La población o población objetivo es ese grupo entero de elementos de los que queremos recoger datos. [Los acercamientos en definirlo se discuten en una página separada: Delimitar la población de estudio.]
En un estudio empírico, este grupo puede consistir de gente, animales u otros objetos. [En un estudio de caso contiene apenas un objeto o acontecimiento, pero en la investigación básica teóricamente orientada puede ser infinita, es decir usted desea saber algo que es verdad para cada objeto o acontecimiento del tipo dado en el universo.
En algunos proyectos cada espécimen o acontecimiento de la población será medido o registrado realmente. Tal un estudio total da una descripción excelente de la población, pero es posible solamente si la población no es demasiado grande y si todos los objetos están disponibles para el estudio.
El estudio total es un método relativamente costoso, porque el trabajo empírico toma tiempo e implica a menudo aparato, recorridos y otros costes. Los objetivos de un proyecto de investigación no requieren siempre una cuenta absolutamente exacta de la población entera. Una aproximación confiable sería suficiente a menudo. Por lo tanto es común que usted mide o registra solamente tan muchas unidades de la población a que usted puede permitirse y que sean necesarias para alcanzar las metas del proyecto. A este fin, varias estrategias están disponibles. Algunos se listan abajo.
El muestreo quere decir que usted limita deliberadamente el número de casos en el estudio. Hay un riesgo que los hallazgos del estudio no son verdades para algunos de los casos fuera de la muestra, pero este riesgo a menudo se puede calcular y restringir en un nivel tolerable.]
En la investigación de muestreo estamos interesados por igual en todos los elementos de la población y querríamos estudiarlos todos. Pero por razones prácticas, tendremos que escoger solo una muestra. Tal vez tenemos una población de millones de objetos y es imposible abarcar incluso una mayoría de entre ellos. También en aquellos casos (con poblaciones, digamos, de 10.000) en que podríamos escoger estudiar cada objeto, el estudio de muestreo puede ser una elección prudente, porque ahorra tiempo y podemos usar el tiempo ahorrado para estudiar los elementos más cuidadosamente. Todos estos son buenos casos para un estudio de muestreo. Los distintos métodos de selección de la muestra se tratan más abajo.
Más arriba vimos que en la investigación de muestreo en lo que estamos siempre interesados no es en la muestra sino en la población; más exactamente, en las propiedades de los elementos de la población. Cuando estamos estudiando los elementos del ejemplo querríamos escoger elementos que tengan los mismos atributos que la media de la población. Si ese es el caso, nuestra muestra es representativa.
Hay dos principios alternativos que pueden seguirse cuando se elige una
muestra:
muestra no aleatoria, en que el investigador deliberadamente
elige los objetos que han de ser estudiados (a la derecha).[El acto del muestreo sí mismo genera dos tipos de desacuerdo entre la población y la muestra:
¿Usted puede preguntar por qué utilizar el muestreo no-aleatorio en todos, porque implica el riesgo del sesgo, una fuente aparentemente innecesaria del desacuerdo con la población? Hay varias motivaciones posibles:
[Si una muestra aleatoria se hace correctamente, contais no tendencia y es por lo tanto relativamente representante de la población. Por supuesto,] en un estudio de muestreo, nunca podemos estar seguros al 100% de que los resultados medidos a partir de la muestra sean también ciertos en la población. No obstante, a efectos prácticos suele ser suficiente si podemos afirmar que [el riesgo de una desviación de la población es, digamos, un 1%]. Seremos capaces de hacer tales afirmaciones que están basadas en cálculo de probabilidades si hemos usado una muestra aleatoria.
El principio de la selección de los elementos en una muestra
aleatoria es el mismo que cuando se reparten la baraja. Todos los objetos
de la población tienen iguales probabilidades de ser seleccionados
en la muestra. Esta probabilidad es llamada razón de muestreo
(sampling ratio en inglés), y es igual al número de elementos
de la muestra dividido por el número de la población.
Hay métodos alternativos para crear una muestra aleatoria (en otras palabras, una "muestra de probabilidad"). [En los diagramas siguientes, los casos de la población original se presentan como puntos u otros símbolos pequeños, y los casos seleccionados en la muestra se demuestran como símbolos en negrita.]
Muestra aleatoria ponderada. Cuando la
población incluye un grupo muy pequeño pero esencial, hay el riesgo de que ningún miembro de ese grupo quede dentro de una
muestra aleatoria. [Tales grupos claves de usuarios de productos son, entre otros, gente corto de vista, duro de oído o con la capacidad reducida del movimiento, véase una lista de tal gente. Otras minorías a menudo significativas originan de religiones, de nacionalidades y de lenguas.
[Las muestras no aleatorias (o "no probabilísticas") son escogidas por el investigador. Son a menudo rápidas y baratas crear, pero generalmente menos representativas que los aleatorias. La desventaja es que] corremos un gran riesgo de obtener demasiado sesgo en la muestra. No seremos capaces siquiera de advertir la presencia, y menos aún la cantidad, de sesgo si hacemos personalmente la selección de la muestra. Y la presencia de sesgo puede hacer imposible generalizar nuestros resultados.
Un modo de reducir el sesgo hasta cierto punto es dejar a otra persona o grupo la selección de los elementos.
[En estudios informativos la presencia de sesgo es una desventaja grave que usted encontrará más adelante en su proyecto, en cuándo valorar el muestreo y en cuándo escribir el capítulo final de su informe. Por lo tanto puede ser prudente pensar de él por adelantado, cuándo escoger el método de muestreo.
Muestras no aleatorias se pueden utilizar en proyectos de investigación y del desarrollo, a condición de que el sesgo sistemático posible será compensado más adelante. Por ejemplo, es común usar al muestreo de conveniencia cuándo escoger clientes potenciales a un grupo de trabajo para desarrollar un concepto del producto preliminar. La selección de personas será probablemente sesgada, tan bien como las propuestas del grupo de trabajo, pero las propuestas serán rectificadas ulteriormente cuando son evaluadas de nuevo por un otro grupo de gente más grande.]
Entre los tipos comunes de muestras no aleatorias se incluyen,
Los casos restantes entre el material histórico o arqueológico, cuando ha desaparecido una parte grande de material relevante antes de que reciben los investigadores, se pueden mirar como una clase de muestra de conveniencia incluso cuando es la realidad histórica y no la conveniencia que selecciona la muestra. Si la destrucción del material, durante el tiempo hasta el estudio, no ha sido al azar ni proporcional pero en lugar de alguna manera parcial o selectivo, el material sobreviviente será sesgado y el investigador debe valorar el sesgo probable. Usted debe preguntarse si cualesquiera de los factores siguientes han afectado diferentemente en la preservación de tipos diferentes de la materia:
Muestra - bola de nieve. Cuando se entrevista a miembros de un grupo,
podemos pedir a las personas que nos indiquen otros individuos en ese grupo
que estén ela mejor posición para dar información
sobre ese tema; podríamos también pedirles que nos indicasen
personas que compartan sus puntos de vista y también otras
que sean de opinión opuesta. Entonces entrevistaremos a nuevos individuos
y continuaremos del mismo modo hasta que no obtengamos nuevos puntos de
vista de nuevos entrevistados. Este es un buen método por ejemplo
para recoger los distintos puntos de vista existentes en un grupo, pero
su inconveniente es que no obtenemos una idea exacta de la distribución
de las opiniones.
Muestra de casos típicos. [La meta de estudiar un grupo heterogéneo es a menudo encontrar cuál es común y típico de la mayoría de los casos en el grupo. A este efecto loable, el muestreo se ha utilizado a veces para seleccionar los casos más típicos en la muestra, y todos los casos extraordinarios son dejados fuera. En la figura en el derecho, los casos típicos se marcan con puntos, y los casos excepcionales están marcados con los símbolos + y x.
Sin embargo, seleccionar una muestra de casos típicos no es muy recomendable porque cuándo escoger los casos "típicos" los prejuicios del investigador (que pueden ser erróneos) influencian demasiado los resultados de la investigación. El investigador puede, sin notarlo, seleccionar sobre todo tales casos que corroboren sus preconcepciones o hipótesis. Para resumir, si usted desea precisar los especímenes medios o los casos más comunes de la población, un método mejor es clasificar clasificar todos los artículos de la población, o una muestra escogida al azar, y encuentra el tipo más frecuente. Cuando es necesario, usted puede entonces continuar el estudio de esta clase, que en adelante se convierte en la población nueva del estudio.
En el momento de diseñar una muestra no aleatoria, debemos siempre tener en mente la población. ¿Es representativa la muestra? ¿Son válidos los resultados en la población? ¿Es cierto que el criterio que usted ha utilizado en seleccionar la muestra (e.g. la buena voluntad de la gente de participar) no tiene ninguna correlación con esas variables que usted desee registrar de la muestra? Si hay correlación, su muestra es sesgada.
Sobrepasar los límites de la población. No tenemos que incluir elementos que no sean miembros de la población en nuestra muestra. Por ejemplo, en muestreo bola-de-nieve sucede a menudo que alguna gente entrevistada nomina a candidatos que no pertenecen a la misma población. [Por supuesto, usted tiene a menudo la opción de alterar sus delimitaciones originales.
Muestra de especialistas. Puede ser que parezca una idea sensible de preguntar directamente ésos, a menudo pocos, personas que saben mucho sobre el asunto, en vez de preguntar una muestra grande de legos escogidos al azar cuyo conocimiento puede ser esporádico y cuyos opiniones pueden divergir. Así, podríamos por ejemplo:
Todos los ejemplos arriba son de la vida verdadera, y son los métodos sin duda sensatas, rápidos y eficaces, porque usted necesita entrevistar apenas unas pocas personas y en la discusión usted consigue rápidamente al punto. Sin embargo, usted no debe pensar que los "especialistas" puedan ser tomados como muestra de "no especialistas". Son dos poblaciones diferentes. No debiéramos generalizar los resultados de "especialistas" a ninguna otra población.
Si usted entonces desea además recolectar las opiniones de los consumidores medios, usted debe definir éstos como una población segunda y seleccionar una muestra adecuada de ella, también. Un alternativa deberá hacer dos proyectos distintos de estos dos exámenes. Una posibilidad es hacer estos dos exámenes en sucesión. Podríamos tal vez continuar transformando los resultados a partir de los especialistas en hipótesis que más tarde verificaríamos con una muestra apropiada de la población "real" o de no especialistas, que serían en los ejemplos citados, respectivamente, los consumidores y los arrendatarios. En otras palabras, podríamos usar la entrevista de los especialistas como un estudio preliminar sólo.
Muestreo normativo. El aspecto normativo es aceptable en los proyectos del desarrollo que apuntan a mejorar objetos similares en el futuro, pero es mejor guardarlo fuera del muestreo porque trastorna los principios de la representatividad y de la generalización.]
"Muestra de los mejores casos" es algo
bastante tradicional en historia del arte: estudiamos solamente los "grandes maestros". La idea es que éstos representan lo más auténtico de su época. Tal selección deliberada por parte del investigador tiene no obstante riesgos serios. [Es evidente que no son típicos de la era y no representan las obras de arte medias. Esto no sugiere que usted no los debe estudiar, pero si usted lo hace, no le llama una "muestra" si usted quere decir que los grandes amos son la población de su estudio. Cf. Delimitar la población de estudio.
Más tarde en la fase de análisis de sus datos que usted puede mantener fácilmente el aspecto normativo, cf. Comparación Normativa , Clasificación Normativa , y Historia normativa, tan allí no es necesidad de mezclar el procedimiento de muestreo con consideraciones normativas.]
[El propósito principal del muestreo es reducir la necesidad de las operaciones empíricas que exigen el trabajo y el coste. ¿Cómo pequeña puede una muestra entonces estar sin perder su utilidad? ¿Es decir cuál es el número más pequeño de los casos que todavía nos dan bastante confiables datos sobre la población?]
Si utilizamos el fórmula inversamente, y sabe el nivel deseado de la representatividad estadística de los datos que vamos a registrar de la muestra, podemos calcular el tamaño de muestra requerido en base del número de variables, y de sus variaciones. No se saben a menudo por adelantado, pero en que el caso una aproximación se puede usar.
Usted, por ejemplo, ha medido dos variables de una muestra pequeña y ha encontrado que su correlación es 0,26. Es siempre posible que tal correlación se ha creado en la muestra apenas accidentalmente y no es verdad en la población. Usted desea que la probabilidad de tal accidente sea menos de 1%. Si usted consulta la tabla que se presenta en t-test, usted encontrará que una muestra de 100 casos se necesita antes de que la probabilidad de conseguir accidentalmente una 0.26 correlación disminuya a 1%.
Otro ejemplo. Usted estudia porcentajes y usted desea ser 95% cierto que el porcentaje que usted ha medido de una muestra es verdad en la población también. Aquí usted puede utilizar el fórmula del intervalo de confianza:
donde
p = el porcentaje como se calcula de una muestra
n = tamaño de la muestra.
Si el intervalo de confianza, según el fórmula, es demasiado ancho, usted puede cortarlo usando una muestra más grande. De la fórmula usted puede deducir que si usted multiplica el tamaño de muestra por cuatro, el intervalo de la confianza se contraerá en la mitad. La fórmula es independiente del tamaño de la población.]
Las formulas para el cálculo son exactas pero algo engorrosas
de usar por las muchas alternativas que intervienen; por ese motivo no
se presentan aquí. En proyectos importantes con amplios recursos
se suele consultar a un estadístico para los cálculos.
En un proyecto de investigación con recursos limitados, la regla
general es: usar una muestra tan amplia como nos podamos permitir.
No hay fórmula para determinar el tamaño de una muestra no aleatoria. Con frecuencia, especialmente en investigación cualitativa, podemos simplemente ampliar gradualmente nuestra muestra y analizar los resultados según llegan. Cuando en casos nuevos ya no se presenta información nueva, podemos concluir que nuestra muestra está saturada, y terminaremos el trabajo. Este método es, sin embargo, muy vulnerable al muestreo sesgado, con lo que tenemos que ser muy cuidadosos y asegurarnos que no omitimos a ningún grupo de nuestra población.
Recuérdese también que es inútil incrementar el tamaño de la muestra si el principio de muestreo está sesgado. La muestra añadida simplemente estará igual de sesgada [si usted utiliza el mismo método de selección que para la primera muestra.
Si usted puede permitirse hacer una segunda muestra, intente crearla con otro método de selección. Guarde inicialmente separado los datos de cada uno de las muestras. Comparándolas usted tiene un medio excelente de juzgar la presencia del sesgo en cualquiera de ellos.]
Antes de decidir el tamaño de una muestra no aleatoria, tal vez queramos leer cómo debe ser evaluada la representatividad de los resultados a partir de una muestra no aleatoria. De otro modo podríamos sufrir una sorpresa bastante desagradable cuando estemos intentando, demasiado tarde, definir la población en que nuestros resultados puedan ser declarados válidos.
Sucede a menudo que algunos casos en la muestra resultan infructuoso porque no pueden ser alcanzados, o las medidas fallan, o los entrevistados rechazan cooperar etc. Si usted desea haga el muestreo muy cuidadosamente, usted debe preguntarse: ¿Es probable o posible que los casos que fallan diferencian los acertados en cualquier respecto que interesa en su proyecto? Solamente cuando la respuesta estará no, usted puede fiarse que la ausencia de estos casos no introducirá sesgo en los resultados. El método normal es entonces sobredimensionar la muestra levemente, y después se olvida simplemente los casos que fallan.
Si usted, al contrario, piensa que los casos que fallan diferencian sistemáticamente del resto, usted puede intentar compensar el sesgo dando pesas diferentes a los datos que vienen de estos dos grupos. El método se explica en El problema de la no-respuesta.]
30.dic.2004. Versión en español:
Benito Bermejo
[Aumentos por Pentti Routio entre paréntesis cuadrados]
Ubicación original:
http://usuarios.iponet.es/casinada/arteolog
(España) http://www2.uiah.fi/projects/metodi/
(Finlandia)