Anda di halaman 1dari 9

Tamao de Muestra

Por Ing. M.Sc. Francisco Martnez Solaris

1. Introduccin Cuando se habla de diseos de investigacin se mencionan una serie de stos como observacionales, descriptivos, transversales, longitudinales, cuasiexperimentales, experimentales, etc. Todo lo anterior se puede resumir en dos tipos de diseos de investigacin: Diseos no Experimentales y Diseos Experimentales. Los diseos no experimentales se dan cuando no existe una manipulacin intencionada por parte del investigador de las variables independientes, es decir, que el investigador solo toma la informacin sin afectar el comportamiento de la poblacin. En estos estudios la informacin se puede hacer de dos formas los cuales son a travs de un censo o bien a travs de muestreo. Se entiende por censo a la enumeracin de todas las unidades de anlisis que conforman la poblacin que es objeto de estudio y ste se puede hacer siempre y cuando la verificacin de la informacin no perjudique o deteriore la unidad de anlisis. En el caso de que sea por muestreo puede ser de dos tipos: Muestreo Arbitrario o No Probabilstico y por Muestreo Aleatorio o Muestreo Probabilstico. Cuando los estudios se realizan usando muestreos probabilsticos una de las primeras interrogantes que hay que responder es cul es el tamao de muestra que se tiene que tomar? Es por esta razn que el presente documento pretende orientar al investigador, si este es el caso, qu muestreo utilizar y cmo determinar el tamao de muestra en cada caso, para ello se hace una revisin de los principales muestreos probabilsticos como son el Muestreo Aleatorio Simple, Muestreo Aleatorio Proporcional y el Muestreo Aleatorio Estratificado, base esencial para cualquier muestreo probabilstico. 2. Fuente Terica Documental Para la realizacin del presente documento se han revisado obras como Elementary Survey Sampling de Mendenhall et al (1971), Mendenhall y Scheaffer (1973), Mendenhall y Reinmuth (1978), Rendn (1992), Crdoba (2000), Martnez (2005) entre otros, ms la experiencia del autor como profesor en diferentes ramas de la estadstica en distintas universidades bolivianas. Para la derivacin de las ecuaciones de tamao de muestra se tom en cuenta tanto las distribuciones probabilstica de variables aleatorias como las describen, entre otros, Infante y Zrate (2000) y Walpole et al (1998), como tambin estimacin intervlica (1-)*100 como la describen ampliamente los autores antes mencionado. 3. Resultados y Discusin Si se toma en cuenta que el diseo de investigacin es la estrategia que el investigador adopta para tomar la informacin de las variables que se han derivado de la hiptesis de investigacin, esta informacin se puede obtener de uno de dos escenarios, en la poblacin

Por Ing. M. Sc. Francisco Martnez Solaris Mgs. En Educacin Superior Febrero 2011

que es objeto de estudio o bien en una parte de ella que se llama muestra, entendindose sta ltima como un subconjunto de la poblacin que se supone la representa. En el primer caso, cuando se estudia toda la poblacin, se dice que se utiliza censo entendindose ste como la enumeracin total de las unidades de anlisis que conforman la poblacin objeto de estudio. Esto no siempre se puede hacer ya sea porque los recursos tantos econmicos, de tiempo y otros son limitantes, pero principalmente no se puede hacer cuando la verificacin de la informacin conlleva a un deterioro de la unidad de anlisis. Es en estos casos, entre otros, que el uso del muestreo es imprescindible. Por muestreo se entiende al proceso a travs del cual se deduce un tamao de muestra de la poblacin que es objeto de estudio, esta deduccin se puede hacer de dos maneras: de forma arbitraria o no aleatoria conocido tambin como muestreo de expertos y de forma aleatoria o muestreo probabilstico, es decir, aquel que utiliza el azar, entendiendo por azar la misma probabilidad que tienen las unidades de anlisis que conforman a la poblacin objeto de estudio (las que cumple con los criterios de inclusin del estudio llamado por algunos autores como Rendn (1992) marco de muestreo), de ser parte de la muestra. Indistintamente del muestreo que se utilice, stos se hacen con el propsito de estimar el comportamiento de los parmetros en la poblacin, caracterstica propia de una poblacin que sirve para describirla, por medio de la informacin que proporcionan los estadsticos o estadgrafos determinados en la muestra, de aqu que se cuestiona cunto debe ser el tamao de muestra que permita que se pueda estimar un parmetro con la informacin del estadstico determinado en la muestra. La Figura 1 resume los dos escenarios antes expuestos donde se puede tomar la informacin. La poblacin (censo) o bien la muestra (censo). La pregunta obligada es la siguiente, cul muestreo utilizar?, el no probabilstico o el probabilstico. Esta es una decisin que el investigador debe tomar y con ello las consecuencias de la misma, por ejemplo, cuando se utiliza un muestreo no probabilstico se dice que los estudios tienen poca o nula validez externa, en el sentido que no se us el azar para seleccionar las unidades de anlisis que conformarn la muestra ya que el uso del azar permite establecer una estructura probabilstica y adems, permite la significancia de ciertas pruebas estadsticas y por otro lado, permite aproximarse ms al parmetro que se desea estimar. De hecho lo recomendable es usar un muestreo probabilstico pero no siempre se puede lograr principalmente en aquellos casos donde las unidades de anlisis puedan verse en situaciones delicadas o censuradas por la sociedad, en estos casos de hecho que el muestreo no probabilstico es el indicado, reducindose las investigaciones a estudios de casos.
Por Ing. M. Sc. Francisco Martnez Solaris Mgs. En Educacin Superior Febrero 2011

Dejando establecido que el ms indicado, si se puede, es el muestreo probabilstico, a continuacin se desarrollan los tres principales muestreos probabilstico que vienen a ser las bases para cualquier muestreo probabilstico. 3.1. Muestreo Aleatorio Simple (MAS) Este muestreo consiste en revisar una a una las unidades de anlisis del marco de muestreo de la poblacin que es objeto de estudio (entindase como marco de muestreo parte de la poblacin que cumple con las exigencias del estudio), esto lo convierte en un esquema de muestreo sin reemplazo y que es utilizado para variables cuantitativas en poblaciones homogneas. Se usa para estimar totales pero comnmente para estimar promedio o medias. Cuando se habla de poblaciones homogneas se refiere aquellas unidades de anlisis que cumplen el mismo criterio de homogeneidad impuesto por el investigador, por ejemplo: procedencia, profesin, carrera que estudia, etc. Para determinar la ecuacin del tamao de muestra en este esquema de muestreo se parte de la ecuacin de intervalo de confianza (1-)*100 para estimar . Para estimar a se parte de su estimador muestral que la media aritmtica ( la cual cumple con los cuatros criterios de un buen estimador y como consecuencia del teorema del Lmite Central, se tienen la siguiente expresin para estimar a : ( ; donde:

= promedio muestral de la variable estudiada = Valor de la normal estndar que deja un rea a la derecha y a la izquierda igual a /2

= Desviacin tpica del promedio muestral

= Promedio poblacional ( = Confiabilidad En la Figura 2 se muestra la lgica de la estimacin, en este caso para . Como se observa, la distancia que separa al parmetro del estadstico tanto por la izquierda como por la derecha, es equidistante de por la simetra de la normal estndar, es , la cual est identificada

Figura 2 Intervalo de confianza para como Precisin en la Figura 2. Por precisin, Rendn (1992) la define como la mxima distancia que separa el estimador del parmetro por ambos lados de la curva. Otros autores como Crdoba (2000) le denominan Mximo Error de Estimacin (E). Es por ello que la expresin (1 )*100 tiene dos interpretaciones:

La confiabilidad de encontrar al parmetro dentro del intervalo estimado

Por Ing. M. Sc. Francisco Martnez Solaris Mgs. En Educacin Superior Febrero 2011

La probabilidad de que el estadstico o estimador no se separe del parmetro ms que , por ambos lados

Lo anterior implica entonces que el investigador puede fijar dicha precisin asumiendo las consecuencias de la misma. Si la precisin es pequea (desea que se separe poco el estimador del parmetro), entonces el tamao de muestra se aumenta lo cual coincide con el criterio de robustez o consistencia de un estimador. 3.1.1. Tamao de muestra en Muestreo Aleatorio Simple Partiendo de la precisin o mximo error de muestreo se tiene lo siguiente:

, lo cual es lo mismo decir que:

; Despejando n se tiene lo

siguiente: , luego que , lo cual se convierte en la primera ecuacin para determinar el tamao de muestra en Muestreo Aleatorio Simple. Este tamao de muestra se usa cuando la el tamao de la poblacin se desconoce o bien se considera infinito y la varianza poblacional se desconoce. Puede ser ahora que la varianza poblacional se desconozca entonces de acuerdo al teorema del Lmite Central se puede usar su estimador muestral (S) siempre y cuando el estimador sea obtenido de una muestra aleatoria mayor o igual a 30 (para buscar normalidad), si este es el caso la expresin anterior quedara de la siguiente forma: , en este caso sera para poblacin infinita o desconocida y varianza poblacional desconocida. En caso de que el tamao de la poblacin sea conocido y la varianza poblacional se conozca, el tamao de muestra se determina de la siguiente forma:
(

, donde:

n = tamao de muestra N = tamao de la poblacin objeto de estudio = valor de la normal estndar /2 = varianza poblacional E = precisin o mximo error de muestreo propuesta por el investigador En caso de que la varianza poblacional se desconozca se puede utilizar el estimador muestral quedando la expresin anterior de la siguiente forma:
(

Todo lo anterior indica que en el MAS existen cuatro situaciones posibles para determinar tamao de muestra, por otra parte, adems de que jugar con la precisin puede aumentar o reducir el tamao de muestra, tambin la significancia () hace variar el tamao de muestra ya que mientras ms pequeo es, mayor es el valor de Z por lo tanto es una decisin que el investigador debe tomar y asumir las consecuencias ya que si se aumenta el tamao de muestra, si bien es cierto se aproxima ms al parmetro, pero existe un aumento en el tiempo de toma de informacin y de otros recursos.

Por Ing. M. Sc. Francisco Martnez Solaris Mgs. En Educacin Superior Febrero 2011

3.2. Muestreo Aleatorio Proporcional (MAP) Este muestreo se desarrolla bajo el mismo esquema del Muestreo Aleatorio Simple, es decir, revisin una a una de las unidades de anlisis lo cual lo hace un muestreo sin reemplazo. Est sugerido para variables cualitativas con distribuciones probabilsticas Binomial, Poisson, Multinomial, Hipergeomtrica, etc., y se usa para estimar proporcin poblacional p. Al igual que en el MAS, la derivacin de las ecuaciones del tamao de muestra se las hace a partir de la estimacin intervlica (1 )*100 para p la cual es la siguiente: ( ; donde:

= proporcin muestral ( ) = valor de la normal estndar /2 = desviacin tpica de la proporcin muestral

Es importante sealar que para la estimacin de p se toman en cue nta los estimadores muestrales pues es ilgico usar cualquiera de los parmetros p o q ya que conociendo a uno de ellos, por complemento se conoce el otro. Esto no ocurre para la determinacin del tamao de muestra, ya que en este caso s se toman en cuenta los parmetros p y q. La Figura 3 muestra la lgica de la estimacin y que por consecuencia del teorema del Lmite Central, la distribucin Binomial bajo ciertas condiciones se aproxima a la normal. Es por ello que el concepto de Mximo Error de Estimacin o Precisin es el mismo que se manej en el MAS y adems es equidistante a p por la simetra de la curva normal estndar. 3.2.1. Tamao de Muestra en el Muestreo Aleatorio Proporcional Para determinar el tamao de muestra se parte de lo siguiente: , despejando n se tienen lo siguiente: n = tamao de muestra = valor de la normal estndar a un /2 p = probabilidad de xito q = probabilidad de fracaso = precisin o error mximo de estimacin
Por Ing. M. Sc. Francisco Martnez Solaris Mgs. En Educacin Superior Febrero 2011

, donde:

La expresin antes expuesta define el tamao de muestra cuando la poblacin es infinita o desconocida y los parmetros p y q se conocen. Si los parmetros se desconocen se puede usar los estimadores muestrales siempre y cuando sean obtenidos de muestras mayores o iguales a 30. La expresin anterior queda de la siguiente forma: ; donde:

En caso de que se desconozca los parmetros y el tamao de la poblacin sea desconocido o se considere infinito, se puede utilizar la distribucin terica de p y q que es de 0.5. A este criterio se le conoce como Criterio de Varianza Mxima , tiene como consecuencia que aumenta el tamao de muestra lo cual hace que el estimador sea ms consistente o robusto. La estimacin del tamao de muestra queda establecida como sigue: . Si el tamao de la poblacin se conoce y los parmetros p y q tambin, el tamao de muestra se determina de la siguiente manera:
(

Si el tamao de la poblacin se conoce y los parmetros p y q se desconocen se puede usar sus estimadores muestrales con las mismas consideraciones antes mencionada. El tamao de muestra, si este es el caso, se determina de la siguiente manera:
(

En caso de que solo se conozca el tamao de la poblacin, es decir, que tanto los parmetros como los estimadores se desconocen se puede usar el criterio de varianza mxima quedando el tamao de muestra como se muestra a continuacin:
(

Ahora bien, hay que considerar que una investigacin no siempre es totalmente cuantitativa o cualitativa, puede ser cuanticualitativa o bien cualicuantitativa (Eid Ayala, 2011; comunicacin personal), pero esto no es el problema, ste resulta al momento de definir el tipo de muestreo a utilizar y por ende su tamao de muestra. En este caso el autor recomienda definir cul es la variable clave que define al estudio y en funcin del tipo que sea sta, se define el muestreo. Por ejemplo, un estudiante de ingeniera industrial est interesado en estimar la atencin que presta una empresa que comercializa harina a sus expendedores en un mercado. Si se tuviera que disear un instrumento para los puestos que vende este tipo de producto la primer pregunta debera ser si expende la harina de dicha empresa, su respuesta puede ser s o no inclusive podra reservarse la respuesta y no contestar, esta variables es de carcter cualitativo y por lo tanto se definira el tipo de muestreo a usar. De la respuesta a esta variable dependen todas las dems preguntas del instrumento. Qu pasara ahora si la poblacin objeto de estudio no es homognea lo cual hace que no se deba aplicar los muestreos antes mencionado. En los casos en la poblacin objeto de estudio se divida o se agrupe en subgrupo y esta forma de organizacin puede afectar la investigacin, se recomienda en Muestreo Aleatorio Estratificado.

Por Ing. M. Sc. Francisco Martnez Solaris Mgs. En Educacin Superior Febrero 2011

3.3. Muestreo Aleatorio Estratificado El muestreo aleatorio estratificado es un mtodo que, en muchas ocasiones, puede dar lugar a un incremento en la precisin de las estimaciones, de las caractersticas o parmetros de una poblacin. El mtodo consiste, primeramente, en dividir a la poblacin de tamao N conocido, en un nmero K de subpoblaciones, llamadas estratos. Ms que dividir, se requiere reconocer los subgrupos o subpoblaciones de la poblacin objeto de estudio con la condicin que estas subpoblaciones estratos no se traslapan, es decir, que la probabilidad de interseccin entre stos sea 0. Ejemplo, supngase que se desea realizar una investigacin en una poblacin que se divide en cuatros subgrupos o estratos: k1, k2, k3 y k4. El tamao de la poblacin N es igual a la suma de los estratos de manera que N = k1+ k2+ k3+ k4 , como se muestra en la Figura 4.

Figura 4. Estratificacin de una poblacin Cuando se estratifica se minimiza la variabilidad interna de cada estrato, ya que son iguales de acuerdo al criterio de estratificacin y se maximiza la variabilidad externa entre estrato. 3.3.1. Tamao de Muestra en el Muestreo Aleatorio Estratificado Dado que a lo interno de cada estrato las unidades de anlisis son homogneas y adems, son de tamao conocido, entonces se puede determinar tamao de muestra por cada estrato ya sea por MAS MAP de acuerdo a los criterios antes expuestos y la muestra total llamada muestra estratificada nk viene a ser la suma de las muestras de cada estrato , es decir, nk = nk1+nk2 + ..nki. De aqu se habla de Muestreo Aleatorio Simple Estratificado y de Muestreo Aleatorio Proporcional Estratificado segn sea el caso. Otra forma de determinar tamao de muestra en muestreo estratificado sera tomar una muestra general tomando en cuenta el tipo de variable que define al estudio y despus asignar muestra por cada estrato. A esto se le llama Asignacin Proporcional y se la hace de la siguiente forma:

Por Ing. M. Sc. Francisco Martnez Solaris Mgs. En Educacin Superior Febrero 2011

Estratos K1 K2 K3 . . . Ki Total

Nki Nk1 Nk2 Nk3 . . . Nki N

fr Nk1/N Nk2/N Nk3/N . . . Nki/N 1

fr*n (Nk1/N)*n (Nk2/N)*n (Nk3/N)*n . . . (Nki/N)*n nk

Donde: Ki = I-simo estrato Nki = Tamao del i-simo estrato La asignacin proporcional toma en cuenta el tamao del estrato y en funcin de su tamao existe la asignacin del tamao de muestra, es decir, que a mayor tamao del estrato mayor es el tamao de muestra que se le asigna Existe otra forma para determinar tamao de muestra la cual considera la varianza de cada estrato, esta es la Asignacin de Neyman. Previo hay que hacer lo siguiente: Estratos K1 K2 K3 . . . Ki Total Nk Nk1 Nk2 Nk3 . . . Nki N Wki Nk1/N Nk2/N Nk3/N . . . Nki/N 1 S2ki S2k1 S2K2 S2K3 . . . S2k S Sk1 Sk2 Sk3 . . . Ski WkiSki2 Wk1S21 Wk2S22 Wk3S23 . . . WkiS2i WkiS2i WkiSki Wk1S1 Wk2S2 Wk3S3 . . . WkiSki WkiSki

Por Ing. M. Sc. Francisco Martnez Solaris Mgs. En Educacin Superior Febrero 2011

Donde: Ki = K-simo estrato Nki = Tamao del k-simo estrato Wki = Peso de cada estrato dentro de la poblacin que pertenece (Nki/N) S2ki = Varianza del k-simo estrato Ski = Desviacin estndar del k-simo estrato En este caso el tamao de muestra se determina por la siguiente expresin:
( (

, donde:

ne = tamao de la muestra estratificada N = tamao de la poblacin = valor de la normal estndar a un /2 ( ( = sumatoria de los pesos de cada estrato multiplicada por su desviacin estndar = peso de cada estrato multiplicada por la varianza de cada estrato

= precisin Una vez que se ha determinado el tamao de muestra estratificada el siguiente paso consiste en asignar el tamao de muestra por estrato, en otras palabras, hay que aplicar la asignacin de Neyman la cual es la siguiente: * + , donde:

nk = tamao de muestra para el k-simo estrato = peso del k-estrato por su desviacin estndar = suma de los pesos de cada estrato por su desviacin estndar ne = tamao de la muestra estratificada Como se puede observar, la asignacin de Neyman toma en cuenta la varianza de cada estrato, por lo tanto, al momento de la asignacin del tamao de muestra por estrato, el que tenga mayor varianza, le corresponde mayor tamao de muestra aun sea el ms pequeo de todos los estratos. Resumiendo lo referente al Muestreo Aleatorio Estratificado (MAE), el tamao de muestra se puede determinar de tres maneras como se ha mostrado anteriormente, todo va a depender de los insumos que disponga el investigador al momento de hacer el trabajo. Documento revisado por Ral Gustavo Eid Ayala, Ph.D.

Por Ing. M. Sc. Francisco Martnez Solaris Mgs. En Educacin Superior Febrero 2011

Anda mungkin juga menyukai