Anda di halaman 1dari 24

Alumno: Aldair Rios Marin

Docente: Ing. Juan Omar Lpez marcial

Materia: Estadstica Inferencial 1

Especialidad: ing. Industrial


Semestre: 3
Grupo: Q
UNIDAD 2

Juchitan de Zaragoza Oaxaca, noviembre 2017

1|Pgina
INDICE
UNIDAD 2
2.1 INTRODUCCIN A LA ESTIMACION. 3

2.2 CARACTERISTICA DE UN BUEN ESTIMADOR.. 4

2.3 ESTIMACIN PUNTUAL 5

2.4 ESTIMACIN POR INTERVALOS. 6

2.4.1 INTERVALO DE CONFIANZA PARA LA MEDIA 10

2.4.2 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIA.10.

2.4.3 INTERVALO DE CONFIANZA PARA LA PROPORCIN ..14

2.4.4INTERVALOS DE CONFIANZA PARA LA DIFERENCIA

DE PROPORCIONES 16

2.4.5 INTERVALOS DE CONFIANZA PARA LA VARIANZA 17

2.4.6 INTERVALOS DE CONFIANZA PARA LA RELACIN

DE VARIANZAS 18

2.5 DETERMINACIN DEL TAMAO DE MUESTRA.20

2.5.1 DETERMINACIN DEL TAMAO DE MUESTRA

BASADO EN LA MEDIA DE LA POBLACIN 21

2.5.2 DETERMINACIN DEL TAMAO DE

MUESTRA BASADO EN LA PROPORCIN DE LA POBLACIN.21

2.5.3 DETERMINACIN DEL TAMAO DE MUESTRA

BASADO EN LA DIFERENCIA ENTRE LAS MEDIAS DE LA POBLACIN.23

2|Pgina
UNIDAD 2
2.1 INTRODUCCIN A LA ESTIMACION

La Estadstica descriptiva y la teora de la Probabilidad van a ser los pilares de un


nuevo procedimiento (Estadstica Inferencial) con los que se va a estudiar el
comportamiento global de un fenmeno. La probabilidad y los modelos de distribucin
junto con las tcnicas descriptivas, constituyen la base de una nueva forma de
interpretar la informacin suministrada por una parcela de la realidad que interesa
investigar.

Los mtodos bsicos de la estadstica inferencial son la estimacin y el contraste de


hiptesis, que juegan un papel fundamental en la investigacin.

Por tanto, algunos de los objetivos que se persiguen en este tema son:

Inferencia, estimacin y contraste de hiptesis

Calcular los parmetros de la distribucin de medias o proporciones muestrales


de tamao n, extradas de una poblacin de media y varianza conocidas.
Estimar la media o la proporcin de una poblacin a partir de la media o
proporcin muestral.
Utilizar distintos tamaos muestrales para controlar la confianza y el error
admitido.
Contrastar los resultados obtenidos a partir de muestras.
Visualizar grficamente, mediante las respectivas curvas normales, las
estimaciones realizadas.

3|Pgina
2.2 CARACTERISTICA DE UN BUEN ESTIMADOR

Insesgado. - Se dice que un estimador puntual q es un estimador insesgado de q si


E(q) = q, para todo valor posible de q. En otras palabras, un estimador insesgado es
aquel para el cual la media de la distribucin muestral es el parmetro estimado. Si se
usa la media muestral x para estimar la media poblacional m, se sabe que la mx = m,
por lo tanto, la media es un estimador insesgado.

Eficiente o con varianza mnima. - Suponga que q 1 y q 2 son dos estimadores


insesgados de q. Entonces, aun cuando la distribucin de cada estimador est
centrada en el valor verdadero de q, las dispersiones de las distribuciones alrededor del
valor verdadero pueden ser diferentes. Entre todos los estimadores de q que son
insesgados, seleccione al que tenga varianza mnima. El q resultante recibe el
nombre de estimador insesgado con varianza mnima (MVUE, mnimum variance
unbiased estimator) de q. En otras palabras, la eficiencia se refiere al tamao de error
estndar de la estadstica. Si comparamos dos estadsticas de una muestra del mismo
tamao y tratamos de decidir cul de ellas es un estimador ms eficiente,
escogeramos la 33 estadstica que tuviera el menor error estndar, o la menor
desviacin estndar de la distribucin de muestreo. Tiene sentido pensar que un
estimador con un error estndar menor tendr una mayor oportunidad de producir una
estimacin ms cercana al parmetro de poblacin que se est considerando. Como se
puede observar las dos distribuciones tienen un mismo valor en el parmetro slo que
la distribucin muestral de medias tiene una menor varianza, por lo que la media se
convierte en un estimador eficiente e insesgado.

Coherencia. - Una estadstica es un estimador coherente de un parmetro de


poblacin, si al aumentar el tamao de la muestra se tiene casi la certeza de que el
valor de la estadstica se aproxima bastante al valor del parmetro de la poblacin. Si
un estimador es coherente se vuelve ms confiable si tenemos tamaos de muestras
ms grandes.

Suficiencia. - Un estimador es suficiente si utiliza una cantidad de la informacin


contenida de la muestra que ningn otro estimador podra extraer informacin adicional
de la muestra sobre el parmetro de la poblacin que se est estimando. Es decir, se
4|Pgina
pretende que al extraer la muestra el estadstico calculado contenga toda la
informacin de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se
necesitan todos los datos. Cuando se calcula la mediana de una muestra slo se utiliza
a un dato o a dos. Esto es solo el dato o los datos del centro son los que van a
representar la muestra. Con esto se deduce que si utilizamos a todos los datos de la
muestra como es en el caso de la media, la varianza, desviacin estndar, etc. se
tendr un estimador suficiente.

2.3 ESTIMACIN PUNTUAL

La inferencia estadstica est casi siempre concentrada en obtener algn tipo de


conclusin acerca de uno o ms parmetros (caractersticas poblacionales). Para
hacerlo, se requiere que un investigador obtenga datos muestrales de cada una de las
poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los
valores calculados de varias cantidades muestrales. Po ejemplo, representamos con m
(parmetro) el verdadero promedio de resistencia a la ruptura de conexiones de
alambres utilizados para unir obleas de semiconductores. Podra tomarse una muestra
aleatoria de 10 conexiones para determinar la resistencia a la ruptura de cada una, y la
media muestral de la resistencia a la ruptura x se poda emplear para sacar una
conclusin acerca del valor de m. De forma similar, si s 2 es la varianza de la
distribucin de resistencia a la ruptura, el valor de la varianza muestral s2 se podra
utilizar para inferir algo acerca de s 2. Cuando se analizan conceptos generales y
mtodos de inferencia es conveniente tener un smbolo genrico para el parmetro de
inters. Se utilizar la letra griega q para este propsito. El objetivo de la estimacin
puntual es seleccionar slo un nmero, basados en datos de la muestra, que
represente el valor ms razonable de q. Una muestra aleatoria de 3 bateras para
calculadora podra presentar duraciones observadas en horas de x1=5.0, x2=6.4 y
x3=5.9. El valor calculado de la duracin media muestral es x = 5.77, y es razonable
considerar 5.77 como el valor ms adecuado de m.

5|Pgina
El smbolo q (theta sombrero) suele utilizarse para representar el estimador de q y la
estimacin puntual resultante de una muestra dada. Entonces m = x se lee como el
estimador puntual de m es la media muestral x. El enunciado la estimacin puntual de
m es 5.77 se puede escribir en forma abreviada m = 5.77. Ejemplo: En el futuro habr
cada vez ms inters en desarrollar aleaciones de Mg de bajo costo, para varios
procesos de fundicin. En consecuencia, es importante contar con mtodos prcticos
para determinar varias propiedades mecnicas de esas aleaciones. Examine la
siguiente muestra de mediciones del mdulo de elasticidad obtenidos de un proceso de
fundicin a presin: 44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1 Suponga que esas
observaciones son el resultado de una muestra aleatoria. Se desea estimar la varianza
poblacional s 2. Un estimador natural es la varianza muestral: ( ) ( ) ( ) ( ) 0.251 8 1 44.2
44.0625 43.9 44.0625 ... 43.1 44.0625 1 2 2 2 2 2 2 = - - + - + + - = - S - = = n x x s i s
En el mejor de los casos, se encontrar un estimador q para el calcular = q siempre.
Sin embargo, q es una funcin de las Xi muestrales, por lo que en s misma una
variable aleatoria. q = q + error de estimacin entonces el estimador preciso sera uno
que produzca slo pequeas diferencias de estimacin, de modo que los valores
estimados se acerquen al valor verdadero.

2.4 ESTIMACIN POR INTERVALOS

Un estimado puntual, por ser un slo nmero, no proporciona por s mismo informacin
alguna sobre la precisin y confiabilidad de la estimacin. Por ejemplo, imagine que se
usa el estadstico x para calcular un estimado puntual de la resistencia real a la ruptura
de toallas de papel de cierta marca, y suponga q Distribucin muestral de medias
Distribucin muestral de medianas 34 que x = 9322.7. Debido a la variabilidad de la
muestra, nunca se tendr el caso de que x =m. El estimado puntual nada dice sobre lo
cercano que esta de m. Una alternativa para reportar un solo valor del parmetro que
se est estimando es calcular e informar todo un intervalo de valores factibles, un
estimado de intervalo o intervalo de confianza (IC). Un intervalo de confianza se calcula
siempre seleccionando primero un nivel de confianza, que es una medida del grado de
fiabilidad en el intervalo. Un intervalo de confianza con un nivel de confianza de 95% de
la resistencia real promedio a la ruptura podra tener un lmite inferior de 9162.5 y uno

6|Pgina
superior de 9482.9. Entonces, en un nivel de confianza de 95%, es posible tener
cualquier valor de m entre 9162.5 y 9482.9. Un nivel de confianza de 95% implica que
95% de todas las muestras dara lugar a un intervalo que incluye m o cualquier otro
parmetro que se est estimando, y slo 5% de las muestras producir un intervalo
errneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del
parmetro que se estima est dentro del intervalo. Una interpretacin correcta de la
confianza de 95% radica en la interpretacin frecuente de probabilidad a largo plazo:
decir que un evento A tiene una probabilidad de 0.95, es decir que si el experimento
donde A est definido re realiza una y otra vez, a largo plazo A ocurrir 95% de las
veces. Para este caso el 95% de los intervalos de confianza calculados contendrn a
m. Esta es una construccin repetida de intervalos de confianza de 95% y se puede
observar que de los 11 intervalos calculados slo el tercero y el ltimo no contienen el
valor de m. De acuerdo con esta interpretacin, el nivel de confianza de 95% no es
tanto un enunciado sobre cualquier intervalo en particular, ms bien se refiere a lo que
sucedera si se tuvieran que construir un gran nmero de intervalos semejantes.

Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una poblacin que sigue la
distribucin Normal, y resulta:

La distribucin de las Medias muestrales aproxima al modelo Normal:

7|Pgina
En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales
es

(Nota: Los valores +-1.96 que multiplican la Desviacin Tpica de la distribucin


muestral son los valores cuya funcin de distribucin es igual a 0.975 y 0.025
respectivamente y se pueden obtener en las tablas de la distribucin Normal
estandarizada o de funciones en aplicaciones informticas como Excel). Seguidamente
generamos una muestra de la poblacin y obtenemos su Media, que es igual a 4.5. Si
establecemos el intervalo alrededor de la Media muestral, el parmetro poblacional
(5.1) est incluido dentro de sus lmites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por esa


razn, la distancia desde m a la Media muestral es la misma que va de la Media
muestral a m. En consecuencia, si hacemos un muestreo con un nmero grande de
muestras observamos que el 95% de las veces (aproximadamente) el valor de la Media
de la poblacin (m) se encuentra dentro del intervalo definido alrededor de cada uno de
los valores de la Media muestral. El porcentaje de veces que el valor de m se halla
dentro de alguno de los intervalos de confianza es del 95%, y es denominado nivel de
confianza.
Si queremos establecer un intervalo de confianza en que el % de veces que m se halle
dentro del intervalo sea igual al 99%, la expresin anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviacin Tpica de la distribucin


muestral en las tablas de la distribucin Normal estandarizada o de funciones en
aplicaciones informticas como Excel), y son los valores cuya funcin de probabilidad
es igual a 0.995 y 0.005 respectivamente).

8|Pgina
Ejemplo
La siguiente imagen muestra la distribucin de las Medias muestrales obtenidas de
100000 muestras aleatorias y los intervalos alrededor de cada una de las Medias
obtenidas de diez de las muestras:

donde ls y le simbolizan los lmites superior e inferior del intervalo de confianza al 95%.

Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a
3.7) incluyen el valor del parmetro dentro sus lmites.

9|Pgina
2.4.1 INTERVALO DE CONFIANZA PARA LA MEDIA

En estadstica, se llama intervalo de confianza a un par o varios pares de nmeros


entre los cuales se estima que estar cierto valor desconocido con una determinada
probabilidad de acierto. Formalmente, estos nmeros determinan un intervalo, que se
calcula a partir de datos de una muestra, y el valor desconocido es un parmetro
poblacional. La probabilidad de xito en la estimacin se representa con 1 - y se
denomina nivel de confianza. En estas circunstancias, es el llamado error
aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar en la
estimacin mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un


intervalo ms amplio tendr ms probabilidad de acierto (mayor nivel de confianza),
mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa,
aumenta su probabilidad de error.

Para la construccin de un determinado intervalo de confianza es necesario conocer


la distribucin terica que sigue el parmetro a estimar, . Es habitual que el parmetro
presente una distribucin normal. Tambin pueden construirse intervalos de confianza
con la desigualdad de Chebyshev.

En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un


parmetro poblacional que sigue una determinada distribucin de probabilidad, es
una expresin del tipo [1, 2] tal que P[1 2] = 1 - , donde P es la funcin de
distribucin de probabilidad de .

2.4.2 Intervalo de confianza para la diferencia de media

Caso de varianza desconocida y comn

Supondremos la existencia de dos poblaciones sobre las que una variable determinada
sigue una distribucin Normal con idntica varianza en las dos. Sobre la poblacin 1, la
variable sigue una distribucin N (1, ) y, sobre la poblacin 2, sigue una distribucin
N (2, ). Igualmente supondremos que disponemos de dos muestras aleatorias

10 | P g i n a
independientes, una para cada poblacin, de tamaos
muestrales n1 y n2 respectivamente.

El objetivo es construir un intervalo de confianza, con nivel de confianza (1 ) 100


%, para la diferencia de medias

1 2

El mtodo se basa en la construccin de una nueva variable D, definida como la


diferencia de las medias muestrales para cada poblacin

Esta variable, bajo la hiptesis de independencia de las muestras, sigue una


distribucin Normal de esperanza

1 2

Y de varianza

La estimacin conjunta, a partir de las dos muestras, de


la varianza comn viene dada por la expresin

Y, utilizando la propiedad de que la variable

Sigue una distribucin 2 con n1 + n2 2 grados de libertad,


podemos construir un estadstico pivote que siga una distribucin t de Suden y que nos
proporciona la frmula siguiente para el intervalo de confianza para la diferencia de
medias:

11 | P g i n a
Donde t/2 es el valor de una distribucin t de Student con n1 + n2 2 grados de libertad
que deja a su derecha una probabilidad de /2

Ejemplos:
1. Un artculo publicado dio a conocer los resultados de un anlisis del peso de
calcio en cemento estndar y en cemento contaminado con plomo. Los niveles
bajos de calcio indican que el mecanismo de hidratacin del cemento queda
bloqueado y esto permite que el agua ataque varias partes de una estructura de
cemento. Al tomar diez muestras de cemento estndar, se encontr que el peso
promedio de calcio es de 90 con una desviacin estndar de 5; los resultados
obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en
promedio con una desviacin estndar de 4. Supngase que el porcentaje de
peso de calcio est distribuido de manera normal. Encuntrese un intervalo de
confianza del 95% para la diferencia entre medias de los dos tipos de cementos.
Por otra parte, supngase que las dos poblaciones normales tienen la misma
desviacin estndar.

Solucin:

El estimador combinado de la desviacin estndar es:

Al calcularle raz cuadrada a este valor nos queda que sp = 4.41

expresin que se reduce a 0.72 1- 2 6.72

Ntese que el intervalo de confianza del 95% incluye al cero; por consiguiente,
para este nivel confianza, no puede concluirse la existencia de una diferencia
entre las medias.

12 | P g i n a
2. Se realiz un experimento para comparar el tiempo promedio requerido por el
cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo
necesario para que cada medicamento alcance un nivel especfico en el torrente
sanguneo se distribuye normalmente. Se eligieron al azar a doce personas para
ensayar cada frmaco registrndose el tiempo en minutos que tard en alcanzar
un nivel especfico en la sangre. Calcule un intervalo de confianza del 95% para
la diferencia del tiempo promedio. Suponga varianzas iguales.

Medicamento A Medicamento B

nA = 12 nB = 12

SA2= 15.57 SB2 = 17.54

Solucin:

2.35 B- A 9.25

Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel
especfico es mayor para el medicamento B.

13 | P g i n a
2.4.3 Intervalo de confianza para la proporcin

Dada una variable aleatoria con distribucin Binomial B(n, p), el objetivo es la
construccin de un intervalo de confianza para el parmetro p, basada en una
observacin de la variable que ha dado como valor x. El mismo caso se aplica si
estudiamos una Binomial B(1, p) y consideramos el nmero de veces que ocurre el
suceso que define la variable al repetir el experimento n veces en condiciones
de independencia.

Existen dos alternativas a la hora de construir un intervalo de confianza para p:

Considerar la aproximacin asinttica de la distribucin Binomial en la


distribucin Normal.

Utilizar un mtodo exacto.

Aproximacin asinttica

Tiene la ventaja de la simplicidad en la expresin y en los clculos, y es la ms


referenciada en la mayora de textos de estadstica. Se basa en la aproximacin

que, trasladada a la frecuencia relativa, resulta

Tomando como estadstico pivote

que sigue una distribucin N(0, 1), y aadiendo una correccin por continuidad al
pasar de una variable discreta a una continua, se obtiene el intervalo de confianza
asinttico:

14 | P g i n a
donde z/2 es el valor de una distribucin Normal estndar que deja a su derecha una
probabilidad de /2 para un intervalo de confianza de (1 ) 100 %. Las condiciones
generalmente aceptadas para considerar vlida la aproximacin asinttica anterior son:

El intervalo obtenido es un intervalo asinttico y por tanto condicionado a la validez de


la aproximacin utilizada.

Intervalo exacto

Aun cuando las condiciones anteriores no se verifiquen, es posible la construccin de


un intervalo exacto, vlido siempre pero algo ms complicado en los clculos. Es
posible demostrar que un intervalo exacto para el parmetro p viene dado por los
valores siguientes:

donde F/2,a,b es el valor de una distribucin F de Fisher-Snedecor con a y b grados de


libertad que deja a su derecha una probabilidad de /2 para un intervalo de confianza
de (1 ) 100 %.
El intervalo de confianza para estimar una proporcin p, conocida como una proporcin
muestral pn de una muestra de tamao n, a un nivel de confianza del (1-)100% es:

En la demostracin de estas frmulas estn involucrados el Teorema Central del


Lmite y la aproximacin de una binomial por una normal.

15 | P g i n a
Ejemplo prctico

Una mquina llena tazas con helado, y se


supone que est ajustada para verter la
cantidad de 250 g. Como la mquina no
puede llenar cada taza con exactamente
250 g, el contenido que se aade a cada
taza individual presenta cierta variacin y
se le asigna una variable aleatoria X. Se asume que esta variacin se ajusta a
una distribucin normal de alrededor de la cantidad promedio deseada de 250 g, con
una desviacin estndar de 2.5 g. Para determinar si la mquina est adecuadamente
calibrada, se toma una muestra aleatoria de n = 25 tazas de helado para pesarlas. La
medicin resultante es X1, ..., X25, una muestra aleatoria procedente de X.

2.4.4INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE


PROPORCIONES
Los limites para el intervalo de una diferencia de proporciones
correspondientes a dos muestras independientes son :
(1
~ (. )


O bien

= ~(0,1)
(1 )
Este intervalo puede utilizarse de manera alternativa al contrasted de hypothesis Para
decider (con nivel de significacin %) si hay igualdad de los dos grupos. Se decidir
por la igualdad de los grupos si el valor 0 queda incluido en cualquier posicin en el
intervalo.
Aunque se haga el contraste de dos proporciones, en primer lugar, es aconsejable
obtener el intervalo de confianza de la diferencia de medias, si ste ha resultado

16 | P g i n a
significativo, puesto que ayudar a interpretar si existe significacin aplicada adems
de la estadstica.
Si se dispone de alguna informacin previa y slo quiere calcularse alguno de los dos
intervalos unilaterales, bastar sustituir z/2 por z y descartar el lmite superior o
inferior del intervalo segn el caso. Por ejemplo, el intervalo unilateral derecho
corresponde a:

2.4.5 INTERVALOS DE CONFIANZA PARA LA VARIANZA

Dada una variable aleatoria con distribucin Normal N (; ), el objetivo es la


construccin de un intervalo de confianza para el parmetro , basado en una muestra
de tamao n de la variable.

A partir del estadstico

La frmula para el intervalo de confianza, con nivel de confianza 1 es la siguiente

17 | P g i n a
Donde 2/2 es el valor de una distribucin ji-cuadrado con n 1 grados de libertad que
deja a su derecha una probabilidad de /2.

Por ejemplo, dados los datos siguientes:

Distribucin poblacional: Normal

Tamao de muestra: 10

Confianza deseada para el intervalo: 95 %

Varianza muestral corregida: 38,5

Un intervalo de confianza al 95 % para la varianza de la distribucin viene dado por:

Que resulta, finalmente

2.4.6 INTERVALOS DE CONFIANZA PARA LA RELACIN DE


VARIANZAS

Supondremos la existencia de dos poblaciones sobre las que una determinada variable
sigue una distribucin Normal. Sobre la poblacin 1 la variable sigue una distribucin N
(1, 1) y sobre la poblacin 2 sigue una distribucin N (2, 2). Igualmente

18 | P g i n a
supondremos que disponemos de dos muestras aleatorias independientes, una para
cada poblacin, de tamaos muestrales n1 y n2 respectivamente.

El objetivo es construir un intervalo de confianza, con nivel de confianza (1 ) 100


%, para el cociente de varianzas

El estadstico pivote utilizado es:

Que sigue una distribucin F de Fisher con n1 1 y n2 1 grados de libertad.

El intervalo de confianza que resulta es

Donde F/2 es el valor de una distribucin F de Fisher-Snedecor


con n1 1 y n2 1 grados de libertad que deja a su derecha una probabilidad de
/2.

19 | P g i n a
2.5 DETERMINACIN DEL TAMAO DE MUESTRA
Todo estudio epidemiolgico lleva implcito en la fase de diseo la determinacin del
tamao muestral necesario para la ejecucin del mismo. El no realizar dicho proceso,
puede llevarnos a dos situaciones diferentes: primera que realicemos el estudio sin el
nmero adecuado de pacientes, con lo cual no podremos ser precisos al estimar los
parmetros y adems no encontraremos diferencias significativas cuando en la realidad
s existen. La segunda situacin es que podramos estudiar un nmero innecesario de
pacientes, lo cual lleva implcito no solo la prdida de tiempo e incremento de recursos
innecesarios sino que adems la calidad del estudio, dado dicho incremento, puede
verse afectada en sentido negativo.

Para determinar el tamao muestral de un estudio, debemos considerar diferentes


situaciones:

A. Estudios para determinar parmetros. Es decir pretendemos hacer inferencias a


valores poblacionales (proporciones, medias) a partir de una muestra.

B. Estudios para contraste de hiptesis. Es decir pretendemos comparar si las medias


o las proporciones de las muestras son diferentes.

Elementos de la Inferencia Estadstica

A. Estudios para determinar parmetros

Con estos estudios pretendemos hacer inferencias a valores poblacionales


(proporciones, medias) a partir de una muestra.

A.1. Estimar una proporcin:

Si deseamos estimar una proporcin, debemos saber:

a) El nivel de confianza o seguridad (1-). El nivel de confianza prefijado da lugar a un


coeficiente (Z). Para una seguridad del 95% = 1.96, para una seguridad del 99% =
2.58.

b) La precisin que deseamos para nuestro estudio.

20 | P g i n a
c) Una idea del valor aproximado del parmetro que queremos medir (en este caso una
proporcin). Esta idea se puede obtener revisando la literatura, por estudio pilotos
previos. En caso de no tener dicha informacin utilizaremos el valor p = 0.5 (50%).

Ejemplos

1. Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado de


Maryland. Un estudio anterior de diez ciervos cazados mostr que la desviacin
estndar de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para
que el bilogo tenga el 95% de confianza de que el error de estimacin es a lo ms de
4 Libras? 45

Solucin: ()() 35.736 4 1.96 12.2 2 2 = = = e zs n En


consecuencia, si el tamao de la muestra es 36, se puede tener un 95% de confianza
en que m difiere en menos de 4 libras de x .

2.5.1 DETERMINACIN DEL TAMAO DE MUESTRA BASADO EN LA


MEDIA DE LA POBLACIN
El determinar el tamao de una muestra representa una parte esencial del metodo
cientifico para poder llevar acabo una investigacion. Al muestreo lo podemos definir
como el conjunto de observaciones necesarias para estudiar la distribucion de
determinadas caracteristicas en la totalidad de una poblacion,apartir de la observacion
de una parte o subconjunto de una poblacion denominada muestra.

2.5.2 DETERMINACIN DEL TAMAO DE MUESTRA BASADO EN LA


PROPORCIN DE LA POBLACIN

En poblaciones dicotmicas con una proporcin xitos el estimador puntual del parmetro
es la proporcin muestral de xitos, p, que coincide con la media de la muestra cuando se
codifica como 1 la caracterstica que se considera como xito y 0 la que se considera no xito.
A partir de un tamao muestral moderadamente grande el estadstico p tiene una
distribucin aproximadamente normal. El intervalo de confianza Para la proporcin poblacional

21 | P g i n a
est centrado en la proporcin muestral; siendo sus lmites superior

e inferior donde z /2 es el valor crtico correspondiente al grado de

confianza 1- de la distribucin normal tipificada y es el error tpico de la proporcin.


Para obtener el intervalo de confianza y contrastar hiptesis sobre la proporcin una

alternativa consiste en tratar a la proporcin como la media poblacional de una


variable dicotmica codificada como se ha descrito anteriormente (xito=1, no xito=0)
y la secuencia es:
Para el intervalo de confianza:
Analizar
Estadsticos Descriptivos
Explorar

Para contrastar la hiptesis nula


Analizar
Comparar medias
Prueba T para una muestra
Utilizando este criterio los resultados numricos no coinciden exactamente con los que se
obtendran aplicando la expresin del error tpico de la proporcin; no obstante la discrepancia es
despreciable si el nmero de observaciones es suficientemente grande.
Otras alternativas para realizar este contraste son de naturaleza no paramtrica.
PRUEBA BINOMIAL
La prueba binomial prueba binomial analiza variables dicotmicas y compara las frecuencias
observadas en cada categora con las que cabra esperar segn una distribucin binomial de
parmetro especificado en la hiptesis nula. El nivel de significacin crtico de esta prueba indica
la probabilidad de obtener una discrepancia igual o superior a la observada a partir de la muestra si
la distribucin es la postulada por la hiptesis nula.
El nivel de significacin crtico (bilateral) de este contraste debe interpretarse como:

el nmero de xitos en la muestra.


Cuando n es suficientemente grande se calcula esta probabilidad aproximando la distribucin
binomial a la normal con correccin de continuidad.

22 | P g i n a
2.5.3 DETERMINACIN DEL TAMAO DE MUESTRA BASADO EN LA
DIFERENCIA ENTRE LAS MEDIAS DE LA POBLACIN

En ocasiones interesa definir un intervalo de valores tal que permita establecer cules son los valores
mnimo y mximo aceptables para la diferencia entre las medias de dos poblaciones. Pueden darse
dos situaciones segn las muestras sean o no independientes; siendo en ambos casos condicin
necesaria que las poblaciones de origen sean normales o aproximadamente normales:

MUESTRAS INDEPENDIENTES

Si puede suponerse que las varianzas de ambas poblaciones son iguales, el intervalo de confianza
para la diferencia de medias poblacionales est centrado en la diferencia de las medias muestrales,
siendo sus lmites superior e inferior:

t /2 es el valor crtico correspondiente al grado de confianza 1- de la distribucin t de Student con

n1+ n2-2 grados de libertad y es una estimacin de la desviacin tpica


comn a ambas poblaciones obtenida a partir de las varianzas de las dos muestras. En la prctica si
n1 y n2 son moderadamente grandes, el valor crtico

t /2 se aproxima, como ya se ha visto anteriormente, a los valores de la distribucin normal.

Si las varianzas poblacionales no pueden suponerse iguales los lmites del intervalo de confianza son:

El valor crtico t /2 corresponde a una distribucin t cuyos grados de libertad se calculan en base a
ambos tamaos mustrales y a las desviaciones tpicas de cada grupo segn la correccin propuesta
por Dixon y Massey:

23 | P g i n a
24 | P g i n a

Anda mungkin juga menyukai