Anda di halaman 1dari 8

Probabilidad y Estadstica

Estimacin estadstica
ESTIMACIN ESTADSTICA

11

BREVE RESUMEN. Lo que hemos estudiado hasta ahora son herramientas para desarrollar la estadstica inferencial que permite conocer caractersticas de la poblacin a partir de la informacin contenida en una muestra. Se vieron las formas en que pueden describirse un conjunto de datos. Los mtodos grficos bsicamente la tabla de frecuencias relativas ! el histograma ! las medidas descriptivas numricas" media varian#a desviacin estndar. La estadstica inferencial busca describir la poblacin con estos grficos ! medidas descriptivas numricas a partir de conocer como son para la muestra. Se estudi el concepto de probabilidad que provee de un mtodo para medir que tan buena es la inferencia. $dems permite ra#onar de la poblacin a la muestra pues si se conoce la distribucin de probabilidad %terica& de una variable aleatoria es posible saber como va a ser apro'imadamente la distribucin de frecuencias relativas si se obtiene una muestra de los valores de esta variable o la probabilidad de obtener un resultado particular. Se estudiaron dos tipos de distribucin de probabilidad las discretas ! las continuas. (or )ltimo se vieron las distribuciones muestrales que nos dicen como se distribu!en los valores de las estadsticas %que son las medidas descriptivas numricas obtenidas de una muestra& al tomar diferentes muestras del mismo tama*o. En este tema vimos parte de la importancia que tiene la distribucin normal !a que muchas estadsticas tienen distribucin de muestreo apro'imadamente normal cuando el tama*o de la muestra es grande. Las estadsticas se usan para apro'imar los parmetros ! conocer las distribuciones muestrales de las estadsticas permite evaluar que tan confiable o buena es la apro'imacin. +a! dos formas de reali#ar inferencias acerca de un parmetro poblacional" podemos estimar su valor %que es lo que vamos a ver esta clase& o bien probar una hiptesis acerca de su valor %esto lo vamos a estudiar la pr'ima clase&. TIPOS DE ESTIMADORES Los procedimientos de estimacin pueden dividirse en dos tipos" Esti aci!" #$"t$al" la estimacin se representa mediante un solo n)mero. Esti aci!" #or i"t%r&alo" la estimacin se representa mediante dos n)meros que determinan un intervalo sobre la recta. Ejemplo. Se quiere estimar la altura media de los alumnos de un determinado curso. Se puede dar la estimacin diciendo que la altura media es de 1.,- m %estimacin puntual& o bien decir que la altura media estar entre 1., m ! 1.. m %estimacin por intervalo&. /n %sti ador es una regla que e'presa cmo calcular la estimacin basndose en la informacin de la muestra ! se enuncia en general mediante una frmula. /n estimador puntual utili#a los datos de la muestra para obtener un n)mero que estima el valor del parmetro. /n estimador por intervalo utili#a los datos de la muestra para obtener dos valores numricos entre los cuales se supone que est el valor del parmetro estimado.

Probabilidad y Estadstica

Estimacin estadstica

10

ESTIMACIN PUNTUA' CON MUESTRAS (RANDES Se pueden usar distintos estimadores para estimar un mismo parmetro. (or ejemplo para estimar la media poblacional se puede usar la media muestral la mediana la moda el promedio entre el valor ms chico ! ms grande de la muestra etc.. 1ada estimador obtenido de muestras de tama*o fijo n vara con cada muestra que se toma. (or lo tanto los estimadores son variables aleatorias ! pueden considerarse sus distribuciones muestrales %similar a los estadsticos que se estudiaron la clase pasada&. La distribuciones de muestreo de los estimadores se usan para compararlos ! decidir cual de todos es el mejor. Se prefiere un estimador que tenga una distribucin muestral cu!a media coincida con el parmetro que se desea estimar ! cu!a e'tensin o dispersin %medida con la variancia& sea lo menor posible. 2otacin. Si denota un parmetro entonces denotar la estadstica correspondiente. 1omo dijimos anteriormente se prefiere una estadstica que tenga una distribucin muestral cu!a media coincida con el parmetro que se desea estimar. /n estimador de este tipo se llama insesgado. Si es un estimador de un parmetro ! si la media de la distribucin de es es decir E% & 3 entonces se dice que es un estimador insesgado. 4e otra manera se llama sesgado. En la figura ,.0. p. 156 aparecen las distribuciones muestrales de dos estimadores el primero insesgado E% & 3 , ! el segundo sesgado E% & 7 . Si se calcula una ve# lo ms probable es que se encuentre cerca de la media E% &. Entonces en el primer caso lo ms probable es que se encuentre cerca de ! en el segundo que sea ms grande que . Se prefiere una estadstica que adems tenga una distribucin muestral cu!a e'tensin o dispersin %medida con la variancia& sea lo menor posible. 2ota" (ara simplificar se habla de variancia del estimador para referirnos a la variancia de la distribucin muestral del estimador. En la figura ,.8 p. 155 aparecen las distribuciones muestrales de dos estimadores insesgados E% & 3 . Si se calcula una ve# en ambos casos lo ms probable es que se encuentre cerca de la media E% &. (ero como la desviacin estndar del primero es menor que la del segundo es ms probable que en el primer caso se encuentre ms cerca de la media que en el segundo caso. En base a lo anterior se elige de todas las estadsticas disponibles aquella con el menor sesgo ! variancia posible. 9s a)n el mejor estimador posible es aquel que es insesgado ! que de todos los insesgados tiene la menor variancia a este estimador se lo llama %sti ador i"s%s)ado d% %"or &aria"cia %EIMV&. En este curso definiremos poblaciones ! los parmetros de inters ! se dir en cada caso cual es el estimador adecuado su media ! su desviacin estndar.

Ejemplos de estimadores insesgados.

Probabilidad y Estadstica

Estimacin estadstica

18

M%dia $%stral ' %estimador insesgado de la media poblacional & Si se seleccionan muestras aleatorias de n mediciones de una poblacin con media ! desviacin estndar la distribucin de muestreo de ' tendr media E% ' & 3 . ! desviacin estndar x 3 : n .
; %estimador insesgado del parmetro p&. Pro#orci!" $%stral p Si se seleccionan muestras aleatorias de n observaciones de una poblacin binomial con x ; 3 parmetro p la distribucin de muestreo de la proporcin muestral p tendr media n ; &3p E% p ! desviacin estndar pq 3 p n

Di*%r%"cia d% %dias ' 1 ' 0 %estimador insesgado del parmetro 1 0&. Se tienen dos poblaciones < ! << con medias ! desviaciones estndar % 1 1& ! %0 0& respectivamente. Se seleccionan en forma independiente muestras de tama*o n 1 para < ! de tama*o n0 para <<. Si ' 1 ! ' 0 son las medias muestrales para tales muestras entonces la distribucin de muestreo de ' 1 ' 0 tendr media E% ' 1 ' 0& 3 1 0 ! desviacin estndar

1 x 0

0 10 0 + n1 n0

; 1 p ; 0 %estimador insesgado del parmetro p1 p0& Pro#orci!" $%stral p Se tienen dos poblaciones binomiales < ! << con parmetros p 1 ! p0 respectivamente. Se seleccionan en forma independiente muestras de tama*o n 1 para < ! de tama*o n0 para <<. ; 1 ! p ; 0 son las proporciones muestrales de tales muestras entonces la distribucin de Si p ; 1 p ; 0 tendr media muestreo de p ; 1 p ; 0& 3 p1 p0 E% p ! desviacin estndar p1 q1 p 0 q 0 3 p + 1 p0 n1 n0

=bservar que en cada caso se toma como estimador la estadstica que corresponde al parmetro que se quiere estimar. La media muestral la proporcin muestral la diferencia de medias muestrales ! la diferencia de proporciones muestrales tienen una distribucin de muestreo que se apro'ima a una normal cuando el tama*o de la:s muestra:s es grande. 1omo regla prctica se supone que esto se cumple cuando n 8>. ?eniendo en cuenta esto ! como estamos interesados en muestras grandes en adelante supondremos que n 8> ! que trabajamos con un estimador insesgado de que tiene una distribucin normal. /na manera de evaluar la bondad de una estimacin puntual es a travs de la distancia entre el estimador ! el parmetro. Esta cantidad se denomina

Probabilidad y Estadstica

Estimacin estadstica

1@

Error d% %sti aci!". A A. 1omo se desea que este error sea lo menor posible interesa saber si es menor que una cierta cota que se suele e'presar en trminos de la desviacin estndar del estimador" Cota #ara %l %rror d% %sti aci!". c .
$hora bien no se puede saber si A A B c pues desconocemos . Sin embargo conociendo las caractersticas de la distribucin de se puede calcular la probabilidad de que A A B c es decir (%A A B c & (or ejemplo si c 3 1.5, ! suponiendo que la distribucin de es normal (%A A B 1.5, & 3 >.5En la siguiente figura aparece el rea correspondiente.

Ejemplo. Se quiere estimar la media de una poblacin. Se toma una muestra de tama*o n 3 -> ! se obtiene ' 3 5.1 s 3 >.0@. 4ar una estimacin para ! evaluar la e'actitud de la estimacin con c 3 1.5,. (armetro Estimador ' %insesgado E% ' & 3 ! tiene una distribucin de muestreo normal si el tama*o de la muestra es grande&. Estimacin para " 5.1. 1ota para el error de estimacin %usando s para apro'imar &" 1.5, x 3 1.5, : n 1.5, s : n 3 1.5, >.0@ : -> >.>.. 1omo (%A ' A B 1.5, x & 3 >.5- (%A ' A B >.>.& 3 >.5podemos decir que la probabilidad de que el error de estimacin sea menor que >.>. es de 5-C. En la siguiente figura aparece el rea correspondiente.

Probabilidad y Estadstica

Estimacin estadstica

1-

INTERVA'OS DE CON+IAN,A PARA MUESTRAS (RANDES /n estimador por intervalo utili#a los datos de la muestra para obtener dos valores numricos entre los cuales se dice que est el valor del parmetro estimado. Supongamos que queremos estimar la media de una poblacin. Se toma una muestra de tama*o n ! se determina con los datos de la muestra un intervalo Da1 b1E. Se espera que Da1 b1E contenga a pero puede suceder que esto no ocurra. Se toma otra muestra de tama*o n ! se determina con los datos de la muestra un intervalo Da0 b0E. Se tambin en este caso que Da0 b0E contenga a pero igual que antes puede suceder que esto no ocurra. Se puede repetir este procedimiento varias veces digamos m obtenindose un conjunto de intervalos Da1 b1E Da0 b0E ... Dam bmE. Se espera que el estimador por intervalo es decir el procedimiento que se est usando para determinar cada intervalo sea tal que un gran porcentaje de estos intervalos contenga a . El ra#onamiento anterior se puede hacer con cualquier otro parmetro . 1ada uno de estos intervalos se llama i"t%r&alo d% co"*ia"-a ! la probabilidad de que el intervalo contenga a se llama co%*ici%"t% d% co"*ia"-a. $hora veremos como se determinan los intervalos de confian#a ! el coeficiente de confian#a. Sea un estimador insesgado de que tiene una distribucin muestral normal o apro'imadamente normal. Se tiene Error de estimacin. A A 1ota para el error de estimacin. 1.5, %se e'presa en trminos de la desviacin estndar&. (%A A B 1.5, & 3 >.5- %para obtener este valor de ( se tiene en cuenta que la distribucin de es normal ! se usa la tabla @&

1omo (%A A B 1.5, & 3 >.5- puede escribirse como (% D 1.5, E& 3 >.5 F 1.5, podemos decir que la probabilidad de que D 1.5, E contenga a es >.5- 3 5-C. F 1.5,

Probabilidad y Estadstica

Estimacin estadstica

1,

4e este modo si es una estimacin particular de entonces D 1.5, E F 1.5, es un intervalo de confian#a para con un coeficiente de confian#a de 5-C ms brevemente intervalo de confian#a de 5-C. $dems lmite inferior de confian#a" L<1 3 1.5, lmite superior de confian#a" LS1 3 F 1.5, 9s general para establecer el intervalo de confian#a con nivel de confian#a %1 &C sea # la normal estandari#ada correspondiente a " # 3 . (%A A B c &31 (%A # A B c & 3 1 (%c B # B c& 3 1 0 (%> B # B c& 3 1 (%> B # B c& 3 %1 & : 0 1:0 (% c B # & 3 %1 & : 0 (% c B # & 3 :0. (or esta ra#n si se escribe c 3 #:0 se tiene I"t%r&alo d% co"*ia"-a d% ./ 01 #ara 2 $sa"do $" %sti ador i"s%s)ado 3$% ti%"% $"a distrib$ci!" $%stral "or al. D #:0 E es un intervalo de confian#a de 1 F #:0 lmite inferior de confian#a" L<1 3 #:0 lmite superior de confian#a" LS1 3 F #:0 donde #:0 es tal que (%#:0 B # & 3 :0 o equivalentemente (%> B # B #:0& 3 %1 ) / 2 %ver figura ,.6 p. 0>@& 2ota" <ntervalos de confian#a para parmetros particulares aparecen en los recuadros de las secciones" ,.- %p. 0>.& para la media poblacional ,., %p. 011& para la diferencia de dos medias poblacionales ,.. %p. 01-& para el parmetro de una poblacin binomial ,.6 %p. 015& para la diferencia entre dos parmetros binomiales. Estos casos particulares se obtienen reempla#ando en cada caso por el estimador que corresponda a ! con la desviacin estndar de . %En Ejemplos de estimadores insesgados en p. 0 de este apunte aparecen en cada caso las e'presiones de ! ! que condiciones se deben cumplir. En particular el tama*o de la:s muestra:s es n 8> para que el estimador tenga una distribucin apro'imadamente normal&.

/sando la tabla @ se puede calcular Co%*ici%"t% d% co"*ia"-a %1 ) / 2 1 >.5> >.@>.5>.@.>.55 >.@5-

#:0 1.,@1.5, 0.-.-

'IC c 1.,@- 1.5, 0.-.-

'SC F c F 1.,@- F 1.5, F 0.-.-

Probabilidad y Estadstica

Estimacin estadstica

1.

Geamos como se obtienen los valores de # :0 para distintos valores de . (or ejemplo se quiere determinar el valor de # :0 para obtener un intervalo de confian#a que tenga coeficiente de confian#a 1 3 5>C3 >.5. 1omo %1 ) / 2 = >.@se debe ubicar en la tabla @ de la normal un valor de # :0 tal que (%> B # B #:0& 3 %1 ) / 2 = 0.45. En la tabla @ no ha! ning)n valor de probabilidad igual a >.@- sin embargo los valores ms cercanos a >.@- son >.@@5- que corresponde a (%> B # B 1.,@& % (%> B # B 1.,@& 3 >.@@5- & >.@->- que corresponde a (%> B # B 1.,-& % (%> B # B 1.,-& 3 >.@->- & cumplindose >.@- 3 %>.@@5- F >.@->-& : 0. Luego se toma #:0 3 %1.,@ F 1.,-& : 0 3 1.,@-. 2ota" Se elige el valor de #:0 que d la probabilidad que est ms cerca de %1 ) / 2 o bien si %1 ) / 2 est a la mitad de dos valores de probabilidad se procede como en el caso anterior. Ejemplo. Se quiere estimar la media de una poblacin. Se toma una muestra de tama*o n 3 -> ! se obtiene s 3 >.0@. ' 3 5.1 Encontrar un intervalo de confian#a de 5>C para . (armetro Estimador ' %insesgado E% ' & 3 ! tiene una distribucin de muestreo normal si el tama*o de la muestra es grande&. 4ebemos encontrar #:0 tal que (%A ' A B #:0 x & 3 >.5> Seg)n la tabla anterior #:0 3 1.,@-. $s (%A ' A B 1.,@- x & 3 >.5>. 1omo ' 3 5.1 x 3 : n s : n 3 >.0@ : -> >.>8@ 1.,@- x 1.,@- >.>8@ >.>-, entonces (%A5.1 A B >.>-,& 3 >.5> 1onclusin" El intervalo D5.1 >.>-, 5.1 F >.>-,E 3 D5.>@@ 5.1-,E contiene a con una probabilidad de 5>C.

Los intervalos de confian#a que hemos considerado hasta ahora se suelen llamar intervalos de confian#a bilaterales. Se pueden determinar tambin los I"t%r&alos d% co"*ia"-a $"ilat%ral%s d% ./ 01 #ara 2 $sa"do $" %sti ador i"s%s)ado 3$% ti%"% $"a distrib$ci!" $%stral "or al o a#ro4i ada %"t% "or al. D # & es un intervalo de confian#a unilateral inferior de 1 lmite inferior de confian#a" L<1 3 #
% F # E es un intervalo de confian#a unilateral superior de 1

Probabilidad y Estadstica

Estimacin estadstica

16

lmite superior de confian#a" LS1 3 F # donde # es tal que (%# B # & 3 o equivalentemente (%# B #& 3 1 %ver figura ,.5. p. 0>,&

TAMA5O DE 'A MUESTRA ?al como dijimos la clase anterior se supone que se trabaja con muestras aleatorias. $hora veremos como se determina el tama*o de la muestra de modo tal que el error de estimacin sea menor que una cierta constante H con una probabilidad de 1 es decir (%A A B H& 3 1
1omo la cota para el error de estimacin se e'presa como #:0 se busca un tama*o de muestra n tal que #:0 3 H. (ara la ma!ora de los estimadores depende de n. En particular esto se cumple para todos los estimadores que vemos en este curso %recordar e'presiones para para cada estadstica&.

Ejemplo. 4eterminar el tama*o de la muestra para que el error al estimar la media de una poblacin sea menor que >.>, con una probabilidad de >.5- sabiendo que se tom una muestra de tama*o n 3 -> ! se obtuvo ' 3 5.1 ! s 3 >.0@. Se busca un tama*o de muestra n tal que (%A ' A B >.>,& 3 >.5= equivalentemente se busca un tama*o de muestra n tal que #:0 3 >.>, con 1 3 >.5-. 1omo %1 &:0 3 >.@.- seg)n la tabla @ (%> B # B #:0& 3 %1 &:0 para #:0 3 1.5, Se busca entonces un tama*o de muestra n tal que #:0 x 3 1.5, x 3 1.5, : n 3 >.>, de donde
1.5, 0 n3 . >.>,
0 0

se desconoce pero se puede apro'imar con el valor s que corresponde a la muestra de n 3 ->. n3 es decir
1.5, 0.240 3 ,1. >.>,

n 3 ,0.

2ota. Si no hubiramos tenido la estimacin s dada por una muestra anterior podramos haber recurrido a la regla emprica para dar un valor apro'imado de siempre ! cuando conociramos en que intervalo caen las mediciones esto es cual es el menor ! ma!or valor posible para las mediciones. Esta regla nos dice que el intervalo % 0& contendr apro'imadamente 5-C de las mediciones. Este intervalo tiene longitud @ . $dems supongamos que sabemos que las mediciones caen en un intervalo de longitud 1. Luego @ 1 1 : @ 3 >.0-. IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII

Anda mungkin juga menyukai