1|Pgina
INDICE
UNIDAD 2
2.1 INTRODUCCIN A LA ESTIMACION. 3
DE PROPORCIONES 16
DE VARIANZAS 18
2|Pgina
UNIDAD 2
2.1 INTRODUCCIN A LA ESTIMACION
Por tanto, algunos de los objetivos que se persiguen en este tema son:
3|Pgina
2.2 CARACTERISTICA DE UN BUEN ESTIMADOR
5|Pgina
El smbolo q (theta sombrero) suele utilizarse para representar el estimador de q y la
estimacin puntual resultante de una muestra dada. Entonces m = x se lee como el
estimador puntual de m es la media muestral x. El enunciado la estimacin puntual de
m es 5.77 se puede escribir en forma abreviada m = 5.77. Ejemplo: En el futuro habr
cada vez ms inters en desarrollar aleaciones de Mg de bajo costo, para varios
procesos de fundicin. En consecuencia, es importante contar con mtodos prcticos
para determinar varias propiedades mecnicas de esas aleaciones. Examine la
siguiente muestra de mediciones del mdulo de elasticidad obtenidos de un proceso de
fundicin a presin: 44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1 Suponga que esas
observaciones son el resultado de una muestra aleatoria. Se desea estimar la varianza
poblacional s 2. Un estimador natural es la varianza muestral: ( ) ( ) ( ) ( ) 0.251 8 1 44.2
44.0625 43.9 44.0625 ... 43.1 44.0625 1 2 2 2 2 2 2 = - - + - + + - = - S - = = n x x s i s
En el mejor de los casos, se encontrar un estimador q para el calcular = q siempre.
Sin embargo, q es una funcin de las Xi muestrales, por lo que en s misma una
variable aleatoria. q = q + error de estimacin entonces el estimador preciso sera uno
que produzca slo pequeas diferencias de estimacin, de modo que los valores
estimados se acerquen al valor verdadero.
Un estimado puntual, por ser un slo nmero, no proporciona por s mismo informacin
alguna sobre la precisin y confiabilidad de la estimacin. Por ejemplo, imagine que se
usa el estadstico x para calcular un estimado puntual de la resistencia real a la ruptura
de toallas de papel de cierta marca, y suponga q Distribucin muestral de medias
Distribucin muestral de medianas 34 que x = 9322.7. Debido a la variabilidad de la
muestra, nunca se tendr el caso de que x =m. El estimado puntual nada dice sobre lo
cercano que esta de m. Una alternativa para reportar un solo valor del parmetro que
se est estimando es calcular e informar todo un intervalo de valores factibles, un
estimado de intervalo o intervalo de confianza (IC). Un intervalo de confianza se calcula
siempre seleccionando primero un nivel de confianza, que es una medida del grado de
fiabilidad en el intervalo. Un intervalo de confianza con un nivel de confianza de 95% de
la resistencia real promedio a la ruptura podra tener un lmite inferior de 9162.5 y uno
6|Pgina
superior de 9482.9. Entonces, en un nivel de confianza de 95%, es posible tener
cualquier valor de m entre 9162.5 y 9482.9. Un nivel de confianza de 95% implica que
95% de todas las muestras dara lugar a un intervalo que incluye m o cualquier otro
parmetro que se est estimando, y slo 5% de las muestras producir un intervalo
errneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del
parmetro que se estima est dentro del intervalo. Una interpretacin correcta de la
confianza de 95% radica en la interpretacin frecuente de probabilidad a largo plazo:
decir que un evento A tiene una probabilidad de 0.95, es decir que si el experimento
donde A est definido re realiza una y otra vez, a largo plazo A ocurrir 95% de las
veces. Para este caso el 95% de los intervalos de confianza calculados contendrn a
m. Esta es una construccin repetida de intervalos de confianza de 95% y se puede
observar que de los 11 intervalos calculados slo el tercero y el ltimo no contienen el
valor de m. De acuerdo con esta interpretacin, el nivel de confianza de 95% no es
tanto un enunciado sobre cualquier intervalo en particular, ms bien se refiere a lo que
sucedera si se tuvieran que construir un gran nmero de intervalos semejantes.
Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una poblacin que sigue la
distribucin Normal, y resulta:
7|Pgina
En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias muestrales
es
8|Pgina
Ejemplo
La siguiente imagen muestra la distribucin de las Medias muestrales obtenidas de
100000 muestras aleatorias y los intervalos alrededor de cada una de las Medias
obtenidas de diez de las muestras:
donde ls y le simbolizan los lmites superior e inferior del intervalo de confianza al 95%.
Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral igual a
3.7) incluyen el valor del parmetro dentro sus lmites.
9|Pgina
2.4.1 INTERVALO DE CONFIANZA PARA LA MEDIA
Supondremos la existencia de dos poblaciones sobre las que una variable determinada
sigue una distribucin Normal con idntica varianza en las dos. Sobre la poblacin 1, la
variable sigue una distribucin N (1, ) y, sobre la poblacin 2, sigue una distribucin
N (2, ). Igualmente supondremos que disponemos de dos muestras aleatorias
10 | P g i n a
independientes, una para cada poblacin, de tamaos
muestrales n1 y n2 respectivamente.
1 2
1 2
Y de varianza
11 | P g i n a
Donde t/2 es el valor de una distribucin t de Student con n1 + n2 2 grados de libertad
que deja a su derecha una probabilidad de /2
Ejemplos:
1. Un artculo publicado dio a conocer los resultados de un anlisis del peso de
calcio en cemento estndar y en cemento contaminado con plomo. Los niveles
bajos de calcio indican que el mecanismo de hidratacin del cemento queda
bloqueado y esto permite que el agua ataque varias partes de una estructura de
cemento. Al tomar diez muestras de cemento estndar, se encontr que el peso
promedio de calcio es de 90 con una desviacin estndar de 5; los resultados
obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en
promedio con una desviacin estndar de 4. Supngase que el porcentaje de
peso de calcio est distribuido de manera normal. Encuntrese un intervalo de
confianza del 95% para la diferencia entre medias de los dos tipos de cementos.
Por otra parte, supngase que las dos poblaciones normales tienen la misma
desviacin estndar.
Solucin:
Ntese que el intervalo de confianza del 95% incluye al cero; por consiguiente,
para este nivel confianza, no puede concluirse la existencia de una diferencia
entre las medias.
12 | P g i n a
2. Se realiz un experimento para comparar el tiempo promedio requerido por el
cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo
necesario para que cada medicamento alcance un nivel especfico en el torrente
sanguneo se distribuye normalmente. Se eligieron al azar a doce personas para
ensayar cada frmaco registrndose el tiempo en minutos que tard en alcanzar
un nivel especfico en la sangre. Calcule un intervalo de confianza del 95% para
la diferencia del tiempo promedio. Suponga varianzas iguales.
Medicamento A Medicamento B
nA = 12 nB = 12
Solucin:
2.35 B- A 9.25
Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel
especfico es mayor para el medicamento B.
13 | P g i n a
2.4.3 Intervalo de confianza para la proporcin
Dada una variable aleatoria con distribucin Binomial B(n, p), el objetivo es la
construccin de un intervalo de confianza para el parmetro p, basada en una
observacin de la variable que ha dado como valor x. El mismo caso se aplica si
estudiamos una Binomial B(1, p) y consideramos el nmero de veces que ocurre el
suceso que define la variable al repetir el experimento n veces en condiciones
de independencia.
Aproximacin asinttica
que sigue una distribucin N(0, 1), y aadiendo una correccin por continuidad al
pasar de una variable discreta a una continua, se obtiene el intervalo de confianza
asinttico:
14 | P g i n a
donde z/2 es el valor de una distribucin Normal estndar que deja a su derecha una
probabilidad de /2 para un intervalo de confianza de (1 ) 100 %. Las condiciones
generalmente aceptadas para considerar vlida la aproximacin asinttica anterior son:
Intervalo exacto
15 | P g i n a
Ejemplo prctico
16 | P g i n a
significativo, puesto que ayudar a interpretar si existe significacin aplicada adems
de la estadstica.
Si se dispone de alguna informacin previa y slo quiere calcularse alguno de los dos
intervalos unilaterales, bastar sustituir z/2 por z y descartar el lmite superior o
inferior del intervalo segn el caso. Por ejemplo, el intervalo unilateral derecho
corresponde a:
17 | P g i n a
Donde 2/2 es el valor de una distribucin ji-cuadrado con n 1 grados de libertad que
deja a su derecha una probabilidad de /2.
Tamao de muestra: 10
Supondremos la existencia de dos poblaciones sobre las que una determinada variable
sigue una distribucin Normal. Sobre la poblacin 1 la variable sigue una distribucin N
(1, 1) y sobre la poblacin 2 sigue una distribucin N (2, 2). Igualmente
18 | P g i n a
supondremos que disponemos de dos muestras aleatorias independientes, una para
cada poblacin, de tamaos muestrales n1 y n2 respectivamente.
19 | P g i n a
2.5 DETERMINACIN DEL TAMAO DE MUESTRA
Todo estudio epidemiolgico lleva implcito en la fase de diseo la determinacin del
tamao muestral necesario para la ejecucin del mismo. El no realizar dicho proceso,
puede llevarnos a dos situaciones diferentes: primera que realicemos el estudio sin el
nmero adecuado de pacientes, con lo cual no podremos ser precisos al estimar los
parmetros y adems no encontraremos diferencias significativas cuando en la realidad
s existen. La segunda situacin es que podramos estudiar un nmero innecesario de
pacientes, lo cual lleva implcito no solo la prdida de tiempo e incremento de recursos
innecesarios sino que adems la calidad del estudio, dado dicho incremento, puede
verse afectada en sentido negativo.
20 | P g i n a
c) Una idea del valor aproximado del parmetro que queremos medir (en este caso una
proporcin). Esta idea se puede obtener revisando la literatura, por estudio pilotos
previos. En caso de no tener dicha informacin utilizaremos el valor p = 0.5 (50%).
Ejemplos
En poblaciones dicotmicas con una proporcin xitos el estimador puntual del parmetro
es la proporcin muestral de xitos, p, que coincide con la media de la muestra cuando se
codifica como 1 la caracterstica que se considera como xito y 0 la que se considera no xito.
A partir de un tamao muestral moderadamente grande el estadstico p tiene una
distribucin aproximadamente normal. El intervalo de confianza Para la proporcin poblacional
21 | P g i n a
est centrado en la proporcin muestral; siendo sus lmites superior
22 | P g i n a
2.5.3 DETERMINACIN DEL TAMAO DE MUESTRA BASADO EN LA
DIFERENCIA ENTRE LAS MEDIAS DE LA POBLACIN
En ocasiones interesa definir un intervalo de valores tal que permita establecer cules son los valores
mnimo y mximo aceptables para la diferencia entre las medias de dos poblaciones. Pueden darse
dos situaciones segn las muestras sean o no independientes; siendo en ambos casos condicin
necesaria que las poblaciones de origen sean normales o aproximadamente normales:
MUESTRAS INDEPENDIENTES
Si puede suponerse que las varianzas de ambas poblaciones son iguales, el intervalo de confianza
para la diferencia de medias poblacionales est centrado en la diferencia de las medias muestrales,
siendo sus lmites superior e inferior:
Si las varianzas poblacionales no pueden suponerse iguales los lmites del intervalo de confianza son:
El valor crtico t /2 corresponde a una distribucin t cuyos grados de libertad se calculan en base a
ambos tamaos mustrales y a las desviaciones tpicas de cada grupo segn la correccin propuesta
por Dixon y Massey:
23 | P g i n a
24 | P g i n a