Anda di halaman 1dari 20

CAPITULO II: PRUEBA DE HIPTESIS E INTERVALOS DE CONFIANZA

TEMA 4. ERROR ESTNDAR


Introdu!"n # $# E%t#d&%t!# In'(r(n!#$
En este captulo trabajaremos con las tcnicas de la Estadstica Inferencial,
a travs de las cuales se busca llegar a conclusiones valederas sobre
poblaciones, tomando como base la informacin obtenida en una muestra. La
nica forma de conocer la informacin exacta sera realizando todas las
observaciones posibles de todo el universo, lo cual suele ser difcil poco pr!ctico
en funcin del costo del tiempo. "e all surge la inferencia estadstica la cual
permite asumir o estimar las caractersticas de la poblacin a partir de las
muestras.
Los dos tipos de problemas #ue resuelven las tcnicas estadsticas son$
estimacin contraste de %iptesis. En ambos casos se trata de generalizar la
informacin obtenida en una muestra a una poblacin. Estas tcnicas exigen #ue
la muestra sea aleatoria. En la pr!ctica rara vez se dispone de muestras
aleatorias, por la tanto la situacin %abitual es la #ue se es#uematiza en la &igura'
&igura '. "iferenciacin entre la poblacin la
muestra.
Entre la muestra con la #ue se trabaja la poblacin de inters, o poblacin
diana, aparece la denominada poblacin de muestreo$ poblacin (la maor parte
de las veces no definida con precisin) de la cual nuestra muestra es una muestra
aleatoria. En consecuencia, la generalizacin est! amenazada por dos posibles
tipos de errores$ error aleatorio #ue es el #ue las tcnicas estadsticas permiten
cuantificar crticamente dependiente del tama*o muestral, pero tambin de la
variabilidad de la variable a estudiar el error sistemtico #ue tiene #ue ver con la
diferencia entre la poblacin de muestreo la poblacin diana #ue slo puede
ser controlado por el dise*o del estudio.
+abe recordar #ue la informacin de las muestras se trabaja a partir de
estadsticos. ,n estadstico es una variable aleatoria cuos valores pueden ser
determinados a partir de la observacin de una muestra aleatoria. Este muestra
una distribucin de probabilidades propias, la cual es conocida como distribucin
muestral de un estadstico. -s puede tenerse una distribucin muestral de
medias, cuando el estadstico es la media aritmtica. distribucin muestral de
proporciones, cuando el estadstico es una proporcin o porcentaje, as
sucesivamente.
Las medidas obtenidas en una muestra (estadsticos) frecuentemente son
diferentes al par!metro de la poblacin. - la diferencia de estas dos medidas se
les denomina error. "eterminar el tama*o de ese error slo sera posible si se
conociera el par!metro de la poblacin, pero este por lo general se desconoce.
/in embargo, el error es posible estimarlo siguiendo un modelo estadstico.
En el caso #ue el estadstico sea la media aritmtica tenemos$
Xi 0 + Ei
Xi $ es el valor de la variable.
$ es la media poblacional.
Ei$ es el error.
/e pueden graficar las frecuencias de Ei, cua distribucin de frecuencias
se comporta como una distribucin normal, con media cero varianza s
1
o
1
. Los
errores pueden ocurrir por exceso o por defecto, lo #ue significa #ue Ei tendr!
valores positivos negativos. +uando se estudia un gran nmero de valores de Ei,
el promedio de ellos es cero.
En una distribucin de frecuencias la medida de dispersin es la desviacin
est!ndar, en la distribucin muestral es el error est!ndar, el cual no es m!s #ue
el promedio de los errores muestrales. Ello significa #ue las distintas medias de la
distribucin muestral contienen una fraccin de error en sus estimaciones con
respecto a la media poblacional.
2odo estadstico de una variable continua tiene una distribucin muestral,
donde$
'. La media de las medias de las muestras es igual a la media de la
poblacin.
1. La varianza de las medias de las muestras es igual a la varianza de la
poblacin, dividida entre el tama*o de las muestras (n).
3. La distribucin de las medias muestrales tiene forma de curva normal.
D('!n!!"n ) C*$u$o d($ Error E%t*nd#r
El error est!ndar puede definirse como la diferencia #ue existe entre el valor
estimado en la muestra (estadstico) el verdadero valor representativo de la
poblacin (par!metro), por lo tanto, mientras menor sea el error est!ndar maor
ser! la aproximacin del estadstico al par!metro.
-l error est!ndar tambin se le conoce como error por muestreo o error
tpico, puede indicarse #ue la magnitud del error es directamente proporcional a
la dispersin de la poblacin de origen de la muestra e inversamente proporcional
al tama*o de sta. 4ientras maor sea la muestra, menor es la magnitud del error
est!ndar.
C*$u$o d($ (rror (%t*nd#r
"ado #ue el error est!ndar es una desviacin est!ndar en una distribucin
muestral, este representa una medida de la dispersin de la distribucin de los
valores de las medias de muestras tomadas de una poblacin, de la misma
manera #ue la desviacin est!ndar lo es para la dispersin de los datos originales.
5ara calcular el error est!ndar de la media se utiliza la formula$

n
s
Sx =
"onde s$ desviacin est!ndar de la muestra
n$ tama*o de la muestra
Sx $ error est!ndar
5ara calcular el error est!ndar de una proporcin o porcentaje$
n
q x p
= Sp
"onde p$ porcentaje de sujetos con la caracterstica de estudio.
q$ ('667p) porcentaje de sujetos sin la caracterstica de estudio.
n$ tama*o de la muestra
8bsrvese #ue %a dos situaciones en las #ue la posibilidad de error es
nula (error est!ndar igual a cero)$
,na de ellas se produce cuando en la poblacin original no %a
dispersin, es decir #ue todos sus datos son iguales. -l ser el
numerador cero, el cociente es cero.
La segunda se verifica cuando la muestra tomada es infinitamente
grande, o cuando se evala la totalidad de la poblacin, en este caso
el denominador es infinito el resultado de dividir cual#uier valor por
infinito es cero.
En la realidad de la investigacin es poco probable #ue se den estas dos
situaciones, a #ue en los datos numricos es casi imposible evitar la dispersin,
por#ue no todos los individuos de una poblacin se comportan exactamente igual
o por#ue es casi imposible no cometer algn error en la recoleccin de datos. 5or
otro lado, las poblaciones de inters son de tama*o demasiado grande como para
#ue sea posible trabajar con todos sus integrantes.
En este sentido, puede indicarse #ue de todas las muestras tomadas en
forma aleatoria a partir de una poblacin$
a) -lrededor del 9: ; tiene valores de media aritmtica entre x 1
+, +erca del <= ; tiene valores de media aritmtica entre x 2
, -lrededor del << ; tiene valores de media aritmtica entre x 5 , 2
"e la misma forma puede indicarse #ue al tomar una muestra al azar$
a) Es >poco probable? (p @ 6,6=) #ue su media aritmtica est alejada de la
media de la poblacin m!s de dos errores est!ndar.
b) Es >mu poco probable? (p @ 6,6') #ue su media aritmtica est alejada
de la media de la poblacin m!s de dos medio errores est!ndar.
E-(./$o 401. /i de una poblacin con 0 '666 0 A6, se toman muestras con n
0 1= puede esperarse #ue el <= ; de ellas tenga valores para su estadstico
media aritmtica entre <:A '6'9. Esto es as por#ue el error est!ndar en
esta situacin es : (A6 dividido entre 25 ) dos veces : es '9.
8
5
40
25
40
Sx = = =
1 /x 0 1 x : 0 '9
B 1 /x 0 '666 B '9 0 '6'9
7 1 /x 0 '666 7 '9 0 <:A
Mu(%tr#% on d#to% no.!n#$(%
-l tomar muestras de poblaciones de datos nominales la situacin es
e#uivalente a la descrita para los datos numricos. /igamos un ejemplo.
E-(./$o 402. +onsidrese una poblacin %ipottica de : individuos, de los cuales
A (p 0 6,= o =6;) est!n en la categora >enfermos?. Los resultados posibles al
tomar muestras de tama*o A (n 0 A) se muestran en la 2abla ' (4acc%i, 166'). -l
estimar el par!metro con el valor del estadstico a veces se >acierta? a veces se
sobrestima o subestima, pero >en promedio? se estima bien.
2ambin en este caso la magnitud del error posible en la estimacin es
inversamente proporcional al tama*o de la muestra, a maor tama*o de la
muestra menor error posible.
La diferencia estriba en #ue la distribucin en este caso no es normal sino
binomial el valor del error est!ndar es la raz cuadrada del valor obtenido de$

n p p / ) 1 (

Esto es la raz cuadrada del resultado del producto de la proporcin en una
categora (6,= en la categora >enfermos? en el ejemplo) por la #ue no est! en la
categora (C' D pE 0 6,= en el ejemplo) dividido por el tama*o de la muestra (A en el
ejemplo).
25 0 0625 0
4
25 0
4
(0,5) 0,5
Sx , ,
,
= = = =
2abla '. Fesultados en las muestras tomadas de una poblacin %ipottica.
5oblacin$ enfermos$ A sanos$ A p 0 6,= =6;
4,E/2F- ; EG&EF48/
- A enfermos,6 sanos '66,6
H 3 enfermos,' sano I=,6
+ 1 enfermos,1 sanos =6,6
" ' enfermo,3 sanos 1=,6
E 6 enfermo, A sanos 6,6
/uma
; promedio
1=6,6
=6,6
U%o% d($ (rror (%t*nd#r
En funcin del error est!ndar de las propiedades de la distribucin
muestral, es posible$
a) Estimar los valores representativos de una poblacin.
b) 2omar decisiones en funcin de pruebas de %iptesis.
c) +alcular el tama*o de una muestra, cuando se espera una determinada
precisin del estadstico el par!metro.
E-(./$o 403. En una poblacin de adultos sin manifestaciones de presencia de
c!lculos sobre sus superficies dentales, el contenido de calcio en saliva tiene un
valor de media aritmtica de =,9mgJ'66ml con una desviacin est!ndar de 6,<
mgJ'66ml.
a) KEs >poco probable? (p L 6,6=) o no #ue la media aritmtica de una
muestra de tama*o '66 tenga un valor de =,3 mgJ'66mlM Es poco probable,
a #ue este valor est! alejado de la media de la poblacin, 6,36 m!s de dos
errores est!ndar. El error est!ndar de este caso es 6,6< (6,<J 100 ) #ue
multiplicado por dos es 6,':.
0 =,9mgJ'66ml
0 6,< mgJ'66ml
n 0 '66
n
s
Sx = 09 0
10
9 0
100
0,9
Sx ,
,
= = =
2 S
x
= 2 x 0,09 = 0,18
7 1 /x 0 =,9 mgJ'66ml 7 6,': mgJ'66ml 0 =,A1 mgJ'66ml
Es poco probable. =,A1 L =,3
b) KN si la muestra %ubiera tenido un tama*o igual a 16M El valor
obtenido no sera poco probable, a #ue en este caso el error est!ndar es de
6,16 (6,<J 100 ) multiplicado por 1 es 6,A6, valor menor #ue 6,36.
/ n 0 16
20 0
47 4
9 0
20
0,9
Sx ,
,
,
= = =
1 /x 0 1 x 6,16 0 6,A6 7 1 /x 0 =,9 mgJ'66ml 7 6,A mgJ'66ml 0 =,1 mgJ'66ml
Es probable. =,1 @ =,3
E-(./$o 404. En una poblacin de adultos jvenes la estatura media (media
aritmtica) es de ',I6 m la desviacin est!ndar 6,1A m. K4enor o maor de
#u valor debe ser la media aritmtica de una muestra de tama*o 9A, tomada
de esa poblacin para poder considerar #ue se est! frente a una situacin
poco probable (p L 6,6=)M El error est!ndar de la distribucin de las medias de
las muestras de ese tama*o tomadas de esa poblacin es de 6,63 (6,1A J 64
). Los valores ',9A ',I9 est!n dos errores est!ndar alejados de la media.
5or lo tanto, cuando la media de la muestra obtenida sea menor o maor,
respectivamente, #ue esos dos valores, se estar! frente a una situacin >poco
probable?.
0 ',I6 m
0 6,1A m
03 0
8
24 0
64
0,24
Sx ,
,
= = =
n 0 9A
1 /x 0 1 x 6,63 0 6,69
O 1 /x $ B 1 /x 0 ',I6 m B 6,69 m 0 ',I9 m
7 1 /x 0 ',I6 m 7 6,69 m 0 ',9A m
T#.#4o .u(%tr#$
El tama*o muestral juega el mismo papel en estadstica #ue el aumento de
la lente en microscopa$ si no se ve una bacteria al microscopio, puede ocurrir #ue$
7 la preparacin no la contenga
7 el aumento de la lente sea insuficiente.
5ara decidir el aumento adecuado %a #ue tener una idea del tama*o del
objeto. "el mismo modo, para decidir el tama*o muestral$
i) en un problema de estimacin %a #ue tener una idea de la magnitud a
estimar del error aceptable.
ii) en un contraste de %iptesis %a #ue saber el tamao del efecto #ue se
#uiere ver.
Peneralmente, se considera #ue el tama*o de la muestra debe estar en
funcin del tama*o de la poblacin, se dice #ue debe ser proporcional a este.
/in embargo, cuando la poblacin es mu extensa, no es indispensable #ue la
muestra sea tan numerosa. es cuestin de determinar la cantidad apropiada, a fin
de #ue el error muestral no afecte los resultados, su vez no se derroc%en
recursos, al utilizar una muestra de maor tama*o #ue la re#uerida.
Existen frmulas #ue permiten calcular el tama*o adecuado de una muestra
cuando se espera una determinada precisin en los resultados. Las frmulas a
utilizar dependen de la informacin disponible (5uertas col., '<<:).
') +uando se conoce el tama*o de la poblacin (G), se puede aplicar la
siguiente frmula$
) P N (
N
n
2
1 +
=
donde, n $ tama*o de la muestra
N $ nmero total de sujetos u objetos en la poblacin o tama*o de la
poblacin
P $ precisin (error m!ximo permitido entre el par!metro el
estadstico), expresado en proporcin.
1) +uando se #uiere estimar el promedio de una poblacin se conoce la
desviacin est!ndar de la poblacin$
2
2 2
P
s Z
n

=
donde, n $ tama*o de la muestra
$ ',<9 constante. Expresa el nivel de confianza
s $ desviacin est!ndar (conocida o estimada) de la poblacin
P $ precisin
3) +uando se conoce la proporcin o porcentaje la poblacin #ue tiene la
caracterstica de inters$
2
2
Z
P
q p
n

=
donde, n $ tama*o de la muestra
$ ',<9 constante. Expresa el nivel de confianza
p $ porcentaje de la poblacin #ue tiene la caracterstica de inters
q $ porcentaje de la poblacin #ue G8 tiene la caracterstica de
inters
(q 0 ' D p)
P $ precisin
E-(./$o 405. /e desea conocer las condiciones de las familias afectadas
directamente por la inundacin del Fo 5ao al /ur del Estado -nzo!tegui. /e
estima #ue el !rea de la cuenca afectada por la inundacin abarca 16.666 familias.
/e decide tomar una muestra en la cual el error m!ximo permitido en los
resultados no sea maor de un =;. K+u!ntas familias deben incluirse en la
muestraM
N 0 16.666 familias
P 0 =; (6,6= expresado en proporcin)
( ) [ ]
5 392
0,05 20000 1
20000
1
2 2
,
) P N (
N
n =
+
=
+
=
5or lo tanto, la muestra re#uerida debe ser de 3<3 familias.
E-(./$o 406. ,n investigador necesita conocer el valor promedio de plomo en
sangre venosa de los pacientes #ue asisten al %ospital donde el trabaja en el
centro de +aracas. En la literatura revisada encuentra #ue el valor promedio de
plomo en sangre es de 6,:3 mgJ'66ml, con una desviacin est!ndar de 6,6=
mgJ'66ml, determinado con un mtodo distinto al #ue l utilizar!. Est! dispuesto a
tolerar 6,61 mgJ'66ml como error m!ximo entre el valor del universo la muestra.
K+u!ntos pacientes deben conformar la muestraM
s ! 6,6= mgJ'66ml
P ! 6,61 mgJ'66ml
! ',<9
01 24
02 0
05 0 96 1
2
2 2
2
2 2
,
,
, ,
P
s Z
n =

=
La muestra debe estar conformada por 1A pacientes.
E-(./$o 407. /e desea realizar una investigacin sobre el desarrollo de
enfermedades respiratorias en una poblacin cercana al botadero de basura La
Honanza (va los Qalles del 2u, Edo. 4iranda), en la #ue anteriormente se %a
estimado la #ue el 16; de la poblacin presenta este tipo de sntomas. /e desea
saber cu!ntas familias deben constituir la muestra, s el ndice buscado vara en
m!s de un 9; con respecto al universo.
p 0 16;
q 0 ('66 7 16) 0 :6;
P 0 9;
0 ',<9
73 170 96 1
6
80 20 2
2
2
2
, , Z
P
q p
n =

=
La muestra debe estar conformada por 'I' familias.
TEMA 5: ESTIMACIN
L# E%t!.#!"n
+omo vimos en el tema anterior, la inferencia estadstica permite %acer
generalizaciones %acia la poblacin a partir de la informacin obtenida en una
muestra. En este sentido, mediante la induccin es posible obtener un valor
representativo de la poblacin, el cual se conoce con el nombre de estimador.
Los resultados de un estimador pueden ser expresados como un simple
valor. entendido como una estimacin en un punto, o un rango de valores, referido
como un intervalo de confianza. /iempre #ue utilicemos la valoracin de un punto,
calculamos el margen de error asociado a la estimacin de ese punto.
El estimador usual de la media poblacional es 0 Rxi J n, donde n es el
tama*o de la muestra x', x1, x3,.......,xn son los valores de la muestra. /i el valor
del estimador en una muestra particular es =, entonces = es la estimacin del S de
la media de la poblacin.
/in embargo, al proceder de esta manera no es posible tener muc%a
>confianza? en la estimacin realizada. 5uede %aberse tenido la >suerte? suficiente
como para extraer de la poblacin un subconjunto de sus integrantes (muestra) en
el #ue se manifieste esa situacin. - menos #ue en la poblacin no %aa
dispersin o la muestra %aa sido infinitamente grande, tambin puede %aberse
tenido >mala suerte? de #ue esos estadsticos sobrestimen o subestimen los
par!metros de la poblacin.
La situacin podra asemejarse a la >confianza? #ue se puede tener de
>ganar un sorteo? mediante la ad#uisicin de uno de entre todos los nmeros #ue
se sortear!n. / estos son '66 tenemos en nuestro poder uno, podramos indicar
#ue tenemos una confianza de uno en cien (6,6' o ';) de ganar el premio. / se
consiguen dos o m!s esos nmeros podemos duplicar o aumentar nuestra
confianza, aun#ue para transformar esa confianza en seguridad de ganar sera
necesario disponer de la totalidad de los nmeros.
La estimacin es un proceso mediante el cual, en una muestra se obtiene
un determinado valor, denominado estadstico, para luego, en funcin de l,
calcular (estimar) su valor en la poblacin correspondiente. Fecordemos #ue este
valor poblacional recibe el nombre de par!metro.
,n estimador es cual#uier cantidad calculada de los datos de la muestra los
cuales se utilizan para obtener informacin sobre una cantidad desconocida de la
poblacin. 5or ejemplo, la media muestral es un estimador de la media
poblacional.
Cu#$!d#d(% d( un +u(n E%t!.#dor
5ara #ue resulte de maor utilidad un buen estimador debe tener$
imparcialidad, consistencia, ausencia de sesgo eficiencia.
'. I./#r!#$!d#d: ,na estimacin es imparcial con respecto a un par!metro
cuando el valor esperado del estimador puede ser expresado igual al
par!metro #ue %a sido estimado. 5or ejemplo, la media de una muestra es
una estimacin imparcial de la media de la poblacin de la cual la muestra
fue obtenida. La imparcialidad es una buena cualidad para una estimacin,
puesto #ue, usando el promedio ponderado de varias estimaciones se
obtendra una mejor estimacin #ue de cada una de ellas por separado. 5or
lo tanto, la imparcialidad permite #ue actualicemos nuestras estimaciones.
5or ejemplo, si sus estimaciones de la medias poblacional S son, digamos
'6, '',1 con respecto a dos muestras independientes de tama*os 16,
36 respectivamente, la mejor estimacin de la media poblacional S basada
en ambas muestras es C 16 ('6) B 36 ('',1) E (16 B 36) 0 '6,I=.
1. Au%(n!# d( %(%8o$ /e dice #ue un estimador es insesgado si la media de
la distribucin de medias de las muestras, es igual al valor del par!metro
estimado. La media X es un estimador insesgado de S.
3. Con%!%t(n!#: como estudiamos en el tema anterior, la desviacin est!ndar
de una estimacin es llamada el error est!ndar de esa estimacin. 4ientras
m!s grande es el error est!ndar existir! m!s error en su estimacin. La
desviacin est!ndar de una estimacin es un ndice comnmente usado del
error exigido al estimar un par!metro de la poblacin basado en la
informacin en una muestra de tama*o n escogida al azar de la poblacin
entera. ,n estimador debe ser >consistente? si al aumentar el tama*o de la
muestra se produce una estimacin con un error est!ndar m!s pe#ue*o.
5or lo tanto, su estimacin es >consistente? con el tama*o de la muestra. Es
decir, realizando un esfuerzo maor, se obtiene una muestra m!s grande
#ue produce una mejor estimacin. ,n estimador consistente es a#uel #ue
tiende aproximarse al valor del par!metro de la poblacin, en la medida #ue
el tama*o de la muestra crece.
A. E'!!(n!#: /e refiere a la precisin con la cual tales medidas pueden
estimar un par!metro. ,na estimacin eficiente es la #ue tiene el error
est!ndar m!s pe#ue*o entre todos los estimadores imparciales. El >mejor?
estimador es el #ue est! m!s cercano al par!metro de la poblacin #ue es
estimado, a#uel #ue tenga menor error est!ndar.
&igura 1. El +oncepto de eficiencia para un
estimador.
En la &igura 1 se ilustra el concepto de la
proximidad por medias #ue tienen como objetivo el
centro para la imparcialidad con varianza mnima.
+ada tablero de dardos tiene varias muestras$
El primero tiene todos los tiros agrupados firmemente juntos, pero ningunos
de ellos golpean el centro. El segundo tiene una extensin mas grande, pero
alrededor del centro. El tercero es peor #ue los primeros dos. /lo el ltimo tiene
un grupo apretado alrededor del centro, por lo tanto tiene buena eficiencia.
/i un estimador es imparcial, entonces su variabilidad determinar! su
confiabilidad. /i un perito es extremadamente variable, las estimaciones #ue
produce pueden en promedio no estar tan cerca del par!metro poblacional como
lo estara un estimador parcializado con varianza m!s pe#ue*a.
E%t!.#!"n d( /#r*.(tro%.
La estimacin de par!metros puede efectuarse por puntos o por intervalos.
La estimacin por puntos plantea un solo valor numrico como par!metro de la
poblacin, estimado a partir de una muestra.
Es probable #ue al considerar un solo punto como estimador de un
par!metro se cometa un error, a #ue la muestra no es m!s #ue una pe#ue*a
parte de un conjunto muc%o m!s grande, por lo tanto es aventurado afirmar #ue el
valor correspondiente a la poblacin sea el mismo valor calculado para la muestra.
5ero si el nmero de observaciones es suficientemente grande, se obtendr! una
medida mu similar a la del par!metro. /in embargo, con frecuencia %a
limitaciones en cuanto a recurso tiempo, por lo cual es necesario decidir slo
sobre la base de algunas observaciones, determinar cuanta probabilidad existe
#ue el valor estimado en la muestra coincida con el valor del par!metro. En este
caso, no se estar! utilizando el mtodo de estimacin puntual sino de intervalo.
-l considerar un estimador de un par!metro poblacional 9, la realizacin
de una muestra aleatoria de tama*o n, :1, :2,..., :n. suministra n datos, valores u
observaciones, ;1, ;2,..., ;n, #ue determinan una (%t!.#!"n /untu#$ del
par!metro desconocido$
/i pretendemos, por ejemplo, estimar puntualmente el valor medio < con el
estimador media muestral, extraeremos una muestra de la poblacin,
observaremos el valor de la variable en los n individuos de la muestra. En tal caso,
los n datos obtenidos ;1, ;2,..., ;n= permiten calcular lo deseado$
La estimacin por intervalos consiste en estimar dos valores numricos
extremos, los cuales permiten construir un intervalo, entre cuos lmites se
considera est! incluido el par!metro a estimar, segn el nivel de confianza o de
acierto, previamente establecido por el experimentador.
La (%t!.#!"n /or !nt(r>#$o% de un par!metro 9 consiste en la
determinacin de un intervalo, #ue contendr! el par!metro con una confianza 10 ,
nmero entre 6 ', fijado por el experimentador. 5ara ello se re#uerir! lo
siguiente$
,na muestra aleatoria :1= :2=...= :n de tama*o n extrada de la poblacin :.
,n estimador del par!metro poblacional 9, con distribucin o le de
probabilidad conocida.
El nivel de confianza 10 , establecido a priori por el experimentador (los
usuales son ?.@5, ?.@? ?.@@).
,na estimacin de intervalo de un par!metro, es un segmento en el
continuo de la escala de nmeros, donde en algn punto del cual se supone se
encuentra el valor del par!metro considerado. Esto significa #ue en lugar de tener
un solo punto como estimacin de un par!metro, se tiene a%ora todo un conjunto
de puntos adacentes, esto es, un intervalo entre cuos puntos, probablemente
alguno coincida con el valor del par!metro, con nivel de probabilidades de acierto
conocido. &ijando de esta manera lo #ue se denomina un intervalo de confianza. el
cual se obtienen mediante la frmula$
Estimador " #$alor cr%tico x error estndar&
Ese intervalo numrico se calcula de tal forma #ue el investigador puede
tener una confianza determinada, aun#ue no la seguridad de #ue el valor buscado
se encuentra dentro de l.
E%t!.#!"n d( $# .(d!# d( $# /o+$#!"n
5ara estimar este par!metro se re#uiere conocer la media aritmtica
de la muestra, as como su desviacin est!ndar fijar el nivel de confianza, el cual
indica la probabilidad de #ue el valor del par!metro se encuentre dentro de los
lmites del intervalo establecido. La expresin matem!tica #ueda de la siguiente
manera$
n
s
Z X
n
s
Z - X + > >
o de manera m!s sencilla$
inter$alo de confian'a 0
( ) x S Z X

/iendo
n
s
S
x
=
donde$
X $ media aritmtica de la muestra.
$ valor crtico o valor sigma. /e busca en la tabla de !reas de la curva
normal, segn el nivel de confianza establecido.
Sx $ error est!ndar.
s $ desviacin est!ndar de la muestra.
n $ tama*o de la muestra.
E-(./$o 501. En una investigacin acerca del estado nutricional de los
escolares de primero a tercer grado, se encontr #ue los niveles de %emoglobina
en aunas se distribuen en forma normal, con una media aritmtica de '1.3:gr;,
una desviacin est!ndar de 6.:Igr;. /e desea conocer, con el <=; de
confianza, el valor promedio de %emoglobina para esa poblacin de escolares, de
donde se extrajo la muestra aleatoria de 'AA ni*os (5uertas col., '<<:).
"-28/$
X 0 '1.3:gr;
s 0 6.:Igr;
n 0 'AA ni*eos
ni$el de confian'a 0 <= ; (T 0 6.6=), el cual e#uivale a '.<9 sigma (U).
-plicando la frmula del inter$alo de confian'a 0
n
s
Z X
0
144
% 087
96 . 1 % 38 . 12
gr
gr
0
07 0 x 96 1 38 12 . . % gr .
0
14 . 0 % 38 . 12 gr
'1.=1 gr;
'1.1A gr;
+onclusin$ En esa poblacin de escolares, la media aritmtica de
%emoglobina no debe ser menor de '1.1Agr;, ni maor de '1.=1gr;. /e %ace tal
afirmacin con <=; de probabilidades de estar en lo cierto, (nivel de confianza) o
con un = ; de riesgo de no acertar o de e#uivocacin (Givel de significacin).
E-(./$o 502. En una muestra de 3=6 mujeres se evalu la edad en la #ue
se presentaron los primeros sntomas de osteoporosis. /e obtuvieron los
siguientes estadsticos de esa muestra$ media aritmtica A:,1 a*os desviacin
est!ndar '6,1 a*os. KVu estimacin con <=; de confianza puede %acerse con
respecto al par!metro media aritmtica de la poblacin a partir de estos datosM
(4acc%i, 1663)
0
350
aos 2 10
96 1 aos 2 48
.
. .
0 .55 0 x 96 1 aos 8.2 4 .
0 07 1 aos 2 48 . . AI.' a*os
A<.3 a*os
En resumen, puede estimarse con <= ; de confianza #ue el par!metro de
la poblacin est! entre AI,' A<,3.
D!%tr!+u!"n .u(%tr#$ d( .(d!#%
Si tenemos una muestra aleatoria de una poblacin N(, ), se sabe (Teorema
del lmite central) que la funcin de la distribucin de la media muestral es
tambin normal con media y varianza
2
/n. sto es e!acto para poblaciones
normales y apro!imado (buena apro!imacin con n"#$) para poblaciones
cualesquiera. s decir es el error tpico, o error estndar de la media.
%&mo usamos esto en nuestro problema de estimacin'
() problema* No +ay tablas para cualquier normal, slo para la normal ,$ y
,( (la llamada z)- pero +aciendo la transformacin (llamada tipificacin)
una normal de media y desviacin se transforma en una z.
.lamando z

al valor de una
variable normal tipificada que de/a
a su derec+a un 0rea ba/o la curva
de , es decir, que la probabilidad
que la variable sea mayor que ese
valor es (estos son los valores
que ofrece la tabla de la normal)
podremos construir intervalos de la
forma
para los que la probabilidad es (1.
2eniendo en cuenta la simetr3a de la normal y manipulando al4ebraicamente
que tambin se puede escribir
o, +aciendo nfasis en que es el error est0ndar de la media,
5ecurdese que la probabilidad de que est en este intervalo es ( 1 . 6 un
intervalo de este tipo se le denomina intervalo de confianza con un nivel de
confianza del ($$(( 1 )7, o nivel de significacin de ($$7. l nivel de
confianza +abitual es el 897, en cuyo caso ,$,$9 y z

/2,(,8:. 6l valor se
le denomina estimacin puntual y se dice que es un estimador de .
Ejemplo 5-3. Si de una poblacin normal con varianza ; se e!trae una
muestra aleatoria de tama<o 2$ en la que se calcula se puede decir
que tiene una probabilidad de $,89 de estar comprendida en el intervalo
que ser3a el intervalo de confianza al 897 para .
n 4eneral esto es poco =til, en los casos en que no se conoce tampoco suele
conocerse
2
- en el caso m0s realista de
2
desconocida los intervalos de
confianza se construyen con la t de Student (otra funcin de la distribucin de
probabilidades continua para la que +ay tablas) en lu4ar de la z.
o, +aciendo nfasis en que es el error est0ndar estimado de la media,
sta manera de construir los intervalos de confianza slo es v0lida si la
variable es normal. &uando n es 4rande ("#$) se puede sustituir t por z sin
muc+o error.
E%t!.#!"n d( /ro/or!on(%
Sea X una variable binomial de par0metros n y p (una variable binomial es el
n=mero de xitos en n ensayos- en cada ensayo la probabilidad de !ito (p) es
la misma, por e/emplo* n=mero de diabticos en 2$$$ personas).
Si n es 4rande y p no est0 pr!imo a $ ( (np 9) X es apro!imadamente
normal con media np y varianza npq (siendo q , ( 1 p) y se puede usar el
estad3stico

(proporcin muestral), que es tambin apro!imadamente normal, con error
tpico dado por
en consecuencia, un >& para p al ($$(( 1 )7 ser0
es decir, la misma estructura que antes*
?bsrvese que para construirlo, @se necesita conocer pA. Si n es 4rande ("#$)
se pueden substituir p y q por sus estimadores sin muc+o error, en cualquier
caso como pq $,29 si se substituye pq por $,29 se obtiene un intervalo m0s
conservador (m0s 4rande).
Ejemplo 5-4. n una muestra de ($$ pacientes sometidos a un cierto
tratamiento se obtienen B$ curaciones. &alcular el intervalo de confianza al
897 de la eficacia del tratamiento.
6,I1'9
6,:I:A
%Cu si4nifica este intervalo' .a verdadera proporcin de curaciones est0
comprendida entre, apro!imadamente, D27 y BB7 con un 897 de
probabilidad.
%s suficientemente preciso' Eabr0 que /uz4arlo con criterios cl3nicos.
AC".o %( !nt(r/r(t# un# on'!#nB# d($ @5CD
/i llevamos a cabo un experimento '66 veces obtendramos '66
distribuciones muestrales de datos '66 intervalos de confianza. "e estos '66
intervalos, <= de ellos cubriran el valor del verdadero par!metro poblacional.
"esgraciada o afortunadamente, nosotros solo realizamos el experimento una sola
vez. +on lo #ue nunca sabremos si nuestro intervalo es uno de esos <= #ue
contienen el par!metro de estudio.
2cnicamente, aun#ue esto suene a una sofisticacin innecesaria, no
podemos asociar el concepto de nivel de confianza con el concepto de
probabilidad. -s no se puede establecer #ue tenemos una probabilidad del <=;
de #ue el par!metro buscado este dentro de nuestro intervalo. Existe una relacin
entre el tama*o de muestra el anc%o del intervalo de la confianza, aunado a
esto, el intervalo de confianza calculado algunas veces no contiene al valor
verdadero.
"igamos #ue se calcula un intervalo de confianza del <=; para una media
WX. La manera de interpretar esto es imaginar un nmero infinito de muestras de la
misma poblacin, el <=; de los intervalos calculados contendr!n la media W de la
poblacin, el =; no. /in embargo, es incorrecto indicar, >tengo el <=; de
confianza de #ue la media XW de la poblacin est! dentro del intervalo.?
,na vez m!s la definicin usual de un intervalo de confianza del <=; es un
intervalo construido por un proceso tal #ue el intervalo contendr! el valor
verdadero el <=; del tiempo. Esto significa #ue el ><=;? es una caracterstica del
proceso, no el intervalo.
5YPIG-/ ZEH V,E 5,E"EG +8G/,L2-F
%ttp$JJ[[[.%rc.esJbioestJ4\docente.%tml
%ttp$JJ[[[.e7
biometria.comJebiometriaJconceptos\basicosJestimacion\estadistica.%tm
"r. ]ossein -rs%am
%ttp$JJ%ome.ubalt.eduJntsbars%JHusiness7statJopre=6A/.%tm^r#ualestiunbsuff
Contr#%t(% d( E!/"t(%!%
,na (iptesis estad%stica es una asuncin relativa a una o varias poblaciones, #ue
puede ser cierta o no. Las %iptesis estadsticas se pueden contrastar con la
informacin extrada de las muestras tanto si se aceptan como si se rec%azan se
puede cometer un error.
La %iptesis formulada con intencin de rec%azarla se llama (iptesis nula se
representa por ]6. Fec%azar ]6 implica aceptar una (iptesis alternati$a (]').
La situacin se puede es#uematizar$
]6 cierta ]6 falsa
]' cierta
]6 rec%azada Error tipo I (a ) "ecisin correcta (_)
]6 no rec%azada "ecisin correcta Error tipo II (b )
(_) "ecisin correcta #ue se busca
a 0 p(rec%azar ]6`]6 cierta)
b 0 p(aceptar ]6`]6 falsa)
5otencia 0'7b 0 p(rec%azar ]6`]6 falsa)
D(t#$$(% # t(n(r (n u(nt#
' a b est!n inversamente relacionadas.
1 /lo pueden disminuirse las dos, aumentando n.
Los pasos necesarios para realizar un contraste relativo a un par!metro # son$
1. Establecer la %iptesis nula en trminos de igualdad
2. Establecer la %iptesis alternativa, #ue puede %acerse de tres maneras,
dependiendo del inters del investigador
en el primer caso se %abla de contraste bilateral o de dos colas, en los otros dos
de lateral (derec(o en el 1a caso, o i'quierdo en el 3a) o una cola.
3. Elegir un ni$el de si)nificacin$ nivel crtico para a
4. Elegir un estad%stico de contraste$ estadstico cua distribucin muestral se
conozca en ]6 #ue est relacionado con # establecer, en base a dic%a
distribucin, la re)in cr%tica$ regin en la #ue el estadstico tiene una probabilidad
menor #ue a si ]6 fuera cierta , en consecuencia, si el estadstico caera en la
misma, se rec%azara ]6.
8bsrvese #ue, de esta manera, se est! m!s seguro cuando se rec%aza una
%iptesis #ue cuando no. 5or eso se fija como ]6 lo #ue se #uiere rec%azar.
+uando no se rec%aza, no se %a demostrado nada, simplemente no se %a podido
rec%azar. 5or otro lado, la decisin se toma en base a la distribucin muestral en
]6, por eso es necesario #ue tenga la igualdad.
5. +alcular el estadstico para una muestra aleatoria compararlo con la regin
crtica, o e#uivalentemente, calcular el bvalor pb del estadstico (probabilidad de
obtener ese valor, u otro m!s alejado de la ]6, si ]6 fuera cierta) compararlo con
a.
E-(./$o:
Estamos estudiando el efecto del estrs sobre la presin arterial. Guestra %iptesis
es #ue la presin sistlica media en varones jvenes estresados es maor #ue ':
cm de ]g. Estudiamos una muestra de 39 sujetos encontramos
1. /e trata de un contraste sobre medias. La %iptesis nula (lo #ue #ueremos
rec%azar) es$
2. la %iptesis alternativa
es un contraste lateral derec%o.
3. &ijamos ba priorib el nivel de significacin en 6,6= (el %abitual en Hiologa).
4. El estadstico para el contraste es
la regin crtica 2Lta
/i el contraste %ubiera sido lateral iz#uierdo, la regin crtica sera 2@t'7a
si %ubiera sido bilateral 2@t'7 aJ1 o 2Lt aJ1
En este ejemplo t(3=)6,6=0',9<.
5. +alculamos el valor de t en la muestra
no est! en la regin crtica (no es maor #ue ',9<), por tanto no rec%azamos ]6.
8tra manera e#uivalente de %acer lo mismo (lo #ue %acen los pa#uetes
estadsticos) es buscar en las tablas el bvalor pb #ue corresponde a 206,:33, #ue
para 3= g.l. es aproximadamente 6,16. Es decir, si ]6 fuera cierta, la probabilidad
de encontrar un valor de 2 como el #ue %emos encontrado o ma*or (Kpor #u
maorM 5or#ue la ]' es #ue m es maor , lo #ue producira una media muestral
maor por tanto maor valor de t) es 6,16, dic%o de otra manera la probabilidad
de e#uivocarnos si rec%azamos ]6 es 6,16, como la frontera se establece en 6,6=
no la rec%azamos.
Este valor crtico de 6,6= es arbitrario pero es la convencin %abitual. K+u!n
razonable esM
5roblema al respecto$ en la %iptesis de #ue un mazo de cartas est bien
barajado, la probabilidad de #ue al sacar dos cartas sean, p.e.$' el as de oros 1
el re de bastos es 'JA6 x 'J3<06,666:33.
/i %acemos la experiencia obtenemos ese resultado Krec%azaramos la %iptesis
de #ue el mazo est! bien barajadoM K+u!nto se parece esto a la lgica del
contraste de %iptesisM
Qolvamos al problema del estrs. +omo no se rec%aza ]6, se puede cometer un
error tipo II. K+u!l es b M. "e %ec%o, sera la informacin relevante a comunicar en
este estudio (la probabilidad del error #ue se pude cometer en l). ]abitualmente,
sin embargo, no se da por#ue los pa#uetes estadsticos no la calculan.
5ara calcularla se debe concretar ]', p.e. m 0 16 (el criterio para este valor no es
estadstico)
b 0p(aceptar ]6`]' cierta)
/upongamos #ue el tama*o muestral sea suficientemente grande para poder
aproximar t a '.
K+u!ndo se acepta ]6M si ' c ',9<
es decir, se acepta ]6 si
KVu probabilidad %a de encontrar si m 0 16 (zona verde del gr!fico)M
En esta %iptesis lo #ue se distribue como una ' es