Anda di halaman 1dari 27

CONTROL DE LECTURA I

LA DISTRIBUCION NORMAL
La distribucin normal es una de las distribuciones ms usadas e importantes. Se ha
desenvuelto como una herramienta indispensable en cualquier rama de la ciencia, la
industria y el comercio. Muchos eventos reales y naturales tienen una distribucin de
frecuencias cuya forma es muy parecida a la distribucin normal.
La distribucin normal es llamada tambin campana de Gauss por su forma
acampanada.
Y

Propiedades de la distribucin normal

La distribucin normal tiene forma de campana

=0

y desviacin estndar

=1

El rea bajo la curva o la probabilidad desde menos infinito a ms infinito vale 1.


La distribucin normal es simtrica, es decir cada mitad de curva tiene un rea de
0.5.
La escala horizontal de la curva se mide en desviaciones estndar.
La forma y la posicin de una distribucin normal dependen de los parmetros

en consecuencia hay un nmero infinito de distribuciones normales.

Existe una relacin del porcentaje de poblacin a la desviacin estndar. En la figura


observamos por ejemplo que el rea bajo la curva para 1
68.26%,

2 =95.46

3 =99.73 .

tiene un porcentaje de

-3s -2s -1s

+1s +2s +3s


68.26%
95.46%
99.73%

La poblacin incluye todos los datos, la muestra es una porcin de la poblacin.

Poblacin

Muestra

x-3s

x-2s

x-s

x+s

x+2s

x+3s

La desviacin estndar
sigma representa la
distancia de la media al
punto de inflexin de la
curva normal

X
x-3

x-2

x-

x+

x+2

x+3

z
-3

-2

-1

La distribucin normal estndar


El valor de z:
Determina el nmero de desviaciones estndar

entre algn valor X y la media de

la poblacin . Para calcular el valor de Z usamos la siguiente frmula.

Z=

La distribucin de probabilidad f (Z) es una distribucin normal con media 0 y


desviacin estndar 1; esto es Z se distribuye normalmente con media cero y
desviacin estndar = 1 Z~N (0,1): La grfica de densidad de probabilidad se muestra
en la figura.

La distribucin f (Z) se encuentra tabulada en la tabla de distribucin normal estndar.


En esta tabla podemos determinar los valores de Z o la probabilidad
F(z) de determinado
valor Z.
solicitantes
1
Ejemplo 1: El gerente de personal de una gran compaa requiere que los
a un puesto efecten cierta prueba y alcancen una calificacin de 500. Si las

Z
0

calificaciones de la prueba se distribuyen normalmente con media = 485 y


desviacin estndar

=30 Qu porcentaje de los solicitantes pasar la prueba?

Calculando el valor de Z obtenemos:


Calculando el valor de Z obtenemos:

Z=

X
500485
=
=0.5

30

Buscamos el valor correspondiente Z en la tabla de distribucin normal. Z 0.5 = .69146 =


69.146%. Siendo esta la probabilidad de que la calificacin sea menor a 500

P( X <500) Dado que el porcentaje pedido es

P( X 500)

la solucin es

1-.69146 =.3085, 30.85% de los participantes pasarn la prueba.


485

3 0 .8 5 %

Z.0 5

PRUEBAS DE HIPOSTESIS DE UNA POBLACIN


1. Introduccin
La inferencia estadstica es el proceso mediante el cual se utiliza la informacin
de los datos de una muestra para extraer conclusiones acerca de la poblacin
de la que se seleccion la muestra. Las tcnicas de inferencia estadstica se
dividen en dos reas principales: Estimacin de intervalos de confianza y
Pruebas de hiptesis.
En cada prueba estadstica, se comparan algunos valores observados contra
algunos esperados u otro valor observado comparando estimaciones de
parmetros (media, desviacin estndar, varianza). Estas estimaciones de los
verdaderos parmetros son obtenidos usando una muestra de datos y
calculando los estadsticos.
La capacidad para detectar una diferencia entre lo que es observado y lo que
es esperado depende del desarrollo de la muestra de datos. Incrementando el
tamao de la muestra mejora la estimacin y la confianza en las conclusiones
estadsticas.
Al realizar pruebas de hiptesis, se parte de que un valor supuesto (hipottico)
es el parmetro poblacional. Despus de recolectar una muestra aleatoria, se
compara el estadstico muestral, as como la media (x), con el parmetro
hipottico, se compara con una supuesta media poblacional (). Despus se
acepta o se rechaza el valor hipottico, segn proceda. Se rechaza el valor

hipottico slo si el resultado muestral resulta muy poco probable cuando la


hiptesis es cierta.
Se trata de probar una afirmacin sobre parmetros de la poblacin (media ;
2
varianza
o proporcin ) en base a datos de estadsticos de una
muestra (X media,

o p respectivamente):

Por ejemplo, probar las afirmaciones en los parmetros se usan los


estadsticos
En una poblacin

La media poblacional = 12;


estadstico Zc
2
2
La varianza poblacional = 12; estadstico x
La proporcin poblacional = 0.3
estadstico Zc

En dos poblaciones

Las medias poblacionales son iguales

= 0;

estadstico Zc o Tc
Las varianzas poblacionales son iguales

21= 22

Fc
Las proporciones poblacionales son iguales

2
2
o 1 2 = 0; estadstico

1= 2 o

1 2=0 ;

estadstico Zc
La prueba de hiptesis tiene varias etapas:
Etapa 1.- Planear la hiptesis nula y la hiptesis alternativa. La hiptesis nula
(H0) es el valor hipottico del parmetro que se compra con el resultado
muestral resulta muy poco probable cuando la hiptesis es cierta.
Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de
significancia del 5%, entonces se rechaza la hiptesis nula solamente si el
resultado muestral es tan diferente del valor hipottico que una diferencia de
esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de
0.05 o menos.
Etapa 3.- Elegir el estadstico de prueba. El estadstico de prueba puede ser el
estadstico muestral (el estimador no segado del parmetro que se prueba) o
una versin transformada de ese estadstico muestral. Por ejemplo, para probar
el valor hipottico de una media poblacional, se toma la media de una muestra
aleatoria de esa distribucin normal, entonces es comn que se transforme la
media en un valor Z el cual, a su vez, sirve como estadstica de prueba.
Etapa 4.- Establecer el valor o valores crticos del estadstico de prueba.
Habiendo especificado la hiptesis nula, el nivel de significancia y el estadstico

de prueba que se van a utilizar, se procede a establecer el o los valores crticos


del estadstico de prueba. Puede haber uno o ms de esos valores,
dependiendo de si se va a realizar una prueba de uno o dos extremos o colas.
Etapa 5.- Determinar el valor real del estadstico de prueba. Por ejemplo, al
probar un valor hipottico de la media poblacional, se toma una muestra
aleatoria y se determina el valor de la media muestral. Si el valor crtico que se
establece es un valor de Z, entonces se transforma la media muestral en un
valor de Z.
Etapa 6.- Tomar la decisin. Se compara el valor observado del estadstico
muestral con el valor (o valores) crticos del estadstico de prueba. Despus no
se rechaza o se rechaza la hiptesis nula. Si se rechaza sta, se acepta la
alternativa; a su vez, esta decisin tendr efecto sobre otras decisiones de los
administradores operativos, como por ejemplo, mantener o no un estndar de
desempeo o cul de dos estrategias de mercadotecnia utilizar.
La distribucin apropiada de la prueba estadstica se divide en dos regiones:
una regin de rechazo y una de no rechazo. Si estadstico de prueba cae en
esta ltima regin no se puede rechazar la hiptesis nula y se llega a la
conclusin de que el proceso funciona correctamente.
Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el
valor crtico en la distribucin estadstica que divide la regin del rechazo (en la
cual la hiptesis nula no se puede rechazar) de la regin de rechazo. A hora
bien el valor crtico depende del tamao de la regin de rechazo.
Pasos de la prueba de hiptesis:
1.
Definir el Problema (Problema Prctico).
2.
Sealar los Objetivos (Problema Estadstico).
3.
Determinar tipo de datos: Atributo o Variable.
4.
Si son datos Variables: Hacer Prueba de Normalidad.
5.
Establecer las Hiptesis: Hiptesis Nula (Ho con signo igual), o la
Hiptesis Alterna (Ha con signo de mayor o menor).
6.
Seleccionar el nivel de Alfa (normalmente 0.05 o 5%).
7.
Establecer el tamao de la muestra.
8.
Desarrollar el Plan de Muestreo.
9.
Seleccionar Muestras y Obtener Datos.
10.
Decidir la prueba estadstica apropiada y calcular el estadstico de
prueba (Z, t, X2 o F) a partir de los datos.
11.
Obtener el estadstico correspondiente de tablas o Excel.
12.
Determinar la probabilidad de que el estadstico de prueba calculado
ocurra al azar.
13.
Comparar el estadstico calculado con el de tablas y ver si cae en la
regin de rechazo o ver si la probabilidad es menor a alfa, rechace Ho y
acepte Ha. En caso contrario no rechace Ho.
14.
Con los resultados interprete una conclusin estadstica para la solucin
prctica.
2. Pruebas de hiptesis para una poblacin

Se trata de probar una afirmacin sobre parmetros de la poblacin (media ;


2
varianza o proporcin ) en base a datos de estadsticos de una
muestra (X media,

s2

o p respectivamente)

Elementos de La prueba:

Prueba Estadstica: Procedimiento para decidir aceptar o rechazar


hiptesis.

Hiptesis: Es una afirmacin acerca de una o ms poblaciones.

Hiptesis Nula (Ho): Usualmente es una afirmacin representando una


situacin status quo. Generalmente deseamos rechazar la hiptesis nula.

Es la hiptesis o afirmacin a ser probada


Puede ser por ejemplo =, , o a constante
Slo puede ser rechazada o no rechazada
Hiptesis Alterna (Ha): Es lo que aceptamos si podemos rechazar la hiptesis nula.
Ha es lo que queremos probar.

Es la hiptesis que se acepta como verdadera cuando se rechaza Ho, es su


complemento
Puede ser por ejemplo para prueba de dos colas
< 7 para prueba de cola izquierda
> 7 para prueba de cola derecha
Estadstico de prueba: Calculado con datos de la muestra.

Regin de Rechazo: Indica los valores de la prueba estadstica para que


podamos rechazar la Hiptesis nula (Ho). Esta regin est basada en un
riesgo a deseado, normalmente 0.05 o 5%.

Estadstico de prueba (Z, t,

x 2 o F): Para probar la hiptesis nula se calcula un

estadstico de prueba con la informacin de la muestra el cual se compara a un


valor crtico apropiado. De esta forma se toma una decisin sobre rechazar o no
rechazar la Ho.

Error tipo I (alfa = nivel de significancia, normal=0.05): Se comete al rechazar la Ho


cuando en realidad es verdadera. Tambin se denomina riesgo del productor

Error tipo II (beta): Se comete cuando no se rechaza la hiptesis nula siendo en


realidad falsa. Es el riesgo del consumidor

Las pruebas de hiptesis pueden ser de dos colas, de cola derecha o de cola
izquierda, a continuacin se esquematizan cada una de ellas.

Pruebas de Hiptesis de dos colas:

Ho: a = b
Ha: a b

Regin de
Rechazo

Regin de
Rechazo

-Z

Pruebas de Hiptesis de cola derecha:

Ho: a b
Ha: a > b

Regin de
Rechazo

Pruebas de Hiptesis cola izquierda:

Ho: a b
Ha: a < b

Regin de
Rechazo

-Z

. Prueba de hiptesis Estadstica

Hiptesis nula Ho, complemento de la Hiptesis alterna:

Es la hiptesis o afirmacin a ser probada


Puede ser por ejemplo =, o , o a 5

Slo puede ser rechazada o no rechazada

Hiptesis alterna Ha, complemento de la hiptesis nula:


Es la hiptesis que se acepta como verdadera cuando se rechaza Ho,
es su complemento

Si el signo de la hiptesis alterna es entonces se trata de una prueba


de dos colas; si es > de cola derecha y si es < de cola izquierda.

Puede ser por ejemplo m 5 para prueba de dos colas


m < 5 para prueba de cola izquierda
m > 5 para prueba de cola derecha

Pasos de la prueba de hiptesis:

Se plantea inicialmente la Ha si en el problema se muestra la afirmacin


de ser menor o mayor a un valor establecido histrico.

Se plantea inicialmente la Ho si en el problema se muestra la afirmacin


igual (es, histricamente ha sido); mayor o igual (cuando menos) o
menor o igual (a lo ms) a un valor establecido histrico.

No importa cual se plantee primero, siempre la conclusin se hace


contra la Ho (se rechaza o no se rechaza)

El intervalo de confianza es el intervalo donde se estima que se


encuentre el parmetro de la poblacin (media ; varianza 2 o
proporcin ) para un cierto nivel de confianza o de significancia.

Estadstico de prueba

Para probar la hiptesis nula se calcula un estadstico de prueba con la


informacin de la muestra el cual se compara a un valor crtico
apropiado. De esta forma se toma una decisin sobre rechazar o no
rechazar la Ho

Error de Tipo I y Error de Tipo II. Poder de una Prueba.


1. Error tipo I (alfa = nivel de significancia, es comn = 0.05). Alfa = 1- Nivel
de confianza

Se comete al rechazar la Ho cuando en realidad es verdadera. Tambin


se denomina riesgo del productor.

2. Error tipo II (beta)

Se comete cuando no se rechaza la hiptesis nula siendo en realidad


falsa. Es el riesgo del consumidor

Pruebas de Hiptesis de dos colas:


Si la Ho: m = que un valor poblacional, entonces el riesgo alfa se reparte en
ambos extremos de la distribucin. Por ejemplo si Ha: m 10 se tiene:

Ho: a = b
Ha: a b

Pruebas de Hiptesis de cola derecha:

Si la Ho: m , que un valor poblacional, entonces el riesgo alfa se coloca en el


extremo derecho de la distribucin. Por ejemplo si Ho m 10 y Ha: m >10 se
tiene una prueba de cola derecha:
Ho: a b
Ha: a > b
Pruebas de Hiptesis cola izquierda:
Si el Ho: m que un valor poblacional, entonces el riesgo alfa se coloca en el extremo
izquierdo de la distribucin. Por ejemplo si Ho m 10 y Ha: m < 10 se tiene una
prueba de cola izquierda
Ho: a b
Ha: a < b

Pasos para realizar una prueba de hiptesis


Probar la hiptesis de igualdad de una media para n > 30
1) Establecer las hiptesis e identificar el nivel de significancia alfa o 1- Nivel
de confianza (NC)
Ho: Ha:
2) Calcular el estadstico de prueba Zc o Tc con frmula
3) Determinar el estadstico de tablas Zt o Tc de Excel para una cierta alfa o 1NC
4) Establecer la regin de rechazo con Zt y ver si cae ah Zc
Las regiones de rechazo prueba de 2 colas: -Z/2 y Z/2
5) Determinar el Intervalo de confianza para la media y ver si incluye a la media
de la hiptesis, si no rechazar Ho
6) Determinar el valor P correspondiente a Zc y comparar contra Alfa/2, si es menor
rechazar Ho

4. Frmulas para calcular los estadsticos de prueba


Frmulas para Intervalos de confianza de parmetros de una poblacin
a) Intervalo de confianza para estimar con muestras grandes (n >= 30 ) y
cuando ya se cuenta con historial, o sea que es conocida:
IC para =x z =
2

Si la no se conoce entonces se usa S de la muestra en su lugar

IC para =x z =
2

s
n

b) Intervalo de confianza para estimar con muestras pequeas (n < 30;


grados de libertad = gl. = n 1):
IC para =x z

2, gl

s
n

c) Intervalo de confianza para estimar proporcin poblacional:

p (1 p )
n
IC para p Z / 2 S p

Sp

d) Tamao de muestra para estimar en funcin del error


2
Z
2
n=
2
( X )

e) Tamao de muestra para estimar en funcin del error


peor caso = 0.5:
Z 2 ( )(1 )
n /2
( p )2

( X )

(p )

, en el

Frmulas para calcular los estadsticos utilizados en las pruebas de


Hiptesis de una poblacin
Estadstico Zc muestras grandes (n >= 30 ) y cuando la es conocida (ya se
tiene historial):
X HIPOTESIS
ZC =

n
f) Si no se conoce la entonces se reemplaza por la S de la muestra.
ZC =

X HIPOTESIS

g) Estadstico tc para muestras pequeas (n < 30) y la es desconocida:


t c=

X HIPOTESIS
s
n

h) Estadstico Zc para proporciones y muestras grandes (n >= 30):

HIPOTESIS (1 HIPOTESIS )
n
p HIPOTESIS
Zc
p

5. Ejemplos de pruebas de hiptesis de una poblacin


Ejemplos de Prueba de hiptesis Estadstica

Paso 1. Para una muestra grande (n >30) probar la hiptesis de una media
Establecer alfa.
o
Ho:
0
Ha:

Paso 2. Calcular el estadstico de prueba


0
Z cal =
s
n

Paso 3. Establecer la regin de rechazo, para prueba de 2 colas:

Regin de

Z 2 Z 2

Regin de
Rechazo

Rechazo
0

-Z

Paso 4. Si el valor del estadstico de prueba cae en la regin de rechazo


rechazaremos Ho de otra manera no podemos rechazar Ho.

Paso 5. Calcular el intervalo de confianza IC para un nivel de confianza de 1alfa, si la media de la hiptesis se encuentra dentro del intervalo, no rechazar
Ho y viceversa.
Paso 6. Calcular el valor de Probabilidad P para el estadstico calculado a partir
de la muestra Zc o Tc por medio de:
Para Zc:
Para Tc:

P = distr.norm.estand.inv (-Zc)
P = distr.t.inv (Tc, grados de libertad, 1 o 2 colas)

Para Chi2: P = Prueba.chi.inv (Chi c, grados de libertad)


Si el valor de P es menor o igual a alfa se rechaza Ho y se acepta Ha (en el
caso de dos colas el valor de P total es del doble del calculado).
Prueba Z de 2 colas
Problema 1
Los enanos de Blanca Nieves le informan que excavan 12 toneladas promedio
por semana. Nieves recolecta datos de 49 semanas y obtiene X=11.5, s= 1.1 a
un nivel de significancia =10%. Los Enanos estn en lo cierto.
Solucin
1) Planteamiento de hiptesis
Ho: =12
Ha: 12
2) Determinar estadstico de la prueba Z
Zc= 11.5 12/ (1.1 / 49) = -0.5/ 0.157 = -3.185
3) Determinar el valor de Zt de acuerdo al valor de alfa
10% / 2 = 0.05
Z de tablas 0.05 = -1.64
4) Interpretacin y conclusiones
Dado que Zc=-3.185 es menor que Zt=-1.64 la Ho se rechaza a un nivel alfa del
10%.
Los enanos no excavan 12 toneladas al da
5) Intervalo de confianza
IC = 11.5+- 1.64* 1.1/raz (49) = (11.242, 11.75)
La media de la hiptesis no se encuentra en el intervalo de confianza, se
rechaza Ho.
t-STUDENT PARA 2 MUESTRAS INDEPENDIENTES
Introduccin

Uno de los anlisis estadsticos ms comunes en la prctica es probablemente


el utilizado para comparar dos grupos independientes de observaciones con
respecto a una variable numrica.
La aplicacin de un contraste paramtrico requiere la normalidad de las
observaciones para cada uno de los grupos. La comprobacin de esta hiptesis
puede realizarse tanto por mtodos grficos (por medio de histogramas,
diagramas de cajas o grficos de normalidad) como mediante test estadsticos.
Un nmero suficiente de observaciones (mayor de 30) justifica la utilizacin del
mismo test.
As mismo, este tipo de metodologa exigir que la varianza en ambos grupos
de observaciones sea la misma. En primer lugar se desarrollar el test t de
Student para el caso en el que se verifiquen ambas condiciones, discutiendo
posteriormente el modo de abordar formalmente el caso en el que las varianzas
no sean similares.
Bajo las hiptesis de normalidad e igual varianza la comparacin de ambos
grupos puede realizarse en trminos de un nico parmetro como el valor
medio.

El t test para dos muestras independientes se basa en el estadstico:

t=

X Y

( n1 ) s21 +( m1) S 22 1 1
+
n+m2
n m

Donde e denotan el valor medio en cada uno de los grupos.


Si la hiptesis de partida es cierta el estadstico (1) seguir una distribucin t de
Student con (n+m-2 grados de libertad). De ser as, el valor obtenido debera
estar dentro del rango de mayor probabilidad segn esta distribucin.
Usualmente se toma como referencia el rango de datos en el que se concentra
el 95% de la probabilidad. El valor-p que usualmente reportan la mayora de
paquetes estadsticos no es ms que la probabilidad de obtener, segn esa
distribucin, un dato ms extremo que el que proporciona el test. Como ya se
dijo, refleja tambin la probabilidad de obtener los datos observados si fuese
cierta la hiptesis inicial. Si el valor-p es muy pequeo (usualmente se
considera p<0.05) es poco probable que se cumpla la hiptesis de partida y se
debera de rechazar. La regin de aceptacin corresponde por lo tanto a los
valores centrales de la distribucin para los que p>0.05.
En la siguiente tabla se determina los grados de libertad (en la primera
columna) y el valor de (en la primera fila). El nmero que determina su
interseccin es el valor crtico correspondiente. De este modo, si el estadstico
que se obtiene toma un valor mayor se dir que la diferencia es significativa.

Otro modo de obtener esta misma informacin es mediante el clculo de


intervalos de confianza para la diferencia de la respuesta media en ambos

grupos. A mayores, el intervalo de confianza constituye una medida de la


incertidumbre con la que se estima esa diferencia a partir de la muestra,
permitiendo valorar tanto la significacin estadstica como la magnitud clnica
de esa diferencia.
A medida que el tamao muestral aumenta, la distribucin del estadstico (1) se
hace ms prxima a la de una variable Normal estndar. De este modo, en
algunos textos se opta por utilizar esta distribucin para realizar la comparacin
de medias. Aunque esta aproximacin es correcta para muestras
suficientemente grandes, ambos mtodos proporcionan en este caso
resultados prcticamente idnticos, por lo que resulta ms simple utilizar,
independientemente del tamao de la muestra, la misma metodologa a partir
de la distribucin t. El mismo planteamiento podra utilizarse en el caso de
varianzas distintas o de muestras apareadas.

DOS MUESTRAS INDEPENDIENTES CON VARIANZA DISTINTA

El caso en el que se dispone de dos grupos de observaciones independientes


con diferentes varianzas, la distribucin de los datos en cada grupo no puede
compararse nicamente en trminos de su valor medio. Obviamente, el primer
problema a resolver es el de encontrar un mtodo estadstico que nos permita
decidir si la varianza en ambos grupos es o no la misma. El test de la razn de
varianzas viene a resolver este problema. Bajo la suposicin de que las dos
poblaciones siguen una distribucin normal y tienen igual varianza se espera
que la razn de varianzas:

Siga una distribucin F de Snedecor con parmetros (n-1) y (m-1).


En este tipo de situaciones, donde no se debe aplicar el contraste basado en
(1), podemos utilizar una modificacin del test para el caso de varianzas
desiguales, conocido como el test de Welch basada en el estadstico:

que, bajo la hiptesis nula seguir una distribucin t de Student con un nmero
f de grados de libertad que depender de las varianzas muestrales segn la
expresin:

La tcnica para realizar el contraste es anloga a la vista anteriormente cuando


las varianzas son desconocidas e iguales.
Al igual que en el caso anterior, podr optarse por calcular el correspondiente
95% intervalo de confianza para la diferencia de medias dado por:

INTERVALOS DE CONFIANZA
1. DOS MUESTRAS DEPENDIENTES

Ya se ha comentado que cuando se trata de comparar dos grupos de


observaciones, es importante distinguir el caso en el que son independientes
de aquel en el que los datos estn apareados. Las series dependientes surgen
normalmente cuando se evala un mismo dato ms de una vez en cada sujeto
de la muestra. Tambin se puede encontrar este tipo de observaciones en
estudios de casos y controles donde cada caso se aparea individualmente con
un control.
En este tipo de anlisis el inters no se centra en la variabilidad que puede
haber entre los individuos, sino en las diferencias que se observan en un
mismo sujeto entre un momento y otro. Por este motivo, resulta intuitivo
trabajar con la diferencia de ambas observaciones.
Bajo los supuestos del modelo lineal clsico, es fcil construir un intervalo de
j . A los intervalos de
confianza (IC) para un parmetro poblacional
confianza se les llama tambin estimaciones por intervalo, porque proporcionan
un rango de valores posibles para el parmetro poblacional y no slo una
estimacin puntual.
^ ^
^
Empleando el hecho de que j j /ee j tiene una distribucin t con n - k - 1
grados de libertad mediante manipulaciones sencillas se puede obtener un IC
para el parmetro desconocido j . : un intervalo de confianza de 95% est
dado por:
^ jee ^ j
Donde la constante c es el percentil 97.5 en la distribucin

t nk1

Con ms

exactitud, los lmites inferior y superior de un intervalo de confi anza estn


dados por:
j ^ jcee ( ^ j )
j ^ j +cee ( ^ j )
Respectivamente.

En este punto es En este punto es aconsejable revisar el significado de


intervalo de confianza. Si se obtuvieran una y otra y otra muestra aleatoria, y

cada vez se calcularn j y j entonces en 95% de las muestras el valor


poblacional (desconocido)

estara en el intervalo

j y j

Por

desgracia, en la nica muestra que se emplea para construir el IC, no se sabe


si j est o no contenida en el intervalo. Se espera haber obtenido una
muestra que pertenezca a 95% de las muestras en las que la estimacin por
intervalo contiene a j , pero no se tiene ninguna garanta de esto.
Estimacin puntual y por intervalo
Las medias o desviaciones estndar calculadas de una muestra se denominan
estadsticos, podran ser consideradas como un punto estimado de la media y
desviacin estndar real de poblacin o de los parmetros.
Qu pasa si no deseamos una estimacin puntual como media basada en una
muestra, qu otra cosa podramos obtener como margen, algn tipo de error?
Un Intervalo de Confianza
ESTIMADOR PUNTUAL: Utiliza un nmero nico o valor para localizar una
estimacin del parmetro.
ESTIMADOR POR INTERVALO DE CONFIANZA: Denota un rango dentro del
cual se puede encontrar el parmetro y el nivel de confianza que el intervalo
contiene al parmetro.
LIMITES DE CONFIANZA: Son los lmites del intervalo de confianza inferior
(LIC) y superior (LSC), se determinan sumando y restando a la media de la
X
muestra un cierto nmero Z (dependiendo del nivel o coeficiente de
X
confianza) de errores estndar de la media
.

Tener un 95% de confianza en que la media poblacional real y desconocida se


encuentra entre los valores LIC y LSC.
NIVEL DE SIGNIFICANCIA = 1- INTERVALO DE CONFIANZA = ERROR TIPO
1 = ALFA
Cmo obtenemos un intervalo de confianza?

Estimacin puntual + error de estimacin


De dnde viene el error de estimacin?
Desv. Estndar X multiplicador de nivel de confianza deseado Z/2
Por Ejemplo:
Si la media de la muestra es 100 y la desviacin estndar es 10, el intervalo de
confianza al 95% donde se encuentra la media para una distribucin normal es:
100 + (10) X 1.96 => (80.4, 119.6)
1.96 = Z0.025
El 95% de Nivel de Confianza significa que slo tenemos un 5% de oportunidad
de obtener un punto fuera de ese intervalo.
Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la tabla Z veremos que
para un rea de 0.025, corresponde a una Z de 1.960.
C. I.
Multiplicador Z/2
99
2.576
95
1.960
90
1.645
85
1.439
80
1.282
.
Para tamaos de muestra >30, o conocida usar la distribucin Normal.
Para muestras de menor tamao, o desconocida usar la distribucin t.
El ancho del intervalo de confianza decrece con la raiz cuadrada del tamao de
la muestra.
Ejemplo:
Dadas las siguientes resistencias a la tensin: 28.7, 27.9, 29.2 y 26.5 psi
Estimar la media puntual
X media = 28.08 con S = 1.02
Estimar el intervalo de confianza para un nivel de confianza del 95% (t = 3.182
con n-1=3 grados de libertad)
Xmedia3.182*S/n = 28.083.182*1.02/2=(26.46, 29.70)
FORMULAS PARA ESTIMAR LOS INTERVALOS DE CONFIANZA:
Intervalo de confianza

Descripcin

Estimacin de con sigma conocida,


muestra grande n>30

Estimacin de
con sigma desconocida,
muestra grande n>30, se toma la desv. Est.
de la muestra S

Estimacin de
con muestras pequeas, n
< 30 y sigma desconocida

Estimacin de la

= x z / n
2

= x z s/ n
2

X t / 2 s / n
(n 1) s 2
( n 1) s 2
2

, n 1

1 , n 1
2

Estimacin de la proporcin

s p=

p (1 p)
n

p Z / 2 s p
Tamao de muestra

n=z2 2 /( x )2

Para estimar n en base a un error mximo


( X )
Para estimar n en base a un error mximo
Si se especifica un intervalo total de error, el
( p )
error
mximo es la mitad del intervalo

n Z / 2 (1 ) /( p ) 2
2

Utilizar

=0.05

que es peor

caso

Convergencia en Distribucin
Definicin de convergencia en distribucin. Tanto la convergencia casi segura
como la convergencia en probabilidad se basan en el concepto de proximidad
entre variables aleatorias. Veremos ahora un tipo de convergencia que se
basa en la proximidad entre las respectivas funciones de distribucin.
Sea ( F n)n 1 una sucesin de funciones de distribucin definidas sobre R y F
otra funcin de distribucin. Diremos que la sucesin

Fn

dbilmente a F si para todo punto x de continuidad de F, las

Fn convergen

converge

puntualmente a F. Es decir, si para todo x tal que F es continua en x se tiene


que
log n F n ( x ) =F( x )
Notacin. Si { Fn }n1 converge dbilmente en distribucin a F escribiremos
Fn F
Observacin. Recordemos que una funcin de distribucin definida sobre R se
caracteriza por las propiedades P1, P2, P3 y P4 y que el conjunto de puntos
donde es discontinua es a lo sumo numerable.
Al decir que (X n )n 1 converge en distribucin a X hay un abuso de lenguaje
puesto que las variables X n no se aproximan a X, sino que son las funciones
de distribucin de las X n las que se aproximan a la funcin de distribucin de
X.
Consideremos el caso donde X e Y son dos variables independientes con
distribucin N (0, 1). Definamos para todo n, X n =X entonces X n Y y sin
embargo como las variables X e Y son independientes, X no se aproxima a Y.
Veamos ahora la relacin que existe entre la convergencia en probabilidad y la
convergencia en distribucin.

(X n )n 1 una sucesin de variables aleatorias y X otra variable aleatoria.

Sea

Entonces
Xn p X

Xn D X

Demostracin. Sea Fn la funcin de distribucin de X y x un punto de


continuidad. De Fn . Probemos primero que
X n x { X x + } {|X n X| }
Para esto basta demostrar que si no est en ninguno de los dos conjunto que
forman la unin en el miembro derecho, entonces no est en { X n x }
Sea tal que X () > x + y | X n

() X()| < . Luego

X n ( ) =x ( )+( X n ( )x ( ) )
X ( ) +| X nx ()|
X > X +
x

Tomado probabilidades en ambos miembros se obtiene:


F x n ( x ) ( x + )+ P(|X n X| )
Tomando lmite superior en ambos miembros y teniendo en cuenta que
|X nX| =0
lim P
n

lim F x ( x ) F x ( x + ) .

y haciendo que 0, en virtud de que las funciones de distribucin son


continuas a derecha se tiene que
lim F x ( x ) F x ( x ) .
n

Ahora hacemos un razonamiento similar a izquierda de x. Consideramos la


inclusin
{ X x } { X n x } {| X n X| }
Tomando probabilidades en ambos miembros se obtiene:
F X ( x ) ( x ) + P(| X nX| )
Tomando lmite inferior en ambos miembros

F( x ) lim F X (x)
n

Luego existe el lmite de ( F X ) en el punto x y adems.


n

lim F X (x)=F (x )

TEOREMA DE LMITE CENTRAL


Los procedimientos de esta seccin constituyen la base para la estimacin de
parmetros poblacionales y la prueba de hiptesis. Cuando se selecciona una
muestra aleatoria simple de una poblacin con media desviacin estndar ,
es esencial conocer los siguientes principios:
1. Si n = 30, entonces las medias mustrales tienen una distribucin que se
puede aproximar por medio de una distribucin normal, con una media
y una desviacin estndar / (ste es el lineamiento que suele
utilizarse, independientemente de la distribucin de la poblacin
original).
2. Si n 30 y la poblacin original tiene una distribucin normal, entonces
las
Medias mustrales tienen una distribucin normal con una media y
una desviacin estndar / .
3. Si n 30, pero la poblacin original no tiene una distribucin normal,
entonces no se aplican los mtodos de esta seccin.
Trate de conservar la siguiente idea en mente: cuando tomamos muestras
de una poblacin, deseamos conocer el comportamiento de las medias
muestrales. El teorema del lmite central nos dice que si el tamao de una
muestra es lo suficientemente grande, la distribucin de las medias
muestrales se puede aproximar por medio de una distribucin normal, aun
cuando la poblacin original no est distribuida de forma normal. Aunque
hablamos de un teorema, no incluimos pruebas rigurosas, sino que nos
enfocamos en los conceptos y en su aplicacin. He aqu los puntos clave
que conforman una base importante para los siguientes captulos.
El teorema del lmite central y la distribucin muestral de x
Dado que:
1. La variable aleatoria x tiene una distribucin (que puede o no ser normal)
con media y desviacin estndar .
2. Todas las muestras aleatorias del mismo tamao n se seleccionan de la
poblacin. (Las muestras se seleccionan de manera que todas las muestras
posibles de tamao n tengan la misma probabilidad de ser seleccionadas).

Conclusiones:
1. Conforme el tamao de la muestra aumenta, la distribucin de las
medias muestrales x , se aproximar a una distribucin normal.
2. La media de todas las medias muestrales es la media poblacional .
(Es decir, la distribucin normal de la conclusin 1 tiene una media
).
3. La desviacin estndar de todas las medias muestrales es /
(es decir, la distribucin normal de la conclusin 1 tiene una
desviacin estndar / )
Reglas prcticas de uso comn:
1. Si la poblacin original no est distribuida normalmente, la siguiente
es una directriz comn: para muestras de tamao n mayor que 30, la
distribucin de las medias muestrales puede aproximarse
razonablemente bien por medio de una distribucin normal. (Existen
excepciones, como las poblaciones con distribuciones muy diferentes
a la normal, que requieren tamaos de muestra mucho ms grandes
que 30, aunque tales excepciones son relativamente raras). La
aproximacin mejora conforme el tamao muestral n se incrementa.
2. Si la poblacin original se distribuye normalmente, entonces las
medias muestrales estarn distribuidas normalmente para cualquier
tamao de muestra n (no slo los valores de n mayores que 30).
El teorema del lmite central implica dos distribuciones diferentes: la
distribucin de la poblacin original y la distribucin de las medias
muestrales. Igual que en captulos anteriores, utilizamos los smbolos
y para denotar la media y la desviacin estndar de la poblacin
original, pero ahora necesitamos nuevas notaciones para la media y
la desviacin estndar de la distribucin de las medias muestrales
.
Notacin para la distribucin muestral de x
Si se seleccionan todas las muestras aleatorias posibles de tamao n de una
poblacin con media y desviacin estndar , la media de las medias
muestrales se denota con de manera que
x =
Asimismo, la desviacin estndar de las medias muestrales se denota con
x x de Manera que:
x =
x

Suele denominarse el error estndar de la media.

Aplicacin del teorema del lmite central


Muchos problemas prcticos importantes se resuelven mediante el teorema
del lmite central. Cuando trabaje con este tipo de problemas, recuerde que
si el tamao de la muestra es mayor que 30, o si la poblacin original se
distribuye normalmente, debe tratar la distribucin de medias muestrales
como si fuera una distribucin normal con media y desviacin estndar
/ ).
En el siguiente ejemplo, el inciso a) incluye un valor individual, pero el inciso
b) incluye la media de una muestra de 20 hombres, por lo que debemos
usar el teorema del lmite central al trabajar con la variable aleatoria x .
Estudie este ejemplo con atencin para comprender la diferencia
significativa entre los procedimientos utilizados en los incisos a) y b).
Observe cmo este ejemplo ilustra el siguiente procedimiento de trabajo:
EJEMPLO
Seguridad de taxis acuticas En el problema del captulo sealamos que
algunos pasajeros murieron cuando un taxi acutico se hundi en el Inner
Harbor de Baltimore. Los hombres suelen ser ms pesados que las mujeres
y los nios; por lo tanto, supongamos que al cargar un taxi acutico la
situacin extrema es aquella en la que todos los pasajeros son hombres. En
concordancia con los datos de la National Health and Nutrition Examination
Survey, suponga que los pesos de los hombres se distribuyen normalmente,
con una media de 172 libras y una desviacin estndar de 29 libras.
a. Calcule la probabilidad de que, si se selecciona un hombre al azar, su
peso sea mayor que 175 libras.
b. Calcule la probabilidad de que 20 hombres elegidos al azar tengan una
media mayor que 175 libras (de manera que su peso total exceda la
capacidad segura de 3500 libras).
SOLUCIN
a. Enfoque:
x 175172
z=
=
=0.10

29
Nos remitimos a la tabla A-2 y utilizamos z 0.10 para encontrar que el rea
acumulativa a la izquierda de 175 libras es 0.5398. Por lo tanto, la regin
sombreada es 1 - 0.5398 = 0.4602. La probabilidad de que un hombre elegido
al azar pese ms de 175 libras es de 0.4602.
b. Enfoque: Utilice el teorema del lmite central (porque estamos trabajando
con la media de una muestra de 20 hombres y no con un solo hombre).
Aun cuando el tamao de la muestra no es mayor que 30, utilizamos una
distribucin normal por la siguiente razn: la poblacin original de
hombres tiene una distribucin normal, de manera que las muestras de
cualquier tamao producirn medias distribuidas normalmente. Puesto
que estamos trabajando con una distribucin de medias muestrales,
x que se evala de la
debemos utilizar los parmetros x y
siguiente manera.

z=

x x 175172
3
=
=
=0.46
x
29
6.48
20

INTERPRETACIN
Si nos remitimos a la tabla z=0.46 corresponde a un rea izquierda acumulativa
de 0.67, de manera que la regin sombreada es 1- 0.67=0.32. La probabilidad
de que 20 hombres tengan un peso medio mayor que 175 libras es de 0.32.

BIBLIOGRAFA
Mario Triola Fundamentos de la estadstica 11 edicin 2011
P. Reyes & Septiembre 2007
WOOLDRIGDGE, Jeffrey M. Introduccin a la Econometra