Anda di halaman 1dari 26

INFERENCIA ESTADSTICA

La Inferencia Estadstica comprende los


mtodos que son usados para obtener
conclusiones acerca de la poblacin en base a
una muestra tomada de ella.
Incluye los mtodos de estimacin de
parmetros y las pruebas de hiptesis.

obtencin de
la muestra
conclusiones

Problema de estimacin:
Por qu una encuesta de 1500 personas permite
predecir bastante bien el resultado de una eleccin
con 10 millones de votantes? Cmo se consigue?
Cmo se mide la precisin del resultado?

Problema de test de hiptesis:


Las normas de calidad exigen que, en un lote de
5000 bombillas, a lo sumo el 3% pueden durar
menos de 1000 horas. En un estudio de control de
calidad de una fabrica de bombillas sera muy
costoso examinar cada una. Se decide usar una
muestra de 500 bombillas. Si obtenemos el 3,2% de
bombillas defectuosas, deberamos declarar el lote
completo defectuoso?

Problema de estimacin
Se busca precisar una caracterstica
totalmente desconocida de la poblacin a
partir de los datos obtenidos sobre una
muestra.
Estimar el porcentaje de la poblacin (10 millones)
que vot a JP a partir de una muestra de 1500
votantes.
Estimar la duracin promedio de las bombillas del lote
de 5000, a partir de una muestra de 500.

Problema de test de hiptesis


Se busca comprobar alguna informacin
sobre la poblacin a partir de los datos
obtenidos de una muestra.
JP obtiene ms del 65% de los votos.
Menos del 3% de las bombillas del lote de 5000
duran menos de 1000 horas.
Las bombillas duran ms de 1000 horas en promedio.

Problema de estimacin
Sea una caracterstica, un parmetro
poblacional cuyo valor se desea conocer a
partir de una muestra.

Sea
un estadstico (funcin de la muestra)
que utilizamos para estimar el valor de .
El estadstico: T ( X

, X 2 ,..., X n )

es una funcin que depende de la muestra y


lo llamaremos estimador. El valor concreto
de es la estimacin.

Estimacin de parmetros
puntual
Estimacin
por intervalos
Estimacin Puntual: Se estudian los
diversos
mtodos
de
encontrar
estimadores y las propiedades ptimas
que deben tener stos.
Estimacin por Intervalos de Confianza:
se estima un parmetro usando un
intervalo centrado en un estimado del
parmetro.

Estimacin puntual
Provee un solo valor, un valor concreto para
la estimacin.
Un estimador puntual es simplemente un
estadstico (media aritmtica, varianza, etc.)
que se emplea para estimar parmetros
(media poblacional, varianza poblacional,
etc.).
Por ejemplo, cuando obtenemos una media
aritmtica a partir de una muestra, tal valor
puede ser empleado como una estimacin
para el valor de la media poblacional.

Parmetro Estimacin Estadstico

E x

~x

x
p
n

s2

X~

P X
n
S2

Mtodos de estimacin puntual


Hemos visto que un estimador de la media poblacional
es la media muestral y de la varianza poblacional es la
varianza muestral.
cmo determinar un estimador cuando no se trata de
la media o la varianza?
Por ejemplo, supongamos una poblacin con funcin
densidad:

f ( x)

(1 x)

x 0, 0

Mtodo de los momentos


Mtodo de mxima verosimilitud
Mtodo de mnimos cuadrados

Cmo estimar
el parmetro ?

Propiedades de los estimadores

~ estime exactamente a
No se espera que
sino que en realidad se espera que no est
muy alejado.

Entre 2
o ms estimadores del mismo
parmetro cul es el mejor estimador?
1. Ausencia de sesgo
(Insesgadez)

2. Consistencia
3. Eficiencia

Estimador insesgado
Diremos que es un estimador insesgado de si:

E ET X 1 ,..., X n

La media muestral es un estimador insesgado de la


media poblacional.
La varianza muestral (dividida por n) no es un estimador
insesgado de la varianza poblacional, es sesgado.

b( ) E se llama sesgo de

Sea una poblacin N(, ) y sean los estimadores de


varianza: varianza muestral y la varianza muestral
(partida por n).

1
2
1 s
n

(x

x)

j 1

1
2

2 S
n 1

(x

x)

j 1

Si la poblacin es normal, entonces el estimador:

(n 1) S 2

se distribuye como n21

E[2 ] E[ s ]
2
*

2
n 1

E[ n21 ] 2

E(S )
2

2
n

1
n

E[1 ]
E[2 ]
2 2
n
n
n

sesgo

Propiedades en muestras grandes


Muchos
estimadores
no
tienen
buenas
propiedades para muestras pequeas, pero
cuando el tamao muestral aumenta, muchas de
las propiedades deseables pueden cumplirse. En
esta situacin se habla de propiedades
asintticas de los estimadores.
Como el estimador va a depender del tamao de
la muestra vamos a expresarlo utilizando el
smbolo
n
Por ejemplo, el sesgo puede depender del
tamao de la muestra. Si el sesgo tiende a cero
cuando el tamao de la muestra crece hasta
infinito decimos
que el
estimador
es
asintticamente insesgado.

Asintticamente insesgado
Definicin: Un estimador se dice que
n
asintticamente insesgado si

lim E[ n ]
n

o equivalentemente:

lim [ E[n ] ] 0
n

es

Consistencia
Se dice que un estimador es consistente si se cumple
que

lim P n 1
n
E[n ]

lim P n 1
n
Var[n ] 0

Es decir, a medida que se incrementa el tamao


muestral, el estimador se acerca ms y ms al valor del
parmetro. La consistencia es una propiedad
asinttica.
Tanto la media muestral como la varianza muestral son
estimadores consistentes. La varianza muestral (partida
por n) es un estimador consistente de la varianza
poblacional, dado que a medida que el tamao muestral
se incrementa, el sesgo disminuye.

Ejemplo: supongamos que la poblacin es no


normal y de media desconocida.

Para cada tamao muestral n tenemos:

E ( xn )

Var( xn )

La media muestral es un estimador consistente


de la media poblacional.

Eficiencia
, decimos que es un estimador insesgado

Si
eficiente o de varianza mnima para , si cualquier otro
estimador insesgado de , digamos ~ , verifica que:

Var Var

La varianza de una variable aleatoria mide la dispersin


alrededor de la media.
Menor varianza para una variable aleatoria significa que, en
promedio, sus valores fluctan poco alrededor de la media
comparados con los valores de otra variable aleatoria con la
misma media y mayor varianza.
Menor varianza implica mayor precisin y entonces el estimador
que tenga menor varianza es claramente ms deseable porque,
en promedio, est mas cerca del verdadero valor de .

Estimacin por intervalo


Este mtodo determina dos valores (lmites de
confianza) entre los que se acepta que puede estar el
valor del estimador.

L U

L
U 1
P

Muestra

0 1

Tenemos entonces una probabilidad de 1- de


seleccionar una variable aleatoria que produzca un
intervalo que contenga al parmetro.

El intervalo que se calcula a partir de la


muestra seleccionada;
L
U
se llama intervalo de confianza de (1) 100%

Estimacin por intervalo

nivel o grado de confianza

probabilidad de error (riesgo)

Tenemos entonces una probabilidad de seleccionar


una variable aleatoria que produzca un intervalo que no
contenga al parmetro.
En general el tamao del intervalo disminuye con el
tamao muestral y aumenta con 1-.
En todo intervalo de confianza hay una noticia buena y
otra mala:
La buena: hemos usado una tcnica que en % alto de
casos acierta.
La mala: no sabemos si ha acertado en nuestro caso.

Intervalo de confianza para la Media


Poblacional (varianza conocida).
De una poblacin normal con
media desconocida y varianza
conocida 2 se extrae una
muestra de tamao n, entonces
de la distribucin de la media
muestral se obtiene que:

se distribuye como
una normal estndar.

Luego

P( Z a / 2 Z Z a / 2 ) 1

Donde Z/2 es el valor de la normal estndar tal que el


rea a la derecha de dicho valor es /2.

Intervalo de confianza para la Media


Poblacional (varianza conocida).
Sustituyendo la frmula de Z, se obtiene:
P( X - Z/2 / n < < X + Z/2 / n ) = 1 -
Los dos extremos del intervalo son aleatorios.
De lo anterior se puede concluir que un Intervalo
de Confianza del 100 (1-) % para la media
poblacional , es de la forma:
( x Z/2 / n , x + Z/2 / n)

Inferencias acerca de la Media


Poblacional (varianza conocida).
La siguiente tabla muestra los Z/2 ms usados.

Nivel de
Confianza
90
95
99

Z/2
1.645
1.96
2.58

Los parmetros poblacionales son fijos, no


aleatorios.
Los estadsticos o los estimadores son
variables aleatorias (su valor depende de
la muestra seleccionada: los estadsticos
calculados para distintas muestras darn,
en general, resultados distintos).

Intervalo de confianza para la Media


Poblacional (varianza desconocida).
En la prctica si la media poblacional es
desconocida entonces, es bien probable que la
varianza tambin lo sea puesto que en el
clculo de 2
interviene . Si sta es la
situacin, y si el tamao de muestra es grande
(n > 30), entonces 2 es estimada por la
varianza muestral s2 y se puede usar la
siguiente frmula para el intervalo de confianza
de la media poblacional:

(x

z / 2 s / n , x z / 2 s / n )

Intervalo de confianza para la Media


Poblacional (varianza desconocida).
Supongamos que la poblacin es normal con
media y varianza desconocida y que se desea
hacer inferencias acerca de , basada en una
muestra pequea (n < 30) tomada de la
poblacin. En este caso la distribucin de la
media muestral X ya no es normal, sino que
sigue la distribucin t de Student.

Si de una poblacin Normal con media y


desviacin estndar desconocida se extrae
una muestra de tamao n, entonces el
estadstico:
X se distribuye como una t de
t
S
Student con n-1 grados de
libertad.
n
Un intervalo de confianza del 100 (1-) % para
es de la forma:

( x t / 2 s / n , x t / 2 s / n )

donde s es la desviacin estndar muestral.


t(n-1,/2) es un valor de t con n1 grados de
libertad y tal que el rea a la derecha de dicho
valor es /2.

Anda mungkin juga menyukai