Anda di halaman 1dari 0

Probabilidades y Estadstica

Edmundo Pea Rozas, Juan Garcs Seguel


1
Estimacin Puntual y por Intervalos

La inferencia estadstica est relacionada con los mtodos para obtener conclusiones o generalizaciones acerca
de una poblacin. Estas conclusiones sobre la poblacin pueden estar relacionadas con la forma de la
distribucin de una variable aleatoria, o con los valores de uno o varios parmetros de la misma.

El campo de la inferencia estadstica se divide en dos: Por un lado tenemos el problema de la estimacin de los
parmetros de una distribucin, y por el otro, las pruebas de hiptesis. En el problema de estimacin se trata de
elegir el valor de un parmetro de la poblacin, mientras que en las pruebas de hiptesis se trata de decidir
entre aceptar o rechazar un valor especificado (por ejemplo, si el medicamento A es superior al medicamento
B).

A su vez el problema de la estimacin se puede dividir en dos reas: La estimacin puntual, y la estimacin por
intervalos de confianza. En forma similar, en el campo de las pruebas de hiptesis se pueden considerar dos
reas: Pruebas de hiptesis sobre parmetros, para determinar si un parmetro de una distribucin toma o no
un determinado valor, y Pruebas de Bondad de Ajuste, para definir si un conjunto de datos se puede modelar
mediante una determinada distribucin.



Estimacin puntual

La estimacin puntual consiste en utilizar el valor de una estadstica o un valor estadstico para estimar el
parmetro de una poblacin. Por ejemplo, cuando usamos la media muestral X para estimar la media de una
poblacin (), o la proporcin de una muestra P para estimar el parmetro de una distribucin binomial . Una
estimacin puntual de algn parmetro de una poblacin es un solo valor obtenido a partir de un estadstico

.

Estimador. Se denomina estimador de un parmetro a un estadstico T = t(X
1
, X
2
, ..., X
n
) que es usado para
estimar el valor del parmetro de una poblacin. Al valor observado del estadstico t = t(x
1
, x
2
, ..., x
n
) se le
denomina estimador de . Cuando hablamos del parmetro nos podemos estar refiriendo a un solo
parmetro, o a un conjunto de parmetros desconocidos. Si el parmetro es estimado, lo representamos
como

. Es decir,

= T = t(X
1
, X
2
, ..., X
n
)

Los principales mtodos de estimacin de parmetros son los siguientes

Mtodo de los momentos
Mtodo de mxima verosimilitud
Mnimos cuadrados

Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
2
Para la estimacin de parmetros de distribuciones de probabilidad los mtodos empleados son los dos
primeros, mientras que el mtodo de mnimos cuadrados se usa principalmente en los estudios de regresin.

Mtodo de los Momentos

Los momentos sirven para caracterizar una distribucin de probabilidad, y si dos variables aleatorias tienen los
mismos momentos, entonces dichas variables tienen o siguen la misma funcin de densidad. Por lo tanto, los
podemos emplear para estimar sus respectivos parmetros. El mtodo consiste en igualar los primeros
momentos de una poblacin a los momentos correspondientes de una muestra.


Mtodo de Mxima Verosimilitud

El mtodo bsicamente consiste en determinar la funcin de verosimilitud de una muestra o conjunto de
variables aleatorias X
1
, X
2
, ..., X
n
(definida como la funcin conjunta de densidad de dichas variables) para a
continuacin derivar la funcin de verosimilitud con respecto a cada uno de los parmetros a estimar, igualar a
cero y despejar el respectivo valor.

Los estimadores son variables aleatorias, y por lo tanto tienen una funcin de densidad, correspondiente a las
distribuciones muestrales. Por lo tanto, no hay ningn estimador perfecto, ya que siempre habr algn error en
el proceso de estimacin, de tal manera que se espera que un estimador puntual cumpla con ciertas
propiedades:.

Insesgamiento: Como no hay ningn estimador perfecto que de siempre estimacin exacta del parmetro, ser
un estimador insesgado aquel que en promedio es igual al parmetro. El valor esperado del estimador debera
ser igual al parmetro que trata de estimar. En caso de que lo sea, se dice que el estimador es insesgado, en
caso contrario se dira que es sesgado.

Consistencia: Es razonable esperar que un estimador mejore a medida que se aumenta el tamao de la
muestra, de acuerdo a esto, cuando el tamao de la muestra es muy grande los estimadores tomarn, por lo
general, valores muy prximos a los parmetros respectivos. Entonces, un estimador es consistente cuando se
cumple que a medida que el tamao de la muestra crece, el valor estimado se aproxima al parmetro
desconocido.

Eficiencia: Al estimador, al ser una variable aleatoria, no se le puede exigir que para una muestra cualquiera se
obtenga como estimacin el valor exacto del parmetro. Sin embargo podemos pedirle que su dispersin con
respecto al valor central (varianza) sea tan pequea como sea posible.

Suficiencia: El estimador debera aprovechar toda la informacin existente en la muestra. Un estimador T es
suficiente si utiliza toda la informacin relevante de la muestra para estimar el parmetro de la poblacin. Es
decir, un estimador T es suficiente si todo el conocimiento que se obtiene acerca del parmetro es mediante la
especificacin real de todos los valores de la muestra.

Dado que los estimadores puntuales raramente coincidirn con los parmetros que tratan de estimar, es
posible otorgarse una mayor libertad en su estimacin mediante el uso de la estimacin por intervalos o
intervalos de confianza.

Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
3
Un intervalo de confianza es un intervalo dentro del cual se espera encontrar el verdadero valor de un
parmetro.

Definicin: Sea 1- una probabilidad especificada alta y sean T1 y T2, dos estadsticos tales que
P[T1 T2] = 1

El intervalo [T1, T2] recibe el nombre de Intervalo de Confianza del 100(1-)% para el parmetro desconocido .
Las cantidades T1, T2 reciben el nombre de lmites de confianza inferior y superior, respectivamente, y (1-) es
el Nivel de Confianza asociado con el intervalo.

La interpretacin de un intervalo de confianza radica en la interpretacin de una probabilidad de largo plazo, y
es que, si se recopila un nmero grande de muestras aleatorias y se calcula un intervalo de confianza del
100(1-)% para el parmetro para cada una de las muestras, entonces el 100(1- )% de esos intervalos
contienen el valor verdadero de .


De acuerdo con la interpretacin, el nivel de confianza del 100(1-)% no es tanto un enunciado sobre un
intervalo particular sino que pertenece a lo que pasara si se construyera un nmero grande de intervalos
semejantes.

INTERVALO DE CONFIANZA PARA MEDIA POBLACIONAL CON VARIANZA
POBLACIONAL CONOCIDA


Si x es la media de una muestra aleatoria de tamao n de una poblacin que se distribuye normal con varianza
poblacional
2
, el intervalo de confianza de (1 - ) 100% para es:

n
z x
n
z x

2 / 1 2 / 1
+


Cabe hacer notar que aun cuando la distribucin de la variable aleatoria no sea normal, si n30, la distribucin
tender a la normal, de tal manera que este intervalo de confianza para la media puede ser aplicado para
muestras grandes aunque la variable original no distribuya exactamente como una normal.

Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
4
Ejemplo.

Si representa la longitud media de un eje proveniente de un proceso de produccin normal con una varianza
de 0.01 cm., y se toman muestras de 16 ejes, cul ser el intervalo de confianza del 95% para el nivel medio del
proceso.

Suponga que se toma la muestra aleatoria y los resultados, en cm., son los siguientes:

4,80 4,78 4,95 4,91 5,02 4,86 5,01 5,07
5,00 4,84 4,94 4,75 4,95 4,96 4,90 4,95
Solucin:

96 . 1 025 . 0 2 / 05 . 0 01 . 0 92 . 4 16
975 . 0 2 / 1
2
= = = = = = =

z z x n




97 . 4 87 . 4
16
1 . 0
96 . 1 92 . 4
16
1 . 0
96 . 1 92 . 4
2 / 1 2 / 1

+
+


n
z x
n
z x


INTERVALO DE CONFIANZA PARA MEDIA POBLACIONAL CON VARIANZA
POBLACIONAL DESCONOCIDA

Cuando la varianza de una variable aleatoria no es conocida, y se tiene una muestra aleatoria proveniente de
una distribucin normal, en lugar de usar distribucin normal, se debe emplear la distribucin t. Es decir, la
variable T definida de la siguiente manera sigue una distribucin t con n-1 grados de libertad.

1
~

=

n
t T
n
s
x


Si x y s son la media muestral y la desviacin estndar de una muestra aleatoria tomada de una distribucin
normal con varianza desconocida, entonces un intervalo de confianza (T1,T2) del 100(1-)% para ser
aquel que cumpla que:
P[T1 T2] = 1

Entonces, Si x es la media muestral de una muestra aleatoria de tamao n de una poblacin con varianza
desconocida
2
, y s
2
es la varianza muestral, el intervalo de confianza para la media poblacional est dado
por:

Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
5

n
s
t x
n
s
t x
n n ) 2 / 1 ; 1 ( ) 2 / 1 ; 1 (


+


Ejemplo.

Si representa la longitud media de un eje proveniente de un proceso de produccin normal, y se toman
muestras de 16 ejes, cul ser el intervalo de confianza del 95% para el nivel medio del proceso?.

Suponga que se toma la muestra aleatoria y los resultados, en cm., son los siguientes:

4,80 4,78 4,95 4,91 5,02 4,86 5,01 5,07
5,00 4,84 4,94 4,75 4,95 4,96 4,90 4,95
Solucin:

131 . 2 025 . 0 2 / 05 . 0 0083 . 0 92 . 4 16
) 975 . 0 ; 15 ( ) 2 / 1 ; 1 (
2
= = = = = = =

t t s x n
n









Ejemplo:
El contenido de una muestra aleatoria de 7 contenedores de cido sulfrico, se presenta a continuacin:
9.8, 10.2, 10.4, 9.8, 10, 10.2, y 9.6 litros. Encontrar un intervalo de confianza del 95% para el contenido
promedio de los contenedores.
( 1;1 / 2) (6;0.975)
7 10 0.283 0.05 / 2 0.025 2.447
n
n x s t t



= = = = = = =
( 1;1 / 2) ( 1;1 / 2)
0.283 0.283
10 2.447 10 2.447
7 7
9.74 10.26
n n
s s
x t x t
n n


+
+



( 1;1 / 2) ( 1;1 / 2)
0.091 0.091
4.92 2.131 4.92 2.131
16 16
4.87 4.97
n n
s s
x t x t
n n


+
+

Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
6
Cuando la muestra es lo suficientemente grande y aun cuando el supuesto de normalidad no se cumpla
cabalmente, apoyndose en el teorema del lmite central, se puede utilizar como aproximacin el siguiente
intervalo de confianza para muestras grandes, el cual indudablemente mejorar en calidad conforme aumente el
tamao de la muestra.


1 / 2 1 / 2
s s
x z x z
n n


+


La figura que se muestra a continuacin, presenta en esquema para seleccionar el intervalo de confianza para
ms adecuado


DISTRIBUCIN MUESTRAL DE UNA PROPORCION


Proporcin: Es la fraccin de una poblacin que posee una rasgo o caracterstica de inters.

Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
7
poblacin la de Tamao
xitos de nmero
N
X
P = =

El estimador puntual de la proporcin est dado por:

muestra la de Tamao
xitos de nmero
n
x
p = =

Si P es la proporcin de individuos de en una poblacin que presenta cierta caracterstica de inters y p es la
proporcin de individuos en una muestra que presenta dicha caracterstica, al aplicar el teorema del lmite
central se puede demostrar que p distribuye aproximadamente normal, con media P y varianza P(1-P)/n,
siempre y cuando np 5 np(1-p) 5.

De lo anterior se desprende que el estadstico Z:

) 1 , 0 ( ~
) 1 (
N
n
P P
P p
Z

=


Intervalo de Confianza para una Proporcin

Si p es la proporcin de inters en una muestra aleatoria de tamao n, y se tiene que el estadstico:
) 1 , 0 ( ~
) 1 (
N
n
P P
P p
Z

=

Entonces, al despejar P se tiene que:
n
P P
Z p P
) 1 (
=
Entonces, dado que P es desconocido pero lo podemos reemplazar por p, intervalo de confianza aproximado
de 100(1-a)% para la proporcin de la poblacin P cuando n es suficientemente grande esta dado:

n
p p
Z p P
n
p p
Z p
) 1 ( ) 1 (
2 / 1 2 / 1




Ejemplo:
Un fabricante asegura a un potencial comprador que el porcentaje defectuoso de su proceso es mximo el 4%.
Para comprobar la afirmacin del productor, el cliente solicita que se le inspeccione una muestra de 300
artculos de los que hay en el inventario. Al verificar esta muestra se obtienen 18 artculos defectuosos. Podr el
cliente potencial dudar de la afirmacin del proveedor?
Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
8

Solucin:
p=18/300=0.06, n=300, Z
1-/2
=1.96

n
p p
Z p P
n
p p
Z p
) 1 ( ) 1 (
2 / 1 2 / 1



300
) 06 . 0 1 ( 06 . 0
96 . 1 06 . 0
300
) 06 . 0 1 ( 06 . 0
96 . 1 06 . 0

+

P
087 . 0 033 . 0 P


Ejemplo:
En una muestra aleatoria de 500 familias que cuentan con televisin pagada en la ciudad de Concepcin, se
encontr que 340 tienen contratado el plan MovieMax. Encuentre un intervalo del 95% de confianza para la
proporcin real de familias con televisin pagada en Concepcin que est suscrita a MovieMax.

Solucin:
A partir de los datos se obtiene lo siguiente: p=340/500=0.68, n=500, Z
1-/2
=1.96
n
p p
Z p P
n
p p
Z p
) 1 ( ) 1 (
2 / 1 2 / 1



0.68(1 0.68) 0.68(1 0.68)
0.68 1.96 0.68 1.96
500 500
P

+
0.64 0.72 P
Por lo tanto, con un 95% de confianza, la verdadera proporcin de familias con televisin pagada en
Concepcin que estn suscritas a Movie Max, est entre un 64% y 72%.

INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL

Si X
1
, X
2
, , X
n
es una muestra aleatoria de tamao n tomada de una poblacin normal, y si s
2
es la varianza
muestral, entonces s
2
es un estimador puntual de la varianza poblacional . Por otra parte, si la poblacin es
normal, la distribucin muestral de S
2
es una distribucin ji-cuadrado con n - 1 grados de libertad.
2
1
2
2
2
~
) 1 (

=
n
s n
S


Por lo tanto, para obtener un intervalo de confianza del 100(1-)% para la varianza
2
nos basamos en el
estadstico S
2
y en la distribucin ji cuadrado. Por lo tanto, tenemos la siguiente probabilidad:



1
) 1 (
2
) 2 / 1 ; 1 (
2
2
2
) 2 / ; 1 ( n n
s n
P

Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
9

De la cual se desprende


1
) 1 ( ) 1 (
2
) 2 / ; 1 (
2
2
2
) 2 / 1 ; 1 (
2
n n
s n s n
P


Entonces el intervalo de confianza para
2
es:


2
) 2 / ; 1 (
2
2
2
) 2 / 1 ; 1 (
2
) 1 ( ) 1 (

n n
s n s n


Ejemplo.

Si la longitud de un eje proviene de un proceso de produccin distribuido normal, y se toman muestras de 16
ejes, cul ser el intervalo de confianza al 95% para la varianza del proceso?

Suponga que se toma la muestra aleatoria y los resultados, en cm., son los siguientes:

4,80 4,78 4,95 4,91 5,02 4,86 5,01 5,07
5,00 4,84 4,94 4,75 4,95 4,96 4,90 4,95
Solucin:
262 . 6
488 . 27 025 . 0 2 / 05 . 0
0083 . 0 16
2 2
2 2
2
) 025 . 0 ; 15 ( ) 2 / ; 1 (
) 975 . 0 ; 15 ( ) 2 / 1 ; 1 (
= =
= = = =
= =

n
n
s n


0199 . 0 0045 . 0
262 . 6
0083 . 0 ) 1 16 (
488 . 27
0083 . 0 ) 1 16 (
) 1 ( ) 1 (
2
2
2
) 2 / ; 1 (
2
2
2
) 2 / 1 ; 1 (
2

n n
s n s n


Ejemplo
Probabilidades y Estadstica
Edmundo Pea Rozas, Juan Garcs Seguel
10
Una mquina produce varillas de metal utilizadas en el sistema de suspensin de un automvil. Se toma una
muestra aleatoria de 15 varillas y se mide el dimetro (cm). Suponga que el dimetro de la varilla tiene una
distribucin normal.
8,24 8,23 8,2
8,21 8,2 8,28
8,23 8,26 8,24
8,25 8,19 8,25
8,26 8,23 8,24
a) Construya un intervalo de confianza del 95% para el dimetro promedio de la varilla.

b) Construya un intervalo de confianza del 95% para la dispersin del dimetro de las varillas.

Solucin
a) Se tiene que: 8, 23 ; 0, 025 ; 15 x s n = = = . Adems, la varianza es desconocida, por lo tanto, un
intervalo de confianza para la media est dado por:
n
s
t x
n
s
t x
n n ) 2 / 1 ; 1 ( ) 2 / 1 ; 1 (


+

Entonces
0, 025 0, 025
8, 23 2,1448 8, 23 2,1448 8, 219 8, 248
15 15

Por lo tanto, un intervalo del 95% de confianza para el dimetro medio de las varillas est dado por:
[8,219; 8,248].

b) Un intervalo de confianza del 95% para la dispersin del dimetro de las varillas est dado por:
2 2
2
2 2
( 1;1 / 2) ( 1; / 2)
2 2
2
2
( 1) ( 1)
(15 1)0.025 (15 1)0.025
26,119 5.629
0, 0003 0, 002
n n
n s n s

Anda mungkin juga menyukai