Anda di halaman 1dari 12

EL TEOREMA DEL LMITE CENTRAL

SERGIO SABA INGENIERA MECANICA

UAN TUNJA 2012

El teorema del lmite central

La distribucin de la media muestral de una poblacin normal es una distribucin normal con la misma media poblacional y con desviacin tpica el error estndar. Este hecho nos permite calcular probabilidades cuando tenemos una muestra de una variable con distribucin normal y desviacin tpica conocida. Cuando no conocemos la desviacin tpica de la variable, tambin podemos hacer clculos con la distribucin Aqui veremos cmo debemos proceder cuando no sabemos si la variable de inters sigue una distribucin normal o no, o cuando sabemos seguro que su distribucin no es normal. Cuando la muestra es lo bastante grande, la solucin nos viene dada por uno de los resultados fundamentales de la estadstica: el teorema del lmite central. Lo haremos con un caso particular: el estudio de la binomial.

1. Aproximacin de la binomial a la normal Supongamos que jugamos diariamente a un nmero de una lotera que, entre otros premios, devuelve el importe jugado a todos los nmeros que acaban en la misma cifra que el nmero ganador. Consideremos la variable X(n), que no da el nmero de veces que nos han devuelto el importe jugado cuando se han realizado n sorteos. En este caso sabemos que la variable aleatoria X(n) sigue una distribucin binomial de parmetros n y p 0,1. En efecto, se han hecho n sorteos (es decir, se ha repetido un mismo experimento n veces de manera independiente) y en cada sorteo la probabilidad de que nos devuelvan el dinero es p 1/10 0,1 (probabilidad de xito). Sin embargo, observemos qu sucede al aumentar el valor de n con la funcin de densidad de probabilidad de la variable X(n). Si dibujamos esta funcin de densidad de probabilidad para n 3, obtenemos el grfico siguiente:

Si ahora consideramos n 10, los posibles valores van del 0 al 10, y el grfico de la funcin de densidad de probabilidad es:

Si tomamos n 100, el grfico es:

Y si por ejemplo tomamos n 500, el grfico de la funcin de probabilidad es:

Vemos, pues, que el perfil de este grfico cada vez se parece ms al de la funcin de densidad de probabilidad de una variable aleatoria normal. La conclusin que extraemos de este experimento es que si n es lo bastante grande, la variable aleatoria X(n) es aproximadamente normal. Determinaremos ahora la media y la desviacin de esta variable aleatoria, que sern las correspondientes a la misma X(n): La esperanza de esta variable es: n p 0,1 n y la varianza: Np (1 p) n(0,1) (0,9) 0,09n stos sern los parmetros de la variable aleatoria normal que aproxima la distribucin de X(n). As pues, si n es lo bastante grande, X(n) se comporta como una N(0,1n; 0,09n).

Este resultado nos permite simplificar bastante los clculos en algunas situaciones.

Ejemplo de la lotera Cul es la probabilidad aproximada de que en un ao nos hayan devuelto el dinero al menos cincuenta veces? De hecho, debemos calcular la probabilidad P(X(365) 50). Si quisiramos obtener el valor exacto de esta probabilidad, por el hecho de que X(365) es una binomial de parmetros 365 y p 0,1, deberamos hacer el clculo siguiente:

donde cada una de estas probabilidades se encontrara mediante la frmula de la binomial que ya conocemos, en nuestro caso:

En cambio, si renunciamos a pedir que la probabilidad sea exacta y nos conformamos con una muy buena aproximacin, podemos utilizar el hecho de que la distribucin de X(365) se puede aproximar por una normal de parmetros 365 0,1 = 36,5 y 2 365 0,09 = 32,85. As:

y si llamamos Z a una variable aleatoria normal (0,1), esta probabilidad ser aproximadamente:

Por tanto, la probabilidad aproximada de que nos devuelvan el dinero cincuenta veces o ms a lo largo del ao es nicamente del 0,0091. Observad que hemos calculado P(X(365) 50), pero que esta cantidad es la misma que P(X(365) 49,5), ya que la variable slo toma valores naturales. Si nos fijamos en que si la aproximamos por la normal, obtendremos:

que es una cantidad ligeramente diferente de la obtenida antes. Se dice que este valor se ha obtenido haciendo una correccin de continuidad, ya que aproximamos una variable discreta por una continua. Podemos considerar buenos los dos resultados.

1.1. Estudio de la proporcin Hemos visto que cuando n es grande, podemos aproximar una binomial (n,p) por una normal de parmetros np y 2 np(1 p). Por otro lado, sabemos que podemos considerar la variable aleatoria binomial como la suma de n variables aleatorias con distribucin de Bernoulli de parmetro p. Si dividimos esta suma por n, obtenemos claramente la proporcin de xitos.

Puesto que hemos visto que la suma de n distribuciones de Bernoulli de parmetro p, que es una binomial (n,p), es aproximadamente una distribucin normal con media np y varianza np(1 p), est claro que la proporcin (que es la suma de las n distribuciones de Bernoulli dividida por n), tendr esperanza p y desviacin tpica

2. El teorema del lmite central Sabemos que la distribucin de la media muestral de una variable normal o bien tiene distribucin normal. Tambin hemos visto que si las variables originales siguen una distribucin de Bernoulli, entonces su media es una proporcin y, en este caso, cuando n es lo bastante grande, su distribucin muestral tambin es una normal. El ltimo resultado es cierto sea cual sea la distribucin de los datos originales. Es decir, no es preciso que partamos ni de distribuciones normales ni de distribuciones de Bernoulli, ya que para muestras de tamaos lo bastante grandes, la distribucin de la media muestral es normal sea cual sea la distribucin original. Este resultado fundamental de la estadstica tiene un nombre propio: el teorema del lmite central.

Una consecuencia de este teorema es la siguiente:

2.1. Control de calidad Uno de los casos ms habituales en los que podemos aplicar el teorema del lmite central es a la hora de hacer un proceso de control de calidad.

Estableceremos un intervalo, de manera que las medias que caigan fuera de este intervalo nos indicarn que existe alguna anomala en el proceso de produccin en aquel instante. Los lmites de este intervalo se denominan lmites de control. Si es la esperanza de la variable de inters, la desviacin tpica y consideramos una muestra de esta variable de tamao n, los lmites de control vendrn dados por . Es decir, calculam Es decir, calculamos tres veces el error estndar a lado y lado de la media. Por tanto, la longitud del intervalo es dos veces el triple del error estndar. Por qu tomamos este intervalo? Si aplicamos el teorema del lmite central sobre la variable de inters, sabemos que la media de n datos se distribuye como una normal con media y varianza n . Se demuestra fcilmente que la probabilidad de que una media est fuera del intervalo + 3n y 3n es de 0,001 (esto significa que un valor fuera de este intervalo, si el proceso funcionase correctamente, se puede dar slo con una probabilidad de 0,001). Por tanto, cuando se d un valor fuera del intervalo, pensaremos que no es casualidad y que el problema es que la variable no se comporta como suponamos. Ejemplo de realizacin de un control de calidad Consideremos una mquina que llena tarros de yogur. Supongamos que, de media, cada tarro contiene 125 gramos de yogur con una desviacin tpica de 1,5 gramos. Todas las semanas hacemos un control de la mquina: analizamos una muestra de treinta tarros y calculamos la media de cada uno. En este ejemplo el error estndar es:

Por tanto, los lmites de control sern:

As pues, si la media de las muestras semanales de tamao 30 est entre estos dos valores, consideraremos que todo est correcto, mentras que si es inferior a 124,18 o superior a 125,82 supondremos que hay alguna anomala en el proceso de produccin, y habr que revisarlo. Por cierto, fijaos en que para hacer este control de calidad slo se desperdician treinta yogures a la semana. 3. Resumen Se ha presentado un resultado fundamental de la estadstica, el teorema del lmite central. Lo hemos desarrollado a partir del estudio de una proporcin. Hemos acabado viendo una de sus aplicaciones ms habituales, la realizacin de un control de calidad. Ejercicios 1. Se establece un control de calidad para un proceso de produccin de balas. Se ha dispuesto que cuando el proceso est bajo control, el dimetro de las balas es de 1 cm, con una desviacin tpica de 0,003 cm. Cada hora se toman muestras de nueve balas y se miden sus dimetros. Los dimetros de media de diez muestras sucesivas, en centmetros, son: 1,0006 1,0012 0,9997 1,0018 0,9992 1,0016 1,0012 1,0020 1,0008 1,0022

Estableced cules son los lmites de control y explicad qu podis concluir sobre el proceso de produccin en estos instantes. Observamos que la media 1 y que el error estndar es:

Por tanto, los lmites de control sern 1,003 y 0,997. Observemos que absolutamente todas las medias que hemos obtenido de las sucesivas muestras estn dentro del intervalo formado por los dos lmites de control. Es decir, no hay ningn dato superior a 1,003 ni ningn dato inferior a 0,997. Por tanto, podemos concluir que el proceso de control ha sido correcto durante el tiempo que lo hemos analizado, y que no hemos detectado ninguna anomala.

CONCLUSIONES
El Teorema Central del Lmite establece que la suma de n variables aleatorias independientes de varianza finita e idntica distribucin tiende a la distribucin normal cuando n tiende a infinito. El Teorema Central del Lmite, permite calcular razonablemente bien las probabilidades de variables que siguen una distribucin Binomial y de Poisson, siempre que el tamao de muestra sea suficientemente grande.

CIBERGRAFIA http://estadisticavigrado.blogspot.com/2011/04/teorema-del-limitecentral.html http://es.wikipedia.org/wiki/Teorema_central_del_l%C3%ADmite http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/C apitulo5/B0C5m1t4.htm