Anda di halaman 1dari 9

1

IMPORTANCIA Y CONSECUENCIAS DEL TEOREMA DEL LMITE CENTRAL



Se trata de una propiedad muy importante en la estadstica porque permite justificar y
resolver diversos problemas claves. En este documento se presenta primero el
enunciado del Teorema y se analizan a continuacin algunas de sus consecuencias.

1 - Enunciado del Teorema

Se tienen n variables aleatorias, independientes entre s, todas con la misma
distribucin de probabilidad (a la cual se identifica con la letra F), con media y
varianza
2
. Esto es, las variables son X
1
, X
2
, , X
n
. Entonces se tiene que:

X
i
~ F( ,
2
)

Si se suman dichas variables del siguiente modo:

S = X
1
+ X
2
+ + X
n

Cuando n tiende a infinito, la suma S tiende a comportarse como una Normal con
media igual a la suma de las medias y varianza igual a la suma de las varianzas. Esto
es:
S N (n, n
2
)

Lo interesante es que el Teorema se verifica aceptablemente an cuando no se
cumplan estrictamente las condiciones de partida. Esto es, la normalidad puede
aparecer an cuando la cantidad de trminos que se suman no sea muy grande e
incluso, cuando las variables sumandos no tienen estrictamente las mismas
distribuciones de probabilidad.

Para analizar el tema se desarrollan a continuacin los siguientes apartados:
o Ejemplos de sumas de variables
o Razones por las cuales la distribucin Normal es tan importante
o Aplicacin en la aproximacin de variables discretas
o Aplicacin en la distribucin de los promedios

2 - Ejemplos de sumas de variables

Con ayuda del EXCEL es posible simular distintas sumas de variables aleatorias. Por
ejemplo, un caso tpico es el de las variables rectangulares o uniformes, en el intervalo
de cero a uno. Para una definicin formal se debe especificar que una variable
aleatoria U tiene esta distribucin cuando su funcin de densidad es de la siguiente
forma:













0 1
u
1
f(u)
0 1
u
1
f(u)
2
La media y la varianza de esta variable U, son las siguientes:
E(U) = 0,5
V(U) = 1/12

Ahora bien, si se realiza un experimento que consiste en sumar doce valores de esta
variable U, la suma resultante debera tener distribucin Normal (conforme a lo que
plantea el teorema), con las siguientes media y varianza:
E(S) = 12 * 0,5 = 6
V(S) = 12 * 1/12 = 1

El EXCEL permite generar valores de una variable como esta, con la funcin
ALEATORIO. Con este recurso, es posible entonces construir una muestra de
posibles resultados. La siguiente tabla representa una parte de los resultados
obtenidos al generar aleatoriamente cincuenta sumas:

U1 U2 U3 U4 U5 U6 U7 U8 U9 U10 U11 U12 Suma
0,382 0,1007 0,5965 0,8991 0,8846 0,9585 0,0145 0,4074 0,8632 0,1386 0,245 0,0455 5,536
0,0324 0,1641 0,2196 0,0171 0,285 0,3431 0,5536 0,3574 0,3718 0,3556 0,9103 0,466 4,076
0,4262 0,3039 0,9757 0,8067 0,9912 0,2563 0,9517 0,0534 0,705 0,8165 0,9725 0,4663 7,725
0,3002 0,7502 0,3515 0,7757 0,0743 0,1984 0,0641 0,3583 0,487 0,5112 0,3735 0,9859 5,23
0,0407 0,2307 0,005 0,9261 0,1003 0,2567 0,7757 0,6796 0,8091 0,7243 0,0851 0,1323 4,766
0,7562 0,6265 0,1737 0,4048 0,5523 0,7115 0,5552 0,1812 0,9703 0,6869 0,5288 0,7967 6,944
0,8057 0,2622 0,178 0,8668 0,1148 0,0595 0,7616 0,7384 0,9863 0,9256 0,9039 0,545 7,148
0,5008 0,675 0,4898 0,1458 0,038 0,7963 0,6716 0,7317 0,5845 0,1522 0,8922 0,3778 6,056
0,2005 0,2058 0,334 0,3251 0,3002 0,8022 0,6961 0,2715 0,904 0,0391 0,709 0,4537 5,241
0,5166 0,2565 0,2913 0,8021 0,789 0,676 0,7553 0,9485 0,6194 0,7221 0,968 0,3686 7,714
0,8504 0,5571 0,8731 0,4411 0,2177 0,859 0,2803 0,7033 0,7074 0,3758 0,3297 0,086 6,281
0,9769 0,2855 0,5343 0,4074 0,9977 0,8947 0,8108 0,9086 0,5745 0,7061 0,4014 0,111 7,609
0,8974 0,3863 0,0958 0,7776 0,7836 0,6657 0,6568 0,2585 0,7652 0,7003 0,8588 0,0028 6,849
0,6786 0,9288 0,0425 0,5181 0,9121 0,9543 0,5943 0,5577 0,9682 0,483 0,2556 0,8179 7,711
0,496 0,8506 0,6681 0,9269 0,4518 0,1681 0,062 0,0052 0,5411 0,6176 0,4929 0,5795 5,86
0,6019 0,9301 0,534 0,1321 0,0823 0,5759 0,8292 0,0657 0,2709 0,6997 0,4142 0,3656 5,501
0,4351 0,3301 0,2111 0,7405 0,5235 0,8968 0,6034 0,5228 0,5898 0,5849 0,497 0,1105 6,045


Ahora bien, los cincuenta valores de suma conducen a obtener el siguiente grfico
para la Distribucin de frecuencias relativas acumuladas.

Ojiva de Suma
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
3,5 4,5 5,5 6,5 7,5 8,5
s
F
r




3
En cuanto a los estadsticos de la muestra, son los siguientes:

Suma

Promedio 6,2340904
Mediana 6,14139225
Desviacin estndar 0,99283554
Varianza de la muestra 0,98572241
Curtosis -0,4790178
Coeficiente de asimetra -0,07807006
Rango 4,16483047
Mnimo 4,01193274
Mximo 8,17676321

Como puede advertirse, la Ojiva coincide con la forma de S que es tpica en la Normal,
en tanto que promedio y mediana son muy parecidos, el desvo estndar es mucho
menor que el promedio y el coeficiente de asimetra se aproxima mucho a cero. Todos
estos son comportamientos tpicos en una Normal.

Para pensar

Ahora desarrolle usted un anlisis semejante. Suponga que necesita sumar cincuenta
valores de una distribucin exponencial con media 15. Determine cul sera la
distribucin de los resultados y cunto valen la media y la varianza de la suma.



3 Razones por las cuales la distribucin Normal es tan importante

Muchas variables pueden concebirse como suma de efectos. Cuando esto ocurre,
conforme al Teorema, la variable debe tener distribucin Normal.

Sea por ejemplo el caso de la variable Estatura. La misma es consecuencia de una
gran cantidad de efectos como gentica, herencia, alimentacin, actividades e incluso
el ambiente donde vive la persona. En esas condiciones, la variable slo puede ser
Nomal.

De hecho, esta propiedad se verifica en buena parte de los organismos vivos. Los
mdicos definen a partir de la Normal los valores razonables para la cantidad de
glbulos rojos de una persona sana. Los siclogos representan con la campana los
resultados de los diversos tests utilizados en sicometra. Los bilogos utilizan la
Normal para analizar si una planta tiene un crecimiento razonable.

Si se habla de otro tipo de variables, la aproximacin se mantiene. Por ejemplo, las
ventas diarias de un local en un Shopping, pueden tener cualquier distribucin. Pero
las ventas diarias de TODO el complejo, deben tender a comportarse como normales.

La cantidad de agua que transporta un ro se mide con una variable denominada
Caudal. Dicha variable, para un ro de las sierras de Crdoba, por ejemplo, tiene
distribuciones de probabilidad completamente asimtricas como se ilustra en la
siguiente figura:


4


















Ahora bien, en la Argentina el ro ms importante es el Paran. Este curso recibe el
agua de una gran cantidad de afluentes en un rea muy extensa. Luego, los caudales
transportados slo pueden tener distribucin Normal.

Para pensar

Se estudia la variable aleatoria determinada por todos los depsitos en caja de ahorro
que tiene un banco, en un determinado instante de tiempo. Analice cul debera ser la
distribucin de probabilidad de esa variable.



4 La Normal puede aproximar a Binomial y a Poisson

Algunos modelos de probabilidad pueden ser entendidos como sumas de variables
aleatorias. En esos casos, el TLC explica que cuando la suma es suficientemente
grande, dicho modelo tiende a comportarse como una Normal.

El caso de la Binomial

Un caso tpico es el de la Binomial. Recordemos que la variable se define como suma
de variables tipo Bernoulli. Esa condicin hace que cuando la cantidad de intentos es
grande, esta distribucin adopte una forma de campana.

Analicemos un ejemplo sobre esta cuestin. Sea el caso de un secretario que redacta
notas por encargo del director de una empresa. El director le comenta la idea y el
secretario escribe una comunicacin conveniente. Luego, el directivo revisa el escrito
para analizar su adecuacin.

Supongamos que el 25% de las veces la nota es corregida por el director. Podemos
definir una variable aleatoria tipo Bernoulli (Y), con los siguientes valores posibles:
Y = 0 si la nota no tiene objeciones;
Y= 1 cuando la nota debe ser corregida.

Con lo cual la distribucin de probabilidad de esta variable es la siguiente:

f
Q
f
Q
5
Y p(y)
0 0,75
1 0,25

Luego, el valor esperado y la varianza resultan:
E[Y] = 0 (1-p) + 1 p = p = 0,25
V[Y] = E(Y
2
) - E
2
(Y) = p - p
2
= p (1-p) = 0,1875

Ahora bien, si hacemos cinco notas por hora, podemos definir una variable aleatoria X
1

del siguiente modo: Cantidad de notas corregidas en un lote de cinco, independientes
entre si. Esta variable debe tener distribucin binomial con parmetros n igual a cinco
y p igual a 0,25. De hecho, la variable puede formularse como:

=
=
5
1
1
j
j
Y X

La forma de la distribucin de probabilidad para esta variable es la siguiente:
B(5, 0,25)
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0 1 2 3 4 5


Debe notarse que tiene una asimetra positiva pronunciada. En cambio, si analizamos
la siguiente variable: Cantidad de notas corregidas en un lote de cien, independientes
entre si; encontramos este otro comportamiento:

B(100, 0,25)
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,1
0 5
1
0
1
5
2
0
2
5
3
0
3
5
4
0
4
5
5
0
5
5
6
0


6
En este caso hay una notable similitud con la tpica campana de la Normal. Por
supuesto, la coincidencia no se presenta slo en las figuras sino tambin en las
probabilidades. Supongamos que se necesita encontrar la siguiente probabilidad:
P( 30 20 X ) =

=
30
20
) (
x
x p = 0,7967

Esa misma probabilidad puede ser aproximada con la Normal. Para dicha
aproximacin es preciso adoptar la media y la varianza:

33 , 4
75 , 18 ) 25 , 0 1 ( * 25 , 0 * 100 ) 1 (
25 25 , 0 * 100
2
=
= = =
= = =

p np
np


Luego se calcula con la Normal la siguiente probabilidad:

P( 5 , 30 5 , 19 X )

La idea de calcular con valores de X en 0,5 ms o menos, se conoce como
correccin por continuidad, Para comprender el sentido de la operacin
consideremos que el modelo binomial es discreto, por lo que asigna una masa de
probabilidad al valor veinte, otra al veintiuno y as sucesivamente. En cambio la normal
es continua y trabaja por reas, por lo que el equivalente a la probabilidad de veinte se
aproxima con la probabilidad del intervalo (19,5 , 20,5).

Pero lo interesante es que en este caso, el clculo con la normal arroja el siguiente
resultado:

P( 5 , 30 5 , 19 X ) = 0,7959

Debemos notar que las diferencias se encuentran recin en el tercer decimal.

Para pensar

En una fbrica producimos cajas de velocidad para automviles. La produccin es de
800 unidades por da. Al final del proceso de elaboracin se realiza una prueba
sistemtica de cada una de las cajas y se rechaza en promedio el uno por ciento de
las unidades.
Para este caso, determinemos la probabilidad de que en un da cualquiera se
rechacen entre setenta y ochenta y cinco cajas.
Es conveniente que realicemos el clculo con ambos modelos: Binomial y Normal.
Comparemos luego los resultados.
Por otra parte, consideremos la posibilidad de aplicar Poisson en este problema: es
posible aproximar la probabilidad solicitada con Poisson?. Elaboremos una
justificacin para esta respuesta.



El caso de Poisson

Resultados similares se obtienen con el modelo de Poisson. Esto suena razonable ya
que podra considerarse que dicho modelo es una condicin lmite para la Binomial. En
cualquier caso, las variables Poisson tambin pueden considerarse como sumas de
7
efectos y en esa condicin, deben tender a la normal cuando su parmetro toma
valores grandes.

Como ejemplo, analicemos el caso de una oficina de clientes en un gran
supermercado. En la misma se recibe un promedio de dos reclamos por minuto. Con
esta situacin, la variable Cantidad de reclamos que se reciben por minuto puede
tener distribucin de Poisson con media dos. En ese caso, la forma de su diagrama de
barras es la siguiente:

Poisson media dos
0
0,05
0,1
0,15
0,2
0,25
0,3
0 1 2 3 4 5 6 7


Ahora bien, si en vez de analizar los reclamos por minuto, estudiamos los reclamos
por hora, estamos acumulando el resultado de sesenta minutos. En ese caso, la media
y varianza son:

E[Y] = 60 * 2 = 120
V[Y] = E (Y) = 120
= 10,954

El diagrama de barras de Poisson con dicha media queda como sigue:

Poisson media 120
0
0,005
0,01
0,015
0,02
0,025
0,03
0,035
0,04
9
0
9
4
9
8
1
0
2
1
0
6
1
1
0
1
1
4
1
1
8
1
2
2
1
2
6
1
3
0
1
3
4
1
3
8
1
4
2
1
4
6
1
5
0


8
Como puede apreciarse, nuevamente la cercana con la normal es realmente
destacable. Por supuesto, tambin los clculos de probabilidades son muy
aproximados.

Como ejemplo, podemos calcular la probabilidad que la variable cantidad de reclamos
por hora tome valores entre 115 y 130:

P ( 130 115 X ) = 0,5196

Para aproximar con la Normal debemos determinar lo siguiente:

P ( 5 , 130 5 , 114 X ) = F(130,5) F(114,5)
= 0,8311 0,3078
= 0,5233

Con lo que nuevamente encontramos una diferencia de pocas milsimas entre el valor
real y el aproximado.


Para pensar

La cantidad de vehculos que arriban a una estacin de peaje, por minuto, es una
variable con distribucin Poisson. Su media es de cinco autos por minutos.
Analicemos cul puede ser un modelo de probabilidad conveniente para la cantidad
de arribos que se producen por hora. Con ese modelo, determinemos la probabilidad
que en una hora arriben entre doscientos ochenta y trescientos veinte autos.
Aproximemos la misma probabilidad con el modelo normal y comparemos los
resultados.



La mquina de Galton

La mquina de Galton est formada por una tabla vertical en la que hay una serie de
filas de clavos que se encuentran intercalados unos con otros. A travs de un embudo
se dejan caer bolitas de acero, de manera que cada bolita, al encontrarse con un
clavo, tiene probabilidad de caer a la izquierda o a la derecha. Las bolitas forman
pequeos montones en el suelo de la mquina, de manera que las superficies dibujan
una curva. En principio esta curva tiene una forma cualquiera, pero cuando el nmero
de bolitas es lo suficientemente grande, la distribucin de las bolitas adopta la forma
de la campana de Gauss (en la mquina original se emplearon 800 bolitas).

9
Este resultado no es sorprendente si tenemos en cuenta que para que una de las
bolitas se ubique, por ejemplo, en la celda que est en el extremo de la derecha, debe
caer siempre hacia la derecha, mientras que una que llegue al centro, debe caer una
vez a la derecha y otra a la izquierda, lo que es una sucesin de resultados ms
probable.

La mquina de Galton ilustra de forma intuitiva lo que sucede cuando tenemos la suma
de un gran nmero de variables aleatorias independientes, cada una de las cuales
contribuye en pequea medida a la totalidad.

Ver el desarrollo del experimento en:
http://www.youtube.com/watch?v=AUSKTk9ENzg

Anda mungkin juga menyukai