=
=
5
1
1
j
j
Y X
La forma de la distribucin de probabilidad para esta variable es la siguiente:
B(5, 0,25)
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0 1 2 3 4 5
Debe notarse que tiene una asimetra positiva pronunciada. En cambio, si analizamos
la siguiente variable: Cantidad de notas corregidas en un lote de cien, independientes
entre si; encontramos este otro comportamiento:
B(100, 0,25)
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,1
0 5
1
0
1
5
2
0
2
5
3
0
3
5
4
0
4
5
5
0
5
5
6
0
6
En este caso hay una notable similitud con la tpica campana de la Normal. Por
supuesto, la coincidencia no se presenta slo en las figuras sino tambin en las
probabilidades. Supongamos que se necesita encontrar la siguiente probabilidad:
P( 30 20 X ) =
=
30
20
) (
x
x p = 0,7967
Esa misma probabilidad puede ser aproximada con la Normal. Para dicha
aproximacin es preciso adoptar la media y la varianza:
33 , 4
75 , 18 ) 25 , 0 1 ( * 25 , 0 * 100 ) 1 (
25 25 , 0 * 100
2
=
= = =
= = =
p np
np
Luego se calcula con la Normal la siguiente probabilidad:
P( 5 , 30 5 , 19 X )
La idea de calcular con valores de X en 0,5 ms o menos, se conoce como
correccin por continuidad, Para comprender el sentido de la operacin
consideremos que el modelo binomial es discreto, por lo que asigna una masa de
probabilidad al valor veinte, otra al veintiuno y as sucesivamente. En cambio la normal
es continua y trabaja por reas, por lo que el equivalente a la probabilidad de veinte se
aproxima con la probabilidad del intervalo (19,5 , 20,5).
Pero lo interesante es que en este caso, el clculo con la normal arroja el siguiente
resultado:
P( 5 , 30 5 , 19 X ) = 0,7959
Debemos notar que las diferencias se encuentran recin en el tercer decimal.
Para pensar
En una fbrica producimos cajas de velocidad para automviles. La produccin es de
800 unidades por da. Al final del proceso de elaboracin se realiza una prueba
sistemtica de cada una de las cajas y se rechaza en promedio el uno por ciento de
las unidades.
Para este caso, determinemos la probabilidad de que en un da cualquiera se
rechacen entre setenta y ochenta y cinco cajas.
Es conveniente que realicemos el clculo con ambos modelos: Binomial y Normal.
Comparemos luego los resultados.
Por otra parte, consideremos la posibilidad de aplicar Poisson en este problema: es
posible aproximar la probabilidad solicitada con Poisson?. Elaboremos una
justificacin para esta respuesta.
El caso de Poisson
Resultados similares se obtienen con el modelo de Poisson. Esto suena razonable ya
que podra considerarse que dicho modelo es una condicin lmite para la Binomial. En
cualquier caso, las variables Poisson tambin pueden considerarse como sumas de
7
efectos y en esa condicin, deben tender a la normal cuando su parmetro toma
valores grandes.
Como ejemplo, analicemos el caso de una oficina de clientes en un gran
supermercado. En la misma se recibe un promedio de dos reclamos por minuto. Con
esta situacin, la variable Cantidad de reclamos que se reciben por minuto puede
tener distribucin de Poisson con media dos. En ese caso, la forma de su diagrama de
barras es la siguiente:
Poisson media dos
0
0,05
0,1
0,15
0,2
0,25
0,3
0 1 2 3 4 5 6 7
Ahora bien, si en vez de analizar los reclamos por minuto, estudiamos los reclamos
por hora, estamos acumulando el resultado de sesenta minutos. En ese caso, la media
y varianza son:
E[Y] = 60 * 2 = 120
V[Y] = E (Y) = 120
= 10,954
El diagrama de barras de Poisson con dicha media queda como sigue:
Poisson media 120
0
0,005
0,01
0,015
0,02
0,025
0,03
0,035
0,04
9
0
9
4
9
8
1
0
2
1
0
6
1
1
0
1
1
4
1
1
8
1
2
2
1
2
6
1
3
0
1
3
4
1
3
8
1
4
2
1
4
6
1
5
0
8
Como puede apreciarse, nuevamente la cercana con la normal es realmente
destacable. Por supuesto, tambin los clculos de probabilidades son muy
aproximados.
Como ejemplo, podemos calcular la probabilidad que la variable cantidad de reclamos
por hora tome valores entre 115 y 130:
P ( 130 115 X ) = 0,5196
Para aproximar con la Normal debemos determinar lo siguiente:
P ( 5 , 130 5 , 114 X ) = F(130,5) F(114,5)
= 0,8311 0,3078
= 0,5233
Con lo que nuevamente encontramos una diferencia de pocas milsimas entre el valor
real y el aproximado.
Para pensar
La cantidad de vehculos que arriban a una estacin de peaje, por minuto, es una
variable con distribucin Poisson. Su media es de cinco autos por minutos.
Analicemos cul puede ser un modelo de probabilidad conveniente para la cantidad
de arribos que se producen por hora. Con ese modelo, determinemos la probabilidad
que en una hora arriben entre doscientos ochenta y trescientos veinte autos.
Aproximemos la misma probabilidad con el modelo normal y comparemos los
resultados.
La mquina de Galton
La mquina de Galton est formada por una tabla vertical en la que hay una serie de
filas de clavos que se encuentran intercalados unos con otros. A travs de un embudo
se dejan caer bolitas de acero, de manera que cada bolita, al encontrarse con un
clavo, tiene probabilidad de caer a la izquierda o a la derecha. Las bolitas forman
pequeos montones en el suelo de la mquina, de manera que las superficies dibujan
una curva. En principio esta curva tiene una forma cualquiera, pero cuando el nmero
de bolitas es lo suficientemente grande, la distribucin de las bolitas adopta la forma
de la campana de Gauss (en la mquina original se emplearon 800 bolitas).
9
Este resultado no es sorprendente si tenemos en cuenta que para que una de las
bolitas se ubique, por ejemplo, en la celda que est en el extremo de la derecha, debe
caer siempre hacia la derecha, mientras que una que llegue al centro, debe caer una
vez a la derecha y otra a la izquierda, lo que es una sucesin de resultados ms
probable.
La mquina de Galton ilustra de forma intuitiva lo que sucede cuando tenemos la suma
de un gran nmero de variables aleatorias independientes, cada una de las cuales
contribuye en pequea medida a la totalidad.
Ver el desarrollo del experimento en:
http://www.youtube.com/watch?v=AUSKTk9ENzg