DISTRIBUCIN
BINOMIAL Y NORMAL
I.- Variable aleatoria. Concepto.
Antes de definir el concepto de varibale aleatoria, veamos algunos ejemplos (ya ests
empezando a comprobar que en estadstica sin ejemplos andamos algo perdidos).
Ejemplos:
Los
valores
posible
son:
Pues bien, todas las variables de los ejemplos anteriores son variables aleatorias. As,
Una variable aleatoria es una funcin x que hace corresponder un
nmero real a cada resultado de un experimento aleatorio.
Tambin de los ejemplos anteriores ya habrs podido deducir que existen dos tipos de
variables aleatorias:
Discretas, cuando la variable aleatoria toma como valores nmeros enteros.
Continua, cuando la variable aleatoria puede tomar cualquier valor dentro de un
intervalo y no es posible asignar un valor entero a un resultado cualquiera del
experimento.
A los valores que puede tomar una variable aleatoria se le llama recorrido. En el caso
de las tres monedas, por ejemplo, el recorrido son los nmeros 0, 1, 2, 3 . En el caso del
tiempo invertido por el alumno sera el intervalo t 1, t 2 entre el mnimo valor y el mximo.
Observacin. Hay variables discretas que pueden tomar infinitos valores, pero
siempre es posible contarlos o numerarlos. Por ejemplo, en el lanzamiento de un dado,
podemos preguntarnos por el la variable x = numero de lanzamientos hasta que salga un . En
principio, el nmero de lanzamientos hasta que salga el resultado esperado puede infinito,
pero es posible contarlos. Es, por tanto, una variable discreta.
- 19 -
de caras . El recorrido
Supongamos ahora que un tirador tira dos veces seguidas a una diana y sabemos que la probabilidad de
que acierte de cada vez es de 0.6. Consideremos para este experimento la variable aleatoria
x = numero de aciertos del tirador en los dos disparos, cuyo recorrido es x = 0, 1, 2
Sea ahora f(x) la funcin que asocia a cada valor de la variable su probabilidad de ocurrencia. Veamos,
diagrama de arbol:
1er disparo
2 disparo
0,6
0,6
0,4
0,6
0,4
0,4
Acierto
Fallo
f(0) = p(0 aciertos ) = 0.4 2 = 0.16
- 20 -
4/8
0,48
3/8
0,36
2/8
0,16
1/8
0
caras
aciertos
)=0.70
p(
) =0.30
(d) Supongamos un dado de quinielas (tres unos, dos equis y un dos) y estudiamos la
variable aleatoria x = nmero de veces que se lanza el dado hasta obtener una equis
x i =numero de hijos
n i =numero de familias
0
5
1
6
2
2
3
1
4
1
Si llamamos N al nmero total de datos (en nuestro caso 15 ), el clculo del nmero medio de hijos de
las 15 familias se realiza, como sabes, de la siguiente manera:
- 22 -
x =
x i $ n i 0 $ 5 + 1 $ 6 + 2 $ 2 + 3 $ 1 + 4 $ 1 17
=
= 1, 13 hijos, de media
N =
15
15
Sin embargo, el clculo de la media puede verse tambin de otro modo. Supongamos que definimos la
variable aleatoria
x =
xi $ ni
ni
( )
N = x i $ N = x i $ f x i = x i $ p(x i ) = 1, 13 hijos, de media
As:
Llamamos media o esperanza matemtica de una distribucin
estadstica a la suma de los productos de cada valor de la
variable por su probabilidad de ocurrencia. Se denota por la letra
griega .
= x i $ p(x i )
(1)
(2)
Por ltimo
Llamamos desviacin tpica de una distribucin estadstica, , a
la raz cuadrada de la varianza:
= varianza = x 2i $ p(x i ) 2
Sobre la media nada que decir. La varianza, en cambio, merece un comentario.
Observa que su clculo depende del valor de la diferencia al cuadrado entre cada valor de la
variable y la media de la distribucin. As pues, cuanto ms alejados estn los elementos
individuales de la media mayor es la varianza. Por tanto, esta es una medida de lo dispersos
que estn los datos respecto del valor medio. La varianza, sin embargo, presenta un problema
de interpretacin, ya que se mide en cm 2 , segundos 2 , hijos 2 , etc Para evitar esto y poder dar
los resultados en trminos de cm, segundos, hijos, etc se introduce la desviacin tpica como
la raz cuadrada de la varianza. As, todo cuadra.
Ejercicios.
1. Calcular la media y la varianza de las distribuciones de probabilidad de ejercicio del
apartado anterior. Interpretar los resultados.
Pues bien, probablemente sea la distribucin binomial, la que por su relacin con el
estudio de las proporciones (proporcin de jvenes que acceden a la universidad frente a los
que no, proporcin de personas que en vacaciones viajan al extranjero frente a las que no,
proporcin de los que invierten en bolsa frente a los que no, etc) tiene mayor importancia en
el mbito social.
Una distribucin de probabilidad se ajusta a los parmetros de una binomial si
verifica los siguientes requisistos:
p+q=1oq=1p
=n$p
2 = n $ p $ q
= n$p$q
(c) Consideremos xito obtener cara al lanzar una moneda. Lanzamos la moneda 7 veces
y consideramos la variable aleatoria: x = nmero de caras obtenidas en los 7
lanzamientos
(d) En una urna en la que hay 7 bolas rojas y 5 negras, extraemos de una vez 3 bolas y
consideramos la variable aleatoria x = nmero de bolas rojas de las 3 extradas
(e) La probabilidad de nacimiento de nios varones en Espaa es del 51,7 %, mientras
que la de nias es del 48,3 %. Consideramos la variable aleatoria x = nmero de
varones en una familia con 5 hijos
(f) En la primera evaluacin -sin contar la recuperacin- aprobasteis la asignatura de
matemticas 12 alumnos de un total de 22 que estis en clase. Sea la variable aleatoria
x = nmero de alumnos que aprobaron que las matemticas de un grupo de 4 alumnos.
2.-
a) Cul es la probabilidad de que el cazador del ejercicio (a) cace al menos una pieza si
un da efectu cinco disparos?
b) Y de que cace exactamente 2 piezas? Y ninguna? -que tambin puede ser-.
3.-
a) Cul es la probabilidad de que un grupo de diez enfermos del ejercicio (b) a los que
se les suministr el medicamento todos estn curados?
b) Cul es la probabilidad de que estn curados ms de la mitad de los enfermos?
4.-
a) Cuntos nios y nias (ejercicio (e)) se espera habr entre los 1500 bebs que
nacieron en cierta ciudad el ao pasado?
b) Cul es la probabilidad de que en una familia con cinco hijos slo haya nias?
5.- Y finalmente...
a) Cul es la probabilidad de que cuatro de vosotros elegidos al azar por Adolfo
hayis aprobado todos las matemticas en la primera evaluacin? Y al menos uno?
b) Podras hacer previsiones para la segunda evaluacin con los datos disponibles?
- 26 -
aleatoria x = tiempo invertido en realizar el trayecto desde casa al instituto no es posible construir una funcin
de probabilidad, puesto que la probabilidad de que ocurra cada uno de los valores posibles de la variable es
siempre nula. Pensars con razn que algunos de los resultados s ocurren, los que tiene anotados en su cuaderno
de tiempos. Y esto es cierto, pero a priori, incluso para esos tiempos la probabilidad de ocurrencia es cero -no me
preguntes, entonces, cmo ocurrieron, podriamos entrar en una interminable discusin sobre el infinito, tal vez
interesante, pero de la misma utilidad que los claustros y reuniones de tutores de este instituto: ninguna, y con el
pernicioso efecto secundario de agrandar el ego de quienes las presiden y disminuir en la misma proporcin su
capacidad de sntesis-.
x 2i $ n i 2
n i en todos los casos vale uno, pues es muy raro que se repita un resultado.
Bien, esta forma de proceder es la correcta y sin duda es la nica que conduce a los
verdaderos resultados de los parmetros media y desviacin tpica. Pero presenta dos
problemas:
Si el nmero de anotaciones fuera muy grande (como suele ocurrir cuando se tratan
problemas reales) el procedimiento no es operativo (imagina por ejemplo sumar las alturas
de todos los habitantes de un pais y dividir por el nmero de habitantes para determinar su
altura media).
Aunque fuera posible determinar sus parmetros, media y desviacin tpica, no podramos
utilizarlos para hacer predicciones ni hiptesis sobre sus posibles cambios en el tiempo
(este ser el tema del prximo captulo de la estadstica)
As pues se hace necesario construir algo parecido a una funcin de probabilidad.
- 27 -
7,5
8,5
La lnea que une las barras verticales se llama polgono de frecuencias y como vers ms adelante
tiene su importancia.
- 28 -
A esta y otras curvas obtenidas de esta manera se las llama funciones densidad para
variables continuas, y como tales funciones se las denota por f(x) .
Una aclaracin ya mencionada. Las funciones dendisad no representan la
probabilidad de ocurrencia de un valor concreto de la variable, como ya se ha mencionado
esta probabilidad es cero, pero a partir de su forma es posible determinar la probabilidad de
que un valor se encuentre entre dos dados, puesto que todas las funciones densidad cumplen
las siguientes dos propiedades:
El rea bajo la curva y el eje X entre dos valores x 1 y x 2 nos da la probabilidad de que la
variable se encuentre entre x 1 y x 2 .
probabilidad de x entre x 1 y x 2 = p(x 1 [ x [ x 2 ) = A
Su forma es la de una campana en la que el valor medio de la varible, , ocupa su valor central.
Para este valor la funcin toma el mximo valor. es la desviacin tpica de la variable. Las dos
colas de la funcin se aproximan a cero (eje X) cuanto ms nos alejamos del valor central.
- 29 -
x
12
1
(Otra vez el nmero e = 2, 718...)
e
Su frmula matemtica es f(x) =
2
El rea total bajo su curva es 1 -como para cualquier funcin densidad-, pero adems se
verifica que:
- 30 -
Sin embargo, estos clculos no pueden hacerse sobre la distribucin de los recin
nacidos pues desconocemos el rea a la derecha del valor x = 4, 200 kg. Dont worry!, existe
una distribucin normal de media = 0 y = 1, idntica a cualquier otra distribucin normal
pero cuyas reas estn calculadas y recogidas en una tabla para cualquier valor de x . As es
que lo nico que debemos hacer es determinar sobre esa distribucin N(0, 1), el valor
equivalente a nuestro 4,200 kg, y buscar en la tabla el valor del rea correspondiente (hay
unas reglas de clculo que vistes el ao pasado y que repasaremos este ao). A este proceso se
le denomina tipificar la variable.
Si x = 4, 200 kg es el valor que queremos tipificar y llamamos z al valor de su
equivalente en la distribucin N(0, 1), entonces
z=
nos da el valor de: z =
x
4, 200 3, 750
= 1, 07
0, 420
el cul, buscado en la tabla, y aplicando las reglas de clculo da una proporcin de:
p(z m 1, 07) = 1 0.8577 = 0.1423
Es decir, el 14,23 % de los nios tendrn un peso igual o superior a 4,200 kg
- 31 -
Ejercicios.
1. Las puntuaciones obtenidas en un test de aptitudes aplicado cada ao a estudiantes
universitarios siguen una distribucin N(500, 100)
a) Qu porcentaje de estudiantes universitarios se espera que obtengan puntuaciones
entre 500 y 675?
b) Qu porcentaje de etudiantes se espera que logran puntuaciones superiores a 630?
c) Qu probabilidad hay de que un estudiante elgido al azar tenga una puntuacin
superior a 700?
2. Supongamos que la altura de las personas con edades comprendidas entre 20 y 30 aos se
distribuye normalmente con media 1,65 metros y desviacin tpica 0,15 metros.
Si consideramos que una persona es alta si mide ms de 1,80 metros, qu nmero de
personas altas se espera que haya en un grupo de 2.000 individuos con edades
comprendidas entre los 20 y 30 aos?
3. Si se multiplica una variable con distribucin normal por una constante, se obtiene otra
variable con distribucin normal, cuyas medias y desviacin tpica quedan multiplicadas por
dicha constante.
x d N , entonces kx d N(k, k)
Segn esto, calcula la probabilidad que tiene una empresa de ingresar por ventas ms de
20.000 euros, cuyo producto tiene una demanda que sigue una distribucin normal
N(5.000, 250) si el precio de venta al pblco de cada unidad es de 3,6 euros.
4. Si se suman o restan dos variables aleatorias que presentan distribucin normal, se obtiene
otra variable aleatoria con distribucin normal cuya media es la suma o resta de las medias y
cuya varianza es la suma de las varianzas:
x d N 1 , 1
x + y d N( 1 ! 2 , 21 + 22 )
y d N 2 , 2
Una tienda vende dos productos. El primero de ellos tiene una demanda diaria que se
distribuye segn una ley normal de media 200 unidades y desviacin tpica 30, y se vende a 5
euros la unidad. El segundo producto tiene una demanda diaria de 60 unidades, con una
desviacin tpica de 4 unidades, y se vende a 20 euros la unidad.
a) Halla la probabilidad de que un da, las ventas de ambos productos superen los
2.370 euros.
b) Halla la probabilidad de que un da las ventas del primer producto sean superiores a
las del segundo producto.
- 32 -
admite
que
la
aproximacin
es
aceptable
cuando
De ellas se observa que el mejor ajuste se da para la binomial B(30, 0.5), cuyo ajuste a
la normal de media = 30 $ 0.5 = 15 y desviacion tipica = 30 $ 0.5 $ 0.5 = 2, 72 es casi
perfecto.
Ejercicios
- 33 -
1. El cinco por ciento de las bombillas fabricadas salen defectuosas. Si se extrae una muestra
de 2.000 bombillas, halla la probabilidad de que dicha muestra contenga ms de 120
bombillas defectuosas.
- 34 -
- 35 -