Anda di halaman 1dari 17

TEMA II. VARIABLES ALEATORIAS.

DISTRIBUCIN
BINOMIAL Y NORMAL
I.- Variable aleatoria. Concepto.
Antes de definir el concepto de varibale aleatoria, veamos algunos ejemplos (ya ests
empezando a comprobar que en estadstica sin ejemplos andamos algo perdidos).
Ejemplos:

Supongamos el experimento consistente en el lanzamiento de tres monedas, y consideremos la


variable x = numero de caras del experimento. Los valores que puede tomar la variable son
x = 0, 1, 2, 3 .

Sea ahora el experimento consistente en lanzar dos dados y consideremos la varibale

x = suma de la cara superior de los dos dados .


x = 2, 3, 4, 5, 6, 7, 8, , 9, 10, 11, 12 .

Los

valores

posible

son:

Elijamos un alumno de la clase y preguntmonos por la varibable x = {tiempo invertido por el


alumno en cubrir el trayecto que va desde su casa al instituto}. En este caso la variable x no puede
tomar valores discretos, ya que el rango de tiempos es infinito y la distancia entre un tiempo dado y
el siguiente es infinitamente prxima y por tanto no podemos numerarlos.

Pues bien, todas las variables de los ejemplos anteriores son variables aleatorias. As,
Una variable aleatoria es una funcin x que hace corresponder un
nmero real a cada resultado de un experimento aleatorio.
Tambin de los ejemplos anteriores ya habrs podido deducir que existen dos tipos de
variables aleatorias:
 Discretas, cuando la variable aleatoria toma como valores nmeros enteros.
 Continua, cuando la variable aleatoria puede tomar cualquier valor dentro de un
intervalo y no es posible asignar un valor entero a un resultado cualquiera del
experimento.
A los valores que puede tomar una variable aleatoria se le llama recorrido. En el caso
de las tres monedas, por ejemplo, el recorrido son los nmeros 0, 1, 2, 3 . En el caso del
tiempo invertido por el alumno sera el intervalo t 1, t 2 entre el mnimo valor y el mximo.
Observacin. Hay variables discretas que pueden tomar infinitos valores, pero
siempre es posible contarlos o numerarlos. Por ejemplo, en el lanzamiento de un dado,
podemos preguntarnos por el la variable x = numero de lanzamientos hasta que salga un . En
principio, el nmero de lanzamientos hasta que salga el resultado esperado puede infinito,
pero es posible contarlos. Es, por tanto, una variable discreta.
- 19 -

II. Variables discretas. Funcin de Probabilidad y Funcin de


Distribucin.
Lo que viene a continuacin es vlido slo para variables discretas. Y referidas a stas
pueden definirse dos funciones que con posterioridad nos servirn para calcular parmetros
tales como la media y la desviacin tpica de una variable aleatoria. Tales funciones son: la
funcin de probabilidad y la funcin de distribucin.
Se define funcin de probabilidad, f(x) , de una variable
aleatoria discreta x a toda funcin que asocia a cada resultado del
experimento su probabilidad de ocurrencia. Es decir:
f(x) = p(x)
Nuevamente confiemos en los ejemplos para entender las ideas.
Supongamos el lanzamiento de las tres monedas y la variable x = numero
de la variable x es x = 0, 1, 2, 3 y los resultados posibles del experimento son :

de caras . El recorrido

E = CCC, CCX, CXC, CXX, XCC, XCX, XXXC, XXX .


Si llamamos f(x) a probabilidad de que el nmero de caras sea
Laplace, es fcil ver que estas probabilidades son:

x , entonces, aplicando la regla de

f(1) = p(1 cara ) = 38


f(3) = p(3 caras ) = 1
8

f(0) = p(0 caras ) = 1


8
f(2) = p(2 caras ) = 38

Supongamos ahora que un tirador tira dos veces seguidas a una diana y sabemos que la probabilidad de
que acierte de cada vez es de 0.6. Consideremos para este experimento la variable aleatoria
x = numero de aciertos del tirador en los dos disparos, cuyo recorrido es x = 0, 1, 2
Sea ahora f(x) la funcin que asocia a cada valor de la variable su probabilidad de ocurrencia. Veamos,
diagrama de arbol:
1er disparo

2 disparo
0,6

0,6
0,4
0,6
0,4
0,4

Acierto
Fallo
f(0) = p(0 aciertos ) = 0.4 2 = 0.16
- 20 -

f(1) = p(1 acierto ) = 2 $ 0.6 $ 0.4 = 0.48


f(2) = p(2 aciertos ) = 0.6 2 = 0.36
En ambos casos la funcin f(x) es la funcin de probabilidad asociada a la variable x para cada uno de
los experimentos aleatorios.
Grficamente:

4/8

0,48

3/8

0,36

2/8
0,16

1/8
0

caras

aciertos

Se define funcin de distribucin F(x) de una variable aleatoria


discreta x a toda funcin que asocia a cada valor de la variable
su probabilidad de que sta tome todos los valores menores o
iguales que x. Es decir:
F(x) = p(todos los valores menores o iguales que x
Para el caso de las tres monedas, y siendo la variable aleatoria x =
toma los valores:

numero de caras , esta funcin

F(0) = p(x [ 0 ) = 1/8


F(1) = p(x [ 1) = p(0) + p(1) = 1/8 + 3/8 = 4/8
F(2) = p(x [ 2) = p(0) + p(1) + p(2) = 1/8 + 3/8 + 3/8 = 7/8
F(3) = p(x [ 3 ) = p(0 ) + p1) + p(2) + p(3) = 1/8 + 3/8 + 3/8 + 1/8 = 8/8 = 1
Para el caso del tirador, y siendo x =

numero de aciertos , la funcin F(x) queda:

F(0) = p(x [ 0) = 0.16


F(1) = p(x [ 1 ) = p(0) + p(1) = 0.16 + 0.48 = 0.64
F(2) = p(x [ 2 ) = p(0) + p(1) + p(2) = 0.16 + 0.48 + 0.36 = 1
Por ltimo, cuando para una variable aleatoria discreta hemos obtenido su funcin de
probabilidad y su funcin de distribucin se dice que ha quedado determinada su distribucin
de probabilidad.
Ejercicios:
- 21 -

Determinar la distribucin de probabilidad (funcin de probabilidad y funcin de


distribucin) en cada uno de los siguientes casos. Representar mediante un diagrama de barras
y un polgono de frecuencias los resultados obtenidos.
(a) En una urna hay siete bolas, de las cuales tres son blancas y cuatro negras. Se
extraen tres bolas sin reemplazamiento y consideramos la variable aleatoria x = nmero de
bolas negras obtenidas entre las tres extradas
(b) Lanzamos dos dados y analizamos la variable aleatoria x = suma de las
puntuaciones de los dos dados.
(c) En el lanzamiento de 5 chichetas idnticas sea x = nmero de ellas que quedaron
con la punta hacia abajo. Supongamos que
p(

)=0.70

p(

) =0.30

(d) Supongamos un dado de quinielas (tres unos, dos equis y un dos) y estudiamos la
variable aleatoria x = nmero de veces que se lanza el dado hasta obtener una equis

III. Parmetros estadsticos: Media, Varianza y Desviacin Tpica


En primer lugar, se entiende por parmetro estadstico a toda cantidad que puede
obtenerse de los datos de una distribucin y que son representativos de alguna propiedad de la
misma. Muchos de estos parmetros te suenan ya: media, moda, mediana, varianza ,
desviacin tpica; de otros, en cambio, seguramente no has oido hablar: momentos ordinarios
y centrales, coeficientes de asimetra, de Kurtosis. Pues bien, de todos los parmetros que
pueden determinarse de una distribucin, dos de ellos resumen una gran parte de la
informacin necesaria para su interpretacin. Son: su media, como una medida del valor
central de los datos, y su desviacin tpica, como medida de lo dispersos que estn stos
respecto del valor medio.
Por cierto, lo de media, varianza y desviacin tpica, tal vez, te suene raro aqu. Estos
trminos suelen asociarse con la estadstica descriptiva: media de altura, de pesos, de
calificaciones. Vers, sin embargo, que estos conceptos aplicados a un conjunto de datos y a
una distribucin estadstica estn ligados de manera muy cercana.
Para mostrarlo, un ejemplo:
Supongamos que hacemos un estudio sobre el nmero de hijos de 15 familias, obtenendose los
resultados de la tabla:

x i =numero de hijos
n i =numero de familias

0
5

1
6

2
2

3
1

4
1

Si llamamos N al nmero total de datos (en nuestro caso 15 ), el clculo del nmero medio de hijos de
las 15 familias se realiza, como sabes, de la siguiente manera:

- 22 -

x =

x i $ n i 0 $ 5 + 1 $ 6 + 2 $ 2 + 3 $ 1 + 4 $ 1 17
=
= 1, 13 hijos, de media
N =
15
15

Sin embargo, el clculo de la media puede verse tambin de otro modo. Supongamos que definimos la
variable aleatoria

x =numero de hijos de una de las familias del estudio


.
El recorrido de esta variable es x =
la tabla toma los valores:

0, 1, 2, 3, 4 . y su funcin de probabilidad, segn los datos de

f(0) = p(0 hijos ) = 5/15 = 0.33


f(1) = p(1 hijo ) = 6/15 = 0.40
f(2 ) = p(2 hijos ) = 2/15 = 0.13
f(3) = p(3 hijos ) = 1/15 = 0.07
f(4) = p(4 hijos ) = 1/15 = 0.07
Ahora, la expresin que nos da el nmero medio de hijos puede expresarse en trminos de
probabilidad, ya que:

x =

xi $ ni
ni
( )
N =  x i $ N =  x i $ f x i =  x i $ p(x i ) = 1, 13 hijos, de media

Resumiendo, la media de un conjunto de datos y de una distribucin de probabilidad tiene un


significado equivalente y su valor es el mismo.

As:
Llamamos media o esperanza matemtica de una distribucin
estadstica a la suma de los productos de cada valor de la
variable por su probabilidad de ocurrencia. Se denota por la letra
griega .
 =  x i $ p(x i )

(1)

Lo de esperanza matemtica proviene de los juegos de azar, ya que la media de una


distribucin estadstica tambin puede interpretarse como el promedio de ganancia esperado
por un jugador al apostar.
Llamamos varianza,  2 , de una distribucin estadstica al
valor obtenido a travs de la frmula
 2 = (x i ) 2 $ p(x i )

(2)

O en su versin ms prctica para el clculo -que no


demostraremos-:
 2 =  x 2i $ p(x i )  2
- 23 -

Por ltimo
Llamamos desviacin tpica de una distribucin estadstica, , a
la raz cuadrada de la varianza:
 = varianza =  x 2i $ p(x i )  2
Sobre la media nada que decir. La varianza, en cambio, merece un comentario.
Observa que su clculo depende del valor de la diferencia al cuadrado entre cada valor de la
variable y la media de la distribucin. As pues, cuanto ms alejados estn los elementos
individuales de la media mayor es la varianza. Por tanto, esta es una medida de lo dispersos
que estn los datos respecto del valor medio. La varianza, sin embargo, presenta un problema
de interpretacin, ya que se mide en cm 2 , segundos 2 , hijos 2 , etc Para evitar esto y poder dar
los resultados en trminos de cm, segundos, hijos, etc se introduce la desviacin tpica como
la raz cuadrada de la varianza. As, todo cuadra.
Ejercicios.
1. Calcular la media y la varianza de las distribuciones de probabilidad de ejercicio del
apartado anterior. Interpretar los resultados.

IV. Distribucin Binomial.


En ejercicios anteriores ya has descrito casos de distribucin de probabilidad de
variables discretas. Algunas de estas distribuciones, por su importancia, tienen nombres
propios -Distribucin dicotmica, binomial, geomtrica, hipergeomtrica, de PoissonPor ejemplo, la distribucin del ejercicio (d) del apartado II, en la que nos preguntamos por el nmero
de veces que debemos realizar un experimento hasta obtener el resultado esperado corresponde al tipo
geomtrica.

Pues bien, probablemente sea la distribucin binomial, la que por su relacin con el
estudio de las proporciones (proporcin de jvenes que acceden a la universidad frente a los
que no, proporcin de personas que en vacaciones viajan al extranjero frente a las que no,
proporcin de los que invierten en bolsa frente a los que no, etc) tiene mayor importancia en
el mbito social.
Una distribucin de probabilidad se ajusta a los parmetros de una binomial si
verifica los siguientes requisistos:


El experimento consiste en un nmero determinado de ensayos idnticos e independientes,


n, cada una de ellos con slo dos resultados posibles (xito o fracaso, a favor o en contra,
cara o cruz).

La probabilidad de xito se designa por p y la de fracaso por q. Y dadas sus caractersticas,


se verifica
- 24 -

p+q=1oq=1p


La variable aleatoria es x = numero de exitos en los n ensayos

Pues bien, su funcin de probabilidad, es decir, la que da la probabilidad de obtener


x xitos de n ensayos viene determinada por la siguiente frmula:
n x nx
f(x) = p(x exitos de n ensayos) =
p $q
x
n
n!
donde el trmino
es el llamadao nmero combinatorio.
= (
x
x!
n
x )!

El nmero medio de xitos, , y la varianza y desviacin tpica, , se calculan


aplicando las frmula (1) y (2) -que omitiremos, por resultar los clculos algo engorrosos- ,
llegndose a los siguientes resultados:
Media
Varianza
Desv. tpica

=n$p
2 = n $ p $ q
= n$p$q

Abreviadamente, a las distribuciones binomiales se las designa por B(n, p).


Una observacin muy importante es que en cada uno de los ensayos de una
distribucin binomial la probabilidad de xito y de fracaso no debe cambiar. Por ejemplo, si
extraemos 10 estudiantes al azar de una universidad para preguntarles si utilizan el comedor
universitario, siendo esta proporcin, antes de extraer ningn estudiante, del 35 % que s
(xito) y del 65 % que no (fracaso) y su respuesta ha sido afirmativa, entonces la proporcin
de estudiantes de esa universidad que s y que no utilizan el comedor universitario ha variado
ligeramente como consecuencia de la extraccin de un estudiante. Siendo rigurosos y, para
que pueda hacerse el estudio a travs de un distribucin binomial, el individuo extrado debe
ser reinsertado nuevamente a la poblacin para que tenga la posibilidad de ser elegido
nuevamente!... No obstante, cuando la poblacin es muy grande, como es el caso que nos
ocupa, la variacin que se produce al extraer un nmero reducido de individuos es tan
pequea que apenas tiene incidencia en los resultados que se obtienen y puede omitirse este
rebuscado procedimiento. Sacamos a los 10 individuos, y ya est.
Ejercicios.
1. Indica si cada una de las siguientes situaciones se ajustan a distribuciones binomiales...
Descrbelas y calcula en cada caso su valor medio y su desviacin tpica. Interpreta los
resultados.
(a) Un cazador acierta en el 65 % de los disparos que realiza. Definimos la variable
aleatoria x = nmero de aciertos en los prximos cinco disparos.
(b) Un medicamento contra la gripe es efectivo en 8 de cada 10 enfermos. Definimos la
variable aleatoria x = nmero de enfermos curados en un grupo de 10 enfermos
- 25 -

(c) Consideremos xito obtener cara al lanzar una moneda. Lanzamos la moneda 7 veces
y consideramos la variable aleatoria: x = nmero de caras obtenidas en los 7
lanzamientos
(d) En una urna en la que hay 7 bolas rojas y 5 negras, extraemos de una vez 3 bolas y
consideramos la variable aleatoria x = nmero de bolas rojas de las 3 extradas
(e) La probabilidad de nacimiento de nios varones en Espaa es del 51,7 %, mientras
que la de nias es del 48,3 %. Consideramos la variable aleatoria x = nmero de
varones en una familia con 5 hijos
(f) En la primera evaluacin -sin contar la recuperacin- aprobasteis la asignatura de
matemticas 12 alumnos de un total de 22 que estis en clase. Sea la variable aleatoria
x = nmero de alumnos que aprobaron que las matemticas de un grupo de 4 alumnos.
2.-

a) Cul es la probabilidad de que el cazador del ejercicio (a) cace al menos una pieza si
un da efectu cinco disparos?
b) Y de que cace exactamente 2 piezas? Y ninguna? -que tambin puede ser-.

3.-

a) Cul es la probabilidad de que un grupo de diez enfermos del ejercicio (b) a los que
se les suministr el medicamento todos estn curados?
b) Cul es la probabilidad de que estn curados ms de la mitad de los enfermos?

4.-

a) Cuntos nios y nias (ejercicio (e)) se espera habr entre los 1500 bebs que
nacieron en cierta ciudad el ao pasado?
b) Cul es la probabilidad de que en una familia con cinco hijos slo haya nias?

5.- Y finalmente...
a) Cul es la probabilidad de que cuatro de vosotros elegidos al azar por Adolfo
hayis aprobado todos las matemticas en la primera evaluacin? Y al menos uno?
b) Podras hacer previsiones para la segunda evaluacin con los datos disponibles?

V. Variables estadsticas continuas. Funcin Densidad.


Al principio del tema, al introducir el concepto de variable aleatoria, distinguiamos
entre variable discreta y continua. Hasta ahora slo hemos tratado las primeras, las que slo
pueden tomar valores discretos (generalmente nmeros enteros), pero no ha aparecido ninguna
que pueda tomar cualquier valor dentro de un rango. Y esto es porque el tratamiento para este
tipo de variables -tiempos, pesos, alturas, cantidades, etc- es completamente distinto.
Un nuevo ejemplo para ilustrar lo dicho:
Supongamos nuevamente a nuestro alumno, compaero y amigo que con gran perseverancia mide y
anota cada dia el tiempo que invierte en el trayecto desde su casa al instituo. Fruto de sus anotaciones observa
que este tiempo se encuentra comprendido entre 7 y 12 minutos, es decir en el intervalo 7, 12 .Ahora bien,
cuntos tiempos son posibles en ese intervalo?... Te habrs percatado de que la respuesta es: infinitos!. As
pues, a priori, la probabilidad de que se de uno solo de ellos es cero (aplica la regla de Laplace: divide tu
resultado favorable entre los infinitos posibles y observa que el resultado es cero). Por tanto para la variable

- 26 -

aleatoria x = tiempo invertido en realizar el trayecto desde casa al instituto no es posible construir una funcin
de probabilidad, puesto que la probabilidad de que ocurra cada uno de los valores posibles de la variable es
siempre nula. Pensars con razn que algunos de los resultados s ocurren, los que tiene anotados en su cuaderno
de tiempos. Y esto es cierto, pero a priori, incluso para esos tiempos la probabilidad de ocurrencia es cero -no me
preguntes, entonces, cmo ocurrieron, podriamos entrar en una interminable discusin sobre el infinito, tal vez
interesante, pero de la misma utilidad que los claustros y reuniones de tutores de este instituto: ninguna, y con el
pernicioso efecto secundario de agrandar el ego de quienes las presiden y disminuir en la misma proporcin su
capacidad de sntesis-.

Cmo obtener entonces los parmetros que caracterizan la distribucin, media y


desviacin tpica, si no disponemos de una funcin de probabilidad a travs de la cul realizar
los clculos?
Nuestro amigo diria: fcil!, sumo todos los tiempos que tengo anotados , los divido por el nmero de
anotaciones y ya tengo la media. Y para la desviacin tpica, elevo al cuadrado cada dato, los sumo, divido el
resultado entre el nmero de anotaciones y le resto el cuadrado de la media; hallo su raz cuadrada, y ya est. es
decir aplico la frmula:
=

 x 2i $ n i  2

n i en todos los casos vale uno, pues es muy raro que se repita un resultado.

Bien, esta forma de proceder es la correcta y sin duda es la nica que conduce a los
verdaderos resultados de los parmetros media y desviacin tpica. Pero presenta dos
problemas:


Si el nmero de anotaciones fuera muy grande (como suele ocurrir cuando se tratan
problemas reales) el procedimiento no es operativo (imagina por ejemplo sumar las alturas
de todos los habitantes de un pais y dividir por el nmero de habitantes para determinar su
altura media).

Aunque fuera posible determinar sus parmetros, media y desviacin tpica, no podramos
utilizarlos para hacer predicciones ni hiptesis sobre sus posibles cambios en el tiempo
(este ser el tema del prximo captulo de la estadstica)
As pues se hace necesario construir algo parecido a una funcin de probabilidad.

Razonamos de la siguiente manera: puesto que para un resultado cualquiera de la


variable aleatoria existen infinitos que estn muy prximos a l, no tiene sentido tratarlos
como si fueran distintos y as, lo ms razonable es meter dentro de un intervalo de la variable
todos aquellos cuyos valores se encuentran entre sus lmites. Esto es un histograma.
Por ejemplo, puede que para nuestro compaero y alumno no represente mucha diferencia tardar
medio minuto ms o menos en realizar el trayecto desde su casa al instituto, as es que decide partir el intervalo
que va de los 7 a los 12 minutos en subintervalos de longitud medio minuto y contar el nmero de veces cuyos
tiempos se encuentran en los intervalos construidos. Como valor representativo de cada intervalo puede tomar su
valor central. Supongamos que el resultado es el siguiente:

- 27 -

7,5

8,5

9,5 10 10,5 11 11,5 12

La lnea que une las barras verticales se llama polgono de frecuencias y como vers ms adelante
tiene su importancia.

El proceso iniciado puede acabar aqu o continuar. Si el nmero de datos es muy


grande ello nos permite estrechar los intervalos. Podemos, adems, sustituir la frecuencia
absoluta en el eje vertical por la relativa o, su equivalente, por la probabilidad de que ocurra
un resultado en un intervalo determinado.
f

Observar que f en el eje vertical no hace referencia a la probabilidad de un resultado


concreto, como ocurria para variable discreta, -esta probabilidad como se dijo al principio es
cero- sino a la probabilidad por intervalo de la variable. Se trata pues de una densidad de
probabilidad, de la misma manera que hablamos de habitantes por km 2 de un pas, de kg de
grano por hectrea de una explotacin agrcola o de nacimientos por cada 1000 habitantes
como ndice de crecimiento. Aqu se habla de probababilidad por amplitud de intervalo.
Cuando el nmero de intervalos es muy grande, y por tanto muy estrechos, el
polgono de frecuencias adopta la forma de una curva que representa en cada punto la altura
de la barra correspondiente. Si quitamos estas barras, que ya no son necesarias queda una
curva como la siguiente:

- 28 -

A esta y otras curvas obtenidas de esta manera se las llama funciones densidad para
variables continuas, y como tales funciones se las denota por f(x) .
Una aclaracin ya mencionada. Las funciones dendisad no representan la
probabilidad de ocurrencia de un valor concreto de la variable, como ya se ha mencionado
esta probabilidad es cero, pero a partir de su forma es posible determinar la probabilidad de
que un valor se encuentre entre dos dados, puesto que todas las funciones densidad cumplen
las siguientes dos propiedades:


El rea bajo la curva y el eje X entre dos valores x 1 y x 2 nos da la probabilidad de que la
variable se encuentre entre x 1 y x 2 .
probabilidad de x entre x 1 y x 2 = p(x 1 [ x [ x 2 ) = A

El rea total bajo la curva entre los extremos de la funcin es 1.

VI. Distribucin Normal.


Aunque existen funciones densidad de muy distintas formas, lo cierto es que muchos
fenmenos sociales acaban adoptando la forma de funciones tericas conocidas. Esto es una ventaja,
pues al ser conocidas es posible determinar sus parmetros, cuantificar probabilidades y hacer
predicciones.
Entre estas funciones densidad cuya frmula terica es conocida, la ms importante de todas
es la llamada distribucin Normal o Campana de Gauss. Su importancia se debe no slo al gran
nmero de fenmenos reales para los que es posible tomar como modelo esta distribucin
(especialmente cualquier variable de carcter cuantitativo de casi todas las grandes poblaciones) sino
al hecho de que otras distribuciones de uso frecuente bajo ciertas condiciones tienden a distribuirse
segn una normal.
Veamos sus caractersticas ms importantes:

Su forma es la de una campana en la que el valor medio de la varible, , ocupa su valor central.
Para este valor la funcin toma el mximo valor.  es la desviacin tpica de la variable. Las dos
colas de la funcin se aproximan a cero (eje X) cuanto ms nos alejamos del valor central.

- 29 -




x
12 
1
(Otra vez el nmero e = 2, 718...)
e
Su frmula matemtica es f(x) =
 2
El rea total bajo su curva es 1 -como para cualquier funcin densidad-, pero adems se
verifica que:

En el intervalo  ,  +  se encuentra el 68,4 % de los datos.


En el intervalo  2,  + 2 se encuentran el 95,4 % de los datos
En el intervalo  3,  + 3 se encuentran el 99,7 % de los datos.
Abreviadamente a las distribuciones normales se las designa por N ,  .
Bien. Y para qu sirve?... Vamos a ello.
Supongamos que hacemos un estudio sobre el peso de los nios recin nacidos, y que
dichos pesos se distribuyen segn una normal de media y desviacin tpica  (es lgico que
as sea: habr un nmero muy grande de nios cuyos pesos estn prximos al valor medio y a
medida que nos alejamos de ese valor, tanto por exceso como por defecto el nmero ir
disminuyendo). Pues bien, a partir de la curva podemos asegurar que el 68,4 % de los recin
nacidos tendr un peso comprendido entre   y  + , y que, por ejemplo, un nio cuyo
peso haya sido superior a  + 3 es anormalmente gordo, puesto que ms del 99,7 % de los
nios dan un peso inferior a esa cantidad. Ms an -y esto es lo ms importante- dado el peso
de un nio, podemos calcular la proporcin de ellos con un peso superior -inferior- al
obtenido: para ello, basta dividir el rea que queda por encima -por debajo- de ese peso entre
el rea total de la curva, que como se ha dicho es 1. Pero esto no podemos hacerlo
directamente, antes hay que tipificar la variable.
Un nio da un peso de 4,200 kg, el valor medio establecido en estudios previos fue de
3,750 kg () y la desviacin tpica de 0,420 kg (), ajustndose los datos a una distribucin
normal N(3, 750; 0, 420 ). Son muchos los nios con un peso igual o superior a 4,200 kg?
Para saberlo situamos este valor en la curva y sealamos el rea que queda a su derecha. La
razn entre esta rea y la total bajo la curva -que es 1- es precisamente esa proporcin.

- 30 -

Sin embargo, estos clculos no pueden hacerse sobre la distribucin de los recin
nacidos pues desconocemos el rea a la derecha del valor x = 4, 200 kg. Dont worry!, existe
una distribucin normal de media  = 0 y  = 1, idntica a cualquier otra distribucin normal
pero cuyas reas estn calculadas y recogidas en una tabla para cualquier valor de x . As es
que lo nico que debemos hacer es determinar sobre esa distribucin N(0, 1), el valor
equivalente a nuestro 4,200 kg, y buscar en la tabla el valor del rea correspondiente (hay
unas reglas de clculo que vistes el ao pasado y que repasaremos este ao). A este proceso se
le denomina tipificar la variable.
Si x = 4, 200 kg es el valor que queremos tipificar y llamamos z al valor de su
equivalente en la distribucin N(0, 1), entonces
z=
nos da el valor de: z =

x


(frmula que tipifica a x )

4, 200 3, 750
= 1, 07
0, 420

el cul, buscado en la tabla, y aplicando las reglas de clculo da una proporcin de:
p(z m 1, 07) = 1 0.8577 = 0.1423
Es decir, el 14,23 % de los nios tendrn un peso igual o superior a 4,200 kg

- 31 -

Ejercicios.
1. Las puntuaciones obtenidas en un test de aptitudes aplicado cada ao a estudiantes
universitarios siguen una distribucin N(500, 100)
a) Qu porcentaje de estudiantes universitarios se espera que obtengan puntuaciones
entre 500 y 675?
b) Qu porcentaje de etudiantes se espera que logran puntuaciones superiores a 630?
c) Qu probabilidad hay de que un estudiante elgido al azar tenga una puntuacin
superior a 700?
2. Supongamos que la altura de las personas con edades comprendidas entre 20 y 30 aos se
distribuye normalmente con media 1,65 metros y desviacin tpica 0,15 metros.
Si consideramos que una persona es alta si mide ms de 1,80 metros, qu nmero de
personas altas se espera que haya en un grupo de 2.000 individuos con edades
comprendidas entre los 20 y 30 aos?
3. Si se multiplica una variable con distribucin normal por una constante, se obtiene otra
variable con distribucin normal, cuyas medias y desviacin tpica quedan multiplicadas por
dicha constante.
x d N ,  entonces kx d N(k, k)
Segn esto, calcula la probabilidad que tiene una empresa de ingresar por ventas ms de
20.000 euros, cuyo producto tiene una demanda que sigue una distribucin normal
N(5.000, 250) si el precio de venta al pblco de cada unidad es de 3,6 euros.
4. Si se suman o restan dos variables aleatorias que presentan distribucin normal, se obtiene
otra variable aleatoria con distribucin normal cuya media es la suma o resta de las medias y
cuya varianza es la suma de las varianzas:
x d N  1 ,  1

x + y d N( 1 !  2 ,  21 +  22 )

y d N  2 ,  2
Una tienda vende dos productos. El primero de ellos tiene una demanda diaria que se
distribuye segn una ley normal de media 200 unidades y desviacin tpica 30, y se vende a 5
euros la unidad. El segundo producto tiene una demanda diaria de 60 unidades, con una
desviacin tpica de 4 unidades, y se vende a 20 euros la unidad.
a) Halla la probabilidad de que un da, las ventas de ambos productos superen los
2.370 euros.
b) Halla la probabilidad de que un da las ventas del primer producto sean superiores a
las del segundo producto.

- 32 -

VII. Convergencia de la distribucin binomial hacia la normal


Son muchas las distribuciones de probabilidad de variable discreta en las que al
aumentar el nmero de ensayos se comportan como una distribucin normal. As, se puede
comprobar que las distribuciones binomiales B(n, p) si n es los suficientemente grande y p no
est prximo a 0 ni a 1, se aproximan a una normal de media  = np y desviacin tpica
 = npq . Es decir:
B n, p d N np, npq
Generalmente se
n m 30 , np m 5 y np m 5

admite

que

la

aproximacin

es

aceptable

cuando

La aproximacin es tanto mejor cuanto mayor es el nmero de pruebas n y cuanto ms


prximos a 0.5 sea el valor de la probabilidad p.
En las grficas siguientes se muestra esta aproximacin para algunas binomiales. Las
lineas verticales son los resultados de la distribucin binomial y la curva continua la
aproximacin de la correspondiente distribucin normal.

De ellas se observa que el mejor ajuste se da para la binomial B(30, 0.5), cuyo ajuste a
la normal de media  = 30 $ 0.5 = 15 y desviacion tipica  = 30 $ 0.5 $ 0.5 = 2, 72 es casi
perfecto.

Ejercicios
- 33 -

1. El cinco por ciento de las bombillas fabricadas salen defectuosas. Si se extrae una muestra
de 2.000 bombillas, halla la probabilidad de que dicha muestra contenga ms de 120
bombillas defectuosas.

2. Durante cierta epidemia de gripe enferma el 20 % de la poblacin. En un centro escolar con


350 alumnos,
a) Cul es la probabilidad de haya exactamente 50 alumnos que pasen la gripe?
b) Y la probabilidad de que haya al menos 40 alumnos?
c) Y la probabilidad de que haya entre 40 y 60 alumnos?
3. En un pas, la tasa de paro de la poblacin es de 8,5 %. Si se toma una muestra de 50
individuos, cul es la probabilidad de que en la muestra haya un nmero de parados menor o
igual que 4? Efecta los clculos mediante la distribucin binomial y aproximando mediante
la normal. Compara los resultados.
En la misma muestra cul es la probabilidad de que el nmero de parados sea superior a 10.

- 34 -

- 35 -

Anda mungkin juga menyukai