Anda di halaman 1dari 23

LA DISTRIBUCIN NORMAL (O GAUSSIANA) EN LA ESTADSTICA

Ing. Rubn Daro Estrella Snchez, MBA


Cavaliere dellordine al Merito della Repubblica Italiana
Ingeniero de Sistemas, Administrador, Matemtico, Telogo y Maestro

ministerio@atalayadecristo.org / rubenestrella@atalayadecristo.org
www.atalayadecristo.org

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

La distribucin normal es una distribucin de datos continuos(*) (no


discretos) que produce una curva simtrica en forma de campana.
La distribucin gaussiana fue presentada por Karl Friedrich Gauss
(1777-1855) en el 1812.

La campana de Gauss o curva de distribucin normal, curva de


probabilidad normal; se caracteriza por:
- Es unimodal.
- Es simtrica (la simetra es perfecta).
- La mitad izquierda de su histograma es aproximadamente una
imagen especular de su mitad derecha.
- La asimetra de la distribucin es cero.
- Las colas de la curva se aproximan ms, pero nunca tocan, el eje
horizontal.
- La media, la mediana y la moda son iguales.

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

- La mitad de las observaciones esta por encima de la media y la mitad


esta por debajo.
- Si las observaciones estn altamente dispersas, la curva en forma de
campana se aplanara y se esparcir.

(*) Variables continuas:


Son las que pueden tomar cualquier valor dentro de un intervalo
dado. Por muy prxima que puedan estar dos observaciones, si el
instrumento de medida tiene la precisin suficiente siempre puede haber una
tercera observacin que caiga entre las dos primeras. Los valores de una
variable continua proceden en general de mediciones, por ejemplo las
cantidades de leche que las vacas producen son datos continuos porque son
mediciones que pueden asumir cualquier valor dentro de un intervalo
continuo.
Se pueden obtener de un numero infinito de posibles valores que
pueden asociarse a puntos de una escala continua, de tal manera que no
haya huecos ni interrupciones.
La Regla Emprica o Regla 68-95-99.
Esta regla solo aplica a un conjunto de datos cuya distribucin tiene
aproximadamente forma de campana. Esta afirma que:
- Cerca del 68% de todos los puntajes u observaciones queda a menos
de una desviacin estndar de la media.
- Cerca del 95% de todos los puntajes u observaciones queda a menos
de dos desviaciones estndar de la media.
- Cerca del 99.7% de todos los puntajes u observaciones que a menos
de tres desviaciones estndar de la media.

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Esta funcin llamada densidad de frecuencias. Tiene dos propiedades


caractersticas:
f ( x) 1

f ( x)dx = 1

Tambin si a c d b, entonces la integral

f ( x)dx ,

da la proporcin del nmero de veces que la medicin produce un valor


entre c y de respecto al nmero total de mediciones, es decir, la frecuencia
relativa del resultado c x d . de la misma manera, f(x) dx puede
considerarse como la proporcin de resultados que estn entre x y x + dx.
Desde este punto de vista, la integral anterior puede interpretarse como la
probabilidad de que una medicin elegida al azar tenga un resultado entre c
y d, y f(x) se llama entonces funcin densidad de probabilidad.

Para adquirir una mejor percepcin de estos conceptos, pensemos por un


momento en f(x) como la funcin densidad de masa de una varilla de masa
total 1 que se extiende a los largo del eje x entre x = a y x = b. Entonces
f(x)dx es el elemento masa, x f(x) dx es el momento de este elemento de
masa alrededor del origen y la integral

x' = xf ( x)dx
a

es el centro de masas de la varilla dado que

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

f ( x)dx = 1 .

Tambin la integral

I = ( x x' ) 2 f ( x)dx
a

es el momento de inercia de la varilla alrededor de la recta x = x como eje. Sabemos por


nuestra experiencia que esta cantidad es pequea si la mayor parte de los elementos de
masa estn prximos al eje, y es grande en caso contrario.
En el caso de una densidad de probabilidad f(x) con las propiedades indicadas
anteriormente, la integral correspondiente a,

m = xf ( x)dx
a

se llama media. Como sabemos, la media es el punto sobre el eje x tal que la regin bajo
la grfica de la densidad de probabilidad, si estuviera hecha de cartulina y fuera colocada
en posicin horizontal, se equilibrara sobre la recta x = m.

La raz cuadrada de la integral correspondiente a,

I = ( x x' ) 2 f ( x)dx
a

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

( x x' )

f ( x)dx

se llama la desviacin tpica (o desviacin estndar). Si es pequeo, los resultados de


nuestras mediciones se agrupan alrededor de la media m, y si fuese grande, entonces
una porcin significativa de estos resultados estn lejos de m.
En la teora matemtica general de la probabilidad, es habitual considerar densidades de
probabilidad que se definen para todos los x, de modo que no se establecen limitaciones
sobre los posibles resultados de la medicin o el experimento que se considere. Una
densidad de probabilidad se define entonces como cualquier funcin que satisface las
condiciones:

f ( x) 1

f ( x)dx = 1

y la media y la desviacin tpica se define mediante:

m = xf ( x)dx

( x x' ) f ( x)dx
2

Varias integrales impropias importantes.


Para entender la distribucin normal debemos en primer lugar considerar
varias propiedades de la funcin:

y = f ( x) = e

x2

cuya grfica tiene forma de campana.

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Comenzaremos sealando que esta funcin es par, lo que significa que


f(-x)=f(x), de modo que la grfica es simtrica respecto al eje y. Tambin
los valores de la funcin son todos positivos, tienen un mximo y = 1 en
x=0, y la grfica tiene dos puntos de inflexin en x = 2 . Es claro que

lim x e

x2

=0

porque e x = 1 / e x ye x cuandox . Tambin


2

lim x e
porque para

x2

=0

x > 1tenemos x e x = x e x < xe x , y sabemos que


2

2 x2

lim x x e

= lim x ze z = 0 .

Es un hecho destacable que el rea bajo la curva

y = f ( x) = e
tiene el valor finito

x2

x2

dx =

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

porque

x2

1
dx =

La mejor manera de demostrar esta asombrosa frmula que conecta e y


consiste en usar la integracin doble en coordenadas polares.
A continuacin, usamos la definicin de integral impropia para escribir

xe

x2

2
1 2 t
dx = lim t xe x dx = lim t e x
2
0
0

1 1 2 1
= lim t e t = .
2 2
2

Anlogamente tenemos

x2

1
dx =
2

de modo que combinando estas dos integrales obtenemos

x2

dx = 0

Finalmente una integracin por parte con u = x, dv = e x dx da


2

2 x2

xe

1 x2
1 x2
dx = e + e dx
2
2

de modo que

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

2 x

xe

1 t
1 x2
dx = te + e dx
2
2
0
2

tenemos ahora

2 x

xe

1
x2
dx = limt e dx
20
t

1 t 2
1
x2
= lim t ( te ) + lim t e dx
2
20
Dado que el integrado de x 2e x es una funcin par, concluimos que
2

1
1
x2
= 0 + e dx =

20
4

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

LA CURVA NORMAL

Sea m () cualquier nmero y cualquier nmero positivo. Entonces la funcin se llama


funcin de densidad de probabilidades normal (o de Gauss) con media m () y desviacin
tpica . Dado que claramente que f ( x ) > 0 para todo x, para comprobar lo que se ha
afirmado implcitamente aqu debemos probar que

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

f ( x)dx = 1

y la media y la varianza se define mediante:

m = xf ( x)dx

= ( x m) f ( x)dx
2

Para probar estos hechos usamos el cambio de variable t = ( x m) / 2 de modo que t


vara desde hasta y
x = m + 2t , dx = 2dt , f ( x) =

2
1
e t .
2

Caso 1.
La precipitacin (es decir, la lluvia) anual media en la ciudad de New York es de 42
pulgadas. La precipitacin anual durante muchos aos se aproxima bien mediante la
funcin de densidad normal con m = 42 y desviacin tpica = 2,
2
1
f ( x) =
e ( x 42) / 2 ( 2)
2 2
La proporcin de aos con precipitacin entre 40 y 44 pulgadas es
1
2 2

44

( x 42 ) 2 / 8

dx

40

Con el cambio de variable t = ( x 42) / 2 y accediendo a una tabla de valores de (t)


esta integral se convierte en
1
2 2

t 2 / 2

dt = (1) (1) = 0.8413 0.1587 0.6826

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Anlogamente, la proporcin de aos con precipitacin entre 38 y 46 pulgadas es (con el


mismo cambio de variable)
1
2 2

46

( x 42 )
dx = e t dt
e
2 /8

38

2/ 2

= (2) (2) = 0.9772 0.0228 0.9544

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Tabla 1. reas bajo la curva normal estndar. Los valores de la


tabla que no se muestran en negrita representan la probabilidad de
observar un valor menor o igual a z. La cifra entera y el primer
decimal de z se buscan en la primera columna, y el segundo
decimal en la cabecera de la tabla.

Z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4

0.00
.5000
.5398
.5793
.6179
.6554
.6915
.7257
.7580
.7881
.8159
.8413
.8643
.8849
.9032
.9192
.9332
.9452
.9554
.9641
.9713
.9772
.9821
.9861
.9893
.9918
.9938
.9953
.9965
.9974
.9981
.9987
.9990
.9993
.9995
.9997

Segunda cifra
.01
.02
.03
.5040 .5080 .5120
.5438 .5478 .5517
.5832 .5871 .5910
.6217 .6255 .6293
.6591 .6628 .6664
.6950 .6985 .7019
.7291 .7324 .7357
.7611 .7642 .7673
.7910 .7939 .7967
.8186 .8212 .8238
.8438 .8461 .8485
.8665 .8686 .8708
.8869 .8888 .8907
.9049 .9066 .9082
.9207 .9222 .9236
.9345 .9357 .9370
.9463 .9474 .9484
.9564 .9573 .9582
.9649 .9656 .9664
.9719 .9726 .9732
.9778 .9783 .9788
.9826 .9830 .9834
.9864 .9868 .9871
.9896 .9898 .9901
.9920 .9922 .9925
.9940 .9941 .9943
.9955 .9956 .9957
.9966 .9967 .9968
.9975 .9976 .9977
.9982 .9982 .9983
.9987 .9987 .9988
.9991 .9991 .9991
.9993 .9994 .9994
.9995 .9995 .9996
.9997 .9997 .9997

decimal del valor de z


.04
.05
.06
.07
.5160 .5199 .5239 .5279
.5557 .5596 .5636 .5675
.5948 .5987 .6026 .6064
.6331 .6368 .6406 .6443
.6700 .6736 .6772 .6808
.7054 .7088 .7123 .7157
.7389 .7422 .7454 .7486
.7704 .7734 .7764 .7794
.7995 .8023 .8051 .8078
.8264 .8289 .8315 .8340
.8508 .8531 .8554 .8577
.8729 .8749 .8770 .8790
.8925 .8944 .8962 .8980
.9099 .9115 .9131 .9147
.9251 .9265 .9279 .9292
.9382 .9394 .9406 .9418
.9495 .9505 .9515 .9525
.9591 .9599 .9608 .9616
.9671 .9678 .9686 .9693
.9738 .9744 .9750 .9756
.9793 .9798 .9803 .9808
.9838 .9842 .9846 .9850
.9875 .4878 .9881 .9884
.9904 .9906 .9909 .9911
.9927 .9929 .9931 .9932
.9945 .9946 .9948 .9949
.9959 .9960 .9961 .9962
.9969 .9970 .9971 .9972
.9977 .9978 .9979 .9979
.9984 .9984 .9985 .9985
.9988 .9989 .9989 .9989
.9992 .9992 .9992 .9992
.9994 .9994 .9994 .9995
.9996 .9996 .9996 .9996
.9997 .9997 .9997 .9997

.08
.5319
.5714
.6103
.6480
.6844
.7190
.7517
.7823
.8106
.8365
.8599
.8810
.8997
.9162
.9306
.9429
.9535
.9625
.9699
.9761
.9812
.9854
.9887
.9913
.9934
.9951
.9963
.9973
.9980
.9986
.9990
.9993
.9995
.9996
.9997

.09
.5359
.5753
.6141
.6517
.6879
.7224
.7549
.7852
.8133
.8389
.8621
.8830
.9015
.9177
.9319
.9441
.9545
.9633
.9706
.9767
.9817
.9857
.9890
.9916
.9936
.9952
.9964
.9974
.9981
.9986
.9990
.9993
.9995
.9997
.9998

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Figura 3. Ejemplos de distribuciones normales con diferentes parmetros.

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

La Desviacin Normal o Formula Z


Z = (X - )/

Valor de Z
Es el numero de desviaciones estndar a las que una observacin esta por encima
o por debajo de la media.
X

es algn valor especifico de la variable aleatoria.


es la media
es la desviacin estndar
TIPIFICACIN

Por tanto su funcin de densidad es

y su funcin de distribucin es

siendo la representacin grfica de esta funcin

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

MANEJO DE TABLAS. CASOS MS


FRECUENTES.
La distribucin de la variable Z se encuentra tabulada

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Caso I.
Claudia Cffaro en su viaje que realizo en el fin de semana pasado, para reunirse
con los funcionarios de la Casa Matriz de diseo de modas a la cual pertenece,
determinaron que el publico al cual se dirigen estaba en constante cambio en su tamao
fsico y en sus proporciones. Por lo que realizaron un estudio y llegaron a la conclusin
de que las estaturas de sus clientes estaban distribuidas normalmente alrededor de una
media de 67 pulgadas, con una desviacin estndar de 2 pulgadas.
Si Claudia fuera a expresar en Valor de Z la estatura de dos de sus clientes, que
tienen 64 y 73 pulgadas respectivamente. Que debe hacer? Tambin represntelo
grficamente.
La Desviacin Normal o Formula Z.
Z = (X - )/

Si se selecciona aleatoriamente a un cliente del negocio de Claudia:


1. Cul es la probabilidad de que la estatura del mismo est entre 67 y 69
pulgadas?
2. Cul es la probabilidad de que la estatura del cliente sea superior a 69 pulgadas?
3. Cul es la probabilidad de que la estatura de est entre 64.5 y 70.3 pulgadas?
4. Cul es la probabilidad de que la estatura de est entre 69.3 y 70.5 pulgadas?

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Ejercicios Propuestos
Caso I.
Los tiempos de reemplazo de los reproductores de CD tienen una distribucion normal con
una media de 7.1 aos y una desviacion estandar de 1.4 aos (basados en datos de
"Getting Things Fixed", Consumer Reports). Determine la probabilidad de que un
reproductor de CD seleccionado al azar tenga un tiempo de reemplazo de menos de 8
aos.
Caso II.
Suponga que los pesos del papel desechado por los hogares cada semana estan
normalmente distribuidos con un media de 9.4 lbs y una desviacion estandar de 4.2 lbs.
Determine la probabilidad de seleccionar aleatoriamente un hogar y obtener uno que
desecha entre 5 y 8 lbs de papel en una semana.
Caso III.
Segun la International Mass Retail Association, las muchachas estadounidenses entre los
13 y 17 aos gastan en promedio US$31.2 dolares al mes cuando van de compras.
Suponga que las cantidades tienen una distribucion normal con una desviacion estandar
de US$8.27 dolares. Si seleccionamos al azar a una muchacha perteneciente a esa
categoria de edades, que probabilidad hay de que gaste entre US$35 y US$40 dolares en
un mes?
Caso IV.
Los puntajes de cociente intelectual (IQ) estan distribuidos normalmente con una media
de 100 y una desviacion estandar de 15. Mensa es una organizacion para personas con
cociente intelectual elevado, y solo acepta personas con un IQ mayor que 131.5.
Si se escoge aleatoriamente a una persona, determine la probabilidad de que satisfaga el
requisito de Mensa.
CASO V.
VERIZON registro los mensajes telefnicos para sus clientes, los cuales promediaron 150
segundos, con una desviacin estndar de 15 segundos.
VERIZON desea determinar la probabilidad de que una sola llamada dure:
a) Entre 145 y 150.
b) Sea mayor que 145.
c) Sea menor que 155.
d) Entre 145 y 155.
e) Sea Mayor que 155.
f) Entre 160 y 170
g) Entre 140 y 145.

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Caso VI.
Cerca del 4.4% de los accidentes fatales de vehculos motorizados se debe a neumticos
defectuosos (basados en datos del Consejo Nacional de Seguridad de Estados Unidos). Si
un estudio de seguridad de autopistas inicia con la seleccin de 750 casos fatales de
choque de vehculos motorizados, estime la probabilidad de que exactamente 35 de ellos
hayan sido causados por neumticos defectuosos. Represente grficamente la situacin
planteada.

Caso VII.
El promedio de los salarios en los bancos comerciales de New York es de US$22.87 por
hora, con una desviacin estndar de US$5.87. Cul debe ser su salario por hora si
desea ganar (Represente grficamente cada situacin planteada:
a. Ms que el 80% de todos los empleados?
b. Ms que el 30% de todos los empleados?
c. Menos que el 20% de todos los empleados?
d. Ms que el 50% de todos los empleados?
Caso VIII.
Los registros muestran que el 45% de todos los automviles producidos por Ford Motor
Company contiene partes importadas de Japn. Cul es la probabilidad de que los
prximos 200 carros, 115 contengan partes japonesas. Represente grficamente.
Caso IX.
El precio promedio del boleto de entrada a un juego de bisbol de ligas mayores fue de
$11.98 dlares en 1998 (USA Today, 1 de noviembre de 1998). Sumando a los boletos el
costo de alimentos, estacionamiento y souvenirs, el costo promedio aproximado fue de
$110.00 dlares para una familia de 4 miembros, con una desviacin de $20.00 dlares.
a. Cul es la probabilidad de que una familia gaste ms de $100.00 dlares?
b. Cul es la probabilidad de que una familia gaste $90.00 dlares o menos?
c. Cul es la probabilidad de que una familia gaste $80.00 dlares a 130 dlares?
d. Cul es la probabilidad de que una familia gaste entre $120.00 dlares y 130
dlares?
e. Cul es la probabilidad de que una familia gaste entre $95.00 dlares y 100
dlares?
f. Cul debe ser el gasto de una familia que esta por encima del 80% de los datos
evaluados?
g. Cul debe ser el gasto del 50% de las familias de 4 miembros?
h. Cul debe ser el gasto de una familia que separa el 40% del 60 restante de los
datos evaluados?
i. Si se toma una muestra de 50 familias, cul es la probabilidad de que gasten
entre 115.00 dlares y 125.00 dlares?

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Caso X.
Cul es el ingreso que separa el 10% de la gente ms pobre del 90% restante de la
poblacin dominicana? Si el ingreso medio es de RD$5,200 y la desviacin es de
RD$1,300.

Caso XI.
El 40% de los sindicalistas del Sindicato quiere huelga. Si seleccionan 15 miembros
Cul es la probabilidad de que 10 apoyen un paro?
Caso XII.
Los registros muestran que 45% de todos los automviles producidos por Ford Motor
Company contienen partes importadas de Japn. Cul es la probabilidad de que los
prximos 200 carros, 115 contengan partes japonesas?
El Teorema del Limite Central indica que en el caso de muestras grandes (n > 30), la
distribucin de las medias de muestra es aproximadamente normal con media y
desviacin estndar /n. Provocando as una variacin de la ecuacin:
= (X' - )/(/n)
La regla general es que si n es por lo menos 30, el Teorema del Limite Central asegurara
una distribucin normal en las medias muestrales incluso si la poblacin no es normal.

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Bibliografa.
o SIMMONS, George F. Clculo y Geometra Analtica. McGraw-Hill:
Segunda Edicin. 2002.
o LIND, Douglas A., MARCHAL William G., and WATHEN Samuel A..
Estadstica Aplicada a los Negocios y a la Economa. McGraw-Hill: 12.
Edicin. 2005.
o WEBSTER, Allen L. Estadstica Aplicada a los Negocios y la Economa.
McGraw-Hill: Tercera Edicin. 2000.
o ANDERSON David, SWEENEY Dennis and WILLIAMS Thomas.
Estadstica para Administracin y Economa. International Thomson
Editores, S. A.: Octava Edicin 2004 / Sptima Edicin. 2000.
o TRIOLA Mario. Estadstica Elemental (Elementary Statistics). AddisonWesley: Sptima Edicin. 1998.
o JONSON Robert and KUBY Patricia. Estadstica Elemental Lo Esencial.
International Thomson Editores, S. A.: Tercera Edicin 2004.
o LIPSCHUTS Seymour and LIPSON Marc. PROBABILIDAD. Mc Graw
Hill. Segunda Edicin. 2001.
o MILTON J. Susan and ARNOLD Jesse C. PROBABILIDAD Y
ESTADISTICA. Mc Graw Hill. Cuarta Edicin. 2004.
o MONTIEL A. M., RIUS F. And BARON F.J. Elementos Bsicos de
Estadstica Econmica y Empresarial. Prentice Hall: 1997.
o HOPKINS Kenneth, HOPKINS B.R. and GLASS Gene. Estadstica Bsica
para las Ciencias Sociales y del Comportamiento. Prentice Hall: Tercera
Edicin. 1997.
o LAPIN Lawrence L. Statistics for Modern Business. The Dryden Press:
1995.

PDF Created with deskPDF PDF Writer - Trial :: http://www.docudesk.com

Anda mungkin juga menyukai