Anda di halaman 1dari 56

Distribuciones de Probabilidad Normal [Gaussiana]

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Distribucin Normal o Gaussiana


Una variable aleatoria X es llamada variable aleatoria normal (guassiana) si su pdf est dado por, 1 # (x # )2 / ( 2! 2 ) f X (x ) = e 2" ! La distribucin gaussiana es la reina de las distribuciones. En este universo, la naturaleza se comporta gaussianamente. El teorema del lmite central garantiza que cualquier otra distribucin se comporta como una gaussiana cuando se hacen un nmero suficiente de experimentos: la suma de muestras independientes para cualquier distribucin con valor esperado y varianzas finitos converge a la distribucin normal conforme el tamao de muestras tiende a infinito. El primer uso de la distribucin normal fue la de hacer una aproximacin continua a la distribucin binomial.
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Distribucin Normal o Gaussiana


Una variable aleatoria X es llamada variable aleatoria normal (guassiana) si su pdf est dado por, 1 # (x # )2 / ( 2! 2 ) f X (x ) = e 2" ! La distribucin gaussiana es la reina de las distribuciones. En este universo, la naturaleza se comporta gaussianamente. "Everybody believes in the Normal frequency distribution: the experimenters, because they think it can be proved by mathematics; and the mathematicians, because they believe it has been established by observation" (Whittaker and Robinson 1967, p. 179).
Whittaker, E. T. and Robinson, G. "Normal Frequency Distribution." Ch. 8 in The Calculus of Observations: A Treatise on Numerical Mathematics, 4th ed. New York: Dover, pp. 164-208, 1967.
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Distribucin Normal: valor esperado


Una variable aleatoria X es llamada variable aleatoria normal (guassiana) si su pdf, representado como N(X, 2X), est dado por, 1 # (x # ) / ( 2! )
f X (x ) =

Con: Haciendo x = x-+, se tiene: " 1 # (x # ) / ( 2$ ) ( ) (x ) = E (x ) = x # e dx + 2 !# "


2 2

2" ! X = E (X ) =

1 2% $

"

#"

xe

# (x # )2 /( 2$ 2 )

2%$ 2

Substituyendo y=x- en la primera integral se obtiene:

2%$

"

#"

2 2 e #(x # ) / (2$ )dx

1 E (X ) = 2% $

"

#"

ye

# y 2 / 2$ 2

dy + ! f X (x )dx =
#"

"

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Distribucin Normal: Varianza


" 1 2 2 # (x # ) /( 2$ ) 2 Con: $ X ( ) = E [X # X ] = x # e X ! # " 2% $ Pero, por definicin: $ % (x % )2 / ( 2" 2 ) dx = " 2! #%$e Tomando la derivada con respecto a , se obtiene:
2 2

d$ e
#%

# (x # )2 /( 2" 2 )

dx

d"

=$

#%

(x # )2 e #(x # ) /( 2"
2

"

dx = 2!

Y multiplicando ambos lados por


1 2% $

" 2 / 2!

se tiene que:

"!# (x ! ) e

! (x ! )2 / 2$ 2

( )dx = $ 2 = $ 2 = Var ( X ) X

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Distribucin Normal o Gaussiana


Se usa la notacin N(; 2) para denotar que la variable aleatoria X es normal con promedio y varianza 2. A una variable aleatoria normal Z con promedio cero y varianza 1 se le llama variable aleatoria normal estndar:
f X (x ) =

Suponga que X tiene distribucin normal N(; 2). La variable aleatoria estandariza se obtiene a partir de la distribucin de X, substituyendo: Z = (X-)/.

1 "(x )2 / 2 e ! N (0;1) 2#

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Regla 68-95-99.7
1 "(x )2 / 2 f X (x ) = e ! N (0;1) 2#

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Propiedades de la distribucin normal


1. 2. Si X~N(,) y a, b son dos constantes reales arbitrarias, entonces: aX+b~N(a+b, (a)2) Si X~N(X,X) y Y~N(Y,Y) son variables aleatorias independientes normalmente distribuidas, entonces: a. La suma est distribuida normalmente, as que: U = X+Y ~N(X+Y, 2X +2Y) b. La resta est distribuida normalmente, as que: U = X-Y ~N(X-Y, 2X +2Y)

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Pruebas de normalidad
Las pruebas de normalidad determinas si un conjunto de datos experimentales muestra similaridades con la distribucin normal. En la jerga usada comnmente en estadstica, la hiptesis nula supone que los datos estn distribuidos normalmente, mientras que un valor suficientemente pequeo de P indica datos no normales. Ejemplos de pruebas de normalidad son:
Kolmogorov-Smirnov test Lilliefors test Ryan-Joiner test Shapiro-Wilk test normal probability plot (rankit plot)
Francisco Rodrguez Henrquez

Introduccin a la Probabilidad

Ocurrencia de la distribucin normal


Las distribuciones normales ocurren aproximadamente en muchas situaciones como consecuencia del teorema del lmite central. El teorema del lmite central puede aplicarse en datos experimentales cuando hay razones para pensar que tales datos son resultado de un conjunto grande de pequeos efectos que actan aditivamente e independientemente. Las pruebas enlistadas en la lmina anterior prueban empricamente si un conjunto de datos se comportan normalmente.
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Ocurrencia de la distribucin normal


Si el conjunto de pequeos efectos acta de manera multiplicativa, entonces es el logaritmo de la variable de inters la que se comporta normalmente [distribucin log-normal] Finalmente si existe una perturbacin externa que afecta de manera significativa el resultado experimental, la hiptesis de comportamiento nulo [hiptesis nula] no se justifica.
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Ocurrencia de la distribucin normal


En resumen, el comportamiento normal de una variable aleatoria se presenta en las siguientes situaciones: Problemas de eventos discretos Problemas que involucran variables aleatorias binarias Problemas que involucran variables aleatorias Poissonianas Mediciones fisiolgicas de especmenes biolgicos, la luz de un rayo lser, la distribucin trmica de la luz en distancias pequeas estn distribuidas normalmente. En variables financieras, en cambio, es el logaritmo de los ndices burstiles el que se comporta normalmente. La vida til de componentes no se comporta normalmente.
Francisco Rodrguez Henrquez

Introduccin a la Probabilidad

Tests de Inteligencia: IQ
Los tests de inteligecnia IQ han sido especficamente diseados para que manifiesten un comportamiento normal Es posible disear un test de inteligencia para que tenga una distribucin arbitraria Se afirma que en general, cualquier prueba que contenga una cantidad suficiente de preguntas distribuidas en un rango amplio de grados de dificultad, en una variedad de tpicos y en la que se incluyen preguntas que tienen una fuerte correlacin con el resultado final de la prueba, inevitablemente mostraran una distribucin normal.
Francisco Rodrguez Henrquez

Introduccin a la Probabilidad

Evaluacin de probabilidades normales


Recordemos que para cualquier variable aleatoria continua X con funcin de densidad f(x), la probabilidad que X [a, b] est dada por: Sin embargo, en el caso de la distribucin normal, no es posible evaluar la integral correspondiente usando una funcin trascendente. Es por ello que se han definido una variedad de funciones que tabulan dicha rea [por ejemplo: funcin erf, funcin (z), etc]. En Matlab utilizaremos:
normcdf ( x) = !
Introduccin a la Probabilidad
x

P(a " X " b ) = ! f (x )dx


a

#"

1 #z2 / 2 e dz 2$
Francisco Rodrguez Henrquez

Funcin de distribucin acumulada


1 "(x )2 / 2 f X (x ) = e ! N (0;1) 2#

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Evaluacin de probabilidades normales estandarizadas


A una variable aleatoria normal Z con promedio cero y varianza 1 se le llama variable aleatoria normal estndar:
1 "(x )2 / 2 f X (x ) = e ! N (0;1) 2#

Ejemplos: cul es la probabilidad que una variable normal estandarizada se encuentre en los rangos: 1. 2. 3. P(-1X1) = normcdf(1)-normcdf(-1)= 0.6827 P(0 X 1.72) = normcdf(1.72)-normcdf(0)= 0.4573 P(4.5X) = 1
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Evaluacin de probabilidades normales arbitrarias


Suponga que la variable aleatoria X tiene distribucin normal N( , 2). Se evalua la probabilidad P(a X b), tras substituir los valores a, b en sus correspondientes unidades estandarizadas, as a" b" z1 = ; z2 = que: ! ! implica: P(a X b) = P(z1 Z z2). De la misma manera: P(X a) = P(Z z) y P(X a) = P(Z z)

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Evaluacin de probabilidades normales arbitrarias


Problema: Suponga que la altura de las mujeres mexicanas est normalmente distribuida, con promedio = 160cm y desviacin estndar = 7.5cm. Encuentre el porcentaje de mexicanas que estn: a) Entre 153 y 168 centmetros b) Aproximadamente 170 centmetros

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Evaluacin de probabilidades normales arbitrarias


Problema: Suponga que la altura de las mujeres mexicanas est normalmente distribuida, con promedio = 160cm y desviacin estndar = 7.5cm. entonces z1 = (153-160)/7.5=-0.93 y z2 = (168-160)/7.5=1.07 De aqu que: P(153X168) = normcdf(-0.93)-normcdf(1.07)= 0.6815 Asuma que las alturas son redondeadas al centmetro ms cercano, entonces z1 = (169.5-160)/7.5=1.27 y z2 = (170.5-160)/7.5=1.4 De aqu que: P(169.5X170.5) = normcdf(1.4)-normcdf(1.27)= 0.0213
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Aproximacin de distribucin binomial con distribucin Gaussiana

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Distribucin Binomial aproximada por distribucin normal


Una variable aleatoria X es llamada variable aleatoria binomial con parmetros b(n, p) si, Para np5 y nq5, el histograma de probabilidad para b(n, p) es casi simtrico alrededor de = np en el intervalo [-3 , -3], donde, ! = npq y fuera de este intervalo P(k) 0. Para cualquier valor entero de k entre [-3, -3], el rea bajo la curva normal es aproximadamente igual a b(n, p). Es decir: b(n, p) N(np, npq);
'n$ k n!k " ( ) p X (k ) = P(X = k ) = % p 1 ! p %k " & # k = 0,1, K , n

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Binaria asinttica= Gaussiana

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Clculo de probabilidades binomiales con aproximacin normal


Problema: Se lanzan 100 volados con una moneda correcta. Encuentre la probabilidad que ocurran exactamente 60 guilas.
&100 # 60 40 ! ( ) ( ) b(n = 100, k = 60, p = 0.5) = $ 0 . 5 0 . 5 = 0.0108 $ 60 ! % "

En Matlab, este problema se resuelve utilizando: binocdf(61,100,0.5)-binocdf(59,100,0.5) = 0.0180 Pregunta: Cul es la prediccin de la aproximacin normal?
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Clculo de probabilidades binomiales con aproximacin normal


Problema: Se lanzan 100 volados con una moneda correcta. Encuentre la probabilidad que ocurran exactamente 60 guilas. Note que: = np = 100(0.5) =50, 2 = npq = 100(0.5)(0.5) = 25, por lo que = 5. Se usa entonces la distribucin normal para aproximar la probabilidad binomial como sigue: b(100, 60, 0.5) N(59.5 X 60.5). Tras transformar, a = 59.5, b = 60.5 en unidades estndar se obtiene: z1 = (59.5-50)/5=1.9 y z2 = (60.5-50)/5=2.1. De aqu que: P(59.5X60.5) = normcdf(2.1)-normcdf(1.9)= 0.0109
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Clculo de probabilidades binomiales con aproximacin normal


Problema: Se lanzan 100 volados con una moneda correcta. Encuentre la probabilidad que ocurran entre 48 y 53 guilas. Note que: = np = 100(0.5) =50, 2 = npq = 100(0.5)(0.5) = 25, por lo que = 5. Se usa entonces la distribucin normal para aproximar la probabilidad binomial como sigue: b(47 k 53) N(47.5 X 53.5). Tras transformar, a = 47.5, b = 53.5 en unidades estndar se obtiene: z1 = (47.5-50)/5=-0.5 y z2 = (53.5-50)/5=0.7. De aqu que: P(59.5X60.5) = normcdf(0.7)-normcdf(-0.5)= 0.4495
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Clculo de probabilidades binomiales con aproximacin normal


Problema: Se lanzan 100 volados con una moneda correcta. Encuentre la probabilidad que ocurran menos de 45 guilas. Note que: = np = 100(0.5) =50, 2 = npq = 100(0.5)(0.5) = 25, por lo que = 5. Se usa entonces la distribucin normal para aproximar la probabilidad binomial como sigue: b(k 45) N( X 44.5). Tras transformar, a = 44.5, en unidades estndar se obtiene: z1 = (44.5-50)/5=-1.1. De aqu que: P(X44.5) = normcdf(-1.1) = 0.1357

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Clculo de probabilidades binomiales con aproximacin normal


Problema: Un dado es tirado 180 veces. Encuentre la probabilidad que un 6 ocurra: a) Entre 29 y 32 veces; b) Entre31 y 35 veces; c) menos de 22 veces;

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Clculo de probabilidades binomiales con aproximacin normal


Problema: Un dado es tirado 180 veces. Encuentre la probabilidad que un 6 ocurra: (a) Entre 29 y 32 veces;

= np = 180(1/6) =30, 2 = npq = 180(1/6)(5/6) = 25, por lo que = 5. Se usa entonces la distribucin normal para aproximar la probabilidad binomial como sigue:
b(29 k 32) N(28.5 X 33.5). Tras transformar, a = 28.5, b = 33.5 en unidades estndar se obtiene: z1 = (28.5-30)/5=-0.3 y z2 = (33.5-30)/5=0.5. De aqu que: P(28.5X33.5) = normcdf(0.5)-normcdf(-0.3)= 0.3094
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Clculo de probabilidades binomiales con aproximacin normal


Problema: Un dado es tirado 180 veces. Encuentre la probabilidad que un 6 ocurra: (a) Entre 31 y 35 veces;

= np = 180(1/6) =30, 2 = npq = 180(1/6)(5/6) = 25, por lo que = 5. Se usa entonces la distribucin normal para aproximar la probabilidad binomial como sigue:
b(31 k 35) N(30.5 X 35.5). Tras transformar, a = 30.5, b = 35.5 en unidades estndar se obtiene: z1 = (30.5-30)/5=0.1 y z2 = (35.5-30)/5=1.1. De aqu que: P(30.5X35.5) = normcdf(1.1)-normcdf(0.1)= 0.3245
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Clculo de probabilidades binomiales con aproximacin normal


Problema: Suponga que el 4% de la poblacin de la tercera edad tiene Alzheimer. Suponga que se toma una muestra aleatoria de 3500 ancianos. Encuentre la probabilidad que al menos 150 de ellos tengan la enfermedad.

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Clculo de probabilidades binomiales con aproximacin normal


Problema: Suponga que el 4% de la poblacin de la tercera edad tiene Alzheimer. Suponga que se toma una muestra aleatoria de 3500 ancianos. Encuentre la probabilidad que al menos 150 de ellos tengan la enfermedad.

= np = 3500(0.04) =140, 2 = npq = 3500(0.04)(0.96) = 134.4, por lo que = 11.6. Se usa entonces la distribucin normal para aproximar la probabilidad binomial como sigue:
b(k 150) N(X 149.5). Tras transformar, a = 149.5, en unidades estndar se obtiene: z1 = (149.5-140)/5= 0.82 De aqu que: P(X149.5) = normcdf(0.82) = 0.7939
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Generacin de variable normal

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Generacin de distribucin normal: mirandn


function [gauss] = mirandn(N); for i=1:2:N rsq = 2; while(rsq>=1 || rsq==0) v1=2*rand(1)-1; v2=2*rand(1)-1; rsq=v1^2+v2^2; end fac = sqrt(-2*log10(rsq)/rsq)*v1; gauss(i)=fac; gauss(i+1)=fac*v2; Fuente: Numerical recipes in C: end http://www.library.cornell.edu/nr/bookcpdf.html gauss = gauss(1:N);
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Histograma de minormal

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Canal Gaussiano

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Transmitiendo informacin digital

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Transmitiendo informacin digital

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Canal contaminado con ruido Gaussiano

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Canal contaminado con ruido Gaussiano

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Canal contaminado con ruido Gaussiano: Anlisis

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Canal contaminado con ruido Gaussiano: Anlisis


Pregunta: Cul es la probabilidad que un ruido Gaussiano N(, ) provoque errores en la recepcin de los bits transmitidos? Ocurrirn errores en la lectura de los bits, siempre que:
P(Error) = P(seal+ruido<0|1transmitido)+P(seal+ruido<0|-1 transmitido)

Suponga que la distancia |1|=k, donde k es una constante real. Entonces, transformando a normal estandarizada y aprovechando simetra se tiene que: z2 = (a- )/ = (k+ - )/=k. De aqu que: P(Error) = P(seal+ruidok) =1-normcdf(k).
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Razn seal a ruido


La razn seal a ruido (SNR por sus siglas en ingls), indica la razn de la potencia de la seal con respecto al ruido de fondo:
SNR =

Debido a que la inmensa mayora de las seales tienen un amplio rango dinmico, el SNR se expresa tpicamente en trminos de una escala logartmica en decibelios. En decibelios, el SNR es 10 veces el logaritmo base 10 de la razn de la potencia de la seal y el ruido: & Pseal #
SNR = 10 log10 $ $P ! ! % ruido "

Pseal Pruido

Lo que implica que:


Introduccin a la Probabilidad

Pruido = Pseal "10 ! SNR /10


Francisco Rodrguez Henrquez

Canal contaminado con ruido Gaussiano: Modelo


function [err, bits] = gauss_channel(N, snr_ar); % This M-Function sends N random binary bits using a coherently detected % pi/4 DQPSK system. % The channel is modelled as an Additive White Gaussian Noise (AWGN) channel, % and the function produces a semilog BER vs Eb/No plot, where both, % the theoretical and the simulated results are compared. % N is the number of samples to be simulated. % pg is the processing gain. % snr_ar is an array containing the different values of SNR (Eb/No) % to be simulated. % The function TX returns an error vector containing the corresponding BERs % for the given snr_ar values. % Written by Francisco Rodri'guez-Henri'quez may 98..

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Canal contaminado con ruido Gaussiano: Simulacin

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Canal contaminado con ruido Gaussiano: Simulacin

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Canal contaminado con ruido Gaussiano: Simulacin

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Teorema de lmite central

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Teorema del lmite Central


Acaso el teorema del lmite central sea el resultado ms famoso, el ms celebrado de la teora de la probabilidad. En su forma ms simple, puede ser formulado como sigue: Sea X1,,Xn una secuencia de variables aleatorias independientes, idnticamente distribuidas, cada una con promedio y varianza 2. Defina entonces Donde, Entonces
Introduccin a la Probabilidad

X 1 + L + X n " n X n " Zn = = ! n !/ n
1 n 1 X n = ! X i = (X 1 + L + X n ) n i =1 n

lm = N (0;1)
n "!

Francisco Rodrguez Henrquez

Teorema del lmite Central: ejemplo


Sea X1,,Xn una secuencia de variables aleatorias independientes, idnticamente distribuidas, cada una con promedio y varianza 2. Defina entonces X 1 + L + X n " n X n " Zn = = ! n !/ n Note que E[Zn] = 0, Var[Zn] = 1.
1 n 1 X n = ! X i = (X 1 + L + X n ) n i =1 n

Se desea calcular P(aZnb) usando el TLC, Pero Zn es una variable aleatoria normal estandarizada!. La funcin TLC.m dibuja las grficas mostradas a continuacin.
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Teorema del lmite Central: ejemplo

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Distribucin Normal Conjunta

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Distribucin Normal Conjunta


Sean X, X, Y, Y y , constantes reales tales que, X>0, Y>0 y, -1< <1. Para variables reales, x, y, definimos:
1 Q(x, y ) = 1. 0 2 ' !- x . X &+ + / ! X %, * - x . X ( + . 2 0 ( + / X ) ,
2

*- y . Y ( (+ + ), / Y

* - y . Y ( (++ + ) , /Y

* ( ( )

$ ! # ! "

Se define la distribucin normal conjunta (o normal bi-variable) para variables aleatorias X, Y es definida por la funcin de densidad:

$ X ,Y =

1 2'& X & Y 1 " % 2

#e

1 " Q (x , y ) 2

,"! < x, y < !

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Distribucin Normal Conjunta


Se define la distribucin normal conjunta (o normal bi-variable) para variables aleatorias X, Y es definida por la funcin de 1 " Q (x , y ) densidad: 1 2

$ X ,Y =

2'& X & Y 1 " %

#e

,"! < x, y < !

Los parmetros son: E[X] = X, E[Y] = Y, Var[X] = 2X, Var[Y] = 2Y, y Cov[X, Y] = E[(X-X)(Y- Y)]=XY. El parmetro sin dimensiones es conocido como el coeficiente de correlacin. Si es positivo (negativo) la correlacin entre las variables X, Y es tambin positivo (negativo). Si = 0, entonces las variables X, Y son independientes. La funcin jointnorm.m produce las imgenes mostradas en las siguientes lminas
Introduccin a la Probabilidad
Francisco Rodrguez Henrquez

Distribucin Normal Conjunta

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Distribucin Normal Conjunta

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez

Distribucin Normal Conjunta

Introduccin a la Probabilidad

Francisco Rodrguez Henrquez