IA AMBIENTAL
Introducci
on
ESTAD
ISTICA
TEMA 5
VARIABLES ALEATORIAS
Sonia Hern
andez Alonso Sonia Hern andez Alonso
Estadstica-Ingeniera Ambiental (URJC)
Departamento de Estadstica e Investigaci
on Operativa (URJC)
Motivaci
on de las variables aleatorias El azar tiene familias
Muchos experimentos aleatorios tienen un espacio muestral, , cuyos Existen muchos tipos de variables aleatorias, unas discretas (como
elementos no son num
ericos.
el n
umero de escapes radiactivos de una central nuclear, el n
umero
Por ejemplo, para el experimento aleatorio consistente en lanzar al conexiones por minuto que acepta un servidor...), y otras continuas
aire una moneda tres veces, el espacio muestral es (como pesos, tiempos, longitudes ...)
= {CCC, CCX , CX C, CX X , X CC, X CX , X X C, X X X } . Hay ciertos tipos de modelos de variables aleatorias (tanto discretas
como continuas) que se repiten con mucha frecuencia.
Matem aticamente, resulta mas
util cuanticar los resultados de un
espacio muestral, ya que de esta manera se pueden emplear medidas Las propiedades de dichos modelos, que se agrupan en familias, est
an
numericas para analizar y resumir las principales caractersticas del bien estudiadas, lo cual facilita mucho las cosas.
experimento aleatorio.
Cuando nos enfrentamos a una variable aleatoria, podemos mirar si
Adem as, en muchas ocasiones, no interesa estudiar todos los detalles encaja en alguno de esos modelos. En caso de que sea asi, su an
alisis
del experimento, sino que el inter
es se centra en el valor de ciertas
ser
a mas inmediato.
magnitudes num ericas. Por ejemplo, cuando se lanzan varios dados,
podemos estar interesados en conocer cu al es la suma obtenida, y no Analizaremos los modelos aleatorios que m as frecuentemente se re-
en los resultados concretos de cada lanzamiento. piten: tres de tipo discreto (binomial, geom
etrica y Poisson) y otros
Las variables aleatorias asignan un valor num
erico a cada uno de los tres continuos (uniforme, exponencial y normal o gaussiana).
1
resultados posibles de un experimento. 1
Esquema
Qu
e es una variable aleatoria?
Modelos discretos:
Distribuci
on binomial
Distribuci
on geom
etrica
Qu
e es una variable aleatoria?
Distribuci
on de Poisson
Modelos continuos:
Distribuci
on uniforme
Distribuci
on exponencial
Distribuci
on normal
Denici
on de variable aleatoria Ejemplo de variable aleatoria
X (X X X ) = 0 X (X X C) = 1 X (CCX ) = 2 X (CCC) = 3
X (X CX ) = 1 X (CX C) = 2
X (CX X ) = 1 X (X CC ) = 2
2 2
Probabilidad inducida por una variable aleatoria Variables aleatorias discretas y continuas
Sobre los elementos de existe una distribuci on de probabilidad, Dependiendo de la cantidad de valores que tomen, las variables alea-
y la variable aleatoria X traslada esta estructura probabilstica a IR. torias se clasican discretas y continuas:
Por ejemplo, para el triple lanzamiento de una moneda equilibrada y Una variable aleatoria discreta es aquella que s
olo puede tomar
la variable aleatoria una cantidad numerable de valores.
X = n
umero de caras Los valores posibles de una variable discreta son puntos aislados,
es decir, valores puntuales.
se tiene que
1 Una variable aleatoria es continua si puede tomar una cantidad
P (X = 0) = P (X X X ) = ,
8 no numerable de valores.
3 El conjunto de valores posibles de una variable continua incluye a
P (X = 1) = P (X X C, X CX , CX X ) = ,
8 todos los n
umeros de algun intervalo de IR.
3
P (X = 2) = P (X CC, CX C, CCX ) = ,
8 Las distribuciones de probabilidad de las variables discretas y de las
1 variables continuas dieren en varios aspectos.
P (X = 3) = P (CCC) = .
8
Caracterizaci
on de variables aleatorias discretas
Por tanto, los valores posibles de una variable discreta son puntos
aislados, es decir, valores puntuales.
Variables aleatorias discretas Para describir una variable aleatoria discreta hay que especicar los
valores que puede tomar y las probabilidades de que aparezca cada
uno de ellos.
3
Sonia Hern andez Alonso
Estadstica-Ingeniera Ambiental (URJC) 3
Soporte de una variable aleatoria discreta Ejemplo: soporte de una variable aleatoria discreta
Al conjunto de valores que puede tomar una variable aleatoria X Consideremos de nuevo el triple lanzamiento de una moneda y la
se le llama soporte o rango de X. variable aleatoria
Para las variables aleatorias discretas el soporte es siempre un conjunto Puesto que SX es un conjunto nito, X es una variable discreta.
numerable.
Funci
on de masa de probabilidad Ejemplo: funci
on de masa
La funci on de masa de probabilidad de una variable aleatoria X es Consideremos de nuevo el triple lanzamiento de una moneda equili-
la funci
on que indica la probabilidad de que X tome cada uno de sus brada y la variable aleatoria
valores, es decir, la funci
on
X = n
umero de caras
fX : IR [0, 1]
k fX (k) = P (X = k) La funci
on de probabilidad de X es
1
fX (0) = P (X = 0) = P ({X X X }) =
Obviamente, si k no es uno de los valores que puede tomar X, entonces 8
fX (k) = 0: 3
fX (1) = P (X = 1) = P ({X X C, X CX , CX X }) =
k
/ SX P (X = k) = 0 fX (k) = 0. 8
3
fX (2) = P (X = 2) = P ({X CC, CCX , CX C}) =
La funci
on de masa de probabilidad de una variable discreta se puede 8
representar gr
acamente mediante un diagrama de barras. 1
fX (3) = P (X = 3) = P ({CCC}) =
8
4 4
Ejemplo: funci
on de masa (continuaci
on) Notaci
on matricial del soporte y la funci
on de masa
0.4
cada punto.
X = n
umero de caras
f(k)
0.2
0 1 2 3
X
1 3 3 1
0.0
8 8 8 8
0 1 2 3
nmero de caras
Propiedades de la funci
on de masa Funci
on de distribuci
on
La funci
on de masa de probabilidad de las variables aleatorias discretas Se llama funci
on de distribuci
on de una variable aleatoria X a la
se caracteriza por dos propiedades: funci
on
FX : IR [0, 1]
1. Es una funci
on no negativa, es decir,
que asigna a cada t IR la probabilidad de que la variable X tome un
fX (k) 0
valor menor o igual que t:
para todo k IR.
FX : IR (0, 1)
2. La suma de la funci
on de masa de todos los valores del soporte es t FX (t) = P (X t)
1, esto es,
Es decir, FX es la funci
on de probabilidad acumulada hasta cada
fX (k) = 1.
valor de IR.
kSX
5 5
Funci
on de distribuci
on de una variable discreta Ejemplo: funci
on de distribuci
on
Ejemplo: funci
on de distribuci
on (continuaci
on) Ejemplo: funci
on de distribuci
on (continuaci
on)
6 6
Ejemplo: funci
on de distribuci
on (continuaci
on) Propiedades de FX para variables discretas
Es mon
otona no decreciente.
Crece a saltos, los puntos de salto son los puntos del soporte, y
la amplitud de cada salto es el valor de la funci
on de masa en ese
punto.
La esperanza, o media, o valor esperado de una variable aleatoria Vamos a calcular el valor esperado de la variable aleatoria
aleatoria discreta X se dene como
X = n
umero de caras
E (X) = k P (X = k)
en el triple lanzamiento de la moneda equilibrada.
kSX
o lo que es lo mismo Recordemos que el soporte y la funci
on de masa de X son
E (X) = k fX (k)
kSX
0 1 2 3
X
Si pensamos en la probabilidad como en una masa total de 1 repartida 1 3 3 1
entre los puntos del soporte, E(X) es el punto donde se encuentra 8 8 8 8
el centro de gravedad o punto de equilibrio de la distribuci on de
probabilidad de X. Por consiguiente la esperanza de X es
Es habitual denotar E(X) por X , o simplemente por . 1 3 3 1 12
E(X) = 0 +1 +2 +3 = = 1,5 caras
8 8 8 8 8
7 7
Gr
aco: esperanza de una variable discreta Esperanza de transformaciones lineales de variables
Este valor esperado indica que, si se lanzan 3 monedas muchas veces, Si X es una variable aleatoria y a, b IR son constantes, entonces se
el n
umero medio de caras sobre todos los lanzamientos sera 1.5: verica
funcin de masa E(aX) = a E(X)
y
0.4
0.3 E(X + b) = E(X) + b
y por consiguiente
E(aX + b) = a E(X) + b
f(k)
0.2
o, escrito abreviadamente,
aX+b = aX + b
0.1
1.5
0 1 2 3
nmero de caras
Para las variables aleatorias discretas, la varianza puede calcularse Por tanto, para las variables discretas, la varianza tambi
en puede cal-
mediante la f
ormula cularse como
2 = k2fX (k) 2
V (X) = (k X )2fX (k) X X
kSX kSX
Habitualmente el c
alculo de la varianza resulta m
as sencillo si se utiliza
8 esta segunda denicion. 8
Ejemplo: varianza de una variable discreta Varianza de transformaciones lineales de variables
Calculemos la varianza de la variable aleatoria Puede demostrarse que si X es una variable aleatoria y a, b IR son
constantes, entonces se verica
X = n
umero de caras
V (aX + b) = a2V (X)
en el triple lanzamiento de la moneda equilibrada:
o, escrito abreviadamente,
0 1 2 3
2
X aX+b = a 2 X
2
1 3 3 1
8 8 8 8
Por ejemplo, si la varianza de una variable aleatoria X es
1 3 3 1 12 V (X) = 9
E(X) = 0 +1 +2 +3 = = 1,5 caras
8 8 8 8 8
y denimos
1 3 3 1 24
E X 2 = 02 + 12 + 22 + 32 = = 3 caras2 Y = 10X + 50,
8 8 8 8 8
entonces
y por tanto la varianza de esta variable es
V (Y ) = V (10X + 50) = 102 V (X) = 100 9 = 900
V (X) = E(X 2) E 2 (X) = 3 1,52 = 0,75 caras2
Desviaci
on tpica de una variable aleatoria Ejemplo: n
umero de muertes de abejas obreras
La desviaci
on tpica de una variable aleatoria X, X , es la raiz cua- Se ha comprobado que el n umero muertes de obreras que se producen
drada de su varianza, esto es, diariamente en una colmena de abejas abeja melferas (Apis mellifera)
es una variable aleatoria, M , con funci
on de probabilidad:
X = 2 =
X V (X)
Las unidades de la varianza son el cuadrado de las unidades en las 6 7 8 9 10
que est
e medida la variable aleatoria. En cambio la desviaci
on tpi- M
ca tiene las mismas unidades que la variable aleatoria a la que 0,10 0,15 0,25 0,30 0,20
corresponde.
1. Hallar la probabilidad de que ayer muriesen al menos 8 obreras.
Ejemplo: la desviaci
on tpica de la variable aleatoria 2. Calcular la probabilidad de que ma
nana mueran m
as de 8 obreras.
X = n
umero de caras 3. Cual es la probabilidad de que la cantidad de defunciones que se
en tres lanzamientos de una moneda equilibrada, es produzcan dentro de tres das sea un numero impar?
4. Se sabe que anteayer fallecieron al menos 8 abejas obreras; c
ual
X = V (X) = 0,75 = 0,866 caras
es la probabilidad de que el n
umero de defunciones fuese impar?
5. Cu
al es el n
umero esperado de defunciones diarias?
9 6. Hallar la desviaci
on tpica del n
umero de defunciones por da. 9
Soluci
on: n
umero de muertes de abejas obreras on: no de muertes de obreras (continuaci
Soluci on)
1. 5. El n
umero esperado de defunciones diarias es
Gr
aco: n
umero de muertes de abejas obreras
funcin de probabilidad
Modelos discretos
f(k)
E(X)=1.5
6 7 8 9 10
La distribuci
on de Poisson est
a relacionada con otro tipo de proceso
estoc
astico conocido como Proceso de Poisson.
Lo denotaremos
X Bin(n, p)
11 11
Ejemplos de la distribuci
on binomial Ejemplo: no de 3s en 5 lanzamientos de un dado
La variable aleatoria Supongamos que se lanza un dado equilibrado cinco veces y queremos
analizar el n
umero de 3s que aparecen en total.
X = n
umero de caras obtenidas en 3 lanzamientos de una moneda
on X Bin(3, 1/2).
sigue una distribuci Llamemos T a n
umero de 3s obtenidos entre los cinco lanzamientos.
Observemos que N
otese que todas las probabilidades anteriores responden a la f
ormula
5 k 5k
5
5 1 5
P (T = 0) = = 0,4019 P (T = k) =
6 k 6 6
4 De forma an aloga a la de este ejemplo, se puede razonar c omo son el
1 5
P (T = 1) = 5 = 0,4019
6 6 soporte y la funci
on de probabilidad de cualquier distribuci
on binomial.
5 2 3 2 3
1 5 1 5
P (T = 2) = = 10 = 0,1608
2 6 6 6 6
5 3 2 3 2
1 5 1 5
P (T = 3) = = 10 = 0,0321
3 6 6 6 6
5 4 4
1 5 1 5
P (T = 4) = =5 = 0,0032
4 6 6 6 6
5
1
P12
(T = 5) = = 0,0001 12
6
on de masa de X Bin(n, p)
Soporte y funci Esperanza y varianza de la distribuci
on binomial
X Bin(n, p) X Bin(n, p)
Entonces: es
E (X) = n p
El soporte de X es
V (X) = n p q
La funci on de masa de probabilidad de la variable aleatoria X
es
n
n Ejemplo: Para la variable T que recoge el n
umero de 3s en 5 lanza-
fX (k) = P (X = k) = pk (1 p)nk = pk q nk mientos de un dado (cuya distribuci
on es Bin(5, 1/6)), se tiene que
k k
1
E(T ) = 5 = 0,8333
6
1 5
V (T ) = 5 = 0,6944
6 6
Ejemplo: n
umero de piezas defectuosas Soluci
on: n
umero de piezas defectuosas
El porcentaje de piezas defectuosas que produce una m aquina es del Llamemos D al n umero de piezas defectuosas de entre las 8 seleccio-
25 %. Para un control rutinario se han seleccionado de forma aleatoria nadas para el control.
8 de las piezas producidas.
Tenemos que
1. Cu
al es la probabilidad de que al menos una de las piezas seleccio- D Bin (8, 0,25)
nadas sea defectuosa?
Por tanto:
2. Cual es la probabilidad de que como mucho dos de las piezas sean
defectuosas? 1.
3. Cual es la probabilidad de que tres de las piezas seleccionadas P (D 1) = 1 P (D = 0) = 1 0,758 = 1 0,1001 = 0,8999
sean defectuosas y el resto sean correctas?
4. Cuantas de las piezas seleccionadas se espera que tengan defec-
2.
tos?
5. Cual es la varianza del n
umero de piezas defectuosas entre las 8 P (D 2) = P (D = 0) + P (D = 1) + P (D = 2)
8
seleccionadas? = 0,758 + 8 0,25 0,757 + 0,252 0,756
2
= 0,6785
13 13
on: no de piezas defectuosas (continuaci
Soluci on) C
omo cambia la distribuci
on al variar p?
0.6
0.6
Funcin de probabilidad
Funcin de probabilidad
sas es
8
0.4
0.4
P (D = 3) = 0,253 0,755 = 56 0,253 0,755 = 0,2076
3
0.2
0.2
0.0
0.0
4. La cantidad de piezas seleccionadas que se espera que tengan alg
un
0 1 2 3 4 5 6 0 1 2 3 4 5 6
defecto es
Nmero de xitos Nmero de xitos
0.6
0.6
Funcin de probabilidad
Funcin de probabilidad
5. La varianza del n
umero de piezas que tienen alg
un defecto de entre
0.4
0.4
las 8 seleccionadas para el control es
0.2
0.2
0.0
0.0
0 1 2 3 4 5 6 0 1 2 3 4 5 6
Distribuci
on geom
etrica
La distribuci
on geom etrica modela el n
umero de veces que es ne-
cesario repetir un experimento de Bernoulli hasta obtener el primer
exito.
La variable aleatoria M = numero de lanzamientos de una mone- La funcion de masa de probabilidad de una variable geom
etrica con
da equilibrada hasta obtener la primera carasigue una distribuci
on probabilidad de
exito p es
Ge(1/2).
fX (k) = P (X = k) = (1 p)k1 p = q k1p,
La variable aleatoria L = n
umero n umero de lanzamientos de un para k = 1, 2, 3, 4, . . . . . ., y 0 para el resto de valores de k.
dado equilibrado hasta obtener el primer cincosigue una distribuci
on
Ge(1/6). La esperanza de una variable X Ge(p) es
1
En una f abrica se analizan todas las piezas fabricadas con el n de E (X) = k q k1 p = ,
k=1
p
encontrar las posibles piezas defectuosas. La probabilidad de que una
pieza est
e en perfecto estado es 0.95. La variable aleatoria N = n
ume- y su varianza es
ro de componentes analizadas hasta encontrar la primera defectuo-
1 1p q
sasigue una distribucion Ge(0,05). V (X) = k2 q k1 p 2 = 2
= 2.
k=1
p p p
Forma de la distribuci
on geom
etrica Gr
acos de la distribuci
on geom
etrica
La funci
on de masa de la distribuci
on geom
etrica,
0.08
0.20
fX (k) = P (X = k) = (1 p)k1 p = q k1p,
0.06
0.15
alcanza su m
aximo en k = 1 y decrece con k.
0.04
0.10
0.02
0.05
El decrecimiento es m
as r
apido cuanto mayor sea p.
0.00
0.00
funcion de masa de Ge(0.3) funcion de masa de Ge(0.1)
0.20
0.08
0.15
0.06
0.10
0.04
0.05
0.02
0.00
0.00
15 15
Ejemplo: distribuci
on geom
etrica Soluci
on al ejemplo
Una pareja decide que tendran descendientes hasta que se produzca La distribuci
on de variable aleatoria
el nacimiento de la primera ni
na. Suponiendo que, en cada parto, la
N = no descendientes hasta la primera ni
na,
probabilidad de que nazca un nino es 0.6,
es N Ge(0,4). Por consiguiente:
1. Hallar la probabilidad de que tengan en total 3 descendientes.
1. P (N = 3) = 0,62 0,4 = 0,144.
2. Calcular la probabilidad de que tengan m
as de 4 hijo@s.
2. P (N > 4) = 0,64 = 0,1296.
3. Supongamos que la pareja ha tenido ya dos hijos varones.
3. Si se sabe que la pareja ha tenido ya dos hijos varones,
a) Hallar la probabilidad de que tengan en total 5 descendientes.
P (N = 5) 0,62 0,4
a) P (N = 5|N > 2) = = = 0,62 0,4 = 0,144.
b) Calcular la probabilidad de que tengan m
as de 6 hijo@s. P (N > 2) 0,62
Notese que este valor coincide con la probabilidad de que la pareja
tenga un total de 3 descendientes.
P (N > 6) 0,66
b) P (N > 6|N > 2) = = = 0,64 = 0,1296.
P (N > 2) 0,62)
Notese que este valor coincide con la probabilidad de que la pareja
tenga m as de 4 hij@s.
La distribuci
on geometrica es la
unica de las distribuciones discretas
que verica esta propiedad de falta de memoria.
16 Sonia Hern andez Alonso
Estadstica-Ingeniera Ambiental (URJC) 16
Sucesos puntuales a lo largo del tiempo Distribuci
on de Poisson
En ocasiones nos encontramos con variables que representan el n ume- Llamemos X al n umero de apariciones del suceso en el intervalo de
ro de sucesos que ocurren en un determinado periodo de tiempo, como tiempo que estemos considerando, y al n
umero medio de apariciones
por ejemplo el n umero de cebras que acuden a beber a un arroyo en en dicho intervalo.
una hora, el numero de visitas diaras a una p
agina web, o el n
umero
Como es natural, el soporte de una variable de este tipo es
averas anuales de un ascensor.
SX = IN = {0, 1, 2, 3, . . . . . .
Muchas veces estos sucesos van apareciendo a lo largo del tiempo de
manera independiente y con una intensidad constante. Si se cumplen las condiciones de que los sucesos ocurran de manera
independiente y con una intensidad constante, entonces la funci
on de
La distribuci
on de Poisson proporciona un modelo adecuado para el
masa de X es
n
umero de ocurrencias independientes de un suceso en situaciones
en las que la intensidad de ocurrencias se mantiene estable. k
fX (k) = P (X = k) = e para k = 0, 1, 2, 3, 4, . . .
k!
Esta distribuci
on depende de un unico par
ametro: el n
umero medio
de ocurrencias del suceso en ese intervalo de tiempo. Denotaremos Esta es la funci
on de masa de probabilidad de una distribuci
on de
por dicho parametro. Poisson con par ametro . Abreviadamente lo expresaremos
X P o()
Qu
e indica el par
ametro ? Esperanza y varianza de la distribuci
on de Poisson
El par
ametro de la distribuci
on de Poisson es el n
umero medio (o Evidentemente, la esperanza de una variable X P o() es
esperado) de ocurrencias del suceso en el periodo considerado.
E (X) =
es siempre un n
umero positivo,
Adem
as, puede probarse que su varianza es
> 0,
V (X) =
y mide la intensidad con la que se producen las ocurrencias del suceso
en el intervalo.
Observamos que se verica
Esta intensidad cambia en funcion de la longitud del intervalo que se E(X) = V (X) =
est
e considerando, y es proporcional a la longitud del intervalo.
Las variables aleatorias de la familia de Poisson son las
unicas en las
Para calcular probabilidades sobre una distribuci
on de Poisson es im-
que la esperanza y la varianza coinciden.
portante jarse antes de nada en el intervalo de tiempo que se va a
considerar.
17 17
Ejemplo: no de ataques de leonas on: no de ataques de leonas
Soluci
El n
umero de ataques de leonas que sufre una manada de gacelas 1. Llamemos N1 al n umero de ataques de leonas que sufre la manada a
sigue una distribuci
on de Poisson con una media de 2 ataque diarios. lo largo de un da.
1. Calcular la probabilidad de que se produzcan 3 ataques en un da. Sabemos que N1 sigue una distribucion de Poisson y tambi
en que su
media o esperanza es E(N1) = 2, luego
2. Hallar la probabilidad de que no ocurra ning
un ataque en 12 horas.
3. Cu
al es la probabilidad de que en dos das consecutivos haya N1 P o (2)
menos de 3 ataques? Por tanto, la probabilidad de que se produzcan 3 ataques en un da
4. Determinar la probabilidad de que ocurra alg
un ataque en 36 horas. es
23
5. Cual es la probabilidad de que en una semana se produzcan 12 P (N1 = 3) = e2 = 0,1804
3!
ataques?
La distribuci
on del n
umero de ataques en medio da es diferente que en N2 P o(4)
un da entero. Sigue tambi
en el modelo de Poisson pero la intensidad Luego la probabilidad de que se produzcan menos de 3 ataques en
de los ataques () es la mitad. dos das es
5. La distribuci
on del n
umero de ataques en siete das es Hemos descrito la Poisson como una distribuci on que modeliza el
n
umero de ocurrencias a lo largo del tiempo, pero tambi
en sirve como
N7 P o(14)
modelo para contar las ocurrencias que se producen a lo largo de un
En consecuencia, la probabilidad de que se produzcan exactamente espacio, o de otro soporte continuo.
12 ataques en una semana es
Por ejemplo, podemos modelizar mediante una distribucion de Poisson
1412
P (N7 = 12) = e14 = 0,0984 el n
umero de puntos de oxido por metro de alambre, el numero de
12! taras por cada 10 m2 de tela, o el n
umero de pasas en una cucharada
de cereales para el desayuno.
19
Sonia Hern andez Alonso
Estadstica-Ingeniera Ambiental (URJC) 19
Valores de una variable continua Probabilidades sobre una variable continua
Al contrario de lo que ocurre con las variables discretas, no se puede Dado que no es posible determinar el peso exacto de una persona,
conocer el valor exacto de una variable continua. tiene sentido plantearse cu
al es la probabilidad de que la persona
pese exactamente una determinada cantidad?
Tomemos como ejemplo el peso de una persona elegida al azar. El
peso es una variable aleatoria continua, ya que, en principio, puede Claramente, no. Pero s tiene sentido tratar de calcular, por ejemplo,
tomar cualquier valor del intervalo (0, ). la probabilidad de que el peso de la persona este entre 60 y 65 kilos.
Si medimos los pesos con una balanza que sea capaz de distinguir Para las variables aleatorias continuas, lo interesante no va a ser cal-
hasta los kilogramos, y el resultado de la medici
on es por ejemplo cular probabilidades sobre puntos aislados, sino probabilidades de
62 kilos, entonces todo lo que podemos armar es que el peso de la que la variable se encuentre en el entorno de un punto, es decir, que
persona esta entre 61.5 kilos y 62.5 kilos. tome valores dentro de un determinado intervalo.
Si usamos una balanza m as precisa, capaz de medir hasta los hecto- En las variables continuas, la probabilidad de cada punto aislado es 0,
gramos, y el resultado de la medici on es por ejemplo 62.3 kilos, lo esto es, se verica
maximo que se puede armar es que el peso de la persona est a entre
P (X = k) = 0
62.25 kilos y 62.35 kilos...
para todo k IR.
Funci
on de densidad de una variable continua Concepto gr
aco de la funci
on de densidad
Puesto que
P (X = k) = 0
para todo k IR, no podemos describir la distribuci
on de probabilida-
des de X mediante una funci
on de masa.
La funci
on de densidad verica las siguientes propiedades: La funci
on de densidad de una variable continua X permite calcular
cualquier probabilidad acerca de dicha variable como un
area:
on no negativa, es decir, fX (x) 0 para todo x.
1. Es una funci
2. La integral de fX a lo largo de su soporte es 1, es decir, P (X A) = fX (x) dx.
A
fX (x) dx = 1. En particular, para a b, se tiene que
SX
b
area que deja por debajo fX siempre es 1:
Esto supone que el
P [a X b] = fX (x) dx.
a
funcin de densidad
0.25
0.20
0.15
f(x)
0.10
rea=1
0.05
0.00
0 5 10 15
Gr
aco: probabilidades sobre variables continuas Probabilidad de intervalos abiertos/cerrados
0.25
0.20
P [a X b] = P [a X < b]
0.15
0.15
= P [a < X b]
f(x)
f(x)
0.10
0.10
P(5<X<10) P(X<5)
0.05
0.05
= P [a < X < b]
b
0.00
0.00
0 5 10 15 0 5 10 15 = fX (x) dx.
a
21 x x
21
Ejemplo: variable aleatoria continua Ejemplo: variable aleatoria continua (continuaci
on)
Constatar que fD (x) 0 para todo x IR es trivial. Las probabilidades de que D tome un valor dentro de un determinado
En cuanto a la segunda propiedad, supone comprobar que el area de an integrando fD en ese conjunto.
conjunto se calcular
la regi
on del plano comprendida entre fD y el eje x es 1. Se tiene que Por ejemplo, la probabilidad de que el di
ametro de un eje elegido al
10 10
x x2 102 62 100 36 azar mida entre 7 y 9 metros es
dx = = = = 1. 9 9
6 32 64 6 64 64 x x2 81 49 1
P (7 < D < 9) = dx = = = = 0,5
7 32 64 7 64 2
De manera analoga podemos calcular la probabilidad de que el eje Recordemos que la funcion de distribuci
on de una variable aleatoria
mida menos de 8 metros o la de que mida mas de 5 metros: on FX que asigna a cada t IR la probabilidad de que X
X es la funci
8 8 tome un valor menor o igual que t:
x x2 64 36 28 7
P (D < 8) = dx = = = = = 0,4375
6 32 64 6 64 64 16 FX : IR (0, 1)
t FX (t) = P (X t)
P (D > 5) = 1
Para las variables continuas, la forma de calcular esta funci
on de
probabilidad acumulada es integrando la funcion de densidad de
la variable hasta el punto t:
t
FX (t) = P (X t) = fX (x) dx.
Ejemplo: funci
on de distribuci
on Ejemplo: c
alculo de probabilidades a partir de FD
23 23
Gr
aco: funci
on de distribuci
on de D (FD ) Propiedades de la funci
on de distribuci
on
funcin de distribucion de D
1
Observamos que FD :
0.7 Es mon
otona no decreciente.
0.6
Es una funci
on continua.
0.5
ci
on de las variables aleatorias continuas.
0.4
0.3
0.2
0.1
0
5 6 7 8 9 10 11
t
La esperanza o media de una variable aleatoria continua X viene Excepto en los casos triviales, como por ejemplo las variables con den-
dada por sidad simetrica, no es posible hallar E(X) sin recurrir a la integraci
on.
Pero s es posible visualizar geometricamente la esperanza:
E (X) = xfX (x) dx
SX
24 24
Ejemplo: esperanza de una variable continua Gr
aco: esperanza de una variable continua
0.4
si x [6, 10],
32
fD (x) =
0 en caso contrario.
0.3
La esperanza de D es
10 10 x2
x
f(x)
0.2
E(D) = xfD (x) dx = x dx = dx =
SD 6 32 6 32
10
x3 103 63 784
= 8,1667
0.1
= = =
32 3 6 96 96
0.0
esta m
aquina es 8,1667 metros.
E(X)
4 6 8 10 12
Varianza de una variable aleatoria continua Ejemplo: varianza de una variable continua
25 25
Familias de modelos continuos
26
Sonia Hern andez Alonso
Estadstica-Ingeniera Ambiental (URJC) 26
Soporte y funci on de X U (a, b)
on de distribuci Gr
acos de distribuciones uniformes
Consideremos dos n
umeros reales, a y b, con a < b.
X U (a, b)
La esperanza de una variable X U (a, b) es Un coche recorre con velocidad constante el tramo que va desde el
a+b kil
ometro 15 hasta el kil
ometro 25 de cierta carretera.
E(X) =
2 Sea
es decir, el punto medio del intervalo (a, b): C = posici
on del coche en un instante elegido al azar
expresada en kil
ometros.
1. Que distribuci
on tiene la variable C? Cu
al es su funci
on de den-
sidad? Y su funcion de distribucion?
2. Cu
al es la probabilidad de que el un instante aleatorio el coche se
encuentre entre el kil
ometro 18 y el kil
ometro 22?
3. Cu
al es valor esperado de C?
C U (15, 25)
Por tanto, su funci
on de densidad es
1
si 15 < x < 25,
fC (x) = 10
0 en el resto.
Integrando fC se obtiene que la funci
on de distribuci
on de C es
0 x 15,
x 15
FC (x) = 15 < x < 25,
10
1 x 25.
Soluci
on al ejemplo (continuaci
on)
3. El valor esperado de C es
Distribuci
on exponencial
15 + 25
E (C) = = 20
2
Esto indica que la posici on en la que se espera que se encuentre
el vehculo en un instante elegido al azar es el kil
ometro 20 de esta
carretera.
La distribuci
on exponencial modela el tiempo que transcurre entre Sea > 0 un numero real positivo. La variable aleatoria T sigue una
on exponencial de intensidad > 0 (T Exp ()), si su
distribuci
dos ocurrencias consecutivas en situaciones en las que que el proceso
funcion de densidad es
que genera esas ocurrencias es un proceso de Poisson, y por tanto no
tiene memoria. ex para x > 0,
fT (x) =
0 para x 0.
Esta distribuci
on es se utiliza con mucha frecuencia. Entre otras apli-
caciones, se emplea en modelos de supervivencia, en modelos de lle- Funcion de densidad de Exp(1) Funcion de densidad de Exp(3)
1.0
3.0
2.5
0.8
2.0
0.6
1.5
f(t)
f(t)
0.4
1.0
0.2
0.5
0.0
0.0
1 0 1 2 3 4 1 0 1 2 3 4
t t
Ejemplo: distribuci
on exponencial Funci
on de distribuci
on de la exponencial
El tiempo (en minutos) que transcurre entre la llegada de un trabajo a La funci on de una variable aleatoria T Exp() es
on de distribuci
un servidor y la siguiente se distribuye seg
un una variable exponencial
con intensidad = 1/6. x
0 si x 0,
FT (x) = P (T x) = fT (s) ds =
1. Cual es la probabilidad de que pasen m
as de 10 minutos entre la 1 ex si x > 0.
llegada de dos trabajos consecutivos?
2. Acaba llegar un trabajo al servidor en este instante, cu
al es la Funcion de distribucion de Exp(1) Funcion de distribucion de Exp(3)
1.0
1.0
Solucion: Sea X el tiempo (medido en minutos) trancurrido entre
0.8
0.8
dos llegadas consecutivas. Puesto que X Exp ( = 1/6),
0.6
0.6
1.
f(t)
f(t)
+
1 x x + 10
e 6 dx = e 6 = e 6 =
0.4
0.4
P (X > 10) = 0,1889
10 6 10
0.2
0.2
2.
4 x 4
0.0
0.0
1 x 4
P (X < 4) = e 6 dx = e 6 = 1 e 6 = 0,4866 1 0 1 2 3 4 1 0 1 2 3 4
29 0 6 0 t t 29
Ejemplo: distribuci
on exponencial (continuaci
on) Esperanza y varianza de la distribuci
on exponencial
La funcion de distribuci
on del tiempo en minutos que pasa entre la Integrando por partes se obtiene que, para una variable aleatoria T
llegada de un trabajo y la del siguiente en el servidor del ejemplo on T Exp(), la esperanza es
con distribuci
anterior es
0 si x 0,
1
FX (x) = E(T ) = x exdx =
x 0
1 e 6 si x > 0.
Ejemplo: distribuci
on exponencial (continuaci
on) Relaci
on entre la exponencial y la Poisson
Para el ejemplo anterior sobre tiempo entre llegadas de trabajos a un Supongamos que el numero de ocurrencias de un suceso, Nt, sigue un
servidor, el tiempo medio entre llegadas es proceso de Poisson, y que el numero esperado de ocurrencias por
unidad de tiempo es .
1 Puede demostrarse que, en ese caso, los tiempos entre llegadas, T ,
E(X) = = 6 minutos,
1/6 siguen una distribuci
on exponencial, con el mismo par ametro .
X = 6 minutos.
30 30
Ejemplo: relaci
on entre exponencial y Poisson Ejemplo: duraci
on de las bombillas
El n
umero de intentos de entradas ilegales recibidas por un servidor La duracion de cierto tipo de bombillas sigue una distribuci
on expo-
sigue una distribuci
on de Poisson con una media de 6 intentos diarios. nencial con una media de 8 meses.
Soluci
on al ejemplo Falta de memoria de la distribuci
on exponencial
Llamememos D a la duraci on de este tipo de bombillas expresada en El ejemplo anterior ilustra una propiedad importante, y caracterstica
meses, que es una variable aleatoria con distribuci
on de la distribuci
on exponencial: su falta de memoria.
D Exp( = 8) Si T Exp(), entonces
1 (x )2
fX (x) = exp
Frecuencias relativas
2 2 2
0.3
La distribuci
on normal es sim
etrica con respecto a , y por tanto su
mediana es tambi en .
Adem
as es una distribuci
on unimodal, y su moda coincide con la
media y la mediana.
La funci
on de densidad de la distribuci
on normal presenta esa forma
acampanada que se conoce como campana de Gauss.
Importancia de la distribuci
on normal Transformaciones lineales de la normal
Las mediciones de magnitudes incluyen habitualmente errores que, Una propiedad importante de las distribuciones normales es que, al
en la mayora de los casos, siguen una distribuci
on normal. aplicarles una transformaci
on lineal, se obtiene otra distribuci
on
normal.
Pero, si la distribuci
on normal ocupa un lugar tan destacado, no es
s
olo porque explique la teora de los errores, sino tambien porque Es decir, si X N (, 2), y a, b IR, entonces la variable aleatoria
representa un tipo de variabilidad muy habitual en la naturaleza.
Y = aX + b
Numerosos fenomenos presentan una distribuci
on de probabilidad sim
e- tambi
en sigue una distribuci
on gaussiana.
trica y en forma de campana. La distribuci on normal modela ade-
cuadamente gran parte de estos fen
omenos. Las propiedades de la esperanza y la varianza implican que
Adem as, el Teorema Central del Lmite establece que para muestras E(Y ) = E(aX + b) = aE(X) + b = a + b,
grandes, muchas funciones de las observaciones muestrales tienen una
distribucion que es aproximadamente normal. Esto hace de las distri- V (Y ) = V (aX + b) = a2V (X) = a2 2.
buciones gaussianas una herramienta indespensable en la inferencia
estadstica. Por tanto,
X N (, 2) = Y = aX + b N (a + b, a2 2).
33 33
Ejemplo: transformaciones lineales de la normal Tipicaci
on de la distribuci
on normal
La temperatura de Charagua (Bolivia), expresada en grados centgra- Como consecuencia de lo anterior se deduce que, si X N (, 2),
on normal con una media de 20oC y una
dos, sigue una distribuci entonces,
o 2
varianza de 25 C , X
N (0, 1).
C N ( = 20, 2 = 25)
A la distribuci
on N (0, 1) se le llama normal est
andar, o normal tipi-
Llamemos F a la variable aleatoria que recoge la temperatura de esa cada, y habitualmente se denota por Z.
misma localidad expresada en grados Farenheit. Puesto que
Ejemplo: Consideremos la variable C que recoge la temperatura de
F = 1,8 C + 32, Charagua en grados centgrados, cuya distribuci
on es normal con me-
dia 20oC y varianza 25oC2,
la distribuci
on de F tambi
en es gaussiana. Sus par
ametros son
C N ( = 20, 2 = 25)
E(F ) = E(1,8 C + 32) = 1,8 E(C) + 32 = 1,8 20 + 32 = 68,
V (F ) = V (1,8 C + 32) = 1,82 V (C) = 1,82 25 = 81. La distribuci
on de la variable aleatoria
C 20
Luego la distribuci
on que sigue F es
5
F N ( = 68, 2 = 81) es una normal estandar:
C 20
N (0, 1)
5
La distribuci
on normal est
andar Simetra de la normal est
andar
La funci
on de densidad de la normal est
andar o
N (0, 1) es Como puede observarse en el r aco, la funci
on de densidad de la
1 2 normal est
andar es sim
etrica con respecto a 0, es decir, verica,
fZ (x) = ex /2,
2
fZ (x) = fZ (x)
Funcion de densidad de N(0,1)
para todo x, lo cual implica que
0.4
P (Z A) = P (Z A).
P (Z 2) = P (Z 2),
0.2
f(t)
34 34
4 2 0 2 4
t
etc
etera
C
omo calcular probabilidades sobre la normal? C
alculo de probabilidades sobre la normal
Supongamos que queremos calcular la probabilidad de que en un de- Afortunadamente, muchos programas (no s olo los paquetes estadsti-
terminado momento, la temperatura en Charagua este entre los 22 y cos) permiten computar probabilidades y cuantiles relativos a la nor-
los 25 grados. mal est
andar: R, Excel, SPSS, Matlab, etc.
Denotaremos L la longitud de una hembra seleccionada al azar. 2. Para determinar la probabilidad P (L > 5,5) escribimos 5.5 en la ven-
tana Valor(es) de la variable, la misma media y desviaci on tpica
1. Para calcular la probabilidad de que una hembra elegida aleatoriamen-
que en el apartado anterior, y elegimos la opci
on Cola derecha. El
te mida menos de 4.5 cm, P (L < 4,5), pinchamos en
resultado es que
Distribuciones > Distribuciones continuas > Distribuci
on nor-
P (L > 5,5) = 0,0256
mal > Probabilidades normales
En la ventana que se abre tecleamos lo siguiente: 3. Para hallar la probabilidad de que la longitud de una hembra est
e entre
4.00 y 5.00 cm debemos observar que
Valor(es) de la variable: 4.5
P (4 < L < 5) = P (L < 5) P (L < 4)
Media: 4.35
Tanto P (L < 5) como P (L < 4) se puede calcular de la misma manera
Desviaci
on tpica: 0.59
que en primer apartado, incluso se pueden meter ambos n umeros a la
Puesto que se trata de una probabilidad de ser menor elegimos la vez en la ventana Valor(es) de la variable separados por una coma.
opci
on Cola izquierda. La probabilidad que buscamos es
De este modo obtenemos que P (4 < L < 5) = P (L < 5) P (L < 4) = 0,8647 0,2765 = 0,5882
P (L < 4,5) = 0,6003
Cuantiles de la distribuci
on normal est
andar Gr
aco: cuantil z de la normal est
andar
Z N (0, 1)
P (Z > z) = ,
o lo que es lo mismo,
P (Z < z) = 1 .
36 36
B
usqueda de cuantiles de Z con R-commander Gr
aco: cuantil z0,1
Probabilidades: 0.025
Media: 0 (valor por defecto)
Desviaci
on tpica: 1 (valor por defecto)
Elegimos la opci
on Cola derecha, y aparece el valor 1.959964, es
decir, aproximadamente 1.96. Luego
z0,025 = 1,96
De forma an
aloga puede comprobarse, por ejemplo, que
z0,01 = 2,33
z0,05 = 1,65
z0,10 = 1,28
Por qu
e es central la distribuci
on normal?
37
Sonia Hern andez Alonso
Estadstica-Ingeniera Ambiental (URJC) 37
Independencia de variables aleatorias Variables aleatorias i.i.d.
Las variables aleatorias X1, X2, . . . , Xn son independientes si para Supongamos que X1, X2, . . . , Xn son realizaciones independientes de
on de conjuntos A1, A2, . . . , An IR se verica
cualquier colecci una distribucion de probabilidades com un. En tal caso podemos de-
cir que X1, X2, . . . , Xn son variables independientes e id
enticamente
P (X1 A1, X2 A2, . . . , Xn An)
distribuidas, o escrito abreviadamente, variables i.i.d.:
Cuando las variables son independientes, el hecho de conocer el valor Cuando se extraen al azar muestras de una poblaci on, lo habitual
de alguna(s) de ellas, no afecta a la distribuci
on de probabilidades de es que las observaciones se escojan de manera independiente unas
las dem
as. de otras.
Si X1, X2, . . . , Xn son i.i.d., es evidente que tienen todas la misma El teorema central del lmite establece que, si X1, X2, ..., Xn son varia-
bles aleatorias independientes e identicamente distribudas con media
media (que podemos denotar ) y la misma varianza (que denota-
y varianza 2, entonces, para n sucientemente grande se verica
remos 2):
X1 + . . . + X n 2
E (X1) = . . . = E (Xn) = , N ,
n n
V (X1) = . . . = V (Xn) = 2.
sin que importe cu
al sea la distribuci
on de las variables X1, X2, ..., Xn.
Consideremos el promedio de estas n variables aleatorias:
X1 + . . . + Xn M
as exactamente, lo que asegura este teorema es que, si
X=
n X1, X2, ..., Xn i.i.d.
Para ilustrar gr
acamente el teorema central del lmite, vamos a uti- Puntuacin en el lanzamiento de 1 dado
lizar el caso del lanzamiento de un dado equilibrado.
0.20
El resultado de cada lanzamiento es una variable aleatoria discreta,
X, con funci
on de masa
0.15
1 2 3 4 5 6
X
1 1 1 1 1 1
6 6 6 6 6 6
0.10
En la transparencia siguiente aparece representada esta distribuci
on
mediante un barras. El gr aco evidencia que la distribuci
on de X
0.05
diere mucho de una normal.
0.00
1 2 3 4 5 6
Observemos que la esperanza de X es Supongamos ahora que no lanzamos el dado una unica vez, sino n
veces. Los n lanzamientos son n variables aleatorias independientes
y todas con la misma distribuci on:
1 1 1 21
E(X) = 1 + 2 + ...6 = = 3,5
6 6 6 6
Adem
as 1 2 3 4 5 6
1 1 1 91 X1, X2, X3, ..., Xn
E(X 2) = 12 + 22 + . . . 62 = = 15,17 1 1 1 1 1 1
6 6 6 6 6 6 6 6 6 6
Por tanto la varianza de X es El promedio de las n puntuaciones es otra variable aleatoria
V (X) = E(X 2) E 2(X) = 15,17 3,52 = 2,92 X1 + X2 + ... + Xn
X=
n
39 39
Ejemplo del TCL: lanzamiento dado (continuaci
on) Ejemplo del TCL: lanzamiento dado (continuaci
on)
Para comprobar lo que dice el TCL sobre este ejemplo, los gr acos Los gr
acos siguientes muestran el promedio de 4 y 6 lanzamientos,
siguientes muestran la distribuci
on del promedio de 2 lanzamientos de respectivamente:
un dado y de 3 lanzamientos, respectivamente:
Media del lanzamiento de 4 dados Media del lanzamiento de 6 dados
0.12
0.10
Media del lanzamiento de 2 dados Media del lanzamiento de 3 dados
0.20
0.14
0.10
0.08
0.12
0.08
0.15
0.10
0.06
0.06
0.08
0.04
0.10
0.04
0.06
0.02
0.04
0.02
0.05
0.02
0.00
0.00
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6
0.00
0.00
Representaci
on del promedio de 10 y 30 lanzamientos: Montgomery, D.C. et al (2011). Engineering Statistics. Wiley
Captulo 3.
Media del lanzamiento de 10 dados Media del lanzamiento de 30 dados
0.04
Captulos 5 y 6.
0.06
0.03
0.05
Pe
na, D. (2001) Fundamentos de Estadstica. Alianza Editorial
0.04
0.02
Captulos 4 (secci
on 4.4) y 5 (secciones 5.1, 5.2, 5.4 y 5.5)
0.03
0.01
ciencias. Pearson
0.01
0.00
Captulos 3, 4, 5 y 6.
0.00
1.1 1.5 1.9 2.3 2.7 3.1 3.5 3.9 4.3 4.7 5.1 5.5 2.1 2.4 2.7 3 3.2 3.5 3.8 4 4.2 4.5 4.8
Cesar P
erez L
opez (2003) Estadstica: Problemas resueltos y aplica-
Es evidente que la distribuci
on del promedio de las variables se va ciones. Pearson Educaci
on
aproximando a una distribuci
on normal centrada en = 3,5.
40 Captulos 5 y 6. 40
Funci
on de distribuci
on de la normal est
andar
La funci
on de distribuci
on de la normal est
andar, que suele denotarse
por , es
z
1 z t2
(z) = P (Z z) = fZ (t) dt = e 2 dt.
2
C
alculo de probabilidades sobre la normal est
andar Gr
aco: probabilidades sobre Z
(1,47) = 0,9292
(z) = P (Z z) = P (Z z) = 1 P (Z z) = 1 (z) .
Por ejemplo,
41 41
Gr
aco: probabilidades sobre Z C
alculo de probabilidades sobre Z (continuaci
on)
Como adem
as,
P (a X b) = P (a X < b)
= P (a < X b)
= P (a < X < b)
= (b) (a) ,
Por ejemplo,
C
alculo de probabilidades sobre Z (continuaci
on) Cuantiles de la distribuci
on normal est
andar
Otros ejemplos: Una busqueda inversa permite hallar los percentiles de la normal
est
andar.
P (Z 0,85) = 1 (0,85)
= 1 0,8023 Para buscar z en la tabla de la normal est
andar se mira la entrada
= 0,1977 (1 ) y con su la y su columna se determina z. Para valores
intermedios se interpola.
P (0,34 < Z < 0,62) = (0,62) (0,34) Por ejemplo,
= 0,7324 (1 0,631)
z0,025 = 1,96
= 0,3655
z0,05 = 1,645
z0,1 = 1,28
P (Z 0,65) = P (Z 0,65)
z0,01 = 2,33
= (0,65)
z0,5 = 0...
= 0,7422,
42 42
C
alculo de probabilidades para otras normales Ejemplo: probabilidades de la distribuci
on normal
Para calcular probabilidades de distribuciones gaussianas diferentes de La longitud de las hembras de conejo com
un (Oryctolagus cuniculus)
la normal est
andar se usa el hecho de que, si sigue una distribucion normal con media = 4,35 cm y desviacion
tpica = 0,59 cm.
X N , 2 ,
entonces, 1. Calcular la probabilidad de que una hembra elegida aleatoriamente
X mida menos de 4.5 cm.
Z= N (0, 1) ,
2. Cu
al es la probabilidad de que una coneja mida m
as de 5.50 cm?
y por tanto
3. Hallar la probabilidad de que la longitud de una hembra seleccio-
a X b
P (a X b) = P nada al azar est
e entre 4.00 y 5.00 cm.
a b Llamaremos L a la longitud (en centmetros) de una hembra de conejo
= P Z
elegida al azar.
b a
= .
Soluci
on al ejemplo Soluci
on al ejemplo (continuaci
on)
= 1 (1,95) = 0,5867.
= 1 0,9744
43 = 0,0256. 43