Anda di halaman 1dari 26

Universidad Catlica de Salta

Ctedra de Modelos y Simulacin


Apuntes de Ctedra
Unidad III

Mg. Ing. Gustavo Ramiro Rivadera


Ao 2015

Unidad 3: Variables aleatorias

1.

Generacin de variables aleatorias


1.1

Introduccin

Toda simulacin de un sistema discreto necesita especificar cmo se producen las variaciones aleatorias
en sus fuentes de aleatoriedad. Esto se establece por medio de la asignacin de una distribucin de
probabilidad a cada fuente de aleatoriedad. Un ejemplo clsico es la simulacin de un sistema de una cola
y un servidor. La llegada de entidades (dinmicas) al sistema ocurre con cierta frecuencia, y es por lo
tanto una fuente de aleatoriedad. Por otra parte, el servidor sirve a las entidades dinmicas durante un
cierto tiempo de servicio, que es la otra fuente de aleatoriedad en este sistema simple. Por lo tanto de lo
enunciado antes surge que en esta simulacin se necesitarn dos distribuciones que especifiquen la
frecuencia de los tiempos aleatorios, el de llegada y el de servicio. La definicin de cual distribucin
utilizar para cada fuente de aleatoriedad est dada por un anlisis estadstico previo de ajuste.
Todo entorno, librera o lenguaje de simulacin debe, por lo tanto, proporcionar medios adecuados para la
generacin de estos valores aleatorios. La base para la generacin de cualquier mtodo para la generacin
de valores de distribuciones aleatorias es un generador de valores IID U(0,1). Es por esta razn que es
esencial que se disponga de un generador de nmeros aleatorios U(0,1) confiable.
Existen por para ciertas distribuciones de probabilidad varios tipos de algoritmos. La eleccin de un
algoritmo en particular depende de varios factores, pero sobre todo se trata de obtener algoritmos que
traten de ser lo ms exactos y eficientes posible.
En este captulo presentaremos en forma conjunta algunas de las muchas distribuciones de probabilidad
utilizadas en la prctica de la simulacin, as tambin como uno de los algoritmos disponibles para su
generacin.
Hacemos la aclaracin pertinente de que las distribuciones se describen en este captulo solo de forma
general, ya que este trabajo no pretende ser un tratado de estadstica, sugirindose al lector interesado la
consulta de fuentes ms completas y generales como [Vardema94] ,[WalpMyer92], etc.
Adems de la descripcin general de las distribuciones continuas y discretas, se hace una descripcin del
mtodo utilizado para generar valores aleatorios de dichas distribuciones. Para la comprensin total de
dichos mtodos es preciso referirse primeramente a ciertos mtodos generales para la generacin de
valores aleatorios, tales como los denominados de la transformada inversa, de la composicin, de la
convolucin, etc. que explicaremos a continuacin.

1.2

Definicin de variable aleatoria

Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio. Puede
ser discreta o continua. Si puede tomar slo un nmero limitado de valores, entonces es una variable
aleatoria discreta. En el otro extremo, si puede tomar cualquier valor dentro de un intervalo dado,
entonces se trata de una variable aleatoria continua.
Se puede pensar en una variable aleatoria como un valor o una magnitud que cambia de una presentacin
a otra, sin seguir una secuencia predecible. Los valores de una variable aleatoria son los valores
numricos correspondientes a cada posible resultado de un experimento aleatorio.
Formalmente: sea un experimento E y S el espacio muestral asociado con el experimento; una funcin X
que asigna a cada uno de los elementos de S un nmero real X(s), se llama variable aleatoria.

1.3

Definicin de funcin de densidad de probabilidad

En el caso de variables aleatorias continuas, en lugar de trabajar con la probabilidad de valores


particulares de la variable, resulta ms apropiado calcular probabilidades asociadas a intervalos. Para
distribuir propiedades se usa una funcin que mide "concentracin" de probabilidades alrededor de un
punto, que se denomina funcin de densidad de probabilidad y se denota como f(x).
Una funcin de densidad de probabilidad debe cumplir con las siguientes propiedades:
f(x) >= 0 (la funcin es no negativa para cualquier valor de x, f(x) no es una probabilidad, y
puede valer ms de 1)
f(x) dx = 1 (la acumulada para todos los valores de la variable suma 1, el rea bajo la curva de la
funcin vale 1).

Unidad 3: Variables aleatorias

Funcin de densidad de probabilidad normal

1.4

Definicin de funcin de densidad de probabilidad


acumulada

Sea X una variable aleatoria, discreta o continua; definimos a F, la funcin de densidad de distribucin
acumulada de la variable aleatoria X, como F(x) = P(X <= x), y adems:
i) Si X es una variable aleatoria discreta, entonces:

F ( x) p ( x j )
j

ii) Si X es una variable aleatoria continua con fdp f:


x

F ( x) f (t )dt
0
donde f(t) representa el valor de la fdp de la variable aleatoria X, cuando X = t.

Funcin de distribucin de probabilidad (Acumulada)

1.5

Mtodos de Generacin

1.5.1 Mtodo de inversin o Transformada Inversa


3

Unidad 3: Variables aleatorias

Este mtodo se basa en la funcin inversa de la funcin de distribucin de la variable aleatoria X. Dado
que F(X) est acotada entre 0 y 1, podemos generar valores en U(0; 1) y sobre ellos aplicar F -1(X).
Se utiliza la funcin de distribucin acumulada F(x). Como F(x) est definida entre 0 y 1, entonces se
necesita generar nmeros aleatorios uniformemente distribuidos entre 0 y 1.
Si representamos un nmero aleatorio con R , entonces
R = F(x)
x=F-1(R)
Es por esto que se denomina al mtodo como el de la transformada inversa. Dada una funcin acumulada
de una distribucin, se obtiene el valor de la variable.
Prueba: si F(x) es invertible,

F( x ) P( X x)

P(X x ) P( F 1 ( R ) x) P( R F(x)) F(x)


Grficamente la idea es:

F(x)

x
Por ejemplo, tomemos la distribucin exponencial con media en , y cuyas funciones de distribucin y
densidad son las siguientes:

f (x ) .e

; x

0 ; o x < 0
x

F (x ) f (x ).dx .e
0

.dx

F (x ) e

1 x
.dx .e

1 x
1
x
F (x ) . .e
( ) 1 e
R

La funcin inversa de F(X) ser:


e

.x ln(1 R )

1 R

1
x .ln(1 R )

es decir:

1
. ln R

R: nmero aleatorio.
Y el algoritmo para generar valores aleatorios para esta distribucin ser:
4

Unidad 3: Variables aleatorias

def exponential(media):
u = random(0,1)
return -log(1-u)/media
El mtodo de la inversa es especialmente til para generar valores de variables aleatorias discretas.
Veamos un ejemplo. supongamos que tenemos una variable aleatoria discreta con espacio de muestreo S
= f1; 2; 3g, y cuya funcin de densidad es la siguiente:
p(1) = 0:2 p(2) = 0:3 p(3) = 0:5
Entonces su funcin de distribucin ser:
F(1) = 0:2 F(2) = 0:2 + 0:3 = 0:5 F(3) = 0:5 + 0:5 = 1
As, en el eje de F(x) podemos identificar tres intervalos: (0; 0:2], (0:2; 0:5] y (0:5; 1]. Para obtener
valores para esta variable, generaremos un valor para U(0; 1), y determinaremos su inversa a partir del
intervalo en el que caiga. Si ste cae en el primer invervalo, el valor de F_1 ser 1, si en el segundo 2, y si
en el tercero 3. As, el algoritmo para generar valores para esta variable
aleatoria ser el siguiente:
def genera_discreta(p1, p2, p3):
u= random(0,1)
if u<=p1:
finv = 1
elseif u<=p1+p2:
finv = 2
else:
finv = 3
return finv
Este tipo de distribuciones suele aparecer en los diagramas de eventos, concretamente cuando un suceso
planifica la ocurrencia de otros sucesos con una determinada probabilidad.
Como ejercicio se plantea realizar una funcin para obtener valores aleatorios segn una distribucin
discreta representada con una lista de cualquier longitud (por ejemplo [0.1, 0.3, 0.4, 0.2] o [0.5, 0.3,0.2],
etc.)

1.5.2 Ejemplos:
1.5.2.1 Mtodo de la transformada inversa discreta:
Suponemos un dado X probable, que nos lleva a la siguiente tabla de probabilidades:
X
1
2
3
4
5
6

P(X)
1/6
1/6
1/6
1/6
1/6
1/6

F(X)
1/6
2/6
3/6
4/6
5/6
1

Como se comprueba, en la columna de la derecha, se ha calculado la FUNCION DE DISTRIBUCION


ACUMULADA, F(x), una de cuyas propiedades es 0 <= F(x) <= 1, es decir, similar a las variables de
tipo u, 0 <= u <= 1. En definitiva, u = F(x) que es el fundamento bsico del mtodo.

Unidad 3: Variables aleatorias

La funcin de probabilidad P(x) tiene la siguiente forma:


0,20
0,15
0,10
0,05
0,00
0

La funcin acumulada F(x) para esos puntos es:


1,2
1,0
0,8
0,6
0,4
0,2
0,0
0

Ahora se procede a invertir los ejes:


7
6
5
4
3
2
1
0
0

1/6

1/3

1/2

2/3

5/6

Luego, generar (mediante un generador congruencial) una variable tipo u, son nmeros pseudoaleatorios
generados (0, 1) uniformemente distribuidos en ese intervalo y continuas en el sentido numrico.
Si p = 3 0,001 0,999 p es una distribucin de probabilidad constante.
Ahora se supone; u = 0,4 x = 3. Con la tabla, se busca en F(x) el primer valor mayor que u, en la
columna x est el valor que le corresponde.
u = 0,6 x = 4
u = 0,9 x = 6
Resumiendo:
El primer paso es establecer la funcin de distribucin acumulada.
El segundo paso es formar la tabla correspondiente a fin de establecer los nmeros ndices. Los nmeros
ndices se asignan de manera tal que puedan reflejar la probabilidad de los diversos valores que asume la
variable aleatoria.
El tercer paso es obtener las variables de tipo u y realizar la simulacin.
A continuacin, el diagrama de flujo del mtodo:
6

Unidad 3: Variables aleatorias

Buscar Tabla

Leer x[i]
Leer PX[i]

u=GenerarU

tope
i = 1
i = 1, tope
Buscar Tabla

i <= tope

FX[i]=FX[i-1] + PX[i]
FX[i] >= u

X[i]
i = tope

i = i+1

1.5.2.2 Mtodo de la transformada inversa continua:


Supongamos una variable aleatoria en el intervalo (10, 12)
Encontrar f(x) como una funcin de densidad de probabilidad rea = 1
1,2
1
0,8
0,6
0,4
0,2

0
10

12

rea = 1
(B * h) / 2 = (2 * h) / 2 = 1 h = 1

y y1
y f x

y 2 y1
x x1
y = (x/2) - 5
x 2 x1

Encontrar la funcin Acumulada F x f x dx

x2
x

5
dx

5 x 25

2
4
Determinar la funcin inversa F-1

F x U F x U 0
F 1 U x

b b 2 4ac
2a
x = 2(5 u )
x

Encontrar el Signo: Uno de los valores de x hallados se corresponde al problema y el otro puede que no
sea as, por lo tanto se debe determinar cual es el x apropiado.
Para u = 0
x = 10
Para u = 1
x = 12
7

Unidad 3: Variables aleatorias

u = 0 x = 10
u = 1 x = 12
u = 0 x = 10
u=1x=8

+:
-:

x = 2(5

u)

1.5.2.3 Resumiendo
Mtodo de la transformada inversa:

La tcnica de la transformada inversa puede ser usada para obtener muestras de las
distribuciones exponenciales, uniforme, Weibull y triangular.
El principio bsico es encontrar la funcin inversa de F,
de tal forma que
.

denota la solucin a la ecuacin r = F(x) en trminos de r, no es 1/F. Por ejemplo, la inversa de y =


x es x = y, la inversa de y = 2 x + 1 es x = (y-1)/2 , etc.

1.5.2.4 Ventajas y desventajas


La desventaja de este mtodo es que se necesita tener la expresin de x = F-1 ( R ), la que no es siempre
fcil de encontrar. De todas maneras puede trabajarse con tablas de nmeros e interpolar, de hecho esto es
lo que hacen algunos lenguajes de simulacin como el GPSS que veremos en el curso de Simulacin: se
le ingresa F(x) vs. x como tabla numrica, le asigna un valor R a F(x) e interpola en la tabla para obtener
x; el mtodo de interpolacin depende de que la funcin sea continua o discontinua, lo que tambin hay
que especificarle.

1.5.2.5 Condiciones para aplicar el Mtodo de la


Transformada Inversa
1.
2.
3.

Debe existir f(x) como una funcin de densidad de probabilidad.


f(x) debe ser integrable, es decir, se pueda calcular F(x)
F(x) debe ser invertible, para poder calcular F-1

1.5.3 Mtodo del rechazo


Cuando no podamos calcular la inversa de la funcin de distribucin, lo que sucede en la mayor parte de
las distribuciones continuas, entonces tendremos que basarnos en la funcin de densidad f(x).
El mtodo del rechazo utiliza una funcin de densidad g(x) para la cual sabemos generar nmeros
aleatorios (ej. una uniforme), y que adems recubre por completo la funcin de densidad que queremos
obtener, es decir:
a g(x) f(x)
El mtodo sirve para generar variables aleatorias en las que x est acotada en un intervalo [a,b], a x b.
Se utiliza la funcin distribucin de probabilidad f(x) y el concepto de moda:
M = mximo valor de f(x) f(x) acotada.
Es un mtodo iterativo para generar cada valor de x.
Como paso previo hay que dividir todos los valores de la funcin por la moda, implica escalonarla entre 0
y 1, de manera de asociarla con los nmeros pseudoaleatorios.
El algoritmo para generar valores a partir de g(x) ser el siguiente:
8

Unidad 3: Variables aleatorias

1.5.3.1 Para funciones discretas


Pasos a seguir:
1. Generar 2 nmeros pseudoaleatorios uniformemente distribuidos: u1, u2
2. Definir x como una funcin lineal de u:

x INT a b a 1u1

x se denomina postulado o propuesto.


3. Evaluar la funcin en el punto x.
4. Calcular la probabilidad relativa de aceptacin

PRA

P x
PMAX

5. Comparar el u2 con la PRA; si


punto(1)

u2 PRA aceptamos x ; de lo contrario, se repite desde el

Algoritmo:
I
Leer x[i]
Leer PX[i]

Generar u 1,u 2
a = Buscar_A
b = Buscar_B
x = INT[a + (b - a + 1) u 1]
PX[i] = Buscar_PX
PMAX = Buscar_PMAX
PRA = PX[i]/PMAX

u 2 <= PRA

NO

SI
x
F

1.5.3.2 Para funciones continuas


Pasos a seguir:
1. Encontrar f(x) como una funcin de densidad de probabilidad.
2. Generar u1 y u2. Definir x como una funcin lineal de u.
3. Evaluar f en el x propuesto.
9

x a b a u1

Unidad 3: Variables aleatorias

4. Calcular PRA

f x
f x

f x
PMAX
1

5. Evaluar el resultado obtenido en el punto anterior.


punto (2)

u 2 PRA aceptar x, sino volver al

Consideraciones:
El mtodo de eliminacin para Funciones Discretas puede no ser ptimo porque genera dos u como
mnimo y no todos los x generados se aceptan. Tiene la ventaja respecto a la transformada inversa que no
necesitamos trabajar con tablas ni necesitamos calcular la acumulada.
El mtodo de eliminacin para funciones continuas, tiene la misma desventaja que el de funciones
discretas. Por otro lado, no es necesario hallar la integral ni la inversa.
Para que funcione eficientemente, el algoritmo debe utilizar una funcin g(x) sencilla, y que se ajuste lo
ms posible a la funcin f(x). De ella depender el nmero de iteraciones del algoritmo.
Veamos un ejemplo presentado en [Raj Jain, 1991]. Supongamos que queremos generar una secuencia de
valores para la distribucin beta(2; 4), cuya funcin de densidad es:
f(x) = 20 _ x(1 _ x)3
Esta funcin puede ser recubierta por un rectngulo de altura 2:11, que es el mximo de la funcin. Por lo
tanto, tomando g(x) = U(0; 1) y a = 2:11, obtendremos el siguiente algoritmo:
def beta2_4():
a = 2.11
x = random(0,1)
u = random(0,1)
while (u_a <= (20*x*(1-x)**3)):
x = random(0,1)
u = random(0,1)
return x

1.5.4 Mtodo de Convolucin


Si X es la suma de dos variables aleatorias Y1 y Y2, entonces la funcin de distribucin de X puede
obtenerse analticamente mediante la convolucin de las funciones de distribucin de Y1 y Y2. Este es el
principio del mtodo de convolucin: para obtener los valores de X bastar con generar 2 valores para Y1
y Y2, y devolver su suma.
Es importante destacar que la suma de un conjunto de variables aleatorias (denominada convolucin) es
un concepto diferente al de la suma de sus funciones de distribucin (composicin).
Existen varias distribuciones que pueden generarse por convolucin:
Una variable con distribucin normal puede obtenerse sumando un nmero suficiente de
variables aleatorias con cualquier distribucin.
Una variable con distribucin 2 con k grados de libertad puede obtenerse sumando los cuadrados
de k variables con distribucin N(0; 1).
Una variable con distribucin Erlang-k puede obtenerse sumando k variables con distribucin
exponencial.
La suma de dos variables con distribucin U(0; 1) forma una variable con distribucin triangular.
Resumiendo:

La distribucin de probabilidad de la suma de dos o ms variables aleatorias independientes se


denomina una convolucin de las distribuciones de las variables originales.
Por ejemplo, para la distribucin de Erlang:

10

Unidad 3: Variables aleatorias

Es demostrable que una variable aleatoria Erlang X con parmetros


de K variables aleatorias exponenciales

es la suma

, cada una con media

Todos estos mtodos pueden encontrarse debidamente explicados en [LawKelt91] y [Taha88] y otros
tratados de simulacin.

1.5.5 Mtodo de composicin


Permite generar valores de variables aleatorias no uniforme expresando f(x) como una mezcla de
varias distribuciones de probabilidad fi(x) que se seleccionan adecuadamente.
Pasos a seguir:
1. Dividir f(x) en sub-reas.
2,5
f 2( x )

2
1,5
f 1( x )

f 3( x )

1
A1

A2

A3

0,5
0
4

2. Definir una distribucin de probabilidad para cada sub-rea: fi(x), donde

f x A1 f 1 x A2 f 2 x ... An f n x
n

A
i 1

3. Obtener la distribucin de las reas.

A 1+ A 2+ A 3

fi

A 1+ A 2

A1

f 1(x )

f 2(x )

f 3(x )

4. Generar u1 y u2.
5. Seleccionar fi(x), mediante: inversin de ejes.
Se debe buscar con u1 la funcin de probabilidad a trabajar.

11

Acumuladas

Unidad 3: Variables aleatorias

f 3( x )

f 2( x )

f 1( x )

A1

A 1+A 2

A 1+A 2+A 3

f2(x) = M.T.I. o M.A.R. (para funciones Continuas)


x = en funcin de u u2 en funcin de x

2. Distribuciones de Probabilidad
2.1

Distribuciones continuas

En esta parte se describen las algunas distribuciones continuas existentes, y su algoritmo de generacin de
valores aleatorios. El algoritmo que se presenta es el que entendemos ms simple de describir e
implementar, y que adems presenta cierta eficiencia en la generacin. Adems los algoritmos son por lo
general mtodos exactos, no aproximaciones.

2.1.1 Distribucin Uniforme


Descripcin
Esta distribucin tiene una aplicacin posible como una primera aproximacin a una fuente de
aleatoriedad que se presiente vara entre los parmetros a y b, pero de la cual se saben muy pocas cosas.
Por otra parte esta distribucin es esencial para la generacin de valores aleatorios para las otras
distribuciones.
Las funciones de densidad de probabilidad y la acumulada se describen abajo:

Los parmetros de esta distribucin son los valores a y b.


La figura 6.1 muestra la funcin de densidad.

12

Unidad 3: Variables aleatorias

Figura 6.1: Funcin de densidad de la distribucin uniforme

Generacin
La funcin de distribucin de una variable aleatoria U(a,b) se invierte fcilmente resolviendo u = F(x)
para x, de tal forma de obtener , para 0 u 1,

x F 1 (u) a (b a)u
De esta forma se puede utilizar el mtodo de la transformada inversa para generar X:
1. Generar U U(0,1).
2. Devolver X = a + (b - a) U

2.1.2 Distribucin Exponencial


Descripcin
Las aplicaciones de esta distribucin son en general la generacin de tiempos de arribos de entidades
dinmicas de simulacin (clientes, piezas, etc.) a un sistema con una tasa constante.
Las funciones de densidad de probabilidad y la acumulada se describen abajo :

Esta distribucin tiene un solo parmetro, , denominado parmetro de escala y que es mayor que cero.
La funcin de densidad se muestra en la figura 6.2.

Figura 6.2:Funcin de densidad de la distribucin exponencial

Generacin
Para obtener el algoritmo de generacin de esta distribucin, seguimos el mtodo de la transformada
inversa, y tratamos de encontrar F-1, y entonces hacemos :
F-1(u) = - ln (1 u)
Por lo tanto, el algoritmo se reduce a :
13

Unidad 3: Variables aleatorias

1.
2.

Generar U U(0,1).
Devolver X = - ln (1 u)

2.1.3 Distribucin Gamma o Erlang


Descripcin
Una de las aplicaciones posibles de esta distribucin en la simulacin es la generacin para completar
algunas tareas, por ejemplo tiempos de servicios en servidores de clientes o servidores que son mquinas
de un taller.
Las funciones de densidad de probabilidad y la acumulada se describen abajo :

Los parmetros y se denominan parmetros de forma de la distribucin Si el parmetro es un


entero positivo se denomina a esta distribucin como Erlang. La distribucin de Erlang con parmetros
y es la suma o convolucin de distribuciones exponenciales independientes e idnticamente
distribuidas con media igual a 1/. Esta relacin es a menudo muy til en las simulaciones, ya que por
ejemplo, si se tiene una simulacin donde llegan trabajos a un taller con una tasa de llegada exponencial
de media igual a 1/., y estos trabajos se asignan en base a una poltica de rotaciones a n mquinas, los
tiempos de asignacin de los trabajos a cada mquina se distribuyen necesariamente con una distribucin
Erlang(.,n).
La funcin de densidad se muestra en la figura 6.3.

Figura 6.3:Funcin de densidad de la distribucin Gamma o Erlang


Obsrvese que la forma de esta distribucin cambia en relacin al parmetro . Si = 1, esta distribucin
se reduce a la exponencial.

Generacin
Como se dijo anteriormente, si X es una distribucin de Erlang con media 1/., se puede escribir que X =
Y1+ Y2++ Ym, donce los Yi son variables aleatorias exponenciales IID con media igual a . Esto conlleva
a utilizar un algoritmo basado en esta convolucin (suma). Sin embargo el algoritmo ms utilizado se
basa en esta propiedad pero tambin en el mtodo de la transformada inversa, aplicado a la generacin de
cada valor exponencial en la convolucin :

m
X Yi
ln U i
i 1
i 1 m
i 1
m

Luego el algoritmo puede ser descripto como sigue :


1.
3.

Generar U1, U2 , , Um como IID U(0,1).


m
Devolver X ln U

m i 1
14

Unidad 3: Variables aleatorias

2.1.4 Distribucin de Weibull


Descripcin
Esta distribucin se utiliza en la simulacin para asignar tiempos para completar alguna tarea, tiempos
para que ocurra una falla en una pieza de equipo, etc. En general esta distribucin tiene una amplia
aplicacin en modelos de confiabilidad de materiales y/o mquinas.
Las funciones de densidad de probabilidad y la acumulada se describen abajo :

El parmetro se denomina parmetro de forma, mientras que el o se denomina parmetro de escala.


La funcin de densidad se muestra en la figura 6.4.

Figura 6.4:Funcin de densidad de la distribucin Weibull


Si = 1 esta distribucin se reduce a la exponencial.

Generacin
Los valores para esta funcin se generan fcilmente invirtiendo la funcin de densidad mostrada ms
arrriba, para obtener

F 1 (u) ln(1 u)

1/

lo cual lleva al siguiente mtodo de generacin :


1.
2.

Generar U U(0,1).
Devolver X = ln ( ln U)1/

2.1.5 Distribucin Normal


Descripcin
Las aplicaciones en la simulacin son errores de variada ndole, tales como el impacto (geogrfico) de
una bomba. Tambin tiene aplicaciones en la suma de grandes nmeros provenientes de otras
observaciones. En general esta distribucin describe fenmenos aleatorios que tienen variaciones
simtricas por arriba y por debajo de la media Por otra parte, esta distribucin es muy til en la
realizacin de anlisis estadsticos sobre la salida de la simulacin.
Las funcin de densidad de probabilidad se describe abajo; la funcin de densidad acumulada no tiene
forma cerrada.

15

Unidad 3: Variables aleatorias

La funcin de densidad se muestra en la figura 6.5.

Figura 6.5: Funcin de densidad de la distribucin normal

Generacin
Existen varios mtodos para la generacin de valores de esta distribucin, los cuales pueden consultarse
en [LawKelt91]. Uno de los ms conocidos, y por otra parte un mtodo que no es una aproximacin, es el
denominado mtodo polar, el cual se basa en una propiedad particular de esta distribucin (ver referencia
anterior). Este mtodo se describe a continuacin:
1.
2.

Generar U1 y U2 como valores aleatorios IID con U(0,1), y sea V1 = 2 U1 1 y para i = 1,2 y sea W =
V12 + V22.
Si W > 1, se vuelve al paso anterior, de lo contrario se hace Y (2 ln W ) / W y X1 = V1Y y X2= V2Y .
Luego X1 y X2 son dos valores aleatorios distribuidos IID segn una distribucin N(0,1).

2.1.6 Distribucin Lognormal


Descripcin
Esta distribucin se utiliza para describir o generar el tiempo para realizar alguna tarea en particular (la
funcin de densidad tiene en muchos casos formas similares a la distribuciones Gama y Weibull). En
general esta distribucin tiene amplias aplicaciones en modelos de confiabilidad. Esta distribucin
adems se relaciona directamente con la normal por virtud de los siguiente : una variable aleatoria x sigue
una distribucin lognormal con parmetros y (ver abajo) si y solo si el logaritmo natural de x se
distribuye con una N(,2).
Las funcin de densidad de probabilidad se describe abajo; la funcin de densidad acumulada no tiene
forma cerrada.

La funcin de densidad se muestra en la figura 6.6

Figura 6.6:Funcin de densidad de la distribucin Lognormal

16

Unidad 3: Variables aleatorias

Generacin
Para generar valores con esta distribucin se utiliza una propiedad especial de esta distribucin: si Y
N(,2), entonces eY ln(,2). Por lo tanto el algoritmo es como sigue:
1.
2.

Generar Y N(,2).
Devolver X = eY.

2.1.7 Distribucin beta


Descripcin
Esta distribucin se utiliza en principio como una primera aproximacin a la generacin de valores
aleatorios, cuando no se tienen otros datos sobre la distribucin probable de los mismos. Tambin se
utiliza como una distribucin para generar proporciones, como por ejemplo, proporcin de artculos o
partes defectuosas en un cargamento o un taller, tiempo para realizar una tarea, duraciones de las tareas en
una red pert, etc.
Las funcin de densidad de probabilidad se describe abajo; la funcin de densidad acumulada no tiene
forma cerrada.

La funcin de densidad se muestra en la figura 6.7.

Figura 6.7: Funcin de densidad de la distribucin Beta

Generacin
Un mtodo general para la generacin de valores de esta distribucin con parmetros y mayores que
0, surge de que si Y1 Gama(,1), y Y2 Gama(,1), y Y1 y Y2 son independientes, entonces Y1/( Y1 + Y2)
Beta(,), lo cual lleva al siguiente algoritmo :
1.
2.

Generar Y1 Gama(,1), y Y2 Gama(,1) independientes de Y1.


Devolver Y1/(Y1 + Y2).

2.1.8 Distribucin Triangular


17

Unidad 3: Variables aleatorias

Descripcin
Se utiliza de forma similar a la anterior, como una primera aproximacin en ausencia de datos.
Las funciones de densidad de probabilidad y la acumulada se describen abajo :

La funcin de densidad se muestra en la figura 6.8.

Figura 6.8:Funcin de densidad de la distribucin triangular

Generacin
Para generar valores con esta distribucin, debemos notar primero que si tenemos X Triang(0,1,(c-a)/(ba)), luego X = a+(b-a)X Triang(a,b,c), de tal forma que podemos restringir nuestra atencin a las
variableas aleatorias Triang(0,1,c), donde 0<c<1. Esta distribucin se puede invertir fcilmente para
obtener 0 u 1,

cu 0 u c

F 1(u )

1 (1 c)(1 u ) c u 1

Por lo tanto podemos establecer el siguiente algoritmo, basado en la transformada inversa, para generar X
Triang(0,1,c):
1.
2.

Generar U U(0,1).
Si U c, devolver X cU , de otra forma retornar X 1 (1 c)(1 U ) .

2.2

Distribuciones Discretas

Estas distribuciones se describen solo ligeramente, ya que su aplicacin en la simulacin es menos


frecuente que las anteriores.

2.2.1 Distribucin de Bernoulli


Descripcin
Las aplicaciones de esta distribucin son las de una ocurrencia aleatoria con dos posibles resultados. En
general esta distribucin se utiliza como base para la generacin de otras variables aleatorias discretas,
como por ejemplo la binomial, la geomtrica y la binomial negativa.
La funcin de masa se muestra abajo:

18

Unidad 3: Variables aleatorias

1 p x 0
p( x)

p x 1
Generacin
El siguiente algoritmo es bastante intuitivo y es equivalente al mtodo de la transformada inversa (si se
intercambian los roles de U y 1 U).
1.
2.

Generar U U(0,1).
Si U p, devolver X = 1, de otra forma retornar X = 0.

2.2.2 Distribucin Uniforme Discreta


Descripcin
Las aplicaciones posibles de esta distribucin son la ocurrencia aleatoria con varios resultados posibles,
cad uno de los cuales es igualmente probable. Esta distribucin se utiliza a menudo como un primer
modelo para una cantidad que vara entre los enteros i a j, pero de la que se conoce muy poco. La funcin
de masa se muestra abajo:

1
p( x)
x i, i 1,...,
j i 1

Generacin
El algoritmo ms utilizado para la generacin de valores con esta distribucin surge directamente del
mtodo de la transformada inversa:
1.
2.

Generar U U(0,1).
Devolver X = i + (j i + 1)U

Con este algoritmo no se necesita de ninguna bsqueda. La constante (j i + 1) debera computarse con
anticipacin y guardarse si se van a generar numerosos nmeros.

2.2.3 Distribucin binomial


Descripcin
Las aplicaciones posibles de esta distribucin son el nmero de xitos en un nmero de t intentos
independientes de Bernoulli, con una probabilidad de xito p en cada ensayo. En la simulacin se utiliza
por ejemplo en la generacin de cantidades de elementos defectuosas en un lote de tamao t, para generar
un nmero aleatorio de objetos en un lote, como un grupo de personas , de piezas, etc., para generar una
cantidad de materiales que se demandan en un sistema de stock, etc.
La funcin de masa se muestra abajo:

p( x) p x (1 p) t x x 0,1,..., t
x

Generacin
Para generar un valor aleatorio de una distribucin bin(t,p), utilizamos la propiedad de que esta
distribucin puede ser considerada como la suma de t distribuciones de Bernoulli IID con parmetro p.
Esta relacin nos lleva al siguiente algoritmo :
1.

Generar Y1, Y2,, Yt como valores aleatorios distribuidos segn una distribucin Bernolli(p).
19

Unidad 3: Variables aleatorias

2.

Devolver X = Y1 + Y2 + + Yt

Como se observa, el tiempo de ejecucin es proporcional a t, por ello sera necesario buscar una
alternativa en el caso de que t sea muy grande. [LawKelt91] proporciona algunos indicios que como
realizar esto.

2.2.4 Distribucin Geomtrica


Descripcin
Las aplicaciones de esta distribucin se dan en general en la generacin de fallos antes del primer xito en
una secuencia de ensayos de Bernoulli con una probabilidad de xito de p en cada ensayo. En particular
se puede utilizar para generar una cantidad de materiales u objetos que deben ser inspeccionados antes de
ver un fallo en uno de ellos. Tiene adems aplicaciones similares a la distribucin anterior. La funcin de
masa se muestra abajo:

s x 1 s

p (1 p) x
p( x)
x

Generacin
El siguiente algoritmo es equivalente al de la transformada inversa, si reemplazamos U por 1 U en el
paso 2 (ver [LawKelt91]):
1.
2.

Generar U U(0,1).
Devolver X = ln U / ln (1 p)

La constante 1-p debera ser computada con anticipacin a la generacin. Si p es muy cercano a 0, el ln(1p) tambin ser muy cercano a 0, de tal forma que debera considerarse el empleo de aritmtica de doble
precisin (tipos double en muchos lenguajes), de forma de evitar errores de redondeo grandes en el
clculo.

2.2.5 Distribucin de Poisson


Descripcin
Esta distribucin es muy utiliza en la simulacin debido a su relacin con
continua. Las aplicaciones son en general la generacin de un nmero de
intervalo de tiempo con una tasa o relacin constante. Tambin se utiliza
artculos en un lote de tamao aleatorio, y el nmero de artculos que se
funcin de masa se muestra abajo:

la distribucin exponencial
eventos que ocurren en un
para generar el nmero de
demandan de un stock. La

e x
p( x)
x 0,1,...
x!
Generacin
El algoritmo general para la generacin de valores distribuidos segn una distribucin de Poisson() est
basado en la relacin existente entre esta distribucin y la exponencial expo(1/) (ver [LawKelt91]):
1.
3.
2.

Sea a = e-, b = 1, e i = 0.
Generar Ui+1 U(0,1) y reemplcese b por bUi+1. Si b < a, devolver X = i, de otra forma regresar al
punto 3.
Reemplazar i por i + 1, y volver al punto 2.

La justificacin de este algoritmo puede encontrarse en la referencia antes citada.


20

Unidad 3: Variables aleatorias

3. Datos de entrada del modelo de simulacin, en relacin


con las distribuciones de probabilidad
A continuacin se describe como sera el procedimiento para aplicar las distribuciones en un estudio de
simulacin.
1.
2.
3.
4.
5.
6.

Coleccin de datos del sistema real.


Identificacin de una distribucin de probabilidades para representar los procesos de entrada.
Tpicamente consiste en realizar una distribucin de frecuencias o histograma de los datos.
Eleccin de una distribucin de probabilidades que represente los datos.
Eleccin de parmetros para determinar una instancia especfica de la familia de distribuciones.
Evaluar la distribucin seleccionada y comprobar la bondad de ajuste, va grfica y/o estadstica (KS, o Chi cuadrado).
Repetir el ltimo procedimiento hasta encontrar una funcin que ajuste a los datos. O determinar una
funcin emprica.

3.1

Ejemplo

Se intent simular una operacin de autoservicio de lavado.


Los tiempos de arribos no fueron homogneos: la distribucin cambi segn los tiempos en un da y
segn los das de la semana. El autoservicio estuvo abierto los 7 das de la semana durante 16 hs/da o 112
horas por semana.
Para cubrir esta informacin en un perodo de tiempo aceptable, se eligi una muestra de tiempos, donde
las distribuciones de tiempos entre arribos se determinaron y clasificaron de acuerdo a su velocidad de
arribos en alta, media y baja.
Las distribuciones de tiempo de servicio presentaron algunos problemas. Se observ la proporcin de
clientes que demandan varias combinaciones de servicio. El caso ms simple fue el de clientes que usaron
la mquina de lavar y la de secar. Algunos pidieron 2 mquinas de lavar y un secador, y otros tipos de
servicios. Asimismo, los clientes seleccionaron distintas mquinas de lavar, y de secado, por lo que fue
imposible asociar una mquina de lavar con una de secar en forma especfica.
Algunos clientes esperaron pacientemente hasta terminar todas las operaciones, mientras que otros
salieron y volvieron despus que las mquinas que usaban terminaron el ciclo.
En perodos de mucha demanda, el gerente sacaba las ropas y las meta en un canasto, para dejar libres las
mquinas a ser usadas por otros clientes. El tiempo de finalizacin del servicio se determin entonces
como el tiempo en que se sac la ropa de las mquinas.
De vez en cuando las mquinas se rompieron y quedaron inhabilitadas, con un tiempo variable desde
minutos hasta das. Se pudo registrar el tiempo de reparacin ms corto, mientras que el ms largo fue
estimado por el gerente.

3.2
1.

2.

3.

4.

5.

Sugerencias para recoger datos

Un gasto til de tiempo es la planificacin. Se puede hacer una sesin de pre-observacin del sistema
y recoger algunos datos. Disear formas para este propsito. Probablemente, estas formas sufran
modificaciones antes de recoger los datos. Observar circunstancias no usuales y pensar cmo
tratarlas. Cuando es posible, filmar un video del sistema y observarlo despus para extraer los datos.
Tratar de analizar los datos cuando se los recoge, de manera de ver si son suficientes o adecuados
para suministrar las distribuciones necesarias para la simulacin, asimismo si son tiles. No perder
tiempo con datos superfluos.
Tratar de combinar conjunto de datos homogneos. Chequear los datos para homogeneidad en
perodos de tiempos sucesivos y durante el mismo perodo de tiempo en das sucesivos. Por ejemplo,
chequear datos entre las 14 hs. a las 15 hs. y entre las 15 y 16 hs. Hacerlo en varios das. Cuando se
chequea la homogeneidad, un test inicial es ver si las medias de las distribuciones son las mismas. Se
puede usar la prueba t para dos muestras.
Puede ocurrir que la cantidad que interesa no puede observarse completamente. Esto ocurre cuando
el analista est interesado en el tiempo requerido para completar un proceso (por ejemplo, producir
una parte, tratar un paciente, o ver cundo falla un componente) porque el proceso comienza antes o
termina despus del tiempo de observacin.
Para determinar si hay una relacin entre dos variables construir un diagrama de dispersin.
21

Unidad 3: Variables aleatorias

6.

Considerar la posibilidad que una secuencia de observaciones que aparenta ser independiente tiene
una autocorrelacin. Puede existir entre perodos de tiempo sucesivos o clientes sucesivos. Por
ejemplo el tiempo de servicio de cliente i puede estar relacionado con el tiempo de servicio del
cliente i+1.

3.3

Identificacin de una distribucin con los datos de


entrada

3.3.1 Histogramas
Una distribucin de frecuencias o histograma es til para identificar la forma de una distribucin.
Un histograma se construye con las siguientes etapas:
1.
2.
3.
4.
5.

Dividir el rango de datos en intervalos (generalmente son de igual amplitud, pero puede tener anchos
distintos si las alturas de las frecuencias son ajustadas)
Particionar el eje horizontal segn los intervalos seleccionados.
Determinar las ocurrencias en los intervalos seleccionados
Particionar el eje vertical de modo que todas las ocurrencias puedan ser graficadas para cada
intervalo.
Graficar las frecuencias sobre el eje vertical.

El nmero de intervalos de clase depende del nmero de observaciones y de la cantidad de dispersin en


los datos. Se sugiere que el nmero de intervalos de clase sea la raz cuadrada del tamao de muestras
trabajado en la prctica. Si los intervalos son muy anchos, el histograma ser muy burdo y no mostrar la
forma o tendencia de los datos. Al contrario, si los intervalos son muy estrechos, el histograma ser muy
desigual.
El histograma para datos continuos corresponde a la funcin densidad de probabilidad de una distribucin
14

25

10

12
20

10

15

10

4
2
0

8 10 12 14 16 18 20 22 24

12

18

12

15

18

21

terica. Si es continua una lnea a travs del punto central de cada intervalo de clase resultar en una
forma como la de una funcin de densidad de probabilidad (pdf).
Los histogramas de datos discretos donde hay un gran nmero de puntos, tendrn una celda de cada valor
en el rango de los datos. Sin embargo, si hay pocos puntos se necesita combinar celdas adyacentes para
eliminar la apariencia desigual del histograma. Si el histograma est asociado con datos discretos, se ver
como una funcin de masa de probabilidad.

22

24

Unidad 3: Variables aleatorias

3.3.2 Ejemplo de datos discretos


El nmero de vehculos que arriban a la esquina noroeste de una interseccin en un perodo de 5 minutos
entre las 7:00 A.M y las 7:05 AM se monitore durante 5 das de trabajo en un perodo de 20 semanas. La
tabla muestra los resultados.

Arribos
perodo
0
1
2
3
4
5
6
7
8
9
10
11

por Frecuencia

20

12
10
19
17
10
8
7
5
5
3
3
1

15

10

9 10 11

3.3.3 Ejemplo de datos continuos


Las pruebas de vida fueron ejecutadas sobre una muestra aleatoria de chips electrnicos a 1,5 veces el
voltaje nominal y sus tiempos de vida (o tiempos de falla) en das fueron registrados en la tabla.
El tiempo de vida, generalmente considerado una variable continua, est registrado aqu con una exactitud
de 3 decimales. El histograma est preparado ubicando los datos en intervalos de clase. EL rango de los
datos es bastante grande, desde 0,002 das hasta 144,695 das. Sin embargo, la mayora de los valores (30
a 50) estn en el rango 0-5 das. Usando intervalos de amplitud 3, los resultados se muestran en la tabla,
que se usan para preparar el histograma de la figura siguiente.

Histograma de la vida de un chip

25

Frecuencia

20
15

10
5
0
0

12

15

18

Vida del chip (das)

23

21

24

27

30

33

36

Unidad 3: Variables aleatorias

Vida de un chip Frecuencia


(das)
23
0 xj < 3
10
3 xj < 6
5
6 xj < 9
1
9 xj < 12
1
12 xj < 15
2
15 xj < 18
0
18 xj < 21
1
21 xj < 24
1
24 xj < 27
0
27 xj < 30
1
30 xj < 33
1
33 xj < 36
..

1
42 xj < 45

1
57 xj < 60

.
78 xj < 81
.
144 xj < 147

1
.
1

3.3.4 Seleccionando una familia de distribuciones


El propsito de un histograma es inferir una pdf o funcin de masa de probabilidad (pmf) conocida. Hay
software estadstico o grfico, incluso las planillas de clculo ms difundidas, que hacen el histograma y
que ajustan a una distribucin determinada. En el caso del ejemplo de datos continuos, la forma del
histograma ajustara a una distribucin exponencial. Si el histograma aparece simtrico respecto a una
media, podra ajustar a una distribucin normal.
Otra forma de ver cmo ajustan los datos a una distribucin es realizar los grficos de un histograma
quantil-quantil (q-q). Si estos grficos tiene una recta con pendiente cercana a 1, entonces la distribucin
seleccionada es apropiada. En pocas palabras en estos grficos la ordenada son los valores experimentales
y la abscisa los valores tericos generados (con T.I. por ejemplo) mediante la distribucin seleccionada.

3.3.5 Estimacin de parmetros


Los estadsticos preliminares de cualquier observacin son la media de la muestra y la varianza de la
muestra:

1 n
xi
n i 1

1.

Media aritmtica:

2.

Variancia:

s2

2
1 n
x i x , tambin definida como
n 1 i1

s2

2
1 n 2
x i nx
n 1 i1

Si los datos estn agrupados en distribuciones de frecuencias, los estadsticos anteriores se pueden
modificar:
24

Unidad 3: Variables aleatorias

3.

4.

Variancia:

1 k
fixi
n i1

2
1 k
2
s
f i x i nx
n 1 i1
2

Donde k es el nmero de distintos valores de X y fi es la frecuencia observada.


Para cada distribucin se pueden encontrar estimadores sugeridos, y los software grficos y/o estadsticos
calculan los parmetros para cada caso.
Bondad de ajuste: Se aplican los test de Chi cuadrado y K-S.
Seleccionado el modelo de distribucin es necesario realizar un anlisis de sensibilidad para observar el
impacto del cambio de los valores de la distribucin en la simulacin. A veces los parmetros suelen
presentarse como secuencias de variables aleatorias independientemente e idnticamente distribuidas, por
lo cual se requiere modelos de entrada multivariados, o modelos de series de tiempos, que representan
una secuencia de entradas dependientes.

4. Referencias
[Lehmer51]
[Fishman78]
[LawKelt91]
[BanCars84]
[Vardema94]
[WalpMyer92]
[Taha88]
[Taha91]

D. Lehmer, Mathematical Methods in Large Scale Computing Units, Ann. Comp. Lab.
Harvard Univ., Vol. 26, 1951
G. Fishman, Conceptos y mtodos en la simulacin digital de eventos discretos,
Editorial Limusa, Mxico, DF, 1978
A. Law, W. D. Kelton, Simulation Modeling and Analysis, Second Edition, McGrawHill, 1991.
J. Banks, J. Carson, Discrete Event System Simulation, Prentice Hall, Englewood Cliffs,
New Jersey, 1984.
Stephen Vardeman, Statistics for Engineering Problem Solving, PWS Publishing
Company, Boston, 1994
R. Walpole, R. Myers, Probabilidad y Estadstica, Cuarta Edicin, McGraw-Hill, 1992
Andy S. Taha, Simulation Modelling and Simnet, Prentice-Hall International, 1988.
Andy S. Taha, Investigacin de Operaciones, Segunda Edicin, Alfaomega, 1991.

5. Relaciones entre funciones de distribucin de


probabilidad
A continuacin presentamos un diagrama de las relaciones entre distribuciones de probabilidad. Las
lneas slidas representan transformaciones y casos especiales, las lneas punteadas representan lmites.
Tomado de Statistical Inference de Casella y Berger.

25

Unidad 3: Variables aleatorias

26

Anda mungkin juga menyukai