Anda di halaman 1dari 80

CAPITULO 4 GENERACION DE

VARIABLES ALEATORIAS

En esta seccin se trataran procedimientos para muestrear una variedad de distribuciones de
probabilidad discretas y continuas ampliamente usadas. En el captulo 1, introduccin a la
simulacin se discuti y se mostraron ejemplos de sistemas diversos donde se dejo clara la
importancia de las distribuciones estadsticas para modelar actividades que son generalmente
impredecibles o inciertas. Por ejemplo, los tiempos entre arribo y los tiempos de servicio en las
colas, y la demanda de un producto, son generalmente impredecibles por naturaleza, al menos en
cierta extensin. Usualmente tales variables son modeladas como variables aleatorias con una
distribucin estadstica, y los procedimientos estadsticos estndar existen para estimar los
parmetros de la distribucin hipottica y para probar la validez del modelo estadstico asumido
(como son las pruebas de Ajuste de Bondad), que se cubrir en la siguiente seccin.

Se asume que una distribucin ha sido completamente especificada, y se han visto procesos para
generar muestras de esta distribucin para ser usadas como insumo para un modelo de
simulacin. El propsito de esta seccin es explicar e ilustrar algunas tcnicas ampliamente usadas
para generar variables aleatorias, y no para llevar a cabo una investigacin profunda de las
tcnicas ms eficientes. En la prctica, la mayora de quin realiza la simulacin usar las rutinas
existentes en las bibliotecas disponibles en los lenguajes de programacin, o en las rutinas de los
lenguajes de simulacin. Sin embargo, algunos lenguajes de programacin no tienen rutinas
internas de todas las distribuciones utilizadas. Aunque esto no es muy comn, es importante
entender como se lleva a cabo la generacin de variables aleatorias.

En este captulo se discuten las tcnicas de transformacin inversa, el mtodo de convolucin y
ms brevemente la tcnica de aceptacin-rechazo. Otra tcnica el mtodo de composicin, es
discutida por Fisherman [1978] y Law y Kelton [1991]. Todas las tcnicas en este captulo
consideran que se conoce como fuente la uniformidad U(0,1) de los nmeros aleatorios R
1
,R
2
,....,
donde cada R
i
tiene una funcin de densidad de probabilidad (FDP )




Y la funcin de densidad acumulada de probabilidad (FDA )


( )
1, 0 1
0,
R
x
f x
en otro caso
s s
=

( )
0, 0
, 0 1
1, 1
R
x
F x x x
x
<

= s s

>






4.1.- Mtodos de Generacin de Variables Aleatorias

Hay una variedad de mtodos para generar variables aleatorias. Cada mtodo se aplica solo a un
subconjunto de distribuciones y para una distribucin en particular un mtodo puede ser mas
eficiente que otro.

4.1.1 Transformacin Inversa
Si la variable aleatoria X tiene una FDA F(x), entonces la variable R = F(x) esta distribuida
uniformemente entre 0 y 1. Por lo tanto, X se puede obtener generando nmeros uniformes y
calculando x = F
-1
(R).



Analticamente, el mtodo se representa como:

( ) ( )
x
F X f t dt

=
}
(9)

1
( ) X F R

= (10)

1.0
u
x
0
FDA
F(x)
donde f(x) es la funcin de densidad de probabilidad de la distribucin deseada. Para ver porqu el
X generado con este mtodo en realidad tiene la distribucin deseada, tome un valor X
0
y calcule la
probabilidad acumulada:

0 0 0
( ) ( ( ) ( ) P X X P R F X F X s = s = (11)

Puesto que F(X
0
) pertenece al intervalo [0,1], la segunda igualdad plantea que R es un nmero
uniformemente distribuido en dicho intervalo, y como F(x) es la funcin de probabilidad acumulada
de X, se concluye que esta variable tendr la distribucin deseada.

Este mtodo nos permite generar variables aleatorias siempre que se pueda determinar F
-1
(x)
analticamente o empricamente.

Ejemplo (determinacin analtica):
Sea X exponencial con f(x) = e
-x
. La FDA es F(x) = 1 - e
-x
=R
o .Si R es uniforme entre 0 y 1, entonces 1-R tambin esta
distribuida uniformemente entre 0 y 1. Por lo tanto podemos
generar variables aleatorias exponenciales generando R y despus calculando.




Ejemplo (determinacin emprica):
El tamao de los paquetes en una red fueron medidos y encontrados trimodales con
las siguientes probabilidades:
Tamao (bytes) Probabilidad
64 0.7
128 0.1
512 0.2
La FDA viene dada por:

y la inversa esta dada por:
F x
x
x
x
x
( )
.
.
.
.
=
s <
s <
s <
s

0 0
0 7
08
10
0 64
64 128
128 512
512



( )
1
1 X Ln R

=
( )
1
X Ln R

=






4.1.2 Mtodo de Aceptacin-Rechazo

Esta tcnica se puede usar si existe otra funcin de densidad g(x) tal que cg(x) supera la funcin
de densidad f(x), es decir, cg(x) > f(x) para todos los valores de x. Si esta funcin existe, entonces
se pueden aplicar los siguientes pasos:

1. Genere x con la densidad g(x).
2. Genere y uniforme en [0, cg(x)].
3. Si y s f (x), devuelva x y retorne. De lo contrario repita desde el paso 1.

El algoritmo permanece rechazando las variables x y y hasta que la condicin y s f (x) sea
satisfecha.

Ejemplo:
Consideremos la funcin de densidad beta(2,4):

< s
< s
< s
=

1 8 . 0
8 . 0 7 . 0
7 . 0 0
512
128
64
) (
1
u
u
u
u F
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 64 128 192 256 320 384 448 512 576
x
f(x)
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 64 128 192 256 320 384 448 512 576
x
F(x)
f x x x ( ) ( ) = s s 20 1
3
0 x 1

Esta funcin se muestra en la figura y puede ser limitada por el rectngulo de altura 2,11. Por lo
tanto podemos usar c = 2,11 y g(x) = 1 para 0 s x s 1. La variables beta (2,4) pueden ser
generadas como sigue:
1. Genere x uniforme en [0, 1].
2. Genere y uniforme en [0, 2,11].
3. Si y s 20x(1-x)
3
, devuelva x y retorne. De lo contrario vuelva al paso 1.

Los pasos 1 y 2 generan un punto (x, y) distribuido uniformemente en el rectngulo en la figura. Si
el punto cae sobre la densidad f (x), entonces el paso 3 rechaza x.
La eficiencia del mtodo depende de que tan bien g(x) limita a f (x). Si hay una brecha muy grande
entre cg(x) y f (x), entonces un gran nmero de puntos generados en los pasos 1 y 2 sern
rechazados. Similarmente, si la generacin de variables aleatorias con g(x) es compleja, entonces
el mtodo puede ser ineficiente.


4.1.3 Mtodo de Composicin

Este mtodo se puede usar si la FDA F(x) deseada se puede expresar como una suma ponderada
de otras n FDA F
1
(x), ..., F
n
(x):

El nmero de funciones n puede ser finito o infinito, y las n FDA son compuestas para formar la
FDA deseada; de aqu el nombre de la tcnica. Esto tambin se puede ver como que la FDA
deseada es descompuesta en otras n FDA; por esto la tcnica a veces es llamada
descomposicin.
0
0.8
1.6
2.4
3.2
0 0.25 0.5 0.75 1
x
f(x)
F x p F x p p
i i
i
n
i i
( ) ( ) = > =
=

1
0 1 , y
i =1
n
Rechace
Beta (2,4)
Acepte
La tcnica tambin se puede usar si la funcin de densidad f (x) puede ser descompuesta como
una suma ponderada de otras n densidades:

En cualquier caso, los pasos a seguir son:
1. Genere un entero aleatorio I tal que P(I = i ) = p
i
. Esto puede ser hecho con el
mtodo de

transformacin inversa.
2. Genere x con la i-esima densidad f
i
(x) y retorne.

Ejemplo:
Consideremos la densidad de Laplace dada por

La siguiente figura muestra la densidad para a = 2.

Esta densidad es una composicin de dos densidades exponenciales. La probabilidad de que x
sea positiva es 1/2, y de que sea negativa tambin es 1/2. Usando la tcnica de composicin
podemos generar variables de Laplace de la siguiente forma:
1. Genere R
1
~ U(0,1), y R
2
~ U(0,1).
2. Si R
1
< 0.5, retorne x = -a ln R
2
, de lo contrario retorne x = a ln R
2
.


4.1.4 Mtodo de Convolucin

f x p f x p p
i i
i
n
i i
( ) ( ) = > =
=

1
0 1 , y
i =1
n
f x
a
e
x
a
( ) =

1
2
- < x <
0
0.1
0.2
0.3
0.4
-2 -1 0 1 2
x
f(x)
Esta tcnica puede ser usada si la variable aleatoria x puede ser expresada como la suma de n
variables aleatorias y
1
, ..., y
n
que puedan ser generadas fcilmente:

En este caso x se puede generar n variables aleatorias y
1
, ..., y
n
y sumndolas. Si x es la suma de
dos variables aleatorias y
1
y y
2
, entonces la densidad de x puede se obtenida analticamente por
la convolucin de las densidades de y
1
y y
2
; de aqu el nombre de la tcnica a pesar de que la
convolucin no es necesaria para la generacin de nmeros aleatorios.
Ntese la diferencia entre composicin y convolucin. La primera se usa cuando la densidad o
FDA puede ser expresada como la suma de otras densidades o FDA. La segunda se usa cuando
la variable misma puede ser expresada como la suma de otras variables.

A continuacin se dan unos ejemplos de aplicacin de esta tcnica:
- Una variable Erlang-k es la suma de k exponenciales.
- Una variable Binomial de parmetros n y p es la suma de n variable Bernulli con
probabilidad de xito p.
- La chi-cuadrado con v grados de libertad es la suma de cuadrados de v normales N(0,1).
- La suma de un gran nmero de variables de determinada distribucin tiene una distribucin
normal. Este hecho es usado para generar variables normales a partir de la suma de
nmeros U(0,1) adecuados.
- Una variable Pascal es la suma de m geomtricas.
- La suma de dos uniformes tiene una densidad triangular.


A continuacin se presenta un diagrama de flujo que ayuda a decidir cual de las tcnicas
anteriores se debe usar:










x y y y
n
= + + +
1 2
...
Si

Es la FDA
invertible?

No

Use inversin

Si

Es la FDA una
suma de FDA?

No

Use composicin

Si

Es la densidad una
suma de densidades?

No

Use composicin

Si

Es la variable una
suma de variables?

No
Use convolucin

























4.1.5 Caracterizacin

Caractersticas especiales de ciertas distribuciones permiten generar sus variables usando
algoritmos especialmente ajustados para ellas. Todos estos algoritmos estn clasificados bajo una
tcnica llamada caracterizacin.

Ejemplos de variables generadas usando caracterizacin son:
- Si los tiempos entre llegadas son exponenciales con media 1/, el nmero de
llegadas n en cierto intervalo T es Poisson con parmetro T. Por lo tanto una
Poisson puede ser obtenida generando exponenciales hasta que su suma supere
T y devolviendo el nmero de exponenciales usadas.
- El a-esimo menor nmero en una secuencia de a + b + 1 variables U(0,1) tiene
distribucin beta(a , b ).
- La razn de dos normales estndar en Cauchy(0,1).
- Una chi-cuadrado con un nmero par de grados de libertad _
2
(v) es un gamma
(2,v/2).
- Si x
1
y x
2
son dos gammas (a , b ) y (a , c ) respectivamente, la razn x
1
/ (x
1
+
x
2
) es beta(b,c).



4.2. Simulando Distribuciones Continuas de Probabilidad

En la simulacin de procesos se emplean valores discretos para tiempo entre fallas, arribos, etc.
Realmente se esta aproximando estos valores de tiempo, dado que en la prctica estos tiempos
pueden tomar cualquier valor, no nicamente valores discretos. Un nmero de variables discretas
de esta naturaleza existe en la realidad, por ejemplo; el tiempo entre llamadas recibidas; el tiempo
entre el inicio del servicio y el trmino del mismo en una ventanilla de servicio bancario; el tiempo
entre salida de aviones en un aeropuerto. Se puede usar un enfoque para simular estas
ocurrencias; sin embargo en esencia, para representar variables aleatorias continuas, ser
necesario usar una distribucin continua en el anlisis.

Muchas funciones de densidad de probabilidad tienen parmetros que controlan sus caractersticas
de forma y escala. Dos de las mas comunes son el parmetro (alfa) que define la forma de la
distribucin y el parmetro (beta) que describe los valores de escala de en el rango de la
distribucin. La media y la desviacin estndar son definidas en trminos de los parmetros y .

Una de las ventajas de emplear distribuciones continuas es que se puede desarrollar una ecuacin
matemtica para servir como un proceso generador.


4.2.1 Distribucin Uniforme

Una distribucin Uniforme sobre el rango de 0 a 1 es la base para generar valores de
distribuciones de probabilidad estndar. Una aplicacin comn es para representar el tiempo de
duracin de una actividad cuando se tiene una mnima informacin de la duracin de la actividad.
Algunas veces el tiempo para completar se considera que vara aleatoria y uniformemente entre
dos valores. Dadas estas condiciones, la distribucin Uniforme es una buena estimacin preliminar
para la duracin de una actividad

La funcin de densidad de la distribucin Uniforme de probabilidad es definida como sigue:
1
;
( )
0
para a x b
b a
f x
para cualquier otro caso

s s


Media:
Varianza:


f(x)


1/(b-a)


x
a b

Distribucin Uniforme de probabilidad para el intervalo (a,b)

Para obtener la distribucin acumulada de probabilidad, usando la distribucin original de
probabilidad y a travs del clculo, as;
a b +
2
( ) / b a
2
12


}
=
x
a
dx x p x P ) ( ) (

substituyendo p(x)=1/(b-a), entonces


1 1 1
( ) ( )
( ) ( ) ( )
x x
a a
F x dx dx x a
b a b a b a
= = =

} }

por lo que,

0 ;
( )
1 ;
;
para x a
F x
para x b
b
X a
para a x
b a
<

>

s s



Usando el procedimiento de transformacin inversa involucra establecer una variable aleatoria
uniforme R (donde R se encuentra entre cero y uno ) igual a F(x) y resolver para x. As,

X = a + R(b - a)

Ejemplo
El tiempo requerido para lavar un auto esta uniformemente distribuido con un tiempo mnimo de 8
minutos y un mximo de 12 minutos. Simule el tiempo de servicio para procesar 10 automviles.
Use un proceso generador uniforme en su anlisis. Cul es el tiempo promedio para los 10
autos que se procesan?

Sea x = Tiempo de servicio
As;
8 8
( )
12 8 4
X a X X
F x
b a

= = =


Como x = a + R . (b-a) , entonces x = 8 + 4R

Carro No. Aleatorio x
1 .4764 9.9056 x =105.8228/10=105823
2 .8416 11.3664
3 .9434 11.7736 tiempo esperado =10
4 .3420 9.368
Tiempo promedio
__
x =10.5823
5 .6827 10.7308
6 .8521 11.4084
7 .1129 8.4516
8 .5806 10.3224
9 .9285 11.714
10 .6955 10.7820


105.8228


4.2.2 Distribucin Exponencial

Es usada extensivamente en modelos de colas. Es la nica distribucin continua con la propiedad
de prdida de memoria: recordar el tiempo desde el ltimo evento no ayuda a predecir el tiempo
hasta el prximo evento. Es usada para modelar el tiempo entre eventos sucesivos, por ejemplo:

- El tiempo entre llegadas.
- El tiempo entre fallas.

Un proceso generador uniforme para esta distribucin puede ser desarrollado con el uso de la
tcnica de transformacin inversa. La funcin de densidad de la distribucin Exponencial de
probabilidad es la siguiente:

( )
x
f x e


= , para 0 < x < ; 0 para x<0
Media:
Varianza:
2



donde es la tasa de servicio o el nmero de unidades servidas por unidad de tiempo.
Para desarrollar el proceso generador, se debe encontrar primeramente la funcin de densidad
acumulada de probabilidad:

0
0 0
( ) ( ) | 1
x x
x x x x
F x f x dx e dx e e


= = = = +
} }

as :
-x
P(x) = 1 - e

Ahora entrando la variable aleatoria R, igual a F(x) , y resolviendo para x
( ) 1
x
R F x e

= =
1
x
e R

=
-x = 1n(1 - R)
entonces,

1
(1 ) X Ln R

=

y esta expresin puede ser reemplazada por
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0
1
.
5 3
4
.
5 6
7
.
5 9
1
0
.
5
1
2
1
3
.
5
1
5
1
6
.
5
1
8
1
9
.
5
2
1
2
2
.
5
2
4
=1
=5

1
( ) X Ln R

=


Ejemplo 1
El tiempo entre fallas para una operacin particular de manufactura puede ser descrito por una
distribucin exponencial con una media de 100 horas. Simule el tiempo de 5 fallas. Use el proceso
generador exponencial en su anlisis.
1/100 = .01 hora
x= tiempo entre fallas

x
e x p
01 .
01 . ) (

=
X = - (1/) Ln (R) =.01
X = - (1/.01) Ln (R) = -100 Ln (R)

Falta No. Aleatorio x
1 .4466 80.6
2 .6427 44.2
3 .5902 52.7
4 .0318 344.8
5 .5901 52.7

Ejemplo 2
El tiempo entre arribos de los clientes que entran a una tienda puede ser descrito por una
distribucin exponencial con media de 8 minutos. Simule el arribo de 10 clientes a la tienda. Use
un proceso generador exponencial en su anlisis.

60/8 =7.5 clientes/hora
como ( )
x
f x e


= para =7.5 clientes por hora, entonces,
7.5
( ) 7.5
x
f x e

=

x=-(1/ ) . ln(R)

x=(-1/7.5) . ln (R) = -8 Ln (R)

Cliente No. Aleatorio x

1 .6279 .062 horas = 3.72 min.
2 .8234 .026 horas = 1.56 min.
3 .5273 .085 horas = 5.1 min.
4 .1820 2.27 horas = 13.62 min.
5 .6383 .060 horas = 3.60 min.
6 .1471 .256 horas = 15.36 min.
7 .3208 .152 horas = 9.12 min.
8 .8224 .026 horas = 1.56 min.
9 .6331 .061 horas = 3.66 min.
10 .5482 .080 horas = 4.80 min.


4.2.3 Distribucin Normal

La distribucin Normal es una funcin de distribucin de probabilidad muy popular.

2
1
2
1
( ) , ; 0
2
x
f x e para x

o
o
to
| |

|
\ .
= < < >
Media:
Varianza: o
2

Debido a su estructura complicada, la funcin de la distribucin Normal no tiene una
representacin inversa. Consecuentemente, la tcnica de transformacin inversa no puede ser
directamente aplicada para muestrear de una distribucin Normal.

El mtodo de convolucin para generar variables normales toma ventaja del Teorema de Limite
Central, el cual asegura que la suma de n variables aleatorias idnticamente distribuidas U(0,1) e
independientes Y1, Y2, .....,Yn con media n y varianza n
2
esta aproximadamente distribuida
normalmente con media y varianza o
2
.

Si tomamos n nmeros aleatorios para representar las anteriores variables aleatorias,
entonces, debido a que los nmeros aleatorios tienen una distribucin Uniforme cuyo rango varia
de 0 a 1 con =0.5 y o
2
= 1/12 , la variables es definida como :

=
=
n
i
i
R x
1

esta aproximadamente distribuida normalmente con media 0.5n y varianza de n/12.

Esto sigue que la variable Z esta definida como
o

=
x
Z , entonces

2 / 1
1
) 12 / (
5 . 0
n
n R
Z
n
i
i

=

=

esta aproximadamente distribuida normalmente con media cero y varianza 1.

La aproximacin en este mtodo mejora conforme n crece. Pero entre mayor sea n, mas tiempo
se requiere para generar la muestra. Un valor n que es suficientemente grande para proveer una
exactitud razonable y simplificar los clculos es 12. Esto produce la siguiente ecuacin:

=
=
12
1
6
i
i
R Z
Ahora, la variable Z puede ser usada para generar aproximadamente, variables aleatorias
normales con media y desviacin estndar o usando la ecuacin siguiente:
o ) 6 (
12
1
+ =

= i
i
R x
Entonces, para generar cada muestra distribuida normalmente usando este mtodo se deben
generar 12 nmeros aleatorios para ser utilizados en la ecuacin anterior.

Un procedimiento ms sencillo para generar variables aleatorias Normales estndar
independientes partiendo de 2 nmeros aleatorios independientes es el siguiente mtodo directo:
El Mtodo de Box-Muller partiendo de dos nmeros aleatorios uniformes R
i
y R
i+1
calcula dos
variables aleatorias Normales independientes N(, ) usando

1
1 ( 2 (1 )) (2 )
i i
X Ln R Cos R t o
+
(
= +

12

1
2 ( 2 (1 )) (2 )
i i
X Ln R Sin R t o
+
(
= +

13

Desarrollo:
Dado que no es posible obtener analticamente la funcin inversa de la probabilidad acumulada, se
recurre a mtodos alternativos. Uno de los mtodos ms empleados considera dos variables con
distribucin estndar normal Z1 y Z2 (media nula y varianza igual a uno), y las expresa en
coordenadas polares como sigue:
Z
1
= sin
Z
2
= cos (14)

Se sabe que =Z
1
2
+Z
2
2
tiene una distribucin chi-cuadrado con grado de libertad 2, la cual es
equivalente a una distribucin exponencial con media 2. Entonces, el radio B puede ser generado
con:
=(-2lnR
1
)
2
(15)
distribuido en

=2R
2
(16)
Finalmente, los valores Z1 y Z2 con distribucin normal estndar se obtienen generando B y con
las ecuaciones (15) y (16) respectivamente. El valor de X con una distribucin normal con media
2
se calcula con:
X=+Z (17)

Lo cual nos genera las ecuaciones 12 y 13

Una desventaja del mtodo de Box-Muller es su poca eficiente en el clculo del seno y el
coseno. Este problema se puede solucionar usando el Mtodo Polar ( Marsaglia )cuyo
procedimiento es el siguiente:
a) Genere dos nmeros aleatorios R
i
y R
i+1
uniformemente distribuidos
b) Haga
1
=2R
1
-1,
2
=2R
2
-1, y r=
1
2
+
2
2
.
c) Si r >1 vaya al inciso a); de lo contrario haga
( )
1/ 2
2ln r
s
r
(

( =
(

y retorne:
X
1
=+
1
s
X
2
=+
2
s
como dos N(, ) independientes

Inconveniente: Se rechazan determinadas pares de variables. La proporcin de rechazo
es: p = 1-/4 = 0.2146

Otro forma de generar variables aleatorias es el generador de Scheimer que de la distribucin
aproximada a la normal estndar

0.135 0.135
(1 )
0.1975
R R
Z

=

donde X=+Z

Otro mtodo para generar variables aleatorias normales es el Mtodo de Rechazo de Forsythe,
que procede de la siguiente manera;

a) Genere dos uniformes R
1
y R
2
U(0,1).
b) Haga x = -ln R
1
.
c) Si
1
2
(1 )
2
x
R e

> regrese al inciso a).


d) Genere R
2
.
e) Si R
2
> 0.5, retorne X= + o x; de lo contrario retorne X= - o x.


4.2.4 Distribucin Weibull

La distribucin Weibull es introducida como un modelo para tiempo entre falla en maquinas o
equipos, o la vida esperado de los componentes electrnicos. Es usada comnmente en anlisis
de confiabilidad y se usa para modelar tiempo de vida de componentes Cuando el parmetro de
ubicacin v es fijado a cero, su funcin de densidad de probabilidad esta dada por la ecuacin
siguiente:
_
o
|
|
o
| ) (
1
) (
x
e x x f

= , x > 0; f(x) = 0, en cualquier otro


caso
Media:
1 o
| |
| |
|
\ .
G

Varianza:
2
2
2
2 1
2
o
|
| | |

( | | | |

` ( | |
\ . \ .
)
G G


donde o > 0 y | > 0 son los parmetros de escala y forma de la distribucin respectivamente.


Para generar una variable Weibull, siga los pasos siguientes:

Paso 1. La funcin de distribucin continua esta dada por
( )
( ) 1 , 0
x
F X e x
|
|

= >


1
0
( )
x
x
F x x e dx
|
| o
|
|
o
| |
|

\ .
=
}
si
x
u
|
o
| |
=
|
\ .
, y
1
1 x
du dx
|
|
o o

| |
=
|
\ .
entonces ;
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
0
2
.
4
4
.
8
7
.
2
9
.
6
1
2
1
4
.
4
1
6
.
8
1
9
.
2
2
1
.
6
2
4
2
6
.
4
2
8
.
8
3
1
.
2
3
3
.
6
3
6
3
8
.
4
4
0
.
8
4
3
.
2
4
5
.
6
0
0
( ) | 1
x
x
u u x
F x e du e e
|
o
| |

|

\ .
= = = +
}
Weibull(20,10)
Weibull(20,1.5) Weibull(20,3.602)



Paso 2. Sea
( )
( ) 1
x
F X R e
|
o

= =
Paso 3. Resolviendo para X en trminos de R produce
1
(1 ) X Ln R
|
o
(
=
(
(


Ahora entrando la variable aleatoria R, igual a F(x) , y resolviendo para x

1
x
e R
|
o
| |

|
\ .
= 1
x
R e
|
o
| |

|
\ .
= (1 )
x
Ln R
|
o
| |
=
|
\ .
( )
1
1
x
Ln R
|
o
= (



( ) ( )
1
1 x Ln R
|
o = lo que hace valido que ( ) ( )
1
x Ln R
|
o = Weibull(,)



4.2.5 Distribucin Erlang

Una variable aleatoria con distribucin Erlang puede ser generada sobre la base del mtodo
provedo para muestreo de la distribucin Exponencial. Es generalmente usada en modelos de
cola como una extensin de la exponencial cuando el coeficiente de variacin (razn entre la
desviacin estndar y la media) es menor que 1, por ejemplo:
- Modelar tiempos de servicio: un taquilla con tiempo de servicios ~ Erlang( , m )
puede ser representada como m taquillas con tiempos de servicio exponenciales.
- Modelar el tiempo de reparacin y el tiempo entre fallas.

1
( ) ; 0 , 0,
( 1)!
x
m
m
x e
f x para x m entero
m

= s < >


Media: m
Varianza:
2
m


1
0
( ) 1
!
i
x
m
i
x
F x e
i

=
(
| |
(
|
\ .
(
=
(
(


Por definicin, una distribucin m-Erlang con parmetro es el resultado de la sumatoria (Tcnica
de convolucin) de m idnticas distribuciones Exponenciales cada una con parmetro .

Por esto, dada la distribucin Exponencial para cada variable xi,
( )
i
x
i i
f x e


=

La variable aleatoria Erlang Y es definida como

Y = X
1
+ X
2
+.....+ X
m

Se tiene de demostraciones anteriores que
X
i
= (-1/ ) 1n R
i
para i = 1,2,3.... m

de esto se tiene que
Y = (-1/ )( 1n R
1
+ 1nR
2
+.....+ 1n R
m
)

0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.1
0 6
1
2
1
8
2
4
3
0
3
6
4
2
4
8
5
4
6
0
6
6
7
2
7
8
8
4
9
0
9
6
Erlang(4,2)
Erlang(10,4)
o
Y = (-1/ ) 1n(R
1
*R
2
*.....*R
m
)

4.2.6 Distribucin Gamma

La distribucin Gamma puede ser usada para representar el tiempo requerido para completar una
actividad o grupo de actividades. La distribucin Gamma pude ser utilizada para generar valores
que representan el tiempo total requerido para completar n desempeos independientes de la
actividad. Es una generalizacin de la Erlang y tiene parmetros no enteros. Se usa en modelos de
colas para modelar tiempos de servicio y tiempos de reparacin. El parmetro es llamado
parmetro de forma y es llamado parmetro de escala.

( )
1
( ) , 0
x
f x x e x
|
|u
|u
|u
|


= >
I( )

E(x)=
1
u
, V(x)=
2
1
|u

Varias tcnicas de aceptacin-rechazo para generar variables aleatorias Gamma han sido
desarrolladas, Fox y Scharge [1978]; Fishman, 1978; Law y Kelton [1991]. Uno de los mas
eficientes es dado por Cheng [1977]; el nmero promedio de pruebas esta entre 1.13 y 1.47 para
cualquier valor del parmetro de forma 1
Si el parmetro de forma = k, una posibilidad es usar la tcnica de Convolucin (Como se
hizo en la Distribucin Erlang). Debido a que la distribucin Erlang es un caso especial de una
distribucin Gamma ms generalizada. Por otro lado, la tcnica de aceptacin-rechazo descrita
aqu ser un mtodo altamente eficiente para la distribucin Erlang especialmente si = k es
grande. La rutina genera variables aleatorias Gamma con parmetro de escala y un parmetro
de forma , esto es, con media
1
u
y varianza
2
1
|u
.



Los pasos a seguir son los siguientes:

Paso 1. Calcule a = (2 -1)
1/2
, b = 2 -Ln4 + 1/a
Paso 2. Genere R
1
y R
2
.
Paso 3. Calcule X = [R
1
/(1-R
1
)]
a

Paso 4a. Si X > b- Ln(R
1
2
R
2
), rechace X y regrese al paso 2.
Paso 4b. Si X Ln(R
1
2
R
2
) use X como la variable buscada. Las variables generadas en el
paso 4b tendrn media y varianza ambas igual a . Si se desea tener con media
1
u
y varianza
2
1
|u

, entonces incluya
Paso 5. Remplace X por X/
2
.
La idea bsica de todos los mtodos de aceptacin-rechazo es nuevamente ilustrar aqu, pero la
prueba de esto no es la intencin de este libro. En el paso 3, X = [R
1
/(1-R
1
)]
a
no esta distribuida
en forma Gamma, pero el rechazo de cierto valores de X en el paso 4 garantiza que los valores
aceptados en el paso 4b tienen una distribucin Gamma.

Ejemplo
Los tiempos muertos de una mquina de de gran produccin de dulces se han determinado tener
una distribucin gamma con media de 2.2 minutos y una varianza de 2.1 minutos. Por lo que
1/=2.2 y 1/
2
=2.10, la cual implica que =2.30 y =0.4545.

0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
0
3
.
5 7
1
0
.
5
1
4
1
7
.
5
2
1
2
4
.
5
2
8
3
1
.
5
3
5
3
8
.
5
4
2
4
5
.
5
4
9
(2,2)
(6,2)
(6,6)
Paso 1. a=1.90, b=3.74
Paso 2. Genere R
1
=0.832, R
2
=0.021.
Paso 3. Calcule X=2.3(0.832/0.168)
1.9
=48.1
Paso 4. X=48.1 > 3.74-Ln[(0.832)
2
0.021]=7.97, por lo que se rechaza X y se regresa al
paso 2.
Paso 2. Genere R
1
=0.434 y R
2
=0.716.
Paso 3. Calcule X=2.3(0.434/0.566)
1.9
=1.389
Paso 4. Debido a que X01.389 3.74 Ln[(0.434)
2
0.716]=5.74, se acepta X.
Paso 5. Divida X entre =1-045 para obtener X=1.329.

Este ejemplo tomo 2 pruebas para generar una variable aleatoria distribuida Gamma, pero en
promedio para generar una 1000 variables Gamma, el mtodo requerir entre 1130 y 470 pruebas,
o en forma equivalente, entre 2260 y 2940 nmeros aleatorios.


4.2.7 Distribucin Beta

Dos parmetros son necesarios para definir una distribucin Beta a y b. Variando estos valores se
produce una variedad de forma de la distribucin. Los valores generados de esta distribucin
tendrn un rango entre 0 y 1. Por esta razn, es particularmente til para representar fenmenos
relacionados con proporciones. La proporcin de artculos defectuosos encontrados en un lote
determinado puede ser descrita por esta distribucin. La distribucin Beta tambin puede ser
usada el tiempo para completar una actividad, cuando se tiene poca o nada de informacin
disponible sobre la duracin de una actividad.

Se usa para representar variables que estn acotadas, por ejemplo, entre 0 y 1. El rango de la
variable puede ser cambiado por otro rango [x
min
, x
max
] sustituyendo x en la ecuacin siguiente por
(x - x
min
) / (x
max
- x
min
).
Se usa para modelar:
- La fraccin de paquetes que requieren retransmisin
- La fraccin de llamadas a procedimientos remotos que tardan mas de determinado
tiempo.

Media:
Varianza:


















Generacin:
1. Genere dos gamas y tome la razn:

2. Si a y b son enteros:
- Genere a + b + 1 nmeros uniformes U(0,1).
- Retorne el a-esimo menor nmero como beta(a , b).
3. Si a y b son ambos menores que 1:
Genere u
1
y u
2
ambos U(0,1).
Haga
1
1
a
X R = y
1
2
b
R = . Si x + y > 1 vaya al paso previo, de lo
contrario retorne x/(x + y) como el valor de beta(a, b).
4. Si a y b son ambos mayores que 1, un algoritmo basado en el mtodo del
rechazo puede ser fcilmente implementado.


4.2.8 Distribucin Chi-cuadrada

f x
x x
a b
x a b
a b x x dx
a b
a b
a b
a b
( )
( )
( , )
( , ) ( )
( ) ( )
( )
=

s s > >
= =
+


}
1 1
1 1
0
1
1
0 1 0 0
1
|
|
, ,
I I
I
a a b / ( ) +
ab a b a b / [( ) ( )] + + +
2
1
beta( , )
( , )
( , ) ( , )
a b
a
a b
=
+


1
1 1
0
0.5
1
1.5
2
2.5
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
0
.
7
0
.
8
0
.
9 1
beta(2,2)
beta(2,4)
beta(4,2)
Se usa cuando tenemos una suma de cuadrados de normales estndar, por ejemplo, para modelar
varianzas mustrales.


Generacin:
1. El siguiente mtodo se basa en el hecho de que la _
2
(v) es una (2, v/2).
Para v par:

Para v impar:

2. Genere v N(0,1) y retorne la suma de sus cuadrados.



4.2.9 Distribucin F

La F es la razn entre dos chi-cuadradas. Se usa para modelar la razn entre varianzas mustrales
como por ejemplo en la prueba-F en regresin y anlisis de varianza.


f x
x e
v
x
b e x dx b b b b b b
v x
v
x b
( )
( / )
( ) ( ) ( ), , ( ) ! , , ,...
( ) / /
/
= s <
= + = + = =

}
2 2 2
2
1
0
2 2
0
1 1 012
I
I I I I I

, (1/ 2) = si t
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
0 2 4 6 8
1
0
1
2
1
4
1
6
1
8
2
0
2
2
2
4
_
2
1
2
1
2
( ) ln
/
v u
i
i
v
=
|
\

|
.
|
=
[
| |
_ _
2 2
2
1 01 ( ) ( ) ( , ) v v N = +
f x
n m
n m
x
n
m
x x n m
n
n
n m
( )
( / )
( / , / )
/
( )/
( )/
= +
|
\

|
.
|
s <

+
2
2 2
2
2 2
1 0
|
, y enteros positivos.
v=4
v=8
Media:
Varianza:

Generacin:
Por caracterizaron. Genere dos chi-cuadrados _
2
(n) y _
2
(m) y calcule:



4.2.10 Distribucin Lognormal

Una distribucin Normal puede ser usada para representar el tiempo para realizar una actividad.
Un ejemplo puede ser el tiempo de ciclo para completar la operacin de un carrusel de almacenaje
y recuperacin de un sistema automatizado de almacenaje.
Es el logaritmo de una normal. Se usa frecuentemente en modelos de regresin y anlisis de
experimentos donde se aplican transformaciones logartmicas.
El producto de un gran nmero de variables aleatorias positivas tiende a la lognormal. Por lo tanto,
tambin se usa para modelar errores que son el producto de efectos de un gran nmero de
factores.

m
m
m

>
2
2 y
2 2
2 4
4
2
2
m n m
n m m
m
( )
( ) ( )
+

> y
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0 1 2 3 4 5 6 7 8 9
1
0
1
1
1
2
1
3
1
4
1
5
F n m
n n
m m
( , )
( ) /
( ) /
=
_
_
2
2
F(4,4) F(4,4)
F(4,8)

Media:
Varianza:


Generacin:
Genere x ~ N(0,1) y retorne .


4.2.11 Distribucin Pareto

Es til para ajustar observaciones a una distribucin. Dada una muestra de tamao n x
1
, ..., x
n
`,
el estimador mximo verosmil del parmetro a es:



Media:
f x
x
e x
x x
x
( ) ,
( ) .
(ln ) /
= < <

1
2
0
2 2
2
o t
o
o
o
y > 0.
y son la media y la desviacion de log y NO de
e
o +
2
2 /
e e
2
2 2
1
o o +
( )
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0
.
1 1
1
.
9
2
.
8
3
.
7
4
.
6
5
.
5
6
.
4
7
.
3
8
.
2
9
.
1
1
0
1
0
.
9
1
1
.
8
e
x o +
( )
a
n
x
i
i
n
=
=

1
1
1
ln
f x ax x a
F x x
a
a
( ) ,
( )
( )
= s < >
=
+

1
1 0
1

a
a
a

>
1
1 , para
LN(0,100)
Varianza:

Generacin:
Por transformacin inversa: Genere u ~ U(0,1) y retorne .



4.2.12 Distribucin T Student

Se aplica cundo se tenga la razn entre una normal y la raz de una
2
_ y comnmente se usa en
el calculo de intervalos de confianza. Si x ~ N(0,1) y y ~_
2
(v), entonces
x
y
v
tiene distribucin t
con v grados de libertad.

La f(x) de la t es muy similar a la de la normal estndar: tiene forma de campana y es simtrica
respecto a cero. Para grados de libertad grandes (v>30), la t se puede aproximar por la normal
estndar.



a
a a
a
( ) ( )
,

>
1 2
2
2
para
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
1
1
.
2
1
.
4
1
.
6
1
.
8 2
2
.
2
2
.
4
2
.
6
2
.
8 3
3
.
2
3
.
4
3
.
6
3
.
8
1
1
u
a /
N
v v
t v
( , )
( ) /
~ ( )
01
2
_
| |
| |
f x
v x v
v v
x v
v
( )
( ) / ( / )
( ) ( / )
, ,
( )/
/
=
+ +
< <
+
I
I
1 2 1
2
2
1 2
1 2
t
entero positivo.
Pareto(5)
Varianza: v/(v-2), para v > 2.


Generacin:
Por caracterizaron. Genere x ~ N(0,1), y ~_
2
(v), y retorne
x
y
v
como t(v).


4.3.- Simulando Distribuciones Discretas de Probabilidad

Existe un nmero de distribuciones discretas tericas de probabilidad; las distribuciones discretas
mas frecuentemente usadas en la simulacin de modelos son la Bernoulli, Binomial, Poisson,
Geomtrica, Pascal y Uniforme discreta. Por lo tanto limitaremos nuestro anlisis a estas
distribuciones.
El proceso generador puede ser desarrollado para distribuciones discretas de probabilidad usando
el mtodo de transformacin inversa. Pero un enfoque simple es utilizar un proceso de conteo
conocido como el mtodo de composicin.


4.3.1 Distribucin Bernoulli

Esta es la ms simple de las distribuciones discretas. Toma solo dos valores que se denotan como
fracaso (x = 0) o xito (x = 1), con probabilidades 1-p y p respectivamente.
Se usa para modelar la probabilidad de que un resultado sea de una clase especfica o tenga una
caracterstica especfica.
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
-
1
0
-
8
.
5 -
7
-
5
.
5 -
4
-
2
.
5 -
1
0
.
5 2
3
.
5 5
6
.
5 8
9
.
5
t(4)
- Un sistema de computacin esta funcionando o no.
- Un paquete en una red llego a su destino o no.

Esta distribucin junto con sus derivadas, se puede usar solo si los ensayos son independientes e
idnticamente distribuidos de forma tal que la probabilidad de xito en cada ensayo sea p y no sea
afectada por el resultado en ensayos anteriores.












f x
p
p
x
x ( ) =
=
=

1
0
0
1
si
si
en otro caso
0
0.2
0.4
0.6
0.8
1
0 1
Bernoulli(0.6)



Generacin:
Use transformacin inversa. Genere R ~ U(0,1). Si R s p retorne 1, de otra forma
retorne 0.



4.3.2 Distribucin Binomial

La funcin de masa de probabilidad, que es e modelo matemtico para la distribucin Binomial, se
expresa como sigue:

x n x
p p
x n x
n
x p

= ) 1 (
)! ( !
!
) (
Media: np
Varianza: np(1-p)
Donde,
n= es el nmero de pruebas independientes
p= es la probabilidad de xito en cualquier prueba

x= es la
variable
aleatoria que
representa el
nmero de
xitos en n
pruebas.






0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0 2 4 6 8
1
0
1
2
1
4
1
6
1
8
2
0
Binomial(0.6,20)








Dados los parmetros n y p, el proceso generador Binomial simplemente implica muestrear n veces
y calcular el nmero x de xitos. En cada prueba una variable aleatoria uniforme R es generada y
comparada con la probabilidad de xito p. Si R es menor que (<) p , la prueba es considerada un
xito y contabilizada ; si es mayor que (>) que p, la prueba es considerada una falla. Despus de
n pruebas el nmero de xitos es el valor de la variable aleatoria Binominal.
4.3.3 Distribucin Poisson

Se usa extensivamente en modelos de colas para modelar el nmero de llegadas en cierto
intervalo:
- Nmero de consultas a un servidor en un intervalo t.
- Nmero de fallas en componentes por unidad de tiempo.
- Nmero de consultas a una base de datos en t segundos.
- Nmero de errores de tecleo por forma.

Si los datos son obtenidos en la forma d el nmero de arribos por unidad de tiempo, entonces los
datos pueden ser descritos por una distribucin Poisson.
La funcin de masa de probabilidad para la distribucin Poisson se define como sigue:


!
) (
) (
x
e T
x p
T x


= , para 0 < x < o
Media: .
Varianza: .
donde,
T= al nmero de arribos por perodo de tiempo T
x =al nmero de arribos en el intervalo de tiempo

Si el nmero de arribos por perodo de tiempo puede ser descrito por la distribucin Poisson,
entonces el tiempo entre arribos puede ser descrito por la distribucin exponencial.

Utilizando esta relacin se simula el tiempo de arribo utilizando el proceso generador exponencial y
se cuenta el nmero de arribos que ocurren en el perodo de tiempo (T).
El mtodo de composicin para generar variables aleatoria Poisson es el siguiente:

Paso 1 Identifique la longitud del perodo T. Inicialice a cero el contador de arribos, n y el
contador de intervalo de tiempo t.
Paso 2 Genere el intervalo de tiempo para un arribo utilizando el generador de proceso
exponencial.
Paso 3 Sume el tiempo entre arribos en el paso 2 a t; sume 1 al contador de nmero de arribo n.
Paso 4 si t>T en el paso 3, entonces deseche el ultimo arribo y reste 1 del contador de nmero de
arribos, n, y vaya a el paso 5 de otra forma vaya al paso 2.
Paso 5 El valor de n es la variable aleatoria para la distribucin Poisson.

Problema
El nmero de clientes que llegan a un banco est descrita por una distribucin poisson con una
media de 4 arribos cada hora. Simule el arribo de los clientes sobre un perodo de 1 hora.
(Recordar la relacin reciproca entre el tiempo entre arribos (dist. Exponencial) y el No. de arribos
por perodo de tiempo (Dist. Poisson)).

= 4 / horas = 8/hora; por lo que el tiempo entre arribos = 7.5 min.
0
0.05
0.1
0.15
0.2
0.25
0.3
0 1 2 3 4 5 6 7 8 9
1
0
1
1
1
2
Poisson(5)
x = - (1/ ) Ln (R)
n R Tiempo entre
arribos
Tiempo transcurrido
1 .5582 .0729 .0729
2 .4459 0876 .1605
3 .1824 .2126 .3731
4 .7041 .0439 .4170
5 .3555 .1293 .5463
6 .9717 .0036 .5499
7 .5571 .0731 .6230
8 .4674 .0951 .7181
9 .8461 .0209 .7390
10 .1838 .2117 .9507
11 .1834 .2120 1.1627

10 arribos/ hora
tiempo de entre arribo = 6 min.

Cuando 15, la tcnica de aceptacin-rechazo se convierte en algo caro ( por la cantidad de
clculos que se realizan ), pero afortunadamente se usa una tcnica para aproximar basada en la
distribucin Normal que trabaja bastante bien. Cuando , es grande,




Tiene una distribucin aproximadamente Normal con media cero y varianza 1, lo cul sugiere ser
una tcnica de aproximacin. Primero genere una variable Normal estndar Z, usando la ecuacin
1
( 2 ( )) (2 )
i i
Ln R Sin R t
+
(


o
1
( 2 ( )) (2 )
i i
Ln R Cos R t
+
(




N
Z

=
(Usadas en la generacin de variables aleatorias Normales 12 13 y )
entonces genere la variable Poisson requerida, N , usando

N= 0.5 Z + 20

donde 0.5 es una funcin de redondeo ( Si 0.5 Z + < 0, entonces N=0 ) el trmino 0.5
usado en la formula hace que la funcin de redondeo se convierta en una funcin de redondeo
cercana al entero ms prximo. La ecuacin 36 no es una tcnica de aceptacin-rechazo, pero
puede ser usada como una alternativa de este mtodo, que provee un mtodo algo eficiente para
generar variables Poisson con media grande.



4.3.4 Distribucin Geomtrica

El nmero de ensayos hasta e incluyendo el primer xito en una secuencia Bernoulli es una
Geomtrica. Es la equivalente discreta de la exponencial en cuanto a la propiedad de prdida de
memoria: recordar el pasado no ayuda a predecir el futuro.

( ) (1 ) , 0,1, 2,....
x
p x p p x = =
Media: 1/p
Varianza:

donde 0<p<1, representa el nmero de fracasos hasta que se produce el primer xito en un
experimento de Bernouilli de parmetro p.

Su funcin de Densidad Acumulada FDA esta dada por ( ) 1 (1 ) , 0,1, 2,...
x
F x p x = =

La variable geomtrica se puede relacionar fcilmente con la variables exponencial:

Sea. ( ) ( ) exp , 1 , 0
y
Y
Y F y e y


= = >

Sea x>0, entonces ( )
( 1)
( 1) ( 1) 1 (1 )
x x
Y Y
P x Y x F x F x e e
+
< s + = + =
1
2
p
p



Como ( ) 0,1 e

e , tomemos tal que 1 e p

= para conseguir la expresin de probabilidad
puntual de una distribucin G(p). Basta tomar = -Ln(1-p). Despus se toma un valor y segn una
[ (1 )] Exp Ln p y se toma x=[y]. Ya se vio que para ello hay que hacer
(1 )
LnR
y
Ln p
=

, con
R U(0,1), por lo que se concluye que
(1 )
LnR
x
Ln p
=



Donde [x] denota el menor entero mayor o igual a x.

Problema
Genere tres valores para una distribucin Geomtrica en el rango (X1) con media 2. La media es
1/p por lo que p=2. Calculando
1
1.443
(1 ) Ln p
=

y usando los nmeros aleatorios 0.932,


0.105, y 0.687, tenemos

X
1
=-1.443Ln(0.932) = 0.10169
X
2
=-1.443Ln(0.105) = 3.2522
X
3
=-1.443Ln(0.687) = 0.541732

Como X denota el menor entero mayor o igual a x, entonces
X
1
=1 X
2
=4 y X
3
=1

4.3.5 Distribucin Pascal

Es una extensin de la geomtrica. En una secuencia de ensayos Bernoulli, el nmero de ensayos
hasta e incluyendo el m-esimo xito tiene distribucin de Pascal.

Es til para modelar el nmero de intentos para obtener cierto nmero de xitos:
( )
( ) 1
X x x
e e e e

= + =
- Nmero de intentos para transmitir un mensaje de m paquetes.
- Nmero de bits a enviar para recibir exitosamente una seal de m bits.


Media: m/p.
Varianza: m(1-p)/p
2
.


Generacin:
Genere m geomtricas G(p) y retorne la suma como una Pascal(p , m ).


4. 3.6 Distribucin Uniforme (discreta)

Toma un nmero finito de valores, todos con la misma probabilidad. Se usa cuando se cree que los
valores sobre un intervalo son equiprobables:
- Nmero de pistas a acceder en un disco.
- El nmero del dispositivo de entrada/salida seleccionado para la prxima operacin.
- El nodo de origen y destino del prximo paquete en una red.
f x
x
m
p p x m m p m
m x m
( ) ( ) , , ,..., ; ; =

|
\

|
.
|
|
= + < <

1
1
1 1 0 1 entero positivo.
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
2 3 4 5 6 7 8 9 10 11 12
Pascal(0.6,2)

Media: (n + m)/2
Varianza:

Generacin:
Genere R ~ U(0,1) y retorne [m + (n - m + 1)u].


4.4. Distribuciones Empricas Continuas

Si el modelador no ha sido capaz de encontrar una distribucin terica que provea un buen
modelo para el suministro de datos, puede ser necesario usar la distribucin emprica de los datos.
El mtodo de transformacin inversa puede ser aplicado en tales situaciones, dado que la funcin
de la distribucin de probabilidad es conocida

Ejemplo 1
Suponga que se conocen los tiempos de reparacin de piezas quebradas. Los datos se muestran a
continuacin:
Intervalo
(horas)
Frecuencia Frecuencia
Relativa
Frecuencia
Acumulada
f x
n m
x m m n m n n m
F x
x m
n m
x m
m x n
n x
( ) , , ,..., ; .
( )
=
+
= + >
=
+
+
<
s <
s

1
1
1
0
1
1
1
y enteros y
si
si
si
( ) n m + 1 1
12
2
0
0.1
0.2
0.3
0.4
0.5
1 3 5 7 9
1
1
1
3
1
5
1
7
1
9
UD(6,15)
0x0.5 31 0.31 0.31
0.5<x1.0 10 0.10 0.41
1.0<x1.5 25 0.25 0.66
1.5<x2.0 34 0.34 1.00

Por ejemplo. Hay 31 observaciones entre 0 y 0.5 de hora, 10 entre 0.5 y 1 hora, y as
sucesivamente.

La verdadera distribucin acumulada, de F(x), de los tiempos de reparacin ( la lnea curva de la
figura siguiente) puede ser estimada tomando como base la FDP ( F(x) estimada )




















0.5 1.0 1.5 2.0
0.2
0.4
0.6
0.8
1.0
Tiempos de Reparacin
F
r
e
c
u
e
n
c
i
a

A
c
u
m
u
l
a
d
a
(0,0)
(0.50,0.31)
(1.0,0.41)
(1.5,0.66)
(2.0,1.0)
Estimacin de F(x)
F(x)
F(x)
x
La forma verdadera de F(x) es desconocida y ser en la prctica siempre desconocida, a menos
que se tenga disponible una cantidad enrome de datos.

Para poder generar variables aleatorias que se tengan el comportamiento de esta distribucin
emprica es necesario encontrar las ecuaciones de cada tramo de recta en la grfica. Por lo que
primero obtenemos la pendiente de cada recta como se muestra en la figura siguiente





















Por ejemplo si tomamos el segundo tramo de recta y sean P
1
(0.31,0.5) y P
2
(0.41,1), entonces la
pendiente m
2
se calcula como


.2 .4 .6 .8 1
.5
1
2
1.5
(0,.25)
(0.31,.5)
(0.41,1)
(0.66,1.5)
(1,2)
Frecuencia Acumulada
Tiempos
de
Reparacin
m1=0.81
m2=0.5
m3=2.0
m4=1.47
F(x)
x


Una vez conocida la pendiente podemos obtener la
ecuacin de la recta con la expresin




Y entonces obtener la ecuacin de su recta

Resolviendo para y, tenemos que y = 0.50+0.50(x-0.31).

Haciendo lo mismo para los otros tramos de recta, tenemos;


1 0.25 .81
2 0.50 0.5( .31)
3 1 2( 0.41)
4 1.5 1.47( 0.66)
tramo x
tramo x
y
tramo x
tramo x
+

=

+



Se aplica la tcnica de transformacin inversa directamente para generar los tiempos de
reparacin de la rotura X, haciendo que R (numero pseudoaleatorio) tome el lugar de x (dado que
el eje x representa a F(x) y F(x)=R), y X el lugar de y en la formula obtenida para el tramo de recta
2, tenemos que;


Haciendo lo mismo para todos los tramos de recta, se obtiene la expresin para generar la variable
aleatoria X


2 1
2
2 1
1 0.5
0.5
.41 .31
y y
m
x x

= = =

1
2
1
y y
m
x x

0.5
0.5 ; 0.5( 0.31) 0.5
0.31
y
x y
x

= =

0.50 0.5( 0.31) X R = +


0.25 0.81 , 0 0.31
0.50 0.5( 0.31), 0.31 0.41
1 2( 0.41), 0.41 0.66
1.5 1.47( 0.66), 0.66 1
R Si R
R Si R
X
R Si R
R Si R
+ s s

+ < s

=

+ < s

+ < s






Si generamos algunas variables aleatorias con estas expresiones, tenemos

i Numero
Aleatorio
R
i
Tramo de
Recta
Variable
Aleatoria
X
i
1 .5545 3 1.2890
2 .8921 4 1.8411
3 .2176 1 0.4240
4 .7023 4 1.5621
5 .3876 2 0.5388


Ejemplo 2
Considere la variable aleatoria que tiene como FDP
1/ 6, 0 2
( ) 1/ 3, 2 3
1/12, 3 7
x
p x x
x
s s

= < s

< s


Como se muestra en la figura siguiente







1 2 3 4 5 6 7
x
P(x)
1/6
1/3
1/12












La FDA de esta distribucin esta dada por;

( )
( )
1
) 0 2
6
1 1
( ) ) 2 2 3
3 3
2 1
) 3 3 7
3 12
a x x
P X b x x
c x x

s s

= + < s

+ < s



obtenida de la forma siguiente
a)
6 6
1
0
x
dx
x
=
}


b)
3
) 2 (
3
1
3
1
|
6
2
2

+ = +
}
=
x
dx
x
x
x



c)
}
+

+
=
x
x
dx x
3
3
12
|
3
) 2 (
3
1


desarrollando el proceso generador, utilizando el proceso de transformacin inversa, donde
R=F(x), tenemos que;

a) En R=1/6 (X) , para 0<X<2, implica que 0<R<1/3, en cuyo caso X=6 R

b) En R=1/3 + 1/3(X-2), para 2<X<3 , implica que 1/6<R<2/3, en cuyo caso X=3(R-1/3)+2

c) En R=2/3+1/12(X-3), para 3<X<7, implica que 2/3<R<1, en cuyo caso X=12(R-2/3)+3

Por lo que X (variable aleatoria) puede ser generada por

1
6 0
3
1 1 2
3( ) 2
3 3 3
2 2
12( ) 3 1
3 3
R x
X R R
R x

s s

= + < s

+ < s




Ejemplo 3
Desarrolle un proceso generador para las siguientes funciones de densidad de probabilidad.
1
, 0
2
( )
1
, 0
2
x
x
e x
f x
e x

< s

< s


Para generar la funcin de densidad acumulada de probabilidad (FDA), tenemos que
1 1 1 1
( ) | ( )
2 2 2 2
x
x x x x x
F x e e e e e

= = = =
}


Como R = F(x) = e ; X =Ln (2R), para R < , y

0 -x
0
0
1 1 1 1
( ) | ( ) ( 1) - e
2 2 2 2
x
x x x x x
F x e e e e e

= = = = =
}


La FDA de esta distribucin esta dada por;

1
, 0
2
( )
1 1
, 0
2 2
x
x
e x
F x
e x
+

< s

< s



Como R = F(X) = - e
-x
; R - = - e
-x
; X = - Ln (1- 2R) , para s R s 1

Por lo que X (variable aleatoria) puede ser generada por
1
(2 ) 0
2
1
(1 2 ), 1
2
Ln R R
X
Ln R R

s s

< s




Problemas Propuestos
1. En un proceso de produccin de chips microprocesadores el 2% de los mismos salen
defectuosos. Cada da se toma una muestra aleatoria de 50 unidades. Si la muestra contiene ms
de 2 defectuosos, el proceso debe ser parado. Determinar la probabilidad de que el proceso sea
parado por el esquema de muestreo.

2. Un autobs llega cada 20 minutos a una parada determinada comenzando su servicio a las 6:40
AM y terminando a las 8:40 AM. Un pasajero determinado no conoce la planificacin pero llega de
forma uniformemente distribuida entre las 7:00 AM y las 7:30 AM cada maana. Cul es la
probabilidad de que el pasajero espere ms de 5 minutos por el bus?.

3. Supongamos que la vida de una lmpara industrial en miles de horas se encuentra distribuida
exponencialmente con una razn =1/3 (esto es, se produce un fallo cada 3000 horas). Calcular la
probabilidad de que la lmpara dure ms de 3000 horas. Calcular la probabilidad de que una
lmpara dure entre 2000 y 3000 horas. Calcular la probabilidad de que dure otras 1000 horas si ha
estado funcionando durante 2500 horas.

4. El profesor de un colegio se va a casa durante el verano, pero desea dejar una luz encendida en
el colegio para desanimar a los ladrones. Para ello instala un dispositivo de dos bombillas, de tal
modo que se encienda la segunda caso de fallar la primera. La caja en la que vienen las bombillas
pone: "vida media de 1000 horas, exponencialmente distribuida". El profesor vuelve al cabo de 90
das (2160 horas). Cul es la probabilidad de que se encuentre una bombilla encendida?.

5. Un determinado examen mdico es llevado a cabo en tres etapas por un mdico. Cada etapa
dura un tiempo exponencialmente distribuido con una media de tiempo de servicio de 20 minutos.
Encontrar la probabilidad de que el examen dure 50 minutos o menos. Adems, determinar la
duracin media del examen.

6. El tiempo que se permanece en la cola de un autoservicio se ha visto que sigue una distribucin
N(10,9). Cul es la probabilidad de que un cliente espere entre 9 y 12 minutos?

7. El tiempo perdido desde la demanda de un determinado artculo X se puede aproximar por una
distribucin normal con un valor medio de 25 das y una varianza de 9. Se desea conocer un valor
de tiempo perdido tal que sea slo excedido un 5% de las veces que se formule un pedido.

8. Se sabe que el tiempo que tarda en fallar un componente electrnico viene dado por una
distribucin Weibull con =0, =1/3 y =200 horas. Calcular: a) la vida media (o tiempo medio
que tarda en fallar el componente); b) la probabilidad de que un componente falle antes de 2000
horas.

9. Un sensor electrnico determina la calidad de chips semiconductores, rechazando aqullos que
fallan. Bajo demanda, el sensor dar el mximo y mnimo nmero de rechazos durante cada hora
de produccin durante las ltimas 24 horas. Tambin da la media. Sin informacin adicional, el
departamento de control de calidad ha asumido que el nmero de chips rechazados viene dado
aproximadamente por una distribucin triangular. El volcado de datos actual indica que el nmero
mnimo de chips rechazados por hora fue 0, el mximo 10 y la media 4. Calcular: a) la moda; b) la
mediana; c) un nmero de chips tal que slo el 5% de las veces el nmero de chips rechazados
por hora sea superior a l.

10. Un avin tiene sistemas hidrulicos duplicados. El avin conmuta automticamente al sistema
de reserva si falla el sistema primario. Si ambos sistemas fallan, el avin puede sufrir un accidente.
Supngase que la vida del sistema hidrulico est distribuida exponencialmente con una media de
2000 horas de vuelo. a) Si los sistemas hidrulicos son inspeccionados cada 2500 horas cul es
la probabilidad de que el avin sufra un accidente antes de ese tiempo? b) Qu probabilidad de
peligro puede esperarse si la inspeccin se hace cada 3000 horas en lugar de cada 2500 horas? c)
Si se quiere reducir la posibilidad de accidente a 2%, cada cuntas horas de vuelo hay que
revisar el sistema hidrulico?

11. Un cartero tiene una ruta consistente en 5 segmentos y el tiempo que tarda en cubrir cada
segmento est normalmente distribuido con una media y varianza tales como las que se detalla:
segmento A: N(38,16); segmento B: N(99,29); segmento C: N(85,25); segmento D: N(73,20); y
segmento E: N(52,12). Adems de los recorridos, el cartero necesita organizar el correo en la
oficina, lo que requiere un tiempo N(90,25). Llegar al punto de partida de la ruta requiere un tiempo
N(10,4), y volver requiere un tiempo N(15,4). El cartero finalmente debe hacer tareas
administrativas que le llevan un tiempo N(30,9). a) Cul es el tiempo de trabajo esperado para el
cartero en un da?. b) Cul es la probabilidad de que tenga que trabajar ms de 8 horas durante
un da? c) Cul es la probabilidad de que trabaje ms de 8 horas 2 o ms das en una semana de
6 das? d) Cul es la probabilidad de que un da cualquiera la ruta sea completada en 8h24
minutos?

12. A una oficina de expedicin de licencias llegan los clientes aleatoriamente a un ritmo de =50
clientes por hora. Hay 20 funcionarios, cada uno de los cuales despacha =5 clientes por hora en
promedio. a) Qu porcentaje de tiempo est cada funcionario ocupado?. b) Cul es el nmero
medio de funcionarios ocupados?. c) El jefe de la oficina se pregunta si puede disminuir el nmero
de funcionarios, en caso de poderse hacer cul es el nmero mnimo que se precisa para que
puedan ser atendidos todos los clientes?

13. Hay dos personas compitiendo para obtener un empleo. Abel dice que es ms rpido
despachando que Benito, pero Benito dice que l es mucho ms uniforme en su trabajo. Las
llegadas llegan de acuerdo con un proceso de Poisson con una razn de 2 por hora (1/30 por
minuto). Las estadsticas de Abel dan un tiempo medio de servicio de 24 minutos con una
desviacin estndar de 20 minutos. Las estadsticas de Benito dan un tiempo medio de 25 minutos,
con una desviacin estndar de tan slo 2 minutos. Si la longitud promedio de la cola es el criterio
de seleccin qu trabajador debera ser seleccionado?.

14. Los tiempos de llegada as como los tiempos de servicio en una peluquera se ha visto que
estn distribuidos exponencialmente. Llegan 2 clientes por hora y son atendidos 3 clientes por
hora. Calcular la probabilidad de encontrar 0, 1, 2, 3, y 4 o ms clientes en el sistema. Calcular la
probabilidad de que el peluquero est ocupado, el nmero medio de clientes en el sistema, el
tiempo medio consumido por cliente en ese sistema, el tiempo medio que un cliente se pasa
esperando en la cola y el nmero medio de clientes que hay en la cola.

15. Supngase que los mecnicos de un gran taller, con muchos mecnicos, llegan aleatoriamente
a un almacn de herramientas con una razn de Poisson de 10 por hora. Se sabe que hay un slo
dependiente en ese almacn que atiende a cada mecnico en un tiempo medio de 4 minutos y una
desviacin estndar de aproximadamente 2 minutos. Se sabe que los tiempos de servicio siguen
una distribucin de Erlang de orden k. Un mecnico produce 1500 Pesos/hora cuando est
trabajando. Cunto cuesta la espera en la cola por la visita de un mecnico al almacn y cul es
el costo medio por hora por ese concepto para el conjunto de todos los mecnicos?

16. Las llegadas a un aeropuerto van todas ellas a la misma pista de aterrizaje. En un determinado
momento del da estas llegadas siguen una distribucin de Poisson a razn de 30 por hora. El
tiempo que tarda un avin en tomar tierra es constante, 90 segundos. a) Calclese longitud media
de la cola, tiempo de espera medio en la cola, ocupacin del sistema y tiempo medio de respuesta
para este aeropuerto. b) Si un aterrizaje retrasado cuesta 50,000 pesos de combustible por hora en
promedio, calclese el costo promedio por hora de la espera de los aviones para aterrizar y el
costo promedio por avin.

17. La peluquera descrita en el problema 14 puede slo alojar 3 clientes, uno en servicio y 2
esperando. Los clientes restantes deben darse la vuelta si encuentran la peluquera llena.
Establecer las medias de rendimiento para este sistema.

18. Considrese el problema 15 de los mecnicos que van al almacn de herramientas.
Supongamos que las llegadas son un proceso de Poisson a razn de 2 mecnicos por minuto y
con tiempos de servicio con una media de 40 segundos distribuidos exponencialmente. Cuntos
dependientes hacen falta para que el sistema sea estable?. Analcese el rendimiento del sistema
con el mnimo nmero de dependientes necesario.

19. Hay 2 trabajadores encargados de 10 mquinas en una fbrica. Las mquinas funcionan
durante un tiempo medio de 20 minutos y entonces requieren un tiempo de servicio medio de 5
minutos; ambos tiempos se hallan distribuidos exponencialmente. Determinar las diversas medidas
de rendimiento de este sistema.

20. Un almacn de madera es servido por una flota de 10 camiones. Hay una gra disponible para
descargar los troncos de los camiones. Tarda un promedio de 1 hora en descargar un camin.
Despus de la descarga cada camin tarda un promedio de 3 horas en volver al almacn con la
siguiente carga de troncos. a) Es necesario realizar ciertas suposiciones sobre las distribuciones de
tiempos para poder analizar este problema de acuerdo con los modelos estudiados. Hganse y
justifquense. b) Con una gra, cul es el nmero promedio de camiones esperando a ser
descargados?cuntos camiones llegarn por trmino medio al almacn cada hora?qu
porcentaje de camiones encuentran al llegar la gra ocupada?es ste el mismo que la proporcin
de tiempo que la gra est ocupada?. c) Supngase que se instala una segunda gra en el
almacn. Responda a las mismas preguntas que en el apartado b). Haga una tabla comparando el
resultado para una o 2 gras. d) Si el valor de los troncos que llegan al almacn es de 20.000
pesos por camin y la gra cuesta 5000 pesos/hora (est trabajando o no), establezca cul es el
nmero ptimo de gras sobre la base del costo por hora. e) Adems de los costos supuestos en
el apartado d), si la direccin decide considerar el costo de los camiones parados y sus
conductores cul es el nmero ptimo de gras? Un camin y su conductor tienen un costo
estimado en 4.000 pesos por hora y se considera que estn parados mientras estn esperando en
la cola para ser descargados.


21. Supngase que se han recogido 100 tiempos de reparacin de una mquina. Esos datos
aparecen en la tabla siguiente en trminos del nmero de observaciones para los diferentes
intervalos.

Intervalo (horas) Frecuencia Frecuencia relativa Frecuencia acumulada

0 x 0.5 31 0.31 0.31
0.5 x 1.0 10 0.10 0.41
1.0 x 1.5 25 0.25 0.66
1.5 x 2.0 34 0.34 1.00

Supngase adems que todas las reparaciones duran ms de 15 minutos. Establecer el
mecanismo para generar valores de una variable aleatoria que tenga su misma distribucin.

22. Al final del da, el nmero de embarques en los muelles de carga de una compaa es 0, 1 o 2,
con una frecuencia relativa de ocurrencia de 0.50, 0.30 y 0.20 respectivamente. Establecer el
esquema de generacin de una variable aleatoria discreta que tenga esta distribucin, supuesto
que el nmero de embarques se modela como una distribucin discreta.

23. Considrese la distribucin uniforme discreta en {1, 2, ..., k} con una funcin fdp dada por
p(x)=1/k, con x =1, 2, ..., k y una funcin de distribucin dada por:
F(x) = 0 si x 1
1/k si 1 x<2
2/k si 2 x<3
.................. ..................
(k-1)/k si (k-1) x<k
1 si k x

Cmo generar una variable aleatoria X que tenga esa distribucin?

24. Una firma de ventas por catlogo enva sus encargos a un almacn central. Los encargos son
agrupados en cestas que van recorriendo el almacn en un vehculo. Las cestas entran en el rea
de empaquetado en grupos de 10. Los empaquetadores pueden ver fcilmente cuntos encargos
hay en la cola. Se est haciendo una simulacin del rea de empaquetado. Parece existir una
relacin entre la longitud de la cola y la velocidad de empaquetado. Si eso ocurre, la velocidad de
servicio puede cambiar como una funcin de la longitud de la cola. Se ha realizado un estudio de la
operacin, obtenindose los resultados de la tabla siguiente:

Observacin i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Longitud de la cola x 20 30 30 50 30 40 40 60 30 20 40 40 50 20 40
Velocidad de (paquetes en 20 24 29 24 27 33 31 39 23 18 34 32 36 21 30
Empaquetado 10 minutos)
Encontrar la relacin entre la velocidad de empaquetado y la longitud de la cola.

25. Los camiones llegan a un gran almacn en una forma totalmente aleatoria la cual puede ser
modelada como un proceso de Poisson con razn de llegada de =10 camiones por hora. El
controlador de la entrada enva los camiones alternativamente hacia las terminales norte o sur. Un
analista ha desarrollado un modelo para estudiar el proceso de carga/descarga en la terminal sur, y
necesita un modelo del proceso de llegada a esa terminal. Establzcase el esquema para generar
tiempo entre llegadas.

26. Los tiempos de servicio en la ventanilla de un cajero se hallan normalmente distribuidos con
una media de =7.3 minutos y varianza 2=11.7 minutos. Generar 10 tiempos de servicio.

27. Generar tres valores de una variable de Poisson con =0.2.

28. El autobs llega a una parada determinada segn un proceso de Poisson con una media de un
bus cada 15 minutos. Generar una variable aleatoria, N, que represente el nmero de llegadas de
autobs durante un intervalo de tiempo de 1 hora.

29. Los tiempos de parada para una mquina de hacer caramelos se ha comprobado que vienen
dados por una variable aleatoria de distribucin gamma con una media de 2.2 minutos y una
varianza de 2.10 minutos2. Genrese una secuencia de tiempos de parada que se ajuste a esa
distribucin.

30. Un espa trata de determinar el nmero de tanques que tiene el ejrcito enemigo. El enemigo
marca cada tanque con un nmero. Sabe que el nmero ms bajo es 100 y los tanques estn
numerados secuencialmente desde 100 hasta algn nmero desconocido dado por 100+b. El
espa se coloca en un cruce de carreteras durante un da, observa los tanques que pasan y anota
sus nmeros, obteniendo lo siguiente: 1783, 1522, 920, 587, 3653, 146, 2937, 1492, 736, 372,
3104, 3535. Cuntos tanques se puede estimar que tiene el ejrcito enemigo?.

31. Desarrolle una variable aleatoria con la siguiente funcin de densidad de probabilidad
2
2
, 0
( )
0
x
x
e x
f x
e x

< s
=

< s



32. Desarrolle el esquema para una distribucin triangular con la siguiente funcin de densidad de
probabilidad
1
( 2), 2 3
2
1
( ) 2 , 3 6
2 3
0,
x x
x
f x x
Cualquier otro caso

< s

| |
= < s

|
\ .



33. Desarrolle un generador para la variable aleatoria cuya funcin de densidad de
probabilidad es
1
, 0 2
3
1
( ) , 2 10
24
0
x
f x x
Cualquier otro caso

< s

= < s



34. Dada la siguiente variable continua para una funcin de densidad de probabilidad con rango de
-3 a 4, desarrolle un generador para la variable.
2
0, 3
1
, 3 0
2 6
( )
1
, 0 4
2 32
4 4
x
x
x
F x
x
x
x
s

+ < s

+ < s

>





Referencias Bibliogrficas

Bratley, P., L. Box, Y L.E. Scharge [1987], A Guide to Simulation, 2nd ed., Springer-Verlag, New
York.
Box, G.E.P., Y M-F.Muller [1958], A Note to Generation of Random Normal Deviates, Annals of
Mathematical Statisticas, Vol. 29, pag. 610-11.
Cheng, R.C.H. [1977], The Generation of gamma variables, Applied Statistician, Vol. 26, No. 1,
pag. 71-75.
Dagpunar, John [1988], Principles od random Variate Generation, Claredon Press, Oxford.
Devroye, Luc [1986], Non-Uniform Random Variate Generation, Springer-Verlag, New Cork.
Fishman, George S. [1978], Principles of Discrete Event Simulation, wiley, New Cork.
Law, A.M., Y W.D. Kelton [1991], Simulation Modeling & Anlisis, 2nd ed., McGraw-hill, New York.
Ripley, Brand D. [1978], Stochastic Simulation, Wiley, New York.
Schmeiser, Bruce W. [1979], Approximations to the inverse Cummulative Normal Function for use
on Hand Calculators, Applied Statistics, Vol. 28, pag. 175-176.
Schmeiser, Bruce W. [1980], Random variate generation: A Survey, in Simulation with Discrete
Models: A State of de Art View, T.I Oren, C.M. Shub, and P.F. Roth, eds., IEEE.
SCHMIDT, J.W., Y R.E. TAYLOR [1970], Simulation and Anlisis of Industrial Systems, Irwin,
Homewood,Ill.
www.virtual.unal.edu.co/cursos/sedes/ manizales/4030011/lecciones/cap3/cap_3_pag_13.html
CAPITULO 5 PRUEBAS DE AJUSTE DE
BONDAD

5.1 Introduccin

El suministro de datos es la fuerza motora para un modelo de simulacin. En la simulacin de un
sistema de colas, el suministro tpico de datos son las distribuciones del tiempo entre arribos y los
tiempos de servicios. Para la simulacin de un sistema de inventarios, el suministro de datos
incluyen la distribucin de la demanda y del tiempo de reposicin. Para la simulacin de un sistema
de confiabilidad, la distribucin de tiempo entre fallas de un componente en un ejemplo de
suministro de datos.
La determinacin de la distribucin apropiada de los datos a suministrar es la tarea principal desde
el punto de vista del tiempo y de los recursos requeridos. A pesar de lo sofisticado que quiera ser
el analista, los modelos que fallan en el suministro de datos conducirn a resultados cuya
interpretacin puede conducir a toma de decisiones (recomendaciones) errneas.

Estos son cuatro pasos en el desarrollo de un modelo til para el suministro de datos:
1.- Rena datos del sistema real de inters. Esto frecuentemente requiere un tiempo sustancial y
comprometer recursos. Desafortunadamente, en algunos casos no es posible reunir datos (por
ejemplo, cuando se esta extremadamente limitado por el tiempo, cuando el proceso de suministro
no existe an, o cuando las leyes o reglas prohben el reunir datos.) Cuando los datos no estn
disponibles, la opinin de un experto en el proceso debe considerarse para tener una sugerencia
de relevancia (educada).

2.- Identifique la distribucin de probabilidad que representa al proceso de suministro de datos.
Cuando los datos estn disponibles, este paso tpicamente inicia desarrollando la distribucin de
frecuencias, o histograma de los datos. Basado en la distribucin de frecuencias y en el
conocimiento estructural del proceso, una familia de distribuciones es elegida. Afortunadamente
varias distribuciones bien conocidas proveen prcticamente una buena aproximacin.

3.- Elija los parmetros que determinan la instancia especfica de la familia de distribuciones.
Cuando los datos estn disponibles estos parmetros pueden ser estimados de los datos.

4.- Evalu la distribucin elegida y sus parmetros asociados para realizar una prueba de ajuste de
bondad. La prueba de ajuste de bondad evala informalmente usando mtodos grficos, o
formalmente usando pruebas estadsticas. Las pruebas Chi-cuadrada, Kolmogorov-Smirnov y
Anderson-Darling son pruebas estndar de las pruebas de ajuste de bondad. Si no se esta
satisfecho con la distribucin elegida, entonces el analista regresa al paso 2, elige una familia
diferente de distribuciones, y repite el procedimiento. Se puede usar una distribucin emprica, si
despus de varias iteraciones este procedimiento fallan obtener el ajuste a una distribucin a los
datos reunidos.

Aunque en la actualidad hay programas disponibles para lograr los pasos 2,3, y 4 incluyendo
programas especficos tales como ExpertFit, y programas integrados tales como SIMAN, Stat:Fit
del ProModel, Statistica, MiniTab - es todava importante comprender el alcance de los programas,
de forma tal que se usen apropiadamente.
Desafortunadamente, no existen programas disponibles para situaciones en las que no hay datos
disponibles o en los que existe una relacin entre dos o ms variables de inters.


5.2 Estimacin de Parmetros

En muchas instancias la media de la muestra, o la media y la varianza de la muestra, son usadas
para estimar los parmetros de la distribucin hipotetizada. En los prrafos siguientes, tres
conjuntos de ecuaciones son dados para calcular la media y la varianza e la muestra. Las
ecuaciones 1 y 2 pueden ser usadas cuando un conjunto de datos discretos o continuos estn
disponibles. Las ecuaciones 3 y 4 son usadas cuando los datos son discretos y han sido
agrupados en una distribucin de frecuencias. Las ecuaciones 5 y 6 son usadas cuando los datos
son discretos o continuos y han sido ubicados en intervalos de clase. Las ecuaciones 5 y 6 son
aproximaciones y debern ser usadas nicamente cuando no hay datos disponibles.
Si las observaciones en la muestra de tamao n son X
1
,X
2
,,....X
n
, la media de la muestra (
_
X ) esta
definida por
_
1
n
i
i
X
X
n
=
=

y la varianza de la muestra S
2
, esta definida por
_
2 2
2 1
1
n
i
i
X n X
S
n
=

=



Si los datos son discretos y agrupados en una distribucin de frecuencias, las ecuaciones 1 y 2
pueden ser modificadas para dar una eficiencia computacional mucho mayor. LA media de la
muestra es calculada por
_
1
k
j j
j
f X
X
n
=
=

y la varianza de la muestra por
_
2 2
1 2
1
k
j j
j
f X n X
S
n
=

=

donde k es el numero de
valores de X y f
j
es la frecuencia observada de X
j
de X.

Ejemplo
Los datos siguientes pueden se analizados para obtener n = 100, f
1
=12, X
1
=0,
f
2
=10, X
2
=1,.....,, y

y


Arribos por
periodo

Frecuencia
Arribos por
periodo

Frecuencia
0 12 6 7
1 10 7 5
2 19 8 5
3 17 9 3
4 10 10 3
5 8 11 1

de la ecuacin 3
_
364
100
X = y
2
2
2080 100(3.64)
7.63
99
S

= =
donde S=2.76.

Cuando los datos son dados en intervalos de clase, no es posible obtener el valor exacto de la
media y varianza de la muestra. En tal caso, la media y varianza de la muestra se calculan
aproximadamente usando las ecuaciones siguientes:

_
1
c
j j
j
f m
X
n
=
=

y
_
2 2
1 2
1
c
j j
j
f m n X
S
n
=

=



donde f
j
es la frecuencia observada en el j
vo
intervalos de clase, m
j
es el punto medio del j
vo

intervalo de clase, y c en el numero de intervalos de clase.
1
364
n
j
j
X
=
=

2
1
2080
n
j j
j
f X
=
=



Ejemplo
Considere los datos de la vida de un Chip donde que son eliminados o perdidos.


Vida de Chip
(das)
Frecuencia
0 X
j
< 3
3 X
j
< 6
6 X
j
< 9
9 X
j
< 12
12 X
j
< 15
15 X
j
< 18
18 X
j
< 21
21 X
j
< 24
24 X
j
< 27
27 X
j
< 30
30 X
j
< 33
33 X
j
< 36
.
.
.
42 X
j
< 45
.
.
.
23
10
5
1
1
2
0
1
1
0
1
1
.
.
.
1
.
.
.
57 X
j
< 60
.
.
.
78 X
j
< 81
.
.
.
143 X
j
< 147
1
.
.
.
1
.
.
.
1

Para determinar los valores aproximados de
_
X y S
2
se usan las ecuaciones 5 y 6. Los siguientes
valores son determinados:

f
1
=23, m
1
=1.5, f
2
=10, m
2
=4.5,....., y

Con n=50,
_
X se obtiene de la ecuacin 5


_
614
12.28
50
X = = . Entonces S
2
se obtiene usando la ecuacin 6 como





Estimadores sugeridos para distribuciones frecuentemente usadas en simulacin


49
1
614
j j
j
f m
=
=

49
2
1
37, 226.5
j j
j
f m
=
=

2
2
37, 226.5 50(12.28)
605.849
49
S

= =

Distribucin Parmetro(s) Estimador(es)
sugerido(s)
Poisson
_ ^
X o =
Exponencial
^
_
1
X
=
Uniforme sobre (0,b) b
^
1 n
b
n
+
=
Normal ,
2

^ _ ^
2 2
, X S o = =
Gamma ,
^
|
^
_
1
X
u =
Weibull con = 0 ,
_
^
X
S
| =
^
^ ^
1
1 ^
'
1
( )
( )
j
j j
j
f
f
|
| |
|

=
Ve las ecuaciones 12
y 15 para
^
1
( )
j
f |

y
^
'
1
( )
j
f |


Iterar hasta que
converger
1
^
1
1
n
i
i
X
n
|
|
o
=
| |
=
|
\ .







5.3 Pruebas de Ajuste de Bondad

Las pruebas de Ajuste de Bondad proveen una gua til para evaluar la sustentabilidad de un
modelo potencial para el suministro de datos. Sin embargo, no existe una sola distribucin en
aplicaciones reales, de las que no debers ser esclavo para el veredicto de tales pruebas. Es
especialmente importante entender el efecto del tamao de la muestra. Si muy pocos datos estn
disponibles, entonces una prueba de ajuste bondad puede rechazar a alguna distribucin
candidato; pero si hay muchos datos disponibles, entonces una prueba de ajuste de bondad puede
rechazar a todas las pruebas candidato. Por esto, fallar en rechazar una distribucin candidato
debers ser tomada como una sola pieza de evidencia a favor de esta eleccin, mientras que
rechazar un modelo de suministro de datos es nicamente una pieza de evidencia contra la
eleccin.


5.3.1 Prueba Chi-Cuadrada ( _
2
)

Antes de poder usar un proceso generador en un estudio de simulacin, se debe demostrar que
los datos empricos pueden ser conocidos. Un nmero de pruebas estadsticas puede ser
utilizado para probar la bondad de ajuste de una distribucin terica a un conjunto dado de datos.
Una de las pruebas ms frecuentemente utilizada es la Chi-cuadrada (_
2
).

La prueba _
2
es un procedimiento para probar la Hiptesis de que una muestra aleatoria de
tamao n de la variable aleatoria X sigue una forma distribucional especfica. La prueba _
2
sirve
para determinar si existe alguna diferencia significativa entre las frecuencias esperadas (las
basadas en la distribucin terica) y las frecuencias actuales (las representadas por los datos).

La prueba es valida para tamaos de muestra grandes, para consideraciones de ambos tipos de
distribuciones discretas y continuas, cuando los parmetros son estimados por mxima
verisimilitud.

Los pasos seguidos para probar el proceso son:

1. Establezca la prueba de hiptesis, H
0
, en la que los n datos observados son
sacados de la poblacin que es descrita por una distribucin terica conocida.
2. Establezca la hiptesis alternativa, H
1
, en la que los n datos observados no
son sacados de la poblacin del paso 1.
3. Identificar el nivel de significacia, o, en el cual la prueba ser efectuada [ (1-
o ) nivel de significancia de la prueba estadstica].
4. Usando la siguiente relacin matemtica

e
e
f
f f
2
0 2
) (
= _
donde _
2

cal
= valor calculado de x
fo = frecuencias observadas
fe = frecuencias tericas observadas


Calcules fe
i
como np
i
, donde p
i
es la probabilidad terica hipotetizada asociada con el i
vo
intervalo.
prubese la _
2

cal
con _
2

tabla



si _
2

cal
> _
2

Tabla
entonces rechace Ho y acepte H1

si _
2

cal
< _
2

Tabla
entonces rechace H1 y acepte Ho

El valor de _
2
en la tabla es encontrado en la tabla de ji-cuadrada y es definido por el nmero de
grados de libertad (g.l.). Y estos se definen para la mayora de las pruebas de bondad como;
g.l.=k-s-1
donde;
k= No. de categoras (clases)
s= No. de parmetros del la distribucin de probabilidad hipotetizada

Ejemplo: Ajustando una Distribucin Poisson Usando la Prueba de Ajuste de Bondad Chi-
Cuadrada ( _
2
)

No. de Arribos/Hora Frecuencia Frecuencia (fo-fe)
2
(x) Observada
(fo)
Esperada
(fe)
f e
0 70 75.05 3.3398
1 84 75.05 1.0673
2 34 37.52 0.3302
3 12 * 16 12.51 *16 .38 0.0088
4 o Ms 4 3.87

204 _
2

cal
= 1.7461

*Calculando si _
2

cal
, se asume que cada clase de datos tiene una fe de al menos 5, debido a que
cada valor esperado para x>4 es 3.87 observaciones, se agrupan la 3y 4clase.


Nmero promedio de arribos 1
204
204
0
0
= = =

f
xf


usando =1 la funcin de densidad Poisson, se pueden calcular la probabilidad de los varios
nmeros de clientes que entran al banco. Estos se expresan como sigue ;

Funcin de densidad de la distribucin Poisson:

36788 .
! 0
) 1 (
) 0 (
1
= = =

e
x P
36788 .
! 1
) 1 (
) 1 (
1
= = =

e
x P
18394 .
! 2
) 1 (
) 2 (
1
= = =

e
x P
( )
( )
!
x
e
P x
x


=
06131 .
! 3
) 1 (
) 3 (
1
= = =

e
x P

3
0
( 4) 1 ( 4) ..01899
i
P x P x
=
> = < =



El nmero de grados de libertad para este problema en particular es 2, debido a que existen 4
intervalos de clases de datos en el conjunto original y la distribucin Poisson tiene un parmetro,
, por lo que g.l.=4-1-1=2 . Si probamos la hiptesis, Ho , a un nivel de confianza del 95%,
entonces =.05. Refirindose a la tabla _
2
se encuentra para =.05 y g.l.=2, _
2

Tabla
= 5.991.
Debido a que _
2

cal
es menor que _
2

Tabla
, se rechaza H
1
, y se concluye que los datos pueden ser
simulados adecuadamente con el proceso generador Poisson.

El valor mnimo de fe
i
es 5, y de obtenerse un valor menor a este valor, se combina este con los
intervalos de clase inmediatos superiores hasta que el valor combinado sea al menos 5. Lo mismo
debe hacerse con las columnas de fo y de
e
e
f
f f
2
0 2
) (
= _ .

La recomendacin para el nmero de intervalos de clase para datos continuos se resume en la
tabla siguiente;

Tamao de la muestra
n
Numero de intervalos de clase
k
20
50
100
>100
No use la prueba Chi-cuadrada
De 5 a 10
De 10 a 20

5
n
De n hasta



Ejemplo: Ajustando una Distribucin Exponencial Usando la Prueba de Ajuste de Bondad
Chi-Cuadrada (_
2
)
Realice una prueba de ajuste de bondad de los datos siguientes para una distribucin Exponencial.
Los 60 datos siguientes representan el tiempo en segundos del tiempo entre arribos de los carros
en una cierta interseccin.

12 7 26 6 18 15 44 28 9 44 16 19 37 29 8
10 9 18 35 17 20 31 8 24 15 18 30 11 28 68
7 19 4 26 25 37 46 9 18 14 7 34 26 9 49
9 16 32 7 4 6 23 8 36 19 5 21 9 3 22

La media es de 20.1 segundos.
La funcin de densidad de probabilidad de la distribucin exponencial esta dada por:

y su respectiva funcin acumulada de probabilidad por:
20.1
( ) 1 0
x
F x e

= >

Se realizan los clculos para obtener la frecuencia esperada de los diferentes intervalos de clase:

0
20.1
(0) 1 1 1 0 F e

= = =
10
20.1
(10) 1 1 .60804 0.391958 F e

= = =
20
20.1
(20) 1 1 0.369714 0.630285724 F e

= = =
30
20.1
(30) 1 1 0.224801 0.77519839 F e

= = =
40
20.1
(40) 1 1 0.136695 0.863304574 F e

= = =
50
20.1
(50) 1 1 0.08311 0.916887652 F e

= = =
20.1
1
( ) , 0
20.1
x
f x e para x

= >
60
20.1
(60) 1 1 0.050535733 0.949464266 F e

= = =
70
20.1
(70) 1 1 0.0307278 0.969272184 F e

= = =

p
1
=[F(10)-F(0)]*60 = 0.391958*60 = 23.51748
p
2
=[ [F(20)-F(10)]*60 = 0.238327724*60=14.29966
p
3
=[ [F(30)-F(20)]*60 = 0.1449698*60=8.698188
p
4
=[ [F(40)-F(30)]*60 = 0.088106184*60=5.286371
p
5
=[ [F(50)-F(40)]*60 = 0.053583078*60=3.21498468
p
6
=[ [F(60)-F(50)]*60 = 0.032576614*60=1.95459684
p
7
=[ [F(70)-F(60)]*60 = 0.019807918*60=1.188475

Ahora se elabora la tabla para el calculo de la
2
calculada
Celda Frecuencia
Observada
Fo
i

Frecuencia
Esperada
Fe
i
= np
i

2
( )
i i
i
Fo Fe
Fe


0-10 19 23.51748 0.8677641
10-20 16 14.29966 0.20218355
20-30 12 8.698188 1.25336601
30-40 8 5.286371 1.39297494
40-50 4 3.21498468
50-60 0 1.95459684
60-70 1 1.188475
Totales n = 60 60

Cuando Fe
i
= np
i
es menor que 5 se debe combinar con la celda inmediata superior. Lo cual
sucede para las ltimas 3 filas, resultando la tabla siguiente:
Celda Frecuencia
Observada
Fo
i

Frecuencia
Esperada
Fe
i
= np
i

2
( )
i i
i
Fo Fe
Fe


0-10 19 23.51748 0.8677641
10-20 16 14.29966 0.20218355
20-30 12 8.698188 1.25336601
30-40 8 5.286371 1.39297494
40-50 5 6.3580564 0.29007547
50-60
60-70
Totales n = 60 58.159755 4.286658

As la
2

calculada
=4.286658. Ahora se obtiene la
2
de la tabla, con grados de libertad igual a 5-1-
1=3, y con un nivel de significancia =0.05

2
Tabla,3,0.05
=7.81

Como la
2

calculada
=4.286658 es menor que
2
Tabla
=7.81, se puede decir que los tiempos entre
arribos de los carros siguen comportamiento que se apega a una distribucin exponencial.


5.3.2 Prueba Kolmogorov-Smirnov

Otra prueba de ajuste de bondad que se usa frecuentemente es la prueba Kolmogorv-Smirnov
(KS). Una ventaja de esta prueba sobre la prueba Chi Cuadrada es que no requiere que los datos
sean agrupados en intervalos de clase ( en el caso de considerar una distribucin de probabilidad
continua, esta agrupacin es arbitraria) y elaborar un histograma con los datos (lo cual, debido a su
base subjetiva, puede resultar en una perdida de alguna informacin pertinente). Cuando se
cambia el nmero de intervalos de clase y el ancho del intervalo afecta el valor calculado y
tabulado de la Chi-cuadrada. Una hiptesis puede ser aceptada cuando los datos son agrupados
de una manera, pero pueden ser rechazados si se agrupan de otra. Otra ventaja de la prueba KS
es que se realiza bien an para cantidades pequeas de datos (tamaos de muestra n pequea).

La desventaja principal de la prueba KS es que se aplica nicamente a distribuciones continuas.
Tambin, la forma original de la prueba KS requiere que todos los parmetros de la distribucin
candidata bajo prueba sean conocidos (por ejemplo los parmetros no pueden ser estimados
usando los datos obtenidos). Dado que los parmetros actuales de la distribucin de los datos son
raramente conocidos, esto limita seriamente la aplicabilidad de la prueba original KS. Ms
recientemente, una nueva forma de la prueba KS ha sido desarrollada, la cual permite la
estimacin de parmetros usando los datos obtenidos., pero esta prueba reciente se aplica ms de
manera mas favorable nicamente para las distribuciones Normal , Exponencial y Weibull. Nota
que la prueba KS ha sido aplicada a otras distribuciones continuas (y tambin a distribuciones
discretas) usando parmetros que son estimados sobre la base de los datos obtenidos. Aunque
esta prctica puede resultar en que obtengamos buenos ajustes, el usuario debe ser cuidadoso
que producir una prueba conservadora en la cual la oportunidad de rechazar una distribucin
candidato puede ser mayor que lo deseado.

La prueba KS es conducida desarrollando una distribucin de probabilidad emprica acumulada
basada en los datos obtenidos y comparndola con la funcin de distribucin de probabilidad
acumulada de la distribucin terica candidato. Si X
1
, X
2
, .,X
n
son datos observados ordenados
en una forma ascendente, entonces la funcin de distribucin de probabilidad emprica esta
definida como;

( )
i
n
Nmero de X x
F x
n
s
=

Por lo tanto F
n
(x) es una funcin paso tal que F
n
(x) = i / n para i = 1,2,.,n.

Esta prueba esta basada en la desviacin absoluta mayor entre las fdp emprica y terica para
todo valor dado de x. Esta desviacin es comparada con los valores crticos de KS tabulados para
determinar si la desviacin puede ser atribuida a los efectos aleatorios y por lo tanto sea una
distribucin candidato a ser aceptada tener un buen ajuste a los datos observados. Ms
especficamente, la prueba tiene los pasos siguientes:

Paso 1: Ordene los datos en forma ascendente
Paso 2: Usando la fdp terica F(x), calcule

(

=
s s
+
) (
1 i N i
x F
N
i
max
D

(
(


=
s s

N
i
x F max
i N i D
1
) (
1

Paso 3: Sea D= max( D
+
, D
-
)
Paso 4: Encuentre el valor crtico de la tabla KS para un nivel de significancia y un tamao de
muestra N.
Paso 5: Si D s al valor crtico, acepte la distribucin candidato como aquella que tiene un buen
ajuste a los datos observados; de otra forma rechace.


Ejemplo: Ajustando una Distribucin Uniforme Usando la Prueba de Ajuste de Bondad
Kolmogorov-Smirnov
En este ejemplo se usa la prueba KS para examinar bajo un nivel de significancia de o=0.05 si un
conjunto de datos representa nmeros aleatorios (por ejemplo esta la distribucin uniforme entre 0
y 1). Suponga que cinco datos son dados: 0.53, 0.35, 0.03, 0.94, y 0.22
Solucin. Para la distribucin Uniforme la fdp es F(x)= 1/(b-a) asxsb
Para este caso particular a=0 y b=1. Por lo tanto F(x)=x. Ahora se ordenan los valores en forma
ascendente y se realizan los clculos relativos.
La tabla siguiente resume los clculos realizados:
i F(x
i
) i/n i/n - F(x
i
) F(x
i
) (i-1)/n
1 0.03 0.20 0.17 0.03
2 0.22 0.40 0.18 0.02
3 0.35 0.60 0.25 -0.05
4 0.53 0.80 0.27 -0.07
5 0.94 1.00 0.06 -.14
D
+
= 0.27 D
-
=0.14

De acuerdo a los clculos, D = max( 0.27, 0.14 ) = 0.27. El valor crtico de KS de la tabla para un
tamao de 5 y un nivel de significancia de 0.05 es 0.565. Debido a que D es menor que este valor
crtico, la hiptesis de que los datos dados pertenecen a una distribucin Uniforme es aceptada.

Ejemplo: Ajustando una Distribucin Exponencial Usando la Prueba de Ajuste de Bondad
Kolmogorov-Smirnov
En este ejemplo se usa una prueba KS para observar bajo un nivel de significancia o=0.05 si un
dado conjunto de datos observados representan a una distribucin Exponencial. Suponga que los
siguientes 10 puntos representan los tiempos entre arribos de los clientes a un cajero bancario (el
tiempo esta en minutos): 3.10, 0.20, 12.10, 1.40, 0.05, 7.00, 10.90, 13.70, 5.30, 9.10.
Los datos son obtenidos dentro de un perodo de 63 minutos. De acuerdo a la teora, si la
distribucin de los tiempos entre arribos dentro de T unidades de tiempo es exponencial, los
tiempos de arribo son uniformemente distribuidos entre 0 y T. Para encontrar los tiempos de arribo
simplemente aadimos los tiempos entre arribos. Por lo cual t
1
, t
1
+t
2
, t
1
+t
2+
t
3, ..
t
1
+t
2
+.+t
10
son los
tiempos de arribo del primer al dcimo cliente. Dividiendo estos tiempos entre la longitud del
periodo de obtencin de los datos(63 en este caso), resulta un conjunto normalizado de datos los
cuales estn distribuidos entre o y 1. Entonces se procede a aplicar el procedimiento para probar el
ajuste a la distribucin uniforme.

La tabla siguiente resume los clculos realizados:
i

=
=
i
j
i i
t X
1

F(x
i
) i/n i/n - F(x
i
) F(x
i
) (i-1)/n
1 3.10 0.049 0.1 0.051 0.049
2 3.30 0.052 0.2 0.148 -0.048
3 15.40 0.344 0.3 0.056 0.044
4 16.80 0.267 0.4 0.133 -0.033
5 16.85 0.267 0.5 0.233 -0.133
6 23.85 0.379 0.6 0.221 -0.121
7 34.75 .552 0.7 0.148 -0.048
8 48.45 0.769 0.8 0.031 0.069
9 53.75 0.853 0.9 0.047 0.053
10 62.85 0.998 1.0 0.002 0.098
D
+
= 0.233 D
-
=0.098

De acuerdo a la tabla anterior, D=0.233. Eligiendo un nivel de significancia de 0.05 y un tamao de
muestra de 10, el valor crtico de la tabla KS es 0.409. Debido a que el valor calculado de la
prueba estadstica es menor que el valor en la tabla KS, no existe razn para no aceptar que los
datos dados estn distribuidos de acuerdo a una distribucin Uniforme con parmetros 0 y 1.
Equivalentemente, se concluye que ellos tiempos entre arribos estn Exponencialmente
distribuidos.


Consideraciones para usar las pruebas de ajuste de bondad.
La pregunta que naturalmente nace es cuando usar la prueba Chi-Cuadrada y cuando usar la
prueba KS. Generalmente, para cantidades grandes de nmeros (mayor que 30) y distribuciones
discretas, la prueba Chi-Cuadrada es ms apropiada. Para cantidades pequeas de nmeros y
distribuciones continuas, la prueba KS es recomendada. (Tambin la prueba KS se ha aplicado
con xito en distribuciones discretas).


5.3.2.1 Otra forma de realizar la prueba

1.- Se colocan los n datos histricos en una tabla de frecuencias con m n = intervalos. Para
cada intervalo se tendr la frecuencia observada i (FOi). Se calcula la media y la varianza de los
datos.
2.- Se divide la frecuencia observada de cada intervalo por el nmero total de datos. A este
resultado para obtener la probabilidad observada i (POi).
3.- Se calcula la probabilidad acumulada observada de cada intervalo (POAi) del paso 2.
4.- Se propone una distribucin de probabilidad de acuerdo con la forma de la tabla de frecuencias
obtenida en 1.
5.- Con la distribucin propuesta se calcula la probabilidad esperada para cada uno de los
intervalos (PEi) mediante la integracin de la distribucin propuesta.
6.- Se calcula la probabilidad acumulada esperada (PEAi) para dado intervalo de clase.
7.- Se calcula el valor absoluto de la diferencia entre POAi y PEAi para cada intervalo y se
selecciona la mxima diferencia, llamndola DM.
8.- El estimador DM se compara con un valor lmite correspondiente a la tabla de la distribucin
Kolmogorov-Smirnov con n datos y a un nivel de confiabilidad de 1- . Si el estimador DM es
menor o igual a el valor lmite de la tabla, entonces no se puede rechazar que la informacin
histrica sigue la distribucin propuesta en el paso 4.

Ejemplo: Ajustando una Distribucin Uniforme Usando la Prueba de Ajuste de Bondad
Kolmogorov-Smirnov
Distribucin Uniforme a=0, b=13
i i
LS
a b
x F

=
1
) (
i i
LS x F
13
1
) ( =

Intervalo FO FOA POA PEA |POAPEA|
0 1 6 6 0.146 0.0769 0.0694
1 3 6 12 0.293 0.2307 0.0619 DM=0.0694
3 5 5 17 0.414 0.3846 0.0300
5 7 7 24 0.585 0.5384 0.0469
7 9 6 30 0.738 0.6923 0.0394 d
5%,41
=0.2123
9 11 6 36 0.878 0.8641 0.0319
11 - 13 5 41 1.000 1.0000 0.0000

como DM = 0.0694 es menor que d
5%,41
= 0.2123, entonces, los datos si siguen una
distribucin Uniforme.

Ejemplo: Ajustando una Distribucin Exponencial Usando la Prueba de Ajuste de Bondad
Kolmogorov-Smirnov
=6
F(xi)=1-Exp(LSi / )

i
LS
i
e x F

=1 ) (
6
1 ) (
i
LS
i
e x F

=

Intervalo FO FOA POA PEA |POAPEA|
0 3 20 20 0.3921 0.3934 0.0013
3 6 12 32 0.6274 0.6321 0.0049 M=0.0483
6 9 7 39 0.7647 0.7768 0.0121
9 12 4 43 0.8431 0.8446 0.0215
12 15 2 45 0.8823 0.9179 0.0356 d
5%,51
=0.1904
15 18 1 46 0.9019 0.9502 0.0483
>18 5 51 1.0000 1.0000 0.0000

como DM = 0.0483 es menor que d
5%,51
= 0.1904, entonces, los datos si siguen una
distribucin Exponencial.

Ejemplo: Ajustando una Distribucin Normal Usando la Prueba de Ajuste de Bondad
Kolmogorov-Smirnov
=8,s o=2
o

=
i
i
x
Z
o

=
i
i
LS
Z
Intervalo FO FOA POA PEA |POAPEA|
0 1 0 0 0.0 0.00023 0.000025
2 3 1 1 00.018 0.0061 0.01197
4 5 8 9 0.164 0.06681 0.09719 DM= 0.09719
6 7 12 21 0.382 0.30854 0.0766
8 9 20 41 0.745 0.69146 0.05354 d
5%,55
= 0.1833
10 11 10 51 0.927 0.9332 0.00619
12 13 3 54 0.982 0.9938 0.01379
14 15 1 55 1.000 0.99977 0.00023
16 -17 0 55 1.000 1.0000 0.0000

como DM = 0.09719 es menor que d
5%,55
= 0.1833, entonces, los datos si siguen una distribucin
Normal.


5.3.3 Prueba Anderson-Darling: Una Prueba de Ajuste de Bondad para
Muestras de tamao n Pequeo.

5.3.3.1 Introduccin

La mayora de los mtodos estadsticos asumen una cierta distribucin en la derivacin de sus
resultados. Sin embargo, cuando se asume que nuestros datos siguen una distribucin especfica,
tomamos un riesgo serio. Si nuestra consideracin es errnea, los resultados obtenidos pueden ser
no validos. Por ejemplo, los niveles de confidencia de los intervalos de confianza (IC) o las
pruebas de hiptesis implementados [2, 7] pueden estar completamente equivocados.

Las consecuencias de especificar mal una distribucin puede resultar ser muy costoso. Una forma
de tratar con este problema es verificar las consideraciones de la distribucin cuidadosamente.
Existen 2 enfoques principales para verificar la distribucin a considerar [2, 3, y 6]. Uno implica
procedimientos empricos, los cuales son fciles de entender e implementar y son basados en
intuicin y en las propiedades grficas de la distribucin que se desea probar. Los procedimientos
empricos pueden ser usados para verificar y validar la distribucin a considerar. Varias de ellas
han sido discutidas a profundidad en otros artculos [8,9, y 10].

Hay tambin otros procedimientos estadsticos ms formales para probar cierta distribucin en
referencia a un conjunto de datos. Estas son las pruebas de Ajuste de Bondad (AB). Ellas estn
numricamente interrelacionadas (convolucionadas) y generalmente requiere un programa
especfico para realizar la gran cantidad de clculos. Pero sus resultados son cuantificables y ms
confiables que los de un procedimiento emprico. Aqu, estamos interesados en aquellos
procedimientos de AB especializados para muestras pequeas. Entre ellas, estn las pruebas
Anderson-Darling (AD) y la Kolmogorov_Smirnov (KS).

Se provee un revisin general de algunos puntos importantes asociados con la implementacin de
las prueba de ajuste de bondad AD, especialmente cuando se trata de las consideraciones de las
distribuciones Exponencial, Normal y Lognormal. Estas distribuciones son ampliamente usadas en
trabajos de calidad y confiabilidad. Primero revisaremos algunas consideraciones tericas para
ayudad a entender (y aplicar) estas pruebas de AB. Entonces, desarrollaremos varios ejemplos
numricos y grficos que ilustrarn como implementar e interpretar las pruebas AB para ajustar
varias distribuciones.


5.3.3.2 Algunas Bases Estadsticas

Establecer la distribucin de un conjunto de datos ( o variables aleatoria) es crucial para el correcto
establecimiento de algunos procedimientos estadsticos. Pro ejemplo, la prueba t de muestra
pequea y el IC, para la media poblacional, requiere que la distribucin de la de la poblacin sea
Normal. Por lo que, primero se requiere establecer ( va una prueba de AB) si la distribucin
Normal aplica antes de que implementemos correctamente estos procedimientos estadsticos.
Las pruebas de AB estn especialmente basadas en dos elementos de la distribucin: la funcin
de distribucin acumulada (FDA) o la funcin de densidad de probabilidad (FDP). La prueba Chi-
cuadrada esta basada en la FDP.

Ambas pruebas de AB, la AD y la KS usan la distribucin acumulada de probabilidad (FDA) y por lo
tanto pertenece a la clase de pruebas de distancia.
Se han seleccionado las pruebas AD y KS entre varias pruebas de distancia por dos razones.
Primero, ellas estn entre las mejores pruebas de distancia para muestras pequeas (Y tambin
pueden ser usadas para muestras grandes). Segundo, debido a que se encuentran disponibles
varios paquetes estadsticos para las pruebas Ad y KS, estos son ampliamente usados en la
prctica.

Para implementar las pruebas de distancia, seguimos una bien definida serie de pasos:
Primero, se asume una distribucin pre-especificada (ejemplo Normal). Entonces, se estiman los
parmetros de la distribucin (ejemplo la media y la varianza) de los datos o se obtienen de
experiencias previas. Tale proceso produce una distribucin hipottica, tambin llamada hiptesis
nula (o Ho), con varias partes que deben ser conjuntamente verdaderas. La negacin de la
distribucin asumida (o sus parmetros) es una hiptesis alternativa (tambin llamada H
1
).
Entonces se prueba la distribucin asumida (hipotetizada) usando el conjunto de datos.
Finalmente, Ho es rechazada cundo cualquiera de los datos que componen Ho no es avalada por
los datos.


5.3.3.2 Ejemplo: Ajustando una Distribucin Normal Usando la Prueba
de Ajuste de Bondad Anderson-Darling

LA prueba Anderson-Darling (AD) es ampliamente usada en la prctica. Por ejemplo, MIL-HDBKs 5
y 17 [4, 5, y 2], usan la prueba AD para probar las distribuciones Normal y Weibull. Mas adelante
se realizan dos ejemplos usando la prueba AD; Primero probando los datos para la distribucin
Normal y despus, para probar los datos para la distribucin Weibull. Si existe la necesidad de
probar los datos para la distribucin Lognormal, entonces se realiza la transformacin logartmica
de los datos originales y entonces se utiliza la prueba AD para el conjunto de datos transformado
para la distribucin Normal.
La prueba de ajuste de bondad AD para la distribucin Normal (Referencia [5] Seccin 8.3.4.1)
Tiene la siguiente forma funcional:

| | ( )
{
( )
( )
}
0 0 1
1
1 2
ln ln 1 ;.....
n
i n i
i
i
AD F Z F Z n
n
+
=

(
= +

(1)

Donde Fo es la distribucin asumida (Normal) con los parmetros asumidos o estimados de la
muestra (, ); Z( i ) es el i
vo
valor estandarizado de la muestra de tamao n, ln es el logaritmo
natural (base e) y el subndice i va de 1 a n.

La hiptesis Nula, que la verdadera distribucin es F0 con los parmetros asumidos, es entonces
rechazada (con un nivel de significancia 0.05, para una muestra de tamao n) si la prueba
estadstica AD es mayor que el valor crtico (VC). La regla de rechazo es:

Rechace si: AD > VC = 0.752 / (1 + 0.75/n + 2.25/ n
2
)

Se ilustra este procedimiento probando la Normalidad los datos del problema 6 de la seccin 8.3.7
de [5]. El conjunto de datos, (Tabla 1), contiene una pequea muestra de seis lotes, sacados de
forma aleatoria de la misma poblacin.

Tabla 1. Datos para la prueba de ajuste de bondad AD
338.7 308.5 317.7 313.1 322.7 294.2

Para probar la Normalidad de la muestra, primero se obtienen puntos de estimacin de los
parmetros de la distribucin Normal: media y desviacin estndar de la muestra (Tabla 2).

Tabla 2. Estadsticas descriptivas de los datos del prob. 6.

Variable N Media Mediana
Conjunto de Datos 6 315.82 315.4

Bajo la consideracin de la distribucin Normal, F
o
es normal ( = 315.8, =14.9).

Entonces se implementa la estadstica AD (1) usando los datos (Tabla 1) como tambin la
probabilidad Normal y los parmetros estimados (Tabla 2). Para el elemento ms pequeo
tenemos:

315.8, 14.8
294.2 315.8
(294.2)
14.8
P Normal
o = =
| |
=
|
\ .

0 0
( ) ( 1.456) 0.0727 F z F = =

La Tabla 3 muestra los resultados inmediatos de la estadstica AD que combinamos con la formula
(1).Cada componente es mostrado en la columna correspondiente de la tabla, identificada por su
nombre.

Tabla 3. Valores inmediatos para la prueba de ajuste de bondad AD para Normalidad
i X F(Z) ln F(Z) n+1-
i
F(n+1-i) 1-F(n1i) ln(1-F)
1 294.2 0.072711 -2.62126 6 0.938310 0.061690 -2.78563
2 308.5 0.311031 -1.16786 5 0.678425 0.321575 -1.13453
3 313.1 0.427334 -0.85019 4 0.550371 0.449629 -0.79933
4 317.7 0.550371 -0.59716 3 0.427334 0.572666 -0.55745
5 322.7 0.678425 -0.38798 2 0.311031 0.688969 -0.37256
6 338.7 0.938310 -0.06367 1 0.072711 0.927289 -0.07549

i
1 2
6
i

ln F(Z)+ln F(n+1-i)
( )
1 2
{ln ( ) ln 1 ( 1 }
6
i
F Z F n i

+ +
1 -1/6 -5.40689 0.90114833
2 -3/6 -2.30239 1.1151195
3 -5/6 -1.16952 1.3746
4 -7/6 -1.15461 1.347045
5 -9/6 -0.76054 1.14081
6 -11/6 -0.13916 0.25512666

( )
6
1
1 2
{ln ( ) ln 1 ( 1 } 6
6
i
i
AD F Z F n i
=

= + +

, AD = 6.16992505-6 = 0.16992505

La estadstica AD (1) produce un valor de 0.1699 < 0.633, el cual no es significativa:
0.752 0.752
0.1699 0.6333
0.75 2.25
1 0.125 0.0625
1
6 36
AD VC = < = = =
+ +
+ +


As, la prueba de ajuste de bondad AD no rechaza que esta muestra haya sido sacada de una
poblacin con distribucin Normal (315.8, 14.9). Y se puede asumir Normalidad para los datos.

Los procedimientos de la prueba de ajuste de bondad AD, aplicados a este ejemplo se resume en
la tabla 4.

Finalmente, si deseamos ajustar a una distribucin Lognormal, primero obtenemos el logaritmo de
los datos y entonces implementar el procedimiento de la prueba AD de los datos transformados los
datos originales son Lognormal, entonces este logaritmo esta Normalmente distribuido, y se puede
usar la misma estadstica AD (1) para probar el comportamiento Lognormal.

Tabla 4. Resumen paso a paso para las pruebas de normalidad AD
- Ordene la muestra original X ( Col. 1, Tabla 3) y estandarice
x
Z

o

=
- Establezca la Hiptesis Nula: Asuma la distribucin Normal (,)
- Obtenga los parmetros de la distribucin: =315.8; =14.9 (Tabla 2)
- Obtenga la probabilidad acumulada F(Z) ( col. 2, tabla 3)
- Obtenga el logaritmo de obtenido previamente ln[F(Z)] (Col. 3)
- Ordene en forma descendente (n-i+1) las probabilidades acumuladas F(Z) (Cols. 4 y 5).
- Encuentre los valores de 1-F(Z) para lo anterior (Col. 6).
- Encuentre el logaritmo de lo anterior: ln[1-F(Z)] ( Col. 7)
- Evale va (1): La prueba estadstica AD=0.1699 y VC=0.633
- Como AD < VC asuma que la distribucin es Normal (315.8, 14.9)
- Cuando sea posible, use un programa de computadora y use la prueba de valor p

Para problemas de pruebas de ajuste de bondad de tamao de muestra grande, frecuentemente
es mejor usar la prueba Chi-cuadrad [11]. No requiere conocer los parmetros de la distribucin
Algo de que ambas pruebas Ad y KS tericamente hacen y no afectan su potencial. Por otro lado,
la prueba Chi-cuadrada requiere que el numero de datos se suficientemente grande para la prueba
estadstica para converger a la referenciada distribucin Chi-cuadrada algo que las pruebas AD y
KS no requieren.


5.3.3.4 Ejemplo: Ajustando una distribucin Weibull usando una prueba
de Ajuste de Bondad Anderson-Darling

Ahora se desarrolla un ejemplo para probar si un conjunto de datos se apegan a una distribucin
Weibull. Se usaran los datos de la Tabla 5. Los datos consisten en seis medidas sacadas de una
go, los parmetros son
desconocidos y sern estimados del conjunto de datos.

Tabla 5. Conjunto de datos para probar la consideracin de una Weibull.
11.7216 10.4286 8.0204 7.5778 1.4298 4.1154

Se obtienen las estadsticas descriptivas (Tabla 6). Entonces, usando mtodos grficos en [11], se
obtienen las estimaciones de los puntos de los parmetros de la distribucin Weibull asumida:
Weibull (= 8.7;

Variable N Media Mediana Desviacin
Estndar
Mnimo Mximo Q1
Conjunto de
Datos
6 7.22 7.8 3.86 1.43 11.72 3.44

La versin Weibull de la prueba de ajuste de bondad AD es diferente de la utilizada con la
distribucin Normal, tratada con anterioridad. Esta versin para la Weibull es explicada a detalle en
[2, 5] y esta definida por:
| ( ) ( )
{
( )
} |
1
1
1 2
ln 1 exp
n
i n i
i
i
AD Z Z n
n
+
=


*
0.2
1 y AD AD
n
| |
= +
|
\ .
(2)

Donde
*
*
i
i
X
Z
|
u
(
=
(

y donde el asterisco en los parmetros de la Weibull denota las estimaciones
correspondientes. La probabilidad (Valor p) del Nivel de Significancia Observado (NSO) es ahora
usado para probar las consideraciones WEIBULL. Si NSO < 0.05 entonces la consideracin de
Weibull es rechazada y el error cometido es menor del 5%. La formula para el NSO esta dada por:

{ }
* *
1
1 exp[ 0.1 1.24 ln( ) 4.48( )]
NSO
AD AD
=
+ + +


Para implementar la prueba de ajuste de bondad AD, primero obtenemos las probabilidades
correspondientes AD bajo la distribucin asumida H
0
. Por ejemplo, el primer dato (1.4298 1.43)
1
8.7; 1.3 1
(1.43) 1 exp( ) 1 exp
X
P Z
|
o |
o
= =

| |
= =
`
|
\ .

)

1.3
1.43
1 exp 1 0.909 0.091
8.7

| |
= = =
`
|
\ .

)

Entonces, se usan estos valores para trabajar con las formulas AD y AD
*
en (2). Se dan a
continuacin en la Tabla (7) los resultados inmediatos para en conjunto de datos en la Tabla 5:

Tabla 7. Valores para la prueba de ajuste de bondad AD para la distribucin Weibull
Fila Conjunto
de Datos
Z(i) Probabilidad
Weibull
e
-Z(i)
Ln(1-e
-Z(i)
) Zn-i+1 I
vo
termino
1
1.430 0.09560 0.091176 0.685308 -2.39496 1.47336 0.64472
2
4.115 0.37789 0.314692 0.908824 -1.15616 1.26567 1.21092
3
7.578 0.83566 0.566413 0.433587 -0.56843 0.89967 1.22342
4
8.020 0.89967 0.593296 0.406704 -0.52206 0.83566 1.58401
5
10.429 1.26567 0.717949 0.282051 -0.33136 0.37789 1.06387
6
11.722 1.47336 0.770846 0.229154 -0.26027 0.09560 0.65242

La estadstica de la prueba de ajuste de bondad AD son: : AD = 0.37936 y AD* = 1.08(.37936)=
0.409788. Los valores correspondientes para el NSO, o la probabilidad de rechazar la distribucin
Weibull (8.7;1.3) errneamente con esos resultados, es NSO = 0.3466 (mucho mayor que el error
=0l05).
Por lo que se acepta la hiptesis nula de que la distribucin en prueba es Weibull (de la poblacin
de donde los datos son obtenidos) ( =8.7; =1.3). Por lo que, la prueba AD fue capaz de
reconocer que los datos fueron Weibull. El procedimiento de la prueba de AB para este caso se
resume en la Tabla 8.

Tabla 8. resumen paso a paso de la prueba de ajuste de bondad Anderson-Darling
- Ordene la muestra original X ( Col. 1, Tabla 3) y estandarice
*
*
i
i
X
Z
|
u
(
=
(

(Cols. 1 y 2
Tabla 7)
- Establezca la Hiptesis Nula: Asuma la distribucin Weibull
- Obtenga los parmetros de la distribucin:
- Obtenga la probabilidad acumulada exp(-Z) ( Cols. 3 y 4)
- Obtenga el logaritmo de obtenido previamente ln[1- exp(-Z)] (Col. 5)
- Ordene Z
i
en forma descendente (n-i+1) (Col. 6).
- Evale va (1): La prueba estadstica AD
*
=0.4104 y NSO =0.3466
- Como NSO =0.3466 > = 0.05, asuma Weibull (
- Cuando sea posible use Software para la prueba AD como Stat:fit del PROMODEL y el
Minitab

Finalmente, recordemos que la distribucin Exponencial, con media , es nicamente una caso
especial de la Weibull (,) donde el parmetro de forma -1. Por lo que, si se esta interesado en
la prueba de ajuste de bondad AD para considerar la Exponencialidad de los datos, ser suficiente
estimar la media () y entonces implementar el procedimiento anteriormente seguido para la
Weibull para este caso especial, usando la formula (2)
Sin embargo, no existe estadsticas AD (formulas ) para todas las distribuciones de probabilidad.
Por lo que, si existe la necesidad de ajustar otras distribuciones diferentes a las ya discutidas, es
mejor usar las pruebas de ajuste de bondad Anderson-Darling [12] y la Chi-cuadrada [11].


Problemas Propuestos
1. Verifica la hiptesis de uniformidad con =0.05 bajo el test de K-S la secuencia siguiente: 0.44,
0.81, 0.14, 0.05, 0.93?

2. Considrese la secuencia de nmeros siguiente y comprubese si verifica uniformidad segn la
prueba Chi-Cuadrada:
0.34 0.90 0.25 0.89 0.87 0.44 0.12 0.21 0.46 0.67
0.83 0.76 0.79 0.64 0.70 0.81 0.94 0.74 0.22 0.74
0.96 0.99 0.77 0.67 0.56 0.41 0.52 0.73 0.99 0.02
0.47 0.30 0.17 0.82 0.56 0.05 0.45 0.31 0.78 0.05
0.79 0.71 0.23 0.19 0.82 0.93 0.65 0.37 0.39 0.42
0.99 0.17 0.99 0.46 0.05 0.66 0.10 0.42 0.18 0.49

3. Dada la secuencia de nmeros aleatorios uniformes 0.1306, 0.0422, 0.6597, 0.7965, 0.7696
obtener a partir de ellos una secuencia de nmeros que se ajusten a una distribucin exponencial
con =1.


4. Se ha estado contabilizando el nmero de vehculos que han llegado a una interseccin a travs
de una determinada calle entre las 7:00 AM y las 7:05 AM, obtenindose los datos siguientes:

Llegadas Frecuencia
(das)
Llegadas

Frecuencia
(das)
Llegadas Frecuencia
(das)
Llegadas Frecuencia
(das)
0 1 6 2 12 6 18 1
1 0 7 1 13 1 19 0
2 1 8 5 14 0 20 0
3 1 9 2 15 0 21 0
4 3 10 5 16 2 22 0
5 1 11 4 17 2 23 1

Constryase la representacin en forma de histograma de esos datos y realice una prueba de
ajuste de bondad para determinar la distribucin de probabilidad a la que mejor se ajusta.

5. Se sabe que el tiempo de retraso desde que se cursa una orden hasta que se dispone de lo
pedido viene dado por una variable aleatoria con distribucin gamma. Se tiene la siguiente tabla de
tiempos de retraso (en das) asociados con 20 rdenes:

1 - 70.292 6 - 25.292 11 - 30.125 16 - 16.314
2 - 10.107 7 - 14.713 12 - 17.137 17 - 28.073
3 - 48.386 8 - 39.166 13 - 44.024 18 - 39.019
4 - 20.480 9 - 17.421 14 - 10.552 19 - 32.330
5 - 13.053 10- 13.905 15 - 37.298 20 - 36.547
Calcular los correspondientes parmetros de esta distribucin.

6. Se ha realizado un prueba sobre una muestra aleatoria de 50 chips de microprocesador a 1.5
veces la tensin nominal y se ha anotado su vida en das (o tiempo hasta que falla el chip),
obtenindose lo siguiente: 79.919, 3.081, 0.062, 1.961, 5.845, 3.027, 6.505, 0.021, 0.013, 0.123,
6.769, 59.899, 1.192, 340760, 5.009, 18.387, 0.141, 43.565, 24.420, 0.433, 144.695, 2.663,
17.967, 0.091, 9.003, 0.941, 0.878, 3.371, 2.157, 7.579, 0.624, 5.380, 3.148, 7.078, 23.960, 0.590,
1.928, 0.300, 0.002, 0.543, 7.004, 31.764, 1.005, 1.147, 0.219, 30217, 14.382, 1.008, 2.336, 4.562.
Se sospecha que siguen una distribucin Weibull (con =0). Estmense los parmetros
correspondientes usando la prueba Chi-Cuadrada

7. Se ha estado observando el nmero de vehculos que han pasado por una calle durante 5
minutos a una determinada hora durante 100 das y se han obtenido los resultados que se detallan
en la siguiente tabla de frecuencia:
N de coches Frecuencia N de coches Frecuencia N de coches Frecuencia
0 12 4 10 8 5
1 10 5 8 9 3
2 19 6 7 10 3
3 17 7 5 11 1
Una vez construido el histograma parece que la variable aleatoria X={nmero de llegadas} sigue
una distribucin Poisson. Se ha procedido a la determinacin del parmetro alfa a travs del
estimador correspondiente, y se obtiene el valor 3.64. Se pide comprobar si esta suposicin de
Poisson supera la prueba Chi-Cuadrada.

8. Comprobar si la suposicin Weibull del ejercicio 6 supera la prueba Anderson-Darling.


5.4 Referencias bibliograficas

A. M. Law and D. W. Kelton. Simulation Modeling and Analysis. Industrial Engineering
and Management Science. McGraw-Hill Inc., 2nd edition, 1991.
An Introduction to Probability Theory and Mathematical Statistics, Rohatgi, V.K., Wiley, NY, 1976.
A Practical Guide to Statistical Analysis of Material Property Data, Romeu, J.L. and C. Grethlein,
AMPTIAC, 2000.
J. Banks, J. S. Carson, and B. L. Nelson. Discrete-event system simulation.
Prentice-Hall, Inc., Upper Saddle River, New Jersey 07458, 2nd edition, 1996.
Banks, J., Carson, J.S., II, and Goldsman, D., "Discrete-Event Computer Simulation," Handbook of
Statistical Methods for Engineers and Physical Scientists, 2nd ed., (H.M. Wadsworth, Ed.),
McGraw-Hill, New York, 1998.
B. Concebs, Discrete Systems Simulation, Mc Graw-Hill, 1994
Christos Alexopoulos, Andrew F. Seila, Advanced Methods for Simulation Output Analysis,
Proceedings of the 1998 Winter Simulation Conference,D.J. Medeiros, E.F. Watson, J.S. Carson
and M.S. Manivannan, eds
Ch. Harrel,B. Ghosh, yR. Borden,Simulation using ProModel,Mc Graw-Hill, 2003 Second edition
Empirical Assessment of Normal and Lognormal Distribution Assumptions, Romeu, J.L., RAC
START,Volume 9, Number 6, http://rac.alionscience.com/pdf/NLDIST.pdf.
Empirical Assessment of Weibull Distribution, Romeu, J.L., RAC START, Volume 10, Number 3,
http://rac.alionscience.com/pdf/WEIBULL.pdf.
Kolmogorov-Smirnov GoF Test, Romeu, J.L., RAC START, Volume 10, Number 6.
Lawrence Leemis, Simulation Input Modeling,Proceedings of the 1999 Winter Simulation
ConferenceP. A. Farrington, H. B. Nembhard, D. T. Sturrock, and G. W. Evans, eds.
Methods for Statistical Analysis of Reliability and Life Data, Mann, N., R. Schafer, and N.
Singpurwalla, John Wiley, NY, 1974.
MIL-HDBK-5G, Metallic Materials and Elements.
MIL-HDBK-17 (1E), Composite Materials Handbook.
Practical Statistical Tools for Reliability Engineers,Coppola, A., RAC, 1999.
S. Ross, Simulacin, Pearson, 1999 segunda edicin.
Statistical Confidence, Romeu, J.L., RAC START, Volume 9, Number 4,
http://rac.alionscience.com/pdf/STAT_CO.pdf.
Statistical Assumptions of an Exponential Distribution, Romeu, J.L., RAC START, Volume 8,
Number 2,http://rac.alionscience.com/pdf/E_ASSUME.pdf.
The Chi-Square: a Large-Sample Goodness of Fit Test, Romeu, J.L., RAC START, Volume 10,
Number 4,http://rac.alionscience.com/pdf/Chi_Square.pdf.

RAC significa (Reliability Analysis Center) por sus siglas en ingles.

Anda mungkin juga menyukai