Anda di halaman 1dari 30

Sahara 3.

2
Simulacin de Monte
Carlo: Apndices
Interfaces S.A.

Sahara: Simulacin de Montecarlo ndice

ndice
ndice....................................................................................................................................................... 0
Apndice A Distribuciones de Probabilidad .................................................................................... 2
Apndice B Tests de Bondad de Ajuste ......................................................................................... 21
Apndice C Comparacin de poblaciones .................................................................................... 23
Apndice D Mtodo de generacin de variables aleatorias independientes ............................. 25
Apndice E Correlacin entre variables en una simulacin de Montecarlo .............................. 27
Apndice F Estimacin de parmetros de funciones continuas ................................................. 28

Interfaces

Sahara: Simulacin de Montecarlo Apndice A

Apndice A Distribuciones de Probabilidad


Sahara cuenta 17 distribuciones de probabilidad. Se describen las funciones de densidad de probabilidades
(fdp) y funciones de distribucin acumulada (fdc).

Distribuciones continuas

Beta
Exponencial
Gamma
Gumbel del mnimo (Extremo mnimo)
Gumbel del mximo (Extremo mximo)
LogNormal
Normal
Pareto
Rayleigh
Triangular
Uniforme
Weibull

Distribuciones discretas

Binomial
Binomial Negativa
Geomtrica
Hper Geomtrica
Poisson

Interfaces

Sahara: Simulacin de Montecarlo Apndice A

Distribuciones continuas
Beta (
Se utiliza en general, para describir variables que por su naturaleza, tienen un dominio acotado (generalmente
entre 0 y 1), como ndices o porcentajes. La distribucin Beta tiene dos parmetros de forma, por lo tanto
puede adoptar formas muy variadas que le permiten adaptarse a situaciones muy diversas.
Entre las aplicaciones clsicas, se ha utilizado para representar variables fsicas cuyos valores de encuentran
restringidos a un intervalo de longitud finita y para encontrar ciertas cantidades conocidas, como lmites de
tolerancia, sin necesidad de la hiptesis de una distribucin Normal. Adems, se la ha empleado para modelar
la distribucin de artculos defectuosos sobre un intervalo de tiempo especfico, evaluacin de programas y
tcnicas de revisin, distribucin de la proporcin de los valores que deben caer entre dos observaciones
extremas. El ltimo tiene relacin con los lmites estadsticos de tolerancia. Estos lmites son muy importantes,
especialmente en control estadstico de calidad donde el control de variabilidad de un producto es esencial.
Este control, en general, se lleva a cabo mediante la medicin de algunas propiedades del producto o
determinando los ajustes que deben hacerse al proceso de produccin para mejorar la calidad del producto.
Los lmites estadsticos de tolerancia no son iguales a las tolerancias fsicas o especificaciones lmite. stos
son conjuntos de criterios diseados para un proceso de produccin en particular y que se espera que todas
las unidades cumplan.
Densidad (fdp)
(
)
( ) ( )

( )

Distribucin (fdc)
(
)

( ) ( )

( )

Sahara utiliza la aproximacin de Wise (1960) para calcular las probabilidades acumuladas Beta.
Parmetros
> 0, > 0
y son parmetros de forma de la distribucin. Valores distintos de y darn distintas formas para la
funcin de densidad Beta.
Si y son menores que uno, la distribucin beta tiene un perfil en forma de U.
Si < 1 y 1, la distribucin tiene un perfil de J transpuesta.
Si <1 y 1, el perfil es una J.
Cuando los dos valores son mayores que uno, la distribucin presenta un pico en x = ( - 1)/( + - 2).
Finalmente, la distribucin beta es simtrica cuando = .
Rango
0<x<1
3

1.2
(1.5,5)

(5,5)

(1.5,3)

(5,1.5)

(1.5,5)

(5,5)

(1.5,3)

(5,1.5)

0.8
0.6

0.4
0.2

0
0

0.2

0.4

0.6

0.8

(a) Densidad de probabilidades Beta

Interfaces

0.2

0.4

0.6

0.8

(b) Distribucin de probabilidades Beta

Sahara: Simulacin de Montecarlo Apndice A

Exponencial (
El parmetro , describe la tasa de fallas en un proceso continuo de Poisson (nmero de fallas por unidad de
continuo) y es igual al recproco de la distancia media entre fallas.
Entre las aplicaciones ms importantes se encuentra el modelado de la vida til de componentes (vinculadas
con las fallas de los mismos por causas aleatorias). Una de las razones de esta aplicacin se vincula con la
propiedad de falta de memoria de la distribucin exponencial (ej.: falla de un fusible de luz o chip de memoria
RAM, que no disipa energa).
Tambin puede describir el tiempo entre eventos sucesivos (ej.: el tiempo que transcurre antes de que una
persona sea atendida en una cafetera, nmero de llamadas telefnicas que recibe un conmutador, clientes que
llegan a una estacin de servicio).
La Exponencial es un caso especial de la Gamma( = 1) .
La suma de k variables aleatorias independientes de distribucin Exponencial con parmetro es una variable
aleatoria de distribucin Gamma.
1

Densidad (fdp)
( )
Distribucin (fdc)
( )
Parmetros
>0
Rango
x0
1.2
1.4
(0.5)

1.2

(1)

(1.5)

0.8

0.8

0.6

0.6

0.4
0.4

(0.5)

0.2

0.2

(1)

(1.5)

0
0

(a) Densidad de probabilidades Exponencial.

(b) Distribucin de probabilidades Exponencial.

Proceso de Poisson: sucesin de fallas o acontecimientos puntuales que ocupan, individualmente, una porcin despreciable en un medio
continuo, de modo que la probabilidad de que ocurra un nmero dado r de fallas en una extensin t de continuo es independiente de la
posicin de t dentro del continuo y de la ocurrencia de fallas en otros tramos del continuo. (Mermoz y Garcia, 2006).

Interfaces

Sahara: Simulacin de Montecarlo Apndice A

Gamma ()
La distribucin Gamma da lugar a una variada familia de curvas de densidad asimtricas. Es el equivalente
continuo de la Binomial Negativa.
Tiene dos parmetros positivos parmetro de forma) y parmetro de escala). Cuando = 1, se obtiene la
distribucin Gamma estandarizada.
Si el parmetro de forma es un entero positivo, entonces la funcin de densidad Gamma adopta la forma de
la funcin de densidad de la variable discreta de Poisson (x > 0). Este caso particular de la distribucin Gamma
( = entero positivo, ), es conocido como distribucin de Erlang ().
Si = 1, la distribucin Gamma se convierte en Exponencial.
La distribucin Gamma rige el tiempo entre un bloque de sucesos de Poisson consecutivos y el siguiente
bloque de sucesos consecutivos (ej.: cantidad de tiempo que pasa entre asaltos bancarios en una ciudad).
Densidad (fdp)
( )

( )

Distribucin (fdc)
( )

( )

Sahara utiliza la aproximacin de Wilson Hilferty (1931) para calcular las probabilidades acumuladas de la
distribucin Gamma. Sahara no calcula probabilidades acumuladas Gamma ( 0.5, ).
Parmetros

Para la fdp estandarizada ( = 1):


Cuando 1, disminuye en forma estricta cuando x aumenta desde cero.
Cuando > 1, aumenta desde cero hasta un mximo y luego disminuye.
Rango
x > 0
1.2
(1,2)

(2,2)

(2,1)

1
0.4

0.8
0.6
0.2

(1,2)

0.4

(2,2)

(2,1)

0.2
0

0
0

10

15

(a) Densidad de probabilidades Gamma

Interfaces

20

10

15

20

(b) Distribucin de probabilidades Gamma.

Sahara: Simulacin de Montecarlo Apndice A

Distribuciones de extremos: mximo y mnimo


Describen las denominadas variables de extremos, es decir, el mnimo o mximo de una muestra. Las
distribuciones de Gumbel son un tipo de distribuciones de extremos que se caracterizan por ser no acotadas
hacia el extremo considerado y con decrecimiento hacia ese extremo, tan o ms rpido que la exponencial.
La funcin de densidad Gumbel del Mnimo tiene asimetra negativa y Gumbel del Mximo tiene asimetra
positiva.
Entre las aplicaciones clsicas han sido utilizadas en el anlisis de frecuencias hidrolgicas o para representar
el comportamiento de crecientes y sequas (mximos y mnimos). Se utilizan tambin en Teora de
Confiabilidad cuando se aplican a fenmenos de vida (ej.: sistemas que dejan de funcionar cuando falla su
elemento ms importante, el que tiene la mnima duracin).

Gumbel del Mximo ()


Densidad (fdp)
( )
Distribucin (fdc)
( )
1.2

0.4
(0,1)

(2,0)

0.3

(2,1)

0.8
0.6

0.2

(0,1)
0.4

(2,0)

0.1

(2,1)

0.2

-5

-3

0
-1

(a) Densidad de probabilidades

Interfaces

-5

-3

0
-1

(b) Distribucin de probabilidades

Sahara: Simulacin de Montecarlo Apndice A

Gumbel del Mnimo ()


Densidad (fdp)
( )
Distribucin (fdc)
( )

Parmetros
>

- < < igual al modo.


Rango
- < x <
1.2

0.4

(0,1)

(0,1)
(2,0)

(2,0)

0.3

(2,1)

(2,1)

0.8
0.6

0.2

0.4
0.1

0.2
0

0
-10

-8

-6

-4

-2

(a) Densidad de probabilidades

Interfaces

-10

-8

-6

-4

-2

(b) Distribucin de probabilidades

Sahara: Simulacin de Montecarlo Apndice A

LogNormal (, )
Una variable aleatoria tiene distribucin LogNormal si su logaritmo, en cualquier base, tiene distribucin
Normal. Por lo tanto, si x es una variable con distribucin LogNormal, entonces, y = Ln(x) tiene distribucin
Normal. Tiene dos parmetros: * y *. * y * no son la media y la desviacin estndar de x, sino del Ln(x), es
decir, representan al promedio y la desviacin estndar del logaritmo de los datos, respectivamente. El dominio
de la distribucin son los x > 0.
La transformacin logartmica tiende a reducir la asimetra positiva. Al calcular el logaritmo se reducen en
mayor proporcin los datos mayores que los menores.
Entre las aplicaciones clsicas se encuentran: mediciones de errores, distribucin de cantidades fsicas
presentes en la naturaleza (ej.: tamao de campos de petrleo), tamao de partculas en el proceso de
molienda, concentraciones de impurezas en agua en una zona determinada. Tambin rige una gran variedad
de fenmenos de naturaleza econmica.
Densidad (fdp)
( ( )

( )

Distribucin (fdc)
( ( )

( )
Parmetros
Relacin

ndar de la muestra:
(

(
(

0, > 0
Rango
x>0
1

1.2
1

0.8

(1,0.5)

(0,1)

(1,1)

0.8
0.6

0.6
0.4

0.4
0.2

(1,0.5)

0.2
0
0

-0.2

(a) Densidad de probabilidades LogNormal

Interfaces

10

(0,1)

(1,1)

0
0

10

-0.2

(b) Distribucin de probabilidades LogNormal.

Sahara: Simulacin de Montecarlo Apndice A

Normal (, )
Esta distribucin es simtrica alrededor de su parmetro y tiene forma de campana, por lo tanto, el centro de
la campana (punto de simetra) es la media y la mediana de la distribucin.
En algunos casos, si las variables individuales por si mismas no estn distribuidas Normalmente, las sumas y
promedios de las mismas darn, bajo ciertas condiciones, aproximadamente una distribucin Normal (Teorema
Central de Lmite).
Algunos ejemplos de poblaciones que siguen distribucin Normal son: alturas, pesos, mediciones de errores en
experimentos cientficos, medidas antropomtricas en fsiles, tiempo de reaccin en experimentos
psicolgicos, mediciones de inteligencia y aptitud, resultados en varios tests, mediciones e indicadores
econmicos.
Densidad (fdp)
(

( )

Distribucin (fdc)
( )

Parmetros
- < <
>0
El valor de es la distancia desde hasta los puntos de inflexin de la curva de densidad Normal. Valores
grandes de producen curvas desparramadas alrededor de la media (), mientras que valores de pequeos
producen curvas de densidad Normal con un pico pronunciado alrededor de la media, y casi toda el rea bajo
la curva se encuentra cercana a la media de la distribucin. Por lo tanto, un alto valor de implica que un valor
de la variable x lejos de la media puede ser observado, mientras que el mismo valor es improbable cuando es
pequea.
Rango
- < x <
1.2

1
(0,0.5)

(0,0.5)

(0,1)

(0,1)

0.8

(1,1)

(1,1)
0.8
0.6

0.6
0.4

0.4
0.2

0.2

0
-5

-3

-1

0
1

(a) Densidad de probabilidades Normal

Interfaces

-5

-3

-1

(b) Distribucin de probabilidades Normal.

Sahara: Simulacin de Montecarlo Apndice A

Pareto
La funcin de densidad tiene forma de J y es parecido al modelo Exponencial. es su parmetro de escala, y a
la vez el lmite inferior de la variable, y tambin el modo.
Las aplicaciones ms importantes se han encontrado en problemas de estadstica econmica (ej.: distribucin
de los salarios de algunas empresas, donde hay un mnimo, que es tambin el ms frecuente; tamao de
reclamaciones de seguros).
Densidad (fdp)
( )
Distribucin (fdc)
( )

( )

Parmetros
> 0, > 0
Rango
x
1.2

(2,1)
(2,1)

1.6

(1,2)

(1,2)

(5,5)

(5,5)

0.8
1.2

0.6
0.8

0.4
0.4

0.2
0

0
0

10

15

(a) Densidad de probabilidades Pareto

Interfaces

20

10

15

20

(b) Distribucin de probabilidades Pareto

10

Sahara: Simulacin de Montecarlo Apndice A

Rayleigh ()
Esta distribucin es un caso particular de la distribucin de Weibull, pero fue introducida 50 aos antes de que
Weibull introdujera la forma ms general.
Inicialmente se la utiliz para modelar fenmenos fsicos relacionados con la propagacin de la luz y el
comportamiento de partculas subatmicas. Otras aplicaciones son: tiempo que se emplea en llevar a cabo una
tarea, tiempo que tarda en estropearse una pieza de una mquina.
Densidad (fdp)
( )
Distribucin (fdc)
( )
Parmetros
>0
Rango
x>0
1

1.2

(1)

0.8

(3)

(5)

0.8
0.6

0.6
0.4

0.4
(1)

0.2

(3)

(5)

0.2

0
0

10

15

(a) Densidad de probabilidades Rayleigh

Interfaces

20

10

15

20

(b) Distribucin de probabilidades Rayleigh

11

Sahara: Simulacin de Montecarlo Apndice A

Triangular (mnimo, ms probable, mximo)


Esta distribucin suele utilizarse para realizar el modelado de una variable cuando no existen datos. En
general, se recurre a la opinin de expertos para obtener los tres parmetros de la distribucin: mnimo, ms
probable y mximo.
Dadas las caractersticas de esta distribucin, Sahara no trata de realizar el ajuste de datos histricos a esta
distribucin en la ventana Histograma cuando se utilizan los test de Bondad de Ajuste.
Densidad (fdp)
a = mnimo; b = valor ms probable; c = mximo

f(x) =

2(x a) / (b a) (c - a)

si a x b

2(c x) / (c a) (c - b)

si b < x c

Distribucin (fdc)
0

si x < a

(x a) / (b a) (c - a)

si a x b

F(x) =

1- [(c x) / (c a) (c - b)]
1

si b < x c
si c < x

Parmetros
Mnimo Ms probable Mximo, Mnimo < Mximo
Rango
Mnimo x Mximo
1.2

0.5

(2,3,7)
(2,3,7)

0.4

(1,5,8)

(1,5,8)

1
0.8

0.3

0.6
0.2

0.4
0.1

0.2

0
0

(a) Densidad de probabilidades Triangular

Interfaces

10

10

(b) Distribucin de probabilidades Triangular

12

Sahara: Simulacin de Montecarlo Apndice A

Uniforme (mnimo, mximo)


La densidad es constante sobre el intervalo entre a y b, con discontinuidades en los extremos, donde los
mismos son finitos y reales. Es una distribucin simtrica, y la mediana coincide con el punto de simetra.
Se utiliza para cantidades que varan uniformemente entre dos valores (a y b), o cuando solamente se conoce
el rango. La distribucin uniforme raramente es una descripcin apropiada del comportamiento probable de
fenmenos fsicos, biolgicos o sociales; su importancia estriba en su utilidad en la teora estadstica.
Su principal motivo de inters se da en los experimentos de simulacin, siendo el caso particular ms
importante la distribucin uniforme en el intervalo [0 1]. Cualquier distribucin de probabilidad continua puede
transformarse fcilmente primero en la distribucin uniforme simple, luego en una distribucin continua dada.
Densidad (fdp)
( )
Distribucin (fdc)
( )
Parmetros
a = mnimo; b = mximo
a<b
Rango
axb
2.5

1.2
(1,2)

(1.5,3)

2
(1,2)

(1.5,3)

0.8

1.5
0.6

1
0.4

0.5

0.2

0.5

1.5

2.5

(a) Densidad de probabilidades

Interfaces

3.5

0.5

1.5

2.5

3.5

(b) Distribucin de probabilidades

13

Sahara: Simulacin de Montecarlo Apndice A

Weibull (
Es una distribucin acotada hacia la izquierda. En algunas situaciones existen justificaciones tericas para
utilizar la distribucin de Weibull, pero en muchas aplicaciones simplemente provee un buen ajuste para los
valores observados de una dada poblacin para valores particulares de sus parmetros y
El modelo fue propuesto empricamente por Weibull luego de analizar datos de fatiga de materiales.
Entre las aplicaciones clsicas, la distribucin puede representar la vida de una pieza o de un ser viviente que
falla por distintas causas, aleatorias, desgaste o fatiga.
y pueden ser variados para obtener un variado nmero de formas diferentes de la distribucin . es un
parmetro de escala. Si se obtiene como caso particular la Exponencial (si se describen fallas, este es el
caso en el que son exclusivamente aleatorias). Si la distribucin es simtrica y para la simetra
es negativa y, cuanto ms grande es este parmetro en valor absoluto, ms negativa es la asimetra (permite
representar situaciones donde el desgaste toma mucha importancia). Para la distribucin tiene
asimetra positiva. Si 1 < se cubren las situaciones en que la falla puede provenir tanto de desgaste
como de causas aleatorias.
Densidad (fdp)
( )

( )

( )

Distribucin (fdc)
( )

( )
Parmetros
> 0 parmetro de forma
> 0 parmetro de escala
Rango
x>0
1.2

(1,1)

0.8

(2,1)

(1,2)

0.8
0.6

0.6
0.4

0.4
0.2

(1,1)

0.2

(2,1)

(1,2)

0
0

(a) Densidad de probabilidades

Interfaces

(b) Distribucin de probabilidades

14

Sahara: Simulacin de Montecarlo Apndice A

Distribuciones Discretas
Binomial (n, p)
Esta distribucin corresponde a los ensayos con reposicin, es decir, ensayos o pruebas repetidas e
independientes con slo dos resultados posibles: xito (con probabilidad p) y fracaso (con probabilidad 1- p).
Sus parmetros son n (e N) y 0 < p < 1.
Puede tomar n +1 valores, entre los cuales uno o dos valores son los ms probables.
Algunos ejemplos de aplicaciones son: nmero de tems defectuosos en una poblacin de n individuos, donde
cada tem tiene una probabilidad p de ser defectuosa; nmero de ventas realizada sobre un dado nmero de
contactos.
Densidad (fdp)
( )

( )

Distribucin (fdc)
( )

( )

Parmetros
n > 0, entero
0<p<1
Rango
x {0,1,2,3,.,n}
0.5

1.2
(5,0.2)

(5,0.5)

(10,0.5)

0.4

(5,0.2)
(5,0.5)

0.3

0.8

(10,0.5)
0.6

0.2
0.4
0.1

0.2

0
0

(a) Densidad de probabilidades Binomial

Interfaces

10

10

(b) Distribucin de probabilidades Binomial

15

Sahara: Simulacin de Montecarlo Apndice A

Binomial negativa (s, p)


2

Esta distribucin se refiere al orden de aparicin de los xitos en los ensayos de Bernoulli y corresponde a la
probabilidad de que el s-simo xito tenga lugar precisamente en el x-simo intento o ensayo.
Los parmetros de la distribucin son s y p, donde s pertenece a los nmeros naturales y 0 < p 1. El dominio
son los nmeros naturales.
Algunos ejemplos de aplicaciones son: nmero de pozos que se deben perforar para encontrar petrleo s
veces, cuando la probabilidad de xito de cada pozo es p; o nmero de artculos que se deben escoger para
encontrar s artculos defectuosos.
Densidad (fdp)
( )

Distribucin (fdc)
( )

Parmetros
s > 0, entero
0<p1
Rango
x {0,1,2,3,.,n}
0.3

1.2
(2,0.5)

(10,0.5)

1
(2,0.5)

0.2

(10,0.5)

0.8
0.6

0.1

0.4
0.2

0
0

10

15

20

25

30

0.3

10

15

20

25

30

1.2
(2,0.5)

(2,0.3)

1
(2,0.5)

0.2

(2,0.3)

0.8
0.6

0.1

0.4
0.2

0
0

10

15

20

Densidades de probabilidades
Binomial Negativa

25

30

10

15

20

25

30

Distribucin de probabilidades
Binomial Negativa

Ensayo de Bernoulli: modela fenmenos que slo pueden tomar dos valores, que denotan xito o fracaso (1
0), con probabilidades p y 1-p.
Interfaces

16

Sahara: Simulacin de Montecarlo Apndice A

Geomtrica (p)
Debe su nombre a que su forma coincide con la del x-simo trmino de la progresin geomtrica. Es un caso
particular de la distribucin Binomial Negativa para el caso cuando s = 1. Por lo tanto, la distribucin
Geomtrica tiene un solo parmetro: p (0 < p 1). El dominio son los nmeros naturales.
Algunos ejemplos de aplicacin son: probabilidad de fallas antes del primer xito en una serie de tiros
independientes (ej.: nmero de pozos perforados hasta que se descubre petrleo, o tems muestreados hasta
que se encuentra uno defectuoso).
Densidad (fdp)
( )

Distribucin (fdc)
( )
Parmetros
0<p1
Rango
x {0,1,2,3,.,n}
1

1.2
(0.2)

0.9
(0.2)

0.8

(0.5)

(0.9)

(0.5)

(0.9)

10

0.7

0.8

0.6
0.5

0.6

0.4

0.4

0.3
0.2

0.2

0.1
0

0
0

10

12

14

(a) Densidad de probabilidades Geomtrica

Interfaces

12

14

(b) Distribucin de probabilidades Geomtrica

17

Sahara: Simulacin de Montecarlo Apndice A

Hipergeomtrica (n, D, M)
Los parmetros de la distribucin son n, D, M; los tres pertenecen al dominio de los nmeros naturales.
Esta distribucin corresponde a los ensayos sin reemplazo, donde M representa el tamao de una poblacin
que consta de D xitos y M-D fracasos. De esa poblacin se extrae una muestra sin reemplazo de tamao n
M. La variable aleatoria x denota el nmero de xitos que hay en esa muestra. El dominio de x son los nmeros
naturales.
La distribucin Hipergeomtrica tiende a la distribucin Binomial cuando M y D tienden a infinito y N >> n.
Algunos ejemplos de aplicaciones son: nmero de tems defectuosos en una muestra obtenida de una
poblacin determinada con proporcin conocida de tems defectuosos.
Densidad (fdp)
( )

)( )
( )

Distribucin (fdc)
( )

)( )
( )

Parmetros
n, D, M > 0, n, D y M enteros; n, D M
Rango
x {0,1,2,3,.,n}
1.2

0.5
(4,8,20)

(4,8,20)

(8,30,50)

(8,30,50)

0.4

0.8

0.3
0.6

0.2
0.4

0.1

0.2

(a) Densidad de probabilidades


Hipergeomtrica

Interfaces

(b) Distribucin de probabilidades


Hipergeomtrica

18

Sahara: Simulacin de Montecarlo Apndice A

Poisson ()
Expresa la probabilidad de un nmero de eventos ocurriendo en un tiempo fijo. Tiene un solo parmetro:
que representa la tasa de eventos en un intervalo.
Uno de los usos ms importantes de la distribucin de Poisson es el conocido como flujo de sucesos de
Poisson, el cual tiene una probabilidad insignificante (virtualmente cero) en un intervalo pequeo de tiempo
(puede ser tambin de rea o de volumen); sin embargo, en intervalos considerables se puede registrar un
promedio estadstico del nmero aproximado de ese tipo de ocurrencias. Por ejemplo, en la ciudad de Mxico
suelen ocurrir sismos de vez en cuando; sin embargo, la probabilidad de que ocurra un sismo en un intervalo
breve dado (por ejemplo, una hora o incluso un da) es despreciable. Pero podra decirse que ocurren, por
ejemplo, tres sismos cada lustro, en promedio.
Ejemplos de sucesos de Poisson:
Nmero de llamadas telefnicas que recibe una persona por unidad de tiempo (cada hora o da).
Nmero de clientes que visitan una tienda o restaurante cada cierto tiempo.
Nmero de accidentes de trnsito que ocurren en cierto cruce cada mes.
Nmero de goles, tiros de esquina, saques laterales, jugadores amonestados, expulsados, etc. que se
anotan en cada partido de ftbol durante el tiempo reglamentario.
Densidad (fdp)
( )
Distribucin (fdc)
( )

Parmetros
> 0
Rango
x {0,1,2,3,.,n}

0.4

1.2
(1)

(2)

(6)

(1)

(2)

(6)

10

0.3

0.8
0.2

0.6
0.4

0.1

0.2
0

0
0

10

12

(a) Densidad de probabilidades Poisson

Interfaces

14

12

14

(b) Distribucin de probabilidades Poisson

19

Sahara: Simulacin de Montecarlo Apndice A


Bibliografa
Devore J.L Probabilidad y Estadstica para Ingeniera y Ciencias 6ta edicin. Cengage Learning
Editores, 2005.
Freeman H. Introduccin a la inferencia estadstica (Editorial Trillas 1970).
Mermoz O. y Garca R. - Distribuciones Univariantes de Probabilidad: modelos y su identificacin 1
edicin. Buenos Aires: Nueva Librera 2006.
Wise, M.E., 1960. On normalizing the incomplete beta function for fitting to dose response curves.
Biometrika 47,173.
Wilson E. B. y Hilferty M.M., 1931. The approximation to the exact values calculated by C. M. Thompson.
Proc. Nat. Acad. Sci. 17,684 (1941 Biometrika 32,187).
Wisniewski P. M., Velasco Sotomayor G. - Problemario de probabilidad - Cengage Learning Editores, 2001.

Interfaces

20

Sahara: Simulacin de Montecarlo - Apndice B

Apndice B Tests de Bondad de Ajuste


Sahara posee dos procedimientos para chequear suposiciones sobre si un conjunto de datos pertenece a una
determinada distribucin de probabilidades conocida. Esto se realiza mediante los denominados Tests de
Bondad de Ajuste. Los mismos proponen una Hiptesis nula (H0) que, con cierto nivel de significacin, se
acepta o se rechaza.
Las hiptesis a contrastar son:
H0: Los datos siguen una distribucin terica determinada (M).
H1: Los datos no siguen una distribucin terica determinada (M).
Si se rechaza la hiptesis nula, entonces se prueba que los datos no se distribuyen segn la distribucin
propuesta. Si, por el contrario, se acepta la hiptesis nula, se establece que el conjunto de datos es consistente
con la distribucin propuesta. Se mide el grado de concordancia entre la distribucin del conjunto de datos y
una distribucin terica determinada.
Existen dos formas generales de contar con datos de una determinada variable: datos individuales o continuos,
o agrupados.
Para el caso de datos individuales o continuos, Sahara cuenta con dos test de bondad de ajuste: Kolmogorov
Smirnov para una muestra y Anderson - Darling. Ambos comparan la distribucin acumulada de las
frecuencias tericas con las observadas. El estadstico de Kolmogorov Smirnov se concentra en el medio de
la distribucin, mientras que el estadstico de Anderson Darling destaca las diferencias en las colas de la
distribucin testeada.
Los pasos que realiza Sahara para realizar el clculo de los estadsticos de Bondad de Ajuste son los
siguientes: una vez elegida una distribucin terica, contra la cual se quieren comparar los datos, se estiman
los parmetros de la distribucin a partir de la muestra (Apndice F). Luego Sahara calcula los dos
estadsticos disponibles. Sahara ordena los resultados en forma ascendente segn los resultados de
Kolmogorov Smirnov.
Hiptesis a contrastar
H0: Los datos siguen una distribucin M
H1: Los datos no siguen una distribucin M.
Se cuenta con una muestra de n elementos: x1, x2,..,xn; cuya distribucin acumulada muestral es S n(x). La
distribucin acumulada contra la cual se quiere testear la hiptesis nula es F(x).
Estadstico de Kolmogorov - Smirnov para una muestra
Dn = mximo | Sn(xi) F(xi)|

i: 1, 2, .., n

xi son los datos ordenados


Dn es la mayor diferencia absoluta observada entre la distribucin acumulada observada y la distribucin
acumulada terica.
Estadstico de Anderson Darling
2

A = -n S, donde
S = (2i -1) /n * (ln ( F(xi) + ln (1 F(xn+1-i))) ,
xi son los datos ordenados

Bibliografa y lectura recomendada


Anderson, T.W. Darling, D.A. Asymptotic theory of certain goodness of fit criteria based on stochastic
processes. Ann. Math. Statist, 1952, 23, 193-212.
Anderson, T.W. Darling, D.A. A test of Goodness of Fit. Journal of the American Statistical Association,
1954, 49, 268, 765 769.
Birnbaum, Z.W. Tingey, F. H. One sided confidence contours for probability distribution functions. Ann.
Math. Statist, 1951, 22, 592 594.
Miller, L. H. Table of percentage points of Kolmogorov Statistics. American Statistical Association Journal,
1956, pp. 111 121.
Interfaces

21

Sahara: Simulacin de Montecarlo - Apndice B


Numerical Recipes in C: The art of scientific computing (1988 1992) - Cambridge University Press.
Zar, J.H 1999 Biostatistical Analysis 4th Ed. Prentice Hall, N.J., USA.

Interfaces

22

Sahara: Simulacin de Montecarlo - Apndice C

Apndice C Comparacin de poblaciones


Mediante este procedimiento es posible discernir, con criterio estadstico si dos muestras independientes
pertenecen a la misma poblacin. Este hecho es muy importante porque la calidad de los datos con los se
armarn las series de datos histricos de una variable se traducir en resultados ms realistas en una
simulacin de Montecarlo.
El mtodo utilizado por Sahara es la prueba de Kolmogorov - Smirnov para dos muestras. Se basa en la
comparacin de las funciones de distribucin acumuladas muestrales.
La prueba no requiere supuesto alguno sobre las distribuciones de los datos comparados.
Prueba de Kolmogorov-Smirnov para dos muestras
La prueba compara las funciones de distribucin acumulada de cada poblacin. Utiliza como estadstico la
mxima diferencia en valor absoluto entre ellas. Permite ensayar la hiptesis nula:
Ho) Distribucin Muestra 1 = Distribucin Muestra 2
El ensayo se realiza calculando, para ambas distribuciones la frecuencia relativa acumulada (funciones de
distribucin muestral) correspondiente a cada observacin.
El estadstico de prueba es:
Dn1, n2 = max | Fn1(x) Gn2(x)|
donde Fn1(x) es la funcin de distribucin emprica asociada a la muestra (X 1, .Xn1) y Gn2 la funcin de
distribucin emprica asociada la muestra (Y1, , Yn2).
n1 y n2 se refiere a los tamaos de las muestras 1 y 2 respectivamente sobre las cuales se realiza la
comparacin.
Para informacin ms detallada sobre el test se recomienda la lectura citada en bibliografa.
En Sahara se accede a la ventana Comparacin de Poblaciones desde la ventana Anlisis Estadstico una
vez que se ha cargado algn dato en la misma.
La Figura 1 muestra la ventana Comparar Poblaciones una vez realizada una comparacin entre dos
muestras. La misma, muestra el valor del estadstico de Kolmogorov Smirnov para dos muestras como
DCalc.

A continuacin de DCalc, se muestran los valores crticos del estadstico para distintos niveles de confianza
como DTeo.
La hiptesis nula que ensaya la ventana Comparar Poblaciones para determinar si dos muestras
independientes representan dos poblaciones diferentes es:
Ho) Distribucin Muestra 1 = Distribucin Muestra 2
Ho significa que, en ningn punto, la diferencia vertical entre la distribucin acumulada de la Muestra 1 y la
distribucin acumulada de la Muestra 2 (se pueden observar ambas en el grfico de la Figura 3 como F(x) y
G(x) respectivamente) es mayor que la que se espera si las dos muestras derivan de la misma poblacin.
Luego, la hiptesis alternativa significa que existe por lo menos un punto donde la mayor diferencia vertical
entre las dos distribuciones de probabilidad acumulada es mayor que la esperada si las dos muestras fueran
derivadas de la misma poblacin. En el punto de mxima separacin vertical de las dos distribuciones, la
probabilidad acumulada de la Muestra 1 es significativamente mayor o menor que la probabilidad acumulada
de la Muestra 2. Esta hiptesis alternativa es no direccional y se evala con un test de dos colas (two tailed
test).
La herramienta Comparacin de Poblaciones de Sahara utiliza los valores crticos del test de Kolmogorov
Smirnov para dos muestras independientes de la Tabla A23 del Handbook of Parametric and Nonparametric
Statistical Procedures.
Interfaces

23

Sahara: Simulacin de Montecarlo - Apndice C


Luego, si DCalc en la Figura 1 es mayor o igual que el valor crtico tabulado (valores de DTeo para los distintos
alfa), se rechaza la hiptesis nula con el nivel de confianza especificado por cada alfa.
En el caso del ejemplo, el valor calculado es menor que el tabulado para todos los niveles de confianza
presentados, por lo tanto, los valores crticos aparecen sobre fondo verde indicando que no se rechaza la
hiptesis nula para ningn nivel de confianza; y por lo tanto se infiere con un alto nivel de confianza que las dos
muestras pertenecen a la misma poblacin.
La Figura 2 muestra otra comparacin realizada con la herramienta Comparacin de Poblaciones de Sahara.

Esta figura muestra que si alguno de los valores crticos fuera menor que el valor calculado del estadstico
(DCalc) el mismo aparecer sobre fondo rojo indicando que la hiptesis nula debe rechazarse para ese nivel de
confianza.
Asimismo, pone de manifiesto que no hay evidencia suficiente para inferir que las dos muestras derivan de
diferentes poblaciones para los niveles de confianza correspondientes a alfa = 0.1, 0.05, 0.02 y 0.01.

Bibliografa
Jos M. Casas Snchez, Vicente Manzano Arrondo. - Inferencia estadstica 2 edicin. Editorial Ramn
Areces, 1997.
Mermoz O. y Garca Roberto - Distribuciones Univariantes de Probabilidad: modelos y su identificacin - 1
edicin. Buenos Aires: Nueva Librera 2006.
David J. Sheskin Handbook of Parametric and Nonparametric Statistical Procedures 2nd Edition.
Chapman & Hall/CRC.

Interfaces

24

Sahara: Simulacin de Montecarlo - Apndice D

Apndice D Mtodo de generacin de variables aleatorias


independientes
Distribuciones continuas
Beta
Sahara utiliza la siguiente propiedad de la distribucin Beta ():
Si X e Y son variables aleatorias independientes con distribuciones Gamma( y Gamma()
respectivamente, luego Z = X/(X+Y) tiene distribucin
Beta ().
Sahara genera las variables con distribucin Gamma con los mtodos detallados en el tem correspondiente.
Exponencial
Transformacin Inversa
Gamma
Sahara utiliza la siguiente propiedad de la distribucin Gamma ():
Si Y tiene una distribucin Gamma( , 1), entonces Z =Y tiene distribucin Gamma().
Sahara genera variables con distribucin Gamma (, 1) por los siguientes mtodos:

<1
Sahara utiliza el algoritmo de Ahrens and Dieter (1974b) que genera Z con distribucin Gamma(,1) con 0 <
< 1 utilizando una combinacin de mtodo de aceptacin-rechazo, composicin y transformacin inversa.
Para ms detalles consultar Monte Carlo: Concepts, algorithms, and applications, George S. Fishman, 1996
Springer-Verlag New York, Inc., pgs. 193-200.

=1
Transformacin inversa de una Exponencial con parmetro = 1.

>1
Sahara utiliza el algoritmo de Cheng and Feast (1974). Utiliza el mtodo de aceptacin-rechazo. Para ms
detalles consultar Monte Carlo: Concepts, algorithms, and applications, George S. Fishman, 1996 SpringerVerlag New York, Inc., pgs. 193-200.
Gumbel del mnimo
Transformacin inversa.
Gumbel del mximo
Transformacin Inversa
LogNormal
Transformacin inversa de una distribucin Normal.
Normal
Transformacin Inversa. Aproximacin de Hastings, 1955.
Para ms detalles consultar Monte Carlo: concepts, algorithms, and applications, George S. Fishman, 1996
Springer-Verlag New York, Inc., pgs. 151.
Pareto
Transformacin Inversa.
Rayleigh
Transformacin Inversa.
Triangular
Transformacin Inversa.
Uniforme
Cambio de escala.
Interfaces

25

Sahara: Simulacin de Montecarlo - Apndice D


Weibull
Transformacin Inversa

Distribuciones discretas
Binomial
Composicin.
Binomial Negativa
Suma de Geomtricas.
Geomtrica
Transformacin Inversa.
Hipergeomtrica
Transformacin Inversa.
Poisson
Suma de exponenciales.

Interfaces

26

Sahara: Simulacin de Montecarlo - Apndice E

Apndice E Correlacin entre variables en una simulacin de


Montecarlo
La correlacin entre variables en un modelo de Montecarlo puede llegar a afectar la distribucin del resultado
de la simulacin. De qu forma es afectado este resultado, depender del modelo planteado y las operaciones
que se realicen durante la simulacin.
Murtha (2000) describe cmo, una correlacin positiva entre dos variables afecta las operaciones de suma y
multiplicacin. En general, los modelos que se requiere resolver incluyen complejas combinaciones de ambas
operaciones y no es fcil determinar a simple vista cul ser el efecto que la correlacin entre las mltiples
variables pueda llegar a tener sobre los resultados del modelo.
El autor sostiene que, en algunos casos, el efecto de la correlacin puede llegar a ser despreciable, pero
recomienda chequearlo.
Coeficiente de Correlacin:
r = Cov (X, Y) / (x * y)
donde,
Cov(X, Y) = (1/ N) (xi xpromedio)(yi ypromedio)
2
varx = (1/ N) (xi xpromedio)
x = varx
donde N es el tamao de la muestra.
El valor de r toma valores entre 1 (correlacin perfectamente positiva) y -1 (correlacin perfectamente
negativa). Coeficientes en el rango [-0.15, 0.15] pueden deberse a ruido. No son frecuentes coeficientes de
correlacin por encima de 0.8 o debajo de -0.8 (Murtha, 2000).
Para tener en cuenta la correlacin entre todas las variables involucradas en un modelo de Montecarlo, Sahara
utiliza la Matriz de Correlaciones. Los coeficientes de correlacin se ingresan en la ventana Matriz de
Correlacin, a la que se accede desde la ventana Montecarlo. Los valores de coeficientes de correlacin que
no se completen, Sahara los tomar como cero, y por lo tanto tratar a las variables como independientes. En
la Figura 1 se muestra la ventana Matriz de Correlacin para un ejemplo donde hay tres variables
involucradas.

Sahara utiliza el mtodo de Iman y Conover (1982) para inducir la correlacin entre las variables en una
simulacin de Montecarlo.
En algunos casos, la matriz ingresada puede no ser vlida (por no ser semi definida positiva). Por lo tanto, es
necesario obtener una matriz de correlaciones semi definida positiva, que sea lo ms cercana posible a la
matriz de correlaciones ingresada. Sahara utiliza el algoritmo de Mishra (2007) para obtener la matriz ms
cercana definida positiva que refleje la correlacin entre las variables ingresada por el usuario. En los casos en
los que este algoritmo no converge, Sahara calcula una matriz vlida que no necesariamente es una matriz
cercana a la ingresada, ni mejor que cualquier otra que pueda ingresar el usuario.

Bibliografa
Iman R. and Conover W. (1982). A distribution-free approach to inducing rank correlation among input
variables. Commun. Statist. Simula. Computa.,11 (3):311334.
Mishra, S. K. (2007), The Nearest Correlation Matrix Problem: Solution by Differential Evolution Method of
Global Optimization Available at SSRN: http://ssrn.com/abstract=980403.
Murtha, J. 2000. When does correlation matter? Risk Analysis for the Oil Industry, 2023.

Interfaces

27

Sahara: Simulacin de Montecarlo - Apndice F

Apndice F Estimacin de parmetros de funciones continuas


Para estimar los parmetros a partir de una muestra, suponiendo una distribucin terica, Sahara utiliza los
mtodos de estimacin por mxima verosimilitud y el mtodo de los momentos, segn el caso.
N: nmero de datos de la muestra
xprom: promedio de la muestra
2
s : varianza de la muestra
s: desviacin estndar de la muestra
Beta ()
Mtodo de los momentos.
Estimadores:
xprom xprom xprom s
xprom xprom xprom s
Exponencial )
Mxima Verosimilitud
Estimador:
xprom
Gamma
Mtodo de los momentos.
Estimadores:
xprom s)
s xprom
Gumbel del mnimo
Mtodo de los momentos
Estimadores:
s * 6 /
xprom + Ceuler * donde Ceuler = 0.5772
Gumbel del mximo
Mtodo de los momentos
Estimadores:
s * 6 /
xprom - Ceuler * donde Ceuler = 0.5772
LogNormal
Mxima Verosimilitud
Estimadores:
* = ln(xi) / N
2
* = ( (xi *) / (N -1))
Normal
Mxima Verosimilitud
Estimadores:
= xprom
=s
Pareto
Mxima Verosimilitud
Estimadores:
mnimo muestral
ln(xi

Interfaces

28

Sahara: Simulacin de Montecarlo - Apndice F


Rayleigh
Mxima Verosimilitud
Estimador:
2
xi / (2 N) )
Uniforme
Mxima Verosimilitud
Estimadores:
Uniforme [0 b]
b = (N + 1) / N * xmx,, donde xmx es el mximo muestral
Uniforme [a b]
a = xmin ((xmx xmin) / (N 1))
b = a + ((N + 1) / (N 1) * (xmx xmin))
Weibull
Mtodo de los momentos
Estimadores:
xprom =
s
Sahara utiliza el mtodo de Newton Raphson para resolver el sistema de ecuaciones para y .

Bibliografa
Mermoz O. y Roberto G. - Distribuciones Univariantes de Probabilidad: modelos y su identificacin 1
edicin. Buenos Aires: Nueva Librera 2006.

Interfaces

29

Anda mungkin juga menyukai