1.1 INTRODUCCIN Un modelo es una representacin de la realidad desarrollado con el propsito de estudiarla. En la mayora de los anlisis no es necesario considerar todos los detalles de la realidad, entonces, el modelo no slo es un sustituto de la realidad sino tambin una simplificacin de ella. Tomando en cuenta las herramientas que se utilizan, una clasificacin de los modelos dara como resultado:
Modelos cnicos Son los modelos fsicos que se asemejan al sistema real, generalmente manejados en otra escala.
Modelos anlogos Son los modelos en los que una propiedad del sistema real se puede sustituir por una propiedad diferente que se comporta de manera similar.
Modelos simblicos Son aqullos en los que se utiliza un conjunto de smbolos en lugar de una entidad fsica para representar a la realidad. Los modelos simblicos, dentro de los cuales se encuentran los modelos de simulacin, se clasifican a su vez en:
LECTURA 6.1 SIMULACIN Y ANLISIS DE MODELOS ESTOCSTICOS Azarang M., Garcia E. Mc. Graw Hill. Mxico
Modelos determinsticos En estos modelos, los valores de las variables no se ven afectados por variaciones aleatorias y se conocen con exactitud. Un ejemplo es el modelo de inventarios conocido como lote econmico. Modelos estocsticos o probabilsticos Los valores de las variables dentro de un modelo estocstico sufren modificaciones aleatorias con respecto a un valor promedio; dichas variaciones pueden ser manejadas mediante distribuciones de probabilidad. Un buen nmero de estos modelos se pueden encontrar en la teora de lneas de espera. Modelos dinmicos La caracterstica de estos modelos es el cambio que presentan las variables en funcin del tiempo; son ejemplo de stos los modelos de series de tiempo, pronsticos y programacin dinmica. Modelos estticos En este tipo de modelos no se maneja la variable tiempo, esto es, representan a un sistema en un punto particular del tiempo; son ejemplo los modelos de programacin lineal. Modelos continuos Son modelos en los que las variables pueden tomar valores reales y manejarse mediante las tcnicas de optimizacin clsica. Son ejemplos los modelos para el estudio de fluidos, intercambio de calor, etctera. Modelos discretos Las variables del sistema toman valores slo en el rango de nmeros enteros. Por ejemplo, los modelos que representen la produccin de piezas en una empresa metal-mecnica. Independientemente de la clasificacin de un modelo, existe una tendencia a seleccionarlos dependiendo de ciertas caractersticas, las cuales hacen ms deseables algunos modelos sobre otros. La siguiente lista muestra las caractersticas principales que debe tener todo modelo: Confiabilidad. Sencillez. Bajo costo de desarrollo y operacin. Manejabilidad. De fcil entendimiento, tanto el modelo como los resultados. La relacin costo-beneficio debe ser positiva.
1.2 DISTRIBUCIONES DE PROBABILIDAD Al modelar un sistema, se debe diferenciar entre dos tipos de datos: los primeros permanecen sin cambio a travs del tiempo y se conocen como "parmetros"; los segundos presentan cambios a travs del tiempo y se conocen como "variables". Por ejemplo, el modelado de un sistema mediante simulacin es til cuando la informacin del sistema tiene carcter dinmico y probabilstico, debido principalmente a que la interaccin de esa informacin es, por lo general, difcil de analizar. La variabilidad que presenta el segundo tipo de datos debe modelarse de acuerdo con ciertas ecuaciones matemticas que sean capaces de reproducirla; en la mayora de los casos dicha variablilidad puede clasificarse dentro de alguna : ucin de probabilidad. As pues, uno de los pasos ms importantes de todo 1 proceso de modelado estocstico es la bsqueda de informacin y su anlisis estadstico posterior basado principalmente en la clasificacin de cada serie de datos dentro de alguna distribucin de probabilidad. Algunas de las distribuciones ms comunes se analizan a continuacin. 1.2.1 DISTRIBUCIONES CONTINUAS Ente tipo de distribuciones se utilizan para modelar la aleatoriedad en aquellas lades o eventos en los cuales los valores de las variables pueden estar dentro de un rango de valores reales. A continuacin se describen algunas de as funciones continuas ms utilizadas.
Figura 1.1 Grfica de la funcin de densidad uniforme.
Figura 1.2 Grfica de la funcin de densidad exponencial.
Figura 1.3 Grfica de la funcin de densidad de Weibull.
Figura 1.4 Grfica de la funcin de densidad triangular.
Figura 1.5 Grfica de la funcin de densidad normal.
Figura 1.6 Grfica de la funcin de densidad lognormal.
1.2.2 DISTRIBUCIONES DISCRETAS Este tipo de distribuciones sirven para modelar la aleatoriedad de una variable que slo puede tomar valores enteros. Las siguientes distribuciones son algunas de las ms utilizadas en el modelado de sistemas estocsticos.
Figura 1.7 Grfica de la funcin de probabilidad de Bernoulli.
Figura 1.8 Grfica de la funcin de probabilidad uniforme discreta.
Figura 1.9 Grfica de la funcin de probabilidad binomial.
Figura 1.10 Grfica de la funcin de probabilidad Poisson.
Figura 1.11 Grfica de la funcin de probabilidad geomtrica.
Normalmente el paso de bsqueda y anlisis de la informacin es el que ms nempo consume dentro del desarrollo total del modelo; tomando en considera- in que no se cuenta con ningn tipo de informacin, es posible afirmar que arte puede tomar del 60 al 70% del tiempo total de desarrollo del modelo.
En la mayor parte de los sistemas, al analizar la informacin, sta se encuentra iisponible en forma de series a travs del tiempo, como se muestra en la gura 1.12. p roduccin
Figura 1.12 Serie de tiempo.
Esta informacin, tabulada en dicho formato no es de utilidad cuando se trata de obtener un comportamiento basado en variabilidad con cierto comportamiento probabilstico. As pues, si el analista desea conocer el comportamiento, es necesario modificar la forma de presentacin de datos y presentarla como tablas de frecuencia, con la finalidad de realizar cualquiera de las siguientes pruebas: 2 Prueba de bondad de ajuste X . Prueba de Kolmogorov-Smirnov.
1.3.1 PRUEBA DE BONDAD DE AJUSTE 5 2
Como ya se mencion, esta prueba se utiliza para encontrar la distribucin de probabilidad de una serie de datos. La metodologa de la prueba x 2
es 1 a siguiente: 1. Se colocan los n datos histricos en una tabla de frecuencias de m = *ra intervalos. Se obtiene la frecuencia observada en cada intervalo i (FO). Se calcula la media y la variancia de los datos. 2. Se propone una distribucin de probabilidad de acuerdo con la forma de la tabla de frecuencias obtenida en el paso 1. 3. Con la distribucin propuesta, se calcula la frecuencia esperada para cada uno de los intervalos (FE) mediante la integracin de la distribucin propuesta y su posterior multiplicacin por el nmero total de datos. 4. Se calcula el estimador:
5. Si el estimador C es menor o igual al valor correspondiente % 2 con m - k - I grados de libertad (k - nmero de parmetros estimados de la distribucin) y a un nivel de confiabilidad de 1 - a, entonces no se puede rechazar la hiptesis de que la informacin histrica sigue la distribucin propuesta en el punto 2.
Ejemplo. Mediante la prueba % 2 determine el tipo de distribucin de probabi- 1 lidad que sigue la demanda de automviles a un nivel del 95%, si a travs del I tiempo se ha registrado el comportamiento consignado en la figura 1.13. Obtenga la tabla de frecuencias de la figura 1.13 considerando 7 intervalos y cuantificando la frecuencia para cada uno de ellos:
Figura 1.13 Comportamiento de la demanda.
La distribucin de probabilidad esperada que se propone, observando los datos de la columna FO, es una distribucin uniforme entre a =O y b - 13 automviles por da, o sea:
Sustituyendo los valores de los lmites para obtener F(x) y multiplicndolos por el total de datos, se tiene FE para cada intervalo.
Calculando el estadstico C con los datos de FE y FO^ se obtiene C=4.092 El valor C =4.092, comparado con el valor de la tabla yj^ %t
6 =12.59, indica que no podemos rechazar que los datos anteriores se comportan de acuerdo a una distribucin uniforme entre O y 13 automviles demandados por da con un nivel de confianza del 95%. Entonces, Demanda ~U (O, 13) automviles/da.
Si el objetivo es encontrar el tipo de distribucin de probabilidad de una serie de datos, es posible utilizar la prueba de bondad de ajuste de Kolmogorov-Smir-nov, la cual, comparndola con la de % 2 , es ms eficiente en varios aspectos ya que trabaja con la distribucin de probabilidad acumulada. La metodologa es la siguiente: 1. Se colocan los n datos histricos en una tabla de frecuencias con m =V/7 intervalos. Para cada intervalo se tendr la frecuencia observada (FO). Se calcula la media y la variancia de los datos. 2. Se divide la frecuencia observada de cada intervalo por el nmero total de datos. A este resultado para obtener la probabilidad observada i (PO). 3. Se calcula la probabilidad acumulada observada de cada intervalo (PAO) del paso 2. 4. Se propone una distribucin de probabilidad de acuerdo con la forma de la tabla de frecuencias obtenida en 1. 5. Con la distribucin propuesta se calcula la probabilidad esperada para cada uno de los intervalos (PE) mediante la integracin de la distribucin propuesta.
6. Se calcula la probabilidad acumulada esperada (PAE) para cada intervalo de clase. Se calcula el valor absoluto entre PAO i y PEO t para cada intervalo y se selecciona la mxima diferencia, llamndola DM. 8. El estimador DM se compara con un valor lmite correspondiente a la tabla 6 en el apndice B con n datos y a un nivel de confiabilidad de 1 - a. Si el estimador DM es menor o igual al valor lmite de la tabla 6, entonces no se puede rechazar que la informacin histrica sigue la distribucin propuesta en el paso 4.
Ejemplo. Mediante la prueba de Kolmogorov-Smirnov determine el tipo de atribucin de probabilidad que siguen los datos del ejemplo anterior, con un ircl del confianza del 95%. Obtenga la tabla de frecuencias, considerando 7 intervalos:
Al obtener la diferencia trmino a trmino entre PEA y POA, se tiene
El valor Z)Mes igual a la mxima diferencia, osea, 0.0694, que comparndolo contra el valor < 5 o /o41 =0.2123, indica que los datos anteriores siguen una distribucin uniforme entre O y 13 automviles demandados por da, a un nivel de confianza del 95%. Por lo tanto, Demanda ~U (O, 13) automviles/da. Ejemplo. Utilizando la prueba de Kolmogorov-Smirnov, definiremos la distribucin de probabilidad que siguen los datos de la figura 1.14, que muestra la demanda de caf a travs del tiempo, medida en toneladas/da
alculando las diferencias absolutas en cada intervalo: Intervalo \PEA- POA\ 0-3 0.0013 3-6 0.0049 6-9 0.0121 9-12 0.0215 12-15 0.0356 15-18 0.0483 >18 0.0000
La DM- 0.0483 se compara con la d 5 o/ 0j51 de la tabla 6 del apndice el valor lmite es 0.1904, lo cual indica que los datos de la demanda de caf siguen una distribucin de probabilidad exponencial con media X 6 toneladas/da, es decir, Demanda ~Exp (A, - 6) toneladas de caf/da. Ejemplo. Un proveedor indica que siempre entrega su mercanca en 7 das o menos. Sin embargo, el jefe del almacn hizo un muestreo de las ltimas entregas de este proveedor y obtuvo lo siguiente: Das de entrega de un pedido Frecuencia 0-1 0 2-3 1 4-5 8 6-7 12 8-9 20 10- 11 10 12- 13 3 14-15 1 16-17 0 Obviamente, no tarda 7 das o menos. Qu se puede decir acerca de los das que tarda en entregar un pedido? Observando los datos se puede pensar que siguen una distribucin normal con media de 8 das y una desviacin estndar de 2 das. La funcin normal no es integrable, as que se utilizar la tabla normal estndar. Intervalo FO FOA POA(l) PEA \POA- PEA\ 0-1 0 0 0.000 0.000025 0.000025 2-3 1 1 0.018 0.00621 0.01197 4-5 8 9 0.164 0.06681 0.0968 6-7 12 21 0.382 0.3021 0.0797 8-9 20 41 0.745 0.6979 0.0475 10- 11 10 51 0.927 0.9332 0.00599 12- 13 3 54 0.982 0.999975 0.000025 16- 17 0 55 1.000 0.99999 0.000010 De la tabla con distribucin normal estndar, se lee la probabilidad acumulada desde - oo hasta z; por ejemplo, para el tercer intervalo:
Con el valor de z 3 =-1.5 se busca en la tabla normal estndar; el valor correspondiente desde - oo a -1.5 es 0.06681. El procedimiento es similar para cada uno de los intervalos. La DM- 0.0968 se compara con la d 5%
55 =0.1833, y ya que DM es menor, entonces no se puede rechazar la hiptesis de que los das de entrega de los pedidos siguen una distribucin normal con media de 8 das y desviacin :idar de 2 das (variancia =4) con un nivel de confianza de 95%. Tiempo de entrega ~N (8, 4) das Los procedimientos presentados, se encuentran ya en paquetes computacio- nales en los que el usuario slo tiene que introducir la serie de datos a travs rl tiempo, y con un procedimiento de prueba y error realiza la bsqueda de la distribucin de probabilidad que ms se adecu. Dentro de los principales paquetes que realizan este anlisis se pueden citar SANDIE y STATGRAP- P .\S. ambos para un ambiente DOS. Una de las ventajas de utilizar los paquetes es la rapidez con la que se puede analizar la informacin, siempre y cuando sta tenga un carcter probabilstico comn, como puede ser exponencial, normal, Erlang, etctera; en caso de que la informacin no presente ese comportamiento, es necesario identificar otro tipo ? distribuciones ms complejas y analizar en forma manual la informacin. Por ltimo, es importante aclarar que el procedimiento de anlisis de la formacin para la bsqueda de una distribucin de probabilidad conocida : rr sentado en este captulo puede evitarse, asimismo, se puede manejar toda la informacin mediante distribuciones de probabilidad generales.
1.4 PROBLEMAS -1. Una mquina procesa piezas con un tiempo que sigue una distribucin exponencial con media de 20 minutos/pieza. Indique cul es la probabilidad de que una pieza cualquiera sea procesada en un tiempo mayor a 35 minutos. .-2, Si la estatura de los bebs recin nacidos sigue una distribucin normal (4.100, 0.500) kg, indique cual es la probabilidad de que un recin nacido pese: a) menos de 3.800 kg, fe) entre 3.900 y 4.050 kg, c) ms de 5.100 kg. .3. Si el tiempo entre llegadas a un restaurante sigue una distribucin exponencial con media de 15 minutos, calcule la probabilidad de que el tiempo entre llegadas sea menor a 15 minutos. .4. El tiempo entre fallas de una mquina es Weibull con parmetros de forma y escala de 2 y 50, respectivamente. Cul es la probabilidad de que una mquina falle antes de 45 horas de trabajo? -5. Si el nmero de roturas/tonelada en la produccin de hilo polister sigue una distribucin geomtrica conp =0.5, calcule la probabilidad de: a) obtener 3 defectos/tonelada, 6) tener entre 4 y 10 defectos, c) no tener defectos.
1.6. Si para el problema anterior la distribucin de probabilidad es Binomial con N = 10 y p = 0.4, qu valores de probabilidad se obtendran? 1.7. Para el siguiente conjunto de nmeros: 5, 8, 4, 7, 8, 2, 4, 4, 3, 5, 6, 7, 8, 4, 8, 7, 3, 4, 5, 6, 7, 2, 3, 4, 5 3, 5, 6, 1, 2, 3, 2, 5, 6, 7, 8, 7, 1, 5, 6, 7, 3, 4, 2, O, 1, O, O, 2, 3 realice la prueba de bondad de ajuste para determinar si siguen una distribucin uniforme entre O y 8, a un nivel de confianza del 95%. 1.8. Realice la prueba de Kolmogorov-Smirnov a los nmeros de la siguiente lista y demuestre a un nivel 1 - a =95% que son uniformes (O, 1).
1.9. Los telares de tipo picaol detienen su produccin de tela automticamente al ocurrir una rotura, hasta que un operario va a repararla. El tiempo entre paros de las mquinas ha arrojado los siguientes resultados medidos en minutos: 1.88 3.53 1.42 0.39 0.80 0.54 0.53 1.28 0.34 5.50 1.90 1.80 0.82 0.01 4.91 0.15 0.79 2.16 0.10 0.35 0.02 0.21 0.05 1.10 0.36 2.81 0.80 0.04 0.24 0.90 1.50 0.26 1.49 0.26 1.03 0.53 0.63 0.66 0.45 1.73 2.62 0.36 2.03 0.17 0.38 2.67 2.03 1.00 4.29 0.48 Determine con un nivel de aceptacin 1 - a =90% la distribucin de probabilidad del tiempo entre paros. 1.10. Los datos en meses del tiempo entre fallas de un automvil son: 36.33 48.00 32.02 36.78 38.52 40.33 35.78 45.39 35.99 36.68 41.52 36.54 36.60 40.56 40.42 33.92 39.82 34.48 34.35 37.73 35.89 31.75 41.91 45.70 31.50 44.58 34.04 32.03 48.53 47.29 41.91 38.45 36.10 40.57 34.28 35.90 48.47 32.86 40.91 32.80 38.69 41.33 49.31 45.99 34.06 37.46 35.97 39.22 41.92 31.08 Construya un histograma y determine la distribucin de probabilidad a un nivel 1 - a =95% con la prueba de bondad de ajuste % 2 . 1.11. Datos histricos en minutos del tiempo de inspeccin de la elongacin de un hilo de nylon son: 2.71 2.12 1.66 0.34 2.24 6.92 4.01 7.96 13.51 3.57 1.12 1.18 4.18 3.08 0.80 3.86 0.57 0.57 1.80 3.50 5.31 2.52 2.40 3.10 2.34 4.48 12.09 2.62 3.13 16.47 2.19 0.32 18.24 1.87 4.90 17.21 0.53 1.97 0.00 4.24 0.71 5.13 1.87 2.73 4.83 3.76 8.88 1.94 3.73 8.94 Construya un histograma y determine la distribucin de probabilidad a un nivel 1 - a =95% con la prueba de bondad de ajuste i 2 .
El nmero de horas de vida de un componente electrnico se comporta de acuerdo con los datos histricos siguientes: 151.3 155.1 150.1 158.7 148.8 148.7 147.9 153.1 151.6 150.9 149.2 160.3 157.7 146.9 150.6 146.8 144.5 160.9 147.7 150.0 157.1 136.6 146.7 142.8 150.0 144.5 156.2 145.6 150.2 151.7 158.8 149.6 144.8 145.2 158.8 150.1 149.6 142.1 150.6 151.6 145.5 154.6 158.4 164.2 152.6 144.5 147.5 142.3 149.3 148.5 Construya un histograma y determine la distribucin de probabilidad de los datos a un nivel 1 - a =90% utilizando la prueba de bondad de ajuste de Kolmogorov-Smirnov. El peso (kg) de 50 piezas se comporta aleatoriamente de acuerdo con: 0. 13 45. 2 2 8. 6 4 93. 1 1 39. 7 3 43. 45 10 8 . 0 0. 74 46. 0 6 3^, 3 7 120. 5 56. 1 4 33 . 8 0 12. 7 8 7. 08 2. 87 77 . 0 8 18. 6 0 55. 6 7 5. 50 45. 4 1 28. 9 4 15 1 . 9 17. 5 1 32. 9 3 19. 06 17 . 5 3 8. 75 3. 20 14. 8 6 20. 8 7 6. 44 3 . 2 0 103. 9 20. 9 0 47. 26 12 0 . 3 0. 62 29. 5 7 33. 3 1 35. 7 2 16. 9 3 17. 72 10. 0 2 33. 3 5 55. 91 3. 0 3 20. 8 1 34. 5 6 9. 94 Sera adecuado considerar que el peso se distribuye exponencialmente con ji = kg? I resultado de aceptacin o rechazo de 50 lotes consecutivos se codifica con 1 o O, respectivamente. A partir de los resultados siguientes, 1 0 0 0 0 0 1 0 0 1 0 0 0 1 0 1 1 1 1 0 0 0 1 0 1 0 1 1 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0 estre que el evento "aceptar un lote" sigue una distribucin Bernoulli con p - 0.35 con un nivel de confianza 1 - a de 95%. Se sospecha que el nmero de defectos/lmina en cierto proceso sigue una distribucin binomial con p = 7 y TV =5. A partir de la siguiente muestra de 50 datos:
demuestre si las sospechas son ciertas mediante la prueba de bondad de ajuste un nivel de confianza del 90%. En caso negativo, qu distribucin de proba-hflidad sera ms adecuada para modelar el nmero de defectos?