Anda di halaman 1dari 61

LA DISPERSIN.

Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo nos revelan una parte de la informacin que necesitamos acerca de las caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de los datos, debemos medir tambin su dispersin, extensin o variabilidad. La dispersin es importante porque:

Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos. Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersin antes de abordar esos problemas. Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersin de valores con respecto al centro de distribucin o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones ms grandes.

Pero si hay dispersin en la mayora de los datos, y debemos estar en capacidad de describirla. Ya que la dispersin ocurre frecuentemente y su grado de variabilidad es importante, cmo medimos la variabilidad de una distribucin emprica?. Vamos a considerar slo algunas medidas de dispersin absolutas: el rango, la varianza, la desviacin estndar y el coeficiente de variacin.

EL RANGO O RECORRIDO ( R ):
Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia entre el valor ms alto (Xn Xmax.) y el mas bajo (X1 Xmin) en un conjunto de datos. Rango para datos no agrupados; R = Xmx.-Xmn = Xn-X1 Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 27,34 y 25., para calcular la media aritmtica (promedio de las edades, se tiene que: R = Xn-X1 ) = 34-18 = 16 aos Con datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los lmites de clases. Se

aproxima el rango tomando el limite superior de la ltima clase menos el limite inferior de la primera clase. Rango para datos agrupados; R= (lim. Sup. de la clase n lim. Inf. De la clase 1) Ejemplo: Si se toman los datos del ejemplo resuelto al construir la tabla de distribucin de frecuencia de las cuentas por cobrar de Cabreras y Asociados que fueron los siguientes: Clases P.M. Xi 7.420 21.835 14.628 10 0.33 10 0.13 14 0.17 19 0.10 22 0.10 25 0.17 30 30 20 16 11 8 5 0.33 1.00 0.46 0.67 0.63 0.54 0.73 0.37 0.83 0.27 1.00 0.17 21.835 36.250 29.043 4 36.250 50.665 43.458 5 50.665 65.080 57.873 3 65.080 79.495 72.288 3 79.495 93.910 86.703 5 Total XXX fi fr fa fa fra fra

30 1.00 XXX XXX XXX XXX

Medidas de dispersin
Las medidas de dispersin nos informan sobre cunto se alejan del centro los valores de la distribucin. Las medidas de dispersin son:

Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica.

Desviacin media
La desviacin respecto a la media es la diferencia entre cada valor de la variable estadstica y la media aritmtica. Di = x - x La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. La desviacin media se representa por

Ejemplo

Calcular la desviacin media de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Desviacin media para datos agrupados


Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:

Ejemplo

Calcular la desviacin media de la distribucin:


xi [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) 12.5 17.5 22.5 27.5 32.5 fi 3 5 7 4 2 21 xi fi 37.5 87.5 157.5 110 65 457.5 |x - x| 9.286 4.286 0.714 5.714 10.174 |x - x| fi 27.858 21.43 4.998 22.856 21.428 98.57

Varianza
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. La varianza se representa por .

Varianza para datos agrupados

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza

Calcular la varianza de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribucin de la tabla:


xi [10, 20) [20, 30) [30,40) [40, 50) [50, 60 [60,70) [70, 80) 15 25 35 45 55 65 75 1 8 10 9 8 4 2 42 fi xi fi 15 200 350 405 440 260 150 1 820 xi2 fi 225 5000 12 250 18 225 24 200 16 900 11 250 88 050

Propiedades de la varianza
1 La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.

2 Si a todos los valores de la variable se les suma un nmero la varianza no vara. 3 Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada por el cuadrado de dicho nmero. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la varianza

1 La varianza, al igual que la media, es un ndice muy sensible a las puntuaciones extremas. 2 En los casos que no se pueda hallar la media tampoco ser posible hallar la varianza. 3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones estn elevadas al cuadrado.

Desviacin tpica
La desviacin tpica es la raz cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin. La desviacin tpica se representa por .

Desviacin tpica para datos agrupados

Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Desviacin tpica para datos agrupados

Ejercicios de desviacin tpica

Calcular la desviacin tpica de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviacin tpica de la distribucin de la tabla:


xi [10, 20) [20, 30) [30,40) 15 25 35 1 8 10 fi xi fi 15 200 350 xi2 fi 225 5000 12 250

[40, 50) [50, 60) [60,70) [70, 80)

45 55 65 75

9 8 4 2 42

405 440 260 150 1 820

18 225 24 200 16 900 11 250 88 050

Propiedades de la desviacin tpica


1 La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara. 3 Si todos los valores de la variable se multiplican por un nmero la desviacin tpica queda multiplicada por dicho nmero. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total. Si todas las muestras tienen el mismo tamao:

Si las muestras tienen distinto tamao:

Observaciones sobre la desviacin tpica

1 La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las puntuaciones extremas. 2 En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica. 3 Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor de la media.

TEORA DE LOS MOMENTOS.- Los momentos son indicadores matemticos de diversos valores. Los diversos valores, estn es funcin del parmetro estadstico o valor que se tome, para ser fijado como punto de referencia. Sean X1, X2, X3, ..........Xn, los valores que toma la variable Xi; se define entonces, momento mi de orden r con respecto al promedio aritmtico ( ) de los valores de la variable Xi elevados a la potencia r; siendo r cualquier valor comprendido entre,1 , 2, 3,....,n. Matemticamente: Los momentos se pueden definir tambin como las potencias de los desvos di con respecto a un determinado valor, que puede ser la media aritmtica, el origen cero o una media arbitraria.En estadstica son importantes los momentos 1, 2, 3 y 4 con respecto a la media aritmtica y el momento 1 con respecto al origen que viene a ser igual a la media aritmtica Formulas para determinar los momentos con respecto a la media aritmtica A) Para datos no agrupados B) Para datos agrupados Descripcin de los Momentos: 1. - El primer momento con respecto a la es siempre igual a cero, este momento es simila r a la primera propiedad de la . 2. El segundo momento con respecto a la es siempre igual a la varianza. 3 El tercer momento con respecto a la media aritmtica se utiliza para determinar el coeficiente de asimetra SKm. 1 E l cuarto momento con respecto a la media aritmtica es un valor que se utiliza para determinar el coeficiente de kurtosis, de una serie de valores. Formula de los momentos con respecto al origen cero: Procedimiento para Calcular los mi de una serie de datos: 1 Se calcula la media aritmtica. 2 Se determinan los mi de los Xi y de los de la serie de valores con respecto a la media aritmtica. 3 Se determinan las di con respecto para los datos no agrupados y la fidi para los datos agrupados segn el caso. 4 Se elabora un cuadro estadstico con los datos calculados.

5 Se aplican las formulas para calcular los momentos segn el caso. 1 Sean los siguientes datos los aos de servicio de un grupo de trabajadores. Determine el m1, m2, m3 y m4 con respecto a la media aritmtica. Solucin.- Lo primero que se hace es calcu lar la y luego se procede a calcular los d1, d2, d3 y d4 con respecto a la despus se aplica la formula para calcular los momentos de datos no agrupados. Xi | (Xi- ) = d1 | (Xi- )2 = d2 | (Xi- )3 = d3 | (Xi- )4 = d4 | 5 | (5 8) = -3 | 9 | -27 | 81 | 6 | (6 8) = -2 | 4 | -8 | 16 | 7 | (7 8) = -1 | 1 | -1 | 1 | 9 | (9 8) = 1 | 1 | 1 | 1 | 13 | (13 8) = 5 | 25 | 125 | 625 | Xi =40 | d = 0 | d2 = 40 | d3 =90 | d4 = 724 |

2 La siguiente distribucin de frecuencia corresponde al consumo de azcar trimestral de un grupo de familias. Determine el m1, m2, m3 y el m4 con respecto a la media aritmtica. CLASES | fi | 5 7 | 5 | 8 10 | 10 | 11 13 | 15 | 14 16 | 30 | 17 19 | 15 | 20 22 | 10 | 23 25 | 5 | | 90 | Solucin.- Lo primero que se hace es elaborar un cuadro estadstico, luego se calcula la y posteriormente se determinan los desvos d1, d2, d3 y d4 con respecto a la media y finalmente con los datos obtenidos en el cuadro se aplica la formula para obtener los momentos en datos agrupados. CLASES | fi | | fi . | di | fi .di | fi .d2 | f i .d3 | fi .d4 | 5 7 | 5 | 6 | 30 | -9 | -45 | 405 | -3645 | 32805 | 8 10 | 10 | 9 | 90 | -6 | -60 | 360 | -2160 | 12960 | 11 13 | 15 | 12 | 180 | -3 | -45 | 135 | -405 | 1215 | 14 16 | 30 | 15 | 450 | 0 | 0 | 0 | 0 | 0 | 17 19 | 15 | 18 | 270 | 3 | 45 | 135 | 405 | 1215 | 20 22 | 10 | 21 | 210 | 6 | 60 | 360 | 2160 | 12960 | 23 25 | 5 | 24 | 120 | 9 | 45 | 405 | 3645 | 32805 |

| 90 | | 1350 | 0 | 0 | 1800 | 0 | 93960 | 4.- La siguiente distribucin de frecuencia corresponde al consumo de azcar de un grupo de familias. Determine el m1 con respecto al origen. CLASES | fi | 57 | 5 | 810 | 10 | 1113 | 15 | 1416 | 30 | 1719 | 10 | 2022 | 15 | 2325 | 5 | | 90 | Cuadro resumen CLASES | fi | | | | 57 | 5 | 6 | 6-0 = 6 | 30 | 810 | 10 | 9 | 9-0 = 9 | 90 | 1113 | 15 | 12 | 12-0 =12 | 1 80 | 1416 | 30 | 15 | 15-0 = 15 | 450 | 1719 | 15 | 18 | 18-0 = 18 | 270 | 2022 | 10 | 21 | 21-0 = 21 | 210 | 2325 | 5 | 24 | 24-0 = 24 | 120 | | 90 | | | 1350 | El momento m1 con respecto al origen cero (0), siempre es igual a la media aritmtica.
------------------

Definicin de probabiidad

La probabilidad de un suceso es un nmero, comprendido entre 0 y 1, que indica las posibilidades que tiene de verificarse cuando se realiza un experimento aleatorio.

Experimentos deterministas Son los experimentos de los que podemos predecir el resultado antes de que se realicen.

Ejemplo

Si dejamos caer una piedra desde una ventana sabemos, sin lugar a dudas, que la piedra bajar. Si la arrojamos hacia arriba, sabemos que subir durante un determinado intervalo de tiempo; pero despus bajar.
Experimentos aleatorios Son aquellos en los que no se puede predecir el resultado, ya que ste depende del azar. Ejemplos

Si lanzamos una moneda no sabemos de antemano si saldr cara o cruz. Si lanzamos un dado tampoco podemos determinar el resultado que vamos a obtener.

Teora de probabilidades
La teora de probabilidades se ocupa de asignar un cierto nmero a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es ms probable que otro. Con este fin, introduciremos algunas definiciones: Suceso Es cada uno de los resultados posibles de una experiencia aleatoria.

Al lanzar una moneda salga cara. Al lanzar una moneda se obtenga 4.


Espacio muestral Es el conjunto de todos los posibles resultados de una experiencia aleatoria, lo representaremos por E (o bien por la letra griega ).

Espacio muestral de una moneda: E = {C, X}. Espacio muestral de un dado: E = {1, 2, 3, 4, 5, 6}.
Suceso aleatorio Suceso aleatorio es cualquier subconjunto del espacio muestral.

Por ejemplo al tirar un dado un suceso sera que saliera par, otro, obtener mltiplo de 3, y otro, sacar 5.

Ejemplo Una bolsa contiene bolas blancas y negras. Se extraen sucesivamente tres bolas. Calcular:

1. El espacio muestral. E = {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n, n,n)} 2. El suceso A = {extraer tres bolas del mismo color}. A = {(b,b,b); (n, n,n)} 3. El suceso B = {extraer al menos una bola blanca}. B= {(b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)} 4. El suceso C = {extraer una sola bola negra}. C = {(b,b,n); (b,n,b); (n,b,b)}

Teora de regresin y correlacin


El trmino correlacin se utiliza generalmente para indicar la correspondencia o la relacin recproca que se da entre dos o ms cosas, ideas, personas, entre otras. En tanto, en probabilidad y estadstica, la correlacin es aquello que indicar la fuerza y la direccin lineal que se establece entre dos variables aleatorias.

Se considera que dos variables de tipo cuantitativo presentan correlacin la una respecto de la otra cuando los valores de una ellas varen sistemticamente con respecto a los valores homnimos de la otra. Por ejemplo, si tenemos dos variables que se llaman A y B, existir el mencionado fenmeno de correlacin si al aumentar los valores de A lo hacen tambin los valores correspondientes a B y viceversa. De todas maneras, vale aclarar que la correlacin que pueda darse entre dos variables no implicar por si misma ningn tipo de relacin de causalidad. Los principales elementos componentes de una correlacin de este tipo sern: la fuerza, el sentido y la forma.

Anlisis de correlacin
El anlisis de correlacin emplea mtodos para medir la significacin del grado o intensidad de asociacin entre dos o ms variables. Normalmente, el primer paso es mostrar los datos en un diagrama de dispersin. El concepto de correlacin est estrechamente vinculado al concepto de regresin, pues, para que una ecuacin de regresin sea razonable los puntos mustrales deben estar ceidos a la ecuacin de regresin; adems el coeficiente de correlacin debe ser:

Grande cuando el grado de asociacin es alto (cerca de +1 o -1, y pequeo cuando Es bajo, cerca de cero. Independiente de las unidades en que se miden las variables.

Diagrama de dispersin
Un diagrama de dispersin se emplea cuando existe una variable que est bajo el control del experimentador. Si existe un parmetro que se incrementa o disminuye de forma sistemtica por el experimentador, se le denomina parmetro de control o variable independiente = eje de x y habitualmente se representa a lo largo del eje horizontal. La variable medida o dependiente = eje de y usualmente se representa a lo largo del eje vertical. Si no existe una variable dependiente, cualquier variable se puede representar en cada eje y el diagrama de dispersin mostrar el grado de correlacin (no causalidad) entre las dos variables. Un diagrama de dispersin puede sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza determinado. La correlacin puede ser positiva (aumento), negativa (descenso), o nula (las variables no estn correlacionadas). Se puede dibujar una lnea de ajuste (llamada tambin "lnea de tendencia") con el fin de estudiar la correlacin entre las variables. Una ecuacin para la correlacin entre las variables puede ser determinada por procedimientos de ajuste. Para una correlacin lineal, el procedimiento de ajuste es conocido como regresin lineal y garantiza una solucin correcta en un tiempo finito.

Uno de los aspectos ms poderosos de un grfico de dispersin, sin embargo, es su capacidad para mostrar las relaciones no lineales entre las variables. Adems, si los datos son representados por un modelo de mezcla de relaciones simples, estas relaciones son visualmente evidentes como patrones superpuestos. El diagrama de dispersin es una de las herramientas bsicas de control de calidad, que incluyen adems el histograma, el diagrama de Pareto, la hoja de verificacin, los grficos de control, el diagrama de Ishikawa y el diagrama de flujo.

Coeficiente de correlacin de Pearson


El coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlacin de Pearson es independiente de la escala de medida de las variables El coeficiente de correlacin entre dos variables aleatorias X e Y es el cociente

El valor del ndice de correlacin vara en el intervalo [-1, +1]:

Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la otra tambin lo hace en proporcin constante. Si 0 < r < 1, existe una correlacin positiva. Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables son independientes: pueden existir todava relaciones no lineales entre las dos variables. Si -1 < r < 0, existe una correlacin negativa. Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la otra disminuye en proporcin constante.

Coeficiente de determinacin
En un modelo de regresin lineal el coeficiente de determinacin se interpreta como el porcentaje de variacin de la variable dependiente

El coeficiente de determinacin, r2 - la proporcin de la variacin total en la variable dependiente Y que est explicada por o se debe a la variacin en la variable independiente X. El coeficiente de determinacin es el cuadrado del coeficiente de correlacin, y toma valores de 0 a 1. Ejemplo: Dan Ireland, presidente de la sociedad de alumnos de la Universidad de Toledo, est preocupado por el costo de los libros. Para tener un panorama del problema elige una muestra de 8 libros de venta en la librera. Decide estudiar la relacin entre el nmero de pginas del libro y el costo. Calcule el coeficiente de correlacin.

r =.614 (verifique) Pruebe la hiptesis de que no existe correlacin en la poblacin. Use .02 de nivel de significancia. Paso 1: H0 la correlacin en la poblacin es cero. H1 la correlacin en la poblacin es distinta de cero. Paso 2: H0 se rechaza si t>3.143 o si t 2 es

Dnde:

El coeficiente a representa el grado de disminucin de peso, un factor de suavizado constante entre 0 y 1. Un descuentos a mayor edad observaciones ms rpido. Por otra parte, a se puede expresar en trminos de perodos de tiempo N, donde a = 2 / (N +1). Por ejemplo, N = 19 es equivalente a a = 0.1. La vida media de los pesos (el intervalo en el que la disminucin de peso por un factor de dos) es de aproximadamente N / 2,8854 (a menos de 1% si N> 5). Y t es la observacin en un perodo de tiempo t. S t es el valor de la EMA, en cualquier perodo de tiempo t.

S 1 es indefinido. S 2 puede ser inicializado en un nmero de maneras diferentes, por lo general mediante el establecimiento de S 2 Y 1, aunque existen otras tcnicas, tales como el establecimiento de S 2 a un promedio de los primeros 4 o 5 observaciones. La importancia de S 2 de inicializacin de efecto sobre la media mvil resultante depende de a, a valores menores que la eleccin de los valores de S 2 relativamente ms importante a ms grande que, desde un a descuentos superiores mayores observaciones ms rpido. Esta formulacin est de acuerdo con Hunter (1986).

Esta es una suma infinita de trminos disminuyendo. Los perodos de N en un N-da EMA slo especificar el factor a. N no es un punto de parada para el clculo en la forma en que se encuentra en un SMA o WMA. Para N suficientemente grande, la primera de datos N puntos en un EMA representan alrededor del 86% del peso total en el clculo:

La frmula de energa por encima de da un valor de partida para un da determinado, despus de lo cual los primeros das se muestra la frmula puede ser aplicada a los sucesivos. La cuestin de hasta qu punto volver a ir para un valor inicial depende, en el peor de los casos, en los datos. Si hay grandes valores de los precios p en los datos de edad, entonces van a tener un efecto sobre el total, aunque su ponderacin es muy pequea. Si uno asume los precios no varan demasiado violentamente a continuacin, slo la ponderacin puede ser considerada. El peso se omite por detener despus de los trminos k es

Modelos aditivos y sumativos para expresar una serie de tiempo


Los mtodos descritos en esta seccin representan una generalizacin de la regresin mltiple (que es un caso especial de modelos lineales generales). En concreto, en la regresin lineal, un ajuste lineal por mnimos cuadrados se calcula para un conjunto de variables explicativas o X, para predecir una variable dependiente Y. La ecuacin de regresin lineal conocido con predictores m, para predecir una variable dependiente Y, se puede plantear como: Y = b 0 + b 1 X * 1 +... M + a * b * X m Donde Y representa el (los valores pronosticados de la) variable dependiente, X 1 a m X representan los valores de m para las variables de prediccin, y b 0 y b 1 a m b son los coeficientes de regresin estimados por regresin mltiple. Una generalizacin del modelo

de regresin mltiple sera la de mantener el carcter aditivo de la modelo, pero para sustituir los trminos simples de la ecuacin lineal b * i X i con f i (X i) donde f i es una funcin no paramtrica del predictor X i. En otras palabras, en lugar de un coeficiente nico para cada variable (trmino aditivo) en el modelo, en los modelos de un aditivo sin especificar (no paramtrica) la funcin se estima para cada predictor, para lograr la mejor prediccin de los valores de las variables dependientes. INDICES ESTACIONALES EN UNA SERIE DE TIEMPO Medida del efecto estacional en una serie de tiempo. Un ndice estacional arriba de 1 indica un efecto positivo (el dato mayor que el marcado por la tendencia), un ndice estacional de 1 indica que no hay efecto estacional y un ndice estacional menor que 1 indica un efecto negativo (el dato es menor que el indicado por la tendencia). Las fluctuaciones estacionales son variaciones que se repiten regularmente en un periodo de un ao. Existen 2 objetivos generales para aislar el componente estacional de una serie cronolgica. El primero es eliminar ese patrn a fin de estudiar las fluctuaciones cclicas. La segunda finalidad es identificar factores estacionales, de esta manera que se puedan considerar en la toma de decisiones. Por ejemplo si una compaa productora se da cuenta de que existen fluctuaciones estacionales en la demanda de un determinado, producto, es posible que desee ajustar sus presupuestos, mano de obra e inventarios, teniendo esto en mente. Por lo general tales ajustes resultan muy costosos. Por ejemplo, compaa puede buscar un producto complementario. El cual presente variaciones estacionales en su de manda opuesta alas del mismo. La demanda de equipo de calefaccin. Para probar y encarar los patrones estacionales, es necesario identificar y determinar primero la extensin de estas variaciones. La Tcnica ms difundida para el anlisis estacional es el mtodo de la razn al promedio mvil. NUMEROS INDICES Un nmero ndice es un nmero que expresa la variacin relativa del precio, la cantidad o el valor, en comparacin con un periodo base. Ejemplo La oficina de censo de estados unidos informa que el nmero de granjas de ese pas disminuyo de 3157857, en 1964, a aproximadamente 1200000, en el ao 2000. Cul es el ndice correspondiente a la cantidad de granjas en el ao 2000, con base en el nmero en 1964? El ndice es 38.0 que se obtiene de: Cantidad de granjas en el ao 2000; 1200000 P = ---------------------------------------------- (100) = ----------------- (100) = 38.0 Cantidad de granjas en 1964; 3157857

Esto indica que la cantidad de granjas en 2000 era 38% de la cantidad de granjas en 1964. En otras palabras, la cantidad de granjas en estados unidos disminuy 62.0% (lo cual proviene de 100-38) en ese periodo. El ndice tambin sirve para comparar un artculo con otro. En 1999 la poblacin en la propicia de Colombia britnica era de 4023100 y en Ontario era 11513800. Cul es la proporcin de la poblacin en Columbia britnica comparada con la poblacin de Ontario? El ndice de poblacin de Columbia britnica es 34.9 que se obtiene mediante la formula Poblacin de Columbia britnica 4023100 P = ------------------------------------------- (100) = --------------- (100) = 34.9 Poblacin de Ontario 11513800 Por qu convertir los datos en ndices? Un ndice es una forma de expresar una variacin en un grupo heterogneo de elementos. Los ndices nos permiten expresar una variacin en precio, cantidad o valor, como un porcentaje. Por ejemplo, el ndices de precios al consumidor (IPC) abarca, una serie de artculos, incluyendo pelotas de golf, podadoras de csped, hamburguesas, servicios funerarios y honorarios de dentistas Los precios se expresa en bolvares por libra, caja, yarda, y otras muchas unidades. Convertir los datos en ndices tambin facilita la evaluacin de la tendencia en una serie compuesta por nmeros excepcionalmente grandes. INDICES PONDERADOS Y NO PONDERADOS

ndices No Ponderados: En muchos casos se desea combinar varios elementos y elaborar un ndice para comparar el costo de un grupo de artculos en dos diferentes periodos. Por ejemplo, si se desea un ndice para elementos relacionados con los gastos de uso y mantenimiento de un automvil, los elementos del ndice podran incluir llantas, cambios de aceites y precios de la gasolina. O tal vez interese un ndice de gastos de estudiantes universitario. Este ndice podra comprender el costo de libros, colegiatura, vivienda, alimentacin y entretenimiento. Existen muchas maneras de combinar los elementos para determinar el ndice. ndices Ponderados: Existen dos mtodos para calcular un ndice de precios ponderados: el mtodo de Laspeyres y el de Paasche, los cuales difieren solo en el periodo utilizado para la ponderacin. El ndice De Precios De Laspeyres

Emplea las ponderaciones del periodo base; es decir, los precios y las cantidades originales de los artculos comparados se utilizan para hallar el cambio porcentual respecto a un periodo o intervalo de tiempo, tanto en precio como en cantidad consumida, dependiendo

del problema. El mtodo de paasches utiliza las ponderaciones del ao actual para el denominador del ndice ponderado.

ndice De Precios De Paasche

El ndice de Paasche es una alternativa. El procedimiento es similar, pero en vez de usar los pesos periodos base, se emplean los pesos del ao actual.

Cmo se decide que ndice usar? Cundo es ms apropiado el de Laspeyres, y cuando el de Paasche?

Laspeyres

Ventajas requiere datos de cantidad solo del periodo base. Esto permite una mejor comparacin conforme pasa el tiempo. Los cambios en el ndice pueden atribuirse a cambios en el precio. Desventajas no refleja cambios en los patrones de compra conforme pasa el tiempo. Adems, podra ponderar en ms los artculos cuyos precios aumentan.

Paasche

Ventajas debido a que se utilizan cantidades del periodo actual, refleja los hbitos actuales de compra. Desventajas requiere datos de cantidad de cada ao, lo cual puede ser difcil de obtener. Debido a que se emplean diferentes cantidades cada ao, es imposible atribuir cambios en el ndice nicamente a cambios en el precio. Tienden a ponderar en ms los artculos cuyos precios han bajado. Requieren que los precios se calculen cada ao.

ndices de precios al consumidor

El (IPC) mide los cambios en los precios de una canasta bsica fija de artculos y servicios en el mercado, de un periodo a otro. El IPC cumple con varias funciones importantes. Permite a los consumidores determinar el grado de deterioro de su poder adquisitivo por el aumento de los precios. A este respecto es un criterio para la revisin de sueldos y salarios, pensiones y otros tipos de ingresos, a fin de mantener el paso con los cambios en los precios. Igualmente importante, es un indicador econmico de la tasa de inflacin. El ndice incluye cerca de 400 elementos, y unos 250 inspectores recopilan mensualmente los datos de los precios. Los precios se obtienen de ms de 21000 establecimientos de comercio al menudeo, y de 60000 unidades habitacionales en 91 reas urbanas del pas. Los precios de cunas para bebes, pan, cerveza, cigarros, gasolina, cortes de cabellos, tasa de inters hipotecario, honorarios mdico, impuestos y cargos por uso de salas para cirugas, son solo algunos de las elementos que se incluyen en lo que se ha dominado con frecuencia canasta bsica de bienes y servicios que se consumen. Usos especiales del ndice de precios al consumidor:

Ingreso real: Determina el poder de compra de la unidad monetaria, y para evaluar el aumento del costo de vida.

Poder adquisitivo del dinero:

Ventas deflacionadas: Importante para mostrar la tendencia en ventas reales.

Distribucin normal
Saltar a: navegacin, bsqueda Distribucin normal

La lnea verde corresponde a la distribucin normal estndar Funcin de densidad de probabilidad

Funcin de distribucin de probabilidad

Parmetros

Dominio Funcin de densidad (pdf)

Funcin de distribucin (cdf)

Media Mediana Moda Varianza Coeficiente de simetra Curtosis Entropa Funcin generadora de momentos (mgf) Funcin caracterstica 0 0

En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece aproximada en fenmenos reales. La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro estadstico. Esta curva se conoce como campana de Gauss y es el grfico de una funcin gaussiana. La importancia de esta distribucin radica en que permite modelar numerosos fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables

incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observacin se obtiene como la suma de unas pocas causas independientes. De hecho, la estadstica es un modelo matemtico que slo permite describir un fenmeno, sin explicacin alguna. Para la explicacin causal es preciso el diseo experimental, de ah que al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional. La distribucin normal tambin es importante por su relacin con la estimacin por mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos. Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la normal son:

caracteres morfolgicos de individuos como la estatura; caracteres fisiolgicos como el efecto de un frmaco; caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de individuos; caracteres psicolgicos como el cociente intelectual; nivel de ruido en telecomunicaciones; errores cometidos al medir ciertas magnitudes; etc.

La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las medias muestrales es aproximadamente normal, cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal.1 Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida en estadstica y muchos tests estadsticos estn basados en una supuesta "normalidad". En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de probabilidad continuas y discretas.
o

Historia

Abraham de Moivre, descubridor de la distribucin normal

La distribucin normal fue presentada por primera vez por Abraham de Moivre en un artculo del ao 1733,2 que fue reimpreso en la segunda edicin de su The Doctrine of Chances, de 1738, en el contexto de cierta aproximacin de la distribucin binomial para grandes valores de n. Su resultado fue ampliado por Laplace en su libro Teora analtica de las probabilidades (1812), y en la actualidad se llama Teorema de De Moivre-Laplace. Laplace us la distribucin normal en el anlisis de errores de experimentos. El importante mtodo de mnimos cuadrados fue introducido por Legendre en 1805. Gauss, que afirmaba haber usado el mtodo desde 1794, lo justific rigurosamente en 1809 asumiendo una distribucin normal de los errores. El nombre de Gauss se ha asociado a esta distribucin porque la us con profusin cuando analizaba datos astronmicos3 y algunos autores le atribuyen un descubrimiento independiente del de De Moivre.4 Esta atribucin del nombre de la distribucin a una persona distinta de su primer descubridor es un claro ejemplo de la Ley de Stigler. El nombre de "campana" viene de Esprit Jouffret que us el trmino "bell surface" (superficie campana) por primera vez en 1872 para una distribucin normal bivariante de componentes independientes. El nombre de "distribucin normal" fue otorgado independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis hacia 1875.[cita requerida] A pesar de esta terminologa, otras distribuciones de probabilidad podran ser ms apropiadas en determinados contextos; vase la discusin sobre ocurrencia, ms abajo.

Definicin formal

Hay varios modos de definir formalmente una distribucin de probabilidad. La forma ms visual es mediante su funcin de densidad. De forma equivalente, tambin pueden darse para su definicin la funcin de distribucin, los momentos, la funcin caracterstica y la funcin generatriz de momentos, entre otros.
Funcin de densidad

Se dice que una variable aleatoria continua X sigue una distribucin normal de parmetros y y se denota X~N(, ) si su funcin de densidad est dada por:

donde (mu) es la media y (sigma) es la desviacin estndar (2 es la varianza).5 Se llama distribucin normal "estndar" a aqulla en la que sus parmetros toman los valores = 0 y = 1. En este caso la funcin de densidad tiene la siguiente expresin:

Su grfica se muestra a la derecha y con frecuencia se usan tablas para el clculo de los valores de su distribucin.

Funcin de distribucin

La funcin de distribucin de la distribucin normal est definida como sigue:

Por tanto, la funcin de distribucin de la normal estndar es:

Esta funcin de distribucin puede expresarse en trminos de una funcin especial llamada funcin error de la siguiente forma:

y la propia funcin de distribucin puede, por consiguiente, expresarse as:

El complemento de la funcin de distribucin de la normal estndar,

, se denota

con frecuencia , y es referida, a veces, como simplemente funcin Q, especialmente en textos de ingeniera.6 7 Esto representa la cola de probabilidad de la distribucin

gaussiana. Tambin se usan ocasionalmente otras definiciones de la funcin Q, las cuales son todas ellas transformaciones simples de .8 La inversa de la funcin de distribucin de la normal estndar (funcin cuantil) puede expresarse en trminos de la inversa de la funcin de error:

y la inversa de la funcin de distribucin puede, por consiguiente, expresarse como:

Esta funcin cuantil se llama a veces la funcin probit. No hay una primitiva elemental para la funcin probit. Esto no quiere decir meramente que no se conoce, sino que se ha probado la inexistencia de tal funcin. Existen varios mtodos exactos para aproximar la funcin cuantil mediante la distribucin normal (vase funcin cuantil). Los valores (x) pueden aproximarse con mucha precisin por distintos mtodos, tales como integracin numrica, series de Taylor, series asintticas y fracciones continuas.
Lmite inferior y superior estrictos para la funcin de distribucin

Para grandes valores de x la funcin de distribucin de la normal estndar prxima a 1 y est muy cerca de 0. Los lmites elementales

es muy

en trminos de la densidad son tiles. Usando el cambio de variable v = u/2, el lmite superior se obtiene como sigue:

De forma similar, usando

y la regla del cociente,

Resolviendo para
Funciones generadoras

proporciona el lmite inferior.

Funcin generadora de momentos

La funcin generadora de momentos se define como la esperanza de e(tX). Para una distribucin normal, la funcin generadora de momentos es:

como puede comprobarse completando el cuadrado en el exponente.

Funcin caracterstica

La funcin caracterstica se define como la esperanza de eitX, donde i es la unidad imaginaria. De este modo, la funcin caracterstica se obtiene reemplazando t por it en la funcin generadora de momentos. Para una distribucin normal, la funcin caracterstica es9

Propiedades
Algunas propiedades de la distribucin normal son:
1. Es simtrica respecto de su media, ;

Distribucin de probabilidad alrededor de la media en una distribucin N(, ). 2. La moda y la mediana son ambas iguales a la media, ; 3. Los puntos de inflexin de la curva se dan para x = y x = + . 4. Distribucin de probabilidad en un entorno de la media: 1. en el intervalo [ - , + ] se encuentra comprendida, aproximadamente, el 68,26% de la distribucin; 2. en el intervalo [ - 2, + 2] se encuentra, aproximadamente, el 95,44% de la distribucin; 3. por su parte, en el intervalo [ -3, + 3] se encuentra comprendida, aproximadamente, el 99,74% de la distribucin. Estas propiedades son de gran utilidad para el establecimiento de intervalos de confianza. Por otra parte, el hecho de que prcticamente la totalidad de la distribucin se encuentre a tres desviaciones tpicas de la media justifica los lmites de las tablas empleadas habitualmente en la normal estndar. 5. Si X ~ N(, 2) y a y b son nmeros reales, entonces (aX + b) ~ N(a+b, a22). 6. Si X ~ N(x, x2) e Y ~ N(y, y2) son variables aleatorias normales independientes, entonces: 2 2 o Su suma est normalmente distribuida con U = X + Y ~ N(x + y, x + y ) (demostracin). Recprocamente, si dos variables aleatorias independientes tienen una suma normalmente distribuida, deben ser normales (Teorema de Crmer). o Su diferencia est normalmente distribuida con
o o

. Si las varianzas de X e Y son iguales, entonces U y V son independientes entre s. La divergencia de Kullback-Leibler,

7. Si e son variables aleatorias independientes normalmente distribuidas, entonces: o Su producto sigue una distribucin con densidad dada por

donde de segundo tipo.


o

es una funcin de Bessel modificada

Su cociente sigue una distribucin de Cauchy con . De este modo la distribucin de Cauchy es un tipo especial de distribucin cociente. son variables normales estndar independientes, entonces sigue una distribucin con n grados de libertad. son variables normales estndar independientes, entonces la media y la varianza muestral

8. Si 9. Si

muestral

son independientes. Esta propiedad caracteriza a las distribuciones normales y contribuye a explicar por qu el testF no es robusto respecto a la no-normalidad). Estandarizacin de variables aleatorias normales

Como consecuencia de la Propiedad 1; es posible relacionar todas las variables aleatorias normales con la distribucin normal estndar. Si ~ , entonces

es una variable aleatoria normal estndar:

La transformacin de una distribucin X ~ N(, ) en una N(0, 1) se llama normalizacin, estandarizacin o tipificacin de la variable X. Una consecuencia importante de esto es que la funcin de distribucin de una distribucin normal es, por consiguiente,

A la inversa, si

es una distribucin normal estndar,

, entonces

es una variable aleatoria normal tipificada de media

y varianza

La distribucin normal estndar est tabulada (habitualmente en la forma de el valor de la funcin de distribucin ) y las otras distribuciones normales pueden obtenerse como transformaciones simples, como se describe ms arriba, de la distribucin estndar. De este modo se pueden usar los valores tabulados de la funcin de distribucin normal estndar para encontrar valores de la funcin de distribucin de cualquier otra distribucin normal.
Momentos

Los primeros momentos de la distribucin normal son:


Nmero 0 1 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 0 1 Momento 1 0 Momento central Cumulante

Todos los cumulantes de la distribucin normal, ms all del segundo, son cero. Los momentos centrales de orden superior (2k con = 0) vienen dados por la frmula

El Teorema del Lmite Central Artculo principal: Teorema del lmite central.

Grfica de la funcin de distribucin de una normal con = 12 y = 3, aproximando la funcin de distribucin de una binomial con n = 48 y p = 1/4

El Teorema del lmite central establece que bajo ciertas condiciones (como pueden ser independientes e idnticamente distribuidas con varianza finita), la suma de un gran nmero de variables aleatorias se distribuye aproximadamente como una normal. La importancia prctica del Teorema del lmite central es que la funcin de distribucin de la normal puede usarse como aproximacin de algunas otras funciones de distribucin. Por ejemplo:

Una distribucin binomial de parmetros n y p es aproximadamente normal para grandes valores de n, y p no demasiado cercano a 1 0 (algunos libros recomiendan usar esta aproximacin slo si np y n(1 p) son ambos, al menos, 5; en este caso se debera aplicar una correccin de continuidad). La normal aproximada tiene parmetros = np, 2 = np(1 p). Una distribucin de Poisson con parmetro es aproximadamente normal para grandes valores de . La distribucin normal aproximada tiene parmetros = 2 = .

La exactitud de estas aproximaciones depende del propsito para el que se necesiten y de la tasa de convergencia a la distribucin normal. Se da el caso tpico de que tales aproximaciones son menos precisas en las colas de la distribucin. El Teorema de BerryEssen proporciona un lmite superior general del error de aproximacin de la funcin de distribucin.
Divisibilidad infinita Artculo principal: Divisibilidad infinita (probabilidad).

Las normales tienen una distribucin de probabilidad infinitamente divisible: Para una distribucin normal X de media y varianza 2 0, es posible encontrar n variables aleatorias independientes {X1,...,Xn} cada una con distribucin normal de media /n y varianza 2/n dado que la suma X1 + . . . + Xn de estas n variables aleatorias

tenga esta especfica distribucin normal (para verificarlo, sese la funcin caracterstica de convolucin y la induccin matemtica).
Estabilidad

Las distribuciones normales son estrictamente estables.

Desviacin tpica e intervalos de confianza


Alrededor del 68% de los valores de una distribucin normal estn a una distancia < 1 (desviacin tpica) de la media, ; alrededor del 95% de los valores estn a dos desviaciones tpicas de la media y alrededor del 99,7% estn a tres desviaciones tpicas de la media. Esto se conoce como la "regla 68-95-99,7" o la "regla emprica". Para ser ms precisos, el rea bajo la curva campana entre n y + n en trminos de la funcin de distribucin normal viene dada por

donde erf es la funcin error. Con 12 decimales, los valores para los puntos 1-, 2-, hasta 6- son:

1 0,682689492137 2 0,954499736104 3 0,997300203937 4 0,999936657516 5 0,999999426697

6 0,999999998027

La siguiente tabla proporciona la relacin inversa de mltiples correspondientes a unos pocos valores usados con frecuencia para el rea bajo la campana de Gauss. Estos valores son tiles para determinar intervalos de confianza para los niveles especificados basados en una curva normalmente distribuida (o estimadores asintticamente normales):

0,80 0,90 0,95 0,98 0,99 0,995 0,998 0,999 0,9999 0,99999

1,28155 1,64485 1,95996 2,32635 2,57583 2,80703 3,09023 3,29052 3,8906 4,4172

donde el valor a la izquierda de la tabla es la proporcin de valores que caern en el intervalo dado y n es un mltiplo de la desviacin tpica que determina la anchura de el intervalo.
Forma familia exponencial

La distribucin normal tiene forma de familia exponencial biparamtrica con dos parmetros naturales, y 1/2, y estadsticos naturales X y X2. La forma cannica tiene como parmetros y y estadsticos suficientes y

Distribucin normal compleja

Considrese la variable aleatoria compleja gaussiana

donde X e Y son variables gaussianas reales e independientes con igual varianza funcin de distribucin de la variable conjunta es entonces

. La

Como compleja Z es

, la funcin de distribucin resultante para la variable gaussiana

Distribuciones relacionadas

es una distribucin de Rayleigh si y

donde

son dos distribuciones normales independientes.

es una distribucin con grados de libertad si para y son independientes. es una distribucin de Cauchy si para independientes. y

donde

son dos distribuciones normales

es una distribucin log-normal si Relacin con una distribucin estable: si .

y entonces

Distribucin normal truncada. si entonces truncando X por debajo de y por encima de dar lugar a una variable aleatoria de media donde

es la funcin de densidad de una variable normal estndar. , entonces tiene

Si es una variable aleatoria normalmente distribuida e una distribucin normal doblada.

Estadstica descriptiva e inferencial


Resultados

De la distribucin normal se derivan muchos resultados, incluyendo rangos de percentiles ("percentiles" o "cuantiles"), curvas normales equivalentes, stanines, z-scores, y T-scores. Adems, un nmero de procedimientos de estadsticos de comportamiento estn basados en la asuncin de que esos resultados estn normalmente distribuidos. Por ejemplo, el test de Student y el anlisis de varianza (ANOVA) (vase ms abajo). La gradacin de la curva campana asigna grados relativos basados en una distribucin normal de resultados.
Tests de normalidad Artculo principal: Test de normalidad.

Los tests de normalidad se aplican a conjuntos de datos para determinar su similitud con una distribucin normal. La hiptesis nula es, en estos casos, si el conjunto de datos es similar a una distribucin normal, por lo que un P-valor suficientemente pequeo indica datos no normales.

Prueba de Kolmogrov-Smirnov Test de Lilliefors Test de AndersonDarling Test de RyanJoiner Test de ShapiroWilk Normal probability plot (rankit plot) Test de JarqueBera Test omnibs de Spiegelhalter

Estimacin de parmetros Estimacin de parmetros de mxima verosimilitud Vase tambin: Mxima verosimilitud.

Supngase que

son independientes y cada una est normalmente distribuida con media y varianza 2 > 0. En trminos estadsticos los valores observados de estas n variables aleatorias constituyen una "muestra de tamao n de una poblacin normalmente distribuida. Se desea estimar la media poblacional y la desviacin tpica poblacional , basndose en las valores observados de esta muestra. La funcin de densidad conjunta de estas n variables aleatorias independientes es

Como funcin de y , la funcin de verosimilitud basada en las observaciones X1, ..., Xn es

con alguna constante C > 0 (de la cual, en general, se permitira incluso que dependiera de X1, ..., Xn, aunque desapareciera con las derivadas parciales de la funcin de logverosimilitud respecto a los parmetros tenidos en cuenta, vase ms abajo). En el mtodo de mxima verosimilitud, los valores de y que maximizan la funcin de verosimilitud se toman como estimadores de los parmetros poblacionales y . Habitualmente en la maximizacin de una funcin de dos variables, se podran considerar derivadas parciales. Pero aqu se explota el hecho de que el valor de que maximiza la funcin de verosimilitud con fijo no depende de . No obstante, encontramos que ese valor de , entonces se sustituye por en la funcin de verosimilitud y finalmente encontramos el valor de que maximiza la expresin resultante. Es evidente que la funcin de verosimilitud es una funcin decreciente de la suma

As que se desea el valor de que minimiza esta suma. Sea

la media muestral basada en las n observaciones. Ntese que

Slo el ltimo trmino depende de y se minimiza por

Esta es la estimacin de mxima verosimilitud de basada en las n observaciones X1, ..., Xn. Cuando sustituimos esta estimacin por en la funcin de verosimilitud, obtenemos

Se conviene en denotar la "log-funcin de verosimilitud", esto es, el logaritmo de la funcin de verosimilitud, con una minscula , y tenemos

entonces

Esta derivada es positiva, cero o negativa segn 2 est entre 0 y

o sea igual a esa cantidad, o mayor que esa cantidad. (Si hay solamente una observacin, lo que significa que n = 1, o si X1 = ... = Xn, lo cual slo ocurre con probabilidad cero, entonces por esta frmula, refleja el hecho de que en estos casos la funcin de verosimilitud es ilimitada cuando decrece hasta cero.) Consecuentemente esta media de cuadrados de residuos es el estimador de mxima verosimilitud de 2, y su raz cuadrada es el estimador de mxima verosimilitud de basado en las n observaciones. Este estimador es sesgado, pero tiene un menor error medio al cuadrado que el habitual estimador insesgado, que es n/(n 1) veces este estimador.
Sorprendente generalizacin

La derivada del estimador de mxima verosimilitud de la matriz de covarianza de una distribucin normal multivariante es despreciable. Involucra el teorema espectral y la razn por la que puede ser mejor para ver un escalar como la traza de una matriz 11 que como un mero escalar. Vase estimacin de la covarianza de matrices.
Estimacin insesgada de parmetros

El estimador de mxima verosimilitud de la media poblacional , es un estimador insesgado de la media poblacional. El estimador de mxima verosimilitud de la varianza es insesgado si asumimos que la media de la poblacin es conocida a priori, pero en la prctica esto no ocurre. Cuando disponemos de una muestra y no sabemos nada de la media o la varianza de la poblacin de la que se ha extrado, como se asuma en la derivada de mxima verosimilitud de arriba, entonces el estimador de mxima verosimilitud de la varianza es sesgado. Un estimador insesgado de la varianza 2 es la cuasi varianza muestral:

que sigue una distribucin Gamma cuando las Xi son normales independientes e idnticamente distribuidas:

con media

y varianza

La estimacin de mxima verosimilitud de la desviacin tpica es la raz cuadrada de la estimacin de mxima verosimilitud de la varianza. No obstante, ni sta, ni la raz cuadrada de la cuasivarianza muestral proporcionan un estimador insesgado para la desviacin tpica

(vase estimacin insesgada de la desviacin tpica para una frmula particular para la distribucin normal.

Incidencia
Las distribuciones aproximadamente normales aparecen por doquier, como queda explicado por el teorema central del lmite. Cuando en un fenmeno se sospecha la presencia de un gran nmero de pequeas causas actuando de forma aditiva e independiente es razonable pensar que las observaciones sern "normales". Hay mtodos estadsticos para probar empricamente esta asuncin, por ejemplo, el test de KolmogorovSmirnov. Hay causas que pueden actuar de forma multiplicativa (ms que aditiva). En este caso, la asuncin de normalidad no est justificada y es el logaritmo de la variable en cuestin el que estara normalmente distribuido. La distribucin de las variables directamente observadas en este caso se denomina log-normal. Finalmente, si hay una simple influencia externa que tiene un gran efecto en la variable en consideracin, la asuncin de normalidad no est tampoco justificada. Esto es cierto incluso si, cuando la variable externa se mantiene constante, las distribuciones marginales resultantes son, en efecto, normales. La distribucin completa ser una superposicin de variables normales, que no es en general normal. Ello est relacionado con la teora de errores (vase ms abajo). A continuacin se muestran una lista de situaciones que estaran, aproximadamente, normalmente distribuidas. Ms abajo puede encontrarse una discusin detallada de cada una de ellas:

En problemas de recuento, donde el teorema central del lmite incluye una aproximacin de discreta a continua y donde las distribuciones infinitamente divisibles y descomponibles estn involucradas, tales como: o variables aleatorias binomiales, asociadas con preguntas s/no; o variables aleatorias de Poisson, asociadas con eventos raros; En medidas fisiolgicas de especmenes biolgicos: o El logaritmo de las medidas del tamao de tejidos vivos (longitud, altura, superficie de piel, peso); o La longitud de apndices inertes (pelo, garras, rabos, dientes) de especmenes biolgicos en la direccin del crecimento; o Otras medidas fisiolgicas podran estar normalmente distribuidas, aunque no hay razn para esperarlo a priori; Se asume con frecuencia que los errores de medida estn normalmente distribuidos y cualquier desviacin de la normalidad se considera una cuestin que debera explicarse; Variables financieras, en el modelo Black-Scholes: o Cambios en el logaritmo de

Cambios en el logaritmo de tasas de cambio, ndices de precios, ndices de existencias de mercado; estas variables se comportan como el inters compuesto, no como el inters simple, por tanto, son multiplicativas;
Mientras que el modelo Black-Scholes presupone normalidad, en realidad estas variables exhiben colas pesadas, como puede verse en crash de las existencias de mercado; o Otras variables financieras podran estar normalmente distribuidas, pero no hay razn para esperarlo a priori; Intensidad de la luz: o La intensidad de la luz lser est normalmente distribuida; o La luz trmica tiene una distribucin de Bose-Einstein en escalas de tiempo muy breves y una distribucin normal en grandes escalas de tiempo debido al teorema central del lmite.
o

Es relevante para la biologa y la economa el hecho de que los sistemas complejos tienden a mostrar la ley de potencias ms que normal.
Recuento de fotones

La intensidad de la luz de una sola fuente vara con el tiempo, as como las fluctuaciones trmicas que pueden observarse si la luz se analiza a una resolucin suficientemente alta. La mecnica cuntica interpreta las medidas de la intensidad de la luz como un recuento de fotones, donde la asuncin natural es usar la distribucin de Poisson. Cuando la intensidad de la luz se integra a lo largo de grandes periodos de tiempo mayores que el tiempo de coherencia, la aproximacin Poisson - Normal es apropiada.
Medida de errores

La normalidad es la asuncin central de la teora matemtica de errores. De forma similar en el ajuste de modelos estadstico, un indicador de la bondad del ajuste es que el error residual (as es como se llaman los errores en esta circunstancia) sea independiente y normalmente distribuido. La asuncin es que cualquier desviacin de la normalidad necesita ser explicada. En ese sentido, en ambos, ajuste de modelos y teora de errores, la normalidad es la nica observacin que no necesita ser explicada, sino que es esperada. No obstante, si los datos originales no estn normalmente distribuidos (por ejemplo, si siguen una distribucin de Cauchy, entonces los residuos tampoco estarn normalmente distribuidos. Este hecho es ignorado habitualmente en la prctica. Las medidas repetidas de la misma cantidad se espera que cedan el paso a resultados que estn agrupados entorno a un valor particular. Si todas las fuentes principales de errores se han tomado en cuenta, se asume que el error que queda debe ser el resultado de un gran nmero de muy pequeos y aditivos efectos y, por consiguiente, normal. Las desviaciones de la normalidad se interpretan como indicaciones de errores sistemticos que no han sido tomados en cuenta. Puede debatirse si esta asuncin es vlida.

Una famosa observacin atribuida a Gabriel Lippmann dice:[cita requerida] Todo el mundo cree en la ley normal de los errores: los matemticos, porque piensan que es un hecho experimental; y los experimentadores, porque suponen que es un teorema matemtico Otra fuente podra ser Henri Poincar.
Caractersticas fsicas de especmenes biolgicos

Los tamaos de los animales adultos siguen aproximadamente una distribucin log-normal. La evidencia y explicacin basada en modelos de crecimiento fue publicada por primera vez en el libro Problemas de crecimiento relativo, de 1932, por Julian Huxley. Las diferencias de tamao debido a dimorfismos sexuales u otros polimorfismos de insectos, como la divisin social de las abejas en obreras, znganos y reinas, por ejemplo, hace que la distribucin de tamaos se desve hacia la lognormalidad. La asuncin de que el tamao lineal de los especmenes biolgicos es normal (ms que lognormal) nos lleva a una distribucin no normal del peso (puesto que el peso o el volumen es proporcional al cuadrado o el cubo de la longitud y las distribuciones gaussianas slo mantienen las transformaciones lineales). A la inversa, asumir que el peso sigue una distribucin normal implica longitudes no normales. Esto es un problema porque, a priori, no hay razn por la que cualquiera de ellas (longitud, masa corporal u otras) debera estar normalmente distribuida. Las distribuciones lognormales, por otro lado, se mantienen entre potencias, as que el "problema" se desvanece si se asume la lognormalidad. Por otra parte, hay algunas medidas biolgicas donde se asume normalidad, tales como la presin sangunea en humanos adultos. Esta asuncin slo es posible tras separar a hombres y mujeres en distintas poblaciones, cada una de las cuales est normalmente distribuida.

Variables financieras

El modelo normal de movimiento de activos no incluye movimientos extremos tales como quiebras financieras.

Ya en 1900 Louis Bachelier propuso representar los precios de cambio usando la distribucin normal. Esta aproximacin se ha modificado desde entonces ligeramente. A causa de la naturaleza multiplicativa del inters compuesto, los indicadores financieros como valores de mercado y precios de las materias primas exhiben un "comportamiento multiplicativo". Como tales, sus cambios peridicos (por ejemplo, cambios anuales) no son normales, sino lognormales. Esta es todava la hiptesis ms comnmente aceptada en economa. No obstante, en realidad las variables financieras exhiben colas pesadas y as, la asuncin de normalidad infravalora la probabilidad de eventos extremos como quiebras financieras. Se han sugerido correcciones a este modelo por parte de matemticos como Benot Mandelbrot, quien observ que los cambios en el logaritmo durante breves periodos de tiempo (como un da) se aproximan bien por distribuciones que no tienen una varianza finita y, por consiguiente, el teorema central del lmite no puede aplicarse. Ms an, la suma de muchos de tales cambios sigue una distribucin de log-Levy.
Distribuciones en tests de inteligencia

A veces, la dificultad y nmero de preguntas en un test de inteligencia se selecciona de modo que proporcionen resultados normalmente distribuidos. Ms an, las puntuaciones "en crudo" se convierten a valores que marcan el cociente intelectual ajustndolas a la distribucin normal. En cualquier caso se trata de un resultado causado deliberadamente por la construccin del test o de una interpretacin de las puntuaciones que sugiere

normalidad para la mayora de la poblacin. Sin embargo, la cuestin acerca de si la inteligencia en s est normalmente distribuida es ms complicada porque se trata de una variable latente y, por consiguiente, no puede observarse directamente.
Ecuacin de difusin

La funcin de densidad de la distribucin normal est estrechamente relacionada con la ecuacin de difusin (homognea e istropa) y, por tanto, tambin con la ecuacin de calor. Esta ecuacin diferencial parcial describe el tiempo de evolucin de una funcin de densidad bajo difusin. En particular, la funcin de densidad de masa

para la distribucin normal con esperanza 0 y varianza t satisface la ecuacin de difusin:

Si la densidad de masa para un tiempo t = 0 viene dada por la delta de Dirac, lo cual significa, esencialemente que toda la masa est inicialmente concentrada en un punto, entonces la funcin de densidad de masa en el tiempo t tendr la forma de la funcin de densidad de la normal, con varianza creciendo linealmente con t. Esta conexin no es coincidencia: la difusin se debe a un movimiento Browniano que queda descrito matemticamente por un proceso de Wiener, y tal proceso en un tiempo t tambin resultar normal con varianza creciendo linealmente con t'. Ms generalmente, si la densidad de masa inicial viene dada por una funcin (x), entonces la densidad de masa en un tiempo t vendr dada por la convolucin de y una funcin de densidad normal.

Uso en estadstica computacional


Generacin de valores para una variable aleatoria normal

Para simulaciones por ordenador es til, en ocasiones, generar valores que podran seguir una distribucin normal. Hay varios mtodos y el ms bsico de ellos es invertir la funcin de distribucin de la normal estndar. Se conocen otros mtodos ms eficientes, uno de los cuales es la transformacin de Box-Muller. Un algoritmo incluso ms rpido es el algoritmo zigurat. Ambos se discuten ms abajo. Una aproximacin simple a estos mtodos es programarlos como sigue: simplemente smense 12 desviaciones uniformes (0,1) y rstense 6 (la mitad de 12). Esto es bastante til en muchas aplicaciones. La suma de esos 12 valores sigue la distribucin de Irwin-Hall; son elegidos 12 para dar a la suma una varianza de uno, exactamente. Las desviaciones aleatorias resultantes estn limitadas al

rango (6, 6) y tienen una densidad que es una doceava seccin de una aproximacin polinomial de undcimo orden a la distribucin normal .10 El mtodo de Box-Muller dice que, si tienes dos nmeros aleatorios U y V uniformemente distribuidos en (0, 1], (por ejemplo, la salida de un generador de nmeros aleatorios), entonces X e Y son dos variables aleatorias estndar normalmente distribuidas, donde:

Esta formulacin aparece porque la distribucin con dos grados de libertad (vase la propiedad 4, ms arriba) es una variable aleatoria exponencial fcilmente generada (la cual corresponde a la cantidad lnU en estas ecuaciones). As, un ngulo elegido uniformemente alrededor de un crculo va la variable aleatoria V y un radio elegido para ser exponencial se transforman entonces en coordenadas x e y normalmente distribuidas. Un mtodo mucho ms rpido que la transformacin de Box-Muller, pero que sigue siendo exacto es el llamado algoritmo Zigurat, desarrollado por George Marsaglia. En alrededor del 97% de los casos usa slo dos nmeros aleatorios, un entero aleatorio y un uniforme aleatorio, una multiplicacin y un test-si . Slo un 3% de los casos donde la combinacin de estos dos cae fuera del "corazn del zigurat", un tipo de rechazo muestral usando logaritmos, exponenciales y nmeros aleatorios ms uniformes deberan ser empleados. Hay tambin alguna investigacin sobre la conexin entre la rpida transformacin de Hadamard y la distribucin normal, en virtud de que la transformacin emplea slo adicin y sustraccin y por el teorema central del lmite los nmeros aleatorios de casi cualquier distribucin sern transformados en la distribucin normal. En esta visin se pueden combinar una serie de transformaciones de Hadamard con permutaciones aleatorias para devolver conjuntos de datos aleatorios normalmente distribuidos.
Aproximaciones numricas de la distribucin normal y su funcin de distribucin

La funcin de distribucin normal se usa extensamente en computacin cientfica y estadstica. Por consiguiente, ha sido implementada de varias formas. Abramowitz y Stegun (1964) dan la conocida como "mejor aproximacin de Hastings" para (x) con x > 0 con un error absoluto |(x)| < 7.5108 (algoritmo 26.2.17):

donde (x) es la funcin de densidad de la distribucin normal estndar,

y las constantes son b0 = 0.2316419, b1 = 0.319381530, b2 = 0.356563782, b3 = 1.781477937, b4 = 1.821255978, b5 = 1.330274429. La Biblioteca Cientfica GNU calcula valores de la funcin de distribucin normal estndar usando aproximaciones por funciones racionales a trozos. Otro mtodo de aproximacin usa polinomios de tercer grado en intervalos.11 El artculo sobre el lenguaje de programacin bc proporciona un ejemplo de cmo computar la funcin de distribucin en GNU bc. Para una discusin ms detallada sobre cmo calcular la distribucin normal, vase la seccin 3.4.1C. de The Art of Computer Programming (El arte de la programacin por ordenador), de Knuth

Distribucin binomial

Definicin
Cuando se dispone de una expresin matemtica, es factible calcular la probabilidad de ocurrencia exacta correspondiente a cualquier resultado especfico para la variable aleatoria. La distribucin de probabilidad binomial es uno de los modelos matemticos (expresin matemtica para representar una variable) que se utiliza cuando la variable aleatoria discreta es el nmero de xitos en una muestra compuesta por n observaciones.

Propiedades
- La muestra se compone de un nmero fijo de observaciones n - Cada observacin se clasifica en una de dos categoras, mutuamente excluyentes (los eventos no pueden ocurrir de manera simultnea. Ejemplo: Una persona no puede ser de ambos sexos) y colectivamente exhaustivos (uno de los eventos debe ocurrir. Ejemplo: Al lanzar una moneda, si no ocurre cruz, entonces ocurre cara). A estas categoras se las denomina xito y fracaso. - La probabilidad de que una observacin se clasifique como xito, p, es constante de una observacin o otra. De la misma forma, la probabilidad de que una observacin se clasifique como fracaso, 1-p, es constante en todas las observaciones. - La variable aleatoria binomial tiene un rango de 0 a n Ecuacin: PX=n!X!n-X!pX1-pn-X Donde PX=Probabilidad de X xitos, dadas y n = Nmero de observaciones p = Probabilidad de xitos 1-p = Probabilidad de fracasos

X = Nmero de xitos en la muestra (= 0, 1, 2, 3, 4,) Ejemplo ilustrativo N 1 Determine P(X=5) para n = 6 y p = 0,83 Solucin: Aplicando la ecuacin se obtiene: PX=n!X!n-X!pX1-pn-X PX=5=6!5!6-5!0,8351-0,836-5=0,4018 En Excel se calcula de la siguiente manera: a) Se escribe los datos y se inserta la funcin DISTR.BINOM. Clic en Aceptar. Los argumentos de la funcin escribir como se muestra en la figura: b) Clic en Aceptar Ejemplo ilustrativo N 2 Determinar P(X=4) para n =5 y p = 0,45 Solucin:

Se puede aplicar la ecuacin para cada probabilidad, pero para ahorrar tiempo se recomienda encontrar las probabilidades con lectura en la tabla de probabilidades binomiales. Realizando la lectura en la tabla de la distribucin binomial para P(X=0) con n=5 y p=0,5 se obtiene 0,0503. Continuando con la respectivas lecturas en la tabla se obtiene: 0,2059 para P(X=1), 0,3369 para P(X=2), 0,2757 para P(X=3) y 0,1128 para P(X=4), Por lo tanto PX=4=0,0503+0,2059+0,3369+0,2757+0,1128=0,9816 Los clculos realizados en Excel se muestran en la siguiente figura:

Media de la distribucin binomial


La media de la distribucin binomial es igual a la multiplicacin del tamao de la muestra por la probabilidad de xito

Desviacin estndar de la distribucin binomial TAREA 1) Realice un organizador grfico sobre la distribucin binomial 2) Determine de manera manual y empleando Excel 2.1) Para n = 4 y p = 0,12, cunto es P(X=0)? R: 0,5997 2.2) Para n = 10 y p = 0,40, cunto es P(X=9)? R: 0,0016 2.3) Para n =10 y p = 0,50, cunto es P(X=8)? R: 0,0439 2) En una muestra de 4 pedidos, se observa el siguiente resultado: 1er pedido 2do pedido 3er pedido 4to pedido Marcado Marcado Sin marcar Marcado

2.1) Llenar la tabla de manera manual y empleando Excel

Resolver los siguientes ejercicios de manera manual y empleando Excel 2.2) Si la probabilidad de que un formato de pedido sea marcado es de 0,1, qu probabilidad existe de que haya tres formatos marcados? P(X=3) = 0,0036 2.3) Si la probabilidad de que un formato de pedido sea marcado es de 0,1, qu probabilidad existe de que haya menos de tres formatos marcados?

2.4) Si la probabilidad de que un formato de pedido sea marcado es de 0,1, qu probabilidad existe de que haya mayor de tres formatos marcados?

2.5) Si la probabilidad de que un formato de pedido sea marcado es de 0,1, qu probabilidad existe de que haya tres o ms formatos marcados (es decir, por lo menos tres)? 0,0037 2.6) Si la probabilidad de que un formato de pedido sea marcado es de 0,1, qu probabilidad existe de que haya tres o menos formatos marcados? 0,9999 2.7) Calcular la desviacin estndar 3) El 60% de profesionales leen su contrato de trabajo, incluyendo las letras pequeas. Suponga que el nmero de empleados que leen cada una de las palabras de su contrato se puede modelar utilizando la distribucin binomial. Considerando un grupo de cinco empleados: 3.1) Llenar la tabla manera manual y empleando Excel

3.2) Resolver los siguientes ejercicios de manera manual y empleando Excel. Cul es la probabilidad de que: a) Los cinco lean cada una de las palabras de su contrato 0,0778 b) Al menos tres lean cada una de las palabras de su contrato 0,6826 c) Menos de dos lean cada una de las palabras de su contrato 0,0870

3.3) Cules seran los resultados para los incisos de la pegunta 3.2) si la probabilidad de que un empleado lea cada una de las palabras de su contrato es de 0,80?. Resolver los siguientes ejercicios de manera manual y empleando Excel 0,3277; 0,9421; 0,0067 4) Un examen de estadstica de eleccin mltiple contena 20 preguntas y cada una de ellas 5 respuestas. Si un estudiante desconoca todas las respuestas y contest al azar 4.1) Cul es la probabilidad de que conteste correctamente a 5 preguntas? 0,1746 4.2) Cul es la probabilidad de que conteste correctamente a lo ms 5 preguntas? 0,8042

Distribucin de Poisson
Saltar a: navegacin, bsqueda Distribucin de Poisson

El eje horizontal es el ndice k. La funcin solamente est definida en valores enteros de k. Las lneas que conectan los puntos son solo guas para el ojo y no indican continuidad.
Funcin de probabilidad

El eje horizontal es el ndice k. Funcin de distribucin de probabilidad

Parmetros Dominio Funcin de probabilidad (fp) Funcin de distribucin (cdf) Media Mediana Moda Varianza Coeficiente de simetra Funcin gamma incompleta) (dnde es la

Curtosis

Entropa

Funcin generadora de momentos (mgf) Funcin caracterstica

En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad que ocurra un determinado nmero de eventos durante cierto periodo de tiempo. Fue descubierta por Simon-Denis Poisson, que la dio a conocer en 1838 en su trabajo Recherches sur la probabilit des jugements en matires criminelles et matire civile (Investigacin sobre la probabilidad de los juicios en materias criminales y civiles).

ndice

1 Propiedades 2 Intervalo de confianza 3 Relacin con otras distribuciones o 3.1 Sumas de variables aleatorias de Poisson o 3.2 Distribucin binomial o 3.3 Aproximacin normal o 3.4 Distribucin exponencial 4 Ejemplos 5 Procesos de Poisson 6 Enlaces externos 7 References 8 Vase tambin

Propiedades

La funcin de masa de la distribucin de Poisson es

donde

k es el nmero de ocurrencias del evento o fenmeno (la funcin nos da la probabilidad de que el evento suceda precisamente k veces). es un parmetro positivo que representa el nmero de veces que se espera que ocurra el fenmeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribucin de Poisson con = 104 = 40. e es la base de los logaritmos naturales (e = 2,71828...)

Tanto el valor esperado como la varianza de una variable aleatoria con distribucin de Poisson son iguales a . Los momentos de orden superior son polinomios de Touchard en cuyos coeficientes tienen una interpretacin combinatorio. De hecho, cuando el valor esperado de la distribucin de Poisson es 1, entonces segn la frmula de Dobinski, el nsimo momento iguala al nmero de particiones de tamao n. La moda de una variable aleatoria de distribucin de Poisson con un no entero es igual a , el mayor de los enteros menores que (los smbolos representan la funcin parte entera). Cuando es un entero positivo, las modas son y 1. La funcin generadora de momentos de la distribucin de Poisson con valor esperado es

Las variables aleatorias de Poisson tienen la propiedad de ser infinitamente divisibles. La divergencia Kullback-Leibler desde una variable aleatoria de Poisson de parmetro 0 a otra de parmetro es

Intervalo de confianza
Un criterio fcil y rpido para calcular un intervalo de confianza aproximada de es propuesto por Guerriero (2012).1 Dada una serie de eventos k (al menos el 15 - 20) en un

periodo de tiempo T, los lmites del intervalo de confianza para la frecuencia vienen dadas por:

entonces los lmites del parmetro estn dadas por:

Relacin con otras distribuciones


Sumas de variables aleatorias de Poisson

La suma de variables aleatorias de Poisson independientes es otra variable aleatoria de Poisson cuyo parmetro es la suma de los parmetros de las originales. Dicho de otra manera, si

son N variables aleatorias de Poisson independientes, entonces

. Distribucin binomial

La distribucin de Poisson es el caso lmite de la distribucin binomial. De hecho, si los parmetros n y de una distribucin binomial tienden a infinito y a cero de manera que se mantenga constante, la distribucin lmite obtenida es de Poisson.
Aproximacin normal

Como consecuencia del teorema central del lmite, para valores grandes de , una variable aleatoria de Poisson X puede aproximarse por otra normal dado que el cociente

converge a una distribucin normal de media nula y varianza 1.

Distribucin exponencial

Supngase que para cada valor t > 0, que representa el tiempo, el nmero de sucesos de cierto fenmeno aleatorio sigue una distribucin de Poisson de parmetro t. Entonces, los tiempos discurridos entre dos sucesos sucesivos sigue la distribucin exponencial.

Ejemplos
Si el 2% de los libros encuadernados en cierto taller tiene encuadernacin defectuosa, para obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan encuadernaciones defectuosas usamos la distribucin de Poisson. En este caso concreto, k es 5 y, , el valor esperado de libros defectuosos es el 2% de 400, es decir, 8. Por lo tanto, la probabilidad buscada es

Este problema tambin podra resolverse recurriendo a una distribucin binomial de parmetros k = 5, n = 400 y =0,02.

Procesos de Poisson
La distribucin de Poisson se aplica a varios fenmenos discretos de la naturaleza (esto es, aquellos fenmenos que ocurren 0, 1, 2, 3,... veces durante un periodo definido de tiempo o en un rea determinada) cuando la probabilidad de ocurrencia del fenmeno es constante en el tiempo o el espacio. Ejemplos de estos eventos que pueden ser modelados por la distribucin de Poisson incluyen:

El nmero de autos que pasan a travs de un cierto punto en una ruta (suficientemente distantes de los semforos) durante un periodo definido de tiempo. El nmero de errores de ortografa que uno comete al escribir una nica pgina. El nmero de llamadas telefnicas en una central telefnica por minuto. El nmero de servidores web accedidos por minuto. El nmero de animales muertos encontrados por unidad de longitud de ruta. El nmero de mutaciones de determinada cadena de ADN despus de cierta cantidad de radiacin. El nmero de ncleos atmicos inestables que decayeron en un determinado perodo El nmero de estrellas en un determinado volumen de espacio. La distribucin de receptores visuales en la retina del ojo humano. La inventiva de un inventor a lo largo de su carrera.

Anda mungkin juga menyukai