Anda di halaman 1dari 13

Sede Huacho

ESCUELA PROFESIONAL DE INGENIRA


DE SISTEMAS
ESTADSTICA INFERENCIAL
TEMA: DISTRIBUCIONES DE PROBABILIDAD

DOCENTE TUTOR
SUSANA (D) GUZMAN BENITES
ALUMNO
GRANADOS SANTOS JHOON HENRRY
SEMESTRE ACADMICO
2015-1
CICLO: III

Huacho, 30 de Mayo Del 2015


DISTRIBUCIONES DE PROBABILIDAD

Un modelo probabilstico es un modelo matemtico que describe el comportamiento de


una variable aleatoria. Es una funcin que depende de los valores de la variable
aleatoria, y de otras cantidades que caracterizan a una poblacin en particular y que
se denominan parmetros del modelo.

En el proceso de modelacin, es necesario seguir los siguientes pasos:

1. Seleccionar el modelo ms apropiado.


2. Ajustar el modelo (calcular el valor de sus parmetros).
3. Verificar el modelo.
4. Decidir su aceptacin o volver al paso 1.

Para ejecutar el paso 1, podemos optar por una amplia gama de modelos de
probabilidad, desarrollados para representar distintos tipos de variables y diferentes
fenmenos aleatorios. Por lo tanto, el problema se reduce a elegir el modelo ms
apropiado para el caso en estudio.

Para ejecutar el paso 2, es necesario recopilar una muestra representativa de la


poblacin en estudio y calcular las cantidades necesarias como para evaluar los
parmetros del modelo.

Existe una gran variedad de "patrones" o funciones a las que una distribucin de datos
se puede ajustar, lo cual depende primero de que el rango de datos pertenezca a una
escala mtrica o no-mtrica. Las variables no mtricas pueden ser aproximadas a

funciones de tipo discreto, como la distribucin binomial. Las variables mtricas


pueden aproximarse a funciones "continuas" diversas, como la hipergeomtrica, la de
Poisson, etc. Cada patrn especfico de distribucin sigue diferentes supuestos y
tiene, por tanto, distintas aplicaciones.

Se menciona el concepto de aproximar porque es difcil que en la realidad los datos


sigan exactamente un cierto patrn o funcin matemtica. Sin embargo, estas
aproximaciones nos permiten realizar anlisis estadsticos ms robustos. As, una gran
cantidad de distribuciones, directa o indirectamente, siguen un patrn: patrn no
significa una forma exacta.

Distribuciones de Probabilidad

A. Discretas:

i) Binomial
ii) Poisson

B. Continuas:

i) Distribucin Normal
ii) Distribucin Hipergeomtrica
iii) t de Student
iv) Ji Cuadrada
v) Distribucin F

La seleccin depende, entre otros, de los siguientes factores:

Un adecuado anlisis del problema considerado: qu tipo de variable se estudia,


qu fenmeno se desea modelar, etc.

Los resultados de la descripcin de los datos disponibles: forma de la distribucin,


propiedades de la variable.

La disponibilidad y manejo de un buen nmero de modelos de probabilidad que


permitan describir diferentes tipos de situaciones.

La Distribucin Normal

La distribucin normal es construida a partir de la distribucin de frecuencias relativas


de clase de un grupo de datos. Esto es, se construye a partir del histograma de
proporciones. Una distribucin normal es aquella curva que sigue una forma de
"campana", como la que se muestra en la siguiente figura.

Para discernir si una distribucin se aproxima o no a una curva normal, es obvio que
no basta con saber si sta tiene forma de campana o no: otras distribuciones tienen
una forma un tanto parecida, adems de que la campana puede tener alturas distintas,
segn el tipo de distribucin del que se trate. En este caso, la distribucin normal tiene
un grupo de caractersticas que la describen de forma nica:

La curva es totalmente simtrica. Esto es, que si dividimos la grfica en su


punto medio, el rea a la derecha de la curva ser exactamente igual (en rea
y forma) a la porcin de la curva a la izquierda de dicho punto medio.

Dicho punto medio es precisamente en el que coinciden la media, la mediana y


la moda.

Es unimodal. Esto es, tan slo tiene 1 moda (al centro de la distribucin).

La unidad base de la curva es la desviacin estndar particular para esa


distribucin, o puntuaciones "z".

Precisamente utilizando estas unidades "z", o de desviacin estndar:


aproximadamente un 68.26% de los datos de la dispersin se encuentran 1
desviacin estndar de la media; asimismo, el 95.44% de las observaciones
estn contenidas en el rango 2 desviaciones estndar de la media. Por ltimo,
el 97.74% de los datos se encuentran entre la media y tres desviaciones
estndar de sta, sea a su derecha o a su izquierda.

Hay dos razones bsicas que otorgan un valor singular a la distribucin normal:
1. Tiene algunas propiedades que la hacen aplicable a un gran nmero de
situaciones en las que es necesario hacer inferencias mediante la toma de
muestras. La distribucin normal es una distribucin til de muestreo.
2. La distribucin normal casi se ajusta a las distribuciones de frecuencias reales
observadas en muchos fenmenos, incluyendo caractersticas humanas
(pesos, alturas), resultados de procesos fsicos (dimensiones y rendimientos) y
muchas otras medidas de inters para los administradores.
3. Para definir una distribucin normal de probabilidad necesitamos definir slo
dos parmetros: la media y la desviacin estndar.
4.

No importa cules sean los valores de la media y la desviacin estndar para


una distribucin de probabilidad normal, el rea bajo la curva es 1, de manera
que podemos pensar en reas bajo la curva como si fueran probabilidades.

Estandarizacin.
Dentro de las caractersticas de la distribucin normal, se incluan las unidades "z",
como unidad base. Para explicar un poco el concepto de unidad "z", pensemos
primero, cmo es posible comparar dos distribuciones, dos medias, si tienen
dispersiones muy distintas? O, ms complicado an, cmo se comparan -por
ejemplo- la calificacin de dos personas en tests de inteligencia distintos, con distinta
escala? Para tal fin, existe un procedimiento que se llama estandarizacin, que
precisamente crea una unidad estndar -llamada "z"- que considera estos factores.

La puntuacin "z" transforma las distintas observaciones en unidades de desviacin


estndar y, con ello, estandariza una escala de intervalos. Su frmula es

z
Donde

xx
s

X es la puntuacin a convertir a unidades estndar,

la media, y s la

desviacin estndar. Como se ve en la frmula, el valor "z" tiene como referencias la


media y la desviacin estndar de una distribucin.
El razonamiento detrs de este proceso:
Radica en crear una nueva distribucin de valores estndar ("z"), en donde la
media de esta distribucin es cero (punto de referencia de cualquier escala
con rango continuo).
Y donde la unidad de medicin de dicha escala es la desviacin estndar.
La siguiente figura muestra un grfico para la distribucin que se crea al estandarizar
una distribucin. Como se puede apreciar, dicha distribucin se comporta tal y como la
distribucin normal indica.

Gracias a que los datos de una distribucin normal se distribuyen de acuerdo a las
reglas anteriormente vistas, podemos crear una unidad de desviacin estndar

-llamada unidad "z"- que considera estos factores. A esto se le conoce como
estandarizacin y es un proceso casi tan simple como transformar horas a minutos.
La puntuacin "z" convierte las distintas observaciones en unidades de desviacin
estndar y, con ello, estandariza la escala de intervalos. En el caso de la distribucin
de policias y trnsitos del AMCM (ver sesin 2), para convertir cualquier valor de una
distribucin (digamos, la edad 21 aos), tan slo restamos esta cantidad a la media y
la dividimos entre la desviacin estndar.

x x 21 36.57

1.4800
s
10.52

Esta observacin se encuentra a -1.48 desviaciones estndar de la media que es igual


a cero. Los valores estndarizados de cada una de las observaciones de esta
distribucin pueden apreciarse en el siguiente cuadro:

X
21
21
21
22
22
23
23
23
23
23
24
24
24

z
1.4800
1.4800
1.4800
1.3850
1.3850
1.2899
1.2899
1.2899
1.2899
1.2899
1.1949
1.1949
1.1949

X
28
28
28
29
29
29
29
30
30
30
30
30
30

z
0.8146
0.8146
0.8146
0.7196
0.7196
0.7196
0.7196
0.6245
0.6245
0.6245
0.6245
0.6245
0.6245

x
33
33
33
34
34
34
35
35
35
36
36
36
36

Z
0.3394
0.3394
0.3394
0.2443
0.2443
0.2443
0.1492
0.1492
0.1492
0.0542
0.0542
0.0542
0.0542

39

0.2310

49

1.1816

39

0.2310

50

1.2766

40

0.3260

51

1.3717

41

0.4211

51

1.3717

41

0.4211

51

1.3717

41

0.4211

52

1.4667

41

0.4211

52

1.4667

42

0.5162

52

1.4667

42

0.5162

53

1.5618

43

0.6112

54

1.6568

44

0.7063

54

1.6568

44

0.7063

56

1.8470

45

0.8013

57

1.9420

25
25
25
26
26
26
27

1.0998
1.0998
1.0998
1.0048
1.0048
1.0048
0.9097

30
31
31
31
32
32
33

0.6245
0.5295
0.5295
0.5295
0.4344
0.4344
0.3394

36

0.0542
0.0542
0.0542

37

0.0409

45

0.8013

37

0.0409

47

0.9914

38

0.1359

47

0.9914

38

0.1359

48

1.0865

36
36

45

0.8013

59

2.1321

45

0.8013

59

2.1321

45

0.8013

65

2.7025

Interpreta algunos de estos valores: Qu observaciones se encontraran a la derecha


de la media y a la misma distancia que aquellos que tienen 21 aos de edad? Cmo
puedes verificar las reglas de 68% y 95% vistas anteriormente?
Como ya vimos, el razonamiento detrs de este proceso radica en que se crea una
nueva distribucin de valores estndar ("z"), en donde la media de esta distribucin es
cero (como punto de referencia, que sin estandarizar es la media) y donde la unidad
de medicin de dicha escala es la desviacin estndar por eso se llaman unidades de
desviacin estndar.
Ejemplo Distribucin Normal
Aunque la distribucin de las edades de los policas no es exactamente normal,
pensemos por unos momentos que se aproxima a una distribucin normal. En el
siguiente Grfico se puede apreciar el histograma con la curva que describe la
distribucin de las edades de los policias y agentes de trnsito del AMCM.

EDAD EN AOS CUMPLIDOS


20

Frequency

10

Std. Dev = 10.52


Mean = 36.6
N = 96.00

0
20.0 25.0 30.0 35.0 40.0 45.0 50.0 55.0 60.0 65.0

EDAD EN AOS CUMPLIDOS

Como se puede apreciar, la dispersin se ajusta a una curva que tiene forma de
campana. Sin embargo, esta curva no se ajusta cabalmente a la curva de la
distribucin normal. Por qu? Porque la distribucin normal tiene un grupo de
caractersticas que la describen de forma nica:

La curva de la distribucin normal es completamente simtrica. Esto es, que si


dividimos la grfica en su punto medio, el rea a la derecha de la curva ser
exactamente igual (en rea y forma) a la porcin de la curva a la izquierda de
dicho punto medio. La distribucin de las edades de los policas y agentes de
trnsito la simetra es casi perfecta.

Dicho punto medio es precisamente en el que coinciden la media, la mediana y


la moda. Para el caso de las edades, la media y la mediana son de 36.6 y 35
aos, respectivamente, mientras que las modas fueron 30 y 36 aos.

Es unimodal. Esto es, tan slo tiene 1 moda (al centro de la distribucin, como
se dijo). La distribucin de edades no cumple con esta condicin pues tiene
dos modas: 30 y 36 aos).

Cmo operan las reglas de la distribucin normal en trminos de la distribucin de las


observaciones segn las distancias marcadas por la desviacin estandar?:

Sin importar cul sea la dispersin de una variable, en una curva de distribucin
normal un 68.26% de los datos se encuentra a 1 desviacin estndar del punto
en donde se ubica la media; el 95.44% de las observaciones estn contenidas en
el rango 2 desviaciones estndar alrededor de la media. Por ltimo, el 99.72% de
los datos se encuentran entre la media y tres desviaciones estndar de sta, sea a
su derecha o a su izquierda.

Si la distribucin de la variable edad viniera de una distribucin normal, con media


igual a 36.6 y desviacin estndar igual a 10.52. aproximadamente. Un 68% de los
datos se encontrarn dentro del siguiente rango:

x (1* ) 36.57 10.52 26.05


x (1 * ) 36.57 10.52 47.09
Es decir, un 68% de las observaciones se encontrarn entre 26 y 47 aos de edad.
Se cumple esto?

El nmero de observaciones entre esas edades es igual a 63. Por lo tanto, 66%

63

96

de las observaciones se encuentran a una desviacin estndar.


Asimismo, un 95% de la poblacin de policas y agentes de trnsito debera estar en el
siguiente rango:

x (2 * ) 36.57 21.04 15.5


x (2 * ) 36.57 21.04 57.6

Es decir, un 95% de las observaciones se encontrarn entre 16 y 58 aos de edad.


Se cumple esto?

El nmero de observaciones entre esas edades es igual a 93. Por lo tanto, 97%

93

96

de las observaciones se encuentran a una desviacin estndar


Este patrn de normalidad, adems de ser comn en gran cantidad de datos, permite
el uso de diversas tcnicas estadsticas que se vern ms adelante. Lo importante es
entender la distribucin normal, ya que es un concepto angular para el uso de una
gran gama de herramientas estadsticas tiles tanto en el anlisis de los datos como
en la etapa de muestreo.

Uso de la tabla de Distribucin Normal Estndar

La tabla de distribucin de probabilidad normal estndar da los valores de nicamente


la mitad del rea bajo la curva normal, empezando con 0,0 en la media. Como la
distribucin normal de probabilidad es simtrica, los valores verdaderos para una
mitad de la curva son verdaderos para la otra.

Las tablas estadsticas indican porciones del rea bajo la curva normal que estn
contenidas dentro de cualquier nmero de desviaciones estndar (ms, menos) a
partir de la media.

No es posible ni necesario tener una tabla distinta para cada curva normal posible. En
lugar de ello, podemos utilizar una distribucin de probabilidad normal estndar para
encontrar reas bajo cualquier curva normal. Con esta tabla podemos determinar el
rea o la probabilidad de que la variable aleatoria distribuida normalmente est dentro
de ciertas distancias a partir de la media. Estas distancias estn definidas en trminos
de desviaciones estndar.

Para cualquier distribucin normal de probabilidad, todos los intervalos que contienen
el mismo nmero de desviaciones estndar a partir de la media contendrn la misma
fraccin del rea total bajo la curva para cualquier distribucin de probabilidad normal.

Bibliografa:

http://www.vitutor.net/1/vectores_espacio.html

Anda mungkin juga menyukai