DESCRIPTIVA A LA TOMA DE
DECISIONES.
Duracin 18 hrs.
Tabla de contenido
CONTENIDO TEMTICO ............................................................................................... 3
1. INTRODUCCIN A LA ESTADSTICA Y SU RELACIN CON LA MEJORA CONTINUA DE LAS
EMPRESAS.................................................................................................................. 7
2. TABULACIN DE DATOS PARA EL BUEN MANEJO DE LA INFORMACIN ........................... 9
3. DISTRIBUCIN DE FRECUENCIAS Y SU INTERPRETACIN............................................... 12
4. PRESENTACIN GRFICA DE DATOS: GUA PARA ACTUAR EN LO PRIORITARIO............... 16
5. MEDIDAS DE TENDENCIA CENTRAL, VARIACIN Y FORMA ........................................... 22
7. INTRODUCCIN A LA PROBABILIDAD .......................................................................... 33
8. ACERCAMIENTO A LAS DISTRIBUCIONES DE PROBABILIDAD ......................................... 43
9. INTRODUCCIN A LA REGRESIN LINEAL: RELACIN DE VARIABLES PARA ANTICIPAR
TENDENCIAS ............................................................................................................ 47
10. TEORA DE LA UTILIDAD ..............................................................................................
11. ESTUDIO DE TIEMPOS Y SISTEMA DE TIEMPOS .................................................................
12. MODELO DE COLAS .....................................................................................................
FUENTES CONSULTADAS ..................................................................................................
OBJETIVO GENERAL:
Identificar las herramientas de estadstica descriptiva para
explicar, explorar y comparar un conjunto de datos
aplicando adecuadamente las medidas de resumen, de
tendencia central y de asociacin, as como la
presentacin e interpretacin de las mismas. Sentar las
bases de la Teora de la Utilidad para poder asignar
probabilidades de ocurrencia a eventos y as tomar una
decisin.
Finalmente
integrar conocimientos de
Investigacin de Operaciones para la solucin de
problemas de colas donde el objetivo es minimiza costo y
reducir el tiempo.
DE LA ESTADSTICA
DESCRIPTIVA A LA TOMA
DE DECISIONES
INTRODUCCIN
INTRODUCCIN A LA
ESTADSTICA Y SU
RELACIN CON LA
MEJORA CONTINUA EN
LAS EMPRESAS
1.
2. TABULACIN DE DATOS
Arreglo ordenado
Si se ordenan los datos sin procesar de las observaciones de menor a mayor, la
secuencia ordenada que se obtiene se llama arreglo ordenado. Al iniciar el anlisis
con los fondos de crecimiento, la tabla 2.1 indica los rendimientos totales a un ao que
alcanzaron 59 fondos de crecimiento en la muestra. Cuando los datos se disponen
formando un arreglo ordenado, es ms sencillo localizar extremos, valores tpicos y
concentracin de valores.
Tabla 2.1
20.4
28.9
31.9
33.4
38.2
43.6
23.8
29.3
32.1
33.7
39.0
43.7
28.6
31.6
32.9
34.7
43.3
48.0
28.8
31.6
33.0
34.8
43.4
48.6
28.9
31.8
33.3
35.0
43.5
Aunque resulta til ordenar los datos brutos antes de desarrollar tablas de resumen y
grficas o de calcular medidas globales descriptivas (vase el captulo 5), cuanto ms
grande es el nmero de observaciones presentes en un conjunto de datos, ms til
ser ordenarlas en un diagrama de tallo y hoja a fin de estudiar sus caractersticas.
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
8
6
2
67
36899
3359
1
56689
1334899
03478
003778
0
2
04
7
1
89
34567
67
47
6
06
Un examen del diagrama de tallo y hoja de la figura 2.1 permite obtener las primeras
conclusiones sobre el rendimiento a un ao de los fondos de crecimiento. Entre ellas:
1. El rendimiento a un ao ms bajo es 20.4.
2. El rendimiento a un ao ms alto es 48.6
3. Los rendimientos de los 59 fondos de crecimiento se distribuyen entre las tasas
ms baja con cierta concentracin entre 28 y 34.
4. Parece haber ms fondos de crecimiento con rendimiento mayor que 40% que
fondos con rendimiento menor que 25%.
10
94
63
75
71
88
64
2.2 Construya un diagrama de tallo y hoja para los siguientes datos sin procesar de
una muestra de calificaciones con = 7.
80
54
69
98
93
53
74
2.3 Los siguientes datos representan tiempos de transaccin (en das) de cierto
tipo de mercanca medidos en diferentes periodos.
7
9
8
6
12
6
9
15
9
16
8
5
14
8
7
6
10
8
11
4
10
6
16
5
10
12
7
10
15
7
10
8
8
10
18
8
10
11
7
10
7
8
15
23
13
9
8
9
9
13
11
3. DISTRIBUCIONES DE
FRECUENCIA Y SU
INTERPRETACIN
Sin importar si se selecciona un arreglo ordenado o un diagrama de tallo y hoja para
organizar los datos, a medida que el nmero de observaciones crece, es necesario
condensar ms los datos en tablas apropiadas, a fin de presentar, analizar e
interpretar resultados en la forma correcta. Entonces. Se pueden agrupar los datos en
clases (o categoras) de acuerdo con divisiones establecidas que convienen al
intervalo de las observaciones. Tal arreglo de los datos en forma tabular se llama
distribucin de frecuencias.
DISTRIBUCIN DE FRECUENCIAS. Agrupacin de los datos en clases mutuamente excluyentes
mostrando el nmero de observaciones en cada una.
Para ello se tiene que definir el siguiente concepto.
MUTUAMENTE EXCLUYENTE. Propiedad de un grupo de categoras por las que un individuo,
medicin u objeto se incluye en slo una categora.
Cuando las observaciones se agrupan o condensan en tablas de distribucin de
frecuencias, el proceso de anlisis e interpretacin de los datos es mucho ms
manejable y significativo. Se pueden aproximar las caractersticas principales de los
datos, lo cual compensa el hecho de que al agrupar los datos, se pierde la informacin
inicial de las observaciones individuales.
Primeramente tenemos que decidir el nmero de clases en las cuales clasificaremos
nuestros datos, para ello existen diversas reglas, una de las ms utilizadas es la
llamada regla de Sturges.
= 1 + 3.32 log
Donde
: nmero de clases
: nmero de elementos en la muestra
Seguido de esto debemos de determinar el ancho de la clase, para ello
=
Donde
: ancho del intervalo
: valor observado ms alto
: valor observado ms bajo
: nmero de clases
A la cantidad se le denomina rango y se representa con la letra .
12
20
22
22
23
24
24
24
25
25
26
26
27
27
27
28
28
29
29
30
30
30
30
30
31
31
31
32
35
35
35
36
36
37
37
38
38
38
38
39
39
40
40
40
41
44
46
48
48
48
49
50
52
52
55
56
56
57
58
60
60 20
= 5.7 6
7
Clase
Intervalos
Frecuencia
Absoluta (f)
I
II
III
IV
V
VI
VII
20-25
26-31
32-37
38-43
44-49
50-55
56-60
10
17
8
10
6
4
5
13
Clase
Intervalos
Frecuencia
Absoluta (f)
Frecuencia Relativa
I
II
III
IV
V
VI
VII
20-25
26-31
32-37
38-43
44-49
50-55
56-60
10
17
8
10
6
4
5
10/60=0.17
17/60=0.28
8/60=0.13
10/60=0.17
6/60=0.10
4/60=0.07
5/60=0.08
Los valores obtenidos tienen la cualidad de sumar 1. Este hecho es de gran relevancia
ya que es el camino para asociar dicha frecuencia a una probabilidad como veremos
ms adelante.
En este punto podemos obtener varias conclusiones:
1. El menor nmero de llamadas es 20.
2. El mayor nmero de llamadas es 60.
3. La mayora de los las llamadas se concentran en la clase II con un 28% de
ocurrencia.
4. El menor nmero de llamadas se concentra en la clase VI con un 7% de
ocurrencia.
Como se ha observado uno de los objetivos de la estadstica es el buen manejo de la
informacin, el uso de distribuciones de frecuencia proporciona una herramienta
poderosa aun cuando la cantidad de mediciones es grande.
La ltima distribucin de frecuencias que se aborda es la distribucin de frecuencias
acumulada.
FRECUENCIAS ACUMULADA. Resultado que se obtiene de sumar de forma progresiva las
frecuencias absolutas
Clase
Intervalos
Frecuencia
Absoluta (f)
Frecuencia
Acumulada
I
II
III
IV
V
VI
VII
20-25
26-31
32-37
38-43
44-49
50-55
56-60
10
17
8
10
6
4
5
10
10+17=27
27+8=35
35+10=45
45+6=51
51+4=55
55+5=60
Este ltimo tipo de distribucin se utiliza para construir un tipo de grfica llamada ojiva
o polgono de frecuencias acumuladas, como se ver en el siguiente captulo.
14
1
2
6
9
4 4 5 6 4 2
4 4 4 5 6 3
5 9 11 3 12 4
2 12
6
5
7
6
3
6
6 7 1
4 5 6
5 15 1
15
4. PRESENTACIN GRFICA
Histograma
Una de las formas ms comunes de representar una distribucin de frecuencias es el
histograma.
HISTOGRAMA. Grfica en la que las clases se sealan en el eje horizontal y las frecuencias de clase
en el eje vertical. Las frecuencias de clase se representan por medio de las alturas de las barras,
stas se dibujan de manera adyacente.
Ejemplo 4.1 Se estudia el tiempo que transcurre entre el momento de hacer un pedido
y el momento en que se surte de entre una muestra de pedidos recientes. Los tiempos
de espera se reportan en das.
Tiempo de espera
(das)
Frecuencia
0<5
5 < 10
10 < 15
15 < 20
20 < 25
Total
6
7
12
8
7
40
a) Construya un histograma
b) Qu conclusiones obtiene de la informacin que se presenta en el
histograma?
16
Polgono de frecuencias
Un polgono de frecuencias es similar a un histograma. Consiste en segmentos de
lnea que conectan los puntos formados por las intersecciones de los puntos medios
de clase y las frecuencias de clase.
Construyendo el polgono de frecuencias para el ejemplo anterior tenemos lo
siguiente.
Tiempo de espera
(das)
0<5
5 < 10
10 < 15
15 < 20
20 < 25
Total
Punto
Medio
2.5
7.5
12.5
17.5
22.5
Frecuencia
6
7
12
8
7
40
Ojiva
Una distribucin de frecuencias acumuladas nos permite ver cuntas observaciones
estn por encima de ciertos valores, en lugar de hacer un mero registro del nmero de
elementos que hay dentro de los intervalos.
Construyendo la ojiva para el ejemplo ya sealado se tiene.
Tiempo de espera
(das)
<5
< 10
< 15
< 20
< 25
Frecuencia
Acumulada
6
13
25
33
40
17
Suponga que en la ojiva se traza una lnea paralela al eje horizontal en la marca de
0.50 hasta intersecar la ojiva. De esta manera, es posible leer el valor aproximado de
11. Este es un hecho importante porque podemos analizar diversos porcentajes de
acumulacin, por arriba o debajo de un valor dado.
La herramienta que se emple para construir el histograma est dentro del Anlisis de
Datos que se incorpora en Excel, seleccionando la opcin Histograma, marcando la
casilla Porcentaje Acumulado.
Frecuencia Porcentaje
0<5
5 < 10
10 < 15
15 < 20
20 < 25
6
7
12
8
7
15
17.5
30
20
17.5
Diagrama de Pareto
Un anlisis de Pareto es una tcnica que permite representar datos categricos que a
menudo proporciona ms informacin visual que los diagramas de barras y de pastel.
Esto ocurre a medida que aumenta el nmero de clases o grupos de las variables. Su
concepto con frecuencia llamado la regla del 80-20, es que el 80% de actividad es a
causa del 20% de los factores. Para desarrollar un diagrama de Pareto primeramente
se ordenan los datos de mayor a menor. El eje vertical de la izquierda contiene las
frecuencias o porcentajes, el eje vertical de la derecha contiene los porcentajes
18
acumulados (de 100 arriba a 0 abajo), y el eje horizontal contiene las categoras de
inters.
Ejemplo 4.2 Se indica que hay por lo general nueve razones que dan como resultado
que cierta produccin de cajas de cartn no conformes al final del proceso. Los
resultados se concentran en la siguiente tabla. Construya un diagrama de Pareto.
Razones de la no conformidad
Cartn roto (R)
Cartn abultado (G)
Cartn agrietado (C)
Cartn sucio (D)
Agujeros en el cartn (H)
Peso del empaque inadecuado (I)
Error de impresin (P)
Etiqueta ilegible (U)
Tapa superior sin sello (S)
Total
Frecuencia
3
4
2
9
1
2
1
12
16
50
%
6
8
4
18
2
4
2
24
32
100
Solucin.
Primeramente procedemos a ordenar los datos de mayor a menor.
Razones de la no conformidad
Tapa superior sin sello (S)
Etiqueta ilegible (U)
Cartn sucio (D)
Cartn abultado (G)
Cartn roto (R)
Cartn agrietado (C)
Peso del empaque inadecuado (I)
Agujeros en el cartn (H)
Error de impresin (P)
Total
Frecuencia
16
12
9
4
3
2
2
1
1
50
%
32
24
18
8
6
4
4
2
2
100
Diagrama de Pareto
50
40
30
20
10
0
100
80
60
40
20
0
% Acumulado
32
56
74
82
88
92
96
98
100
Al
organizar
las
causas, se observa
que el 74% de las
inconformidades
estn
contenidas
dentro de: (S), (U) y
(D).
19
< 18
< 21
< 24
< 27
< 30
< 33
< 36
8
23
17
18
8
4
2
80
Construya:
a)
b)
c)
d)
e)
f)
Un histograma.
Un polgono de frecuencias.
Grfica de ojiva
Grfica de pastel
Diagrama de Pareto
Indique al menos cuatro conclusiones.
4.2 La siguiente grfica indica el nmero de paquetes enviados por da durante los
pasados 100 das.
21
5. MEDIDAS DE TENDENCIA
CENTRAL, VARIACIN Y
FORMA
En cualquier anlisis o interpretacin, se pueden usar muchas medidas descriptivas
que representan las propiedades de tendencia central, variacin y forma para resumir
las caractersticas importantes de un conjunto de datos. Si se calculan estas medidas
descriptivas globales a partir de una muestra de datos, se denominan estadsticos, si
se calculan para toda la poblacin de los datos se denominan parmetros. Se suelen
usar muestras en lugar de la poblacin por las razones descritas anteriormente (vase
el capitulo1).
Media
Dichas medidas existen para datos agrupados (distribuciones de frecuencia) y no
agrupados (datos brutos). La primera de ellas es la media.
MEDIA (DATOS NO AGRUPADOS)
Este ltimo resultado es lo que conocemos como promedio, consiste en sumar cada
uno de los datos y dividirlo entre el total.
Ejemplo 5.1 Se obtienen las siguientes calificaciones en un grupo de 8 estudiantes: 7,
8, 6, 8, 10, 9, 5, 8. Calcule la media.
Solucin.
=
7 + 8 + 6 + 8 + 10 + 9 + 5 + 8
= 7.6
8
MEDIA (DATOS AGRUPADOS)
=
Donde
: media
: marca de clase
: frecuencia de cada clase
: nmero de observaciones
22
Clase
Intervalos
Frecuencia
Absoluta (f)
I
II
III
IV
V
VI
VII
20-25
26-31
32-37
38-43
44-49
50-55
56-60
10
17
8
10
6
4
5
Solucin.
Dado que la frmula para calcular la mediana implica primero una multiplicacin
( ) y posteriormente una suma (), extendamos la tabla para facilitar el clculo.
Clase
Intervalos
Frecuencia
Absoluta (f)
Marca de clase
(x)
( )
I
II
III
IV
V
VI
VII
20-25
26-31
32-37
38-43
44-49
50-55
56-60
10
17
8
10
6
4
5
22.5
28.5
34.5
40.5
46.5
52.5
58
225
484.5
276
405
279
210
290
2169.5
Finalmente
=
2169.5
= 36.15
60
Cabe sealar que si comparamos este resultado con el de la media para datos no
agrupados, tenemos que para ese caso = 36.2. Con lo cual podemos justificar el
hecho de agrupar los datos en clases.
Este tipo de medida de tendencia central tiene algunas desventajas, recordemos que
las medidas posicionales nos dan informacin acerca de la distribucin que siguen los
datos, sin embargo, en este caso.
1) Se puede ver afectada por valores extremos que no son representativos del
resto de los datos.
2) Somos incapaces de calcular la media para un conjunto de datos que tiene
clases de extremo abierto en la parte inferior o superior de la escala.
Por estas y otras razones es importante contar con otras medidas representativas de
los datos.
23
Media ponderada
La media ponderada nos permite calcular un promedio que toma en cuenta la
importancia de cada valor con respecto al total. Para ello se desarrolla el siguiente
ejemplo.
Ejemplo 5.3 Una compaa utiliza tres niveles de trabajo (no calificado, semicalificado
y calificado) para la produccin de dos productos finales. La compaa desea saber el
promedio del costo de trabajo por hora para cada uno de los productos.
Horas de mano de obra
por unidad producida
Nivel de mano de
obra
No Calificado
Semicalificado
Calificado
Producto 1 Producto 2
1
4
2
3
5
3
5+7+9
= $7/
3
Usando esta tasa podramos calcular el costo del trabajo invertido en una unidad del
producto 1 como $7(1 + 2 + 5) = $56, y el de una unidad del producto 2 como
$7(4 + 3 + 3) = $70. Estos promedios son incorrectos!
Una forma diferente de calcular el costo promedio por hora para los productos consiste
en tomar un promedio ponderado del costo de los tres niveles de mano de obra.
Para ello ponderamos el salario por hora de cada nivel mediante la proporcin de la
mano de obra requerida para fabricar el producto. Una unidad del producto 1, por
ejemplo, requiere ocho horas de trabajo. De este tiempo, 1/8 es de mano de obra no
calificada, 2/8 de mano de obra semicalificada, y 5/8 de trabajo calificado. Si
utilizamos estas fracciones como ponderaciones (o pesos), entonces una hora de
trabajo en el producto 1 cuesta en promedio
=
1
2
5
$5 + $7 + $9 = $8/
8
8
8
Donde
: media ponderada
: peso de cada observacin
: cada observacin
24
Mediana
La mediana es una medida de tendencia central diferente a cualquiera de las que
menos tratado hasta ahora. La mediana es un solo valor del conjunto de datos que
mide la observacin central del conjunto. Esta sola observacin es el elemento que
est ms al centro del conjunto de nmeros. La mitad de los elementos estn por
arriba de este punto y la otra mitad est por debajo.
MEDIANA (DATOS NO AGRUPADOS)
+1
=
2
Tomando nuevamente los datos del ejemplo 5.1 tenemos.
Ejemplo 5.4 Se obtienen las siguientes calificaciones en un grupo de 8 estudiantes: 7,
8, 6, 8, 10, 9, 5, 8. Calcule la mediana.
Solucin.
Primeramente se deben ordenar los datos: 5, 6, 7, 8, 8, 8, 9, 10.
En seguida ocupamos la frmula para calcular el elemento que es la mediana.
=
8+1
= 4.5
2
8+8
=8
2
Ejemplo 5.5 Se A menudo, tenemos acceso a los datos hasta despus de agruparlos
en una distribucin de frecuencias. Por ejemplo, no conocemos todas las
observaciones que llevaron a la siguiente tabla, que contiene datos de 600 clientes
bancarios. En este caso, tenemos 10 intervalos de clase y un registro de las
frecuencias con las que aparecen las observaciones en cada intervalo.
Clase en dlares
0-49.99
50.00-99.99
100.00-149.99
150.00-199.99
200.00-249.99
250.00-299.99
300.00-349.99
350.00-399.99
400.00-449.99
450.00-499.99
Frecuencias
78
123
187 Clase mediana
82
51
47
13
9
6
4
600
25
Donde
: mediana de la muestra
: nmero de elementos en la distribucin
: suma de todas las frecuencias de clase hasta, pero sin incluir, la clase de la
mediana.
: frecuencia de la clase de la mediana
: lmite inferior del intervalo de la clase de la mediana
: ancho de intervalo de clase
Identificando cada uno de los parmetros de esa expresin tenemos
= 600, = 201, = 187, = $100 y = $50
=
98.5
50 + 100
187
126.35
Moda
La moda es una medida de tendencia central diferente de la media, pero un tanto
parecida a la mediana, pues en realidad no se calcula mediante algn proceso
aritmtico ordinario. La moda es el valor que ms se repite en el conjunto de datos.
MODA (DATOS AGRUPADOS)
1
= +
1 + 2
26
Donde
: moda de la muestra
: lmite inferior de la clase modal
1 : frecuencia de la clase modal menos la frecuencia de la clase que se
encuentra inmediatamente menor que ella.
2 : frecuencia de la clase modal menos la frecuencia de la clase que se
encuentra inmediatamente mayor que ella.
: ancho de intervalo de clase modal.
64
50
64 + 105
Distribucin simtrica
27
En una distribucin con sesgo positivo (es decir, sesgada a la derecha), como la
siguiente figura, la moda todava se encuentra en el punto ms alto de la distribucin,
la mediana est a la derecha de la moda y la media se encuentra todava ms a la
derecha de la moda y la mediana.
En una distribucin con sesgo negativo (es decir, sesgada a la izquierda), como en la
siguiente grfica, la moda sigue siendo el punto ms alto de la distribucin, la mediana
est a la izquierda y la media se encuentra todava ms a la izquierda de la moda y la
mediana.
Medidas de dispersin
Una medida de ubicacin, como la media o la mediana, solamente describe el centro
de los datos. Desde este punto de vista resulta valiosa, pero no dice nada sobre la
dispersin de los datos. Comparemos tres curvas, las cuales cuentan con la misma
media, sin embargo, no tienen la misma dispersin.
28
Para aumentar nuestro entendimiento del patrn de los datos, debemos medir tambin
su dispersin, separacin o variabilidad.
Por qu es tan importante entender y medir la dispersin de la distribucin?
1. Nos proporciona informacin adicional que nos permite juzgar la confiabilidad
de nuestra medida de tendencia central. Si los datos se encuentran muy
dispersos, como los que representa la curva C de la figura anterior, la posicin
central es menos representativa de los datos, como un todo, que cuando stos
se agrupan ms cerca alrededor de la media, como en la curva A de la misma
figura.
2. Ya que existen problemas caractersticos para datos muy dispersos, debemos
ser capaces de reconocer esa dispersin amplia para poder abordar esos
problemas.
3. Quiz se desee comparar las dispersiones de diferentes muestras. Si no se
desea tener una amplia dispersin de valores con respecto del centro de
distribucin, o esto presenta riesgos inaceptables, necesitamos poder
reconocerla y evitar elegir distribuciones que tengan las dispersiones ms
grandes.
Existen diversas medidas que caracterizan esa dispersin nosotros ocuparemos las
siguientes.
29
Clase Intervalos
Frecuencia Marca
Absoluta de clase
(f)
(x)
( )
( )
( )2
( )2
20-25
10
22.5
225
-13.65
186.32
1863.225
II
26-31
17
28.5
484.5
-7.65
58.52
994.8825
III
32-37
34.5
276
-1.65
2.72
21.78
IV
38-43
10
40.5
405
4.35
18.92
189.225
44-49
46.5
279
10.35
107.12
642.735
VI
50-55
52.5
210
16.35
267.32
1069.29
VII
56-60
58
290
21.85
2169.5
477.42
2387.1125
7168.25
Finalmente
2 =
7168.25
= 121.49
60 1
30
6
16
21
29
25
22
11
7
4
0
2
a)
b)
c)
d)
31
5.5 Una empresa que usa dos mtodos diferentes para enviar pedidos a sus
T1 (30 mins)
T2 (45 mins)
T3 (1 hr)
2
6
2
3
1
4
1
7
3
0
3
1
1
3
6
a)
b)
c)
d)
32
6. INTRODUCCIN A LA
PROBABILIDAD
La teora de la probabilidad fue aplicada con xito en las mesas de juego en un
principio y, lo que es ms importante en nuestro estudio, a problemas sociales y
econmicos. La industria de seguros, que surgi en el siglo XIX, requera un
conocimiento preciso acerca de los riesgos de prdida, con el fin de calcular las
primas. Medio siglo ms tarde, muchos centros de aprendizaje estaban estudiando la
probabilidad como una herramienta para el entendimiento de los fenmenos sociales.
En la actualidad, la teora matemtica de la probabilidad es la base para las
aplicaciones estadsticas, tanto en investigaciones sociales como en la toma de
decisiones.
Vivimos en un mundo incapaz de predecir el futuro con total certidumbre. Nuestra
necesidad de encarar a la incertidumbre nos lleva a estudiar y utilizar la teora de la
probabilidad. En muchos casos, nosotros, como ciudadanos preocupados, tendremos
algn conocimiento sobre los posibles resultados de una decisin. Al organizar esta
informacin y considerarla de manera sistemtica seremos capaces de reconocer
nuestras suposiciones, comunicar nuestro razonamiento a otras personas y tomar una
decisin ms slida que la que tomaramos si slo diramos palos de ciego.
Conceptos fundamentales
Un espacio muestral, es un listado de todos los eventos simples posibles que pueden
resultar del experimento probabilstico. Puede ser: una lista, un diagrama de rbol, un
sistema de red, etc. Los eventos simples no se traslapan, es decir, son completamente
ajenos. Se acostumbra denotar por al espacio muestral.
Ejemplo 6.1 Se arroja una moneda al aire y se observa cara () o cruz ().
Espacio muestral:
= {, }
Ejemplo 6.2 Se arrojan dos monedas (un peso y cinco pesos) al mismo tiempo, y se
observan caras y cruces en cada una. Utilizamos notacin ordenada (un peso, cinco
pesos).
Espacio muestral:
Diagrama de rbol:
Un peso
Cinco pesos
C
C
X
C
X
X
Listado:
= { , , , , , , , }
33
Cinco pesos
Representacin en red:
X
C
C
X
Un peso
Probabilidad de que ocurra un evento es la frecuencia relativa con que ocurre ese
evento, o la frecuencia relativa con la cual puede esperarse que ese evento ocurra.
=
Probabilidad
0.05
0.15
0.35
0.25
0.10
0.10
( = 0) = 0.05
b) Haya por lo menos cuatro departamentos libres
34
Probabilidad condicionada
Usualmente, en la probabilidad de un evento influye el hecho de que un evento
relacionado con l ya haya ocurrido. Suponga que tiene un evento cuya probabilidad
es (). Si obtiene informacin nueva y sabe que un evento relacionado con l,
denotado por , ya ha ocurrido, desear aprovechar esta informacin y volver a
calcular la probabilidad del evento . A esta nueva probabilidad del evento se le
conoce como probabilidad condicional y se expresa (|), la notacin | indica que
se est considerando la probabilidad del evento dada la condicin de que el evento
ha ocurrido. Por tanto, la notacin (|) se lee la probabilidad de dado .
=
( )
()
Evento ( )
Evento A
Evento B
Ejemplo 6.5 Considere el caso de las promociones de los agentes de polica de una
determinada ciudad. La fuerza policiaca consta de 1200 agentes, 960 hombres y 240
mujeres. En los ltimos dos aos, fueron promovidos 340. En la siguiente tabla se
muestra como quedaron repartidas estas promociones entre hombres y mujeres.
Hombre Mujer Total
Promovido
288
36
324
No promovido
672
204
876
Total
960
240
1200
35
Al dividir los valores de la tabla permite concretar la informacin que se tiene en las
siguientes probabilidades.
= 288/1200 = 0.24
= 672/1200 = 0.56
= 36/1200 = 0.03
= 204/1200 = 0.17
0.24
0.03
0.27
No promovido
0.56
0.17
0.73
Total
0.80
0.20
1.00
( ) 0.03
=
= 0.15
()
0.20
b) Cul es la probabilidad de que exista una promocin dado que el agente sea
hombre?
( ) 0.24
=
=
= 0.30
()
0.80
En conclusin la probabilidad de que un agente sea promovido dado que es hombre
es el doble de la probabilidad de que un agente sea promovido dado que sea mujer,
aunque el uso de probabilidad condicional no demuestra por si misma que exista
discriminacin en este caso, los valores de probabilidad condicional confirman el
argumento presentado por las mujeres.
Probabilidad compuesta
La probabilidad compuesta (o regla de multiplicacin de probabilidades) se deriva de
la probabilidad condicional:
La probabilidad de que se den simultneamente dos sucesos (suceso interseccin de
A y B) es igual a la probabilidad a priori del suceso B multiplicada por la probabilidad
del suceso A condicionada al cumplimiento del suceso B.
36
Probabilidad total
Sea 1 , 2 , , un sistema completo de eventos tales que la probabilidad de cada
uno de ellos es distinto de cero, y sea un evento cualquiera del que se conocen las
probabilidades condicionales (| ).
Entonces, la probabilidad del evento , llamada probabilidad total, se calcula
empleando la siguiente frmula:
= 1 1 + 2 2 + + (| )
Ejemplo 6.7 Se dispone de tres cajas con bombillas. La primera contiene 10
bombillas, de las cuales hay cuatro fundidas; en la segunda hay seis bombillas,
estando una de ellas fundida, y la tercera caja hay tres bombillas fundidas de un total
de ocho. Cul es la probabilidad de que al tomar una bombilla al azar de una
cualquiera de las cajas, est fundida?
6/10
1 caja
1/3
1/3
4/10
5/6
2 caja
1/6
5/8
1/3
F
B
3 caja
3/8
37
1 4 1 1 1 3 113
+ + =
0.31
3 10 3 6 3 8 360
Teorema de Bayes
En el estudio de la probabilidad condicional se vio que revisar las probabilidades
cuando se obtiene informacin es parte importante del anlisis de probabilidades. Por
lo general, se suele iniciar el anlisis con una estimacin de probabilidad inicial o
probabilidad previa de los eventos que interesan. Despus, de fuentes como una
muestra, una informacin especial o una prueba de producto, se obtiene ms
informacin sobre estos eventos. Dada esta nueva informacin, se modifican o revisan
los valores de probabilidad mediante el clculo de probabilidades revisadas a las que
se les conoce como probabilidades posteriores. El teorema de Bayes es un medio
para calcular estas probabilidades, el proceso de revisin es el siguiente:
Probabilidades
previas
Aplicacin del
teorema de
Bayes
Nueva
informacin
Probabilidades
posteriores
1 1
(| )
+ 2 2 + + (| )
Ejemplo 6.8 Considere una fbrica que compra piezas de dos proveedores. Sea 1 el
evento la pieza proviene del proveedor 1 y 2 el evento proviene del proveedor 2. De
las piezas que compra la fabrica, 65% proviene del proveedor 1 y 35% del proveedor
2. Por lo tanto, si toma una pieza aleatoriamente, le asignar las probabilidades
previas 1 = 0.65 y 2 = 0.35.
La calidad de las piezas compradas vara de acuerdo con el proveedor. Si denota el
evento la pieza es buena y denota el evento la pieza es mala, las probabilidades
condicionales por experiencia son:
1 = 0.98
1 = 0.02
2 = 0.95
2 = 0.05
Suponga ahora que las piezas de los dos proveedores se emplean en el proceso de
fabricacin de esta empresa y que una mquina se descompone al tratar de procesar
una pieza mal. Dada la informacin de que la pieza es mala, Cul es la probabilidad
de que sea del proveedor 1 y cul es la probabilidad de que sea del proveedor 2?
Las dos preguntas en lenguaje matemticos son:
a) 1 =
1 (|1 )
1 1 + 2 2
b) 2 =
2 (|2 )
1 1 + 2 2
38
Para resolver esa situacin de manera sencilla dibujemos un diagrama de rbol con la
informacin del problema y recordemos el significado de probabilidad compuesta.
|1
1 = 1 * |1 = 0.6370
0.98
|1
0.02
1 = 1 * |1 = 0.0130
0.65
2
|2
0.35
2 = 2 * |2 = 0.3325
0.95
|2
0.05
2 = 2 * |2 = 0.0175
1 (|1 )
1 1 + 2 2
b) 2 =
2 (|2 )
1 1 + 2 2
= 0.0305 = 0.5738
0.0130
0.0130
0.0175
Independencia de sucesos
Es un caso especial en el que P A B = P(A), es decir, el que suceda A es
independiente del suceso B.
Recordando el significado de probabilidad compuesta tenemos que:
P AB = P B P A B
Sustituyendo:
P A B = P B P A = P A P(B)
Ejemplo 6.9 Cul es la probabilidad de obtener dos caras en dos lanzamientos de
una moneda equilibrada?
Puesto que la probabilidad de las caras es de
1
2
1 1
52 52
= 169 .
39
En el segundo caso tenemos que al haber obtenido nuestro primer as, nos queda un
monte de 51 naipes entre ellos solo 3 ases, por lo tanto
4
3
52 51
1
.
221
40
6.3 La siguiente tabla muestra la distribucin de edades por sexo en Mxico, segn
datos del INEGI (2010)
Total
0.20 0.10
0.30
0.05 0.65
0.70
1.00
Responda lo siguiente:
a)
b)
c)
d)
e)
42
7. ACERCAMIENTO A LAS
DISTRIBUCIONES DE
PROBABILIDAD
En el captulo 3 describimos a las distribuciones de frecuencias como una forma til de
resumir las variaciones en los datos observados. Preparamos distribuciones de
frecuencias haciendo una lista de todos los resultados posibles de un experimento
para despus indicar la frecuencia observada de cada resultado posible. Las
distribuciones de probabilidad estn relacionadas con las distribuciones de
frecuencias. De hecho, podemos pensar que una distribucin de probabilidad es una
distribucin de frecuencias terica. Qu significa lo anterior? Una distribucin de
frecuencias terica es una distribucin de probabilidades que describe la forma en que
se espera varen los resultados. Como estas distribuciones representan expectativas
de que algo suceda, resultan modelos tiles para hacer inferencias y tomar decisiones
en condiciones de incertidumbre.
Distribucin Binomial
Una distribucin de probabilidad de variable aleatoria discreta utilizada ampliamente es
la distribucin binomial. Esta distribucin describe una variedad de procesos de inters
para los administradores. Las caractersticas que describen un experimento de
probabilidad binomial son:
1. El resultado de cada prueba de un experimento se clasifica en una de dos
categoras mutuamente excluyentes: xito o fracaso.
2. La variable aleatoria permite contar el nmero de xitos en una cantidad fija de
pruebas.
3. La probabilidad de xito y fracaso es la misma para cada prueba.
4. Las pruebas son independientes, lo cual significa que el resultado de una
prueba no influye en el resultado de otra prueba.
DISTRIBUCIN BINOMIAL
= = (1 )
Donde
: combinaciones de en .
: nmero de pruebas.
: nmero de xitos.
: probabilidad de xito en cada prueba.
VARIANZA
2 = (1 )
43
Ejemplo 7.1 Estudios revelan que un envo tiene un 95% de probabilidad de cumplir
con su tiempo de llegada entre dos ciudades. Se realizan 200 envos calcule.
a)
b)
c)
d)
e)
f)
Solucin.
Identifiquemos los parmetros de la situacin descrita: = 200, = 0.95.
a) = 200 = 200 200 (0.95)200 (1 0.95)200200 = 0.000035
Lo que lo hace prcticamente nula.
b) = = 200 0.95 = 190.
Esto indica que en promedio se espera que 190 cumplan con el tiempo de
llegada.
c) 2 = (1 ) = 200 0.95 (1 0.95) = 9.5.
Por ende su desviacin estndar es = 9.5 = 3.08, calculando el coeficiente de
variacin =
3.08
190
( = )
( )
200
0.000035
0.000035
199
0.000369
0.000404
198
0.001932
0.002336
197
0.006712
0.009048
196
0.017398
0.026447
195
0.035896
0.062342
194
0.061401
0.123743
193
0.089562
0.213305
192
0.113720
0.327024
191
0.127685
0.454710
190
0.128357
0.583067
189
0.116689
0.699756
188
0.096729
0.796484
187
0.073623
0.870108
186
0.051758
0.921866
185
0.033779
0.955644
184
0.020556
0.976201
183
0.011710
0.987911
182
0.006266
0.994176
Distribucin de Poisson
La distribucin de probabilidad de Poisson describe el nmero de veces que se
presenta un evento durante un intervalo especfico. El intervalo puede ser de tiempo,
distancia, rea o volumen.
1. La variable aleatoria es el nmero de veces que ocurre un evento durante un
intervalo definido.
2. La probabilidad de que ocurra el evento es proporcional al tamao del intervalo.
3. Los intervalos no se superponen y son independientes.
DISTRIBUCIN DE POISSON
= =
!
Donde
: media de la cantidad de veces que se presenta un evento.
: nmero de Euler (2.7182)
: nmero de veces que se presenta un evento.
La media () y varianza ( 2 ) de una distribucin binomial se calculan como sigue.
MEDIA
=
VARIANZA
2 =
a)
b)
c)
d)
Solucin.
Identifiquemos el parmetro de la situacin descrita: = 4
40 4
a) = 0 = 0! = 0.0183
Lo que lo hace una probabilidad muy baja, no sera comn observar esto.
41 4
b) = 1 = 1! = 0.0732
A diferencia del caso anterior tiene una probabilidad ms considerable.
44 4
c) = 4 =
= 0.1953
4!
Es ms probable de observar, es de esperarse ya que estamos calculando la
probabilidad de que ocurra el promedio de eventos.
45
f)
( = )
( )
0.018316
0.018316
0.073263
0.091578
0.146525
0.238103
0.195367
0.433470
0.195367
0.628837
0.156293
0.785130
0.104196
0.889326
0.059540
0.948866
0.029770
0.978637
0.013231
0.991868
46
8. INTRODUCCIN A LA
REGRESIN LINEAL
Todos los das, administradores y gerentes toman decisiones personales y
profesionales basadas en predicciones de sucesos futuros. Para hacer estos
pronsticos, se basan en la relacin (intuitiva y calculada) entre lo que ya se sabe y lo
que se debe estimar. Si los responsables de la toma de decisiones pueden determinar
cmo lo conocido se relaciona con el evento futuro, pueden ayudar considerablemente
al proceso de toma de decisiones. se es el objetivo de este captulo: cmo
determinar la relacin entre variables.
Diagramas de dispersin
El primer paso para determinar si existe una relacin entre dos variables es examinar
la grfica de los datos observados (o conocidos). Esta grfica, o dibujo, se llama
diagrama de dispersin. Un diagrama de dispersin nos puede dar dos tipos de
informacin. Visualmente, podemos identificar patrones que indiquen que las variables
estn relacionadas. Si esto sucede, podemos ver qu tipo de lnea, o ecuacin de
estimacin, describe esta relacin.
Las grficas (a) y (b) muestran relaciones lineales directas e inversas. Las grficas (c)
y (d) son ejemplos de relaciones curvilneas que indican asociaciones directas e
inversas entre variables, respectivamente. La grfica (e) ilustra una relacin lineal
inversa con un patrn de puntos ampliamente disperso. Esta mayor dispersin indica
que existe menor grado de asociacin entre las variables independiente y dependiente
que el existente en la grfica (b). El patrn de puntos en la grfica (f) parece indicar
que no existe relacin entre las dos variables; por tanto, conocer el pasado referente a
una variable no nos permitir pronosticar ocurrencias futuras de la otra.
47
La idea bsica para el desarrollo de nuestro anlisis es adaptar la relacin de los datos
a una relacin lineal, es decir, una ecuacin de la forma.
ECUACIN DE LA RECTA
= +
Donde
: variable de respuesta (dependiente).
: variable controlada (independiente).
: pendiente.
: ordenada al origen.
Dicha ecuacin describir una recta ajustada a los datos tal como se muestra en la
figura anterior en los incisos (a), (b) y (e), el objetivo es calcular los parmetros y
asociados a la ecuacin, ya que los mismos definen por completo y de manera nica a
la recta.
Para ello se procede de manera estadstica a estimarlos con las siguientes
expresiones.
=
=
=
48
Ganancia anual
45
40
35
30
25
20
15
0
10
12
Cantidad de tareas
semanales
6
5
3
9
7
49
Fuentes consultadas
1.
2.
Kohler Heins. Estadstica para negocios y economa. Compaa Editorial Continental, Mxico
1999, 1 Edicin.
3.
4.
5.
Allen L. Webster. Estadstica aplicada a los negocios y la economa. Editorial Mc Graw Hill, 3
Edicin
6.
50