Anda di halaman 1dari 50

DE LA ESTADSTICA

DESCRIPTIVA A LA TOMA DE
DECISIONES.
Duracin 18 hrs.

Periodo de imparticin: DEL 22 DE JULIO AL 26 DE AGOSTO


Nombre del Capacitador: PROF. JUAN AGUILAR GMEZ
Horario:

Tabla de contenido
CONTENIDO TEMTICO ............................................................................................... 3
1. INTRODUCCIN A LA ESTADSTICA Y SU RELACIN CON LA MEJORA CONTINUA DE LAS
EMPRESAS.................................................................................................................. 7
2. TABULACIN DE DATOS PARA EL BUEN MANEJO DE LA INFORMACIN ........................... 9
3. DISTRIBUCIN DE FRECUENCIAS Y SU INTERPRETACIN............................................... 12
4. PRESENTACIN GRFICA DE DATOS: GUA PARA ACTUAR EN LO PRIORITARIO............... 16
5. MEDIDAS DE TENDENCIA CENTRAL, VARIACIN Y FORMA ........................................... 22
7. INTRODUCCIN A LA PROBABILIDAD .......................................................................... 33
8. ACERCAMIENTO A LAS DISTRIBUCIONES DE PROBABILIDAD ......................................... 43
9. INTRODUCCIN A LA REGRESIN LINEAL: RELACIN DE VARIABLES PARA ANTICIPAR
TENDENCIAS ............................................................................................................ 47
10. TEORA DE LA UTILIDAD ..............................................................................................
11. ESTUDIO DE TIEMPOS Y SISTEMA DE TIEMPOS .................................................................
12. MODELO DE COLAS .....................................................................................................
FUENTES CONSULTADAS ..................................................................................................

OBJETIVO GENERAL:
Identificar las herramientas de estadstica descriptiva para
explicar, explorar y comparar un conjunto de datos
aplicando adecuadamente las medidas de resumen, de
tendencia central y de asociacin, as como la
presentacin e interpretacin de las mismas. Sentar las
bases de la Teora de la Utilidad para poder asignar
probabilidades de ocurrencia a eventos y as tomar una
decisin.
Finalmente
integrar conocimientos de
Investigacin de Operaciones para la solucin de
problemas de colas donde el objetivo es minimiza costo y
reducir el tiempo.

DE LA ESTADSTICA
DESCRIPTIVA A LA TOMA
DE DECISIONES

INTRODUCCIN

INTRODUCCIN A LA
ESTADSTICA Y SU
RELACIN CON LA
MEJORA CONTINUA EN
LAS EMPRESAS

1.

Por qu se necesita conocer Estadstica?


Hace un siglo H. G. Wells coment: "Algn da el pensamiento estadstico ser tan
necesario como la habilidad para leer y escribir". Al comienzo del nuevo milenio, el
problema que enfrentan los gerentes no es la escasez de informacin, sino cmo
utilizar la informacin disponible para tomar las decisiones adecuadas.
Desde la perspectiva de una toma de decisiones informada, cabe preguntarse por qu
un administrador necesita saber estadstica. Los administradores deben comprender la
estadstica por cuatro razones fundamentales.
1. Para saber cmo presentar y describir la informacin en forma adecuada.
2. Para saber cmo obtener conclusiones sobre poblaciones grandes basndose
solamente en la informacin obtenida de las muestras.
3. Para saber cmo mejorar procesos.
4. Para saber cmo obtener pronsticos confiables.
ESTADSTICA. Conjunto de mtodos para recopilar, organizar, presentar, analizar e interpretar
informacin para ayudar a tomar decisiones efectivas.
El estudio de la estadstica por lo general se divide en dos categoras: Descriptiva e
Inferencial.
ESTADSTICA DESCRIPTIVA. Conjunto de mtodos para organizar, resumir y presentar los datos de
manera informativa.
Por ejemplo, el INEGI reporta que la poblacin de Mxico era de 81 249 645 en 1990,
97 361 711 en 2000 y 112 336 538 en 2010. Esta informacin es resultado de la
estadstica descriptiva. Tambin se trata de estadstica descriptiva si calculamos el
crecimiento porcentual de una dcada a otra. Sin embargo, no lo sera si la
utilizramos para calcular la poblacin en Mxico en 2020 puesto que la estadstica
descriptiva se ocupa para resumir las poblaciones pasadas y no las futuras.
ESTADSTICA INFERENCIAL. Conjunto de mtodos utilizados para determinar algn atributo
medible de una poblacin con base en una muestra.
Para aclarar este concepto se requieren otras definiciones.
POBLACIN. Es la totalidad de los elementos que se toman en consideracin.

MUESTRA. Es la porcin de la poblacin que se selecciona para su anlisis.


La necesidad de uso de los mtodos de inferencia estadstica se deriva de la
necesidad del muestreo A medida que una poblacin crece, por lo general resulta
demasiado costoso, tardado y tedioso obtener informacin de toda la poblacin. Las
decisiones respecto a las caractersticas de la poblacin deben basarse en la
informacin que est contenida en una muestra de esa poblacin. La teora de
probabilidad proporciona el vnculo al determinar la posibilidad de que los resultados
de la muestra reflejen los resultados de la poblacin.
Dichas tcnicas fueron desarrolladas a principios del siglo XX cuando especialistas en
estadstica como Fisher, Pearson,Goset, Neyman, Wald y Tukey iniciaron el desarrollo
de los mtodos de inferencia estadstica, que en la poca actual tienen una amplia
aplicacin en varios campos.
La relacin entre una muestra y una poblacin se presenta a continuacin. Por
ejemplo queremos estimar el promedio de Kilmetros por litro que cierto tipo de
vehculo consume, para ello seleccionamos al azar a seis de ellos.

2. TABULACIN DE DATOS

PARA EL BUEN MANEJO


DE LA INFORMACIN
Como se mencion en el captulo anterior la estadstica descriptiva se encarga de
organizar, resumir y presentar los datos de manera informativa. Para ello debemos
tomar en cuenta los tipos de datos que se pueden presentar en un estudio.
VARIABLES ALEATORIAS CATEGRICAS. Producen respuestas categricas, como s o no.
VARIABLES ALEATORIAS NUMRICAS. Producen respuestas numricas, como: los montos
empleados en una operacin, el tiempo en el que se lleva a cabo un proceso, etc. Se dividen en:
discretas y continuas.
VARIABLES ALEATORIAS DISCRETAS. Producen respuestas numricas que surgen de un conteo.
"El nmero de embarques que se reciben en un mes" es un ejemplo de variable numrica discreta.
Se tienen cero, uno, dos o ms de ellos.
VARIABLES ALEATORIAS CONTINUAS. Producen respuestas numricas que surgen de procesos
de medicin. El tiempo que toma realizar una actividad, la estatura de una persona son claros
ejemplos de este tipo de variables.
A medida que crece el nmero de observaciones, se hace ms difcil concentrarse en
las caractersticas importantes de un conjunto de datos. Es necesario organizar las
observaciones de manera que se pueda entender mejor qu informacin contienen
dichos datos. Dos mtodos de uso comn para lograr esto son el arreglo ordenado y el
diagrama de tallo y hoja.

Arreglo ordenado
Si se ordenan los datos sin procesar de las observaciones de menor a mayor, la
secuencia ordenada que se obtiene se llama arreglo ordenado. Al iniciar el anlisis
con los fondos de crecimiento, la tabla 2.1 indica los rendimientos totales a un ao que
alcanzaron 59 fondos de crecimiento en la muestra. Cuando los datos se disponen
formando un arreglo ordenado, es ms sencillo localizar extremos, valores tpicos y
concentracin de valores.
Tabla 2.1
20.4
28.9
31.9
33.4
38.2
43.6

23.8
29.3
32.1
33.7
39.0
43.7

Arreglo ordenado de rendimientos


los 59 fondos de crecimiento
25.6
26.2
27.6
27.7
29.3
29.5
29.9
30.1
32.3
32.3
32.4
32.8
33.8
34.0
34.0
34.3
39.4
40.7
41.1
42.8
44.6
44.7
45.4
45.7

totales a un ao que alcanzaron


28.3
31.5
32.9
34.7
42.9
46.6

28.6
31.6
32.9
34.7
43.3
48.0

28.8
31.6
33.0
34.8
43.4
48.6

28.9
31.8
33.3
35.0
43.5

Aunque resulta til ordenar los datos brutos antes de desarrollar tablas de resumen y
grficas o de calcular medidas globales descriptivas (vase el captulo 5), cuanto ms
grande es el nmero de observaciones presentes en un conjunto de datos, ms til
ser ordenarlas en un diagrama de tallo y hoja a fin de estudiar sus caractersticas.

Diagrama de tallo y hoja


El diagrama de tallo y hoja es una herramienta valiosa y verstil para organizar un
conjunto de datos y entender la distribucin y agrupacin de los valores dentro del
intervalo de observaciones en el conjunto. Un diagrama de tallo y hoja separa los
datos en dgitos gua, o en tallos, y dgitos que les siguen u hojas. Por ejemplo,
observe que todos los rendimientos a un ao en los datos para fondos de crecimiento
manejan dos dgitos enteros, entonces las decenas y unidades son los dgitos gua, y
lo que queda (las dcimas) es el dgito que sigue. As un dato con valor de 32.3 tiene
un tallo de 32 y una hoja de 3.
La figura 2.1 describe el diagrama de tallo y hoja de los rendimientos a un ao para los
59 fondos de crecimiento.
Figura 2.1 Diagrama de tallo y hoja de los
rendimientos totales a un ao (en
porcentajes)
Fuente: datos tomados de la tabla 2.1

20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48

8
6
2
67
36899
3359
1
56689
1334899
03478
003778
0

2
04
7
1
89
34567
67
47
6
06

Un examen del diagrama de tallo y hoja de la figura 2.1 permite obtener las primeras
conclusiones sobre el rendimiento a un ao de los fondos de crecimiento. Entre ellas:
1. El rendimiento a un ao ms bajo es 20.4.
2. El rendimiento a un ao ms alto es 48.6
3. Los rendimientos de los 59 fondos de crecimiento se distribuyen entre las tasas
ms baja con cierta concentracin entre 28 y 34.
4. Parece haber ms fondos de crecimiento con rendimiento mayor que 40% que
fondos con rendimiento menor que 25%.

10

Problemas para el captulo 2.


2.1 Obtenga un arreglo ordenado para los siguientes datos brutos de una muestra
de calificaciones con = 7.
68

94

63

75

71

88

64

2.2 Construya un diagrama de tallo y hoja para los siguientes datos sin procesar de
una muestra de calificaciones con = 7.
80

54

69

98

93

53

74

2.3 Los siguientes datos representan tiempos de transaccin (en das) de cierto
tipo de mercanca medidos en diferentes periodos.
7
9
8
6
12

6
9
15
9
16

8
5
14
8
7

6
10
8
11
4

10
6
16
5
10

12
7
10
15
7

10
8
8
10
18

8
10
11
7
10

7
8
15
23
13

9
8
9
9
13

a) Desarrolle un arreglo ordenado


b) Construya un diagrama de tallo y hoja
c) Con base en estos datos, Es probable que el nmero de das sean altos o
bajos? Explique
d) Es ms probable que el tiempo requerido para la operacin sea menor que 10
das o mayor que 20 das. Explique.

11

3. DISTRIBUCIONES DE

FRECUENCIA Y SU
INTERPRETACIN
Sin importar si se selecciona un arreglo ordenado o un diagrama de tallo y hoja para
organizar los datos, a medida que el nmero de observaciones crece, es necesario
condensar ms los datos en tablas apropiadas, a fin de presentar, analizar e
interpretar resultados en la forma correcta. Entonces. Se pueden agrupar los datos en
clases (o categoras) de acuerdo con divisiones establecidas que convienen al
intervalo de las observaciones. Tal arreglo de los datos en forma tabular se llama
distribucin de frecuencias.
DISTRIBUCIN DE FRECUENCIAS. Agrupacin de los datos en clases mutuamente excluyentes
mostrando el nmero de observaciones en cada una.
Para ello se tiene que definir el siguiente concepto.
MUTUAMENTE EXCLUYENTE. Propiedad de un grupo de categoras por las que un individuo,
medicin u objeto se incluye en slo una categora.
Cuando las observaciones se agrupan o condensan en tablas de distribucin de
frecuencias, el proceso de anlisis e interpretacin de los datos es mucho ms
manejable y significativo. Se pueden aproximar las caractersticas principales de los
datos, lo cual compensa el hecho de que al agrupar los datos, se pierde la informacin
inicial de las observaciones individuales.
Primeramente tenemos que decidir el nmero de clases en las cuales clasificaremos
nuestros datos, para ello existen diversas reglas, una de las ms utilizadas es la
llamada regla de Sturges.
= 1 + 3.32 log
Donde
: nmero de clases
: nmero de elementos en la muestra
Seguido de esto debemos de determinar el ancho de la clase, para ello
=

Donde
: ancho del intervalo
: valor observado ms alto
: valor observado ms bajo
: nmero de clases
A la cantidad se le denomina rango y se representa con la letra .
12

Dada esta informacin podemos abordar un ejemplo.


Ejemplo 3.1 Una compaa de ventas de diferentes mercancas desea conocer el
comportamiento de las llamadas telefnicas durante los meses de marzo y abril del
ao en curso; por lo que realiza una investigacin, se obtuvieron los siguientes datos:
20

20

22

22

23

24

24

24

25

25

26

26

27

27

27

28

28

29

29

30

30

30

30

30

31

31

31

32

35

35

35

36

36

37

37

38

38

38

38

39

39

40

40

40

41

44

46

48

48

48

49

50

52

52

55

56

56

57

58

60

Clasifique los datos de acuerdo a una distribucin de frecuencias.


Solucin.
Primeramente debemos de calcular el nmero de intervalos con la regla de Sturges.
= 1 + 3.32 log 60 = 6.90 7
Eso significa que tenemos 7 clases o intervalos. El ancho de cada uno de ellos es
=

60 20
= 5.7 6
7

Por lo tanto la distribucin de frecuencias es:

Clase

Intervalos

Frecuencia
Absoluta (f)

I
II
III
IV
V
VI
VII

20-25
26-31
32-37
38-43
44-49
50-55
56-60

10
17
8
10
6
4
5

Nota: Observe que el nmero de elementos en cada uno de los intervalos es


= , en la primera clase tenemos: 20, 21, 22, 23, 24, 25. En total son seis
elementos. Lo mismo ocurre con el resto.
Una vez construida la distribucin de frecuencias (absolutas), podemos construir una
distribucin de frecuencias relativas.
FRECUENCIA RELATIVA. Resultado de dividir las frecuencias en cada clase de la distribucin entre
el nmero total de observaciones.

13

Clase

Intervalos

Frecuencia
Absoluta (f)

Frecuencia Relativa

I
II
III
IV
V
VI
VII

20-25
26-31
32-37
38-43
44-49
50-55
56-60

10
17
8
10
6
4
5

10/60=0.17
17/60=0.28
8/60=0.13
10/60=0.17
6/60=0.10
4/60=0.07
5/60=0.08

Los valores obtenidos tienen la cualidad de sumar 1. Este hecho es de gran relevancia
ya que es el camino para asociar dicha frecuencia a una probabilidad como veremos
ms adelante.
En este punto podemos obtener varias conclusiones:
1. El menor nmero de llamadas es 20.
2. El mayor nmero de llamadas es 60.
3. La mayora de los las llamadas se concentran en la clase II con un 28% de
ocurrencia.
4. El menor nmero de llamadas se concentra en la clase VI con un 7% de
ocurrencia.
Como se ha observado uno de los objetivos de la estadstica es el buen manejo de la
informacin, el uso de distribuciones de frecuencia proporciona una herramienta
poderosa aun cuando la cantidad de mediciones es grande.
La ltima distribucin de frecuencias que se aborda es la distribucin de frecuencias
acumulada.
FRECUENCIAS ACUMULADA. Resultado que se obtiene de sumar de forma progresiva las
frecuencias absolutas

Clase

Intervalos

Frecuencia
Absoluta (f)

Frecuencia
Acumulada

I
II
III
IV
V
VI
VII

20-25
26-31
32-37
38-43
44-49
50-55
56-60

10
17
8
10
6
4
5

10
10+17=27
27+8=35
35+10=45
45+6=51
51+4=55
55+5=60

Este ltimo tipo de distribucin se utiliza para construir un tipo de grfica llamada ojiva
o polgono de frecuencias acumuladas, como se ver en el siguiente captulo.

14

Problemas para el captulo 3.


3.1 Se recopila informacin sobre el nmero de veces que un cliente visita un
establecimiento en un mes. Las respuestas de 51 clientes fueron
5 3 3
1 14 1
8 4 7
1 10 8
a)
b)
c)
d)
e)

1
2
6
9

4 4 5 6 4 2
4 4 4 5 6 3
5 9 11 3 12 4
2 12

6
5
7

6
3
6

6 7 1
4 5 6
5 15 1

Construya una distribucin de frecuencias (absoluta).


Construya una distribucin de frecuencias relativa.
Construya una distribucin de frecuencias acumulada.
Dnde tienden a agruparse los datos?
Proporcione una conclusin con las distribuciones que construy.

3.2 Desarrolle el ejercicio 2.3 para agrupar los datos:


a) Construya una distribucin de frecuencias (absoluta).
b) Construya una distribucin de frecuencias relativa.
c) Construya una distribucin de frecuencias acumulada.
d) Dnde tienden a agruparse los datos?
e) Proporcione una conclusin con las distribuciones que construy.

15

4. PRESENTACIN GRFICA

DE DATOS: GUA PARA


ACTUAR EN LO
PRIORITARIO
A menudo se requiere de un panorama rpido de las tendencias, ests tendencias se
pueden ilustrar adems de las tablas que ya estudiamos con la ayuda de grficas.
Tres grficas que ayudan a ilustrar una distribucin de frecuencias en forma grfica
son el histograma, el polgono de frecuencias y el polgono de frecuencias
acumuladas.

Histograma
Una de las formas ms comunes de representar una distribucin de frecuencias es el
histograma.
HISTOGRAMA. Grfica en la que las clases se sealan en el eje horizontal y las frecuencias de clase
en el eje vertical. Las frecuencias de clase se representan por medio de las alturas de las barras,
stas se dibujan de manera adyacente.

Ejemplo 4.1 Se estudia el tiempo que transcurre entre el momento de hacer un pedido
y el momento en que se surte de entre una muestra de pedidos recientes. Los tiempos
de espera se reportan en das.
Tiempo de espera
(das)

Frecuencia

0<5
5 < 10
10 < 15
15 < 20
20 < 25
Total

6
7
12
8
7
40

a) Construya un histograma
b) Qu conclusiones obtiene de la informacin que se presenta en el
histograma?

16

Algunas de las conclusiones son las siguientes:


1. El menor tiempo de espera es 0 das (es decir, se surte en el mismo da).
2. El mayor tiempo de espera es de 25 das.
3. La frecuencia de clase ms alta es la clase de 10 a 15 das. Un total de 12 de
los 40 registros estn en este rango.
4. 27 de los registros tienen un periodo de espera entre los 5 y 20 das.
La herramienta que se emple para construir el histograma est dentro del Anlisis de
Datos que se incorpora en Excel, seleccionando la opcin Histograma.

Polgono de frecuencias
Un polgono de frecuencias es similar a un histograma. Consiste en segmentos de
lnea que conectan los puntos formados por las intersecciones de los puntos medios
de clase y las frecuencias de clase.
Construyendo el polgono de frecuencias para el ejemplo anterior tenemos lo
siguiente.
Tiempo de espera
(das)
0<5
5 < 10
10 < 15
15 < 20
20 < 25
Total

Punto
Medio
2.5
7.5
12.5
17.5
22.5

Frecuencia
6
7
12
8
7
40

La herramienta que se emple para construir el polgono de frecuencias, est en la


opcin
Insertar->Grficos->Dispersin->Dispersin
con
lneas
suavizadas.
Previamente se calcularon los puntos medios de cada clase.

Ojiva
Una distribucin de frecuencias acumuladas nos permite ver cuntas observaciones
estn por encima de ciertos valores, en lugar de hacer un mero registro del nmero de
elementos que hay dentro de los intervalos.
Construyendo la ojiva para el ejemplo ya sealado se tiene.
Tiempo de espera
(das)

<5
< 10
< 15
< 20
< 25

Frecuencia
Acumulada
6
13
25
33
40

17

Suponga que en la ojiva se traza una lnea paralela al eje horizontal en la marca de
0.50 hasta intersecar la ojiva. De esta manera, es posible leer el valor aproximado de
11. Este es un hecho importante porque podemos analizar diversos porcentajes de
acumulacin, por arriba o debajo de un valor dado.

La herramienta que se emple para construir el histograma est dentro del Anlisis de
Datos que se incorpora en Excel, seleccionando la opcin Histograma, marcando la
casilla Porcentaje Acumulado.

Grficas circulares o de pastel


Una grfica circular o de pastel es muy til para ilustrar datos de nivel nominal, es
decir no hay un orden particular para las categoras. As pues calculando el porcentaje
relacionado con cada una de las clases tenemos
Tiempo de espera
(das)

Frecuencia Porcentaje

0<5
5 < 10
10 < 15
15 < 20
20 < 25

6
7
12
8
7

15
17.5
30
20
17.5

La herramienta que se emple para construir la grfica de pastel, est en la opcin


Insertar->Grficos->Circular. Excel da la opcin de calcular los porcentajes eligiendo
uno de los tipos de grfico.

Diagrama de Pareto
Un anlisis de Pareto es una tcnica que permite representar datos categricos que a
menudo proporciona ms informacin visual que los diagramas de barras y de pastel.
Esto ocurre a medida que aumenta el nmero de clases o grupos de las variables. Su
concepto con frecuencia llamado la regla del 80-20, es que el 80% de actividad es a
causa del 20% de los factores. Para desarrollar un diagrama de Pareto primeramente
se ordenan los datos de mayor a menor. El eje vertical de la izquierda contiene las
frecuencias o porcentajes, el eje vertical de la derecha contiene los porcentajes

18

acumulados (de 100 arriba a 0 abajo), y el eje horizontal contiene las categoras de
inters.
Ejemplo 4.2 Se indica que hay por lo general nueve razones que dan como resultado
que cierta produccin de cajas de cartn no conformes al final del proceso. Los
resultados se concentran en la siguiente tabla. Construya un diagrama de Pareto.
Razones de la no conformidad
Cartn roto (R)
Cartn abultado (G)
Cartn agrietado (C)
Cartn sucio (D)
Agujeros en el cartn (H)
Peso del empaque inadecuado (I)
Error de impresin (P)
Etiqueta ilegible (U)
Tapa superior sin sello (S)
Total

Frecuencia
3
4
2
9
1
2
1
12
16
50

%
6
8
4
18
2
4
2
24
32
100

Solucin.
Primeramente procedemos a ordenar los datos de mayor a menor.
Razones de la no conformidad
Tapa superior sin sello (S)
Etiqueta ilegible (U)
Cartn sucio (D)
Cartn abultado (G)
Cartn roto (R)
Cartn agrietado (C)
Peso del empaque inadecuado (I)
Agujeros en el cartn (H)
Error de impresin (P)
Total

Frecuencia
16
12
9
4
3
2
2
1
1
50

%
32
24
18
8
6
4
4
2
2
100

Diagrama de Pareto
50
40
30
20
10
0

100
80
60
40
20
0

% Acumulado
32
56
74
82
88
92
96
98
100

Al
organizar
las
causas, se observa
que el 74% de las
inconformidades
estn
contenidas
dentro de: (S), (U) y
(D).

19

Problemas para el captulo 4.


4.1 La siguiente tabla ilustra la demanda de cierto producto con base en su precio.
Precios (miles de $) Frecuencia
15
18
21
24
27
30
33
Total

< 18
< 21
< 24
< 27
< 30
< 33
< 36

8
23
17
18
8
4
2
80

Construya:
a)
b)
c)
d)
e)
f)

Un histograma.
Un polgono de frecuencias.
Grfica de ojiva
Grfica de pastel
Diagrama de Pareto
Indique al menos cuatro conclusiones.

4.2 La siguiente grfica indica el nmero de paquetes enviados por da durante los
pasados 100 das.

a) Qu nombre recibe la grfica?


b) Cul es el nmero total de frecuencias?
c) Cul es el intervalo de clase?
d) Cul es la frecuencia de clase para la clase de 10 a 15?
e) Cul es la frecuencia relativa de la clase de 10 a 15?
f)

Cul es el punto medio de la clase de 10 a 5?

g) En cuntos das se enviaron 25 o ms paquetes?


20

4.3 La siguiente grfica muestra los precios de venta (miles de dlares) de


cierto tipo de producto.

a) Cuntos productos se estudiaron?


b) Cul es el intervalo de clase?
c) En menos de que cantidad se vendieron 100 productos?
d) En menos de que cantidad se vendi aproximadamente el 75% de los
productos?
e) Aproxime el nmero de productos vendidos entre $150 000 y $200 000.

21

5. MEDIDAS DE TENDENCIA

CENTRAL, VARIACIN Y
FORMA
En cualquier anlisis o interpretacin, se pueden usar muchas medidas descriptivas
que representan las propiedades de tendencia central, variacin y forma para resumir
las caractersticas importantes de un conjunto de datos. Si se calculan estas medidas
descriptivas globales a partir de una muestra de datos, se denominan estadsticos, si
se calculan para toda la poblacin de los datos se denominan parmetros. Se suelen
usar muestras en lugar de la poblacin por las razones descritas anteriormente (vase
el capitulo1).

Medidas de tendencia central


La mayor parte de los conjuntos de datos muestran una tendencia bien determinada a
agruparse o aglomerarse alrededor de cierto punto central. As, para cualquier
conjunto especfico de datos, casi siempre se puede seleccionar algn valor tpico, o
promedio, para describir todo el conjunto. Este valor tpico descriptivo es una medida
de tendencia central o ubicacin.

Media
Dichas medidas existen para datos agrupados (distribuciones de frecuencia) y no
agrupados (datos brutos). La primera de ellas es la media.
MEDIA (DATOS NO AGRUPADOS)

Este ltimo resultado es lo que conocemos como promedio, consiste en sumar cada
uno de los datos y dividirlo entre el total.
Ejemplo 5.1 Se obtienen las siguientes calificaciones en un grupo de 8 estudiantes: 7,
8, 6, 8, 10, 9, 5, 8. Calcule la media.
Solucin.
=

7 + 8 + 6 + 8 + 10 + 9 + 5 + 8
= 7.6
8
MEDIA (DATOS AGRUPADOS)

=

Donde
: media
: marca de clase
: frecuencia de cada clase
: nmero de observaciones
22

Ejemplo 5.2 Haciendo referencia al ejemplo 3.1 calcule la media.

Clase

Intervalos

Frecuencia
Absoluta (f)

I
II
III
IV
V
VI
VII

20-25
26-31
32-37
38-43
44-49
50-55
56-60

10
17
8
10
6
4
5

Solucin.
Dado que la frmula para calcular la mediana implica primero una multiplicacin
( ) y posteriormente una suma (), extendamos la tabla para facilitar el clculo.
Clase

Intervalos

Frecuencia
Absoluta (f)

Marca de clase
(x)

( )

I
II
III
IV
V
VI
VII

20-25
26-31
32-37
38-43
44-49
50-55
56-60

10
17
8
10
6
4
5

22.5
28.5
34.5
40.5
46.5
52.5
58

225
484.5
276
405
279
210
290
2169.5

Finalmente
=

2169.5
= 36.15
60

Cabe sealar que si comparamos este resultado con el de la media para datos no
agrupados, tenemos que para ese caso = 36.2. Con lo cual podemos justificar el
hecho de agrupar los datos en clases.
Este tipo de medida de tendencia central tiene algunas desventajas, recordemos que
las medidas posicionales nos dan informacin acerca de la distribucin que siguen los
datos, sin embargo, en este caso.
1) Se puede ver afectada por valores extremos que no son representativos del
resto de los datos.
2) Somos incapaces de calcular la media para un conjunto de datos que tiene
clases de extremo abierto en la parte inferior o superior de la escala.
Por estas y otras razones es importante contar con otras medidas representativas de
los datos.

23

Media ponderada
La media ponderada nos permite calcular un promedio que toma en cuenta la
importancia de cada valor con respecto al total. Para ello se desarrolla el siguiente
ejemplo.
Ejemplo 5.3 Una compaa utiliza tres niveles de trabajo (no calificado, semicalificado
y calificado) para la produccin de dos productos finales. La compaa desea saber el
promedio del costo de trabajo por hora para cada uno de los productos.
Horas de mano de obra
por unidad producida
Nivel de mano de
obra
No Calificado
Semicalificado
Calificado

Salario por hora en


dlares
$5.00
7.00
9.00

Producto 1 Producto 2
1
4
2
3
5
3

Un simple promedio de los salarios pagados sera


=

5+7+9
= $7/
3

Usando esta tasa podramos calcular el costo del trabajo invertido en una unidad del
producto 1 como $7(1 + 2 + 5) = $56, y el de una unidad del producto 2 como
$7(4 + 3 + 3) = $70. Estos promedios son incorrectos!
Una forma diferente de calcular el costo promedio por hora para los productos consiste
en tomar un promedio ponderado del costo de los tres niveles de mano de obra.
Para ello ponderamos el salario por hora de cada nivel mediante la proporcin de la
mano de obra requerida para fabricar el producto. Una unidad del producto 1, por
ejemplo, requiere ocho horas de trabajo. De este tiempo, 1/8 es de mano de obra no
calificada, 2/8 de mano de obra semicalificada, y 5/8 de trabajo calificado. Si
utilizamos estas fracciones como ponderaciones (o pesos), entonces una hora de
trabajo en el producto 1 cuesta en promedio
=

1
2
5
$5 + $7 + $9 = $8/
8
8
8

De manera anloga para el producto 2 el promedio es


4
3
3
$5 +
$7 +
$9 = $6.8/
10
10
10
Siendo esta la forma correcta de obtener el promedio en este problema.
MEDIA PONDERADA

=

Donde
: media ponderada
: peso de cada observacin
: cada observacin
24

Mediana
La mediana es una medida de tendencia central diferente a cualquiera de las que
menos tratado hasta ahora. La mediana es un solo valor del conjunto de datos que
mide la observacin central del conjunto. Esta sola observacin es el elemento que
est ms al centro del conjunto de nmeros. La mitad de los elementos estn por
arriba de este punto y la otra mitad est por debajo.
MEDIANA (DATOS NO AGRUPADOS)
+1
=

2
Tomando nuevamente los datos del ejemplo 5.1 tenemos.
Ejemplo 5.4 Se obtienen las siguientes calificaciones en un grupo de 8 estudiantes: 7,
8, 6, 8, 10, 9, 5, 8. Calcule la mediana.
Solucin.
Primeramente se deben ordenar los datos: 5, 6, 7, 8, 8, 8, 9, 10.
En seguida ocupamos la frmula para calcular el elemento que es la mediana.
=

8+1
= 4.5
2

Lo que significa que la media es el promedio del elemento 4 y 5.


=

8+8
=8
2

Ejemplo 5.5 Se A menudo, tenemos acceso a los datos hasta despus de agruparlos
en una distribucin de frecuencias. Por ejemplo, no conocemos todas las
observaciones que llevaron a la siguiente tabla, que contiene datos de 600 clientes
bancarios. En este caso, tenemos 10 intervalos de clase y un registro de las
frecuencias con las que aparecen las observaciones en cada intervalo.
Clase en dlares
0-49.99
50.00-99.99
100.00-149.99
150.00-199.99
200.00-249.99
250.00-299.99
300.00-349.99
350.00-399.99
400.00-449.99
450.00-499.99

Frecuencias
78
123
187 Clase mediana
82
51
47
13
9
6
4
600

25

No obstante, podemos calcular la mediana en este caso determinando cual de los 10


intervalos de clase contiene la mediana. Para ello, ocupamos la siguiente expresin
MEDIA (DATOS AGRUPADOS)
( + 1)/2 ( + 1)
=
+

Donde
: mediana de la muestra
: nmero de elementos en la distribucin
: suma de todas las frecuencias de clase hasta, pero sin incluir, la clase de la
mediana.
: frecuencia de la clase de la mediana
: lmite inferior del intervalo de la clase de la mediana
: ancho de intervalo de clase
Identificando cada uno de los parmetros de esa expresin tenemos
= 600, = 201, = 187, = $100 y = $50
=

(600 + 1)/2 (201 + 1)


50 + 100
187
=

98.5
50 + 100
187
126.35

La mediana tiene varias ventajas respecto a la media. La ms importante, es que los


valores extremos no afectan a la mediana de manera tan grave como a la media. Se
puede encontrar la mediana incluso de una serie de datos cualitativos. Una de las
desventajas es que ciertos procedimientos estadsticos que ocupan la mediana son
ms complejos que aquellos que involucran a la media, por ltimo la mediana requiere
que se ordenen los datos, por ello consume ms tiempo su clculo que la media.

Moda
La moda es una medida de tendencia central diferente de la media, pero un tanto
parecida a la mediana, pues en realidad no se calcula mediante algn proceso
aritmtico ordinario. La moda es el valor que ms se repite en el conjunto de datos.
MODA (DATOS AGRUPADOS)
1
= +

1 + 2

26

Donde
: moda de la muestra
: lmite inferior de la clase modal
1 : frecuencia de la clase modal menos la frecuencia de la clase que se
encuentra inmediatamente menor que ella.
2 : frecuencia de la clase modal menos la frecuencia de la clase que se
encuentra inmediatamente mayor que ella.
: ancho de intervalo de clase modal.

Ejemplo 5.6 Calculemos la moda para la distribucin presentada en el ejemplo 5.5. En


este caso
= $100, 1 = 187 123 = 64, 2 = 187 82 = 105 y = $50
= 100 +

64
50
64 + 105

= 100 + 18.93 = 118.93


La moda al igual que la mediana se puede utilizar como una posicin central para
datos tanto cualitativos como cuantitativos, los valores extremos no afectan
indebidamente a la moda. A pesar de estas ventajas, la moda no se utiliza tan a
menudo como medida de tendencia central como la media o mediana. Muchas veces,
no existe un valor modal debido a que el conjunto de datos no contiene valores que se
presenten ms de una vez.

Comparacin de la media, la mediana y la moda


Cuando trabajamos problemas de estadstica, debemos decidir si vamos a utilizar la
media, la mediana o la moda como medidas de tendencia central. Las distribuciones
simtricas que slo contienen una moda siempre tienen el mismo valor para la media,
la mediana y la moda. En esos casos, no es necesario escoger la medida de tendencia
central, pues ya est hecha la seleccin.

Distribucin simtrica

27

En una distribucin con sesgo positivo (es decir, sesgada a la derecha), como la
siguiente figura, la moda todava se encuentra en el punto ms alto de la distribucin,
la mediana est a la derecha de la moda y la media se encuentra todava ms a la
derecha de la moda y la mediana.

Distribucin con sesgo positivo

En una distribucin con sesgo negativo (es decir, sesgada a la izquierda), como en la
siguiente grfica, la moda sigue siendo el punto ms alto de la distribucin, la mediana
est a la izquierda y la media se encuentra todava ms a la izquierda de la moda y la
mediana.

Distribucin con sesgo negativo

Cuando la poblacin est sesgada negativa o positivamente, la mediana suele ser la


mejor medida de posicin, debido a que siempre est entre la moda y la media. La
frecuencia de ocurrencia de un solo valor no influye mucho en la mediana como es el
caso de la moda, ni la distorsionan los valores extremos como la media.
En cualquier otro caso, no existen guas universales para la aplicacin de la media, la
mediana o la moda como medidas de tendencia central para diferentes poblaciones.
Cada caso deber considerarse de manera independiente, de acuerdo con las lneas
generales que se analizaron.

Medidas de dispersin
Una medida de ubicacin, como la media o la mediana, solamente describe el centro
de los datos. Desde este punto de vista resulta valiosa, pero no dice nada sobre la
dispersin de los datos. Comparemos tres curvas, las cuales cuentan con la misma
media, sin embargo, no tienen la misma dispersin.

Tres cuervas con la misma media pero diferente variabilidad

28

Para aumentar nuestro entendimiento del patrn de los datos, debemos medir tambin
su dispersin, separacin o variabilidad.
Por qu es tan importante entender y medir la dispersin de la distribucin?
1. Nos proporciona informacin adicional que nos permite juzgar la confiabilidad
de nuestra medida de tendencia central. Si los datos se encuentran muy
dispersos, como los que representa la curva C de la figura anterior, la posicin
central es menos representativa de los datos, como un todo, que cuando stos
se agrupan ms cerca alrededor de la media, como en la curva A de la misma
figura.
2. Ya que existen problemas caractersticos para datos muy dispersos, debemos
ser capaces de reconocer esa dispersin amplia para poder abordar esos
problemas.
3. Quiz se desee comparar las dispersiones de diferentes muestras. Si no se
desea tener una amplia dispersin de valores con respecto del centro de
distribucin, o esto presenta riesgos inaceptables, necesitamos poder
reconocerla y evitar elegir distribuciones que tengan las dispersiones ms
grandes.
Existen diversas medidas que caracterizan esa dispersin nosotros ocuparemos las
siguientes.

Varianza y desviacin estndar


Al igual que las medidas de tendencia central, existen medidas de dispersin para
datos agrupados (distribuciones de frecuencia) y no agrupados (datos brutos). La
primera de ellas es la varianza.
VARIANZA MUESTRAL (DATOS NO AGRUPADOS)
( )2
2 =
1
Donde
2 : varianza de la muestra.
: cada uno de los datos.
: media de la muestra.
: nmero de datos.
Por su parte la definicin de varianza para datos agrupados es
VARIANZA MUESTRAL (DATOS AGRUPADOS)
( )2
2 =
1
Donde
2 : varianza de la muestra.
: marca de clase.
: media de la muestra.
: frecuencia de cada clase.
: nmero de datos.

29

Ejemplo 5.7 Retomando el ejemplo 5.2 calculemos su varianza, recordemos que


= 36.15.

Clase Intervalos

Frecuencia Marca
Absoluta de clase
(f)
(x)

( )

( )

( )2

( )2

20-25

10

22.5

225

-13.65

186.32

1863.225

II

26-31

17

28.5

484.5

-7.65

58.52

994.8825

III

32-37

34.5

276

-1.65

2.72

21.78

IV

38-43

10

40.5

405

4.35

18.92

189.225

44-49

46.5

279

10.35

107.12

642.735

VI

50-55

52.5

210

16.35

267.32

1069.29

VII

56-60

58

290

21.85

2169.5

477.42

2387.1125
7168.25

Finalmente
2 =

7168.25
= 121.49
60 1

Comparando este resultado con la varianza para datos no agrupados 2 = 117.48.


Observamos que son muy parecidos, esto reafirma una vez el hecho de la efectividad
de agrupar los datos para su manejo.
A partir de esta medida de dispersin obtenemos una nueva medida , llamada
desviacin estndar, esta ltima no es ms que la raz cuadrada de la varianza. Para
el ejemplo anterior (datos agrupados) se tiene que = 11.02.
La desviacin estndar representa una medida de la dispersin de los datos, es decir,
entre ms dispersos estn los datos, mayor ser su desviacin (tambin la varianza) y
viceversa cuando menor sea su desviacin (tambin la varianza) los datos se
encontraran ms concentrados alrededor de una medida de tendencia central.
Problemas para el captulo 5.
5.1 Para las distribuciones siguientes, indique cul de ellas:
a) Tiene una media ms grande.
b) Es ms probable que produzca un valor pequeo que uno grande.
c) Es la mejor representacin de tiempos de espera en un proceso.

30

5.2 Para las siguientes dos distribuciones, indique cul de ellas:


a) Tiene valores distribuidos ms uniformemente a travs del intervalo de valores
posibles.
b) Es ms probable que produzca un valor cercano a cero.
c) Tiene una probabilidad ms alta de producir valores positivos que negativos.

5.3 Si las dos curvas siguientes representan la distribucin de los resultados de un


grupo de trabajo en dos pruebas diferentes. Qu prueba parece haber sido
ms difcil?

5.4 La siguiente distribucin de frecuencias representa el tiempo en segundos que


a un oficinista le toma realizar cierta tarea.
Tiempo (en segundos) Frecuencia
20-29
30-39
40-49
50-59
60-69
70-79
80-89
90-99
100-109
110-119
120-129

6
16
21
29
25
22
11
7
4
0
2

a)
b)
c)
d)

Calcule la media, la mediana, la moda.


Cul de ellos ocupara como medida descriptiva de la muestra?
Calcule la varianza y la desviacin estndar.
Construya un histograma y ubique las medidas de tendencia central, marque
tambin alrededor de la medida sugerida en b) la desviacin estndar.
e) Indique algunas conclusiones de este estudio.

31

5.5 Una empresa que usa dos mtodos diferentes para enviar pedidos a sus

clientes encontr las siguientes distribuciones del tiempo de entrega


para los dos mtodos, segn los registros histricos. Con la evidencia
disponible, Qu mtodo de envo recomendara?

5.6 Se pretende medir cuan eficiente es un grupo de personas que realizan

una serie distinta de actividades las cuales toman diferentes tiempos de


ejecucin (promedio) durante un da, en el interior de la tabla se muestra
la cantidad de tareas que realizan. Los resultados se presentan a
continuacin.
S1
S2
S3
S4
S5

T1 (30 mins)

T2 (45 mins)

T3 (1 hr)

2
6
2
3
1

4
1
7
3
0

3
1
1
3
6

a)
b)
c)
d)

Determine una medida de la eficiencia para cada una de las personas.


Quin es ms eficiente?
Quin es el menos eficiente?
Qu porcentaje del trabajo total corresponde a cada una de las diferentes
tareas? Construya una grfica de pastel.
e) Qu porcentaje del trabajo total corresponde a cada una de las personas?
Construya una grfica de pastel.
f) Considerando que las personas deben de trabajar 8 hrs. En una escala del 010, Qu calificacin se le asigna a cada uno?
g) Considerando a la persona con mayor eficiencia un 10 y a la persona menos
eficiente un 5. Qu calificacin le corresponde al resto?

32

6. INTRODUCCIN A LA

PROBABILIDAD
La teora de la probabilidad fue aplicada con xito en las mesas de juego en un
principio y, lo que es ms importante en nuestro estudio, a problemas sociales y
econmicos. La industria de seguros, que surgi en el siglo XIX, requera un
conocimiento preciso acerca de los riesgos de prdida, con el fin de calcular las
primas. Medio siglo ms tarde, muchos centros de aprendizaje estaban estudiando la
probabilidad como una herramienta para el entendimiento de los fenmenos sociales.
En la actualidad, la teora matemtica de la probabilidad es la base para las
aplicaciones estadsticas, tanto en investigaciones sociales como en la toma de
decisiones.
Vivimos en un mundo incapaz de predecir el futuro con total certidumbre. Nuestra
necesidad de encarar a la incertidumbre nos lleva a estudiar y utilizar la teora de la
probabilidad. En muchos casos, nosotros, como ciudadanos preocupados, tendremos
algn conocimiento sobre los posibles resultados de una decisin. Al organizar esta
informacin y considerarla de manera sistemtica seremos capaces de reconocer
nuestras suposiciones, comunicar nuestro razonamiento a otras personas y tomar una
decisin ms slida que la que tomaramos si slo diramos palos de ciego.

Conceptos fundamentales
Un espacio muestral, es un listado de todos los eventos simples posibles que pueden
resultar del experimento probabilstico. Puede ser: una lista, un diagrama de rbol, un
sistema de red, etc. Los eventos simples no se traslapan, es decir, son completamente
ajenos. Se acostumbra denotar por al espacio muestral.
Ejemplo 6.1 Se arroja una moneda al aire y se observa cara () o cruz ().
Espacio muestral:
= {, }
Ejemplo 6.2 Se arrojan dos monedas (un peso y cinco pesos) al mismo tiempo, y se
observan caras y cruces en cada una. Utilizamos notacin ordenada (un peso, cinco
pesos).
Espacio muestral:
Diagrama de rbol:
Un peso

Cinco pesos
C

C
X
C
X
X
Listado:
= { , , , , , , , }

33

Cinco pesos

Representacin en red:

X
C
C
X
Un peso

Probabilidad de que ocurra un evento es la frecuencia relativa con que ocurre ese
evento, o la frecuencia relativa con la cual puede esperarse que ese evento ocurra.
=

Si el evento est constituido por diferentes puntos muestrales, la probabilidad ser la


suma de los puntos muestrales que conforman el evento.
Ejemplo 6.3 Qu probabilidad hay de extraer un as de un monte debidamente
barajado de 52 naipes?
= 4
= 52
4
1
=
=
52 13
Ejemplo 6.4 Un administrador de un conjunto grande de departamentos proporciona
la siguiente estimacin de probabilidades acerca del nmero de departamentos libres
que habr el prximo mes.
Departamentos libres
0
1
2
3
4
5

Probabilidad
0.05
0.15
0.35
0.25
0.10
0.10

D la probabilidad de cada uno de los siguientes eventos:


a) No haya departamentos libres

( = 0) = 0.05
b) Haya por lo menos cuatro departamentos libres

4 = = 4 + = 5 = 0.10 + 0.10 = 0.20


c) Haya dos o menos departamentos libres

2 = = 2 + = 1 + ( = 0) = 0.35 + 0.15 = 0.05

34

Probabilidad condicionada
Usualmente, en la probabilidad de un evento influye el hecho de que un evento
relacionado con l ya haya ocurrido. Suponga que tiene un evento cuya probabilidad
es (). Si obtiene informacin nueva y sabe que un evento relacionado con l,
denotado por , ya ha ocurrido, desear aprovechar esta informacin y volver a
calcular la probabilidad del evento . A esta nueva probabilidad del evento se le
conoce como probabilidad condicional y se expresa (|), la notacin | indica que
se est considerando la probabilidad del evento dada la condicin de que el evento
ha ocurrido. Por tanto, la notacin (|) se lee la probabilidad de dado .
=

( )
()

Evento ( )

Evento A

Evento B

Ejemplo 6.5 Considere el caso de las promociones de los agentes de polica de una
determinada ciudad. La fuerza policiaca consta de 1200 agentes, 960 hombres y 240
mujeres. En los ltimos dos aos, fueron promovidos 340. En la siguiente tabla se
muestra como quedaron repartidas estas promociones entre hombres y mujeres.
Hombre Mujer Total
Promovido

288

36

324

No promovido

672

204

876

Total

960

240

1200

Despus de analizar el registro de promociones, un comit femenil protest, ya que


haban sido promovidos 288 agentes hombres, frente a slo 36 mujeres. Los directivos
argumentaron que no se deba a una discriminacin, sino a que el nmero de mujeres
que son agentes de polica es una cantidad pequea. Determine si el argumento de
dicho comit tiene validez o no.
Sean
= .
= .
= .
=

35

Al dividir los valores de la tabla permite concretar la informacin que se tiene en las
siguientes probabilidades.
= 288/1200 = 0.24

Probabilidad agente sea hombre y sea promovido

= 672/1200 = 0.56

Probabilidad agente sea hombre y no sea promovido

= 36/1200 = 0.03

Probabilidad agente sea mujer y sea promovida

= 204/1200 = 0.17

Probabilidad agente sea mujer y no sea promovida

Cada uno de estos valores da la probabilidad de la interseccin de dos eventos, se les


llama probabilidades conjuntas, agrupndolos en una tabla, tenemos.
Hombre Mujer Total
Promovido

0.24

0.03

0.27

No promovido

0.56

0.17

0.73

Total

0.80

0.20

1.00

La pregunta al problema se resuelve plantendola de la siguiente manera:


a) Cul es la probabilidad de que exista una promocin dado que el agente sea
mujer?
=

( ) 0.03
=
= 0.15
()
0.20

b) Cul es la probabilidad de que exista una promocin dado que el agente sea
hombre?
( ) 0.24
=
=
= 0.30
()
0.80
En conclusin la probabilidad de que un agente sea promovido dado que es hombre
es el doble de la probabilidad de que un agente sea promovido dado que sea mujer,
aunque el uso de probabilidad condicional no demuestra por si misma que exista
discriminacin en este caso, los valores de probabilidad condicional confirman el
argumento presentado por las mujeres.

Probabilidad compuesta
La probabilidad compuesta (o regla de multiplicacin de probabilidades) se deriva de
la probabilidad condicional:
La probabilidad de que se den simultneamente dos sucesos (suceso interseccin de
A y B) es igual a la probabilidad a priori del suceso B multiplicada por la probabilidad
del suceso A condicionada al cumplimiento del suceso B.

36

La frmula para calcular esta probabilidad compuesta es.


=
O bien
=

Ejemplo 6.6 Estudiamos el suceso A (porcentaje de varones mayores de 40 aos


casados) y el suceso B (varones mayores de 40 aos con ms de 2 hijos) y
obtenemos la siguiente informacin:
a) Un 35% de los varones mayores de 40 aos estn casados.
b) De los varones mayores de 40 aos y casados, un 30% tienen ms de 2 hijos
(suceso B condicionado al suceso A).
c) Calcular la probabilidad de que un varn mayor de 40 aos est casado y
tenga ms de 2 hijos (suceso interseccin de A y B).
Por lo tanto:
() = 0.35
(|) = 0.30
= 0.35 0.30 = 0.105
Es decir, un 10.5% de los varones mayores de 40 aos estn casados y tienen ms de
2 hijos.

Probabilidad total
Sea 1 , 2 , , un sistema completo de eventos tales que la probabilidad de cada
uno de ellos es distinto de cero, y sea un evento cualquiera del que se conocen las
probabilidades condicionales (| ).
Entonces, la probabilidad del evento , llamada probabilidad total, se calcula
empleando la siguiente frmula:
= 1 1 + 2 2 + + (| )
Ejemplo 6.7 Se dispone de tres cajas con bombillas. La primera contiene 10
bombillas, de las cuales hay cuatro fundidas; en la segunda hay seis bombillas,
estando una de ellas fundida, y la tercera caja hay tres bombillas fundidas de un total
de ocho. Cul es la probabilidad de que al tomar una bombilla al azar de una
cualquiera de las cajas, est fundida?

6/10

1 caja
1/3

1/3

4/10

5/6

2 caja
1/6
5/8

1/3

F
B

3 caja
3/8

37

De acuerdo al diagrama de rbol y a lo aprendido respecto a probabilidad condicional


tenemos:
=

1 4 1 1 1 3 113

+ + =
0.31
3 10 3 6 3 8 360

Teorema de Bayes
En el estudio de la probabilidad condicional se vio que revisar las probabilidades
cuando se obtiene informacin es parte importante del anlisis de probabilidades. Por
lo general, se suele iniciar el anlisis con una estimacin de probabilidad inicial o
probabilidad previa de los eventos que interesan. Despus, de fuentes como una
muestra, una informacin especial o una prueba de producto, se obtiene ms
informacin sobre estos eventos. Dada esta nueva informacin, se modifican o revisan
los valores de probabilidad mediante el clculo de probabilidades revisadas a las que
se les conoce como probabilidades posteriores. El teorema de Bayes es un medio
para calcular estas probabilidades, el proceso de revisin es el siguiente:
Probabilidades
previas

Aplicacin del
teorema de
Bayes

Nueva
informacin

Probabilidades
posteriores

Matemticamente el Teorema de Bayes es:


=

1 1

(| )
+ 2 2 + + (| )

Ejemplo 6.8 Considere una fbrica que compra piezas de dos proveedores. Sea 1 el
evento la pieza proviene del proveedor 1 y 2 el evento proviene del proveedor 2. De
las piezas que compra la fabrica, 65% proviene del proveedor 1 y 35% del proveedor
2. Por lo tanto, si toma una pieza aleatoriamente, le asignar las probabilidades
previas 1 = 0.65 y 2 = 0.35.
La calidad de las piezas compradas vara de acuerdo con el proveedor. Si denota el
evento la pieza es buena y denota el evento la pieza es mala, las probabilidades
condicionales por experiencia son:
1 = 0.98

1 = 0.02

2 = 0.95

2 = 0.05

Suponga ahora que las piezas de los dos proveedores se emplean en el proceso de
fabricacin de esta empresa y que una mquina se descompone al tratar de procesar
una pieza mal. Dada la informacin de que la pieza es mala, Cul es la probabilidad
de que sea del proveedor 1 y cul es la probabilidad de que sea del proveedor 2?
Las dos preguntas en lenguaje matemticos son:
a) 1 =

1 (|1 )
1 1 + 2 2

b) 2 =

2 (|2 )
1 1 + 2 2

38

Para resolver esa situacin de manera sencilla dibujemos un diagrama de rbol con la
informacin del problema y recordemos el significado de probabilidad compuesta.

|1

1 = 1 * |1 = 0.6370
0.98

|1
0.02

1 = 1 * |1 = 0.0130

0.65
2

|2

0.35

2 = 2 * |2 = 0.3325
0.95

|2
0.05

2 = 2 * |2 = 0.0175

Ocupando ahora el teorema de Bayes:


a) 1 =

1 (|1 )
1 1 + 2 2

= 0.0130 +0.0175 = 0.0305 = 0.4262

b) 2 =

2 (|2 )
1 1 + 2 2

= 0.0305 = 0.5738

0.0130

0.0130

0.0175

Independencia de sucesos
Es un caso especial en el que P A B = P(A), es decir, el que suceda A es
independiente del suceso B.
Recordando el significado de probabilidad compuesta tenemos que:
P AB = P B P A B
Sustituyendo:
P A B = P B P A = P A P(B)
Ejemplo 6.9 Cul es la probabilidad de obtener dos caras en dos lanzamientos de
una moneda equilibrada?
Puesto que la probabilidad de las caras es de

1
2
1 1

por cada lanzamiento y los


1

lanzamientos son independientes, la probabilidad es 2 2 = 4.


Ejemplo 6.10 Se extraen dos cartas al azar de un monte ordinario de 52 naipes. Qu
probabilidad hay de obtener dos ases si
a) La primera carta es reemplazada antes de extraer la segunda.
b) La primera carta no es reemplazada antes de extraer la segunda.
Para el primer caso, tenemos que entre los 52 naipes hay cuatro ases, obteniendo
4
4

52 52

= 169 .
39

En el segundo caso tenemos que al haber obtenido nuestro primer as, nos queda un
monte de 51 naipes entre ellos solo 3 ases, por lo tanto

4
3

52 51

1
.
221

Notamos que ambos resultados no son iguales de manera que la independencia se


viola cuando el muestreo es sin reemplazo.
Problemas para el captulo 6.
6.1 Obtenga el espacio muestral asociado a los siguientes experimentos.
a) Se tira un solo dado una vez, a fin de observar el nmero obtenido en la cara
superior.
Espacio muestral:
b) Una caja contiene tres fichas (una roja, una azul y una blanca), y se sacan dos
con reemplazo; es decir, se selecciona una ficha, se observa su color y en
seguida se vuelve a meter a la caja. A continuacin, se revuelven las fichas y
se selecciona la segunda y se observa su color.
Espacio muestral:
c) Repetir el experimento anterior, pero en este caso no devuelva la ficha antes
de hacer la segunda seleccin.
Espacio muestral:
d) Se tiran dos dados (uno azul y uno rojo) al mismo tiempo, y se observa el
nmero de puntos que aparecen en la cara superior de cada uno.
Espacio muestral:
6.2 La revista Fortune publica anualmente una lista de las 500 empresas ms
grandes de EUA. A continuacin se presentan los estados en los que existe
mayor nmero de estas 500 empresas.
Estado
Nmero de empresas
Nueva York
54
California
52
Texas
48
Illinois
33
Ohio
30
Suponga que se elige una de las 500 empresas de Fortune, Cul es la
probabilidad de cada uno de los siguientes eventos?
a) Sea el evento: La empresa se encuentra en Nueva York. Halle ().

b) Sea el evento: La empresa se encuentra en Texas. Halle ().


c) Sea el evento: La empresa se encuentra en uno de los cinco estados. Halle
().

40

6.3 La siguiente tabla muestra la distribucin de edades por sexo en Mxico, segn
datos del INEGI (2010)

Suponga una seleccin aleatoria de una persona de esta poblacin.


a)
b)
c)
d)

Cul es la probabilidad de que una persona tenga entre 20 y 24 aos?


De que la persona tenga entre 20 y 34 aos?
De que tenga 45 o ms aos?
De que tenga menos de 25 aos y sea mujer?

6.4 Estudiamos el suceso A (alumnos que hablan ingls) y el suceso B (alumnos


que hablan alemn) y obtenemos la siguiente informacin:
Un 50% de los alumnos hablan ingls.
De los alumnos que hablan ingls, un 20% hablan tambin alemn (suceso B
condicionado al suceso A).
Calcular la probabilidad de que un alumno hable ingls y alemn (suceso
interseccin de A y B).
6.5 Una compaa de transporte pblico tiene tres lneas en una ciudad, de forma
que el 45% de los autobuses cubre el servicio de la lnea 1, el 25% cubre la
lnea 2 y el 30% cubre el servicio de la lnea 3. Se sabe que la probabilidad de
que, diariamente, un autobs se avere es del 2%, 3% y 1% respectivamente,
para cada lnea.
a) Calcular la probabilidad de que, en un da, un autobs sufra una avera
b) Calcular la probabilidad de que, en un da, un autobs no sufra una avera

6.6 Considere el caso de la compra o no de cierto bien, bajo el supuesto de


planearlo o no.
Sean
= .
= .
= .
= .
41

La siguiente tabla condensa los resultados.

Total

0.20 0.10

0.30

0.05 0.65

0.70

Total 0.25 0.75

1.00

Responda lo siguiente:
a)
b)
c)
d)
e)

Cul es la probabilidad de que una persona compre un bien?


Cul es la probabilidad de que una persona no compre un bien?
Cul es la probabilidad de que una persona planee comprar?
Cul es la probabilidad de que una persona no planee comprar?
Cul es la probabilidad de que una persona compre un bien dado que
planeaba comprarlo?
f) Cul es la probabilidad de que una persona compre un bien dado que no
planeaba comprar
g) Cul es la probabilidad de que una persona no compre un bien dado que
planeaba comprarlo?
h) Cul es la probabilidad de que una persona no compre un bien dado que no
planeaba comprarlo?
i) Cul es la probabilidad de que una persona planeara comprar un bien dado
que lo compr?
j) Cul es la probabilidad de que una persona planeara comprar un bien dado
que no lo compr?
6.7 Si = 0.65, = 0.40 = 0.24 Los eventos y son
independientes?
6.8 Convengamos en que es el evento en el que se dispone de materia prima
cuando se necesita y es el evento en el que el tiempo de operacin de la
maquinaria es inferior a 1 hora. Si = 0.8 = 0.7, asigne la
probabilidad al evento .

42

7. ACERCAMIENTO A LAS

DISTRIBUCIONES DE
PROBABILIDAD
En el captulo 3 describimos a las distribuciones de frecuencias como una forma til de
resumir las variaciones en los datos observados. Preparamos distribuciones de
frecuencias haciendo una lista de todos los resultados posibles de un experimento
para despus indicar la frecuencia observada de cada resultado posible. Las
distribuciones de probabilidad estn relacionadas con las distribuciones de
frecuencias. De hecho, podemos pensar que una distribucin de probabilidad es una
distribucin de frecuencias terica. Qu significa lo anterior? Una distribucin de
frecuencias terica es una distribucin de probabilidades que describe la forma en que
se espera varen los resultados. Como estas distribuciones representan expectativas
de que algo suceda, resultan modelos tiles para hacer inferencias y tomar decisiones
en condiciones de incertidumbre.

Distribucin Binomial
Una distribucin de probabilidad de variable aleatoria discreta utilizada ampliamente es
la distribucin binomial. Esta distribucin describe una variedad de procesos de inters
para los administradores. Las caractersticas que describen un experimento de
probabilidad binomial son:
1. El resultado de cada prueba de un experimento se clasifica en una de dos
categoras mutuamente excluyentes: xito o fracaso.
2. La variable aleatoria permite contar el nmero de xitos en una cantidad fija de
pruebas.
3. La probabilidad de xito y fracaso es la misma para cada prueba.
4. Las pruebas son independientes, lo cual significa que el resultado de una
prueba no influye en el resultado de otra prueba.
DISTRIBUCIN BINOMIAL
= = (1 )

Donde
: combinaciones de en .
: nmero de pruebas.
: nmero de xitos.
: probabilidad de xito en cada prueba.

La media () y varianza ( 2 ) de una distribucin binomial se calculan como sigue.


MEDIA
=

VARIANZA
2 = (1 )

43

Ejemplo 7.1 Estudios revelan que un envo tiene un 95% de probabilidad de cumplir
con su tiempo de llegada entre dos ciudades. Se realizan 200 envos calcule.
a)
b)
c)
d)
e)
f)

La probabilidad de que los 200 envos cumplan su tiempo de llegada.


Cuntos envos se espera que cumplan su tiempo de llegada?
Cmo es la dispersin de esta distribucin?
La probabilidad de que ms de 190 envos cumplan su tiempo de llegada.
A partir de cuntos envos usted podra garantizar un 99% de cumplimiento?
Cmo podra mejorar esta caracterstica?

Solucin.
Identifiquemos los parmetros de la situacin descrita: = 200, = 0.95.
a) = 200 = 200 200 (0.95)200 (1 0.95)200200 = 0.000035
Lo que lo hace prcticamente nula.
b) = = 200 0.95 = 190.
Esto indica que en promedio se espera que 190 cumplan con el tiempo de
llegada.
c) 2 = (1 ) = 200 0.95 (1 0.95) = 9.5.
Por ende su desviacin estndar es = 9.5 = 3.08, calculando el coeficiente de
variacin =

3.08
190

= 0.0162. Lo cual indica un valor pequeo, esto quiere decir

que la distribucin est muy concentrada alrededor de la media.


d) 190 = = 190 + = 191 + + = 200 = 0.5830
Es una probabilidad ms grande, sin embargo, no es lo suficiente como para indicar
que es muy posible.
e) = 0.99, lo que se traduce en encontrar el valor de que satisface esa
condicin en la probabilidad. Observando la tabla, se tiene que = 182.
=

( = )

( )

200

0.000035

0.000035

199

0.000369

0.000404

198

0.001932

0.002336

197

0.006712

0.009048

196

0.017398

0.026447

195

0.035896

0.062342

194

0.061401

0.123743

193

0.089562

0.213305

192

0.113720

0.327024

191

0.127685

0.454710

190

0.128357

0.583067

189

0.116689

0.699756

188

0.096729

0.796484

187

0.073623

0.870108

186

0.051758

0.921866

185

0.033779

0.955644

184

0.020556

0.976201

183

0.011710

0.987911

182

0.006266

0.994176

f) Incrementando la probabilidad de que cada paquete llegue a su destino.


44

Distribucin de Poisson
La distribucin de probabilidad de Poisson describe el nmero de veces que se
presenta un evento durante un intervalo especfico. El intervalo puede ser de tiempo,
distancia, rea o volumen.
1. La variable aleatoria es el nmero de veces que ocurre un evento durante un
intervalo definido.
2. La probabilidad de que ocurra el evento es proporcional al tamao del intervalo.
3. Los intervalos no se superponen y son independientes.
DISTRIBUCIN DE POISSON

= =
!
Donde
: media de la cantidad de veces que se presenta un evento.
: nmero de Euler (2.7182)
: nmero de veces que se presenta un evento.
La media () y varianza ( 2 ) de una distribucin binomial se calculan como sigue.
MEDIA
=

VARIANZA
2 =

Ejemplo 7.2 Un promedio de 4 envos no llegan a su destino durante una semana


laboral, calcule.

a)
b)
c)
d)

La probabilidad de que 0 envos no lleguen a su destino durante una semana.


La probabilidad de que 1 envo no llegue a su destino durante una semana.
La probabilidad de que 4 envos no llegue a su destino durante una semana.
Cuntos envos no llegan a su destino durante una semana con un 98% de
certeza?

Solucin.
Identifiquemos el parmetro de la situacin descrita: = 4
40 4

a) = 0 = 0! = 0.0183
Lo que lo hace una probabilidad muy baja, no sera comn observar esto.
41 4

b) = 1 = 1! = 0.0732
A diferencia del caso anterior tiene una probabilidad ms considerable.
44 4

c) = 4 =
= 0.1953
4!
Es ms probable de observar, es de esperarse ya que estamos calculando la
probabilidad de que ocurra el promedio de eventos.

45

f)

= 0.98, lo que se traduce en encontrar el valor de que satisface esa


condicin en la probabilidad. Observando la tabla, se tiene que = 9. Esto
quiere decir que a lo ms nueve envos no llegan a su destino durante una
semana con un 98% de certeza.
=

( = )

( )

0.018316

0.018316

0.073263

0.091578

0.146525

0.238103

0.195367

0.433470

0.195367

0.628837

0.156293

0.785130

0.104196

0.889326

0.059540

0.948866

0.029770

0.978637

0.013231

0.991868

Problemas para el captulo 7.


7.1 Estudios revelan que un envo tiene un 98% de probabilidad de cumplir

con su tiempo de llegada entre dos ciudades. Se realizan 150 envos


calcule.
a)
b)
c)
d)

La probabilidad de que los 150 envos cumplan su tiempo de llegada.


Cuntos envos se espera que cumplan su tiempo de llegada?
Cmo es la dispersin de esta distribucin?
La probabilidad de que 147 envos cumplan su tiempo de llegada. Qu puede
afirmar sobre este valor de probabilidad?
e) Construya un histograma alrededor de la media considerando unos cuantos
valores de la distribucin.
f) La probabilidad de que ms de 146 envos cumplan su tiempo de llegada.
g) A partir de cuntos envos usted podra garantizar un 99% de cumplimiento?
h) Cmo podra mejorar esta caracterstica?

7.2 Un promedio de 10 envos no llegan a su destino durante un mes laboral,


calcule.
a) La probabilidad de que 0 envos no lleguen a su destino durante un mes.
b) La probabilidad de que 1 envo no llegue a su destino durante un mes.
c) La probabilidad de que 10 envos no llegue a su destino durante un mes. Qu
puede afirmar sobre este valor de probabilidad?
d) Construya un histograma alrededor de la media considerando unos cuantos
valores de la distribucin.
e) Cuntos envos no llegan a su destino durante un mes con un 99% de
certeza?

46

8. INTRODUCCIN A LA

REGRESIN LINEAL
Todos los das, administradores y gerentes toman decisiones personales y
profesionales basadas en predicciones de sucesos futuros. Para hacer estos
pronsticos, se basan en la relacin (intuitiva y calculada) entre lo que ya se sabe y lo
que se debe estimar. Si los responsables de la toma de decisiones pueden determinar
cmo lo conocido se relaciona con el evento futuro, pueden ayudar considerablemente
al proceso de toma de decisiones. se es el objetivo de este captulo: cmo
determinar la relacin entre variables.

Diagramas de dispersin
El primer paso para determinar si existe una relacin entre dos variables es examinar
la grfica de los datos observados (o conocidos). Esta grfica, o dibujo, se llama
diagrama de dispersin. Un diagrama de dispersin nos puede dar dos tipos de
informacin. Visualmente, podemos identificar patrones que indiquen que las variables
estn relacionadas. Si esto sucede, podemos ver qu tipo de lnea, o ecuacin de
estimacin, describe esta relacin.

Relaciones posibles entre y en diagramas de dispersin

Las grficas (a) y (b) muestran relaciones lineales directas e inversas. Las grficas (c)
y (d) son ejemplos de relaciones curvilneas que indican asociaciones directas e
inversas entre variables, respectivamente. La grfica (e) ilustra una relacin lineal
inversa con un patrn de puntos ampliamente disperso. Esta mayor dispersin indica
que existe menor grado de asociacin entre las variables independiente y dependiente
que el existente en la grfica (b). El patrn de puntos en la grfica (f) parece indicar
que no existe relacin entre las dos variables; por tanto, conocer el pasado referente a
una variable no nos permitir pronosticar ocurrencias futuras de la otra.

47

La idea bsica para el desarrollo de nuestro anlisis es adaptar la relacin de los datos
a una relacin lineal, es decir, una ecuacin de la forma.
ECUACIN DE LA RECTA
= +

Donde
: variable de respuesta (dependiente).
: variable controlada (independiente).
: pendiente.
: ordenada al origen.
Dicha ecuacin describir una recta ajustada a los datos tal como se muestra en la
figura anterior en los incisos (a), (b) y (e), el objetivo es calcular los parmetros y
asociados a la ecuacin, ya que los mismos definen por completo y de manera nica a
la recta.
Para ello se procede de manera estadstica a estimarlos con las siguientes
expresiones.
=

=
=

El "gorro" indica que es un valor estimado, el valor 2 se conoce como coeficiente de


determinacin y establece que tan ligadas estn las variables.
Ejemplo 8.1 Se cuenta con los registros que involucran al gasto de investigacin y
desarrollo con la ganancia anual, tal como se presentan a continuacin.
Millones de dlares
gastados en investigacin
y desarrollo
2
3
5
4
11
5
a)
b)
c)
d)

Ganancia anual (millones


de dlares)
20
25
34
30
40
31

Construya un diagrama de dispersin.


Estime los parmetros de la recta.
Calcule el coeficiente de correlacin.
Estime la ganancia que se tendr al invertir 8 millones

48

Ganancia anual

Dispersin de los puntos y = 2x + 20


R = 0.826

45
40
35
30
25
20
15
0

10

12

Gastos de investigacin y desarrollo

En Excel se procede de la siguiente forma:


1)
2)
3)
4)

Primeramente se construye una tabla con los valores.


Se construye una grfica de dispersin. Insertar->Grficos->Dispersin
Clic derecho sobre alguno de los puntos y clic en Agregar Lnea de Tendencia.
Habilitar las casillas de Mostrar ecuacin y Presentar el valor 2 .

d) Para realizar la prediccin, se sustituye el valor = 8 en la ecuacin.


= 2 8 + 20 = 28. Es decir, uno espera ganar 28 millones al invertir 8 de
ellos.

Problemas para el captulo 8.


8.1 Los siguientes datos expresan la relacin que existe entre los aos de
antigedad en un trabajo y la realizacin semanal de cierta cantidad de tareas
en especfico. Los datos se obtienen considerando a cinco empleados.
Aos de antigedad
14
7
3
15
11
a)
b)
c)
d)

Cantidad de tareas
semanales
6
5
3
9
7

Construya un diagrama de dispersin.


Estime los parmetros de la recta.
Calcule el coeficiente de correlacin.
Estime la ganancia que se tendr al invertir 8 millones

49

Fuentes consultadas
1.

Lind Douglas A/ William G Marchal/ Wathen. Estadstica aplicada a los negocios y la


economa. Editorial Mc Graw Hill, Mxico 2008, 13 Edicin.

2.

Kohler Heins. Estadstica para negocios y economa. Compaa Editorial Continental, Mxico
1999, 1 Edicin.

3.

Hend Black. Estadstica en los negocios. Editorial CECSA Mxico 2005.

4.

David R. Anderson/ Dennis J. Sweeney/ Thomas A. Williams. Estadstica para administracin


y economa. Editorial CENGAGE Learning, 10 Edicion.

5.

Allen L. Webster. Estadstica aplicada a los negocios y la economa. Editorial Mc Graw Hill, 3
Edicin

6.

Richard A. Johnson Probabilidad y estadstica para ingenieros de Miller y Freund. Editorial


Prentice Hall, 5 Edicion.

50

Anda mungkin juga menyukai