Apuntes de Clase
Ra
ul Eyzaguirre
Escuela Universitaria de Ingeniera
Universidad de Lima
13 de agosto de 2012
Prefacio
Estos apuntes fueron desarrollados para el dictado del curso Estadstica y Probabilidad
I en la escuela de ingeniera de la Universidad de Lima. Si bien este material esta dirigido
especialmente a los estudiantes de dicho curso, puede ser de utilidad para cualquier estudiante
de pregrado que este llevando su primer curso de estadstica.
Estos apuntes cubren los temas de estadstica descriptiva y calculo de probabilidades. En
el captulo 1 se presentan una serie de deniciones basicas a tener en cuenta en captulos pos-
teriores. En el captulo 2 se trata el tema de organizacion y resumen de datos mediante tablas
de frecuencias y gracos. En el captulo 3 se estudian las principales medidas de posicion,
variabilidad y forma, utiles para describir cualquier conjunto de datos. En el captulo 4 se
presentan dos herramientas de analisis exploratorio de datos, el graco de cajas y el graco
de tallos y hojas. En el captulo 5 se inicia el estudio del calculo de probabilidades. Este cap-
tulo empieza con una revision de los metodos de enumeracion, para luego presentar algunas
deniciones de probabilidad y los temas de probabilidad condicional e independencia. En el
captulo 6 se toca el tema de las variables aleatorias discretas y continuas. Finalmente, en
los captulos 7 y 8, se presentan las principales distribuciones de probabilidad para variables
discretas y continuas.
Para quienes lleven el curso de Estadstica y Probabilidad I en la Universidad de Lima con
estos apuntes se recomienda, como material adicional, a Barreno et. al [1], y a Montgomery y
Runger [3]. La forma en la que son tratados los temas no es dependiente de ning un software
estadstico, aunque el curso de Estadstica y Probabilidad I se desarrolla utilizando MINITAB
(http://www.minitab.com). Cabe mencionar que algunos de los calculos y gracos presen-
tados en estos apuntes fueron realizados utilizando R [4]. Un buen material de consulta sobre
los temas de estadstica descriptiva e inferencia estadstica utilizando R [4] es Trosset [5].
i
ii
Indice general
Prefacio I
1. Conceptos Basicos 1
1.1. Estadstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Poblacion, muestra y unidad elemental . . . . . . . . . . . . . . . . . . . . . . . 1
1.3. Variable y observacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4. Escalas de medida (Estudio opcional) . . . . . . . . . . . . . . . . . . . . . . . 3
1.5. Parametro y estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.6. Estadstica descriptiva e inferencia estadstica . . . . . . . . . . . . . . . . . . . 4
1.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2. Organizacion de Datos 7
2.1. Organizacion de datos cualitativos . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2. Organizacion de datos cuantitativos discretos . . . . . . . . . . . . . . . . . . . 8
2.3. Organizacion de datos cuantitativos continuos . . . . . . . . . . . . . . . . . . . 10
2.3.1. Tabla de frecuencias con datos cuantitativos continuos . . . . . . . . . . 10
2.3.2. Interpolacion a partir de la tabla de frecuencias . . . . . . . . . . . . . . 12
2.3.3. Histograma de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3.4. Polgono de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3.5. Polgono de frecuencias acumuladas o curva ojiva . . . . . . . . . . . . . 15
2.4. Graco de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3. Medidas de Posicion, Varibilidad y Forma 19
3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2. Medidas de posicion central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.1. Media aritmetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.2. Media ponderada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2.3. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2.4. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
iii
iv
INDICE GENERAL
3.3. Cuantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.4. Medidas de variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4.1. Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4.2. Rango intercuartlico (RIC) . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.4.3. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.4.4. Desviacion estandar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.4.5. Coeciente de variacion . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.5. Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.5.1. Asimetra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.5.2. Curtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4. Analisis Exploratorio de Datos 33
4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.2. Graco de cajas y bigotes (Boxplot o box-and-whisker plot) . . . . . . . . . . . 33
4.3. Graco de tallos y hojas (Steam and leaf) . . . . . . . . . . . . . . . . . . . . . 35
4.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5. Probabilidades 37
5.1. Metodos de enumeracion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.1.1. Principio de multiplicacion . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.1.2. Principio de adicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.1.3. Factorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.1.4. Combinacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.1.5. Permutacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.1.6. Permutacion con elementos iguales . . . . . . . . . . . . . . . . . . . . . 38
5.2. Conceptos de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.2.1. Experimento aleatorio () . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.2.2. Espacio Muestral () y punto muestral () . . . . . . . . . . . . . . . . 39
5.2.3. Evento o suceso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5.2.4. Denicion clasica o a priori de probabilidad . . . . . . . . . . . . . . . . 40
5.2.5. Denicion de probabilidad a partir de frecuencias relativas o a posteriori 41
5.2.6. Denicion axiomatica de probabilidad . . . . . . . . . . . . . . . . . . . 41
5.2.7. Denicion subjetiva de probabilidad . . . . . . . . . . . . . . . . . . . . 41
5.2.8. Teoremas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.3. Probabilidad condicional e independencia . . . . . . . . . . . . . . . . . . . . . 42
5.3.1. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.3.2. Axiomas de probabilidad condicional . . . . . . . . . . . . . . . . . . . . 42
5.3.3. Teoremas de probabilidad condicional . . . . . . . . . . . . . . . . . . . 43
INDICE GENERAL v
5.3.4. Regla de la multiplicacion . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.3.5. Teorema de probabilidad total . . . . . . . . . . . . . . . . . . . . . . . 43
5.3.6. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.3.7. Independencia de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
6. Variables Aleatorias 51
6.1. Denicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6.2. Variable aleatoria discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6.2.1. Funcion de masa de probabilidad de una variable aleatoria discreta (fmp) 51
6.2.2. Funcion de distribucion acumulada de una variable aleatoria discreta
(fda) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
6.3. Variable aleatoria continua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.3.1. Funcion de densidad de probabilidad de una variable aleatoria continua
(fdp) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
6.3.2. Probabilidad de un evento . . . . . . . . . . . . . . . . . . . . . . . . . . 54
6.3.3. Funcion de distribucion acumulada de una variable aleatoria continua
(fda) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
6.4. Valor esperado y varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.4.1. Valor esperado o esperanza matematica de una funcion de una variable
aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
6.4.2. Media, valor esperado o esperanza matematica de una variable aleatoria 56
6.4.3. Varianza de una variable aleatoria . . . . . . . . . . . . . . . . . . . . . 56
6.4.4. Propiedades del valor esperado y de la varianza . . . . . . . . . . . . . . 57
6.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7. Distribuciones de Probabilidad Discretas 63
7.1. Distribucion binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
7.1.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
7.1.2. Caractersticas de la distribucion binomial . . . . . . . . . . . . . . . . . 64
7.1.3. Distribucion de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2. Distribucion hipergeometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
7.2.2. Caractersticas de la distribucion hipergeometrica . . . . . . . . . . . . . 65
7.3. Distribucion de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
7.3.2. Caractersticas de la distribucion de Poisson . . . . . . . . . . . . . . . . 67
7.4. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
8. Distribuciones de Probabilidad Continuas 73
vi
INDICE GENERAL
8.1. Distribucion uniforme continua . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8.1.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
8.1.2. Caractersticas de la distribucion uniforme continua . . . . . . . . . . . 73
8.2. Distribucion normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
8.2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
8.2.2. Caractersticas de la distribucion normal . . . . . . . . . . . . . . . . . . 75
8.2.3. Distribucion normal estandar . . . . . . . . . . . . . . . . . . . . . . . . 76
8.3. Distribucion gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.3.2. Caractersticas de la distribucion gamma . . . . . . . . . . . . . . . . . 78
8.4. Distribucion exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
8.4.2. Caractersticas de la distribucion exponencial . . . . . . . . . . . . . . . 79
8.5. Distribucion de Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
8.5.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
8.5.2. Caractersticas de la distribucion de Weibull . . . . . . . . . . . . . . . . 80
8.6. Distribucion ji-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
8.6.2. Caractersticas de la distribucion ji-cuadrado . . . . . . . . . . . . . . . 81
8.7. Distribucion t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.7.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
8.7.2. Caractersticas de la distribucion t de Student . . . . . . . . . . . . . . . 82
8.8. Distribucion F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
8.8.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
8.8.2. Caractersticas de la distribucion F . . . . . . . . . . . . . . . . . . . . . 84
8.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
Bibliografa 91
Captulo 1
Conceptos Basicos
1.1. Estadstica
Estadstica es la ciencia que se ocupa de la recoleccion, organizacion y analisis de datos,
y de la posterior presentacion e interpretacion de los resultados. El objetivo nal suele ser
tomar una decision a partir de toda la informacion disponible, y en este sentido la estadstica
busca tambien evaluar la conabilidad de las conclusiones que se puedan derivar de dicha
informacion. La estadstica es principalmente util en el analisis de datos en situaciones de in-
certidumbre por lo que los resultados estadsticos estaran siempre sujetos a cierta probabilidad
de error.
1.2. Poblacion, muestra y unidad elemental
Tal vez la forma mas simple de denir a una poblacion sea como el conjunto de todos los
elementos o unidades que presentan cierta caracterstica com un. En este sentido, si el interes
es investigar el nivel educativo de los habitantes de cierta ciudad (la caracterstica com un es
que todos viven en la ciudad), todos los habitantes de dicha ciudad constituiran la poblacion
de interes; si el interes es investigar la distribucion de cierta plaga en un cultivo de palma
aceitera, la poblacion podra estar constituida por todos los arboles de la plantacion.
En un sentido mas amplio, el termino poblacion podra estar referido al total de observa-
ciones de interes. Entonces, por poblacion podra uno referirse a:
Una poblacion fsica, como por ejemplo las poblaciones humanas o cualquier grupo de
individuos u objetos.
Una poblacion conceptual, como por ejemplo el conjunto de todos los resultados que
podran obtenerse si un experimento fuese repetido indenidamente.
La primera denicion sera predominante en la primera parte del curso en donde se tratara
el tema de la estadstica descriptiva; la segunda denicion sera mas apropiada en la segunda
parte del curso, en donde se tratara el tema de probabilidades, y en el curso de Estadstica
y Probabilidad II en donde se estudiaran algunos metodos de la inferencia estadstica. Una
poblacion puede ser nita o innita; cuando la poblacion es nita su tama no sera denotado
por N.
1
2 CAP
ITULO 1. CONCEPTOS B
ASICOS
Una muestra es cualquier subconjunto de la poblacion y una unidad elemental, al menos
en el primer sentido de poblacion, es cada uno de sus elementos. El tama no de la muestra
sera denotado por n.
Ejemplo 1: Suponga que se desea realizar una investigacion sobre las preferencias electorales en el
Per u antes de una eleccion, y que para ello se cuenta con recursos para entrevistar a un total de 500
electores. Entonces, todos los peruanos inscritos en el padron electoral son la poblacion en estudio, los
500 electores seleccionados la muestra, y cada uno de los electores es una unidad elemental.
Ejemplo 2: Suponga que se desea estudiar la resistencia a la rotura de cierto tipo de material y que se
cuenta con recursos para efectuar 40 pruebas. En este caso la poblacion es conceptual, y esta compuesta
por todos los resultados que podran obtenerse al evaluar la resistencia a la rotura en materiales del
tipo sometido a prueba, la muestra esta compuesta por las 40 pruebas, y una unidad elemental es cada
una de las pruebas.
Dependiendo de la forma en que son seleccionados los elementos de la muestra, esta puede
ser aleatoria o no aleatoria. En una muestra aleatoria, todas las unidades tienen una probabi-
lidad conocida no nula de ser seleccionadas. Una muestra aleatoria permite inferir, bajo cierto
nivel de conabilidad, como podra ser la poblacion desde la cual fue extrada (a este proceso
se le conoce como inferencia estadstica).
El proceso de muestreo puede ser con reemplazo o sin reemplazo. En el muestreo con
reemplazo, un elemento que ya ha sido elegido en la muestra puede ser elegido otra vez.
Ejemplo 3: Suponga que se va a extraer una muestra de tama no 2 de la poblacion de letras {a, b, c,
d}. Si el muestreo es sin reemplazo, todas las muestras posibles son (a, b), (a, c), (a, d), (b, c), (b, d)
y (c, d). Si el muestreo es con reemplazo, todas las muestras posibles son (a, a), (a, b), (a, c), (a, d),
(b, b), (b, c), (b, d), (c, c), (c, d) y (d, d).
1.3. Variable y observaci on
Una variable es cualquier caracterstica de las unidades elementales que puede tomar
valores diferentes. Las variables se clasican en variables cuantitativas continuas, cuantitativas
discretas, cualitativas jerarquicas u ordinales y cualitativas nominales, y son denotadas por
letras may usculas, principalmente por X, Y, y Z.
Una variable cuantitativa es aquella cuyos resultados expresan una magnitud que puede
representarse numericamente. Una variable cuantitativa es discreta si sus distintos valores se
pueden enumerar en secuencia. Una variable cuantitativa es continua si puede tomar cualquier
valor en un intervalo dado.
Ejemplo 4:
Considere una poblacion de electores y sea X el n umero de elecciones en las que ha participado
un elector. Entonces X es una variable cuantitativa discreta.
Considere una fabrica que produce mermeladas y sea Y el contenido neto en gramos de los
frascos de mermelada. Entonces Y es una variable cuantitativa continua.
Una observacion es el dato o valor registrado de una variable en una unidad elemental. El
valor observado en una variable sera denotado por letras min usculas, principalmente por x, y,
y z.
Ejemplo 6: Para cada uno de los ejemplos de variables indicados anteriormente se podran registrar
las siguientes observaciones:
Para la variable n umero de elecciones: Un elector ha participado en 5 elecciones.
Para la variable contenido neto de un frasco de mermelada: Un frasco tiene un contenido neto
de 989 gramos.
Para la variable calidad de la mermelada: Un frasco es de segunda.
Para la variable candidato de preferencia: El elector piensa votar por el candidato Juan Perez.
ITULO 1. CONCEPTOS B
ASICOS
Una escala de medida es de razon o proporcion si, ademas de las relaciones anteriores, es
posible establecer una relacion de proporcionalidad entre sus distintos valores. Ello supone la
existencia de un cero intrnseco a la magnitud que se esta midiendo. Ejemplos: N umero de
hijos, peso, altura.
1.5. Parametro y estadstico
Un parametro es una caracterstica de una poblacion. Si la poblacion fuera nita, sus
parametros seran funciones de todas sus observaciones. Dado que la poblacion es unica, el
valor de los parametros es tambien unico, esto es, es una constante; dado que por lo general
no se tiene informacion de toda la poblacion, los parametros son generalmente constantes
desconocidas. Usualmente los parametros se denotan con letras griegas como (que representa
la media de una poblacion) o (que representa una proporcion poblacional).
Un estadstico es cualquier funcion de las observaciones de una muestra. Un estadstico es
una variable pues depende de los elementos de la muestra (distintas muestras daran distintos
valores para el estadstico).
Ejemplo 7:
Con una muestra de 500 electores se obtuvo que el 20 % no sabe a un por quien votar. Este
resultado corresponde a un valor estadstico (una proporcion muestral).
De la produccion total de frascos de mermelada se obtuvo un contenido neto medio de 998 gr.
Este resultado corresponde a un parametro (una media poblacional).
ITULO 1. CONCEPTOS B
ASICOS
Forma homogenea, de ser posible como pelotas de tenis. Esto es importante para
la maquina cortadora. La forma es evaluada por el mejorador de manera subjetiva,
en una escala del 1 al 5, donde 5 es el optimo.
Un contenido de almidon cercano a cierto valor ideal. Un contenido bajo en almidon
producira un camote poco dulce, que probablemente no le guste a los consumido-
res, mientras que uno muy alto podra hacer que el producto frito sea muy duro.
El contenido de almidon se mide en porcentaje.
Un alto contenido de betacaroteno, lo cual le da al camote frito un vistoso color
naranja intenso. El betacaroteno se mide en mg por cada 100 g de materia seca.
Un alto rendimiento en campo, pues de nada sirve cultivar una variedad que no
rinda. El rendimiento en campo debe ser tan alto como sea posible, y de ninguna
manera menor a las 30 toneladas por hectarea.
Para empezar su trabajo el mejorador ha decido realizar un experimento para evaluar en
campo la variedad que usa la empresa actualmente. Para este experimento el mejorador
ha sembrado 20 plantas.
(a) En el experimento el mejorador ha registrado, para cada planta, la forma de los
camotes, el contenido de almidon y de betacaroteno en los camotes, el peso de
los camotes, y el n umero de camotes por planta. En este contexto, identique la
poblacion en estudio, la muestra, la unidad elemental, las variables, y el tipo al
que corresponden.
(b) Suponga que al nalizar el experimento con las 20 plantas, el mejorador ha en-
contrado un contenido medio de betacaroteno de 21 mg/100g de materia seca y
que la primera planta tena 5 camotes. Son estos n umeros parametros, valores
estadsticos u observaciones?
5. Mencione tres diferencias entre parametro y estadstico.
Captulo 2
Organizacion de Datos
2.1. Organizacion de datos cualitativos
Para la organizacion de datos cualitativos es necesario tener presente si estos corresponden
a una variable nominal o a una jerarquica. Si se van a resumir los datos en una tabla de
frecuencias o en un graco, con datos jerarquicos es recomendable respetar el orden natural de
la variable mientras que con datos nominales estos pueden presentarse en categoras ordenadas
de mayor a menor de acuerdo con las frecuencias observadas en cada una. En cualquier caso
se pueden representar dos tipos de frecuencias:
Frecuencia absoluta (f
i
): Representa el n umero de unidades elementales u observaciones
que hay en la clase o categora i.
Frecuencia relativa (fr
i
o h
i
): Representa la proporcion o porcentaje de unidades ele-
mentales u observaciones que hay en la clase o categora i.
Ejemplo 9: Organizacion de datos cualitativos nominales - Para investigar las preferencias de
los consumidores en el mercado de gaseosas, se tomo una muestra de 150 personas y se obtuvieron los
siguientes resultados: 60 preeren la gaseosa A, 43 la gaseosa B, 24 la gaseosa C y 23 otras gaseosas.
Estos datos se pueden presentar en una tabla de frecuencias como la que se muestra en la tabla 2.1, o
mediante un graco de barras como el que se muestra en la gura 2.1.
Ejemplo 10: Organizacion de datos cualitativos jerarquicos - A las 150 personas se les dio a
probar una nueva gaseosa sin identicacion y se les pidio que respondan a la siguiente pregunta: Cual
de las siguientes alternativas dene mejor su actitud hacia este nuevo producto? Las alternativas fueron:
Tabla 2.1: Tabla de frecuencias para los datos de la variable gaseosa de preferencia.
Gaseosa de preferencia f
i
h
i
A 60 0.40
B 43 0.29
C 24 0.16
Otras gaseosas 23 0.15
Total 150 1.00
7
8 CAP
ITULO 2. ORGANIZACI
ON DE DATOS
A B C Otras
Gaseosa de preferencia
%
0
1
0
2
0
3
0
4
0
Base: 150 personas
40%
29%
16%
15%
Figura 2.1: Graco de barras para los datos de la variable gaseosa de preferencia.
Tabla 2.2: Tabla de frecuencias para los datos de la variable actitud hacia la nueva gaseosa.
Actitud hacia la nueva gaseosa f
i
h
i
Denitivamente la comprare 18 0.12
Probablemente la compre 25 0.17
Probablemente no la compre 86 0.57
Denitivamente no la comprare 21 0.14
Total 150 1.00
Denitivamente la comprare, probablemente la compre, probablemente no la compre y denitivamente
no la comprare. Los resultados a la pregunta fueron 18, 25, 86 y 21 respuestas respectivamente para
cada alternativa. En la tabla 2.2 se presenta la tabla de frecuencias para estos datos y en la gura 2.2
se presenta un graco de barras.
Un buen graco puede ser en muchos casos la mejor opcion para presentar la informacion
contenida en los datos. Sin embargo, lograr un buen graco puede no ser una tarea del todo
trivial. Una buena referencia al respecto es Tufte [6].
2.2. Organizacion de datos cuantitativos discretos
Si se tienen datos cuantitativos discretos cuyo n umero de resultados diferentes no es gran-
de, estos pueden ser clasicados y presentados directamente sin perdida de la informacion
original, esto es, sin la necesidad de agrupar los datos en categoras. En la representacion de
datos cuantitativos es posible utilizar, ademas de las frecuencias absolutas y relativas antes
mencionadas, las siguientes frecuencias acumuladas:
Frecuencia absoluta acumulada (F
i
): Representa el n umero de unidades elementales u
observaciones acumuladas hasta la clase o categora i.
2.2. ORGANIZACI
ITULO 2. ORGANIZACI
ON DE DATOS
0 1 2 3 4 5 6
Nmero de hijos por familia
%
0
5
1
0
1
5
2
0
2
5
3
0
Nmero de hijos
Base: 50 familias
8%
16%
26%
30%
8% 8%
4%
Figura 2.3: Graco de barras para los datos de la variable n umero de hijos por familia.
Datos cuantitativos discretos suelen representarse tambien mediante el llamado graco de
bastones. El graco de bastones es un graco de barras en donde cada barra es representada
por una linea, de modo que se resalta la naturaleza discreta de los datos. Este tipo de graco
puede obtenerse en MINITAB con el men u Graph/Histogram. . . usando la opcion Project
lines en Data View . . . . En la gura 2.4 se presenta el graco de bastones para los datos del
ejemplo 11.
2.3. Organizacion de datos cuantitativos continuos
2.3.1. Tabla de frecuencias con datos cuantitativos continuos
Dado que las observaciones para una variable continua son por lo general diferentes entre
s, estas tendran que ser agrupadas en categoras mutuamente excluyentes llamadas intervalos
de clase. Para que el proceso de agrupacion en categoras no desvirt ue la informacion dada
por los datos es recomendable que los intervalos sean del mismo tama no. Para la construccion
de una tabla de frecuencias con intervalos de igual tama no se podran considerar los siguientes
pasos:
1. Calcular el rango de los datos (r):
r = x
max
x
min
(2.1)
2. Determinar el n umero de intervalos (k). Una gua utilizada con frecuencia es la regla de
Sturges la cual indica que el n umero de intervalos debe ser
k 1 + 3.3 log n (2.2)
donde n es el n umero de datos. En esta formula, k se redondea al entero mas cercano.
Es importante mencionar que no existe una regla unica para determinar el n umero de
intervalos, y que el resultado de cualquier regla no es mas que una recomendacion.
2.3. ORGANIZACI
) y es denido por
M
i
= (LI
i
+LS
i
)/2 (2.7)
Notese que la marca de clase no es mas que el punto medio del intervalo.
7. Finalmente se procede a calcular las frecuencias absolutas y relativas, f
i
, F
i
, h
i
y H
i
.
Ejemplo 12: Suponga que en una muestra aleatoria de 50 clientes de un banco se ha observado los
saldos en cuentas de ahorro, en miles de soles, que se muestran en la tabla 2.5. En este caso el rango
es
r = x
max
x
min
= 16.1 0.4 = 15.7,
12 CAP
ITULO 2. ORGANIZACI
ON DE DATOS
Tabla 2.5: Resultados para la variable saldos en cuentas de ahorro en miles de soles.
0.4 0.9 1.0 1.2 2.0 3.0 3.0 3.2 4.0 4.0 4.2 4.5 4.9
5.2 5.6 5.6 5.7 6.2 6.2 6.3 6.3 6.4 6.4 6.6 6.9 7.1
7.2 7.8 7.8 8.0 8.2 8.4 8.4 8.4 8.5 8.6 9.0 9.5 9.8
9.9 10.0 10.1 10.5 10.5 11.5 12.0 13.0 13.5 15.0 16.1
Tabla 2.6: Tabla de frecuencias para los datos de la variable saldos en cuentas de ahorro.
Saldos (en miles de soles) M
i
f
i
F
i
h
i
H
i
[0.4 2.7) 1.55 5 5 0.10 0.10
[2.7 5.0) 3.85 8 13 0.16 0.26
[5.0 7.3) 6.15 14 27 0.28 0.54
[7.3 9.6) 8.45 11 38 0.22 0.76
[9.6 11.9) 10.75 7 45 0.14 0.90
[11.9 14.2) 13.05 3 48 0.06 0.96
[14.2 16.5] 15.35 2 50 0.04 1.00
Total 50 1.00
el n umero de intervalos seg un la regla de Sturges
k 1 + 3.3 log n = 1 + 3.3 log 50 = 6.6 7
y el tama no de los intervalos de clase
c r/k = 15.7/7 = 2.24 2.3.
La tabla de frecuencias para estos datos se muestra en la tabla 2.6. Los resultados presentados en una
tabla de frecuencias tienen una interpretacion directa. As por ejemplo, en la tabla 2.6 se tiene que:
M
2
= 3850 soles es el valor representativo del segundo intervalo.
f
3
= 14 clientes tienen entre 5000 y 7300 soles.
F
4
= 38 clientes tienen entre 400 y 9600 soles.
H
5
H
3
= 0.90 0.54 = 0.36 indica que el 36 % de los clientes tienen entre 7300 y 11900 soles.
ITULO 2. ORGANIZACI
ON DE DATOS
Distribucin de los saldos en cuentas de ahorro
Saldos en miles de soles
%
1.55 3.85 6.15 8.45 10.75 13.05 15.35
0
1
0
2
0
3
0
Figura 2.5: Histograma para los datos de la variable saldos en cuentas de ahorro.
Distribucin de los saldos en cuentas de ahorro
Saldos en miles de soles
%
0.75 1.55 3.85 6.15 8.45 10.75 13.05 15.35 17.65
0
1
0
2
0
3
0
Distribucin de los saldos en cuentas de ahorro
Saldos en miles de soles
%
0.75 1.55 3.85 6.15 8.45 10.75 13.05 15.35 17.65
0
1
0
2
0
3
0
Figura 2.6: Polgono de frecuencias e histograma para los datos de la variable saldos en cuentas de
ahorro. En la gura de la izquierda se muestra el polgono de frecuencias superpuesto en el histograma.
En la gura de la derecha se muestra el polgono de frecuencias unicamente.
2.4. GR
AFICO DE PARETO 15
Distribucin acumulada de los saldos en
cuentas de ahorro
Saldos en miles de soles
H
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
0.4 2.7 5.0 7.3 9.6 11.9 14.2 16.5
Figura 2.7: Polgono de frecuencias acumuladas para los datos de la variable saldos en cuentas de
ahorro.
2.3.5. Polgono de frecuencias acumuladas o curva ojiva
Es el graco que resulta al trazar un polgono que pase por los puntos (LS
i
, H
i
). En este
graco se debe considerar adicionalmente el punto (LI
1
, 0). En la gura 2.7 se muestra el
polgono de frecuencias acumuladas correspondiente a la tabla de frecuencias mostrada en la
tabla 2.6.
2.4. Graco de Pareto
El graco de Pareto es un graco de barras desarrollado para datos cualitativos en el que
en el eje horizontal se representa alguna variable cualitativa cuyas categoras son ordenadas
de acuerdo con sus frecuencias de mayor a menor. Este graco es acompa nado con una curva
de proporciones acumuladas similar a la curva ojiva. La variable en estudio esta asociada por
lo general a defectos o problemas. Al ordenar las barras de mayor a menor seg un sus frecuen-
cias, el graco pretende mostrar que tipo de defectos o problemas corresponden a los pocos
vitales para diferenciarlos de los muchos triviales. El principio de Pareto establece que
aproximadamente el 80 % de los problemas o defectos corresponden al 20 % de las categoras
con mayor frecuencia.
Ejemplo 13: En la gura 2.8 se presenta un ejemplo con datos simulados para una muestra de 300
casos. La variable en estudio es el aspecto que los clientes de un centro comercial cticio consideran
que la gerencia debe mejorar. Este graco se puede realizar en MINITAB en el men u Stat/Quality
Tools/Pareto Chart. . . .
16 CAP
ITULO 2. ORGANIZACI
ON DE DATOS
Figura 2.8: Graco de Pareto para la variable aspecto a mejorar en un centro comercial.
Tabla 2.7: Resultados para la variable tiempo requerido para realizar una tarea.
105 105 107 108 108 108 109 109 110 111 111 111
113 114 114 117 118 119 121 121 123 125 126 126
126 126 128 129 130 131 134 134 137 145 145 150
150 152 153 154 157 157 158 164 170 171 179 183
2.5. Ejercicios
1. Una compa na manufacturera tiene a prueba a 48 nuevos trabajadores. Para evaluar
su rendimiento se les asigno una tarea rutinaria y se midio el tiempo que tardaron en
realizarla. Los tiempos observados en minutos se presentan en la tabla 2.7.
(a) Construya la tabla de frecuencias. Use la regla de Sturges para determinar el n u-
mero de intervalos.
(b) A partir de la tabla de frecuencias interprete f
5
, y 1 H
4
.
(c) A partir de la tabla de frecuencias aproximadamente que porcentaje de los traba-
jadores termino la tarea en menos de 134 minutos? (Rpta.: 61.46 %)
2. Se realizo un estudio para evaluar el tiempo de atencion en un banco. Con los resultados
obtenidos con una muestra de 100 clientes se construyo una tabla de frecuencias, la cual
se muestra con algunos vacos en la tabla 2.8.
(a) Identique el tipo de variable en estudio y la unidad elemental.
(b) Complete la tabla de frecuencias.
(c) Interprete M
4
, h
3
y f
3
+f
4
.
2.5. EJERCICIOS 17
Tabla 2.8: Tabla de frecuencias para los datos de la variable tiempo de atencion en una muestra de
100 clientes de un banco.
Tiempo de atencion (en minutos) M
i
f
i
F
i
h
i
H
i
[1.0 1.5) 4
[1.5 2.0) 15
[2.0 2.5) 49
[2.5 3.0) 22
[3.0 3.5) 19
[3.5 4.0] 10
Total
(d) Utilice interpolacion lineal para aproximar el tiempo maximo de atencion para que
un cliente este incluido dentro del 10 % de los que son atendidos mas rapido.
3. En el archivo SUELDOS.MTW se presentan los sueldos anuales (en miles de Nuevos
Soles) de los directores ejecutivos de 120 peque nas empresas (columna C1) clasicados
seg un el rubro de la empresa (columna C2).
(a) Construya una tabla de frecuencias y un graco para mostrar los datos de la
columna C2. Que porcentaje de las empresas corresponden a cada uno de los
rubros?
(b) Construya una tabla de frecuencias para los datos de la columna C1. Utilice la
regla de Sturges para determinar el n umero de intervalos.
(c) A partir de la tabla de frecuencias anterior construya el histograma, el polgono de
frecuencias y la curva ojiva.
(d) A partir de la tabla de frecuencias interprete f
2
, F
3
, y H
4
.
4. Considere las siguientes situaciones:
Un profesor ha registrado el total de tardanzas de sus alumnos a clase durante un
periodo academico. Luego de tabular los datos ha encontrado que aproximadamente
el 80 % de las tardanzas corresponden al 20 % de sus alumnos.
Un fanatico del f utbol indica que aproximadamente el 80 % de los campeonatos de
primera division fueron ganados por aproximadamente el 20 % de los clubes que
alguna vez participaron en primera.
Aplica el principio de Pareto a esto casos?
18 CAP
ITULO 2. ORGANIZACI
ON DE DATOS
Captulo 3
Medidas de Posicion, Varibilidad y
Forma
3.1. Introducci on
En este captulo se presentan una serie de medidas cuyo objetivo es describir distintos
aspectos (la posicion, dispersion y forma) de la distribucion de un conjunto de datos. A estas
medidas se les conoce como estadsticas descriptivas, y pueden verse como distintos res umenes
de la informacion contenida en los datos, cada una tratando de describir un aspecto diferente.
Todas estas medidas, y algunas mas, pueden calcularse en MINITAB en el men u Stat/Basic
Statistics/Display Descriptive Statistics.
3.2. Medidas de posici on central
Las medidas de posicion central o tendencia central son medidas estadsticas que repre-
sentan el centro de la distribucion de los datos. En la gura 3.1 se muestran dos distribuciones
de datos con diferente posicion pero con la misma variabilidad o dispersion.
3.2.1. Media aritmetica
Es la suma de todas las observaciones de una poblacion o muestra dividida entre el tama no
de la poblacion o muestra. Para una poblacion de tama no N la media poblacional se dene
por
=
1
N
N
i=1
x
i
. (3.1)
Para una muestra de tama no n la media muestral se dene por
x =
1
n
n
i=1
x
i
. (3.2)
Si los datos estan agrupados en una tabla de frecuencias con k clases o categoras la media
muestral puede aproximarse utilizando las marcas de clase como valores representativos, y
19
20 CAP
i=1
M
i
f
i
=
k
i=1
M
i
fr
i
. (3.3)
Ejemplo 14: En la tabla 2.3 se presentan datos para la variable n umero de hijos por familia para una
muestra de 50 familias. Con estos datos, la media muestral, calculada con la formula 3.2 es
x =
1
n
n
i=1
x
i
=
0 + 0 +. . . + 6
50
= 2.54 hijos.
Ejemplo 15: En la tabla 2.5 se presentan datos para la variable saldo en una muestra de 50 cuentas
de ahorro. Con estos datos, la media muestral, calculada con la formula 3.2, es
x =
1
n
n
i=1
x
i
=
0.4 + 0.9 +. . . + 16.1
50
= 7.17 miles de soles.
Si no se contara con los datos originales sino solo con la tabla de frecuencias mostrada en la tabla 2.6,
se podra aproximar el valor de la media con la formula 3.3 de la siguiente manera:
x =
1
n
k
i=1
M
i
f
i
=
1.55 5 + 3.85 8 +. . . + 15.35 2
50
= 7.254 miles de soles.
La media aritmetica es una medida sensible a valores extremos, esto es, uno o unos pocos
valores extremadamente altos o bajos pueden tener un efecto importante en su valor. A
continuacion se presentan algunas propiedades matematicas de la media aritmetica:
3.2. MEDIDAS DE POSICI
ON CENTRAL 21
1. La suma de las desviaciones de las observaciones respecto a la media aritmetica es cero,
esto es,
n
i=1
(x
i
x) = 0.
2. La sumatoria
n
i=1
(x
i
k)
2
es mmina en k = x.
3. Si a cada observacion se le multiplica por una constate b y se le suma otra constante a, la
media aritmetica queda multiplicada por la primera constate y sumada por la segunda,
esto es, si y
i
= a +bx
i
para cada i, entonces y = a +b x.
Ejemplo 16: Suponga que la media del sueldo de los trabajadores de una empresa es 1200 soles y
que se planea efectuar un primer aumento del 10 % y luego un segundo aumento de 200 soles a todos
los trabajadores. Entonces, si X denota el sueldo de los trabajadores antes del aumento y Y el sueldo
de los trabajadores despues del aumento, seg un la propiedad n umero 3 se tiene que la media de los
sueldos despues del aumento sera y = 200 + 1.1 x = 200 + 1.1 1200 = 1520 soles.
3.2.2. Media ponderada
La media ponderada de un conjunto de observaciones x
1
, . . . x
k
, con pesos o ponderaciones
P
1
, . . . , P
k
se dene como
x =
k
i=1
P
i
x
i
k
i=1
P
i
(3.4)
Ejemplo 17: Un estudiante obtiene 15 en su primer examen de estadstica, 12 en el segundo y 17 en
el tercero. Considerando que el primer examen tiene un peso de 20 %, el segundo un peso de 30 % y el
tercero un peso de 50 %, su nota nal en el curso sera, usando la formula 3.4
x =
0.2 15 + 0.3 12 + 0.5 17
0.2 + 0.3 + 0.5
= 15.1.
Ejemplo 18: En una compa na los trabajadores estan considerados en tres categoras, A, B y C. El
ingreso medio de los 300 trabajadores de la categora B es de S/. 6000 y de los 150 trabajadores de
la categora C es de S/. 8000. A los trabajadores de la categora A se les hace un aumento del 20 %
mas una bonicacion de S/. 600, a los de la categora B se les aumenta un 25 % mas una bonicacion
de S/. 800 y a los de la categora C se les hace un aumento del 35 % mas una bonicacion de S/. 500.
Si el ingreso medio de los 650 trabajadores de la compa na despues del aumento es de S/. 8100, cual
era el ingreso promedio de los trabajadores de la categora A antes de los aumentos?
Sea X el ingreso de un trabajador antes de los aumentos. Utilizando la formula 3.4, la media de
todos los trabajadores antes de los aumentos es
x =
200 x
A
+ 300 x
B
+ 150 x
C
650
.
Sea Y el ingreso de un trabajador despues de los aumentos. Por la propiedad n umero 3 se tiene que
y =
200(600 + 1.2 x
A
) + 300(800 + 1.25 x
B
) + 150(500 + 1.35 x
C
)
650
.
Dado que y = 8100, x
B
= 6000 y x
C
= 8000, se tiene que
8100 =
200(600 + 1.2 x
A
) + 300(800 + 1.25 6000) + 150(500 + 1.35 8000)
650
.
Depejando x
A
en esta ultima expresion se tiene que x
A
= 4000.
22 CAP
Ejemplo 20: Considere el siguiente conjunto de datos: 9,12,16,16,17,18,19 y 21. Dado que n = 8 es
par, aplicando la formula 3.6 se tiene que la mediana es
me =
x
(
8
2
)
+x
(
8
2
+1)
2
=
x
(4)
+x
(5)
2
=
16 + 17
2
= 16.5.
Ejemplo 21: Con los datos de la tabla 2.4, y dado que n = 50 es par, aplicando la formula 3.6 se
tiene que la mediana para el n umero de hijos por familia es
me =
x
(
50
2
)
+x
(
50
2
+1)
2
=
x
(25)
+x
(26)
2
=
2 + 3
2
= 2.5 hijos.
Ejemplo 22: Para la variable saldo en cuentas de ahorro, con la informacion mostrada en la tabla 2.6,
la mediana pertenece al tercer intervalo ya que a este le corresponden frecuencias relativas acumuladas
de entre 0.26 y 0.54 (La mediana corresponde a una frecuencia relativa acumulada de 0.5). Luego,
aplicando la formula 3.7, la mediana en este caso es aproximada por
me = LI
3
+
_
n
2
F
31
f
3
_
c
3
= 5 +
_
25
2
13
14
_
2.3 = 6.97 miles de soles.
3.3. CUANTILES 23
n
i=1
|x
i
k| es mmina en k = me.
2. Si a cada observacion se le multiplica por una constate b y se le suma otra constante a,
la mediana queda multiplicada por la primera constate y sumada por la segunda, esto
es, si y
i
= a +bx
i
para cada i, entonces me
y
= a +b me
x
.
3.2.4. Moda
Es el valor con mayor frecuencia. Si los datos estan agrupados en una tabla de frecuencias
con k intervalos, la moda puede aproximarse con la expresion
mo = LI
i
+
_
1
1
+
2
_
c
i
(3.8)
donde i es el n umero del intervalo que contiene a la moda (intervalo con mayor frecuencia),
1
= f
i
f
i1
y
2
= f
i
f
i+1
. Alternativamente,
1
y
2
pueden denirse por
1
= h
i
h
i1
y
2
= h
i
h
i+1
.
Ejemplo 23: Con los datos de la tabla 2.4 la moda es 3 hijos, pues es el valor con mayor frecuencia,
en este caso, una frecuencia de 15.
Ejemplo 24: Para la variable saldo en cuentas de ahorro, con los datos mostrados en la tabla 2.6, la
moda se encuentra en el tercer intervalo, pues es el intervalo con mayor frecuencia absoluta. Luego,
aplicando la formula 3.8 se tiene que
1
= f
3
f
2
= 14 8 = 6
2
= f
3
f
4
= 14 11 = 3
y la moda es aproximada por
mo = LI
3
+
_
1
1
+
2
_
c
3
= 5 +
_
6
6 + 3
_
2.3 = 6.53 miles de soles.
3.3. Cuantiles
Se pueden considerar como medidas de posicion no central. Los cuantiles son utilizados
para dividir a un conjunto de datos ordenados en subconjuntos de igual tama no; los cuantiles
son los valores que determinan los lmites entre estos subconjuntos consecutivos. Algunos
cuantiles reciben nombres especiales:
Percentiles (P): Conjunto de valores que dividen a los datos en 100 partes iguales.
Deciles (D): Conjunto de valores que dividen a los datos en 10 partes iguales.
Cuartiles (Q): Conjunto de valores que dividen a los datos en 4 partes iguales.
24 CAP
Ejemplo 26: Con los datos de la tabla 2.6, el primer cuartil, que corresponde al percentil 25, pertenece
al segundo intervalo, ya que este contiene frecuencias relativas acumuladas entre 0.10 y 0.26. Luego,
utilizando la formula 3.11, el percentil 25 es aproximado por
P
25
= LI
2
+
_
2550
100
F
21
f
2
_
c
2
= 2.7 +
_
12.5 5
8
_
2.3 = 4.85625 miles de soles.
Ejemplo 28: En la tabla 2.6 se presentan datos para la variable saldo en una muestra de 50 cuentas
de ahorro. Con estos datos el rango de la variable saldo en cuentas de ahorro, calculado con la formula
26 CAP
3.4.3. Varianza
La varianza de las observaciones de una poblacion nita de tama no N esta dada por
2
=
1
N
N
i=1
(x
i
)
2
=
1
N
_
N
i=1
x
2
i
N
2
_
. (3.15)
La varianza de las observaciones de una muestra de tama no n esta dada por
s
2
=
1
n 1
n
i=1
(x
i
x)
2
=
1
n 1
_
n
i=1
x
2
i
n x
2
_
. (3.16)
Si los datos obtenidos con una muestra estan agrupados en una tabla de frecuencia con k
categoras, la varianza muestral puede aproximarse con la expresion
s
2
=
1
n 1
k
i=1
(M
i
x)
2
f
i
=
1
n 1
_
k
i=1
M
2
i
f
i
n x
2
_
. (3.17)
A partir de las formulas anteriores para el calculo de la varianza se puede notar la siguiente
propiedad: Si a cada observacion x se le aplica la transformacion y = a + bx, la varianza de
la variable transformada Y es igual a la varianza de X multiplicada por b
2
.
Ejemplo 30: Suponga que la varianza de los sueldos, denotados por X, de los trabajadores de una
empresa es
2
X
= 200 soles
2
. Si a cada trabajador se le hace un primer aumento del 10 % y luego un
segundo aumento de 200 soles, entonces su nuevo sueldo, denotado por Y , sera Y = 200 + 1.1X y la
varianza de Y sera
2
Y
= 1.1
2
2
X
= 1.1
2
200 = 242 soles
2
.
3.4. MEDIDAS DE VARIABILIDAD 27
Tabla 3.2: Datos observados en dos muestras de tama no 5.
Muestra A 5 8 11 12 16
Muestra B 1015 1036 1050 1051 1100
3.4.4. Desviaci on estandar
Un problema en la interpretacion de la varianza es que esta expresada en las unidades de
las observaciones elevadas al cuadrado. Para evitar este problema se dene otra medida de
variabilidad, denominada desviacion estandar, que es igual a la raz cuadrada positiva de la
varianza. As, la desviacion estandar poblacional esta dada por
= +
2
(3.18)
y la desviacion estandar muestral por
s = +
s
2
. (3.19)
3.4.5. Coeciente de variaci on
Expresa el n umero de veces que la desviacion estandar contiene a la media expresado como
un porcentaje. El coeciente de variacion poblacional esta dado por
CV =
||
100 % (3.20)
y el coeciente de variacion muestral por
cv =
s
| x|
100 %. (3.21)
Dado que el coeciente de variacion carece de unidades, es util para comparar la variabilidad de
dos o mas conjuntos de datos con diferentes unidades de medida o con valores muy diferentes
para sus medias.
Ejemplo 31: Considere las observaciones dadas en la tabla 3.2 para dos muestras de tama no 5. Para
la muestra A la varianza (usando la formula 3.16), desviacion estandar y coeciente de variacion estan
dados por
s
2
A
=
5
2
+ 8
2
+ 11
2
+ 12
2
+ 16
2
5 10.4
2
5 1
= 17.3 con x
A
= 10.4,
s
A
=
17.3 = 4.16 y
cv
A
=
4.16
10.4
100 % = 39.99 %,
mientras que para la muestra B se tiene
s
2
B
=
1015
2
+ 1036
2
+ 1050
2
+ 1051
2
+ 1100
2
5 1050.4
2
5 1
= 980.3 con x
B
= 1050.4,
s
B
=
980.3 = 31.31 y
cv
B
=
31.31
1050.4
100 % = 2.98 %.
28 CAP
Ejemplo 33: Con los datos de la tabla 2.6, y utilizando la formula 3.17, la varianza para la variable
saldo en cuentas de ahorros es
s
2
=
1.55
2
5 + 3.85
2
8 +. . . + 15.35
2
2 50 7.254
2
50 1
= 12.36 miles de soles
2
,
y la desviacion estandar y coeciente de variacion son
s =
n
i=1
(x
i
x)
3
_
1
n
n
i=1
(x
i
x)
2
_
3/2
. (3.25)
En general, un coeciente de asimetra igual a cero indica que la distribucion es simetrica.
Conforme mas se aleja el coeciente de asimetra de cero hacia el lado negativo o positivo,
mas asimetrica negativa o positiva sera la distribucion.
Ejemplo 34: En la tabla 3.1 se presentan datos para la variable volumen de venta en miles de soles
registrada en un total de 36 establecimientos. La media, mediana y desviacion estandar de este conjunto
de datos son
x = 7.731, me = 7.4, s = 3.398.
Entonces, el coeciente de asimetra de Pearson denido en (3.24) es
as =
3(7.731 7.4)
3.398
= 0.29.
Este valor indica cierta asimetra positiva en la distribucion de los datos.
3.5.2. Curtosis
La curtosis es una medida del apuntamiento (concentracion en torno al pico maximo) de
una distribucion. Una curtosis alta (distribucion leptoc urtica) indica que la mayor parte de
la varianza es debida a valores muy extremos poco frecuentes mientras que una curtosis baja
(distribucion platic urtica) indica que la mayor parte de la varianza es debida a valores no tan
extremos pero mas frecuentes. En la gura 3.4 se muestran tres distribuciones de datos con
diferente medida de curtosis.
Se puede evaluar la curtosis de un conjunto de datos mediante el coeciente
k =
1
n
n
i=1
(x
i
x)
4
_
1
n
n
i=1
(x
i
x)
2
_
2
. (3.26)
30 CAP
ITULO 4. AN
ITULO 4. AN
ITULO 5. PROBABILIDADES
5.1.4. Combinacion
El n umero de grupos diferentes de r elementos que pueden formarse a partir de un total
de n elementos sin importar el orden de la seleccion es
C
n
r
=
_
n
r
_
=
n!
r!(n r)!
. (5.1)
De esta denicion notese que C
n
r
= C
n
nr
. Ademas, dado que 0! = 1, se tiene que C
n
0
= C
n
n
= 1.
Ejemplo 41: El profesor de una clase de 20 alumnos desea escoger al azar un grupo de 3 alumnos
para realizar una actividad. Entonces el profesor puede formar C
20
3
= 1140 grupos diferentes.
5.1.5. Permutacion
El n umero de maneras diferentes en que r elementos pueden elegirse y ordenarse uno
detras de otro a partir de un total de n elementos es
P
n
r
=
n!
(n r)!
. (5.2)
De esta denicion notese que P
n
n
= n!.
Ejemplo 42: Suponga que se dispone de 8 banderas de distinto color y que se va a seleccionar 3 para
formar una se nal colocandolas en lnea. Entonces se pueden formar P
8
3
= 336 se nales diferentes.
5.1.6. Permutacion con elementos iguales
El n umero maneras diferentes en las que se puede ordenar n elementos, de los cuales
n
1
, n
2
, . . . , n
k
son iguales entre s para efectos del ordenamiento, con n = n
1
+n
2
+. . . +n
k
,
es dado por
P
n
n
1
,n
2
,...,n
k
=
n!
n
1
!n
2
! . . . n
k
!
. (5.3)
Ejemplo 43: Suponga que se dispone de 8 banderas de las cuales 3 son amarillas, 3 rojas y 2 azules.
Colocando estas banderas en lnea se pueden formar P
8
3,3,2
= 560 se nales diferentes.
5.2. Conceptos de probabilidad
5.2.1. Experimento aleatorio ()
Es todo experimento cuyos resultados pueden ser diferentes aun cuando es repetido de la
misma manera cada vez. Por ejemplo:
1
: Lanzar una moneda 2 veces y registrar los resultados.
2
: Lanzar un dado y registrar el resultado.
3
: Observar el tiempo de vida de un componente electrico.
5.2. CONCEPTOS DE PROBABILIDAD 39
4
: Lanzar un dado hasta obtener un 6 y registrar el n umero de lanzamientos requeridos.
5
: Extraer una bola y observar el color desde una caja que contiene 3 bolas blancas y
5 rojas.
5.2.2. Espacio Muestral () y punto muestral ()
El espacio muestral es el conjunto de todos los posibles resultados de un experimento alea-
torio. Los espacios muestrales pueden ser nitos o innitos. Los espacios muestrales innitos
pueden a su vez clasicarse en numerables y no numerables. Por ejemplo, para los experimen-
tos aleatorios denidos con anterioridad, los siguientes seran sus correspondientes espacios
muestrales.
1
= {(c, c), (c, s)(s, c), (s, s)}, que es nito.
2
= {1, 2, 3, 4, 5, 6}, que es nito.
3
= {t R|t > 0}, que es innito no numerable.
4
= {1, 2, 3, 4, . . .}, que es innito numerable.
5
= {blanca, roja}, que es nito.
Un punto muestral es cada uno de los posibles resultados de un experimento aleatorio. Por
ejemplo, para cada uno de los espacios muestrales denidos con anterioridad, los siguientes
son ejemplos de puntos muestrales.
1
= (c, c).
2
= 2.
3
= 125.36 horas.
4
= 9.
5
= blanca.
5.2.3. Evento o suceso
Es cualquier subconjunto del espacio muestral de un experimento aleatorio. Se les repre-
senta con letras may usculas. Por ejemplo, dado el experimento
2
denido con anterioridad,
A = {2}, B = {1, 2}, C = {2, 4, 6} y D = {1, 3, 5} son algunos eventos.
Dado que los eventos son subconjuntos, se pueden utilizar las operaciones de conjuntos con
ellos y los resultados de estas operaciones seran otros eventos. Algunas de estas operaciones
se describen a continuacion:
La union de dos eventos, E
1
y E
2
, es el evento que consiste de todos los puntos muestrales
que pertenecen al menos a uno de los dos eventos, y es denotada por E
1
E
2
. Por ejemplo,
A D = {1, 2, 3, 5}.
40 CAP
ITULO 5. PROBABILIDADES
La interseccion de dos eventos, E
1
y E
2
, es es el evento que consiste de todos los puntos
muestrales que pertenecen a ambos eventos, y es denotada por E
1
E
2
. Por ejemplo,
B C = {2}.
El complemento de un evento, E, en un espacio muestral, es el evento que consiste de
todos los puntos muestrales en el espacio muestral que no pertenecen a dicho evento, y
es denotado por E
,
E o E
c
. Por ejemplo, B
= {3, 4, 5, 6}.
Ademas, es importante tener presente las siguientes reglas:
Ley distributiva: (AB) C = (AC) (B C) y (AB) C = (AC) (B C).
Leyes de Morgan: (A B)
= A
, y (A B)
= A
.
Tambien es usual utilizar diagramas de Venn para representar espacios muestrales y eventos.
Eventos mutuamente excluyentes: Dos eventos E
1
y E
2
denidos sobre un mismo es-
pacio muestral son mutuamente excluyentes si E
1
E
2
= . Por ejemplo, en el experimento
2
, los eventos A = {2} y D = {1, 3, 5} son mutuamente excluyentes.
Eventos complementarios: Dos eventos E
1
y E
2
denidos sobre un mismo espacio mues-
tral son complementarios si son mutuamente excluyentes y ademas E
1
E
2
= . Por ejemplo,
en el experimento
2
, los eventos C = {2, 4, 6} y D = {1, 3, 5} son complementarios.
5.2.4. Denicion clasica o a priori de probabilidad
Si un experimento aleatorio tiene n() posibles resultados, todos ellos igualmente pro-
bables, y si n(E) de estos resultados pertenecen a un evento E, entonces la probabilidad de
ocurrencia del evento E es
P(E) =
n(E)
n()
. (5.4)
Ejemplo 44: Para cubrir 6 puestos de trabajo se han presentado 7 hombres y 4 mujeres. Si la seleccion
es al azar, cual es la probabilidad de que una sola mujer sea elegida en el grupo de 6?
Dena el evento A = {una sola mujer es elegida}. Entonces, aplicando la denicion en (5.4)
P(A) =
n(A)
n()
=
C
7
5
C
4
1
C
11
6
=
84
462
= 0.1818.
Ejemplo 45: Una urna tiene 8 bolas blancas y 5 negras. Si se extraen al azar y con reemplazo 4 bolas,
cual es la probabilidad de que 3 bolas blancas y 1 negra sean extradas?
Dena el evento A = {se extraen 3 bolas blancas y 1 negra}. Entonces, aplicando la denicion en
(5.4)
P(A) =
n(A)
n()
=
P
4
3,1
8
3
5
13
4
=
10240
28561
= 0.3585.
ITULO 5. PROBABILIDADES
5.2.8. Teoremas de probabilidad
Teorema 1. La probabilidad del evento vaco es cero: P() = 0.
Teorema 2. Para cualquier evento E, P(E
) = 1 P(E).
Teorema 3. Si E
1
y E
2
son dos eventos tales que E
1
E
2
, entonces P(E
1
) P(E
2
).
Teorema 4. Si E
1
y E
2
son dos eventos de un espacio muestral entonces
P(E
1
E
2
) = P(E
1
) +P(E
2
) P(E1 E
2
). (5.7)
Este teorema puede extenderse a la union de k eventos.
Ejemplo 48: En un grupo de personas el 20 % ha hecho un posgrado, el 60 % tiene hijos y el 10 %
tiene posgrado y tiene hijos. Si se escoge una persona al azar, cual es la probabilidad de que tenga
posgrado o tenga hijos?
Dena los eventos A = {la persona elegida tiene posgrado} y B = {la persona elegida tiene hijos}.
Entonces, P(A) = 0.2, P(B) = 0.6 y P(A B) = 0.1. Al aplicar el resultado (5.7) se tiene que
P(A B) = P(A) +P(B) P(A B) = 0.2 + 0.6 0.1 = 0.7.
|B) = 1 P(E|B).
Teorema 3. Si E
1
y E
2
son dos eventos tales que E
1
E
2
, entonces P(E
1
|B) P(E
2
|B).
Teorema 4. Si E
1
y E
2
son dos eventos de un espacio muestral entonces P(E
1
E
2
|B) =
P(E
1
|B) +P(E
2
|B) P(E1 E
2
|B). Este teorema puede extenderse a la union de k eventos.
5.3.4. Regla de la multiplicacion
Si A y B son dos eventos pertenecientes a un espacio muestral , entonces
P(A B) = P(A)P(B|A) = P(B)P(A|B). (5.9)
Este resultado es una consecuencia directa de la denicion de probabilidad condicional dada
en (5.8) y puede generalizarse a la interseccion de k eventos. As, si E
1
, E
2
, . . . E
k
son eventos
pertenecientes a un espacio muestral , entonces
P(E
1
E
2
. . . E
k
) = P(E
1
)P(E
2
|E
1
)P(E
3
|E
1
E
2
) . . . P(E
k
|E
1
E
2
. . . E
k1
). (5.10)
Ejemplo 50: Al preguntar a un grupo de amas de casa que compran carne por el tipo de carne que
compran mensualmente se obtuvo la siguiente informacion: El 50 % compran carne de res, el 30 %
no compran carne de cerdo y el 60 % de las que compran cerdo no compran carne de res. Si se elige
aleatoriamente un ama de casa que compra carne, cual es la probabilidad de que compre carne de
cerdo si se sabe que compra carne de res.
Considere los siguientes eventos: R = {el ama de casa compra carne de res} y C = {el ama de
casa compra carne de cerdo}. Entonces se tiene que P(R) = 0.5, P(C) = 0.7 y P(R|C) = 0.4. Luego,
aplicando los resultados (5.8) y (5.9) se tiene que
P(C|R) =
P(C R)
P(R)
=
P(C)P(R|C)
P(R)
=
0.7 0.4
0.5
= 0.56.
ITULO 5. PROBABILIDADES
Sean E
1
, E
2
, . . . , E
k
cualquier particion de un espacio muestral y sea B un evento
cualquiera de dicho espacio muestral. Entonces, la probabilidad del evento B puede escribirse
como
P(B) =
k
i=1
P(B E
i
) =
k
i=1
P(E
i
)P(B|E
i
). (5.11)
5.3.6. Teorema de Bayes
Sean E
1
, E
2
, . . . , E
k
cualquier particion de un espacio muestral y sea B un evento
cualquiera no nulo de dicho espacio muestral. Entonces se tiene que
P(E
j
|B) =
P(E
j
)P(B|E
j
)
k
i=1
P(E
i
)P(B|E
i
)
. (5.12)
Notese que esta formula puede deducirse a partir de la denicion de probabilidad condicional
dada en (5.8), la regla de la multiplicacion dada en (5.9) y el teorema de la probabilidad total
dado en (5.11).
Ejemplo 51: Una fabrica tiene 3 maquinas (M1, M2 y M3) que producen respectivamente el 50 %,
30 % y 20 % del total de artculos. Se sabe que el 5 % de los artculos producidos por M1, el 10 % de
los producidos por M2 y el 20 % de los producidos por M3 son defectuosos. Si se selecciona un artculo
al azar de la produccion de un da, la probabilidad de que sea defectuoso (evento D) es, aplicando el
teorema de probabilidad total dado en (5.11),
P(D) = P(M
1
)P(D|M
1
) +P(M
2
)P(D|M
2
) +P(M
3
)P(D|M
3
)
= 0.5 0.05 + 0.3 0.1 + 0.2 0.2 = 0.095.
Si se selecciona un artculo al azar y se observa que es defectuoso, la probabilidad de que haya sido
producido por la maquina M1 es, por el teorema de Bayes dado en (5.12),
P(M
1
|D) =
P(M
1
)P(D|M
1
)
P(D)
=
0.5 0.05
0.095
= 0.2632.
De manera similar se puede calcular P(M
2
|D) y P(M
3
|D).
5.3.7. Independencia de eventos
Los eventos A y B son independientes si la ocurrencia de uno de ellos no afecta la pro-
babilidad de ocurrencia del otro. A y B son independientes si se cumple cualquiera de las
siguientes condiciones:
1. P(A|B) = P(A).
2. P(B|A) = P(B).
3. P(A B) = P(A)P(B).
En general, si E
1
, E
2
, . . . , E
k
son eventos independientes, entonces
P(E
1
E
2
. . . E
k
) = P(E
1
)P(E
2
) . . . P(E
k
).
Ademas, si dos eventos A y B son independientes, entonces
5.4. EJERCICIOS 45
A
y B
son independientes.
A y B
son independientes.
A
y B son independientes.
Ejemplo 52: Juan, Luis y Manuel son tres amigos que suelen llegar tarde a clase. El profesor ha
determinado que Juan llega tarde al 30 % de las clases (evento J), Luis al 50 % (evento L) y Manuel
al 60 % (evento M). Para un da cualquiera, la probabilidad de que solo uno de los tres llegue tarde es
P(solo uno llegue tarde) = P((J L
) (J
L M
) (J
M)).
Dado que los tres eventos en la union son mutuamente excluyentes se tiene que
P(solo uno llegue tarde) = P(J L
) +P(J
L M
) +P(J
M).
Finalmente, asumiendo independencia entre J, L y M
P(solo uno llegue tarde) = P(J)P(L
)P(M
) +P(J
)P(L)P(M
) +P(J
)P(L
)P(M)
= 0.3 0.5 0.4 + 0.7 0.5 0.4 + 0.7 0.5 0.6
= 0.41.
5.4. Ejercicios
1. De cuantas maneras diferentes se pueden colocar las guras blancas (2 caballos, 2
torres, 2 alles, el rey y la reina) en la primera la del tablero de ajedrez? (Rpta.: 5040)
2. De A a B hay 6 caminos y de B a C hay 4 caminos. De cuantas maneras se puede ir
de A a C pasando por B? (Rpta.: 24)
3. De cuantas maneras se pueden acomodar las letras a, b, c, d, e, f, de modo que c y d
esten siempre juntas? (Rpta.: 240) De cuantas maneras de modo que c y d nunca esten
juntas? (Rpta.: 480)
4. Cinco polticos se encuentran en una sesion. Cuantos saludos de mano intercambian si
cada poltico estrecha la mano de todos los demas solo una vez? (Rpta.: 10)
5. De cuantas maneras se pueden colocar a 12 personas en tres habitaciones si la primera
puede contener a 2, la segunda a 6 y la tercera a 4? (Rpta.: 13860)
6. Una persona tiene 6 amigos y desea invitar a su casa a 3 de ellos cada da de modo que
el grupo no se repita ni una sola vez. Durante cuantos das podra invitar a sus amigos?
(Rpta.: 20)
7. De un grupo formado por 7 hombres y 4 mujeres hay que escoger 6 personas de manera
que entre ellos haya al menos 2 mujeres. De cuantas maneras puede efectuarse la
seleccion? (Rpta.: 371)
8. Se tienen 10 cartas numeradas del 0 al 9. Cuantos n umeros distintos pueden formarse
si se extraen 5 cartas con reemplazo? (Rpta.: 100000) Y sin reemplazo? (Rpta.: 30240)
46 CAP
ITULO 5. PROBABILIDADES
9. Un inspector visita 6 maquinas diferentes durante el da. A n de evitar que los opera-
dores sepan cuando los inspeccionara, vara el orden de sus visitas. De cuantas maneras
puede hacerlo? (Rpta.: 720)
10. En una ciudad hay 3 gasteros (A, B y C). Un da 5 residentes llaman a un gastero
seleccionado al azar.
(a) De cuantas maneras pueden elegir a todos los gasteros? (Rpta.: 150)
(b) De cuantas maneras pueden elegir solo a 2 gasteros? (Rpta.: 90)
(c) De cuantas maneras pueden elegir solo a los gasteros A y B? (Rpta.: 30)
11. Extienda el resultado (5.7) al caso de 3 eventos.
12. En un salon de clases con 10 estudiantes, cual es la probabilidad de que al menos dos
estudiantes cumplan a nos el mismo da? Asuma a nos de 365 das y que todos los das
son igualmente probables para el nacimiento de una persona. (Rpta.: 0.1169)
13. Si se colocan en un estante en orden aleatorio 4 vol umenes de una cierta obra, cual es
la probabilidad de que el orden sea perfecto (Ascendente o descendente)? (Rpta.: 1/12)
14. Un cuestionario consta de 20 preguntas. Si se escogen al azar tres preguntas, cual es la
probabilidad de que a un alumno que se ha preparado en 6 preguntas le toque al menos
una de las que sabe? (Rpta.: 0.6807)
15. Un lote consta de 10 artculos buenos, 4 con peque nos defectos y 2 con defectos graves.
Si se escogen 2 artculos al azar, calcular la probabilidad de que:
(a) Ambos sean buenos. (Rpta.: 0.375)
(b) Por lo menos uno sea bueno. (Rpta.: 0.875)
(c) A lo mas uno sea bueno. (Rpta.: 0.625)
(d) Ninguno tenga defectos graves. (Rpta.: 0.7583)
16. La gerente de una tienda de ropa para dama desea determinar la relacion entre el tipo
de cliente y la forma de pago. Para ello ha recopilado la siguiente informacion sobre una
muestra de 200 clientes:
Forma de pago
Tipo de cliente Credito Contado Total
Habitual 70 50 120
No habitual 40 40 80
Total 110 90 200
Si se selecciona un cliente al azar:
(a) Cual es la probabilidad de que no sea habitual o pague a credito? (Rpta.: 0.75)
(b) Cual es la probabilidad de que sea habitual y pague a credito? (Rpta.: 0.35)
(c) Si se sabe que es habitual, cual es la probabilidad de que pague a credito? (Rpta.:
0.5833)
5.4. EJERCICIOS 47
(d) Si se seleccionan 3 clientes sin reemplazo, cual es la probabilidad de que al menos
uno pague al contado? (Rpta.: 0.8357)
(e) Si se seleccionan 3 clientes con reemplazo, cual es la probabilidad de que 2 sean
habituales? (Rpta.: 0.432)
17. Suponga que A, B y C son eventos tales que P(A) = P(B) = P(C) = 1/4, P(AB) =
P(B C) = 0 y P(A C) = 1/8. Calcular la probabilidad de que al menos uno de los
sucesos ocurra. (Rpta.: 5/8)
18. Suponga que A y B son eventos tales que P(A B) = 0.7 y P(A B
) = 0.9. Calcular
P(A). (Rpta.: 0.6)
19. La probabilidad de que el sabado un alumno vaya al cine es 0.25, de que haga deporte
0.2 y de que haga ambas cosas 0.08.
(a) Cual es la probabilidad de que vaya al cine o haga deporte? (Rpta.: 0.37)
(b) Cual es la probabilidad de que haga deporte pero no vaya al cine? (Rpta.: 0.12)
(c) Cual es la probabilidad de que haga deporte o no vaya al cine? (Rpta.: 0.83)
20. El encargado de control de calidad de una fabrica ha seleccionado 200 artculos produ-
cidos durante un da y encontr o que 10 artculos tienen fallas de tipo A, 10 tienen fallas
de tipo B, 12 de tipo C, 2 tienen A y B pero no C, 3 tienen fallas de tipo A y C pero
no B, 5 tienen de tipo B y C pero no A y un artculo tiene las tres fallas. Calcule la
probabilidad de que un artculo seleccionado al azar:
(a) No tenga fallas de tipo A. (Rpta.: 190/200)
(b) Tenga fallas de tipo A o B. (Rpta.: 17/200)
(c) Tenga A pero no C. (Rpta.: 6/200)
(d) Tenga B o no tenga C. (Rpta.: 194/200)
(e) No tenga A o no tenga B. (Rpta.: 197/200)
(f) No tenga ni A ni B. (Rpta.: 183/200)
(g) Tenga solo 2 fallas. (Rpta.: 10/200)
21. Muestre si las siguientes proposiciones son ciertas o falsas:
(a) Si P(A) +P(B) = 1 entonces A B = .
(b) Si P(A) = P(B) = p entonces P(A B) < p
2
.
(c) Si P(A) = P(B
) entonces A
= B.
(d) Si P(A) = 0 entonces A
= .
(e) Si P(A) = 0 y P(B) = 1, entonces P(A B) = 0.
22. Si se lanza una moneda regular 10 veces, cual es la probabilidad de obtener exactamente
3 caras? (Rpta.: 0.1172)
23. En una clase hay 15 chicos y 30 chicas. Se seleccionan al azar 10 estudiantes para
una tarea especial. Que probabilidad hay de seleccionar exactamente 3 chicos? (Rpta.:
0.2904)
48 CAP
ITULO 5. PROBABILIDADES
24. Las caras numeradas 1, 2 y 3 de un dado son de color rojo, las caras 4 y 5 son de color
blanco y la cara 6 es azul.
(a) Al lanzar este dado, cu al es la probabilidad que aparezca una cara roja o un
n umero mayor que 4? (Rpta.: 5/6)
(b) Si aparecio un n umero impar, cual es la probabilidad de que la cara sea roja?
(Rpta.: 2/3)
25. Si se sabe que al lanzar 5 monedas aparecieron al menos 2 caras, cual es la probabilidad
de que hayan aparecido exactamente 3? (Rpta.: 0.3846)
26. Un conjunto electronico consta de dos subsistemas, digamos A y B. A partir de una serie
de pruebas previas se determin o que la probabilidad de que falle A es 0.2, la probabilidad
de que falle B pero no A es 0.15, y la probabilidad de que fallen los dos es 0.15. Calcular
las siguientes probabilidades:
(a) P(Falle A|Fallo B) (Rpta.: 0.5)
(b) P(Solo falle A) (Rpta.: 0.05)
27. En una ciudad se publican los periodicos A, B y C. Una encuesta reciente indica que
la poblacion adulta tiene las siguientes preferencias: 20 % lee A, 16 % lee B, 14 % lee C,
8 % lee A y B, 5 % lee A y C, 4 % lee B y C, y 2 % lee los tres. Para un adulto escogido
al azar, calcular la probabilidad de que:
(a) No lea ninguno de los periodicos. (Rpta.: 0.65)
(b) Lea exactamente uno de los periodicos. (Rpta.: 0.22)
(c) Lea al menos A y B si se sabe que lee al menos uno de los periodicos publicados.
(Rpta.: 8/35)
28. Una empresa de seguros clasica a sus 10000 asegurados de acuerdo con el genero
(hombre o mujer), la edad (joven o adulto), y el estado civil (casado o soltero). De estos
asegurados se sabe que 3000 son personas jovenes, 4600 son hombres, 7000 son personas
casadas, 1320 son hombres jovenes, 3010 son hombres casados, 1400 son personas jovenes
casadas y 600 son hombres jovenes casados. Si se elige un asegurado al azar, hallar la
probabilidad de que:
(a) Sea una mujer joven soltera.
(b) Sea soltero sabiendo que es hombre. (Rpta.: 0.3456)
(c) Sea un hombre casado sabiendo que es adulto. (Rpta.: 0.3443)
29. Suponga que el 20 % de cierta poblacion es hipertensa y que se cuenta con una maquina
automatica para medir la presion arterial que identica como hipertensos al 84 % de los
hipertensos y al 23 % de los no hipertensos. Una persona es seleccionada aleatoriamente
desde esta poblacion.
(a) Cual es la probabilidad de que la maquina la identique como hipertensa? (Rpta.:
0.352)
(b) Si la maquina la identica como hipertensa, cual es la probabilidad de que real-
mente lo sea? (Rpta.: 0.4773)
5.4. EJERCICIOS 49
30. Inocencio llega a su trabajo despues de las 8 a.m. con una probabilidad de 0.2. Si llega
despues de las 8 a.m. hay una probabilidad de 0.6 de que olvide marcar su tarjeta en
tanto que esta es solo de 0.05 si llega antes de las 8 a.m. Hallar la probabilidad de que
en un da cualquiera:
(a) Inocencio marque su tarjeta. (Rpta.: 0.84)
(b) Si en un da Inocencio olvido marcar su tarjeta, cual es la probabilidad de que
haya llegado despues de las 8 a.m.? (Rpta.: 0.75)
31. Una compa na de seguros sabe que el 70 % de los incendios son iniciados por causas
fortuitas y el 30 % restante por alg un tipo de negligencia. Cuando la causa es fortuita,
la compa na de seguros asume los costos de las perdidas en un 95 % de las veces, mientras
que cuando el incendio se produce por una negligencia, la compa na asume los costos
de las perdidas en solo un 10 % de las veces.
(a) Si un asegurado sufre un incendio, cual es la probabilidad de que la compa na de
seguros le cubra los costos de las perdidas? (Rpta.: 0.695)
(b) Si la compa na asume los costos de las perdidas en un incendio, cual es la proba-
bilidad de que el incendio haya sido iniciado por una negligencia? (Rpta.: 0.04317)
(c) Suponga que en el ultimo a no la compa na atendio 6 incendios. Cual es la proba-
bilidad de que 2 hayan sido ocasionados por una negligencia? (Rpta.: 0.3241)
32. Un banco ha comprobado que la probabilidad de que un cliente con fondos extienda un
cheque con fecha equivocada es de 0.05; en cambio, esta probabilidad es de 0.8 para los
clientes sin fondos. El 90 % de los clientes del banco tienen fondos. Si se recibe en caja
un cheque con fecha equivocada, cual es la probabilidad de que sea de un cliente sin
fondos?
33. Suponga que tres candidatos A, B y C compiten por el control del consejo de adminis-
tracion de una empresa. Las probabilidades de que estos candidatos ganen son 0.2, 0.3
y 0.5 respectivamente. Si la probabilidad de fabricar un nuevo producto X es 0.7 si gana
A, 0.6 si gana B y 0.1 si gana C, hallar la probabilidad de que el candidato C haya sido
elegido si el producto X fue fabricado despues de las elecciones. (Rpta.: 0.1351)
34. Suponga que una empresa dedicada a realizar revisiones tecnicas tiene dos talleres A
y B. Se sabe que el 60 % de los conductores eligen el taller A y el 40 % restante el
taller B. Para un vehculo que pasa por el taller A, la probabilidad de que apruebe el
examen es 0.9 mientras que para un vehculo que pasa por el taller B la probabilidad
correspondiente es 0.85.
(a) Si se sabe que un vehculo desaprobo la revision tecnica, cual es la probabilidad
de que haya escogido el taller B? (Rpta.: 0.5)
(b) Si 3 amigos escogen el taller A, cual es la probabilidad de que solo uno desapruebe?
Considere los resultados de las tres revisiones como independientes. (Rpta.: 0.243)
35. Miguel tiene actualmente una caja que contiene 6 pares de aretes de oro de 14 kilates
en tres diferentes tama nos: dos de 3mm, dos de 4mm y dos de 5mm. Cada vez que
Miguel necesita un regalo poco costoso para alguna amiga selecciona aleatoriamente un
50 CAP
ITULO 5. PROBABILIDADES
par de aretes desde la caja. Si el par seleccionado es de 3mm, no lo reemplaza; si el
par seleccionado es de 4mm, el lo reemplaza luego por uno identico; nalmente si el
par seleccionado es de 5mm, entonces lo reemplaza por dos pares de 5mm. Cual es la
probabilidad de que el segundo par seleccionado sea uno de 4mm? (Rpta.: 0.3397)
36. Tres aventureros deben elegir a uno de ellos para una mision arriesgada. Para ello toman
una urna con dos bolas blancas y una negra y extraen cada uno sucesivamente una bola
sin reemplazo. El elegido sera el que escoja la bola negra. Demuestre que todos tienen
la misma probabilidad de ser seleccionados para la mision, sea cual sea el orden en que
efect uen las extracciones.
37. Existen dos vas que conducen de la ciudad A a la ciudad B y dos vas que conducen
de la ciudad B a la ciudad C. En epoca de lluvias, cada una de las 4 vas tiene una
probabilidad de 0.6 de ser interrumpida por la cada de huaycos, independiente las unas
de las otras. Con que probabilidad se podra pasar de la ciudad A a la ciudad C en un
momento dado en epoca de lluvias? (Rpta.: 0.4096)
38. Cada vez que se hace un experimento la ocurrencia de un evento particular A es igual
a 0.2. El experimento se repite, independientemente, hasta que A ocurre.
(a) Calcule la probabilidad de que A ocurra en el cuarto experimento. (Rpta.: 0.1024)
(b) Si se van a realizar n experimentos, calcule el valor de n de modo que la probabilidad
de que ninguno de ellos resulte en A sea 0.32768. (Rpta.: 5)
39. Las probabilidades de que tres tiradores A, B y C den en el blanco son, respectivamente,
1/3, 1/4 y 1/5. Si cada uno de ellos hace un disparo, calcular la probabilidad de que:
(a) Solamente dos den en el blanco. (Rpta.: 3/20)
(b) Ninguno de en el blanco. (Rpta.: 2/5)
40. Un ingeniero tiene tres proyectos en ejecucion, cada uno de los cuales puede resultar en
un exito o un fracaso. Las probabilidades de exito para estos proyectos son 0.8, 0.7 y 0.6.
El ingeniero conservara su trabajo si al menos dos de sus proyectos resultan exitosos.
Asumiendo independencia entre los tres proyectos, cual es la probabilidad de que el
ingeniero se quede sin trabajo? (Rpta.: 0.212)
41. El 60 % de los clientes de una entidad nanciera son hombres, el 70 % tienen casa propia,
y el 30 % son mujeres que tienen casa propia.
(a) Si se elige un cliente al azar, cual es la probabilidad de que sea hombre y no tenga
casa propia?. (Rpta.: 0.2)
(b) Si se eligen al azar 3 clientes, cual es la probabilidad de que solo uno de ellos
no tenga casa propia?. Asuma independencia entre la condicion de los 3 clientes.
(Rpta.: 0.441)
Captulo 6
Variables Aleatorias
6.1. Denicion
Una variable aleatoria es una funcion X() que tiene como dominio al espacio muestral y
como rango a un subconjunto de los n umeros reales R
X
. Considere por ejemplo el experimento
aleatorio trivial consistente en lanzar dos monedas y la variable aleatoria X que representa el
n umero de caras que aparecen. En este caso el espacio muestral consiste de los cuatro posibles
resultados, esto es, = {
1
= SS,
2
= SC,
3
= CS,
4
= CC} y la variable aleatoria X
es la funcion denida de la siguiente manera: X(
1
) = 0, X(
2
) = X(
3
) = 1 y X(
4
) = 2.
6.2. Variable aleatoria discreta
Una variable aleatoria X es discreta si el n umero de valores posibles de la variable es nito
o innito numerable.
6.2.1. Funcion de masa de probabilidad de una variable aleatoria discreta
(fmp)
Sea X una variable aleatoria discreta con rango R
X
. Una funcion f(x) es llamada la
funcion de masa de probabilidad de X si tiene como dominio a R
X
y como rango a un
conjunto de n umeros reales f(x) = P(X = x) que cumplen con las siguientes condiciones:
1. 0 f(x) 1.
2.
x
i
R
X
f(x
i
) = 1.
Ejemplo 53: En un examen hay 3 preguntas del tipo verdadero o falso. Un alumno, que no tiene
ning un conocimiento sobre el tema, va ha responder aleatoriamente. Sea la variable aleatoria discreta
X el n umero de respuestas correctas. En este caso, para cada pregunta, la probabilidad de que el
alumno marque la respuesta correcta es 0.5. En la gura 6.1 se presentan el espacio muestral de este
experimento aleatorio, el rango de la variable aleatoria y la fmp. En la gura 6.3 (lado izquierdo) se
presenta el graco de la fmp.
51
52 CAP
x
i
x
f(x
i
). (6.1)
A continuacion se presenta la fda correspondiente a los dos ejemplos anteriores.
F(x) =
_
_
0 x < 0
1/8 0 x < 1
4/8 1 x < 2
7/8 2 x < 3
1 x 3
F(y) =
_
_
0 y < 0
5/30 0 y < 1
20/30 1 y < 2
29/30 2 y < 3
1 y 3
.
6.3. VARIABLE ALEATORIA CONTINUA 53
0 1 2 3
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
X
f
(
x
)
0 1 2 3
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
Y
f
(
y
)
Figura 6.3: Graco de la fmp para las variables aleatorias n umero de respuestas correctas (X) y
n umero de ovejas negras (Y).
6.3. Variable aleatoria continua
Una variable aleatoria X es continua si el n umero de valores posibles de la variable es
innito no numerable.
Ejemplo 55: Una fabrica produce varillas de acero con una longitud de entre 2 y 4 pulgadas. Se
selecciona una varilla al azar de la lnea de produccion y se dene la variable aleatoria continua X
como la longitud de la varilla seleccionada. En este caso, D
X
= = {
i
:
i
lnea de produccion} y
R
X
= {X : 2 < X < 4}.
6.3.1. Funcion de densidad de probabilidad de una variable aleatoria con-
tinua (fdp)
Sea X una variable aleatoria continua con rango R
X
. Una funcion f(x) es llamada la
funcion de densidad de probabilidad de X si tiene como dominio a R
X
y como rango a un
conjunto de n umeros reales f(x) que cumplen con las siguientes condiciones:
1. 0 f(x).
2.
_
R
X
f(x)dx = 1.
Ejemplo 56: Suponga que la longitud de ciertas varillas de acero es una variable aleatoria continua
X con fdp
f(x) =
3
56
x
2
I
(2,4)
(x).
Constituye f(x) una fdp?
54 CAP
4
2
=
64
56
8
56
= 1.
Por lo tanto, f(x) s es una fdp. En la gura 6.4 se presenta el graco de la fdp de esta variable.
En el ejemplo anterior aparece una expresion de la forma I
(a,b)
(x), que sera utilizada con
frecuencia de aqu en adelante. I
(a,b)
(x) es la funcion indicadora, y se dene como la funcion
que toma el valor 1 cuando la variable X esta en el intervalo (a, b) y 0 en caso contrario.
6.3.2. Probabilidad de un evento
La probabilidad de que una variable aleatoria continua X tome valores en el intervalo
[a, b] esta dada por
P(X [a, b]) =
_
b
a
f(x)dx. (6.2)
Ejemplo 57: La probabilidad de que una varilla seleccionada al azar mida mas de 3 y menos de 3.5
pulgadas es
P(3 < X < 3.5) =
_
3.5
3
3
56
x
2
dx =
x
3
56
3.5
3
= 0.2835.
Esta probabilidad es representada por el area sombreada en la gura 6.5.
Ejemplo 58: La probabilidad de que una varilla mida mas de 3 y menos de 3.5 pulgadas si se sabe
que mide mas de 2.5 pulgadas es
P(3 < X < 3.5|X > 2.5) =
P(3 < X < 3.5)
P(X > 2.5)
=
_
3.5
3
3
56
x
2
dx
_
4
2.5
3
56
x
2
dx
=
0.2835
0.7210
= 0.3932.
f(x)dx. (6.3)
Esta funcion cumple con las siguientes propiedades (tanto para el caso de variables aleatorias
continuas como discretas):
1. lm
x
F(x) = 0.
2. lm
x
F(x) = 1.
3. Si x y, entonces F(x) F(y).
Ejemplo 59: Para el ejemplo tratado en esta seccion se tiene que
P(X x) =
_
x
3
56
x
2
dx =
_
x
2
3
56
x
2
dx =
x
3
56
x
2
=
x
3
8
56
.
Entonces, la fda se dene por
F(x) =
_
_
0 x < 2
x
3
8
56
2 x < 4
1 x 4
.
56 CAP
R
X
g(x)f(x) si X es una variable aleatoria discreta (6.4)
E(g(x)) =
_
R
X
g(x)f(x)dx si X es una variable aleatoria continua (6.5)
6.4.2. Media, valor esperado o esperanza matematica de una variable alea-
toria
Sea X una variable aleatoria con funcion de probabilidad f(x). Entonces la media, valor
esperado o esperanza matematica de X se dene como:
= E(X) =
R
X
xf(x) si X es una variable aleatoria discreta (6.6)
= E(X) =
_
R
X
xf(x)dx si X es una variable aleatoria continua (6.7)
Note que los resultados (6.6) y (6.7) se desprenden de los resultados (6.4) y (6.5) respectiva-
mente haciendo g(x) = x.
Ejemplo 60: Considere la variable aleatoria discreta X, n umero de respuestas correctas, denida en
el ejemplo 53. En la gura 6.1 se presenta la fmp de esta variable. Utilizando la formula (6.6) con esta
variable se tiene que
= E(X) = 0
1
8
+ 1
3
8
+ 2
3
8
+ 3
1
8
= 1.5 respuestas correctas.
Ejemplo 61: Considere la variable aleatoria continua X, longitud de una varilla, denida en el ejemplo
56. Utilizando la formula (6.7) con esta variable se tiene que
= E(X) =
_
4
2
x
3
56
x
2
dx =
_
4
2
3
56
x
3
dx =
3
224
x
4
4
2
= 3.214 pulgadas.
2
= V (X) = E[(X )
2
]. (6.8)
6.4. VALOR ESPERADO Y VARIANZA 57
Si la variable aleatoria es discreta, a partir del resultado (6.4) se tiene que
2
= V (X) =
R
X
(x )
2
f(x). (6.9)
Si la variable aleatoria es continua, a partir del resultado (6.5) se tiene que
2
= V (X) =
_
R
X
(x )
2
f(x)dx. (6.10)
Un poco de algebra a partir de los resultados (6.9) o (6.10) permite demostrar que, tanto para
variables aleatorias discretas como continuas, la varianza puede escribirse tambien como
V (X) = E[(X )
2
] = E[X
2
]
2
. (6.11)
Ejemplo 62: Considere la variable aleatoria discreta X, n umero de respuestas correctas, denida en
el ejemplo 53. En la gura 6.1 se presenta la fmp de esta variable. Utilizando la formula (6.4) sobre
X
2
se tiene que
E(X
2
) = 0
2
1
8
+ 1
2
3
8
+ 2
2
3
8
+ 3
2
1
8
= 3
y entonces, aplicando el resultado (6.11), la varianza de X resulta
V (X) = E[X
2
]
2
= 3 1.5
2
= 0.75 respuestas correctas
2
.
Ejemplo 63: Considere la variable aleatoria continua X, longitud de una varilla, denida en el ejemplo
56. Utilizando la formula (6.5) sobre X
2
se tiene que
E(X
2
) =
_
4
2
x
2
3
56
x
2
dx =
_
4
2
3
56
x
4
dx =
3
280
x
5
4
2
= 10.6286
y entonces, aplicando el resultado (6.11), la varianza de X resulta
V (X) = E[X
2
]
2
= 10.6286 3.214
2
= 0.2969 pulgadas
2
.
x
(1 )
nx
x = 0, 1, . . . , n. (7.1)
Notacion: X Bin(n, ) (Se lee X tiene distribucion binomial con parametros n y ).
Si X tiene una distribucion binomial con parametros n y , entonces su media y varianza
estan dadas por
= E(X) = n
2
= V (X) = n(1 ). (7.2)
La fmp de una variable con distribucion binomial es simetrica para = 0.5, asimetrica positiva
para < 0.5 y asimetrica negativa para > 0.5. La varianza de una variable con distribucion
binomial es maxima cuando = 0.5. Se pueden calcular probabilidades para una variable con
distribucion binomial en MINITAB en el men u Calc/Probability Distributions/Binomial. . .
Ejemplo 64: Con el objetivo de disminuir sus costos de produccion, una empresa azucarera empaca
900 gr en el 20 % de las bolsas de un kilo de su produccion. Un cliente compra 20 bolsas y decide
vericar el peso de cada una de ellas. Suponiendo que la variable aleatoria X, n umero de bolsas con
900 gr, sigue una distribucion de probabilidades binomial, responda lo siguiente:
(a) Dena el rango de la variable y calcule su valor esperado y varianza.
Asumiendo que X Bin(20, 0.2), el rango de X es 0, 1, . . . , 20. La media y la varianza estan
dadas por:
= E(X) = 20 0.2 = 4 bolsas
2
= V (X) = 20 0.2 (1 0.2) = 3.2 bolsas
2
.
(b) Cual es la probabilidad de que el cliente encuentre 3 bolsas con 900 gr?
P(X = 3) =
_
20
3
_
0.2
3
(1 0.2)
203
= 0.2054.
(c) Cual es la probabilidad de que el cliente encuentre mas de 3 pero menos de 7 bolsas con 900
7.2. DISTRIBUCI
ON HIPERGEOM
ETRICA 65
gr?
P(3 < X < 7) = P(X = 4) +P(X = 5) +P(X = 6)
=
_
20
5
_
0.2
5
(1 0.2)
205
+
_
20
5
_
0.2
5
(1 0.2)
205
+
_
20
6
_
0.2
6
(1 0.2)
206
= 0.2182 + 0.1746 + 0.1091
= 0.5019.
(d) Cual es la probabilidad de que el cliente encuentre mas de 3 bolsas si se sabe que no hay mas
de 5 con 900 gr?
P(X > 3|X 5) =
P(3 < X 5)
P(X 5)
=
P(X = 4) +P(X = 5)
P(X 5)
=
0.2182 + 0.1746
0.8042
= 0.4884.
2
= V (X) = 5
20
50
_
1
20
50
__
50 5
50 1
_
= 1.102 bolillas rojas
2
.
(b) Cual es la probabilidad de que el ni no obtenga una bolilla roja y 4 amarillas?
P(X = 1) =
_
20
1
__
5020
51
_
_
50
5
_ = 0.2587.
(c) Cual es la probabilidad de que el ni no obtenga a lo mas 2 bolillas rojas?
P(X 2) = P(X = 0) +P(X = 1) +P(X = 2)
=
_
20
0
__
5020
50
_
_
50
5
_ +
_
20
1
__
5020
51
_
_
50
5
_ +
_
20
2
__
5020
52
_
_
50
5
_
= 0.0673 + 0.2587 + 0.3641
= 0.6900
7.3. DISTRIBUCI
ON DE POISSON 67
7.3. Distribucion de Poisson
7.3.1. Introducci on
Esta distribucion fue desarrollada por el matematico frances Simeon Denis Poisson (1781 -
1840), y expresa la probabilidad de una variable aleatoria denida como el n umero de eventos
que ocurren por cierta unidad de observacion, usualmente relacionada al tiempo, bajo el
supuesto de que estos eventos ocurren en forma aleatoria con una tasa media de ocurrencia
conocida. Las siguientes variables podran tener una distribucion de Poisson:
1. N umero de bacterias por ml.
2. N umero de accidentes por semana en una interseccion.
3. N umero de errores tipogracos por pagina.
4. N umero de clientes que llegan a una agencia bancaria por hora.
5. N umero de arboles de pino por kilometro cuadrado.
6. N umero de emergencias atendidas en un hospital por da.
7. N umero de personas que sufren ataques cardacos por cada 100 000 habitantes al a no.
Es importante denir la unidad de observacion con cuidado. As por ejemplo, si el n umero
de clientes que llegan por hora a una ventanilla de atencion tiene distribucion de Poisson con
una tasa media de 15 clientes por hora, el n umero de clientes que llegan en tres horas tendra
distribucion de Poisson con una tasa media de 45 clientes por cada tres horas.
7.3.2. Caractersticas de la distribucion de Poisson
La fmp de una variable aleatoria X con distribucion de Poisson es
f(x) = P(X = x) =
e
x
x!
x = 0, 1, 2 . . . . (7.5)
Notacion: X Poisson() (Se lee X tiene distribucion de Poisson con parametro ).
Si X tiene una distribucion de Poisson con parametro entonces su media y varianza
estan dadas por
= E(X) =
2
= V (X) = . (7.6)
La fmp binomial con parametros n y p se aproxima a la fmp Poisson con parametro =
np conforme n , y p 0. Se pueden calcular probabilidades para una variable con
distribucion de Poisson en MINITAB en el men u Calc/Probability Distributions/Poisson. . . .
Ejemplo 66: Suponga que el n umero de accidentes que ocurren en una interseccion por semana es una
variable aleatoria que sigue una distribucion de Poisson con tasa media de 2 accidentes por semana.
68 CAP
2
= V (X) = 2 accidentes
2
.
(b) Cual es la probabilidad de que en una semana ocurran 3 accidentes?
P(X = 3) =
e
2
2
3
3!
= 0.1804.
(c) Cual es la probabilidad de que en una semana ocurran mas de 3 accidentes?
P(X > 3) = P(X = 4) +P(X = 5) +P(X = 6) +. . .
= 1 P(X = 0) +P(X = 1) +P(X = 2) P(X = 3)
= 1
e
2
2
0
0!
e
2
2
1
1!
e
2
2
2
2!
e
3
2
3
0!
= 0.1429.
(d) Cual es la probabilidad de que en tres semanas ocurran 5 accidentes?
P(X = 5) =
e
6
6
5
5!
= 0.1606.
7.4. Ejercicios
1. Los resultados de una investigacion de mercado se nalan que aproximadamente uno de
cada 10 consumidores preeren el refresco de cola marca A. Si se selecciona una muestra
aleatoria de 30 consumidores, cual es la probabilidad de que por lo menos 5 preeran
el refresco A?
2. Una compa na de seguros sabe que la probabilidad de que una persona sufra cierto tipo
de accidente durante un a no es 8 %. Se sabe que la compa na tiene 25 asegurados contra
este tipo de accidente.
(a) Cual es la probabilidad de que la compa na tenga que afrontar los gastos de 2 de
sus asegurados? (Rpta.: 0.2821)
(b) Cual es la probabilidad de que la compa na tenga que afrontar los gastos de a lo
mas 3 asegurados? (Rpta.: 0.8649)
(c) Suponga que la compa na tiene que pagar 2500 soles por cada asegurado que sufre
este accidente. Calcule el gasto esperado de la compa na durante el a no. (Rpta.:
5000)
3. Un fabricante vende sus productos en cajas de 10 unidades y se sabe que la probabili-
dad de que una unidad este defectuosa es 5 %. Asumiendo que el n umero de unidades
defectuosas por caja sigue una distribucion binomial calcule lo siguiente.
(a) La probabilidad de que una caja no contenga unidades defectuosas? (Rpta.: 0.5987)
7.4. EJERCICIOS 69
(b) Si una caja no tiene unidades defectuosas es considerada perfecta y no produce
perdida alguna, si tiene una o dos unidades defectuosas produce una perdida de 10
soles, y si tiene mas de dos unidades defectuosas produce una perdida de 30 soles.
Calcule la perdida esperada por caja para el fabricante. (Rpta.: 4.2427)
4. Un examen objetivo consta de 20 preguntas con 4 alternativas cada una.
(a) Si un alumno que no estudio decide responder aleatoriamente (probar suerte en el
examen), cual sera su n umero esperado de puntos en el examen? (Rpta.: 5)
(b) Cual es la probabilidad de que este alumno obtenga un 5? (Rpta.: 0.2023)
(c) Cual es la probabilidad de que este alumno obtenga por lo menos un 4? (Rpta.:
0.7748)
5. Las probabilidades de que un automovil que se somete a una revision tecnica tenga los
frenos en buen estado, en estado regular o malo son 0.7, 0.2 y 0.1 respectivamente. Para
10 automoviles seleccionados al azar, calcule la probabilidad de que:
(a) Por lo menos 7 tengan los frenos en buen estado. (Rpta.: 0.6496)
(b) A lo mas 2 tengan los frenos en mal estado. (Rpta.: 0.9298)
(c) Se encuentren autos con frenos en las 3 condiciones mencionadas. (Rpta.: 0.5722)
6. En un grupo de 40 personas se sabe que 8 estan a favor de legalizar el aborto. Suponga
que se selecciona al azar un grupo de 10 personas desde estas 40, y dena la variable
aleatoria X como el n umero de personas en la muestra que estan a favor de legalizar el
aborto.
(a) Dena el rango de la variable y calcule su valor esperado y varianza. (Rpta.: R
X
=
{0, 1, . . . , 8}, E(X) = 2, V (X) = 1.2308)
(b) Cual es la probabilidad de encontrar entre 3 y 5 personas a favor de legalizar el
aborto? (Rpta.: 0.3105)
7. De un lote de 25 artculos que contiene 5 defectuosos se selecciona una muestra de 4
al azar. Sea la variable aleatoria X el n umero de artculos defectuosos encontrados en
la muestra. Calcule la probabilidad de obtener mas de 2 defectuosos para los casos en
que el muestreo sea con y sin reemplazo. (Rpta.: Con reemplazo 0.0272 y sin reemplazo
0.0162)
8. En un intento para burlar la vigilancia de la aduana en un aeropuerto, un viajero coloco
en un frasco 8 tabletas de narcotico junto con 20 pastillas de vitaminas de apariencia
semejante. Si el inspector de aduana selecciona 5 tabletas al azar para analizarlas.
(a) Cual es la probabilidad de que el viajero sea descubierto y arrestado por posesion
ilegal de narcoticos? (Rpta.:0.8422)
(b) Cual es la probabilidad de que el inspector encuentre 2 tabletas de narcotico?
(Rpta.:0.3248)
9. La empresa FERTISA se dedica a la produccion de fertilizantes y tiene ciertos problemas
en el envasado de sus productos. Un lote de 100 sacos que contienen 8 defectuosamente
envasados ha sido remitido a la rma AGROUNA.
70 CAP
1
b a
dx =
x a
b a
.
73
74 CAP
a
)
Figura 8.1: fdp para una distribucion uniforme continua en el intervalo [a,b].
Luego, la fda esta dada por
F(x) =
_
_
0 si x < a
(x a)/(b a) si a x < b
1 si x b
. (8.3)
Esta distribucion es util para generar n umeros aleatorios para variables con distintas distribu-
ciones de probabilidad, tanto continuas como discretas. Se pueden calcular probabilidades para
una variable con distribucion uniforme continua en MINITAB en el men u Calc/Probability
Distributions/Uniform. . . .
Ejemplo 67: Suponga que el peso neto de un paquete de cereal es una variable aleatoria con distri-
bucion uniforme continua en el intervalo de 195 a 205 gramos.
(a) Calcule la probabilidad de que un paquete seleccionado al azar tenga menos de 197 gramos.
P(X 197) =
197 195
205 195
= 0.2.
(b) Calcule el valor esperado y la varianza del peso de los paquetes.
E(X) =
195 + 205
2
= 200.
V (X) =
(205 195)
2
12
= 8.333.
(c) Calcule el primer cuartil de la distribucion de los pesos.
El primer cuartil es un valor q
1
que satisface la condicion
P(X q
1
) =
q
1
195
205 195
= 0.25.
Luego, despejando se tiene que q
1
= 197.5.
8.2. DISTRIBUCI
ON NORMAL 75
10 5 0 5 10 15 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
N(5, 5
2
)
X
f
(
x
)
10 5 0 5 10 15 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
N(10, 3
2
)
X
f
(
x
)
10 5 0 5 10 15 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
N(3, 2
2
)
X
f
(
x
)
Figura 8.2: fdp normal para diferentes valores de la media y varianza.
8.2. Distribucion normal
8.2.1. Introducci on
Sin lugar a dudas, la distribucion normal constituye el modelo de probabilidad mas utili-
zado. Una de las razones de su gran aplicabilidad es el teorema del lmite central, desarrollado
por De Moivre en 1733 y por Gauss casi 100 a nos despues (por esta razon, la curva normal
es tambien conocida como Gaussiana). El teorema del lmite central establece que la variable
aleatoria que corresponde al promedio o suma del resultado de varias mediciones tiende a una
distribucion normal conforme el n umero de mediciones aumenta. As por ejemplo, aunque el
ingreso mensual de las personas en una comunidad podra tener una distribucion bastante
diferente de la normal, el ingreso promedio de los individuos de la comunidad podra ajustarse
bastante bien. Por otro lado, si el ingreso mensual de una persona esta constituido por la suma
de varios pagos, su ingreso tambien podra ajustarse bastante bien a la normal. En general,
cualquier variable aleatoria continua cuya distribucion exhiba simetra y colas poco pesadas
podra ajustarse bien a la distribucion normal, como por ejemplo algunos pesos, longitudes,
vol umenes, tiempos de vida, errores de medicion, etc.
8.2.2. Caractersticas de la distribucion normal
La fdp de una variable aleatoria X con distribucion normal es
f
X
(x) =
1
2
exp
_
(x )
2
2
2
_
I
(,)
(x), < < , > 0. (8.4)
Notacion: X N(,
2
) (Se lee X tiene distribucion normal con media y varianza
2
).
Si X tiene una distribucion normal con parametros y
2
, entonces
E(X) = V (X) =
2
. (8.5)
En la gura 8.2 se presenta la fdp normal para tres combinaciones diferentes de los parametros.
La distribucion normal tiene forma acampanada y es simetrica con respecto a su media. Por
lo tanto, se puede vericar que si X tiene distribucion N(,
2
), entonces P(X < ) =
76 CAP
22
exp
_
(x 10)
2
2 2
2
_
dx = 0.4331928.
Esta probabilidad esta dada por el area sombreada en la gura 8.3.
Otra caracterstica importante de la distribucion normal es que la suma de variables
aleatorias con distribucion normal, tambien tiene distribucion normal. As, si X
1
, X
2
, . . . , X
n
son variables aleatorias independientes con distribuciones N(
i
,
2
i
), dadas las constantes
a
1
, a
2
, . . . , a
n
, la variable aleatoria Y =
n
i=1
a
i
x
i
tiene distribucion normal con media y
varianza dadas por
y
=
n
i=1
a
i
i
y
2
y
=
n
i=1
a
2
i
2
i
.
Ejemplo 69: Se sabe que el salario mensual de una pareja de esposos, X
1
y X
2
, son variables alea-
torias normales con medias 1000 y 1500 soles, y desviaciones estandar de 100 y 120 soles. Cual es la
probabilidad de que un mes determinado el ingreso conjunto de ambos esposos supere los 3000 soles?
Para resolver este problema dena la variable aleatoria ingreso conjunto por Y = X
1
+X
2
. Entonces
se tiene que Y N(1000 + 1500, 100
2
+ 120
2
) y P(Y > 3000) = 0.000685.
8.2.3. Distribucion normal estandar
Sea X una variable aleatoria con distribucion N(,
2
). Entonces la variable
Z =
X
(8.6)
8.2. DISTRIBUCI
ON NORMAL 77
4 2 0 2 4
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
Distribucin Normal Estndar
Z
Figura 8.4: Graco de la fdp N(0, 1).
tiene distribucion N(0, 1). A esta distribucion se le conoce como la normal estandar y su fdp
esta dada por
f
Z
(z) =
1
2
exp
_
z
2
2
_
I
(,)
(z). (8.7)
En la gura 8.4 se presenta el graco de la fdp de esta distribucion. La fda de la variable
normal estandar es denotada por (z), y esta dada por
(z) = P(Z < z) =
_
z
2
exp
_
z
2
2
_
dz. (8.8)
Ejemplo 70: Suponga que la variable X tiene distribucion N(,
2
). Si se sabe que P(X < 3) = 0.2
y P(X < 4) = 0.3, calcule la media y la varianza.
Se puede calcular la media y la varianza de esta distribucion teniendo en cuenta que
P(X < 3) = P
_
Z <
3
_
= 0.2
P(X < 4) = P
_
Z <
4
_
= 0.3.
Dado que P(Z < 0.8416) = 0.2 y P(Z < 0.5244) = 0.3, se tiene que
3
= 0.8416 y
4
= 0.5244
de lo que nalmente se obtiene que = 5.6531 y
2
= 3.1524
2
.
78 CAP
x
1
e
x/
I
(0,)
(x) > 0, > 0. (8.9)
En esta expresion, (.) representa la funcion gamma, que es denida por
() =
_
0
t
1
e
t
dt. (8.10)
Utilizando integracion por partes se puede demostrar que
() = ( 1)( 1).
Luego, para valores enteros se tiene que () = (1)!. Otra caracterstica bien conocida de
la funcion gamma es que (1/2) =
.
Notacion: X Gamma(, ) (Se lee X tiene distribucion gamma con parametros y ).
Si X tiene una distribucion gamma con parametros y , entonces
E(X) = V (X) =
2
. (8.11)
Con entero, la distribucion resultante es conocida como la distribucion de Erlang. En este
caso, la variable aleatoria X con distribucion gamma(, ) (o Erlang(, ) representa el tiem-
po que transcurre hasta la observacion del suceso n umero , considerando que el n umero de
sucesos de este tipo que ocurren por unidad de tiempo tiene una distribucion de Poisson con
media 1/. Con = 1, la distribucion resultante es conocida como la distribucion Exponen-
cial, que se tratara en la siguiente seccion. Con = k/2 y = 2, la distribucion resultante es
conocida como la distribucion ji-cuadrado con k grados de libertad, que tambien sera vista
mas adelante.
Se pueden calcular probabilidades para una variable con distribucion gamma en MINITAB
en el men u Calc/Probability Distributions/Gamma. . . .
Ejemplo 71: En una clnica los pacientes llegan a emergencia en cualquier momento del da siguiendo
una distribucion de Poisson con una tasa media de 1 paciente cada 20 minutos.
8.4. DISTRIBUCI
ON EXPONENCIAL 79
(a) Calcule la probabilidad de que pasen 10 minutos y no haya llegado ning un paciente.
El n umero de pacientes que llegan por minuto tendra una distribucion de Poisson con parametro
= 1/20. Luego, la variable X denida como el tiempo en minutos para la llegada de un paciente
tendra distribucion gamma con parametros = 1 y = 1/ = 20. Entonces, P(X > 10) =
1 0.3935 = 0.6065.
(b) Calcule la probabilidad de que se tenga que esperar mas de una hora para que llegue el cuarto
paciente.
El n umero de pacientes que llegan por minuto tendra una distribucion de Poisson con parametro
= 1/20. Luego, la variable X denida como el tiempo en minutos para la llegada del cuarto
paciente tendra distribucion gamma con parametros = 4 y = 1/ = 20. Entonces, P(X >
60) = 1 0.3528 = 0.6472.
e
x/
I
(0,)
(x) > 0. (8.12)
Notacion: X Exp() (Se lee X tiene distribucion exponencial con parametro ).
Si X tiene una distribucion exponencial con parametro , entonces
E(X) = V (X) =
2
. (8.13)
Existe una conexion entre las distribuciones exponencial y de Poisson. As, si la variable
Y Poisson() representa el n umero de sucesos de cierto tipo que ocurren por unidad de
tiempo, entonces el tiempo entre dos sucesos consecutivos, medido en las mismas unidades
de tiempo, tiene distribucion Exp( = 1/). Otra caracterstica importante de la distribu-
cion exponencial es la de perdida de memoria. Seg un esta propiedad, si X tiene distribucion
exponencial, entonces se cumple que P(X > s +x|X > s) = P(X > x).
Se pueden calcular probabilidades para una variable con distribucion exponencial en MI-
NITAB en el men u Calc/Probability Distributions/Exponential. . .
Ejemplo 72: Se sabe que el tiempo de vida de cierto circuito tiene una distribucion exponencial con
una media de 1500 horas.
80 CAP
x
1
e
(x/)
I
(0,)
(x), > 0, > 0. (8.14)
Notacion: X Weibull(, ) (Se lee X tiene distribucion de Weibull con parametros y
).
Si X tiene una distribucion de Weibull con parametros y , entonces
E(X) =
_
1 +
1
_
V (X) =
2
_
_
1 +
2
_
1 +
1
__
2
_
. (8.15)
El parametro permite modelar tiempos de vida con gran exibilidad como se indica a
continuacion:
Si < 1, entonces la tasa de fallas disminuye en el tiempo. Esta situacion sugiere una
alta mortalidad infantil, esto es, que las unidades con predisposicion a fallar lo hacen
pronto, de modo que al pasar el tiempo solo las resistentes van quedando, con lo que la
tasa de fallas disminuye.
Si = 1, entonces la tasa de fallas es constante, y la distribucion resultate es la expo-
nencial con parametro .
Si > 1, entonces la tasa de fallas aumenta en el tiempo. Esta situacion sugiere undes-
gaste en las unidades, de modo que conforme el tiempo pasa, aumenta la probabilidad
de fallar.
8.6. DISTRIBUCI
ON JI-CUADRADO 81
Se pueden calcular probabilidades para una variable con distribucion de Weibull en MINITAB
en el men u Calc/Probability Distributions/Weibull. . . .
Ejemplo 73: El tiempo de vida de una l ampara incandescente en miles de horas tiene una distribucion
de Weibull con parametros = 1.2 y = 6. Cual es la probabilidad de que una lampara cualquiera
funcione menos de 7000 horas?
P(X < 7) = 0.6998.
i=1
_
X
i
_
2
2
(n)
(8.18)
y
n
i=1
_
X
i
_
2
=
n
i=1
(X
i
X)
2
2
=
(n 1)S
2
2
2
(n1)
. (8.19)
82 CAP
2
(1)
X
f
(
x
)
0 5 10 15 20 25 30
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
2
(3)
X
f
(
x
)
0 5 10 15 20 25 30
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
2
(10)
X
f
(
x
)
Figura 8.5: fdp ji-cuadrado para diferentes valores de los grados de libertad.
Para dos variables aleatorias independientes X
1
2
(n
1
)
y X
2
2
(n
2
)
, se tiene que
X
1
+X
2
2
(n
1
+n
2
)
.
Ejemplo 74:
1. Si Z N(0, 1), entonces P(Z
2
< 3) = 0.9167.
2. Si X
2
(25)
, entonces P(X < 30) = 0.7757.
3. Si X
2
(25)
y P(X > x
0
) = 0.05, entonces x
0
= 37.65.
k
__
1 +
x
2
k
_
k+1
2
I
(,)
(x), k > 0. (8.20)
8.7. DISTRIBUCI
ON T DE STUDENT 83
6 4 2 0 2 4 6
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
t(1)
X
f
(
x
)
6 4 2 0 2 4 6
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
t(5)
X
f
(
x
)
6 4 2 0 2 4 6
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
t(50)
X
f
(
x
)
Figura 8.6: fdp t de Student para diferentes valores de los grados de libertad.
Notacion: X t
(k)
(Se lee X tiene distribucion t de Student con k grados de libertad).
Si X tiene una distribucion t de Student con k grados de libertad, entonces
E(X) = 0 con k > 1 V (X) =
k
k 2
con k > 2. (8.21)
La distribucion t con 1 grado de libertad es conocida como la distribucion de Cauchy, y ni
la media ni la desviacion estandar son denidas. En la gura 8.6 se presenta la fdp de esta
distribucion para distintos valores de los grados de libertad. Se pueden calcular probabilidades
para una variable con distribucion t de Student en MINITAB en el men u Calc/Probability
Distributions/t. . . .
A continuacion se mencionan algunas caractersticas importantes de esta distribucion:
La distribucion t de Student tiene forma acampanada y es simetrica con respecto a su
media.
La distribucion t de Student se aproxima a la distribucion normal estandar conforme
k .
Si las variables aleatorias Z N(0, 1) y U
2
(k)
son independientes, entonces la
variable aleatoria
Z
_
U
k
t
(k)
.
Ejemplo 75:
1. Si X t
(12)
, entonces P(X < 3) = 0.9945.
2. Si X t
(4)
, entonces P(X > 1) = 1 P(X < 1) = 1 0.1870 = 0.8130. Dado que la
distribucion t es simetrica en torno a cero, el resultado anterior se pudo calcular de la siguiente
manera:
P(X > 1) = P(X < 1) = 0.8130.
3. Si X t
(8)
y P(X < x
0
) = 0.32, entonces x
0
= 0.4860.
84 CAP
8.9. Ejercicios
1. El tiempo en minutos que tiene que esperar un cliente para ser atendido en una tienda
es una variable con distribucion uniforme en el intervalo (0, 8). Cual es la probabilidad
de que un cliente tenga que esperar mas de 5 minutos? (Rpta.: 0.375)
2. El sueldo de los nuevos empleados en una empresa es una variable aleatoria con distri-
bucion uniforme en el intervalo [1, 2] en miles de soles.
(a) Cual es la probabilidad de que un empleado ingrese con un sueldo de entre 1600
y 1800 soles? (Rpta.: 0.2)
(b) Cual es la probabilidad de que un empleado ingrese con un sueldo de mas de 1200
soles si se ha escuchado por ah que no ganara mas de 1500? (Rpta.: 0.6)
3. Sea la variable aleatoria X U(a, b). Demuestre que la varianza de X esta dada por
(ba)
2
12
.
4. En un programa concurso tienen una rueda dividida en varias secciones, cada una con
un premio diferente. Los concursantes giran la rueda y se llevan el premio que queda
indicado por la echa de la rueda una vez que esta se detiene. Si denimos como X al
angulo en grados formado por la echa y un radio de referencia, entonces podramos
asumir que X tiene una distribucion uniforme en el intervalo (0, 360).
(a) Si los organizadores del concurso colocan un premio fabuloso en la seccion com-
prendida entre los grados 10 y 30, cual es la probabilidad de que un concursante
se lleve dicho premio? (Rpta.: 0.05556)
(b) Suponga que los organizadores dividen la rueda en cuatro partes iguales de la
siguiente manera: El primer cuarto con un premio de 500 soles, el segundo cuarto
con un premio de 100 soles, el tercer cuarto con un premio de 20 soles y el cuarto
cuarto sin premio. Calcule el valor esperado del premio para un concursante. (Rpta.:
155 soles)
(c) Considere que un cuarto de la rueda no tiene premio y los otros 3 cuartos s. Si
en un programa dado participan 8 personas, cual es la probabilidad de que 2 se
queden sin premio? (Rpta.: 0.3115)
86 CAP
i=1
(x
i
x)
2
5
< 9
_
(Rpta.: 0.9534)
21. Si de una poblacion normal con media y varianza 10 se extrae una muestra aleatoria
de 13 observaciones, hallar h tal que
P
_
13
i=1
(x
i
)
2
< h
_
= 0.7
(Rpta.: 151.19)
22. Dadas las variables aleatorias independientes X
2
(30)
, Y
2
(20)
y Z N(0, 1),
calcule lo siguiente:
(a) Los lmites del 90 % central de la distribucion de X. (Rpta.: 18.49 y 43.77)
(b) El valor de k tal que P(|Z| > k) = 0.08. (Rpta.: k = 1.751)
(c) P
_
0.45 <
Y/20
X/30
< 2.1
_
. (Rpta.: 0.9348)
(d) El valor de c tal que P(c < X +Y < 65) = 0.8715. (Rpta.: c = 35)
23. Sea la variable aleatoria X que tiene distribucion N(0, 25). Se extrae aleatoriamente una
muestra de tama no 2 cuyos valores seran denotados por X
1
y X
2
. Calcule P(X
2
1
+X
2
2
<
11). (Rpta.: 0.1975)
24. Si W
2
(18)
y X t
(6)
. Hallar:
(a) W
0
tal que P(14.44 < W < W
0
) = 0.68. (Rpta.: 32.35)
(b) k tal que P(X < 2k) = 0.9. (Rpta.: 0.7199)
25. Suponga que la variable aleatoria X tiene una distribucion ji-cuadrado con 3 grados de
libertad, la variable aleatoria Y tiene una distribucion t de Student con 7 grados de
libertad y que la variable aleatoria Z tiene una distribucion normal estandar. Suponga
tambien que X, Y y Z son variables independientes. Calcule lo siguiente:
(a) P(Y < 1). (Rpta.: 0.8247)
(b) P
_
Z
2
X
> 2
_
. (Rpta.: 0.09172)
90 CAP