Anda di halaman 1dari 75

Notas de PROBABILIDAD y ESTADÍSTICA

Humberto Barrios
Docente UPC
Introducción
DESCRIPCIONES DE UN CONJUNTO DE
MEDICIONES
DISTRIBUCIONES DE FRECUENCIAS
MÉTODO GRÁFICO
MEDIDAS NUMÉRICAS DESCRIPTIVAS
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE DISPERSIÓN
OTRAS MEDIDAS DESCRIPTIVAS
EJERCICIOS

1. Estadı́stica Descriptiva

1.1 Introducción
Estamos en una época en la que nos agobian acontecimientos y números, las llama-
das, estadı́sticas, acerca de cualquier tema comprensible. Se escuchan o se leen inda-
gaciones de los medios de comunicaciones del número de personas desplazadas por la
violencia a las que ayuda el gobierno, el número de hectáreas sembradas de coca radica-
das diariamente por el actual gobierno y crónicas deportivas sobre el número promedios
de goles en los partidos de fútbol en una semana determinada. En este sentido para
mucha gente, el término estadı́stica significa descripción numérica. En un sentido más
amplio, se puede establecer que el objetivo de la estadı́stica es hacer inferencias con
respecto a una población a partir de la información contenida en una muestra y propor-
cionar una medida (probabilidad) correspondiente para la bondad de la inferencia. Es
decir, la estadı́stica trata del diseño de experimento o encuestas (investigación) median-
te muestras para obtener una cantidad determinada de información a un costo mı́nimo
y del uso óptimo de esta información para sacar conclusiones (inferencias inductivas)
con respecto a una población.

En estadı́stica la inferencia es inductiva porque se proyecta de lo especifico (la muestra)


hacia lo general (población). En un procedimiento de esta naturaleza siempre existe la
posibilidad de error. Nunca se tendrı́a el cien por ciento de seguridad sobre una propor-
ción en la que se basa la inferencia estadı́stica. Sin embargo, lo que hace de la estadı́stica
una ciencia (separándola del arte de adivinar la suerte) es que, unida cualquiera propo-
sición o afirmación, existe una medida de la confiabilidad de ésta. En estadı́stica se mide
la confiabilidad en términos de probabilidad (un tema que se estudiara más adelante).
En otras palabras, para cada inferencia estadı́stica se identifica la probabilidad de que
la inferencia sea correcta. Los problemas estadı́sticos se caracterizan por los siguientes
cuatro elementos:
1. La población de interés y el procedimiento cientı́fico que se emplea para seleccionar
la muestra.
2. La muestra y el análisis matemático de la información.
3. Las inferencias estadı́sticas que resulten del análisis de la muestra.
4. La probabilidad o confiabilidad de que las inferencias sean correctas.
4 Capı́tulo 1. Estadı́stica Descriptiva

Para comprender la naturaleza de la estadı́stica inferencial, es necesario precisar algunos


conceptos.

Definición 1.1.1 Una población es el conjunto de todas las mediciones de interés


para determinado problema. En estadı́stica, población es un concepto mucho más
general del que tiene el concepto común de esta palabra.

En este sentido, una población es cualquier colección ya sea de un número finito de


mediciones o una colección grande, virtualmente infinita, de datos acerca de algo de
interés.

Definición 1.1.2 Una muestra es un subconjunto de la población que contiene las


mediciones obtenidas mediante un experimento. De esta forma, una buena muestra
es aquella que refleja las caracterı́sticas esenciales de la población de la cual se obtuvo.

En estadı́stica, el objetivo de las técnicas de muestreo es asegurar que cada observación


en la población tiene una oportunidad igual e independiente de ser incluida en la mues-
tra. Tales procesos de muestreo conducen a una muestra aleatoria. Las observaciones
de la muestra aleatoria se usan para calcular ciertas caracterı́sticas de la muestra lla-
madas estadı́sticas. Las estadı́sticas se usan como base para hacer inferencias de ciertas
caracterı́sticas de la población, que reciben el nombre de parámetros.

En cada uno de los siguientes casos se describe la población correspondiente, el objetivo


inferencial y qué es lo que se harı́a para obtener una buena muestra.
 Ejemplo 1.1 La Facultad de Ciencias de la Salud de la UPC quiere hacer un estu-
dio acerca de los niveles de resistencia fı́sica de estudiantes varones que recientemente
ingresaron a la universidad. 

Población: Son todos los estudiantes varones de primer semestre de la UPC.

Objetivo inferencial: Estimar la distribución de frecuencias, por edades, la resistencia


fı́sica de estudiantes varones que recientemente ingresaron a la universidad.

Muestra: Seleccionar una muestras de estudiantes varones que ingresaron a la UPC,


en el primer semestre.
 Ejemplo 1.2 Un ingeniero desea estimar el consumo semanal promedio de agua por
familias en Valledupar. 

Población: Todas las familias que viven en Valledupar.

Objetivo inferencial: Estimar el consumo semanal promedio de agua por familias.

Muestra: Tomar un subconjunto de todas las familias de Valledupar, de tal manera


que estas familias sean “representativas”.
 Ejemplo 1.3 Un ingeniero electrónico desea determinar si la duración promedio de
cierto tipo de transistores supera las 500 horas. 

Humberto Barrios - hbarrios@unicesar.edu.co


1.2 DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES 5

Población: En este caso, la población puede estar constituida por todos los transistores
producidos por una fábrica durante una semana o también se puede considerar los que
se pueden fabricar en el futuro. En este caso, la población es virtualmente infinita.

Objetivo inferencial: Estimar si la duración promedio de cierto tipo de transistores


supera las 500 horas.

Muestra: Seleccionar una muestra aleatoria de la producción de un lote de varios dı́as.

1.2 DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES


1.2.1 DISTRIBUCIONES DE FRECUENCIAS
En el sentido más amplio, hacer inferencias implica la descripción parcial o total de
un fenómeno u objeto fı́sico. Por consiguiente, un preludio necesario a la explicación de
como hacer inferencias, es la elaboración de un método para describir un conjunto de
números. La descripción debe ser tal, que el conocimiento de las medidas descriptivas
nos permita tener una apreciación clara del conjunto de datos. Además es de esperarse
que la descripción posea un sentido pragmática, para que el conocimiento de las medidas
descriptivas de una población nos ayude a resolver un problema práctico no estadı́stico,
por ejemplo, en la toma de decisiones.
 Ejemplo 1.4 Si se seleccionaron aleatoriamente en un proceso de fabricación de una
semana, 100 baterı́as para hallar algún tipo de regularidad en el proceso de fabricación.
En el cuadro 1.1 se dan los datos que representan el tiempo de duración en dı́as de cada
uno de las baterı́as: 

Cuadro 1.1: Tiempo de duración de 100 baterı́as


178 221 157 153 107 188 220 157 184 173
221 153 177 173 182 185 111 151 178 167
164 234 151 169 174 229 192 109 118 135
205 181 155 176 146 187 168 188 222 156
200 134 174 200 191 165 187 175 169 162
206 139 176 160 226 188 155 185 187 184
199 174 165 168 124 149 203 159 164 166
226 191 195 182 160 193 140 167 218 183
122 224 187 104 173 194 181 151 198 172
218 236 176 150 158 199 144 202 208 178

Si quisiéramos buscar algún tipo de regularidad en este conjunto de datos serı́a impo-
sible encontrarla a simple vista. Una manera sencilla para organizar datos es preparar
un arreglo ordenado. Un arreglo ordenado es una lista de valores de una población o
muestra en orden de magnitud de menor a mayor valor. Un arreglo ordenado permite
determinar con rapidez los valores de las mediciones más pequeños, de los más grandes.
A continuación se muestra la construcción de un arreglo ordenado con los datos que se
muestran en el cuadro 1.1.

Fácilmente es posible identificar rápidamente la baterı́a que duro menos dı́as (104) y la
que duro más dı́as (236).

Humberto Barrios - hbarrios@unicesar.edu.co


6 Capı́tulo 1. Estadı́stica Descriptiva

Cuadro 1.2: Tiempo ordenado de las 100 baterı́as


104 107 109 111 118 122 124 134 135 139
140 144 146 149 150 151 151 151 153 153
155 155 156 157 157 158 159 160 160 162
164 164 165 165 166 167 167 168 168 169
169 172 173 173 173 174 174 174 175 176
176 176 177 178 178 178 181 181 182 182
183 184 184 185 185 187 187 187 187 188
188 188 191 191 192 193 194 195 198 199
199 200 200 202 203 205 206 208 218 218
220 221 221 222 224 226 226 229 234 236

Pero para identificar los patrones en un conjunto de datos es necesario agrupar las
observaciones en un número relativamente pequeño de clases que no se intercepten
entre sı́, de tal manera que no exista ninguna ambigüedad con respecto a la clase que
pertenece una observación en particular. El número de observaciones que caen en una
clase recibe el nombre de frecuencia de clase (fi ), mientras que el cociente de una
frecuencia de clase con respecto al número de observaciones (n) en la muestra se conoce
como frecuencia relativa (fi /n) de la clase. Los lı́mites de las clases se denominan
fronteras de clases, y el promedio aritmético entre los lı́mites superior (Li ) e inferior
(Ls ) recibe el nombre de marca de clase o punto medio de clase (xi ).

El número de clase que se emplean para clasificar a un conjunto de datos depende del
número total de observaciones. Si el número de observaciones es relativamente pequeño,
el número a emplear serı́a cinco o más. Si existe un número sustancial de datos, el
número de clases debe ser de quince clases o menos. Es decir, el número de clases que se
deben tomar no debe ser mayor a quince ni menor de cinco. Un número muy pequeño
de clases puede ocultar la distribución real del conjunto de datos, mientras que una
muy numerosa puede dejar sin observaciones a algunas clases, limitando de esta forma
su uso.

Para determinar el número aproximado de clases, también se puede hacer uso de la


Regla de Sturges:

k = 1 + 3.3 log n

donde
K es el número de clases
n es el número total de observaciones de la muestra
log es el logaritmo común base 10.

Se debe dejar en claro que la Regla de Sturges es una aproximación del número de clases,
siempre es posible tomar una más o una menos de lo que la formula nos da.

Una buena práctica es la creación de clases que tengan longitudes iguales. Esto puede
lograrse tomando la diferencia entre los valores extremos del conjunto de los datos, lo
que se conoce como rango (R), y dividiéndolo sobre el número de clases, el resultado

Humberto Barrios - hbarrios@unicesar.edu.co


1.2 DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES 7

será aproximadamente la longitud para cada clase. Sin embargo, existen casos donde
esta regla no se puede aplicar o no debe aplicarse. Como ilustración, tomemos los datos
de la tabla 1, para establecer un esquema de agrupamiento para este conjunto de datos
y determinar las frecuencias de clases, frecuencias relativas de clases, marcas de clases
y fronteras de clases. Agrupar los datos en clases de igual longitud.

El rango = valor mayor - valor menor = 236 − 104 = 132

Por ejemplo, si aplicamos la Regla de Sturges el número de clases que debemos tomar
serı́a de 8.

Por lo tanto, la Longitud de clase = 132/8 ' 17.

Para establecer las fronteras de cada clase, es necesario considerar la unidad más cercana
con respecto a la cual se mide las observaciones. Ası́, las ocho clases a considerar son:

(103, 120], (120, 137], (137, 154], (154, 171], (171, 188], (188, 205], (205, 222], (222, 239]

Por lo tanto, una manera de representar a un conjunto de datos es como se muestra


en el siguiente cuadro, distribución de frecuencias correspondiente a la duración de 100
baterı́as, seleccionadas de manera aleatoria, de la producción de una fábrica en una
semana.

Cuadro 1.3: Distribución de frecuencias


Li Ls xi fi fi % Fi Fi %
103 120 111.5 5 5% 5 5%
120 137 128.5 4 4% 9 9%
137 154 145.5 11 11 % 20 20 %
154 171 162.5 21 21 % 41 41 %
171 188 179.5 31 31 % 72 72 %
188 205 196.5 14 14 % 89 86 %
205 222 213.5 8 8% 94 94 %
222 239 230.5 6 6 % 100 100 %

Donde
Li limite inferior de la clase i-ésima.
Ls limite superior de la clase i-ésima.
xi marca de clase de la clase i-ésima.
fi frecuencia absoluta de la clase i-ésima.
fi % frecuencia porcentual de la clase i-ésima.
Fi frecuencia acumulada absoluta de la clase i-ésima.
Fi % frecuencia acumulada porcentual de la clase i-ésima.

El cuadro ?? de frecuencias proporciona mucha más información a simple vista que


los datos originales, cuadro 1.1. En un estudio de la vida de las baterı́as, hay muchas
preguntas que pueden ahora responderse. Por ejemplo, ¿Qué fracción o porcentaje de
las baterı́as puede esperarse de la población en estudio tengan una duración entre 171
a 188 dı́as?

Humberto Barrios - hbarrios@unicesar.edu.co


8 Capı́tulo 1. Estadı́stica Descriptiva

Es claro, que si la muestra es el reflejo de la población, o como dicen mis compañeros


de la UPC es “representativa”, entonces la respuesta es 0.31, es decir, el 31 %. Muchas
preguntas más se pueden responder con la tabla anterior, como por ejemplo, ¿Cuántas
baterı́as falları́an antes de 205 horas? La respuesta a esta pregunta serı́a sumar todas
las frecuencias que ocurren antes de 205, esto es, sumar las frecuencias: 5 %, 4 %, 11 %,
21 %, 31 %, y 14 % lo que suma 84 %. La suma de las frecuencias (fi ) de las obser-
vaciones cuyos valores son menores o iguales al lı́mite superior de una clase dada se
denomina frecuencia acumulada (Fi ). De la misma manera se definen la frecuencia
acumulada relativa (Fi /n).

1.2.2 MÉTODO GRÁFICO


Otra manera útil de representar los datos de una muestra es a través de gráficos.
El principal objetivo de la representación gráfica de las frecuencias de clases como las
frecuencias acumuladas es mostrar el perfil de distribución de los datos. El conocimiento
de este perfil es útil en varias formas, para los análisis apropiados para las inferencias
estadı́sticas o con el fin de comparar los perfiles de dos o más conjunto de datos.

Histograma de frecuencias. Un histograma es una representación gráfica de los da-


tos que muestra la frecuencias de los casos (valores de los datos) en categorı́as. Las
frecuencias se representan para examinar la forma de la distribución de las respuestas.
El histograma de frecuencias se construye levantando rectángulos con centros en las
marca de clases, con base de longitud igual a la longitud real del intervalo de clase
(L = LS − LI ) y altura igual a la frecuencia de la respectiva clase, en un eje de coorde-
nadas. Para la distribución de frecuencias del cuadro 1.3, el histograma de frecuencias
figura 2.1:

Figura 1.1: Histograma de frecuencias

30

25

20

15

10

103 120 137 154 171 188 205 222 239 x

Polı́gono de frecuencias. Los polı́gonos de frecuencias son otra forma de representar


gráficamente distribuciones de clases (o distribuciones relativas de clases). Para construir
un polı́gono de frecuencias señalamos en el eje horizontal las marcas de clases, en el

Humberto Barrios - hbarrios@unicesar.edu.co


1.2 DESCRIPCIONES DE UN CONJUNTO DE MEDICIONES 9

eje vertical las frecuencias correspondientes y en los extremos se añaden dos clases
con frecuencia cero, en un sistema de coordenadas, y conectamos con segmentos los
puntos sobre el plano. Para la distribución de frecuencias del cuadro 1.3, el polı́gono de
frecuencias es la figura 2.2:

Figura 1.2: Polı́gono de frecuencias

30

25

20

15

10

103 239
111.5 128.5 145.5 162.5 179.5 196.5 213.5 220.5 x

Los histogramas y los polı́gonos de frecuencias son parecidos. Como se puede observar
en los gráficos anteriores. Pero se pueden señalar las ventajas de los histogramas, las
que se pueden resumir ası́: los rectángulos muestran cada clase de la distribución por
separado y el área de cada rectángulo, en relación con el resto, muestra la proporción
del número total de observaciones que se encuentra en cada clase.

Los polı́gonos, sin embargo, también poseen ciertas ventajas, de las cuales se pueden
resaltar: el polı́gono de frecuencias es más sencillo que el histograma, traza con más
claridad el perfil de patrón de los datos y por último, el polı́gono se vuelve más liso y
parecido a una curva conforme aumenta el número de clases y el número de observacio-
nes. Un polı́gono como el que acabamos de describir, alisado mediante el aumento de
clases y de puntos de datos, se conoce como curva de frecuencias.

Diagrama de tallo y hojas. Una variante del histograma es el diagrama de tallo y hoja
que tiene la misma similitud y propósito pero que también proporciona una enumeración
completa de los valores de los datos reales. Para construirlo basta separar en cada dato
el último dı́gito de la derecha (que constituye la hoja) del bloque de cifras restantes (que
formará el tallo). El siguiente ejemplo ilustra la construcción del diagrama de tallo y
hojas.

 Ejemplo 1.5 Utilice los datos de los tiempo de duración del cuadro 1.1 para construir
diagrama de tallo y hojas. 

Solución Puesto que todas las mediciones son números de tres dı́gitos, se tiene tallos

Humberto Barrios - hbarrios@unicesar.edu.co


10 Capı́tulo 1. Estadı́stica Descriptiva

de dos dı́gitos y hojas de un solo dı́gito. Por ejemplo, la medición 175 tiene un tallo 17
y una hoja de 5. La siguiente tabla 1.4 muestra el diagrama de tallo y hojas para los
datos.

Cuadro 1.4: Diagrama de tallo y hojas para el


tiempo duración de 100 baterı́as
10 47918
12 24459
14 04690111335567789
16 00244556778899233344456667888
18 1122344557777888112345899
20 002356888
22 0112466946

Ojiva. Para graficar la distribución de frecuencias acumulada (o relativa acumulada),


sobre un eje de coordenadas, se ubican los limites reales de las clases sobre el eje hori-
zontal contra las frecuencias acumuladas (o relativas acumuladas) en el eje vertical y se
unen todos los puntos consecutivos. Para la distribución de frecuencias acumulada del
cuadro ?? , la ojiva de las frecuencias acumuladas (o relativas acumuladas) es la figura
2.3:

Figura 1.3: Distribución frecuencias acumulada

100

80

60

40

20

En este contexto el principal uso de la distribución acumulada (o acumulada relativa)


es lo que comúnmente se denomina como cuantiles. Con respecto a una distribución
relativa acumulada, se define un cuantil como el valor bajo el cual se encuentra una
determinada proporción de los valores de la distribución. En la próxima sección se dará
una fórmula para calcular los cantiles correspondiente a una distribución de frecuencia
acumulada.

Humberto Barrios - hbarrios@unicesar.edu.co


1.3 MEDIDAS NUMÉRICAS DESCRIPTIVAS 11

1.3 MEDIDAS NUMÉRICAS DESCRIPTIVAS


Las descripciones gráficas de los datos presentadas en la sección anterior propor-
cionan una información útil respecto al conjunto de mediciones, pero no es adecuado
para hacer inferencias, sobre todo porque ninguna de las representaciones (tablas y
gráficas) no están bien definidas. Por ejemplo, se podrı́an elaborar muchos histogramas
similares a partir del mismo conjunto de mediciones. Para poder hacer inferencias con
respecto a una población, basada en la información contenida en una muestra y medir
la confiabilidad de la inferencia, en términos de probabilidades, se requieren cantida-
des obtenidas de expresiones rigurosamente definidas para analizar la información de
la muestra. Es posible obtener, mediante las matemáticas, ciertas propiedades de esas
cantidades muestrales y establecer conclusiones probabilı́sticas con respecto a la validez
de las inferencias.

Las cantidades que se pretenden definir son medidas numéricas descriptivas de un con-
junto de datos. Se buscan números que describan la distribución de frecuencias para
cualquier conjunto de mediciones.

Existen dos medidas de interés para cualquier conjunto de datos: la localización de su


centro y su variabilidad.

1.3.1 MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central de un conjunto de datos es la disposición de éstos
para agruparse ya sea alrededor del centro o de ciertos valores numéricos. Existen prin-
cipalmente tres medidas de tendencia central: la media, la mediana y la moda.

Definición 1.3.1 Sean x1 , x2 , x3 , . . ., xk marcas de clases con frecuencias de clases f1 ,


f2 , f3 , . . . fk , respectivamente, en una distribución de frecuencias. Entonces la media
es
k
1X
x̄ = xi fi (1.1)
n
i=1

Donde n = f1 + f2 + f3 + . . . + fk . En el caso, f1 = f2 = f3 = . . . = fk = 1
entonces los datos se dicen no agrupados. Ası́, la fórmula para la media se convierte
en
n
1X
x̄ = xi (1.2)
n
i=1

La media es una medida apropiada de tendencia central para muchos conjuntos de datos.
Sin embargo, dado que todas las mediciones se emplean para su cálculo, el valor de la
media puede afectarse por la existencia de algunos valores extremos.

Definición 1.3.2 La mediana en un conjunto de datos no agrupados, ordenados de


menor a mayor, es el valor medio si el número de datos es impar o el promedio de los
dos valores centrales cuando el número de datos es par. Se notara la mediana por x̃.

Humberto Barrios - hbarrios@unicesar.edu.co


12 Capı́tulo 1. Estadı́stica Descriptiva

Para el caso de datos agrupados o para una distribución de frecuencias, se procede


como sigue:
1. Se identifica la clase mediana, la cual será la que contiene el elemento para el
cual la mitad de todas las observaciones es menor y la otra mitad es mayor.
2. Lm = limite real inferior de la clase mediana
3. fm = frecuencia de la clase mediana
4. Fm−1 = frecuencia acumulada anterior a la clase mediana
5. c = ancho real de la clase mediana
6. n = número de observaciones en la muestra o tamaño de muestra.
Por consiguiente, la ecuación para la mediana con datos agrupados serı́a:
n
2 − Fm−1
x̃ = Lm + c (1.3)
fm

Puesto que la mediana es un valor que se basa en la secuencia ordenada de las n


mediciones, es necesario saber que la existencia de valores extremos y agregado muy
alto de observaciones, no afecta su valor, en este sentido la mediana es mejor que la
media. Generalmente los conjuntos de datos que describen información de ingresos caen
en esta categorı́a.

Definición 1.3.3 La moda para un conjunto de datos no agrupados es el valor de las


observaciones que ocurre con mayor frecuencia. La cual notaremos por: Mo .

Cuando los datos se encuentran agrupados en una distribución de frecuencias, se


puede suponer que la moda está localizada en la clase de mayor frecuencia. Para
determinar un solo valor para la moda a partir de esta clase modal, identifica:
1. LMo = limite real inferior de la clase modal
2. ∆1 = frecuencia de la clase modal menos la frecuencia que se encuentra inme-
diatamente por encima de ella
3. ∆2 = frecuencia de la clase modal menos la frecuencia que se encuentra inme-
diatamente por debajo de ella
4. c = ancho real de la clase modal

Entonces se utiliza la siguiente ecuación:


 
∆1
Mo = LMo + c (1.4)
∆1 + ∆ 2

En muchas ocasiones en una serie de datos, puede ocurrir más de una observación con la
misma frecuencia. En este caso, se dice que la distribución de frecuencias es multimodal.
Como en todos los aspectos de la vida, el azar puede desempeñar un papel importante
en la organización en un conjunto de mediciones. En ocasiones, el azar hace que un
solo elemento no representativo se repita lo suficiente para ser el valor más frecuente
del conjunto de mediciones. Es por esta razón que rara vez se utilice la moda de un
conjunto de datos no agrupados como medida de tendencia central.

Se explicarán el cálculo de la media, mediana y moda con los ejemplos siguientes:


 Ejemplo 1.6 (Para datos no agrupados). El tiempo de reparación, medido en horas,
de un instrumento electrónico tiene un comportamiento aleatorio. Los tiempos de repa-

Humberto Barrios - hbarrios@unicesar.edu.co


1.3 MEDIDAS NUMÉRICAS DESCRIPTIVAS 13

ración de 16 de tales instrumentos, elegidos a través de un mecanismo aleatorio, son los


siguientes:

5 6 3 6 11 7 9 10 2 4 10 6 2 8 1 5

Calcular la media, mediana y moda de este conjunto de datos. 

Para calcular la media se utiliza la fórmula (1.2), es decir,

n
1X 1
x̄ = xi = (5 + 6 + 3 + 6 + 11 + 7 + 9 + 10 + 2 + 4 + 10 + 6 + 2 + 8 + 1 + 5) = 5.94
n 16
i=1

Para el caso de la mediana se ordenan los datos de menor a mayor, como en este caso
el número de elementos es par, la mediana será el promedio de los dos valores centrales.

1 2 2 3 4 5 5 6 6 6 7 8 9 10 10 11

Es decir,

6+6
x̃ = =6
2

La moda en una serie de datos es el valor con mayor frecuencia, en este caso el valor
con mayor frecuencia es el 6. Entonces

Mo = 6

 Ejemplo 1.7 (Para datos agrupados). Con la distribución de frecuencias del cuadro

1.3. Calcular la media, mediana y moda. 

Solución

De la distribución de frecuencias correspondiente a la duración de 100 baterı́as, para


calcular la media multiplicamos las marcas de clases por las respectivas frecuencias de
clase y dividimos por las suma de las frecuencias. Es decir,

L
1X
x̄ = xi fi
n
i=1
1
= [111.5(5) + 128.5(4) + 145.5(11) + 162.5(21)
100
+ 179.5(31) + 196.5(14) + 213.5(8) + 230.5(6)] = 174.9

Humberto Barrios - hbarrios@unicesar.edu.co


14 Capı́tulo 1. Estadı́stica Descriptiva

Otra manera para calcular la media es utilizando el cuadro 1.3, construyendo otra
columna resultado de multiplicar las marcas de clases por sus respectivas frecuencias, y
dividir la suma de esta por la suma de las frecuencias.

Para calcular la mediana de la distribución de frecuencias del cuadro 1.3.


1. Se identifica la clase mediana, la cual será la que contiene el elemento para el cual
la mitad de todas las observaciones es menor y la otra mitad es mayor. Por lo
tanto la clase mediana es: 171-188.
2. Lm = limite real inferior de la clase mediana = 171
3. fm = frecuencia de la clase mediana = 31
4. Fm−1 = frecuencia acumulada anterior a la clase mediana=21
5. c = ancho real de la clase mediana =14
6. n = número de observaciones en la muestra o tamaño de muestra = 100.

Por consiguiente, la ecuación para la mediana con datos agrupados serı́a:


n
− Fm−1
  
2 50 − 41
x̃ = Lm + c = 171 + (17) = 175.9
fm 31
Para determinar el valor para la moda, identificamos la clase modal es: 171-188.
1. LMo = lı́mite real inferior de la clase modal= 171
2. ∆1 = frecuencia de la clase modal menos la frecuencia que se encuentra inmedia-
tamente por encima de ella = 31-21 = 10
3. ∆2 = frecuencia de la clase modal menos la frecuencia que se encuentra inmedia-
tamente por debajo de ella = 31 -14=17
4. c = ancho real de la clase modal = 17

Entonces se utiliza la siguiente ecuación:


   
∆1 10
Mo = LMo + c = 171 + (17) = 177.3
∆1 + ∆ 2 10 + 17
Cuando se trabaja un problema en estadı́stica, se debe decidir cual de las medidas de
tendencia central se va ha utilizar. Por ejemplo, si la distribución es simétrica, es claro
que en este caso solo tienen una moda. Por lo tanto el mismo valor para la media,
la mediana y la moda. En tales casos, no es necesario escoger la medida de tendencia
central, pues ya esta hecha la selección, cualquiera de ellas es una buena opción.

En una distribución sesgada positiva. Es decir, sesgada hacia la derecha, la moda se


encuentra en el punto más alto de la distribución, la mediana está a la derecha de la
moda y la media se encuentra todavı́a más a la derecha de la moda y la mediana. Es
decir, se tiene la siguiente relación:

Mo < x̃ < x̄
En una distribución sesgada negativa. Es decir, sesgada hacia la izquierda, la moda se
encuentra en el punto más alto de la distribución, la mediana está hacia la izquierda de
la moda y la media se encuentra todavı́a más a la izquierda de la moda y la mediana.
Es decir, se tiene la siguiente relación:

Mo > x̃ > x̄

Humberto Barrios - hbarrios@unicesar.edu.co


1.3 MEDIDAS NUMÉRICAS DESCRIPTIVAS 15

Cuando la población está sesgada negativamente o positivamente, con frecuencia la


mediana resulta ser la mejor medida de posición, debido a que siempre está entre la
moda y la media. La mediana no se ve influida por la frecuencia de aparición de un solo
valor como es el caso de la moda, ni se distorsión con la presencia de valores extremos
como la media.

En cualquier otro caso, no existen reglas universales para la aplicación de la media, la


mediana o la moda como medidas de tendencia central para diferentes poblaciones. Cada
caso deberá considerarse de manera independiente, de acuerdo con las lı́neas generales
que se ha analizado.

1.3.2 MEDIDAS DE DISPERSIÓN


Las medidas de tendencia central de un conjunto de mediciones solamente localizan
el centro de la distribución de los datos. Por si mismo, no ofrecen una descripción
adecuada de los datos. Por ejemplo, dos conjuntos de mediciones podrı́an tener sus
distribuciones de frecuencias muy diferentes pero con la misma media. La diferencias
entre dos distribuciones, puede estar en variación o dispersión a ambos lados de la
media. Una descripción adecuada de los datos requiere de la definición de una medida de
variabilidad de los datos. La medida más común de variabilidad usada en la estadı́stica
es la varianza, que es una función de las desviaciones (o distancia) de las mediciones
con respecto a su media.

Definición 1.3.4 Sean x1 , x2 , x3 , . . ., xk marcas de clases con frecuencias de clases


f1 , f2 , f3 , . . . fk , respectivamente, en una distribución de frecuencias. Entonces la
varianza es
k
1 X
s2 = (xi − x̄)2 fi (1.5)
n−1
i=1

Donde n = f1 + f2 + f3 + . . . + fk . En el caso, f1 = f2 = f3 = . . . = fk = 1 entonces


los datos se dicen no agrupados. Ası́, la fórmula para la varianza se convierte en
n
2 1 X
s = (xi − x̄)2 (1.6)
n−1
i=1

La varianza es útil en la comparación de la variación relativa de dos conjuntos de


mediciones, pero sólo aporta información con respecto a la variación en un solo conjunto
cuando se interpreta en términos de la desviación estándar. La desviación estándar de
un conjunto de medidas es la raı́z cuadrada positiva de la varianza, es decir,

s= s2 (1.7)

La varianza y la desviación estándar no son medidas de variabilidad distintas, debido


a que la última no puede determinarse a menos que se conozca la primera. A menudo
se prefiere la desviación estándar en relación con la varianza, porque se expresa en las
mismas unidades fı́sicas de las observaciones.

Humberto Barrios - hbarrios@unicesar.edu.co


16 Capı́tulo 1. Estadı́stica Descriptiva

Otra medida útil de la variabilidad tiene base en el valor absoluto de las diferencias
entres el conjunto de mediciones y la media o la mediana, dependiendo de cual de las
dos se emplee como medida de tendencia central.

Definición 1.3.5 Sean x1 , x2 , x3 , . . ., xk marcas de clases con frecuencias de clases


f1 , f2 , f3 , . . . fk , respectivamente, en una distribución de frecuencias. Entonces la
desviación media está dada por
k
1X
DM = |xi − x̄|fi (1.8)
n
i=1

Donde n = f1 + f2 + f3 + . . . + fk . En el caso, f1 = f2 = f3 = . . . = fk = 1 entonces


los datos se dicen no agrupados. Ası́, la fórmula para la desviación media está se
convierte en
n
1X
DM = |xi − x̄| (1.9)
n
i=1

Cuando se sustituye la media por la mediana en (1.8) y (1.9) se obtiene la desviación


mediana, la que se notara por DM d.

La desviación media es una medida de la variación de un conjunto de mediciones, espe-


cialmente en el contexto de la evidencia empı́rica, debido a que en muchas ocasiones el
interés se centra en las desviaciones y no en los signos de éstas. Sin embargo, desde un
punto de vista teórico, el empleo de desviación media como medida de dispersión está
en desventaja dado que, matemáticamente, es difı́cil de obtener. De cualquiera mane-
ra, la desviación media es menos sensible a los efectos inducidos por las observaciones
extremas del conjunto de datos que la varianza o la desviación estándar. Sin importar
la presencia de pocos valores extremos, la desviación media puede proporcionar una
medida de dispersión mucho más real que la obtenida por la desviación estándar.

Cuando la mediana se utiliza como medida de tendencia central con el propósito de


amortiguar los efectos de la existencia de algunos valores extremos en el conjunto de
mediciones, debe preferirse a la desviación mediana como una medida de dispersión por
la misma razón, es decir, con la intención amortiguar los efectos de la existencia de
valores extremos en el conjunto de mediciones.

A continuación se ilustran los pasos que se deben seguir para los cálculos de la varianza,
desviación estándar, desviación media y desviación mediana, para los datos no agrupados
del ejemplo 1 y para los datos agrupados de la tabla 2.
 Ejemplo 1.8 El tiempo de reparación, medio en horas, de un instrumento electrónico
tiene un comportamiento aleatorio. Los tiempos de reparación de 16 de tales instrumen-
tos, elegidos a través de un mecanismo aleatorio, son los siguientes:

5 6 3 6 11 7 9 10 2 4 10 6 2 8 1 5

Calcular la varianza, desviación estándar, desviación media y desviación mediana de


este conjunto de datos. 

Humberto Barrios - hbarrios@unicesar.edu.co


1.3 MEDIDAS NUMÉRICAS DESCRIPTIVAS 17

Solución

Para la varianza se tiene

n
1 X
s2 = (xi − x̄)2
n−1
i=1
1
= [(5 − 5.94)2 + (6 − 5.94)2
16 − 1
+ (3 − 5.94)2 + (6 − 5.94)2 + (2 − 5.94)2
+ (4 − 5.94)2 + (11 − 5.94)2 + (7 − 5.94)2
+ (9 − 5.94)2 + (10 − 5.94)2 + (10 − 5.94)2
+ (6 − 5.94)2 + (2 − 5.94)2 + (8 − 5.94)2
+ (1 − 5.94)2 + (5 − 5.94)2 ]
= 9.53

La desviación estándar es

s= 9.5333 = 3.0876

Para la desviación media se tiene

n
1X
DM = |xi − x̄|
n
i=1
1
= [|5 − 5.94| + |6 − 5.94| + |3 − 5.94| + |6 − 5.94|
16
+ |2 − 5.94| + |4 − 5.94| + |11 − 5.94| + |7 − 5.94|
+ |9 − 5.94| + |10 − 5.94| + |10 − 5.94| + |6 − 5.94|
+ |2 − 5.94| + |8 − 5.94| + |1 − 5.94| + |5 − 5.94|
= 2.445

Para la desviación mediana se tiene

n
1X
DM d = |xi − x̃|
n
i=1
1
= [|5 − 6| + |6 − 6| + |3 − 6| + |6 − 6|
16
+ |2 − 6| + |4 − 6| + |11 − 6| + |7 − 6| + |9 − 6|
+ |10 − 5.94| + |10 − 6| + |6 − 6| + |2 − 6|
+ |8 − 6| + |1 − 6| + |5 − 6|
= 2.4375

 Ejemplo 1.9 Con la distribución de frecuencias de la tabla 2. Calcular la varianza,


desviación estándar, desviación media y desviación mediana. 

Humberto Barrios - hbarrios@unicesar.edu.co


18 Capı́tulo 1. Estadı́stica Descriptiva

Cuadro 1.5: Medidas descritivas en una distribución


xi fi xi fi (xi − x̄)2 fi |xi − x̄|fi |xi − x̃|fi
111.5 5 557.5 20104.1 317.0 322.0
128.5 4 514.0 8615.6 185.6 189.6
145.5 11 1600.5 9514.4 323.5 334.4
162.5 21 3412.5 3234.2 260.6 281.4
179.5 31 5564.5 653.1 142.3 111.6
196.5 14 2751.0 6525.8 302.3 288.4
213.5 8 1708.0 11913.5 308.7 300.8
230.5 6 1383.0 18541.5 333.5 327.6
Total 100 17491.0 79102.0 2174.0 2156.0

Solución

Utilicemos el cuadro 1.5, para la varianza, desviación estándar, desviación media y


desviación mediana. Por lo tanto la

varianza es: s2 = 799.0

Desviación estándar es: s = 28.26

Desviación media es: D.M. = 21.74

Desviación mediana es: D.M d. = 21.56.

1.3.3 OTRAS MEDIDAS DESCRIPTIVAS


El principal uso de la distribución acumulada es lo que comúnmente se conoce como
cuantiles. Con respecto a una distribución de frecuencias relativa acumulada, se define
un cuantil como el valor bajo el cual se encuentra una determinada proporción de los
valores de la distribución. Para identifica la clase cuantil, la cual será la que contiene
el elemento para el cual la proporción 100q % de todas las observaciones es menor y la
otra proporción 100(1 − q) % es mayor en una distribución de frecuencias.

Definición 1.3.6 Para calcular el cuantil q se utiliza la siguiente fórmula

nq − Fq−1
x̃q = Lq + c (1.10)
fq
1. Se identifica la clase cuantil, la cual será la que contiene el elemento para el
cual la q % de todas las observaciones es menor y la otra (100 − q) % es mayor.
2. Lq = limite real inferior de la clase cuantil
3. fq = frecuencia de la clase cuantil
4. Fq−1 = frecuencia acumulada anterior a la clase cuantil
5. c = ancho real de la clase cuantil
6. n = número de observaciones en la muestra o tamaño de muestra.

Definición 1.3.7 Una medida que compara la dispersión relativa de dos distribuciones
de frecuencias es el coeficiente de variación, que está definido por:

Humberto Barrios - hbarrios@unicesar.edu.co


1.3 MEDIDAS NUMÉRICAS DESCRIPTIVAS 19

s
cv = 100 % (1.11)

Los cantiles comúnmente más utilizados son los percentiles, deciles y cuartiles. Los
percentiles son los puntos que dividen a la distribución de frecuencias en 100 pares
iguales, cada uno con una frecuencia relativa q = 0.01; los deciles y cuartiles son los
puntos que dividen a la distribución de frecuencias en 10 y 4 partes iguales, cada uno
con frecuencia relativa q = 0.1 y q = 0.01, respectivamente. Nótese que la mediana es
el cincuentavo percentil, el quinto decil y el segundo cuartil.

Definición 1.3.8 La diferencia entre los percentiles 90 avo y 10 avo recibe el nombre
de recorrido interdecil.

Definición 1.3.9 La diferencia entre los percentiles 75avo y 25avo recibe el nombre de
recorrido intercuartil.

En este contexto el recorrido interdecil es una medida de la dispersión del 80 % de la


distribución de frecuencia, en tanto que el recorrido intercuartil refleja la variación del
50 % de la distribución de frecuencia. En ambos casos, al excluir los efectos de los valores
extremos de la distribución de frecuencia, se tiene la capacidad de medir la variabilidad
del conjunto de mediciones de la mitad de una distribución de frecuencia.

Los recorridos interdecil e intercuartil, son dos medidas de dispersión que se emplean en
disciplinas como educación, economı́a, finazas e ingenierı́a. El recorrido interdecil se em-
plea muchas veces en pruebas educacionales para medir la variabilidad en el desempeño
sin importar los valores por arriba o por debajo de un 10 % de un valor predeterminado.
El recorrido intercuartil se emplea en muchas ocasiones, en economı́a y finanzas, para
medir la variabilidad de un conjunto de mediciones de una proporción de su distribución
de frecuencia.

El coeficiente de variación expresa la magnitud de la dispersión de un conjunto de


mediciones con respecto a la media, es una medida estandarizada de la variación con
respecto a la media, especialmente útil para comparar dos distribuciones de frecuencias
cuando la escala de medición difiere de manera apreciable entre estas. Es decir, como el
coeficiente de variaciones la razón de dos promedios, es independiente de las unidades
de medidas usadas, por ejemplo, da igual que se usen libras o gramos para medir el
peso.

 Ejemplo 1.10 . Para la distribución de frecuencia de la Tabla 2. Calcular los recorrido

interdecil, recorrido intercuartil y el coeficiente de variación. 

Solución Las clases percentiles 10ava y 90ava son respectivamente (137, 154] y (205, 222],
entonces para calcular a x0.1 se tiene:
1. Se identifica la clase cuantil, la cual será la que contiene el elemento para el cual
la q % de todas las observaciones es menor y la otra (100 − q) % es mayor.
2. Lq = limite real inferior de la clase 10ava = 137
3. fq = frecuencia de la clase 10ava = 11
4. Fq−1 = frecuencia acumulada anterior a la clase cuantil =9
5. c = ancho real de la clase cuantil =17

Humberto Barrios - hbarrios@unicesar.edu.co


20 Capı́tulo 1. Estadı́stica Descriptiva

6. n = número de observaciones en la muestra o tamaño de muestra =100.

Se utiliza la siguiente fórmula:

nq − Fq−1 0.1(100) − 9
x̃q = Lq + c = 137 + (17) = 138.5
fq 11
De la misma manera se calcula x0.9 ,

nq − Fq−1 0.9(100) − 86
x̃q = Lq + c = 205 + (17) = 213.5
fq 8
Ası́, el recorrido interdecil es = 213.5-138.5 = 75.

De igual forma se realizan los cálculos para el recorrido intercuartil.

El coeficiente de variación es:


s 28.26
cv = 100 = (100) = 16 %
x̄ 174.91
Obsérvese 1.5 que los valores de las medidas de tendencias central se encuentran muy
cerca entre si, también se puede afirmar lo mismo de las desviaciones estándar, media
y mediana. Sin embargo, no es de esperar que todas las distribuciones de frecuencia
tengan este comportamiento.

Estas comparaciones aclaran lo que las medidas numéricas y las distribuciones de fre-
cuencia pueden hacer para descubrir la naturaleza inherente de un conjunto de medi-
ciones. En consecuencias, el usuario debe tener cuidado tanto en la elección como en la
interpretación de estas medidas. A pesar que la media y la desviación estándar se han
empleado de manera extensa como medidas de tendencia central y dispersión respec-
tivamente, aunque tiene propiedades matemáticas muy interesantes existen problemas
para los cuales no puede ser las medidas más deseables. Para conjuntos de mediciones
fı́sicas como lecturas de instrumentos, especificaciones de partes, pesos, etc., la media
y la desviación estándar o desviación media, son medidas anheladas. Para conjunto de
mediciones afines con ingresos y otras informaciones de tipo económico y financieros,
la mejor elección para la medida de tendencia central y dispersión son la media y la
desviación de la mediana respectivamente.

En muchas investigaciones de tipo económico y social proporcionan información en


tablas de frecuencia que no solo contienen clases de diferentes amplitudes sino también
clases abiertas como mayores que o menor que con el propósito de tener mayor cobertura
de los datos. Estas clases se presentan en los extremos de la distribución de frecuencia
y no se especifica los lı́mites de las clases. Como resultado, no se encuentra definido
el punto medio de la clase abierta y en consecuencias no se puede calcular la media,
varianza, desviación estándar y desviación media, a menos que se conozca un valor
particular de la clase o que sea conocido su promedio aritmético.

1.4 EJERCICIOS
1. Los siguientes datos son los tiempos, en minutos, correspondiente a una muestra
aleatoria de 50 personas que estuvieron cobrando un cheque, un fin de mes en un
banco de la cuidad

Humberto Barrios - hbarrios@unicesar.edu.co


1.4 EJERCICIOS 21

17 16 39 30 23 38 32 20 43 32
44 41 23 17 29 26 21 34 44 24
21 27 36 21 17 28 29 34 24 28
25 29 45 23 16 34 20 30 23 35
35 27 19 31 45 40 14 29 23 19
a) Construir una distribución de frecuencias, de clases, relativa, acumulada y
relativa acumulada.
b) Construir histograma, polı́gono y ojiva con los resultados obtenidos en a.
c) Con los datos agrupados calcula: la media, mediana, moda, desviación estándar,
desviación media, desviación mediana, y los recorridos intercuartil e interde-
cil.
2. Con los siguiente tres conjuntos de datos:

1 2 3 4 5 6
1 1 1 6 6 6
−13 2 3 4 5 20

Calcular la media y la varianza para cada conjunto de datos. ¿Qué se puede


concluir?
3. Con los datos del ejercicio 1, sea xi el tiempo que gasta el i-ésimo cliente en cobrar
un cheque para i = 1, 2, . . . , 50. Transformar los datos por medio de la relación

zi = (xi − 28.2)/8.928
Con los datos transformados
a) Construir una distribución de frecuencias, de clases, relativa, acumulada y
relativa acumulada.
b) Construir histograma, polı́gono y ojiva con los resultados obtenidos en a.
c) Con los datos agrupados calcula: la media, mediana, moda, desviación estándar,
desviación media, desviación mediana, y los recorridos intercuartil e interde-
cil.
d ) ¿Ha ocurrido algún cambio en la naturaleza de la distribución de frecuencia
cuando ésta se compara con los del ejercicio 1?
4. Los datos que tienen una distribución acampanada tienen caracterı́sticas bien defi-
nidas con respecto a la variación, que se puede expresar en el siguiente enunciado:
Regla empı́rica. Para una distribución de mediciones que es aproximadamente
acampanada (forma normal), el intervalo
(µ − σ, µ + σ) Contiene aproximadamente el 68 % de las mediciones
(µ − 2σ, µ + 2σ) Contiene aproximadamente el 95 % de las mediciones
(µ − 3σ, µ + 3σ) Contiene casi todas las mediciones

Donde µ y σ son la media poblacional y desviación estándar poblacional respec-


tivamente.

Calcular el intervalo (x̄ − kσ, x̄ + kσ) para k =1, 2, y 3, del ejercicio 1, cuenta
el número de mediciones que se ubican dentro de cada intervalo y compara estos
resultados con el número que podrı́a esperarse de acuerdo a la regla empı́rica.

Humberto Barrios - hbarrios@unicesar.edu.co


22 Capı́tulo 1. Estadı́stica Descriptiva

5. Los siguientes datos agrupados representan las ventas ($1000) de 50 tiendas, se-
leccionadas aleatoriamente del municipio de Valledupar, de un dı́a cualquiera de
la semana.

Clases Frecuencias
110-186 4
187-263 14
264-340 11
341-417 9
418-494 7
495-571 1
572-648 2
649-727 2
a) Construir una distribución de frecuencia acumulada y relativa acumulada.
b) Construir histograma, polı́gono y ojiva con los resultados obtenidos en a.
c) Calcular la media, mediana, moda, desviación estándar, desviación media,
desviación mediana, y los recorridos intercuartil e interdecil.
La regla empı́rica señala que se puede aproximar la desviación estándar de un
conjunto de mediciones por una cuarta parte del rango. Calcule esta aproximación
para la desviación estándar en los conjunto de datos de la tabla 1 y del ejercicio
1.
6. Las siguiente tres propiedades son importante cuando se emplea el sı́mbolo de la
sumatoria.
n
P
a) c = nc
i=1
n
P n
P
b) cxi = c xi
i=1 i=1
Pn n
P n
P
c) (xi + yi ) = xi + yi
i=1 i=1 i=1

1. Demostrar las siguientes identidades algebraicas:


Pn
a) (xi − x̄) = 0
i=1  k 
2 1 P 2 2
b) s = n−1 xi fi − nx̄
i=1

2. Demuestre que la función


n
X
h(y) = (xi − y)2
i=1

Tiene un mı́nimo en x̄ . Utilice sus conocimientos de Calculo Diferencial.


7. Sea k ≥ 1. Demuestre que para cualquier conjunto de n mediciones, la fracción
que queda incluida en el intervalo (x̄ − ks, x̄ + ks) es por lo menos (1 − k12 ). Este
resultado se conoce con el nombre de teorema de Tchbysheff.
8. Supongamos que tenemos las siguientes medias: x̄1 = 37, x̄2 = 41 y x̄3 = 28,
basadas en 50, 20 y 10 observaciones respectivamente. Si hay que escoger una
sola media, ¿Cuál serı́a su elección? ¿Por qué? ¿Cuáles son los totales de las
muestras originales? ¿Cómo se usarı́a estos totales para hallar la media de las 80
observaciones?

Humberto Barrios - hbarrios@unicesar.edu.co


1.4 EJERCICIOS 23

9. Sea x1 , x2 , . . . , xn una muestra aleatoria de una población. Demuestre que

(n − 1)s
máx |xi − x̄| < √
1≤i≤n n

a menos que todas las n observaciones sean iguales o exactamente n − 1 de las xi


son iguales.
10. Sean x1 , x2 , . . . , xk marcas de clases diferentes con frecuencias f1 , f2 , . . . , fk res-
pectivamente. Si yi = axi + c, son las marcas de clases de una nueva variable
aleatoria yi . Demuestre que:
a) ȳ = ax̄ + c
b) s2y = a2 s2 .
11. Los siguientes datos corresponden a una muestra aleatoria simple de tamaño
n = 100 seleccionadas de los N = 365 dı́as de las ventas (en millones) de un
supermercado de la ciudad, los datos se muestra en la tabla siguiente:

Cuadro 1.6: Datos


78 113 94 101 87 88 75 87 110 92
100 116 102 105 89 104 111 93 114 95
107 117 109 117 100 104 127 112 120 117
108 121 126 127 124 106 127 120 121 118
108 124 128 135 131 114 128 122 129 119
126 131 129 138 139 121 129 128 129 126
129 136 130 140 140 124 130 141 130 135
137 143 132 141 143 133 137 143 138 140
139 144 146 153 146 135 142 151 142 147
142 146 149 175 155 135 167 151 147 152

a) Encuentre las clases para el conjunto de datos anteriores, si se sabe que la


primera clase tiene como limite inferior 75 y la longitud de cada clase es
c = 10.
b) Hallar las frecuencias absolutas y acumuladas para cada clase.
c) Qué interpretación se le da a las frecuencias absolutas y acumuladas en cada
clase.
d ) Hallar los limites reales para cada clase y sus marcas de clases e interprete.
e) Qué porcentajes de dı́as al año tienen ventas superiores a $140.000.000 (ciento
cuarenta millones de pesos).
f ) Qué porcentajes dı́as tiene ventas superiores o iguales a $173.000.000 y su-
periores o iguales $108.000.000.
g) Construir el histograma de frecuencias, polı́gono de frecuencias y ojiva e
indicar cuál debe ser el perfil de la población.
h) Calcular la media, mediana y moda e interprete su significados en términos
poblacionales.
i ) Calcular el rango, varianza, desviación estándar, desviación media y desvia-
ción mediana e interprete su significados.
j ) Calcular todos los deciles y cuartiles de la distribución de frecuencias.
k ) Calcular el recorrido interdecil y el recorrido intercuartil e interprete.

Humberto Barrios - hbarrios@unicesar.edu.co


INTRODUCCIÓN
PROPIEDADES BÁSICAS
DIFERENTES MANERAS DE ASIGNAR
PROBABILIDADES
PROBABILIDAD CONDICIONAL
EVENTOS INDEPENDIENTES
EJERCICIOS

2. PROBABILIDAD

2.1 INTRODUCCIÓN
La teorı́a de probabilidad comenzó en siglo XVII con dos grandes matemáticos
franceses, Blaise Pascal (1961-1668) y Pierre de Fermat (1623-1662), aunque algunos
matemáticos anteriores, como Gerolamo Cardano (1501-1576) en el siglo XVI, habı́an
hecho importantes contribuciones a su desarrollo. La probabilidad, como una rama de
la matemática, comenzó como un intento de responder a varias preguntas que surgı́an
en los juegos de azar, convirtiéndose en una herramienta poderosa en las más variadas
ramas del conocimiento. Es ası́, que encuentra aplicaciones en cada una de las área de
la actividad humana desde la música a la fı́sica, y en experiencia diarias como es la de
pronosticar el tiempo a la predicción de los riesgos de nuevos tratamientos médicos.

El objetivo principal de este capı́tulo es proporcionar al estudiante una formación


sólida y sistemática en los principios, métodos, resultados y aplicaciones de la teorı́a de
la probabilidad, ası́ como la habilidad de razonar bajo estos modelos. El primer paso de
está capı́tulo es describir la estructura genérica del concepto de probabilidad a través
de un conjunto de axiomas, y sus propiedades básicas. Para esto, se empezara con una
revisión corta de la teorı́a de conjuntos.

2.2 PROPIEDADES BÁSICAS


La teorı́a de la probabilidad fue establecida sobre una base axiomática idónea por
el matemático ruso Andréi Nikoláyevich Kolmogórov (1903-1987) en la década de los
años treinta. Por supuesto, los axiomas y teoremas de Kolmogórov son más rigurosos
que la versión simplificada que presentaremos a continuación, para ilustrar el enfoque
axiomático comenzaremos con la siguiente definición.
Definición 2.2.1 Un experimento aleatorio es el proceso por medio del cual se obtiene
una observación.
Por ejemplo, el lanzamiento de un dado, el número de carros que llegan a la universidad
en una hora determinada, se les puede considerar un experimento. En el contexto de las
ciencias sociales, la mayor parte de los procedimientos de recogida de datos se pueden
26 Capı́tulo 2. PROBABILIDAD

considerar como experimentos aleatorios. Cuando se efectúa un experimento se pueden


tener uno o más resultados posibles, los cuales se denominan eventos.
Definición 2.2.2 Un espacio muestral Ω asociado a un experimento es el conjunto de
todo los resultados posibles de un experimento.

Por ejemplo, para el lanzamiento del dado el espacio muestral puede ser

Ω = {1, 2, 3, 4, 5, 6}

o también

Ω = {pares, impares}.

Para el número de carros que llegan a la universidad en una hora determinada, el espacio
muestral es

Ω = {x| x un número entero mayor o igual a cero}.

Donde x es el número de carros que llegan en una hora determinada.


Si w es un elemento de Ω lo notaremos w ∈ Ω, y diremos que w pertenece a Ω. La
definición de un espacio muestral Ω en un problema concreto depende de cuales son los
aspectos que se desean analizar.
Definición 2.2.3 Un evento es cualquier subconjunto A del espacio muestral Ω, y lo
notaremos A ⊆ Ω.

Para el espacio muestral asociado con el lanzamiento de un dado, se tiene que cualquier
subconjunto de

Ω = {1, 2, 3, 4, 5, 6}
es un evento de Ω.
Al conjunto formado por todos los subconjuntos de Ω, el cual notaremos P(Ω), lo
denominaremos el conjunto de partes Ω. Por ejemplo, si Ω = {a, b, c} conjunto de
partes de Ω es:

P(Ω) = {∅, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, Ω}.

Definición 2.2.4 Sean A y B eventos cualesquiera del espacio muestral Ω. Entonces


1. La intersección de los eventos A y B es otro evento, lo cual escribimos A ∩ B,
cuyo elementos son los elementos comunes a A y B.

x ∈ A ∩ B si y solo si x ∈ A y x ∈ B
2. La unión de los eventos A y B es otro evento, lo cual escribimos A ∪ B, cuyos
elementos son todos los elementos de A o B.

x ∈ A ∩ B si y solo si x ∈ A o x ∈ B
3. Los eventos A y B se dicen disjuntos o mutuamente excluyentes si su
intersección es el conjunto vacı́o:

Humberto Barrios - hbarrios@unicesar.edu.co


2.2 PROPIEDADES BÁSICAS 27

A∩B =∅
4. El complemento de A es otro evento, lo escribimos Ac , cuyos elementos son
todos los del espacio muestral Omega excepto los que están en A:

x ∈ Ac si y solo si x no esta en A
En lo sucesivo, cualquier evento de un espacio muestral se puede representar median-
te los diagramas de Veen. Por ejemplo, la intersección, la unión, la disyunción y el
complemento entre conjuntos se representan como se muestran en las figuras siguientes
respectivamente

A∩B Ω A∪B Ω

A∩B A B

A∩B =∅ Ω Ω
Ac

A
A B

 Ejemplo 2.1 Sea Ω = {1, 2, 3, 4, 5, 6} el espacio muestral asociado al experimento


el lanzamiento de un dado, y sean los eventos A = {2, 4, 6} y B = {3, 6}. Entonces

A ∩ B = {6}
A ∪ B = {2, 3, 4, 6}
Ac = {2, 3, 4, 6}

Definición 2.2.5 Sea Ω un espacio muestral asociado a un experimento. Una proba-


bilidad es una función P de valor real que asigna a cada evento A de Ω un número
real de tal manera que sean validos los siguientes axiomas:

Humberto Barrios - hbarrios@unicesar.edu.co


28 Capı́tulo 2. PROBABILIDAD

P1. Para todo evento A de P (A) ≥ 0. Es decir, la probabilidad de cualquier evento


A de Ω es un número real no negativo.
P2. P (Ω) = 1
P3. Si A1 , A2 , A3 , . . . es una sucesión de eventos de Ω mutuamente excluyentes, es
decir, Ai ∩ Aj = Φ para todo i 6= j , entonces

[ ∞
X
P( An ) = P (An ).
n=1 n=1

La pareja (Ω, P ) se llama un espacio de probabilidad. Un espacio de probabilidad es una


descripción del experimento que informa de cuál es el conjunto de posibles resultados del
experimento, Ω de los sucesos cuya realización interesa, los eventos A de Ω, los cuales
permiten cuantificar la incertidumbre de que produzcan los sucesos que interesan.

Teorema 2.2.1 P (Φ) = 0.

Demostración. Sea A1 = Ω y Ai = Φ para i = 2, 3, . . . , es claro que Ai ∩ Aj = Φ para


todo i 6= j.

Por el axioma (P3) de la definición (2.2.5) tenemos que



[ ∞
X
P( An ) = P (An ) (2.1)
n=1 n=1
como

[
Ω= An (2.2)
n=1

De (2.1) y (2.2.2) se infiere que



X
P (Ω) = P (Ω) + P (An )
n=2

y puesto que P (Ai ) ≥ 0 para todo i = 1, 2, 3, . . .. Entonces P (Ai ) ≥ 0 para todo


i = 2, 3, . . .. En consecuencia
P (Φ) = 0.


Teorema 2.2.2 Sean A y B eventos de Ω si A ∩ B = Φ. Entonces

P (A ∪ B) = P (A) + P (B).

Demostración. Considérese A1 = A, A2 = B, Ai = Φ, aplicando el axioma ?? se deduce



[ ∞
X ∞
X
P( An ) = P (An ) = P (A1 ) + P (A2 ) + P (An )
n=1 n=1 n=3

puesto que P (Φ) = 0 se concluye



[ ∞
X
P( An ) = P (An ) = P (A1 ) + P (A2 ) (2.3)
n=1 n=1

Humberto Barrios - hbarrios@unicesar.edu.co


2.2 PROPIEDADES BÁSICAS 29

pero

[
A∪B = An (2.4)
n=1

De (2.3) y (2.4) se obtiene

P (A ∪ B) = P (A) + P (B).

Teorema 2.2.3 Sea A evento de Ω. Entonces

P (Ac ) = 1 − P (A).

Demostración. Como se puede ver en la figura 2.1, Ω = A ∪ Ac y A ∩ Ac = Φ.

Figura 2.1: Ac

Ac

Aplicando el axioma P2 y el teorema 2, se tiene

P (Ω) = P (A ∪ Ac ) = P (A) + P (Ac ) = 1


En consecuencia
P (Ac ) = 1 − P (A).


Teorema 2.2.4 Sean A y B eventos de Ω, tales que A ⊆ B. Entonces

P (A) ≤ P (B).

Demostración. Nótese que el evento B se puede escribir como

B = A ∪ (Ac ∩ B)
donde los eventos A y (Ac ∩ B) son mutuamente excluyentes. En consecuencia, por
teorema 2 se tiene

P (B) = P (A) + P (Ac ∩ B)

Humberto Barrios - hbarrios@unicesar.edu.co


30 Capı́tulo 2. PROBABILIDAD

Figura 2.2: A ⊆ B

B

Ac ∩ B

como
P (Ac ∩ B) ≥ 0
se sigue
P (A) ≤ P (B).


Teorema 2.2.5 Sean A y B eventos de Ω. Entonces

P (A ∪ B) = P (A) + P (B) − P (A ∩ B)

Demostración. Es fácil comprobar, mediante la figura 2.3, que

Figura 2.3: A ∪ B
A∪B Ω

A A∩B B

A ∪ B = A ∪ (Ac ∩ B) y A ∩ (Ac ∩ B) = Φ (2.5)

también
B = (A ∩ B) ∪ (Ac ∩ B) y A ∩ B) ∩ (Ac ∩ B) = Φ (2.6)

de (2.5) y teorema 2, se infiere

P (A ∪ B) = P (A) + P (Ac ∩ B) (2.7)


por (2.6) y teorema 2, se obtiene

P (B) = P (A ∩ B) + P (Ac ∩ B) (2.8)

De (2.7) y (2.8) se establece

Humberto Barrios - hbarrios@unicesar.edu.co


2.3 DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES 31

P (A ∪ B) = P (A) + P (B) − P (A ∩ B).




Observemos que la definición de probabilidad solamente expresa cuáles son las propie-
dades que tiene una función de probabilidad, pero no expresa cómo asignar las proba-
bilidades especı́ficas de los eventos.

——————————————————————————– ———————————
————————- ——————————————————————————–

2.3 DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES


En un experimento aleatorio no es posible determinar con absoluta precisión cual
será el resultado. Sin embargo, unos resultados suelen ser más verosı́miles que otros.
Intuitivamente, la probabilidad indica el grado de confianza en que ocurra cada suce-
so. Existen diferentes interpretaciones del concepto de probabilidad que pretenden dar
sentido a esta idea. Algunas de ellas son las siguientes:
Definición 2.3.1 — Probabilidad clásica. Se define la probabilidad como el cociente
entre el número de casos favorables y el número total de casos posibles, siempre que
no exista razón alguna para creer que un resultado ocurra más que otro. Es decir, si
A es un evento del espacio muestral Ω entonces la probabilidad del evento A es:

número de casos favorables de A #(A)


P (A) = =
número de casos posibles #(Ω)

Por ejemplo, si se lanza un dado, la probabilidad de cada cara es 61 . Esta definición


no implica que se realice verdaderamente el experimento. La probabilidad se define
independientemente de que el experimento se lleve a cabo o no, y depende únicamente
de la geometrı́a o las propiedades fı́sicas del objeto en cuestión.
Definición 2.3.2 — Probabilidad frecuentista. Supongamos que se lanza un dado N
veces en las mismas condiciones y sale la cara un número n de veces. La definición
frecuentista de la probabilidad de obtener n veces caras en el resultado es:
n
P (c) = lı́m
n→∞ N

Al igual que en el caso anterior, esta definición es una forma conceptual de entender lo
que es un experimento aleatorio (por ejemplo, lanzar un dado), y no significa que en la
práctica haya que repetirlo un número ilimitado de veces para calcular la probabilidad.
Esto se debe a dos razones: en la práctica es imposible repetir un mismo experimento
en idénticas condiciones; el dado se deteriorará cuantas más veces se lance, la velocidad
del aire cambiará, etc. Además, si se pudiera repetir el fenómeno en idénticas condi-
ciones el resultado serı́a el mismo en todos los lanzamientos, por lo que el concepto de
probabilidad perderá su sentido.
 Ejemplo 2.2 Considérese el experimento de lanzamiento de un dado.
1. Hallar el espacio muestral
2. Asigne probabilidades a cada resultado posible

Humberto Barrios - hbarrios@unicesar.edu.co


32 Capı́tulo 2. PROBABILIDAD

3. Hallar la probabilidad de obtener un número par.


Solución.
1. El espacio muestral asociado al experimento, del lanzamiento de un dado es:

Ω = {1, 2, 3, 4, 5, 6}
2. El axioma P2 dice que la suma de todas las probabilidades de los elementos de Ω
debe ser igual a uno. Por lo tanto una forma de asignar probabilidades es suponer
a priori que el dado es perfecto, y en consecuencia cada una de las caras tiene la
misma posibilidad de salir, en este caso,

1
P ({i}) = ; i=1, 2, 3, 4, 5, 6.
6
Esta forma de asignar probabilidad se denomina clásica.
3. El evento obtener un número par es el subconjunto

A = {2, 4, 6}

número de casos favorables 3 1


P (A) = = = .
número de caso posibles 6 2


 Ejemplo 2.3 Un fabricante tiene cinco terminales de computador aparentemente idénti-


cos listos para ser enviados a su destino. El no sabe que dos son defectuosos. Recibe
un pedido especial de dos terminales y lo surte seleccionado al azar dos de los cinco
disponibles.
1. Encuentren el espacio muestral para este experimento
2. Sea A el evento en que el pedido se surte con dos terminales no defectuosos. Liste
los puntos muéstrales de A
3. Asigne probabilidades a cada resultado posible
4. Calcular la probabilidad del evento A.
Solución. Sean d1 , d2 los dos terminales defectuoso y b1 , b2 , b3 los terminales buenos.
1. Los eventos simples pueden representarse como sigue:

e1 = {d1 , d2 } e6 = {d2 , b2 }
e2 = {d1 , b1 } e7 = {d2 , b3 }
e3 = {d1 , b2 } e8 = {b1 , b2 }
e4 = {d1 , b3 } e9 = {b2 , b3 }
e5 = {d2 , b1 } e10 = {b3 , b3 }.

Por lo tanto el espacio muestral es:

Ω = {e1 , e2 , e3 , e4 , e5 , e6 , e7 , e8 , e9 , e10 }.
2. El evento A = {e8 , e9 , e10 }
3. Como las terminales son idénticos se puede asumir que tiene la misma posibilidad
de ser seleccionado cualquiera de los elementos del espacio muestral, luego

1
P ({ei } = ; i=1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
10

Humberto Barrios - hbarrios@unicesar.edu.co


2.3 DIFERENTES MANERAS DE ASIGNAR PROBABILIDADES 33

4. Puesto que el evento A = {e8 , e9 , e10 } = {e8 } ∪ {e9 } ∪ {e10 } , aplicando el teorema
2, se obtiene
3
P (A) = P ({e8 }) + P ({e9 }) + P ({e10 }) = .
10


 Ejemplo 2.4 Una empresa dedicada a la búsqueda de petróleo o gas natural encuentra

en 10 % de sus perforaciones. Si la compañı́a perfora dos pozos, los cuatro eventos simples
posibles y tres de sus probabilidades asociadas son:

RESULTADOS
EVENTOS 1 perforación 2 perforación Probabilidad
e1 Éxito Éxito 0.01
e2 Éxito Fracaso
e3 Fracaso Éxito 0.09
e4 Fracaso fracaso 0.81

1. Obtenga la probabilidad de que la compañı́a encuentre petróleo o gas en la primera


perforación y falle en la segunda
2. Obtenga la probabilidad de que la compañı́a encuentre petróleo o gas en al menos
una de las dos perforaciones.
Solución. El experimento consiste en la perforación de pozos en busca de petróleo o
gas. El espacio muestral es:

Ω = {e1 , e2 , e3 , e4 }
donde, por ejemplo, e3 significa fracaso en la primera perforación y éxito en la segunda.
1. El evento de encontrar petróleo o gas en la primera perforación y fracaso en la
segunda perforación es:

A = {e2 }.
Por otro lado, se tiene por axioma P2, que

P (Ω) = P ({e1 }) + P ({e2 }) + P ({e3 }) + P ({e4 }) = 1


entonces

P ({e2 }) = 1 − (P ({e1 }) + P ({e3 }) + P ({e4 })) = 1 − (0.01 + 0.09 + 0.81) = 0.09.

2. El evento de que encuentre petróleo o gas en al menos en una de las dos perfora-
ciones es

B = {e1 , e2 , e3 }
por lo tanto

P (B) = P ({e1 }) + P ({e2 }) + P ({e3 }) = 0.01 + 0.09 + 0.09 = 0.19


Otra forma de calcular la probabilidad de P (B) es:

P (B) = 1 − P ({e4 }) = 1 − 0.81 = 0.19.

Humberto Barrios - hbarrios@unicesar.edu.co


34 Capı́tulo 2. PROBABILIDAD

 Ejemplo 2.5 Una agencia comercial compra papelerı́a a uno de los tres vendedores v1 ,
v2 y v3 . Se ordena el pedido en dos dı́as consecutivos, un pedido por dı́a, tal que (v1 , v2 )
significa que el vendedor v1 recibe el pedido el primer dı́a y el vendedor v2 lo recibe el
segundo dı́a.
1. Determine los puntos muéstrales de este experimento
2. Supongamos que se seleccionan los vendedores al azar cada dı́a, asigne una pro-
babilidad a cada punto muestral
3. Sean A el evento de que el mismo vendedor recibe los dos pedidos y el evento B
de que el vendedor v2 consigue por lo menos un pedido. Calcular: P (A), P (B),
P (A ∩ B) y P (A ∪ B).
Solución. El experimento consiste en la solicitud de papelerı́a que hace una agencia
comercial en dos dı́as consecutivos. Como (vi , vj ) representa que el vendedor i recibió el
primer pedido y j el segundo pedido. Entonces
1. el espacio muestral es:

Ω = {(v1 , v1 ), (v1 , v2 ), (v1 , v3 ), (v2 , v1 ), (v2 , v2 ), (v2 , v3 ), (v3 , v1 ), (v3 , v2 ), (v3 , v3 )}

2. Como la selección se hace de manera aleatoria cada dı́a, es natural suponer que
todos los vendedores tienen la misma posibilidad de ser seleccionados por lo tanto
1
P ({(vi , vj )}) = ; i,j=1, 2, 3.
9
3. Los eventos

A = {(v1 , v1 ), (v2 , v2 ), (v3 , v3 )}


B = {(v1 , v2 ), (v2 , v1 ), (v2 , v2 ), (v2 , v3 ), (v3 , v2 )}
A ∩ B = {(v2 , v2 )}

se tiene

1
P (A) = P ({(v1 , v1 ), (v2 , v2 ), (v3 , v3 )}) =
3
5
P (B) = P ({(v1 , v2 ), (v2 , v1 ), (v2 , v2 ), (v2 , v3 ), (v3 , v2 )}) =
9
1
P (A ∩ B) = P ({(v2 , v2 )}) = .
9

Por lo tanto
1 5 1 7
P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = + − = .
3 9 9 9


2.4 PROBABILIDAD CONDICIONAL


La probabilidad condicional nos permite ajustar un evento si se sabe que ha ocurrido
un evento relacionado con el primero.

Humberto Barrios - hbarrios@unicesar.edu.co


2.4 PROBABILIDAD CONDICIONAL 35

Definición 2.4.1 Sea B un evento del espacio muestral Ω tal que P (B) > 0. Entonces
la probabilidad condicional del evento A, dado que el evento B ocurrió, se define
como la razón

P (A ∩ B
P (A|B) = .
P (B)
De la misma manera se define

P (A ∩ B
P (B|A) = .
P (A)

También de la definición de probabilidad condicional se obtiene lo que se conoce como


teorema de multiplicación

P (A ∩ B) = P (A|B)P (B) = P (B|A)P (A).


 Ejemplo 2.6 Supongamos que en una oficina hay 100 máquinas calculadoras. Algunas

de esas máquinas son eléctricas (E), mientras otras son manuales (M). Además, algunas
son nuevas (N), mientras otras son usadas (U). La siguiente tabla da el número de
máquinas de cada categorı́a.

E M Total
N 40 30 70
U 20 10 30
Total 60 40 100

Una persona entra a la oficina, escoge una máquina al azar y descubre que es nueva.
¿Cuál es la probabilidad de que sea eléctrica?
Solución. Se sabe que la persona escogió una máquina nueva de la 70 y se tienen 40,
por lo tanto
4
P (E|N ) = .
7
Otra forma es calcular la probabilidad que se nueva y eléctrica,

P (E ∩ N ) = 0.40 y P (N ) = 0.70.

Entonces

P (E ∩ N ) 0.40 4
P (E|N ) = = = .
P (N ) 0.70 7


 Ejemplo 2.7 Considérese las familias que tienen dos hijos y supongamos que varones
y mujeres son igualmente probables. Si se escoge una familia al azar y en la familia hay
un hijo varón. ¿Cuál es la probabilidad de que el otro sea varón?
Solución. En este caso el espacio muestral es

Ω = {(v, v), (v, m), (m, v), (m, m)}.


Donde v es varón, m es mujer y el orden del par es el orden de los nacimientos. Cada
uno de los puntos tiene la probabilidad 41 . Sean los eventos A: uno de los hijos es varón
y B: ambos son varones, entonces

Humberto Barrios - hbarrios@unicesar.edu.co


36 Capı́tulo 2. PROBABILIDAD

A = {(v, v), (v, m), (m, v)}


y

B = {(v, v)}
como B ⊆ A entonces B = A ∩ B. Por lo tanto

P (A ∩ B) 1
P (A|B) = = .
P (B) 3


Definición 2.4.2 Se dice que los eventos B1 , B2 , B3 , B4 , . . . Bn representa una partición


del espacio muestral Ω si:
1. Bi ∩ Bj = Φ para todo i 6= j.
Sn
2. Bi = Ω
i=1
3. P (Bi ) > 0 para todo i = 1, 2, 3, . . . , n.

Teorema 2.4.1 — Teorema de la Probabilidad Total. Sea B1 , B2 , B3 , . . . , Bn una parti-


ción del espacio muestral Ω y A un evento de Ω. Entonces
n
X
P (A) = P (A|Bi )P (Bi ).
i=1

Demostración. Es fácil observar en la figura 2.4 que A es la unión disjunta de elementos


de Ω, como se muestra en la siguiente gráfica.

Figura 2.4: Partición de Ω


Bn
B1

A B3

B2

Esto es:

A = (A ∩ B1 ) ∪ (A ∩ B2 ) ∪ (A ∩ B3 ) ∪ . . . ∪ (A ∩ Bn )
donde

(A ∩ B1 ) ∩ (A ∩ B2 = Φ; para todo i 6= j
entonces
n
X
P (A) = P (A ∩ Bi ) (2.9)
i=1

Humberto Barrios - hbarrios@unicesar.edu.co


2.4 PROBABILIDAD CONDICIONAL 37

pero tenemos que para i = 1, 2, . . . , n

P (A ∩ Bi ) = P (A|Bi )P (Bi ) (2.10)


sustituyendo (2.10) en (2.9), se obtiene
n
X
P (A) = P (A|Bi )P (Bi ).
i=1


Una consecuencia inmediata del anterior teorema e el reconocido teorema de Bayes.

Teorema 2.4.2 — Teorema de Bayes. Sea B1 , B2 , B3 , . . . , Bn una partición del espacio


muestral Ω. Para cualquier evento A de Ω, done P (A) > 0 y cualquier j, 1 ≤ j ≤ n.
Entonces

P (A|Bj )P (Bj )
P (Bj |A) = n .
P
P (A|Bi )P (Bi )
i=1

Demostración. Por la definición de probabilidad condicional se tiene

P (A ∩ Bj )
P (Bj |A) = (2.11)
P (A)
Por otra parte se tiene que

P (Bj ∩ A) = P (A | Bj )P (Bj ) (2.12)


por teorema de la probabilidad total
n
X
P (A) = P (A | Bi )P (Bi ) (2.13)
i=1

reemplazando (2.12) y (2.13) en (2.11) se obtiene

P (A | Bj )P (Bj )
P (Bj |A) = n .
P
P (A|Bi )P (Bi )
i=1


 Ejemplo 2.8 Cierto artı́culo se hace en una de tres fábricas, digamos 1, 2 y 3. Se


sabe que la primera produce el doble de artı́culos que la segunda. También se sabe que
la segunda y la tercera producen el mismo número de artı́culo(durante un periodo de
producción especı́fico). Se conoce también que el 2 % de los artı́culos producidos por
cada una de las dos primeras son defectuosos; mientras que 4 % de los manufacturados
por la tercera son defectuosos. Todos los artı́culos se colocan en una fila y se escoge uno
al azar.
1. ¿Cuál es la probabilidad de que este artı́culo sea defectuoso?
2. Si las tres fábricas producen 10000 artı́culos ¿Cuál es el número de artı́culos de-
fectuosos que produce cada fábrica?
3. Si se sabe que el artı́culo es defectuoso ¿Cuál es la probabilidad de que este articulo
proceda de la fábrica dos?

Humberto Barrios - hbarrios@unicesar.edu.co


38 Capı́tulo 2. PROBABILIDAD

Solución. Definamos
1. los siguientes eventos:

A = {el artı́culo es defectuoso}


B1 = {el artı́culo proviene de la fábrica 1}
B2 = {el artı́culo proviene de la fábrica 2}
B3 = {el artı́culo proviene de la fábrica 3}.

Entonces para i = 1, 2, 3

(A ∩ B1 ) = {el articulo es defectuoso y proviene de la fábrica i}


Luego

A = (A ∩ B1 ) ∪ (A ∩ B2 ) ∪ (A ∩ B3 )
por otra parte se tiene que

P (A|B1 ) = 0.02
P (A|B2 ) = 0.02
P (A|B3 ) = 0.04
P (B1 ) = 0.50
P (B2 ) = 0.25
P (B3 ) = 0.25.

Reemplazando los valores anteriores en

P (A) = P (A|B1 )P (B1 ) + P (A|B2 )P (B2 ) + P (A|B3 )P (B3 )


se obtiene

P (A) = (0.02)(0.50) + (0.02)(0.25) + (0.04)(0.25) = 0.025.


Por lo tanto la probabilidad que un artı́culo sea defectuoso es 0.025.
Los puntos 2. y 3. se dejan al lector.


 Ejemplo 2.9 Supóngase que tenemos una urna con cuatro monedas de oro y tres de
bronce, y una segunda urna contiene tres de oro y cinco de bronce. Las monedas en las
dos urnas son todas idénticas. Se selecciona una moneda de la primera urna y se coloca
sin verla en la segunda urna. ¿Cuál es la probabilidad de que ahora se seleccione una
moneda de bronce de la segunda?

Solución. Sean B1 y B2 , la selección de una moneda de bronce de la urna 1 y una


moneda de bronce de la segunda urna respectivamente, y O1 una moneda de oro de la
urna 1. Debemos calcular la probabilidad de la unión de los eventos B1 ∩ B2 y O1 ∩ B2 .

Humberto Barrios - hbarrios@unicesar.edu.co


2.4 PROBABILIDAD CONDICIONAL 39

Figura 2.5:

6
18
= 9 P (B1 ∩ B2 ) = P (B2 |B1 )P (B1 ) =
B 1) 63
2|
P (B

3
P (O
7
= 2 |B
1)
9
1) P (B1 ∩ O2 ) = P (O2 |B1 )P (B1 ) =
(B

= 3 63
P

4
16
= 9 P (O1 ∩ O2 ) = P (O2 |O1 )P (O1 ) =
P

1) 63
(O

O
2|
P (O
1
)=
4
7

P (B
2 |O 20
1) = 5
P (B2 ∩ O1 ) = P (B2 |O1 )P (O1 ) = 63
9

Las diferentes posibilidades que se pueden dar se muestran el diagrama de árbol, figura
2.5. Entonces

Por lo tanto, la probabilidad se seleccionar una moneda de bronce de la segunda


urna es:

P (B2 ) = P ((B1 ∩ B2 ) ∪ (O1 ∩ B2 ))


= P (B1 ∩ B2 ) + P (O1 ∩ B2 )
= P (B2 |B1 )P (B1 ) + P (B2 |O1 )P (O1 )
18 20 38
= + = .
63 63 63

 Ejemplo 2.10 Supongamos que varias cajas son de dos tipos B1 y B2 . El tipo B1
contiene 70 % de caramelos dulces y 30 % de caramelos ácidos, mientras que el tipo B2
dicho porcentaje esta invertido. Supongamos además que el 60 % de todas las cajas son
del tipo B1 , mientras que el resto son del tipo B2 . Si se escoge un caramelo dulce al azar
de una caja desconocida. Decidir de que tipo de caja es más probable que provenga.
Solución. Se tienen dos tipos de cajas B1 y B2 con probabilidades de selección

P (B1 ) = 0.60

P (B2 ) = 0.40.

Sea los eventos

Humberto Barrios - hbarrios@unicesar.edu.co


40 Capı́tulo 2. PROBABILIDAD

D = conjunto de caramelos dulces


A = conjunto de caramelos ácidos

por otra parte se tiene que

P (D|B1 ) = 0.70
P (D|B2 ) = 0.30
P (A|B1 ) = 0.30
P (A|B2 ) = 0.70.

Ası́

P (D|B1 )P (B1 ) (0.7)(0.6) 7


P (B1 |D) = = =
P (D|B1 )P (B1 ) + P (D|B2 )P (B2 ) (0.7)(0.6) + (0.3)(0.4) 9
y

P (D|B2 )P (B2 ) (0.3)(0.4) 2


P (B2 |D) = = =
P (D|B1 )P (B1 ) + P (D|B2 )P (B2 ) (0.7)(0.6) + (0.3)(0.4) 9
Por lo tanto se decide a favor de los caramelos que provienen de las cajas B1 . 

2.5 EVENTOS INDEPENDIENTES


Definición 2.5.1 Los eventos A1 , A2 , A3 , . . . , An de Ω se dicen independientes si para
todo conjunto de ı́ndices i1 , i2 , i3 , . . . , ik entre 1 y n se tiene que

P (Ai1 ∩ Ai2 ∩ Ai3 ∩ . . . ∩ Aik ) = P (Ai1 )P (Ai2 )P (Ai3 ) . . . P (Aik ).

En particular, los eventos A y B son eventos independientes en Ω, si

P (A ∩ B) = P (A)P (B).

Es fácil verificar que los eventos Φ y Ω son independientes.

Ejemplo 2.11 Un lote de diez objetos contiene cuatro defectuosas y seis en buen estado.
Se extraen dos objetos sucesivamente y sin reemplazo. Sea

D1 = {el primer objeto es defectuoso}


D2 = {el segundo objeto es defectuoso}

1. ¿Son independientes estos eventos?

Humberto Barrios - hbarrios@unicesar.edu.co


2.5 EVENTOS INDEPENDIENTES 41

2. ¿Qué sucede si los objetos se extraen con reemplazo?


Solución. Si D1 , el primer objeto es defectuoso, entonces
2
P (D1 ) =
5
y la probabilidad del evento D2 el segundo objeto es defectuoso, es
12 43 2
P (D2 ) = P (D2 |D1 )P (D1 ) + P (D2 |D1c )P (D1c ) =
+ = .
35 95 5
Por otra parte, la probabilidad de D2 dado que ocurrió D1 es:
3
P (D2 |D1 ) =
9
de lo cual se tiene que

P (D2 |D1 ) 6= P (D2 )


En el segundo caso se tiene
2
P (D1 ) = P (D2 ) =
5
y
4
P (D1 ∩ D2 ) = P (D1 )P (D2 ) = .
25
Por lo tanto, si la selección se realiza con reemplazo los eventos son independientes.
Si A1 , A2 , A3 , . . . , An son eventos tales que Ai1 , Ai2 , Ai3 , . . . , Aik son independientes
para todos los indices distintos i1 , i2 , . . . , ik , k = 1, 2, . . . , n − 1, de esto no se sigue que

A1 , A2 , A3 , . . . , An
son independientes. Por ejemplo, se el lanzamiento de una moneda dos veces, y
signemos una probabilidad de 1/4 a cada resultado de Ω = {cc, cs, sc, ss}. Sean los
eventos

A = {cc, cs}
B = {cc, sc}
C = {cc, ss}

Entonces se tiene

1 11
P (A ∩ B) = P ({cc}) = 4 = P (A)P (B) = 22
1 11
P (A ∩ C) = P ({cc}) = 4 = P (A)P (C) = 22
1 11
P (B ∩ C) = P ({cc}) = 4 = P (B)P (C) = 22

pero
1 1 111
P (A ∩ B ∩ C) = P ({cc}) =
6= = P (A)P (B)P (C) = .
4 8 222
Entonces A y B, A y C, B y C son independientes pero A, B y C no lo son.

Humberto Barrios - hbarrios@unicesar.edu.co


42 Capı́tulo 2. PROBABILIDAD

Inversamente, si P (A1 ∩ A2 ∩ . . . ∩ An ) = P (A1 )P (A2 ) . . . P (An ), esto no implica que

P (Ai1 ∩ Ai2 ∩ . . . ∩ Aik ) = P (Ai1 )P (Ai2 ) . . . P (Ain )

cuando k < n. Por ejemplo, supongamos el lanzamiento de dos dados. Es claro, que el
espacio muestral Ω es conjunto formado por todas las parejas (i, j), i, j = 1, 2, 3, 4, 5, 6
con probabilidad 1/36. Sean los siguientes eventos

A = {el segundo dado muestra 1, 2, ó 5}


B = {el segundo dado muestra 4, 5 , ó 6}
B = {la suma de las dos caras sea nueve}

En este caso, es fácil ver que

P (A ∩ B) 6= P (A)P (B)
P (A ∩ C) 6= P (A)P (C)
P (B ∩ C) 6= P (B)P (C)

pero

P (A ∩ B ∩ C) = P (A)P (B)P C).

Por lo tanto los eventos A, B y C no son independientes.




 Ejemplo 2.12 El siguiente circuito (figura 2.6) funciona, si y sólo si, hay un camino
en el cual todos los dispositivos funcionan de izquierda a derecha. Suponga que los
dispositivos funcionen de forma independiente y que la probabilidad de que funcione un
dispositivo es como se muestra en la gráfica.
1. ¿Cuál es la probabilidad de que el circuito funcione?
2. ¿Cuál es la probabilidad de que el circuito no funcione?

Figura 2.6:

A1 A2 A4
0.90 0.90 0.98
A6
0.99
A3 A5
0.97 0.98

Solución. Para solucionar este problema procedemos como sigue:

Humberto Barrios - hbarrios@unicesar.edu.co


2.5 EVENTOS INDEPENDIENTES 43

1. La trayectoria de A1 a A2 funciona si y solo si los dispositivos A1 y A2 funcionan


simultáneamente. Por lo tanto, la probabilidad de que funciona, dado que los
dispositivos funcionan de manera independiente, es:
P (A1 ∩ A2 ) = P (A1 )P (∩A2 ) = (0.90)(0.90) = 0.81
Ası́, se tiene el siguiente circuito equivalente al dado en la figura 2.6

Figura 2.7:

A1 A4
0.81 0.98
A6
0.99
A3 A5
0.97 0.98

Por otra parte, la trayectoria del rectángulo en el circuito de la 2.7 funciona si los
dispositivos A1 o A3 funciones, es decir, no funciona si y solo si los dispositivos
A1 y A3 no funcionan simultáneamente. En consecuencia, la probabilidad que no
funcione es:

P (Ac1 ∩Ac3 ) = P (Ac1 )P (Ac3 ) = (1−P (Ac1 ))(1−P (Ac3 )) = (1−0.81)(1−0.97) = 0.0057
Luego la probabilidad que funcione la trayectoria del rectángulo es:

P (A1 ∪ A3 ) = 1 − P ((A1 ∪ A3 )c ) = 1 − P (Ac1 ∩ Ac3 ) = 1 − 0.0057 = 0.9943


De manera similar se resuelve para el caso de la trayectoria compuesta por el
cuadrado

P (A4 ∪ A5 ) = 1 − (1 − P (Ac4 ))(1 − P (Ac5 )) = 0.9996


Resumiendo lo anterior se llega al circuito

Figura 2.8:

A1 A2 A3
0.994 0.999 0.990

Para que el circuito de la figura 2.8 funcione es necesario que los tres dispositivos
funciones simultáneamente, y por ser independientes, la probabilidad que funcione
el circuito es:
P (A1 ∩ A2 ∩ A3 ) = P (A1 )P (A2 )P (A3 ) = 0.983.
2. La probabilidad que no funcione el circuito de la figura 2.6 es: 0.017.


Humberto Barrios - hbarrios@unicesar.edu.co


44 Capı́tulo 2. PROBABILIDAD

2.6 EJERCICIOS
1. Supongamos que se lanzan tres monedas perfectas y se observa el resultado de las
caras que quedan hacia arriba.
a) Establezca los puntos muestrales de este experimento.
b) Asigne una probabilidad razonable a cada punto.
c) Sea A el evento de observar exactamente una cara y B el evento de observar
al menos una cara. Obtenga los puntos muestrales de los eventos A y B.
d ) De la respuesta de (c), calcular P (A), P (B), P (A∩B), P (A∪B) y P (Ac ∩B).
2. Cuatro administradores de empresa solicitan dos puestos en una compañı́a. Uno
y solamente uno de los aspirantes es miembro de una étnica de la Sierra Nevada
de Santa Marta. Los puestos se otorgan seleccionado aleatoriamente dos de los
aspirantes.
a) Establezca los puntos muestrales de este experimento.
b) Asigne las probabilidades a los resultados del espacio muestral.
c) Encuentre la probabilidad de que el aspirante de la étnica de la Sierra Nevada
de Santa Marta se seleccionado para un puesto.
3. Un equipo de comunicación contiene seis sistemas electrónicos complejos. Se se-
leccionan aleatoriamente dos de los seis para someterlos a pruebas rigurosas y
clasificarlos como defectuosos y no defectuosos.
a) Si dos de los seis sistemas son realmente defectuosos, encuentre la proba-
bilidad que al menos uno de los dos sistemas probados sean defectuosos.
Encuentre la probabilidad que los dos sean defectuosos.
b) Encuentre la probabilidad indicada en (a) para el caso en que cuatro de los
seis sistemas sean realmente defectuosos.
4. Un supermercado vende solamente dos tipos de lámparas eléctricas y la experiencia
muestra que tienen igual demanda. Cuatro clientes entran uno tras otro para
comprar una lámpara. El vendedor se interesa por la preferencia de sus clientes.
a) Establezca los puntos muestrales de este experimento.
b) Asigne las probabilidades a los resultados del espacio muestral.
c) Sea A el evento de que los cuatro clientes prefieren el mismo tipo de lámpara.
Calcular P (A).
5. Dos equipos de fútbol, I Y II, tienen la misma capacidad y juegan uno contra el
otro una serie de cuatro juegos. Se registra el resultado de cada juego.
a) Establezca los puntos del espacio muestral de este experimento.
b) Asigne las probabilidades a los resultados del espacio muestral.
c) Sea A el evento de que el equipo I gana exactamente tres veces. Calcular
P (A).
6. Los enfermos no hospitalizados que acuden a una clı́nico pueden elegir una de
tres secciones para ser atendidos. Suponga que los médicos son asignados aleato-
riamente a tales secciones y que por esto los pacientes no presentan preferencia
alguna con respecto a una sección. Tres pacientes acuden a la clı́nico y se observan
la sección que eligen.
a) Establezca los puntos del espacio muestral de este experimento.
b) Asigne las probabilidades a los resultados del espacio muestral.
c) Sea A el evento de que cada sección recibe un paciente. Establezca los puntos
muestrales de A. Calcular P (A).
7. Se tienen 3 libros: uno de aritmética (A), uno de biologı́a (B) y otro de cálculo(C).
¿De cuántas maneras se pueden ordenar en un estante?
8. Se tienen 7 libros y solo 3 espacios en una biblioteca, suponiendo que no existan

Humberto Barrios - hbarrios@unicesar.edu.co


2.6 EJERCICIOS 45

razones para preferir alguno. ¿De cuántas maneras se pueden colocar 3 libros
elegidos; entre los siete dados?
9. ¿Cuántas permutaciones pueden formarse con las letras de la palabra BONDAD?
10. Cuantos grupos de 5 alumnos pueden formarse con los treinta alumnos de una
clase. (Un grupo es distinto de otro si se diferencia de otro por lo menos en un
alumno).
11. Una aerolı́nea tiene seis vuelos diarios Barranquilla a Medellı́n y siete vuelos de
Medellı́n a Cali. Si los vuelos se hacen en dı́as separados. ¿Cuántos arreglos dife-
rentes de vuelos puede ofrecer la aerolı́nea de Barranquilla a Cali?
12. Una operación de montaje en una fábrica manufacturara requiere tres pasos que
pueden realizarse en cualquier orden. ¿De cuántas maneras se puede hacer el
montaje?
13. Cierta marca de automóvil tiene cinco modelos diferentes, con cuatro tipo de
motores, con dos tipos de transmisión, y en ocho colores.
a) ¿Cuántos automóviles tendrı́a que adquirir un distribuidor si quiere incluir
un carro por combinación modelo-motor-trasmisión?
b) ¿Cuántos automóviles tendrı́a que tener en existencia un centro de distri-
bución si almacenara los carros de todos los colores disponibles para cada
combinación en (a.)?
14. Un investigador quiere determinar el efecto de tres variables, presión, tempera-
tura y el tipo de catalizador, en el proceso de refinación. Si el investigador tiene
la intención de utilizar tres temperaturas, tres presiones y dos tipos de cataliza-
dor. ¿ Cuántos experimentos habrı́a que hacer si quiere incluir todas las posibles
combinaciones de temperaturas, de presiones y tipos de catalizador?
15. Cinco empresas F 1, F 2, F 3, F 4 y F 5, hacen propuestas con respecto a tres contra-
tos separados, C1, C2 y C3. Una empresa sólo puede obtener a lo más un contrato.
Los contratos son bastante diferentes, de tal manera que la asignación de C1 a F 1
se debe diferenciar de la asignación de C2 a F 2.
a) ¿Cuántos puntos muestrales tiene este experimento que trata de la asignación
de los contratos a las empresas?
b) Encuentre la probabilidad de que se conceda un contrato a la empresa F 3,
bajo el supuesto de que los puntos muestrales son equiprobable.
16. Dado los siguientes eventos A y B, tales que P (A) = 0.5, P (B) = 0.3, y P (A∩B) =
0.1, encontrar lo siguiente:
a) P (A|B)
b) P (B|A)
c) P (A|A ∩ B)
d ) P (A|A ∪ B)
e) P (A ∪ B|A ∩ B)
17. Un armador de ventiladores eléctricos usa motores de dos proveedores. La com-
pañı́a A le suministra el 70 % y la compañı́a B el otro 30 % de los motores. Su-
pongamos que sabe que el 5 % de los motores que suministra la compañı́a A son
defectuosos que el 3 % de los que suministra B también lo son. Se selecciona un
ventilador ya armado.
a) ¿Cual es la probabilidad que tenga un motor defectuoso?
b) ¿Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido
suministrado por la compañı́a A?
c) ¿Si tiene un motor defectuoso cual es la probabilidad que ese motor haya sido
suministrado por la compañı́a B?

Humberto Barrios - hbarrios@unicesar.edu.co


46 Capı́tulo 2. PROBABILIDAD

18. Los empleados de un supermercado se encuentra clasificado en tres categorı́as:


administradores, supervisores y vendedores. La siguiente tabla indica el número
de empleados en cada división clasificados por sexo:

Mujeres (M) Hombres (H) Total


Administradores (A) 20 30 50
Supervisores (S) 50 20 70
Vendedores (V) 100 80 180
Total 170 130 300

a) Si elige aleatoriamente un empleado:


1) ¿Cuál es la probabilidad que sea mujer?
2) ¿Cuál es la probabilidad que sea un vendedor?
3) ¿Cuál es la probabilidad que sea mujer y trabaje en la sección de admi-
nistración?
4) ¿Cuál es la probabilidad que sea mujer si trabaja en la división de su-
pervisor?
b) ¿Son los eventos V y H estadı́sticamente independientes?
c) ¿Son los eventos A y M estadı́sticamente independientes?
d ) Determine las siguientes probabilidades:
1) P (A ∪ M )
2) P (A ∪ M c )
3) P (S ∩ M )
4) P (M |A)
19. Sean A y B dos eventos cualesquiera de un espacio muestral Ω. Si A y B son
mutuamente excluyentes, muéstrese que no pueden ser independientes. Dedúzcase
que dos eventos independientes son, también, mutuamente.
20. Se lanza una moneda diez veces y en todos los lanzamientos el resultado es cara.
a) ¿Cuál es la probabilidad de este evento?
b) ¿Cuál es la probabilidad de que en el decimoprimero lanzamiento el resultado
sea cara?
21. Una agencia de automóviles recibe un embarque de 20 automóviles nuevos. En-
tre éstos, dos tienen defectos. La agencia decide seleccionar, aleatoriamente, dos
automóviles entre los 20 y aceptar el embarque si ninguno de los dos vehı́culos
seleccionados tienen defectos. ¿Cuál es la probabilidad de aceptar el embarque?
22. Se lanza una moneda con una probabilidad de 23 que el resultado sea cara. Si
aparece una cara, se extrae una pelota, aleatoriamente, de una urna que contiene
dos pelotas rojas y tres verdes. Si el resultado es sello se extrae una pelota, de otra
urna, que contiene dos rojas y dos verdes. ¿Cuál es la probabilidad de extraer una
pelota roja?
23. De entre 20 tanques de combustible fabricados para el trasbordador espacial, tres
se encuentran defectuosos. Si se seleccionan aleatoriamente cuatro tanques:
a) ¿Cuál es la probabilidad que ninguno de los tanques se encuentre defectuoso?
b) ¿Cuál es la probabilidad de que uno de los tanques tenga defectos?
24. La probabilidad de que cierto componente eléctrico funcione es de 0.9. un aparato
contiene dos de éstos componentes. El aparato funciona mientras lo haga, por lo
menos, uno de los componentes.
a) Sin importar cuál de los dos componente funcione o no. ¿Cuáles son los
posibles resultados y sus respectivas probabilidades?. Suponga independencia
en la operación entre los componentes.

Humberto Barrios - hbarrios@unicesar.edu.co


2.6 EJERCICIOS 47

b) ¿Cuál es la probabilidad que el aparato funcione?


25. Con base en varios estudios una compañı́a ha clasificado, de acuerdo con la posibi-
lidad de descubrir petróleo, las formaciones geológicas en tres tipos. La compañı́a
pretende perforar un pozo en determinado sitio, al que le asigna las probabilidades
0.35, 0.40 y 0.25 para los tres tipos de formaciones respectivas. De acuerdo con
la experiencia, se sabe que el petróleo se encuentra en un 40 % de formaciones de
tipo I, en un 20 % de formaciones de tipo II y en un 30 % de formaciones de tipo
III. Si la compañı́a no descubre petróleo en ese lugar, determı́nese la probabilidad
de que exista una formación de tipo II.
26. Se debe examinar un grupo grande de personas respecto a dos sı́ntomas comunes
de cierta enfermedad. Se considera que el 20 % de las personas presentan solamente
el sı́ntoma A, el 30 % tienen solamente el sı́ntoma B, 10 % tienen ambos sı́ntomas,
y el resto no tiene sı́ntoma alguno. Para una persona escogida aleatoriamente de
este grupo, encuentre las probabilidades de los eventos siguientes:
a) ¿Qué la persona presente al menos un sı́ntoma?
b) ¿Qué la persona no presente sı́ntoma alguno?
c) ¿Qué la persona presente ambos sı́ntoma, dado que presenta el sı́ntoma B?
27. Una planta ensambladora recibe circuitos proveniente de tres fábricas distintas
B1 , B2 y B3 . El 50 % del total se compran a B1 mientras que a B2 y B3 se les
compra un 25 % a cada una. El porcentaje de circuitos defectuosos para B1 , B2 y
B3 es 5, 10 y 12 % respectivamente. Si los circuitos se almacenan en la planta sin
importar quién fue el proveedor:
a) Determinar la probabilidad de que una unidad armada en la planta contenga
un circuito defectuoso
b) Si un circuito no es defectuoso. ¿Cuál es la probabilidad de que haya sido
vendido por el proveedor B2 ?
28. Supongamos que hay nueve lugares disponibles en un estacionamiento, uno junto
al otro. Un acomodador tiene que estacionar nueve carros. Tres son carros depor-
tivos, tres son carros grandes nacionales, y tres son carros compactos importados.
¿Cuál es la probabilidad de que los tres carros deportivos se encuentren juntos,
suponiendo que el acomodador estaciona los carros de manera aleatoria?
29. Se clasifican ocho marcas de llantas de 1 a 8 (de la mejor a la peor) según el
kilometraje que aguanten. Si un comprador escoge cuatro llantas aleatoriamente,
encuentre la probabilidad de que la mejor llanta entre las seleccionadas por el
comprador se encuentre realmente en el tercer lugar entre las ocho llantas origi-
nales.
30. Una maquinaria para producir un nuevo tubo electrónico experimental genera
tubos defectuosos de vez en cuando, de una manera aleatoria. El ingeniero super-
visor de una máquina en particular, ha notado que los tubos defectuosos parecen
agruparse (y, por tanto, aparecen de manera no aleatoria) y esto sugiere el mal
funcionamiento de alguna de la máquina. Una prueba para detectar la no alea-
toriedad de un evento, se basa en el número de corridas de artı́culos defectuosos
y buenos (una corrida es una sucesión no interrumpida de artı́culos defectuosos
o buenos). Mientras más pequeña sea el número de corridas, más grande es la
evidencia que indica la no aleatoriedad. De 12 tubos producidos por la máquina,
los 10 primeros eran buenos y los dos últimos defectuosos (BBBBBBBBBBDD).
Suponga la aleatoriedad.
a) ¿Cuál es la probabilidad de observar la secuencia antes mencionada (resul-
tante de dos corridas) dado que los 10 tubos de 12 son buenos?

Humberto Barrios - hbarrios@unicesar.edu.co


48 Capı́tulo 2. PROBABILIDAD

b) ¿Cuál es la probabilidad de observar dos corridas?


c) ¿Cuál es la probabilidad de que el número de corridas R sea R=3?
31. Suponga que la probabilidad de exposición a la gripe durante una epidemia es 0.6.
La experiencia ha mostrado que una vacuna tiene 80 % de efectividad en proteger
a una persona sobre la gripe, si está expuesta a la epidemia. Una persona tiene una
probabilidad de 0.90 de ser afectada por la gripe al ser expuesta. Dos personas, una
vacunada y la otra no, realizan una tarea altamente especializada en un negocio.
Suponga que no se ubican en la misma localización, que no entra en contacto con
la misma persona, y no se expone la una a la otra. ¿Cuál es la probabilidad de
que al menos una sea afectada por la gripe?
32. Si A y B son eventos tales que A ⊆ B. Demuéstrese que P (A) ≤ P (B).
33. Sean A, B y C eventos mutuamente excluyentes. Entonces

P (A ∪ B ∪ C) = P (A) + P (B) + P (C)

34. Sean A y B eventos cualesquiera. Entonces

P (A ∩ B) ≥ P (A) + P (B) − 1

35. Sean A, B y C eventos cualesquiera. Entonces

P (A∪B∪C) = P (A)+P (B)+P (C)−P (A∩B)−P (A∩C)−P (B∩C)+P (A∩B∩C)

36. Sea (Ω, P ) un espacio de probabilidad. Dada la función PH : ℘(Ω) 7→ <, definida
por

P (A ∩ H)
PH (A) =
P (H)
donde A y H son subconjuntos de Ω y P (H) > 0.
Demuéstrese que
a) PH es un función de probabilidad
b) PH (Φ) = 0
c) PH (A ∪ B) = PH (A) + PH (B), si A ∩ B = Φ
d ) PH (Ac ) = 1 − P (A)
e) PH (A ∪ B) = PH (A) + PH (B) − PH (A ∩ B), para A y B eventos cualesquiera.
37. Sean A1 , A2 , . . . , An eventos definidos en el espacio muestral Ω y Ai ∩ Aj = Φ,
i 6= j. Demostrar que
[n Xn
P ( Ai ) = P (Ai )
i=1 i=1

38. Sea A evento tal que A ⊆ Ω. Demuéstrese que P (A) ≤ 1.


39. Sea A1 , A2 , . . . , An una partición del espacio muestral Ω y B un evento de Ω.
Entonces
Xn
P (B) = P (Ai ∩ B)
i=1

40. Sean A1 , A2 , . . . , An eventos del espacio muestral Ω. Entonces


n
[ n
X
P( Ai ) ≤ P (Ai )
i=1 i=1

Humberto Barrios - hbarrios@unicesar.edu.co


2.6 EJERCICIOS 49

41. Sean A1 , A2 , . . . , An eventos del espacio muestral Ω. Entonces

n
[ n
X n
X n
X
P( Ai ) = P (Ai ) − P (Ai ∩ Aj ) + P (Ai ∩ Aj ∩ Ak )
i=1 i=1 i<j i<j<k

− . . . + (−1)n+1 P (A1 ∩ A2 ∩ . . . ∩ An

42. Sean A y B eventos cualesquiera del espacio muestral Ω, tales que P (A) = 0.2,
P (B) = 0.3 y P (A ∪ B) = 0.4. Calcular:
a) P (A ∩ B)
b) P (Ac ∪ B)
c) P (Ac ∩ B c )
d ) P (Ac ∪ B c )
43. Sean A y B eventos independientes del espacio muestral Ω tales que P (A) = 0.5
y P (B) = 0.4. Calcular:
a) P (A ∩ B)
b) P (Ac ∪ B)
c) P (Ac ∩ B c )
d ) P (Ac ∪ B c )
44. Sean A y B eventos cualesquiera del espacio muestral Ω. Demuéstrese:
a) Si A ∩ B = Φ =⇒ P (A|B) = 0
b) Si A ⊆ B =⇒ P (B|A) = 1
45. Se lanzan dos dados hasta que la suma de los dos puntos sea 7 u 8. si sale 7, gana
el jugador A, y si sale 8 gana el jugador B. ¿Cuál es la probabilidad que gane B?
46. En el control preventivo de una población donde la proporción de enfermos es, se
usa el examen radiológico para detectar posibles enfermos. Se sabe que la proba-
bilidad de que, aplicando el examen a un enfermo, la muestra como tal, es 0.90; y
que la probabilidad de que el examen aplicado a una persona sana la señale como
enfermo es 0.01. calcular la probabilidad de que una persona dada esté realmente
enferma, si el examen radiológico lo mostró como tal. Considérese el experimento
de elegir una persona de la población de manera aleatoria.
47. Supongamos que tenemos tres escritorios idénticos, A, B y C, cada uno con dos
cajones. En A, cada cajón contiene una moneda de oro; en B, un cajón contiene
una moneda de oro y el otro una de plata, y en C, cada cajón contiene una de
plata. Se elige un escritorio al azar, se abre uno de los cajones y encontramos una
moneda de oro. ¿Cuál es la probabilidad de que el escritorio elegido sea el B?
48. Sean A y B dos eventos independientes tales que con probabilidad 61 ocurren si-
multáneamente, y con probabilidad 13 ninguno ocurre. Halle P (A) y P (B). ¿Están
determinadas en forma única estas probabilidades?
49. Sean A y B dos eventos independientes tales que con probabilidad 16 ocurren si-
multáneamente, y con probabilidad 31 ocurre A y B no ocurre. Halle P (A) y P (B).
¿Están determinadas en forma única estas probabilidades?
50. ¿Cuál es el menor valor de n para el cual la probabilidad de obtener al menos un
6 en una serie de n lanzamientos de un dado es mayor que 43 ?
51. Los A1 , A2 , . . . son independientes y P (Ai ) = p, i = 1, 2, . . . . Hallar el menor n
Sn
para el cual P ( Ai ) ≥ p0 , donde p0 es un número fijo.
i=1
52. Sean A y B dos eventos cualesquiera. ¿Cuál de las siguientes afirmaciones es falsa?
a) P (A|B) + P (Ac |B c ) = 1
b) P (A|B) + P (A|B c ) = 1

Humberto Barrios - hbarrios@unicesar.edu.co


50 Capı́tulo 2. PROBABILIDAD

c) P (A|B) + P (Ac |B) = 1


53. Sean A y B dos eventos cualesquiera tales que P (A|B) = P (B|A), P (A ∪ B) = 1
y P (A | B) > 0. Demostrar que P (A) > 1/2.
54. Sean A1 , A2 , . . . , An eventos independientes en el espacio muestral Ω si 0 < P (Aj ) <
1 para todo j. Demostrar que Ω tiene por lo 2n puntos.
55. Demuestre que si P (A|C) ≥ P (B|C) y P (A|C c ) ≥ P (B|C c ), entonces P (A) ≥
P (B).

Sean A y B dos eventos cualesquiera del espacio muestral Ω. Diremos que el


evento A atrae al evento B si P (B|A) > P (B) y rechaza a B si P (B|A) < P (B).
56. Probar que A atrae a B si y sólo si B atrae a A. Luego diremos que A y B son
mutuamente atractivos si A atrae B.
57. Probar que A no atrae ni rechaza a B si y sólo si A y son B independientes.
58. Probar que A y B son mutuamente atractivos si y sólo si P (B|A) > P (B|Ac ).
59. Probar que A atrae a B, entonces A rechaza a B c .
60. Probar que si A atrae B y C, y A rechaza a B ∩ C, entonces A atrae B ∪ C. Hallar
un ejemplo en el cual A atrae a B y C y rechace a B ∪ C?
61. Probar que si B1 , B2 , . . . , Bn es una colección mutuamente disjunta y si A atrae
algún Bi , entonces A rechaza algún Bj .
62. Muestre que para A y B eventos en un espacio de probabilidad:
a) P ((A ∩ B c ) ∪ (B ∩ Ac )) = P (A) + P (B) − 2P (A ∩ B)
b) P (A ∩ B) ≤ P (A) ≤ P (A ∪ B) ≤ P (A) + P (B)
c) Si P (A) = α y P (B) = β entonces P (A ∩ B) ≥ α + β − 1.
63. Un suero de la verdad tiene la propiedad de que el 90 % de los sospechosos culpables
se juzgan de forma adecuada; mientras que, por supuesto, 10 % de lo sospechosos
erróneamente se consideran inocentes. Por otro lado, a los sospechosos inocentes
se les juzga de manera errónea 1 % de las veces. Si el sospechoso se selecciona de un
grupo de sospechosos, de los cuales sólo el 5 % alguna vez han cometido un delito,
y el suero indica que es culpable, ¿cuál es la probabilidad de que sea inocente?

Humberto Barrios - hbarrios@unicesar.edu.co


Introducción
Variables Aleatorias Discretas
Valor Esperado y Varianza
Distribución Binomial
Distribución Poisson
Distribución Geométrica
Distribución Binomial Negativa
Distribución Hipergeométrica
Ejercicios

3. Variables Aleatorias Discretas

3.1 Introducción
En el capı́tulo anterior se estudio los conceptos básicos de probabilidad con respecto
a los resultados posibles de un experimento aleatorio. Se considero al espacio muestral
Ω, como el conjunto de todos los resultados posibles de un experimento aleatorio. Es-
tos resultados pueden ser cualitativos o cuantitativos. Por ejemplo, en un proceso de
fabricación se puede estar interesado en el hecho si el producto es defectuoso o no de-
fectuoso o una persona puede estar interesada en el consumo de agua diarias de una
familia en Valledupar. Con frecuencia puede ser útil la cuantificación de los resultados
de un espacio muestral y, mediante la asignación de un número real a cada elemento de
Ω, estudiar su comportamiento aleatorio. El concepto de variable aleatoria facilita un
medio para relacionar un resultado de un espacio muestral con un número real. Es decir,
utilizaremos el concepto de variable aleatoria para referirnos a experimentos donde cada
resultado posible queda caracterizado por un valor numérico.
Algunos modelos de funciones de probabilidad ocurren con muchas frecuencias en el
contexto de la estadı́stica teórica como aplicada, esto nos motiva al estudio en detalle
de algunos modelos de probabilidad, los cuales han demostrados ser útil en el campo de
las aplicaciones. A pesar de ello tales funciones de probabilidad presentan un carácter
teórico en el sentido en que son modelos que se deducen matemáticamente con base
en ciertos supuestos que se atribuyen ciertos para los fenómenos aleatorios. La elección
de un modelo de distribución de probabilidad para representar un fenómeno de interés
práctico debe estar motivada tanto por la compresión de la naturaleza del fenómeno en
sı́, como por la posible verificación de la distribución seleccionada a través de la evidencia
empı́rica. En todo momento antes de aplicar un modelo de función de frecuencia de
probabilidad debe realizarse un análisis crı́tico del problema de investigación.
En este capitulo se examina, más con la intuición que con cierto rigor matemático,
algunos modelos de frecuencia de probabilidad discretas, destacando ciertas aplicaciones
de ellas.

3.2 Variables Aleatorias Discretas


52 Capı́tulo 3. Variables Aleatorias Discretas

Hasta ahora, estamos familiarizados con una función cuyo dominio y recorrido son
subconjuntos de los números reales. Una función que tiene como dominio un espacio
muestral y su recorrido es un subconjunto de los números reales se llama variable alea-
toria.

Definición 3.2.1 Sea (Ω, P ) un espacio de probabilidad y R el conjunto de los números


reales. Una función

X:Ω→R
se llama una variable aleatoria real.
 Ejemplo 3.1 Considérese el experimento del lanzamiento de tres monedas una sola vez.
El espacio muestral es:

Ω = {ccc, css, scs, ssc, ccs, csc, scc, sss}


Sea la variable aleatoria X =“número de sellos en el lanzamiento de las tres monedas”,
entonces los posibles valores de esta variable aleatoria son: X(ccc) = 1, X(css) =
X(scs) = X(ssc) = 1, X(ccs) = X(csc) = X(scc) = 2 y X(sss) = 3, es costumbre
representar una variable aleatoria sólo por los valores que toma. Ası́, la variable aleatorio
del ejemplo, quedarı́a representada por X = 0, 1, 2, 3. 

 Ejemplo 3.2 Supóngase que se lanza un dado corriente dos veces consecutivas. Entonces
en este caso el espacio muestral es:
 

(1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6)




(2, 1) (2, 2) (2, 3) (2, 4) (2, 5) (2, 6)



(3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6)
 
Ω=

(4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6)

(5, 1) (5, 2) (5, 3) (5, 4) (5, 5) (5, 6)

 

 


(6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)

y definamos la variable aleatoria X =“suma de las dos caras”, entonces los posibles
valores de está variable aleatoria son: X = 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12. 

Es decir, una función X que asigna a cada uno de los elementos w ∈ Ω, un número real
X(w), se llama una variable aleatoria.
Definición 3.2.2 Sea X una variable aleatoria definida sobre el espacio muestral Ω.
Si el número de valores posibles de X es a lo más numerable, diremos que X es
una variable aleatoria discreta. Es decir, si se pueden anotar los valores posibles de
X como x1 , x2 , . . . , xn , . . .. En el caso finito, la lista termina y en el caso infinito
numerable, la lista continúa indefinidamente.

Las variables aleatorias definidas en los ejemplos anteriores, son claramente variables
aleatorias discretas.
Definición 3.2.3 Sea X una variable aleatoria discreta definida sobre el espacio de
probabilidad (Ω, P ). Entonces definimos:

1. La función de probabilidad de densidad (abreviada fpd) de X, como la función


PX (x) tal que para cualquier número real x ∈ R,

Humberto Barrios - hbarrios@unicesar.edu.co


3.2 Variables Aleatorias Discretas 53

PX (x) = PX (X = x) = P ({w ∈ Ω|X(w) = x}) (3.1)


2. la función de distribución acumulada de X (abreviada fda), la cual se notara
por F (x), por

F (x) = PX (X ≤ x) = P ({w ∈ Ω | X(w) ≤ x} (3.2)

La función de probabilidad de densidad PX (x) como la función de distribución acumu-


lada F (x) para una variable aleatoria discreta X se pueden representa por una fórmula,
una tabla o una gráfica.

Obsérvese que PX (x) es la probabilidad de que la variable aleatoria X tome exactamente


el valor x y F (x) es la probabilidad que la variable aleatoria X tome todos aquellos valores
menores o iguales a x.

 Ejemplo 3.3 Hallar la función de probabilidad de densidad PX (x), la función de dis-


tribución acumulada F (x) y gráficas de PX (x) y F (x) para la variable aleatoria del
ejemplo 3.1.

Solución En la tabla siguiente se muestra, en la primera columna todos los resultados


posibles, es decir, el espacio muestral Ω del experimento: lanzamiento de tres moneda
una sola vez, en la segunda columna los valores que toma la variable aleatoria X número
de sellos en el lanzamiento de tres moneda una sola vez y en las columnas tres y cuatro
la función de probabilidad de densidad PX (x) y la función de distribución acumulada
F (x) para la variable aleatoria X respectivamente.

Ω x PX (x) F (x)
1 1
ccc 0 8 8
3 4
css, scs, ssc 1 8 8
3 7
ccs, csc, scc 2 8 8
1
ccc 3 8 1

Por lo tanto la probabilidad PX (0) = 18 es la probabilidad de que en un lanzamiento de


tres monedas no salga ninguna cara, PX (2) = 18 es la probabilidad de obtener exacta-
mente dos cara en el lanzamiento de tres moneda una sola vez y F (3) = PX (X ≤ 3) = 78
es la probabilidad de obtener a los más dos cara en el lanzamiento de tres moneda una
sola vez.

Igualmente se puede graficar la función de probabilidad de la variable aleatoria X, como


se muestra a continuación:

Humberto Barrios - hbarrios@unicesar.edu.co


54 Capı́tulo 3. Variables Aleatorias Discretas

PX (x)
1
4

1
8

1 0
2 13 42 3 x
Gráfica de PX

Es fácil ver que la función de distribución acumulada F (x) de una variable aleatoria
cualesquiera esta definida en todo el conjunto de los reales R. Por lo tanto, la función de
distribución acumulada de la variable aleatoria X número de sellos en el lanzamiento
de tres monedas una sola vez se puede representar mediante la siguiente fórmula:


 0, si x < 0

1
 8 , si 0 ≤ x < 1



F (x) = 14 , si 1 ≤ x < 2
 1
4 , si 2 ≤ x < 3





1, si x ≥ 3

Por consiguiente, F (x) se puede representar como se muestra en la siguiente gráfica

F (x)
1
7
8

4
8

1
8

0 1 2 3 x
Gráfica de F (x)

En la gráfica se puede establecer que la probabilidad F (2.5) = 48 , haciendo la interpo-


lación como se puede ver en la gráfica. 

 Ejemplo 3.4 Hallar la función de probabilidad de densidad PX (x), la función de dis-


tribución acumulada F (x) y gráficas de PX (x) y F (x) para la variable aleatoria del
ejemplo 3.2.
Solución En la tabla siguiente se muestra, en la primera columna todos los resultados
posibles, es decir, el espacio muestral Ω del experimento: lanzamiento de un dado co-
rriente dos veces en forma consecutiva, en la segunda columna los valores que toma la

Humberto Barrios - hbarrios@unicesar.edu.co


3.2 Variables Aleatorias Discretas 55

variable aleatoria X suma de las dos caras en el lanzamiento de un dado corriente dos
veces y en las columnas tres y cuatro la función de probabilidad de densidad PX (x) y la
función de distribución acumulada F (x) para la variable aleatoria X respectivamente.

Ω x PX (x) F (x)
1 1
(1,1) 2 36 36
2 3
(1,2) (2,1) 3 36 36
3 6
(1,3) (2,2) (3,1) 4 36 36
4 10
(1,4) (2,3) (3,2) (4,1) 5 36 36
5 15
(1,5) (2,4) (3,3) (4,2) (5,1) 6 36 36
6 21
(1,6) (2,5) (3,4) (4,3) (5,2) (6,1) 7 36 36
5 27
(2,6) (2,6) (4,4) (5,3) (6,2) 8 36 36
4 30
(3,6) (3,6) (4,5) (6,3) 9 36 36
3 33
(4,6) (4,6) (6,4) 10 36 36
2 35
(5,6) (5,6) 11 36 36
1
(6,6) 12 36 1

Por lo tanto la probabilidad de observar que la suma de las dos caras se exactamente
6 5
7 es PX (7) = 36 , PX (8) = 36 es la probabilidad de obtener exactamente 8 en la suma
6
de las dos cara en el lanzamiento de un dado corriente y F (4) = PX (X ≤ 4) = 36 es la
probabilidad de obtener a los más 4 como suma de las dos cara.

Igualmente se puede graficar la función de probabilidad y la función de distribución


acumulada de la variable aleatoria X, como se muestra a continuación:

PX (x) Gráfica de PX
6
36
5
36
4
36
3
36
2
36
1
36

1 2 3 4 5 6 7 8 9 10 11 12 x

Como en el caso anterior del ejemplo 3.1 la gráfica de la distribución acumulada nos
permite responder preguntas referentes a la probabilidades de aquellos valores que no
toma la variable aleatoria X, pero que si están en el dominio de la función de distribución
acumulada F , puesto que F está definida en todo el conjunto de los números reales.

Humberto Barrios - hbarrios@unicesar.edu.co


56 Capı́tulo 3. Variables Aleatorias Discretas

F (x) Gráfica de F (x)

1
30
36
24
36
18
36
12
36
6
36

1 2 3 4 5 6 7 8 9 10 11 12 x

3.3 Valor Esperado y Varianza


Se ha observado que la función de probabilidad para una variable aleatoria es un
modelo teórico para la frecuencia relativa de datos asociados a una población real. Si
el modelo es una representación exacta de la realidad, la función de probabilidad y
las frecuencias relativas son equivalentes. Por lo tanto es natural, como en estadı́stica
descriptiva, que se intente definir la media y la varianza de una variable aleatoria y ası́
de esa manera obtener medidas descriptivas para una función de probabilidad de una
variable aleatoria discreta.

Definición 3.3.1 Sea X una variable aleatoria discreta con función de distribución de
probabilidad PX (x). Definimos
1. El valor esperado de X el cual se denotara por E(X) o µ y es definido por:

X
µ = E(X) = xi PX (xi )
i=1

2. La varianza de X se define y notaremos por:



X
σ 2 = V (X) = (xi − µ)2 PX (xi )
i=1

A la raı́z cuadrada de la varianza σ se le llama desviación estándar de la variable


aleatoria X.
En la anterior definición se asume que la suma como la integral es absolutamente con-
vergente, es decir,

X
|xi |PX (xi ) < ∞
i=1

si esto no es ası́ se dice que no tiene valor esperado.

Humberto Barrios - hbarrios@unicesar.edu.co


3.4 Distribución Binomial 57

Teorema 3.3.1 Si X es una variable aleatoria discreta con función de probabilidad


PX (x). Entonces V (X) = E(X 2 ) − [E(X)]2 .

 Ejemplo 3.5 Sea una variable aleatoria X que representa el número de clientes que
llegan una bomba de gasolina en Valledupar en un intervalo de tiempo de una hora (por
ejemplo, entre las 5:00 PM y 6:00 PM). En la siguiente tabla se muestra la función de
probabilidad de la variable aleatoria X

X=x 0 1 2 3 4 5 6 7 8
PX (x) 0.05 0.10 0.10 0.10 0.20 0.25 0.10 0.05 0.05
Encontremos el valor esperado, la varianza y la desviación estándar de la variable alea-
toria X.

Con base en la definición de valor esperado y la tabla anterior, tenemos:

X=x 0 1 2 3 4 5 6 7 8
PX (x) 0.05 0.10 0.10 0.10 0.20 0.25 0.10 0.05 0.05
xPX (x) 0 0.10 0.20 0.30 0.80 1.50 0.60 0.35 0.40
(x − µ)2 )PX (x) 0.90 1.06 0.51 0.16 0.01 0.14 0.31 0.38 0.70

Ası́, el valor esperado de X es



X 9
X
µ = E(X) = xi PX (xi ) = xi PX (xi ) = 4.25
i=1 i=0
.
la varianza de X
9
X
σ 2 = V (X) = (xi − µ)2 PX (xi ) = 4.17
i=1
Por lo tanto, la desviación estándar es σ = 2.04.


Teorema 3.3.2 Sea X una variable aleatoria discreta y a, c ∈ R y sea la variable


aleatoria Y = aX + c. Entonces

E(Y ) = aE(X) + c
V (Y ) = a2 V (X)

Demostración. La demostración se deja como un ejercicio. 

En las siguientes secciones examinamos algunos de los modelos de distribuciones de


probabilidades discretos más utilizados.

3.4 Distribución Binomial


Definición 3.4.1 Sea X una variable aleatoria que representa el número de éxitos en
n ensayos independiente, donde la probabilidad de un éxito es p y de un fracaso es
q = 1 − p, cada vez que el experimento se lleva acabo. Se dice entonces que X tiene

Humberto Barrios - hbarrios@unicesar.edu.co


58 Capı́tulo 3. Variables Aleatorias Discretas

distribución Binomial con función de probabilidad dada por:


 
 n px q n−x , donde x = 0, 1, 2, · · · n y q = 1 − p
PX (X = x) = x
0, en otro caso

Si una variable aleatoria X que tiene una distribución binomial con parámetros n y p,
notaremos X ∼ B[n, p].

La probabilidad que una variable aleatoria X sea menor o igual a un valor determinado
x0 , se especifica por la función de distribución acumulada,
X n
F (x0 ) = PX (X ≤ x0 ) = px q n−x
x
x≤x0

 Ejemplo 3.6 Supóngase que el 20 % de los artı́culos producidos por una fábrica son
defectuosos. Si se selecciona una muestra aleatoria simple con reemplazo de tamaño 10.
1. Determine la función de probabilidad y la función de distribución acumulada de
la variable aleatoria, número de artı́culos defectuosos en la muestra.
2. ¿Cuál es la probabilidad de que exactamente tres artı́culos son defectuosos entre
los 10 seleccionados?
3. ¿Cuál es la probabilidad de que 4 o más artı́culos son defectuosos entre los 10
seleccionados?
4. ¿Cuál es la probabilidad de rechazar el lote de 10 artı́culos si se tienen tres o más
artı́culos son defectuosos?
Solución Sea X la variable aleatoria que representa el número de artı́culos defectuosos
en la muestra seleccionada.
1. Para n = 10 y p = 0.2, entonces la función de probabilidad de está dada por:
 
10
PX (X = x) = 0.2x 0.810−x , donde x = 0, 1, 2, · · · n y q = 1 − p
x

y la función de distribución acumulada


10  
X 10
F (x0 ) = PX (X ≤ x0 ) = 0.2x 0.810−x
x
x=0

Las cuales también se puede representar mediante la siguiente tabla.

X=x PX (X = x) F (x0 )
0 0.1074 0.1074
1 0.2684 0.3758
2 0.3020 0.6778
3 0.2013 0.8791
4 0.0881 0.9672
5 0.0264 0.9936
6 0.0055 0.9998
7 0.0008 0.9999
8 0.0001 1
9 0.0000 1

Humberto Barrios - hbarrios@unicesar.edu.co


3.4 Distribución Binomial 59

2. La probabilidad de que exactamente tres artı́culos son defectuosos entre los 10


seleccionados es:

PX (X = 4) = 0.2013.

3. La probabilidad de que 4 o más artı́culos son defectuosos entre los 10 seleccionados


es:

PX (X ≥ 4) = 1 − F (3)
= 1 − 0.8791 = 0.1209.

4. La probabilidad de rechazar el lote de 10 artı́culos si se tienen tres o más artı́culos


son defectuosos es

PX (X ≥ 3) = 1 − PX (X ≤ 2)
= 1 − 0.6778 = 0.3222.

Teorema 3.4.1 Sea una variable aleatoria X que tiene una distribución binomial con
parámetros n y p. Entonces

n  
X n
px q n−x = 1 (3.3)
x
x=0
E(X) = np (3.4)
V (X) = npq (3.5)
t n
MX (t) = (pe + q) (3.6)

Demostración. 1. Debemos demostrar que


X
PX (x) = 1
x=0

Por definición y el teorema del Binomio de Netown, entonces

∞ n  
X X n
PX (x) = px q n−x
x
x=0 x=0
= (p + q)n = 1

2. Por la definición de valor esperado para una variable aleatoria discreta,

Humberto Barrios - hbarrios@unicesar.edu.co


60 Capı́tulo 3. Variables Aleatorias Discretas


X
E(X) = xPX (x)
x=0
n  
X n x n−x
= x p q
x
x=0
n
X xn!
= px q n−x
(n − x)!x!
x=0
n
X xn!
= px q n−x
(n − x)!(x − 1)!
x=1
n−1
X n(n − 1)!
= py+1 q n−(y+1)
(n − (y + 1))!y!
y=0
n−1
X n(n − 1)!
= py+1 q (n−1)−y
(n − 1) − y)!y!
y=0
n−1
X (n − 1)!
= np py q (n−1)−y
(n − 1) − y)!y!
y=0

= np(p + q)n−1 = np

3. Para calcular la varianza de la variable aleatoria X, hallemos el segundo momento,


es decir:


X
E(X 2 ) = x2 PX (x)
x=0
n  
X
2 n x n−x
= x p q
x
x=0
n
X x2 n!
= px q n−x
(n − x)!x!
x=0
n
X xn!
= px q n−x
(n − x)!(x − 1)!
x=1
n−1
X n(n − 1)(y + 1)! y+1 n−(y+1)
= p q
(n − (y + 1))!y!
y=0
n−1
X (n − 1)!(y + 1) y (n−1)−y
= np p q
(n − 1) − y)!y!
y=0
n−1
X y(n − 1)!
= np py q (n−1)−y
(n − 1) − y)!y!
y=0
n−1 
X (n − 1)!
+ py q (n−1)−y
(n − 1) − y)!y!
y=0

Humberto Barrios - hbarrios@unicesar.edu.co


3.5 Distribución Poisson 61

Por lo tanto

E(X 2 ) = np[(n − 1)p + 1] = np[np − p + 1] = np[np + q] = n2 p2 + npq

Puesto que V (X) = E(X 2 ) − [E(X)]2 ), se tiene que

V (X) = E(X 2 ) − [E(X)]2 ) = n2 p2 + npq − n2 p2 = npq


4. En el capitulo anterior se encontró la función generatriz de una variable aleatoria
binomial.


En el ejemplo anterior, el número de artı́culos defectuosos que esperamos estén en el


lote de 10 es: E(X) = np = 10(0.20) = 2.

3.5 Distribución Poisson


Definición 3.5.1 Sea X una variable aleatoria que representa el número de eventos
independientes sobre el tiempo o el espacio. Se dice entonces que tiene distribución
Poisson con función de probabilidad dada por:
( x −λ
λ e
x! donde x = 0, 1, 2, · · ·
PX (X = x) =
0, en otro caso
Donde λ es el número promedio de resultados posibles por unidad de tiempo o espacio
y e = 2.71828 . . ..

Si una variable aleatoria X que tiene una distribución Poisson con parámetro λ, nota-
remos X ∼ P [λ].

La probabilidad que una variable aleatoria sea menor o igual a un valor determinado
x0 , se especifica por la función de distribución acumulada,
x0
X λx e−λ
F (x0 ) = PX (X ≤ x0 ) =
x!
x=0
 Ejemplo 3.7 El número de componentes que fallan antes de cumplir 100 horas de
operación es un variable aleatoria de Poisson. Si el número promedio de ésta es ocho:
1. Hallar la función de probabilidad y distribución acumulada para los primeros 6
valores de la variable aleatoria X que falle un componentes en 25 horas.
2. Cuál es la probabilidad de que falle un componentes en 25 horas?
3. Cuál es la probabilidad de que fallen no más de dos componentes en 50 horas?
4. Cuál es la probabilidad de que fallen por lo menos diez componentes en 125 horas?

Solución Sea X la variable aleatoria que representa el número componentes que fallan
antes de cumplir 100 horas en la muestra seleccionada. Si el número promedio en la 100
horas es λ = 8. Entonces
1. Para 25 horas esperamos λ = 2, entonces la función de probabilidad de X está
dada por:

2x e−2
PX (X = x) = ; donde x = 0, 1, 2, · · ·
x!

Humberto Barrios - hbarrios@unicesar.edu.co


62 Capı́tulo 3. Variables Aleatorias Discretas

Por lo tanto en la siguiente tabla se muestra la función de probabilidad y distri-


bución acumulada para los primero 6 valores de la variable aleatoria X

X=x PX (X = x) F (x)
0 0.1353 0.1353
1 0.2707 0.4060
2 0.2707 0.6767
3 0.1804 0.8571
4 0.0902 0.9473
5 0.0361 0.9834
2. La probabilidad de que falle un componentes en 25 horas es:

2x e−2
PX (X = 1) = = 0.2707
x!
3. Para 50 horas esperamos λ = 4, entonces la función de probabilidad de X está
dada por:
4x e−4
PX (X = x) = ; donde x = 0, 1, 2, · · ·
x!

En consecuencias, la probabilidad de que fallen no más de dos componentes en 50


horas es:

PX (X ≤ 2) = 0.0183 + 0.0733 + 0.1465


= 0.2381.

4. Para 125 horas esperamos λ = 10, entonces la función de probabilidad de X está


dada por:
10x e−10
PX (X = x) = ; donde x = 0, 1, 2, · · ·
x!
Por lo tanto en la siguiente tabla se muestra la función de probabilidad y la función
de distribución acumulada para los primeros 10 valores de X

X=x PX (X = x) F (x)
0 0 0.0000
1 0.0005 0.0005
2 0.0023 0.0028
3 0.0076 0.0103
4 0.0189 0.0293
5 0.0378 0.0671
6 0.0631 0.1301
7 0.0901 0.2202
8 0.1126 0.3328
9 0.1251 0.4579

En consecuencias, la probabilidad de que fallen por lo menos 10 componentes en


125 horas es:

PX (X ≥ 10) = 1 − PX (X ≤ 9) = F (10)
= 1 − 0.4579 = 0.5421.

Humberto Barrios - hbarrios@unicesar.edu.co


3.5 Distribución Poisson 63

Teorema 3.5.1 Sea una variable aleatoria X que tiene una distribución Poisson con
parámetro λ. Entonces


X λx e−λ
=1 (3.7)
x!
x=0
E(X) = λ (3.8)
V (X) = λ (3.9)
λ(et −1)
MX (t) = e (3.10)

Demostración. Para demostrar el teorema es suficiente considerar el desarrollo en serie


de Taylor de eλ , es decir,

λ
X λx
e =
x!
x=0

Los detalles debe elaborarlo el estudiante como un ejercicio.




La distribución de Poisson también es una forma limite de la distribución binomial


cuando n → ∞ y p → 0 . Este resultado se demuestra en el siguiente teorema.

Teorema 3.5.2 Sea una variable aleatoria que tiene una distribución binomial, con
parámetros n y p. Entonces

n x n−x λx e−λ
 
PX (X = x) = lı́m p q =
n→∞ x x!

Donde λ = np.

Demostración. Comencemos escribiendo la función de densidad de la probabilidad bi-


nomial en términos de λ:

  x 
λ n−x
  
n x n−x n λ
lı́m p q = lı́m 1−
n→∞ x n→∞ x n n
λ −x λ n
    
n! x 1
= lı́m λ 1− 1− (3.11)
n→∞ (n − x)!x! nx n n

Pero sabemos que

λ n
 
lı́m 1 − = e−λ (3.12)
n→∞ n

Por otro lado nótese,

Humberto Barrios - hbarrios@unicesar.edu.co


64 Capı́tulo 3. Variables Aleatorias Discretas

n! n(n − 1)(n − 2) · · · (n − x + 1)
x
=
(n − x)(n − λ) (n − λ)(n − λ)(n − λ) · · · (n − λ)

Ası́, dividiendo por n y tomado limite a la anterior expresión,

n! 1 1 − 1/n (1 − 2/n)
lı́m = lı́m lı́m lı́m
n→∞ (n − x)(n − λ)x n→∞ (1 − λ/n) n→∞ (1 − λ/n) n→∞ (1 − λ/n)
(1 − (x − 1)/n)
· · · lı́m =1 (3.13)
n→∞ (1 − λ/n)

Reemplazando 3.13 y 3.12 en 3.11 se obtiene lo que se desea demostrar. 

En la tabla siguiente se comparan las probabilidades binomial y de Poisson

100 1x e−1
(0.01)x (0.99)100−x

X=x x x!
0 0.366032 0.367879
1 0.369730 0.367879
2 0.184865 0.183940
3 0.060999 0.061313
4 0.014941 0.015328
5 0.002897 0.003065
6 0.000463 0.000510
7 0.000062 0.000072
8 0.000007 0.000009
9 0.000000 0.000001
10 0.000000 0.000000

Un buena aproximación de la distribución binomial a la de Poisson se obtiene cuando


p < 0.1 y n → ∞.

3.6 Distribución Geométrica


Definición 3.6.1 Sea X una variable aleatoria que representa el número de pruebas
necesarias hasta obtener el primer éxito, donde cada prueba es independiente y la
probabilidad de un éxito es p y de un fracaso es 1 − p, cada vez que el experimento
se lleva acabo. Se dice entonces que X tiene distribución Geométrica con función de
probabilidad dada por:
(
pq x−1 , donde x = 1, 2, 3, · · · y q = 1 − p
PX (X = x) =
0, en otro caso

Si una variable aleatoria X que tiene una distribución geométrica con parámetro p,
notaremos X ∼ G[p].

La probabilidad que una variable aleatoria X sea menor o igual a un valor determinado
x0 , se especifica por la función de distribución acumulada,

Humberto Barrios - hbarrios@unicesar.edu.co


3.6 Distribución Geométrica 65

x0
X
F (x0 ) = PX (X ≤ x0 ) = pq x−1
x=1

Teorema 3.6.1 Sea una variable aleatoria X que tiene una distribución Poisson con
parámetro p. Entonces


X
pq x−1 = 1 (3.14)
x=1
1
E(X) = (3.15)
p
1−p
V (X) = (3.16)
p2
pet
MX (t) = (3.17)
1 − (1 − p)et

Demostración. Las pruebas de (a), (b) y (d) las dejaremos como ejercicios.

Demostremos (c) teniendo en cuenta la siguiente igualdad:

E(X 2 ) = E(X(X − 1)) + E(X)


Por definición,

X
E(X(X − 1)) = x(x − 1)PX (x)
x=1

Ası́ que

X ∞
X
E(X(X − 1)) = x(x − 1)pq x−1 = pq x(x − 1)pq x−2
x=1 x=2

si y = x − 1, entonces

X
E(X(X − 1)) =pq (y + 1)yq y
y=1
∞ ∞
d2 X y+1
X 
y−1
=pq (y + 1)yq = pq 2 q
dq
y=1 y=1

d2
 X 
2
=pq 2 q q y−1
dq
y=1

pero la serie

Humberto Barrios - hbarrios@unicesar.edu.co


66 Capı́tulo 3. Variables Aleatorias Discretas


X 1
qy =
1−q
y=0

esto conduce a la ecuación

d2 q2
 
E(X(X − 1)) = pq
dq 2 1−q

derivando dos veces a E(X(X − 1)) con respecto a q, tenemos


2q
E(X(X − 1)) =
p2

Puesto que E(X 2 ) = E(X(X − 1)) + E(X) entonces


2q 1 2q + p
E(X 2 ) = 2
+ =
p p p2

Ası́,
2q + p 1 1−p
V (X) = − 2 =
p2 p p2

 Ejemplo 3.8 Supóngase que el 10 % de los motores fabricados en determinada lı́nea
de montaje son defectuosos. Si se seleccionan aleatoriamente los motores, uno a la vez,
para su prueba. Calcular las siguientes probabilidades:
1. El primer motor defectuoso se encuentre en el segundo intento.
2. El primer motor defectuoso se encuentre en el quinto intento.
3. El primer motor defectuoso se encuentre en o antes del quinto intento.
4. Calcular el promedio y la varianza del número de la inspección en la cual se
encuentre en el primer motor defectuoso.
Solución Sea X la variable aleatoria número intentos hasta tener el primer motor
defectuoso, es claro que esta es una variable aleatoria con distribución Geométrica con
parámetro p = 0.10. Por lo tanto, la función de probabilidad es

PX (X = x) = (0.1)(0.9)x−1 , donde x = 1, 2, 3, · · · y q = 1 − p

En la siguiente tabla se muestra la función de probabilidad y función de distribución


acumulada para los primeros 10 valores de la variable aleatoria X

X=x PX (X = x) F (x)
1 0.1000 0.1000
2 0.0900 0.1900
3 0.0810 0.2710
4 0.0729 0.3439
5 0.0656 0.4095
6 0.0590 0.4686
7 0.0531 0.5217
8 0.0478 0.5695
9 0.0430 0.6126
10 0.0387 0.6513

Humberto Barrios - hbarrios@unicesar.edu.co


3.7 Distribución Binomial Negativa 67

Por lo tanto
1. La probabilidad que el primer motor no defectuoso se encuentre en el segundo
intento,

PX (X = 2) = (0.1)(0.9)2−1 = 0.0810
2. La probabilidad que el primer motor no defectuoso se encuentre en el quinto
intento,

PX (X = 5) = (0.1)(0.9)5−1 = 0.0590
3. La probabilidad que el primer motor no defectuoso se encuentre en o antes del
quinto intento,
5
X
F (5) = PX (X ≤ 5) = (0.1)(0.9)x−1 = 0.4686
x=1
4. El promedio y la varianza del número de la inspección en la cual se encuentre en
el primer motor no defectuoso son:
1 1
E(X) = = = 10
p 0.1

y
1−p 0.9
V (X) = 2
= = 90
p (0.1)2

respectivamente.


3.7 Distribución Binomial Negativa


Definición 3.7.1 Sea X una variable aleatoria Binomial con probabilidad de éxito p
y donde X, es el número de pruebas necesarias hasta obtener exactamente r éxitos.
En este caso, se dice que la variable aleatoria X tiene distribución Binomial Negativa
con función de probabilidad dada por:

 
  x = r, r + 1, r + 2, · · ·

 x − 1 pr q x−r , donde r = 1, 2, 3, · · ·



PX (X = x) = r−1 
0≤p≤1 y q =1−p
 



0, en otro caso

Si una variable aleatoria X que tiene una distribución binomial negativa con parámetros
r y p, en donde r no se requiere que sea un entero positivo, notaremos X ∼ BN [r, p].
La probabilidad que una variable aleatoria X sea menor o igual a un valor deter-
minado x0 , se especifica por la función de distribución acumulada,
X x − 1
F (x0 ) = PX (X ≤ x0 ) = pr q x−r
r−1
x≤x0

Humberto Barrios - hbarrios@unicesar.edu.co


68 Capı́tulo 3. Variables Aleatorias Discretas

Teorema 3.7.1 Sea una variable aleatoria X que tiene una distribución binomial ne-
gativa con parámetros r y p. Entonces

∞  
X x − 1 r x−r
p q =1 (3.18)
r−1
x=0
r
E(X) = (3.19)
p
r(1 − p)
V (X) = (3.20)
p2
h pet ir
MX (t) = (3.21)
1 − qet

Teorema 3.7.2 Sea X una variable aleatoria que tiene una distribución Binomial Ne-
gativa con parámetros r y p. Entonces

FBN (x) = PX (X ≤ x) = 1 − FB (y) = PY (Y ≥ y)

en donde Y es una variable aleatoria Binomial con parámetros n = r + x y p.

 Ejemplo 3.9 Una empresa de reclutamiento encuentra que el 30 % de los aspirantes

para determinado puesto en la industria tiene conocimiento avanzado de programación.


Supóngase que se tienen tres puestos en los que se necesitan conocimientos avanzados
de programación.

1. Encontrar la función de probabilidad de la variable aleatoria, número de aspirantes


hasta obtener tres que tengan conocimiento avanzado en programación.
2. Se entrevistan uno a uno los solicitantes, calcular la probabilidad de encontrar un
aspirante en la quinta entrevista.

Solución Supóngase que las entrevistas son independientes, y que la probabilidad de


encontrar un candidato con conocimiento avanzado de programación es 0.3, la cual
permanece constante de prueba en prueba. Sea X, número de aspirantes hasta obtener
tres que tengan conocimiento avanzado en programación. Entonces se puede inferir
que X, número de aspirantes hasta obtener tres que tengan conocimiento avanzado en
programación.

1. Entonces se puede concluir que X tiene una distribución binomial negativa, ası́
que la función de probabilidad es:

 
x−1
PX (X = x) = (0.3)3 (0.7)x−1 , r = 3, 4, 5, · · · , 12
2

En la siguiente tabla se muestra la función de probabilidad y función de distribu-


ción acumulada para los primeros 10 valores de la variable aleatoria X

Humberto Barrios - hbarrios@unicesar.edu.co


3.8 Distribución Hipergeométrica 69

X=x PX (X = x) F (x)
3 0.027 0.027
4 0.057 0.084
5 0.079 0.163
6 0.093 0.256
7 0.097 0.353
8 0.095 0.448
9 0.089 0.537
10 0.080 0.617
11 0.070 0.687
12 0.060 0.747
2. De la tabla anterior observamos que
 
4
PX (X = 5) = (0.3)3 (0.7)4 = 0.079
2


3.8 Distribución Hipergeométrica


Definición 3.8.1 Sea N el número total de objetos en una población finita, de manera
tal que R de éstos son de tipo A y N − R - de tipo B. Si se selecciona una muestra
aleatoria simple sin reemplazo n objetos de la población. La probabilidad que exac-
tamente X sean de tipo A, está dado por la función de probabilidad hipergeométrica.
 R N −R
 ( x )( n−x ) , si x = 0, 1, 2, · · · , n.
PX (X = x) = (Nn )
0, en otro caso

y donde x ≤ R yn − x ≤ N − R.

Los parámetros de la distribución hipergeométrica son N , n y R.

La probabilidad que una variable aleatoria Hipergeométrica X sea menor o igual a un


valor determinado x0 ,se especifica por la función de distribución acumulada,

Xx0 R N −R
x n−x
F (x0 ) = PX (X ≤ x0 ) = N

x=0 n

Teorema 3.8.1 Sea una variable aleatoria X que tiene una distribución Hipergeométri-
ca con parámetros N , n y R. Entonces

Humberto Barrios - hbarrios@unicesar.edu.co


70 Capı́tulo 3. Variables Aleatorias Discretas

n R N −R
 
X x n−x
N
 =1 (3.22)
x=0 n
R
E(X) = n (3.23)
N  
R R N −n
V (X) = n 1− (3.24)
N N N −1
t n
MX (t) = (pe + q) (3.25)

 Ejemplo 3.10 Supóngase que se tienen 50 representantes de cierta región del paı́s, a una

convención polı́tica nacional, de los cuales 20 apoyan al candidato A y 30 al candidato


B. Si se seleccionan aleatoriamente 10 representantes. Cual es la probabilidad que entre
estos 10:
1. Exactamente 5 apoyen al candidato A
2. Por lo menos apoyen al candidato A
3. Entre dos y cinco inclusive apoyen al candidato A
4. Cuantos representantes esperamos apoyen al candidato A
5. Con que variabilidad se espera que los representantes apoyen al candidato A.
Solución Sea X una variable aleatoria que representa el número de representantes que
apoyen al candidato A; con parámetros N = 50, n = 10 y R = 20. Entonces la función
de probabilidad para la variable aleatoria X es
30
 20 
x 10−x
PX (X = x) = N
 , si x = 0, 1, 2, · · · , 10.
n

Por lo tanto en la siguiente tabla se muestra la función de probabilidad y distribución


acumulada para valores de la variable aleatoria X

X=x PX (X = x) F (x)
0 0.0029 0.0029
1 0.0279 0.0308
2 0.1083 0.1390
3 0.2259 0.3650
4 0.2801 0.6450
5 0.2151 0.8601
6 0.1034 0.9635
7 0.0306 0.9942
8 0.0053 0.9995
9 0.0005 1.0000
10 0.0000 1.0000

Las respuestas para las preguntas:


1. Exactamente 5 apoyen al candidato A:
PX (X = 5) = 0.2801
2. Por lo menos dos apoyen al candidato A:
PX (X ≥ 2) = 1 − F (1) = 1 − 0.0308 = 0.9692

Humberto Barrios - hbarrios@unicesar.edu.co


3.8 Distribución Hipergeométrica 71

3. Entre dos y cinco inclusive apoyen al candidato A:

PX (2 ≤ X ≤ 5) = (0.1083 + 0.2259 + 0.2259 + 0.2801) = 0.8402


4. Cuantos representantes esperamos apoyen al candidato A:

E(X) = 10(30/50) = 6

5. Con que variabilidad se espera que los representantes apoyen al candidato A:


  
20 20 50 − 10
V (X) = 10 1− = 1.6271
50 50 50 − 1
.


La distribución de binomial también es una forma limite de la distribución hiper-


geométrica. Este resultado se demuestra en el siguiente teorema.

Teorema 3.8.2 Sea X una variable aleatoria que tiene una distribución hipergeométri-
ca con parámetros N , n y R . Entonces
R N −R
   
x n−x n x n−x
lı́m N
 = p q
N →∞
n
x

Donde p = R/N.

Demostración. La prueba se deja como un ejercicio 

La función de distribución Binomial aproxima de manera adecuada a la función de


probabilidad Hipergeométrica si n < 0.1N.

En la siguiente tabla se comparan los valores de probabilidad de una Binomial como


limite de una función de probabilidad Hipergeométrica, con N = 1000, n = 10 y R = 50.

X=x Hipergeométrica Binomial


0 0.0009 0.0010
1 0.0095 0.0098
2 0.0434 0.0439
3 0.1168 0.1172
4 0.2057 0.2051
5 0.2473 0.2461
6 0.2057 0.2051
7 0.1168 0.1172
8 0.0434 0.0439
9 0.0095 0.0098
10 0.0009 0.0010

Humberto Barrios - hbarrios@unicesar.edu.co


72 Capı́tulo 3. Variables Aleatorias Discretas

3.9 Ejercicios tener una calificación mayor o


1. Demuestre las siguientes igual a 3.5 e inferior a 4.8?
   igualdades: e) ¿Cuántas preguntas esperamos
n+r−1 n+r−1
a) = responda correctamente?
 r−1  n 
f ) ¿Hallar la varianza y la desvia-
n+r−1 −r
b) = (−1)n ción estándar?
n n
donde (−n)! = (−1)n n!. 4. La probabilidad de que un enfermo se
recupere de un padecimiento gástri-
2. En la Universidad Popular del Cesar co es 0.8. Supóngase que 20 personas
se ha observado que el 60 % de los es- han contraı́do tal afección.
tudiantes que se matriculan lo hacen
a) ¿Cuál es la probabilidad de que
en una carrera de Ciencias, mientras
sobrevivan exactamente 14?
que el otro 40 % lo hacen en carreras
b) ¿Cuál es la probabilidad de que
de Humanidades. Si un determinado
al menos 10 sobrevivan?
dı́a se realizan 20 matrı́culas, calcular
c) ¿Cuál es la probabilidad de que
la probabilidad de que:
al menos 14, pero no más de 18
a) el número de matrı́culas en
sobrevivan?
Ciencias y en Humanidades es
d ) ¿Cuál es la probabilidad de que
igual
al lo más 16 sobrevivan?
b) el número de matrı́culas en
e) Si 100 personas han contraigo la
Ciencias sea menor que en Hu-
afección gástrica. ¿Cuántos es-
manidades
peramos que sobrevivan?
c) al menos 8 estudiantes matrı́cu-
las en Ciencias
d ) no se matriculen más de 12 es- 5. En pruebas realizadas a un amorti-
tudiantes en Ciencias guador para automóvil se encontró
e) Si las cinco primeras matrı́culas que el 20 % presentaban fuga de acei-
son de Humanidades, calcular la te. Si se instalan 20 de estos amor-
probabilidad de que el número tiguadores, hallar la probabilidad de
total de matrı́culas en Ciencias que:
y en Humanidades es igual. a) 4 salgan defectuosos,
b) más de 5 tengan fuga de aceite.
3. Un examen consta de 10 preguntas c) de 3 a 6 amortiguadores salgan
a las que hay que responder sı́ o no. defectuosos.
Suponiendo que a los estudiantes que d ) Determine el promedio y la des-
se le aplica no saben responder a nin- viación estándar de amortigua-
guna de las preguntas y, en conse- dores con defectos.
cuencia, responden de manera alea-
toria. 6. Un ingeniero que labora en el depar-
a) Hallar la función de probabili- tamento de control de calidad de una
dad y la función de distribución empresa eléctrica, inspecciona una
acumulada. muestra al azar de 10 alternadores de
b) ¿Cuál es la probabilidad de pa- un lotes. Si el 15 % de los alternado-
sar el examen si cada punto vale res del lote están defectuosos. Cuál es
0.5? la probabilidad de que en la muestra,
c) ¿Cuál es la probabilidad de ob- a) ninguno esté defectuoso,
tener una calificación mayor o b) uno salga defectuoso,
igual a 4? c) al menos dos salgan defectuosos
d ) ¿Cuál es la probabilidad de ob- d ) más de tres estén con defectos

Humberto Barrios - hbarrios@unicesar.edu.co


3.9 Ejercicios 73

10. El número de componentes que fallan


7. Un sistema de protección contra antes de cumplir 100 horas de opera-
cohetes está construido con n unida- ción es una variable aleatoria de Pois-
des de radar que funcionan indepen- son. Si el número promedio de éstas
dientemente, cada una con probabili- es ocho:
dad de 0.9 de detectar un cohete que a) ¿Cuál es la probabilidad de que
ingrese en la zona que cubren todas falle una componente en 25 ho-
las unidades. ras?
a) Si n = 5 y un cohete entra en b) ¿Cuál es la probabilidad de que
la zona. ¿Cuál es la probabili- fallen no más de dos componen-
dad de que exactamente cuatro tes en 50 horas?
unidades detecten el cohete? c) ¿Cuál es la probabilidad de que
b) Si n = 5 y un cohete entra en la falle por lo menos diez compo-
zona. ¿Cuál es la probabilidad nentes en 125 horas?
de que al menos una unidades
detecten el cohete? 11. Mediante estudios reciente se ha de-
c) ¿Cuál debe ser el valor de n para terminado que la probabilidad de
que la probabilidad de detectar morir por causa de cierta vacuna pa-
el cohete al entrar a la zona, sea ra la gripe es de 0.00002. Si se ad-
de 0.999? ministra la vacuna a 100.000 perso-
nas y si suponemos que esta constitu-
8. Un fabricante de cera para pisos yen un conjunto de ensayos indepen-
desarrolla dos productos nuevos, A y dientes: (Sugerencia: haga λ = np =
B, que desea someter a la evolución (100.000)(0.00002) = 20 y aplique la
de amas de casa para determinar cuál distribución de Poisson).
es la mejor. Las dos ceras, A y B, se a) ¿Cuál es la probabilidad de que
aplica en los pisos de 15 casas. Se su- mueran no más de dos personas
pone que en realidad no hay diferen- a causa de la vacuna?
cia en calidad entre las dos marcas. b) ¿Cuál es la probabilidad de que
a) ¿Cuál es la probabilidad de que mueran exactamente cinco de
10 o más amas de casa vayan a las personas a causa de la va-
preferir la marca A? cuna?
b) ¿Cuál es la probabilidad de que c) ¿Cuál es la probabilidad de que
10 o más amas de casa vayan a mueran ninguna de las personas
preferir la marca A o B? a causa de la vacuna?
d ) ¿Cuántas personas esperamos
9. En un almacén en particular los se mueran, de las 100.000, a cau-
clientes llegan al mostrador de caja, sa de la vacuna?
conforme una distribución de Poisson
con un promedio de siete por hora. 12. Sea X una variable aleatoria bino-
En una hora dada. mial. Para n = 20, calcular las pro-
a) ¿Cuál es la probabilidad de que babilidades puntuales binomiales y
no lleguen más de tres clientes? compararlas con las correspondien-
b) ¿Cuál es la probabilidad de que tes probabilidades de Poisson para
lleguen al menos dos clientes? p =0.5, 0.3, 0.1 y 0.01. (Sugerencia:
c) ¿Cuál es la probabilidad de que haga λ = np)
lleguen exactamente cinco clien-
tes? 13. Un lote de televisores está formado
por 5 TV a color (3 de la marca A

Humberto Barrios - hbarrios@unicesar.edu.co


74 Capı́tulo 3. Variables Aleatorias Discretas

y 2 de la marca B) y 6 TV blanco especie A (asuma que el método de


y negro (4 de la marca A y 2 de la captura utilizado por el investigador
marca B). Si se seleccionan sin reem- es igualmente efectivo para con todas
plazo un grupo de 3 TV. Hallar la las especies).
probabilidad de: a) ¿Cuál es la probabilidad de que
a) Seleccionar 2 TV de la marca B. el investigador realice solamente
b) Seleccionar 2 TV de la marca A 10 extracciones?
o 2 TV a color. b) Para la v.a. definida en la parte
(a), calcule el valor esperado e
14. La probabilidad de un lanzamiento interpretarlo.
exitoso es igual a 0.8. Supongamos c) Suponga que en el lago solo hay
que se hacen ensayos de lanzamientos 50 peces, 10 de los cuales son de
hasta que han ocurrido 3 lanzamien- la especie A.
tos exitosos. d ) ¿Cuál es la probabilidad de que
a) ¿Cuál es la probabilidad de que en 10 extracciones se obtengan
sean necesarios 6 ensayos? 3 de la especie A?
b) Suponga que se hacen los ensa- e) Bajo los supuestos de la pregun-
yos de lanzamientos hasta que ta (c), ¿cuál es la probabilidad
ocurren 3 lanzamientos exitosos de que sean necesarias 10 ex-
consecutivos. Responda la pre- tracciones para obtener 3 de la
gunta (a) en este caso. especie A?
c) Suponga que cada uno de los
ensayos de lanzamiento cuesta 17. Supóngase que el número de acciden-
$5000. Además, un lanzamien- tes en una fábrica se puede represen-
tos que fracase produce un cos- tar por un proceso de Poisson con un
to adicional de $500. Calcule el promedio de 2 accidentes por sema-
costo esperado para obtener los na.
3 lanzamientos exitosos. a) Encuentre la distribución de
probabilidades de la variable
15. Para un experimento médico se re- aleatoria tiempo hasta que ocu-
quieren cinco mujeres que hayan te- rra un nuevo accidente.
nido seis o más partos. La propor- b) ¿Cuál es la probabilidad de que
ción de mujeres adultas con esa ca- el tiempo entre un accidente y el
racterı́stica es 0.25. Suponga que se siguiente sea mayor de 3 dı́as?
toma una muestra de mujeres adultas c) Cuál es la probabilidad de que el
y sea N el número de mujeres adul- tiempo hasta que ocurran cinco
tas que es necesario entrevistar para accidentes sea mayor a 2 sema-
encontrar las cinco buscadas. nas?
a) cuál es el modelo apropiado pa- d ) Si ocurrió un accidente en el
ra la distribución de N ? tiempo 0, y un dı́a después aún
b) cuál es la probabilidad de que no ocurre otro, ¿cuál es la pro-
en diez o menos intentos se en- babilidad de que pasen dos dı́as
cuentren las cinco mujeres? más y aún no halla ocurrido el
siguiente accidente?
16. El 20 % de los peces de un lago son
de la especie A y el resto de otras es- 18. Las lı́neas telefónicas que entran a
pecies. Un investigador decide reali- una oficina de reservaciones de ae-
zar el siguiente experimento: Extraer rolı́neas están ocupadas un 60 % del
peces del lago hasta obtener 3 de la tiempo.

Humberto Barrios - hbarrios@unicesar.edu.co


3.9 Ejercicios 75

a) Si usted habla en esa oficina, distribución acumulada e inter-


¿cuál es la probabilidad que le prete
respondan en la primera llama- b) el valor esperado y la desviación
da? ¿En la segunda? ¿En la ter- estándar e interprete.
cera?
b) Si usted y un amigo deben hacer 21. Los procedimientos de muestreo para
llamadas separadas a esta ofici- aceptar lotes en una empresa manu-
na, ¿cuál es la probabilidad de faturera electrónica requiere el mues-
que deban hacer un total de cua- treo de n artı́culos de un lote de N
tro intentos para lograr las dos artı́culos, y aceptar el lote si X ≤ c,
llamadas? donde X es el número de artı́culos de-
fectuosos en la muestra. Para un lote
19. Un electrodoméstico se vende en dos de 20 cubiertas de impresoras, se de-
colores, blanco y café, y tiene igual be mostrar 5. Calcular de aceptar el
demanda. Un vendedor tiene tres lote si c = 1, y si el número real de
electrodomésticos de cada color en cubiertas defectuosas en el lote es:
existencia, aunque esto no lo saben a) X = 0, 1, 2, 3, 4
los clientes. Dichos clientes llegan y b) Responder la anterior pregunta
piden en forma independiente estos se c = 2.
electrodomésticos. Calcular la proba-
bilidad de que 22. De cada 2.000 tornillos fabricados
a) el quinto cliente pida el tercer por una determinada máquina hay 2
blanco defectuosos. Para realizar el control
b) el quinto cliente se lleve el tercer de calidad se observan 150 tornillos
café y se rechaza el lote si el número de
c) se piden todos los blancos antes defectuosos es mayor que 1. Calcular
del primer café la probabilidad de que el lote sea re-
d ) se pidan todos los blancos antes chazado.
que se agoten los café.
23. En pruebas realizadas a un amorti-
20. Se definen los requisitos peor de los guador para automóvil se encontró
casos como objetivos de diseño de que el 20 % presentaban fuga de acei-
una marca de terminales de compu- te. Si se instalan 20 de estos amor-
tadora. Una prueba preliminar rápi- tiguadores, hallar la probabilidad de
da indica que 4 de 10 terminales no que:
pasan la prueba del peor de los ca- a) 4 salgan defectuosos,
sos. Se seleccionan 5 de los 10, en b) más de 5 tengan fuga de aceite.
forma aleatoria, para pruebas poste- c) de 3 a 6 amortiguadores salgan
riores. Sea X la variable aleatoria el defectuosos.
numero, entre las 5 terminales, que d ) Determine el y la desviación
no pasan la prueba preliminar. Cal- estándar de amortiguadores con
cular: defectos.
a) la función de probabilidad y de

Humberto Barrios - hbarrios@unicesar.edu.co