(2012) SOSA, J. C. Et Al. - Estadística Descriptiva y Probabilidades PDF

Estadística descriptiva
y
probabilidades
y
probabilidades
Juan Camilo Sosa Martínez

Luis Eduardo Ospina Forero
Emilio Pablo Berdugo Camacho
Universidad Externado de Colombia

Departamento de Matemáticas
Bogotá, D.C.
2.012
Dedicatoria
Juan Camilo:
A mi querida familia: Elsi, Nani y Gonza.
A mi querida Yenny Paola y su hermoso Pollito.
A mis queridos Maestros.
Sin su Amor y su Apoyo este libro jamás hubiera sido posible.
Luis Eduardo:
Con mucho amor para las mujeres mas importantes en mi vida: Lolita,
Leito, Marcela y Alejandra.
Emilio Pablo:
A mis antiguos y futuros estudiantes.

Estadística descriptiva y probabilidades
© Juan Camilo Sosa Martínez
Docente investigador
© Luis Eduardo Ospina Forero

Estudiante de maestría en Ciencias-Estadística
Facultad de Ciencias
Departamento de Estadística
Universidad Nacional de Colombia
© Emilio Pablo Berdugo Camacho

Docente catedrático
Departamento de Estadística
Universidad Nacional de Colombia
Estadístico, egresado de Maestría en Ciencias-Estadística de la Universidad Nacional de Colombia
con trabajo de tesis distinguido con Mención Laureada, interesado primordialmente en la docencia
y la investigación. Es autor de artículos publicados en la Revista Colombiana de Estadística y ha
sido expositor en eventos nacionales e internacionales de estadística. En la Universidad Externado de
Colombia ha colaborado con las Facultades de Administración de Empresas, Finanzas, Gobierno y
Relaciones Internacionales, Contaduría Pública, Economía y Administración de Empresas Turísticas
y Hoteleras; y en la Universidad Nacional de Colombia, con las Facultades de Ciencias, Ciencias
Humanas, Ingeniaría y Odontología. Sus principales intereses en investigación están orientados hacia el
modelamiento estadístico, especícamente el análisis de datos longitudinales, la estadística matemática
y la pedagogía encaminada a la formación de pensamiento estadístico. Actualmente es miembro del
grupo de estadística aplicada en investigación experimental, industria y biotecnología y desempeña
su labor investigativa como estudiante de doctorado en la Universidad de California, Santa Cruz
(University of California, Santa Cruz ).
Luis Eduardo Ospina Forero

Estadístico egresado de la Universidad Nacional de Colombia e interesado principalmente en el mo-
delamiento de variables latentes y modelamiento de redes nancieras y biológicas, actualmente esta
realizando estudios de doctorado en estadística en la Universidad de Oxford (University of Oxford,
United Kingdom ). Anteriormente fue miembro del grupo de investigación en Bioestadística en la Uni-
versidad nacional de Colombia, en el cual publicó varios proyectos en ponencias nacionales e interna-
cionales y revistas indexadas sobre la inferencia funcional de genes mediante métodos de clasicación.
Los campos en los que actualmente se encuentra investigando son la extensión de modelos de teoría
de respuesta al ítem para el modelamiento del riesgo, la predicción funcional de genes mediante datos
y la interacción de los anteriores bajo la perspectiva de redes.
Emilio Pablo Berdugo Camacho

Licenciado en Matemáticas y Física de la Universidad del Atlántico (Barranquilla), Magister en
Ciencias-Estadística de Universidad Nacional de Colombia. Ha trabajado en el ejercicio de la docencia
en la Universidad Nacional de Colombia, la Universidad Autónoma de Colombia y la Universidad San-
to Tomás orientando cursos en los programas de Ingeniería, Física, Biología, Sicología, Trabajo Social,
Enfermería, Economía, Administración, Contaduría, Cultura Física, especializaciones en Estadística
y Gerencia Empresarial y Maestría en Didácticas de las Ciencias entre otros. Sus intereses académicos
se orientan hacía la pedagogía y la didáctica de la Estadística y la Física, así como los modelos de
para el análisis de datos longitudinales.
Agradecimientos
Declaro mi profundo agradecimiento a la Universidad Externado de Colombia, por acogerme como

docenteinvestigador durante todos estos años; a todos los integrantes del Departamento de Mate-
máticas de la Universidad Externado de Colombia, pues de algún modo u otro han contribuido en
mi formación académica y personal. En especial, al Profesor Jorge Arias y a la Doctora Luz Mary
Huérfano, por sus valiosos comentarios y aportes; y a la Profesora Sandra Ivón Castillo Lemus y Clara
Inés Ramírez Montegro por su constante entrega, motivación y apoyo.
También resalto mi innita gratitud a mis maestros y mis colegas. Particularmente, al Profesor Luis
Guillermo Díaz Monroy y al Profesor Luis Alberto López Pérez, profesores de la Universidad Nacional
de Colombia, quienes sirvieron como evaluadores de este libro y lo enriquecieron en gran medida; y
a los co-autores de este libro, Luis Eduardo Ospina Forero y Emilio Pablo Berdugo Camacho, sin
quienes este libro no hubiera sido posible.
Finalmente, maniesto que este libro no hubiera sido posible sin la colaboración de todos los que
alguna vez fueron mis estudiantes, cuyas criticas hicieron de este libro lo que es hoy. Este libro es para
Ustedes y todos los que en algún momento quieran estudiar la Realidad.
A todos Ustedes, ½innitas gracias!

juan.sosa@externado.edu.co
jcsosam1983@gmail.com
2013
6
Resumen
Este libro de texto es el resultado de dos años extensivos de investigación en la Universidad Externado
de Colombia, y no ha sido presentado previamente en esta Universidad u otras. Este libro contiene los
resultados obtenidos en investigaciones llevadas a cabo en el Departamento de Matemáticas, durante
el período comprendido entre julio de 2010 y diciembre de 2012, como resultado de la orientación
repetida de cursos de estadística en diversas facultades de la Universidad.
Este libro está dirigido a todos aquellos que se quieran adentrar en el estudio de la realidad tal
como es por medio de los métodos estadísticos clásicos. Este texto fue concebido primordial mente
para estudiantes de pregrado de Administración, Economía, Finanzas y otras carreras anes, que de
alguna forma necesiten apropiarse los conceptos indispensables para adquirir seguridad y destreza en
la aprehensión de los fundamentos que sustentan los métodos estadísticos y sus aplicaciones, que se
estudian en variados espacios académicos anes.
Así, se quiere dotar al lector de elementos que le permitan entender, analizar y hacer una evalua-
ción crítica de documentos y publicaciones especializados, relacionados con la toma de decisiones;
familiarizar al interesado con los conceptos básicos de probabilidad y las distribuciones probabilísti-
cas más comunes; y por último, presentar aplicaciones de la estadística descriptiva y de teoría de la
probabilidad en casos prácticos.
La primera parte del libro, está dedicada a todas las medidas y técnicas estadísticas relacionadas con
la descripción de la información, con el n de hacer un diagnostico de alguna realidad que se quiera
conocer para que pueda ser entendida y/o intervenida concienzudamente. Si este es el caso, el lector
deberá tener ciertos conceptos básicos de álgebra y aritmética, que se presentan con cierto detalle en
el apéndice A. En esta primera parte del texto, se ofrecen herramientas indispensables para describir
conjuntos de datos en los que se quiera precisar su tendencia (capítulos 2 y 3), su variabilidad (capítulo
4), su distribución (capítulo 5) y la relación que puedan tener con otras variables relacionadas (capitulo
6).
7
8
Una vez se tengan las herramientas descriptivas y se quiera profundizar en una realidad con mayor
detenimiento por medio de un modelo formal, en la segunda parte del libro se presentan todos los
métodos fundamentales para tratar variables con ciertos diseños asumidos por el investigador. Para
esto es necesario que el lector tenga los conatos básicos del cálculo diferencial y del cálculo integral, que
en cualquier caso, de olvido o desconociendo, se presentan en el apéndice C. Por tal motivo, se presentan
todas las herramientas necesarias para abordar con precisión el estudio de las características de una
variable asociadas con la incertidumbre de ciertos eventos (capítulo 7), los parámetros de tendencia y
variabilidad (capítulo 8), los posibles modelos probabilísticos que enmarquen sus rasgos (capítulos 9
y 10) y las posibles relaciones con otras variables (capítulo 11).
Contenido
Figuras xvi
Tablas xx
I Estadística descriptiva 1
1. Elementos generales 1
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Formas del saber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3. ¾Qué es estadística? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4. Clasicación de la estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5. Algunos términos importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.6. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.7. Medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.8. La investigación estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
i
ii CONTENIDO
1.9. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.10. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2. Tablas y grácas estadísticas 18
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2. Tablas estadísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1. Tablas para variables cualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.2. Tablas para variables cuantitativas . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3. Grácas estadísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.1. Grácos para variables cualitativas . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2. Grácos para variables cuantitativas . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.3. Sobre los grácos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3. Medidas de tendencia central y de posición 41
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2. Medidas estadísticas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2.1. La media aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2.2. La media aritmética ponderada . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2.3. La mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.4. La moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2.5. La media geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

CONTENIDO iii
3.2.6. La media armónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.3. Medidas de posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.3.1. El rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.3.2. Los percentiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.3.3. Los cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.4. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4. Medidas de dispersión 64
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2. El rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.3. El rango intercuartílico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.4. Diagrama de caja y bigotes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.5. La desviación de un dato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.6. La varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.7. La desviación estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.8. Estandarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.9. Teorema de Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.10. El Coeciente de variación de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.11. Otras medidas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.12. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.13. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
iv CONTENIDO
5. Medidas de forma 91
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.2. Medidas de asimetría . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.2.1. Inspección de las medidas de tendencia central . . . . . . . . . . . . . . . . . . 92
5.2.2. El coeciente de asimetría de Pearson . . . . . . . . . . . . . . . . . . . . . . . 94
5.2.3. El coeciente de asimetría de Fisher . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2.4. El índice de asimetría de Yule-Bowley . . . . . . . . . . . . . . . . . . . . . . . 98
5.3. Medidas de apuntamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.4. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6. Medidas descriptivas para dos variables 104
6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.2. Tablas de doble entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
6.3. Perles o distribuciones condicionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.4. Grácas para dos variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.5. Medidas de asociación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
6.5.1. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
6.5.2. Coeciente de correlación de Pearson . . . . . . . . . . . . . . . . . . . . . . . . 119
6.5.3. Coeciente de correlación de Spearman . . . . . . . . . . . . . . . . . . . . . . 122
6.5.4. Coeciente de correlación de Kendall . . . . . . . . . . . . . . . . . . . . . . . . 123
6.5.5. Coeciente de Gini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

CONTENIDO v
6.6. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
6.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
II Probabilidades 138
7. Fundamentos de probabilidad 139
7.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
7.2. Experimentos determinísticos y experimentos aleatorios . . . . . . . . . . . . . . . . . 139
7.3. Espacios muestrales y eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
7.4. Operaciones con eventos aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
7.5. Asignación de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
7.5.1. Método frecuentista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
7.5.2. Método clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.5.3. Método subjetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.6. Propiedades de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
7.7. Métodos de Conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
7.7.1. Enumeración . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
7.7.2. Diagramas de árbol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
7.7.3. Principio fundamental del conteo . . . . . . . . . . . . . . . . . . . . . . . . . . 157
7.7.4. Principio de la adición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
7.7.5. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
7.7.6. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

vi CONTENIDO
7.8. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
7.9. Teorema de la multiplicación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
7.10. Teorema de la probabilidad total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
7.11. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
7.12. Independencia estadística de eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
7.13. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
7.14. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
8. Variables aleatorias 185
8.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
8.2. Variables aleatorias discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
8.3. Variables aleatorias continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
8.4. Valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208
8.5. Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
8.6. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
8.7. Algunas desigualdades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
8.8. Función generadora de momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
8.9. Funciones de variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
8.9.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
8.9.2. Distribuciones de funciones de v.a. . . . . . . . . . . . . . . . . . . . . . . . . . 239
8.10. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
8.11. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242

CONTENIDO vii
9. Distribuciones discretas 254
9.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
9.2. Distribución uniforme discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
9.3. Distribución de Bernoulli y binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
9.4. Distribución hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
9.5. Distribución geométrica y binomial negativa . . . . . . . . . . . . . . . . . . . . . . . . 270
9.6. Distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
9.7. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
9.8. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281
10.Distribuciones continuas 285
10.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
10.2. Distribución uniforme continua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
10.3. Distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
10.3.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
10.3.2. La distribución normal estándar . . . . . . . . . . . . . . . . . . . . . . . . . . 293
10.3.3. Uso de la tabla de la distribución normal estándar . . . . . . . . . . . . . . . . 295
10.3.4. Estandarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296
10.3.5. Aproximación de la distribución binomial . . . . . . . . . . . . . . . . . . . . . 300
10.3.6. Distribuciones relacionadas con la distribución normal . . . . . . . . . . . . . . 302
10.4. Distribución exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
10.5. Distribución gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306

viii CONTENIDO
10.6. Distribución beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
10.7. Otras distribuciones probabilísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312
10.8. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
10.9. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316
11.Distribuciones de probabilidad multivariadas

(Emilio Pablo Berdugo Camacho) 320
11.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 320
11.2. Vectores aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
11.3. Distribuciones conjuntas de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 322
11.3.1. Vector de componentes discretas . . . . . . . . . . . . . . . . . . . . . . . . . . 323
11.3.2. Distribución multinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329
11.3.3. Vector de componentes continuas . . . . . . . . . . . . . . . . . . . . . . . . . . 330
11.3.4. Distribución normal bivariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
11.4. Otras distribuciones relacionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
11.4.1. Distribuciones de probabilidad marginales . . . . . . . . . . . . . . . . . . . . . 338
11.4.2. Distribuciones de probabilidad condicionales . . . . . . . . . . . . . . . . . . . 340
11.4.3. Variables aleatorias independientes . . . . . . . . . . . . . . . . . . . . . . . . . 342
11.5. Combinaciones lineales de variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . 345
11.5.1. Matriz de covarianzas y matriz de correlaciones . . . . . . . . . . . . . . . . . . 346
11.5.2. Valor esperado varianza para una combinación lineal de variables aleatorias . . 350
11.6. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352

CONTENIDO ix
11.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352
A. Elementos básicos de matemáticas 354
A.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
A.2. Operaciones aritméticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354
A.3. Exponentes y radicales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357
A.4. Factorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359
A.5. Razones, fracciones y porcentajes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 360
A.6. Desigualdades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362
A.7. Factorización de polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363
A.8. Ecuaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 371
A.9. Logaritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378
A.10.Sumatorias y productorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
A.11.Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391
B. Elementos básicos de conjuntos 398
B.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
B.2. Conceptos generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398
B.3. Operaciones entre conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402
B.4. Conjuntos numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406
B.5. Funciones y conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 409
B.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 410

x CONTENIDO
C. Elementos básicos de cálculo 412
C.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
C.2. Funciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 412
C.3. Límites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420
C.4. Derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427
C.5. Integrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438
C.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
D. Tablas estadísticas 458
D.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458
D.2. Distribución binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458
D.3. Distribución de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 461
D.4. Distribución normal estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
D.5. Distribución t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463
D.6. Distribución Ji-cuadrado de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 466
D.7. Distribución F de Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469
D.7.1. Tabla para 1 − α = 0.90 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469
D.7.2. Tabla para 1 − α = 0.95 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471
D.7.3. Tabla para 1 − α = 0.975 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473
D.7.4. Tabla para 1 − α = 0.99 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475
Referencias 478
Figuras
1.1. Pierre-Simon Laplace (1749-1827). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.1. Ejemplo de un diagrama de barras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2. Ejemplo de un diagrama de sectores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3. Grácos diferencial (a) e integral (b) de los datos de la tabla 2.10. . . . . . . . . . . . . . . . . . 29
2.4. Ejemplo de un polígono de frecuencias (a) y de un polígono de frecuencias acumulado (b). . . . . . 30
2.5. Ejemplo de un polígono de frecuencias suavizado. . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.6. Ejemplo de un pictograma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.7. Ejemplo de un cartograma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.8. Ejemplo de una serie de tiempo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1. Algunas formas de una distribución de frecuencias. . . . . . . . . . . . . . . . . . . . . . . . . 42
3.2. Augustin Louis Cauchy (17891857). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.1. Ejemplo de un diagrama de caja y bigotes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
xi
xii FIGURAS
4.2. Diagrama de caja y bigotes de los datos de la tabla 2.8. . . . . . . . . . . . . . . . . . . . . . . 70
4.3. Pafnuty Chebyshev (1821-1894). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.4. Karl Pearson (1857-1936). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.5. Diagrama de caja y bigotes de los datos de la tabla 4.4. . . . . . . . . . . . . . . . . . . . . . . 86
5.1. Algunas distribuciones de frecuencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.2. Histograma (a) y diagrama de caja y bigotes (b) asociados con los datos de la tabla 2.9. . . . . . . 94
5.3. Ronald Fisher (1890-1962). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.4. Gráco de la distribución normal con media 0 y varianza 1. . . . . . . . . . . . . . . . . . . . . 100
5.5. Ejemplos de algunas distribuciones simétricas con distintos grados de apuntamiento. . . . . . . . . 101
6.1. Gráco de barras tridimensional de las frecuencias relativas del ejemplo 6.2.2. . . . . . . . . . . . 110
6.2. Gráco de barras de las frecuencias relativas del ejemplo 6.2.2. . . . . . . . . . . . . . . . . . . . 111
6.3. Dispersograma del peso frente a la edad de los 25 niños. . . . . . . . . . . . . . . . . . . . . . . 112
6.4. Ejemplos de diagramas de dispersión en los que se evidencia una relación cuadrática (a), cúbica (b),
exponencial (c) y logarítmica (d). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
6.5. Ejemplos de diagramas de dispersión en los que no se evidencia directamente una relación entre a las
variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.6. Ejemplos de nubes de puntos de un par de variables con relación directa (a), relación inversa (b) y
covarianza nula (c y d). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.7. Ejemplos de nubes de puntos con su respectivo coeciente de correlación. . . . . . . . . . . . . . . 121
6.8. Corrado Gini (1884-1965). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
6.9. Cartograma cartograma donde se evidencian los valores del coeciente de Gini a nivel mundial . . . . 127
6.10. Ejemplo de la curva de Lorenz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

FIGURAS xiii
6.11. Curva de Lorenz asociada con la repartición de las cuentas del ejemplo 6.5.6. . . . . . . . . . . . . 130
7.1. Diagrama de Venn del ejemplo 7.6.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
7.2. Ejemplo de un diagrama de árbol. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
7.3. Thomas Bayes (1702-1761). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
8.1. Gráco de la f.m.p. (a) y de la f.d.a. (b) de la variable del ejemplo 8.1.1. . . . . . . . . . . . . . . 188
8.2. Gráco de la f.d.a. de la variable del ejemplo 8.2.5. . . . . . . . . . . . . . . . . . . . . . . . . 197
8.3. Ejemplo de gráco de una función de densidad de una v.a.c. X. . . . . . . . . . . . . . . . . . . 199
8.4. Ejemplo de una f.d.a. de una v.a.c. X. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
8.5. Gráco de la f.d.p. de la variable del ejemplo 8.3.2. . . . . . . . . . . . . . . . . . . . . . . . . 206
9.1. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución uniforme discreta de parámetro
n = 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
9.2. Jakob Bernoulli (1654-1705). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259
9.3. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial de parámetros
n = 10 y π = 0.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
9.4. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial de parámetros n=5
y π = 0.6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
9.5. Grácos de la f.m.p. de una distribución binomial de parámetros n = 10 y π = 0.25, n = 10 y π = 0.50,

y n = 10 y π = 0.75. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
9.6. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución hipergeométrica de parámetros
n = 4, M = 3 y N = 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
xiv FIGURAS
9.7. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial negativa de pará-
metros r=3 y π = 0.03. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
9.8. Siméon Denis Poisson (1781-1840). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276
9.9. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución de Poisson de parámetro λ = 5. 277
9.10. Grácos de la f.m.p. de una distribución de Poisson de parámetros λ = 2, λ = 5 y λ = 10. . . . . . . 278
10.1. Gráco de la f.d.p. (a) y de la f.d.a. (b) de una variable con distribución uniforme continua sobre el
intervalo a = −3 y b = 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290
10.2. Gráco de la f.d.p.de una variable con distribución normal. . . . . . . . . . . . . . . . . . . . . 291
10.3. Johann Carl Friedrich Gauss (1777-1855). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
10.4. Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución normal para diferentes
valores de los parámetros µ y σ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
10.5. Ilustración gráca del cálculo de probabilidades bajo la distribución normal. . . . . . . . . . . . . 295
10.6. Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución exponencial para
diferentes valores del parámetro λ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
10.7. Gráco de la f.d.p. (a) y de la f.d.a. (b) de una variable con distribución exponencial de parámetro
1
λ= 16
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
10.8. Algunas grácas de la f.d.p. de la distribución gamma para diferentes valores de los parámetros α y β . 307
10.9. Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución beta para diferentes
valores de los parámetros α y β. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
10.10.Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución de Weibull para

diferentes valores de los parámetros α y β. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312
10.11.Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución de Cauchy para

10.12.Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución de Laplace para

FIGURAS xv
10.13.Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución lognormal cuando

el parámetro µ=0 para diferentes valores del parámetro σ. . . . . . . . . . . . . . . . . . . . . 315
11.1. Función másica de probabilidad conjunta de las variables asociadas con los resultados de dos dados
distinguibles y balanceados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324
11.2. Función másica de probabilidad conjunta estimada para las variables género y nivel educativo . . . . 325
11.3. Función de distribución acumulada conjunta para dos variables discretas. . . . . . . . . . . . . . . 326
11.4. Función de distribución acumulada conjunta de las variables asociadas con los resultados de dos dados
distinguibles y balanceados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
11.5. Ejemplo de una función de densidad conjunta de un vector aleatorio bidimensional. . . . . . . . . . 332
11.6. Soporte de la función de densidad conjunta y región de integración de la probabilidad pedida del del
ejemplo 11.3.5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
11.7. Función de densidad conjunta de las variables asociadas a los tiempos de respuesta en un servidor de
computadoras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
11.8. Función de distribución acumulada conjunta para las variables asociadas a los tiempos de respuesta en
un servidor de computadoras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
11.9. Función de densidad conjunta y función de distribución acumulada conjunta de la distribución normal
bivariada de parámetros µX = µY = ρXY = 0 y σX = σY = 1. . . . . . . . . . . . . . . . . . . 337
11.10.Región de integración asociada con el evento |X − Y | ≤ 10 del ejemplo 11.4.7. . . . . . . . . . . . 345
A.1. Leonhard Euler (1707-1783). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
B.1. Diagrama de Venn que ilustra un caso en el que A ⊆ B. . . . . . . . . . . . . . . . . . . . . . . 400
B.2. Diagrama de Venn asociado con un par de conjuntos disjuntos. . . . . . . . . . . . . . . . . . . 403
B.3. Diagramas de Venn para las operaciones entre conjuntos. De izquierda a derecha y de arriba a abajo:
A ∪ B , A ∩ B , A − B , B − A, A4B y AC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
C.1. Grácas de las funciones de la tabla C.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 414

xvi FIGURAS
C.2. Grácas de las funciones del ejemplo C.2.2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415
C.3. Grácas de las funciones del ejemplo C.2.5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 418
C.4. Guillaume François de L'Hôpital (1661-1704). . . . . . . . . . . . . . . . . . . . . . . . . . . . 437
C.5. Bernhard Riemann (1826-1866). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 440

Tablas
2.1. Formato general de una distribución de frecuencias. . . . . . . . . . . . . . . . . . . . . . 20
2.2. Datos asociados con una encuesta de opinión acerca de una medida económica. 1=A favor; 0=En
contra; 3=No Sabe/No Responde (NS/NR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3. Distribución de frecuencias de los datos de la tabla 2.2. . . . . . . . . . . . . . . . . . . . . . . 21
2.4. Datos asociados con el nivel educativo de algunos empleados de una empresa. B= Bachillerato; P=
Pregrado; M= Maestría; D= Doctorado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.6. Datos asociados con la clasicación con respecto al tamaño y a la afectividad de un grupo de perros.
Peq= Pequeño; Med= Mediano; Gra= Grande. . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.7. Tabla a dos vías de clasicación de los datos de la tabla 2.6. . . . . . . . . . . . . . . . . . . . . 23
2.8. Datos asociados con las ganancias en un día determinado de una muestra de empresas de una ciudad. 24
2.10. Clasicación de un grupo de familias por el número de hijos. . . . . . . . . . . . . . . . . . . . . 28
2.12. Datos asociados con el número de clientes de un almacén atendidos en los últimos 20 días. . . . . . 32
xvii
xviii TABLAS
2.13. Ejemplo de un diagrama de tallo y hojas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1. Cálculos del ejemplo 3.2.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2. Datos asociados con las calicaciones de un estudiante. . . . . . . . . . . . . . . . . . . . . . . 46
3.3. Datos asociados con el número de hijos de una muestra de empleados de una empresa. . . . . . . . 48
3.4. Datos asociados con las velocidades de tres vehículos. . . . . . . . . . . . . . . . . . . . . . . . 53
3.5. Datos asociados con los puntajes de una muestra de 20 empresas en relación a la calidad de sus servicios. 55
3.6. Rango del conjunto de datos de la tabla 3.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.1. Datos asociados con los salarios anuales de una muestra de supervisores de ventas de dos empresas. . 64
4.3. Algunos valores asociados con el teorema de Chebyshev. . . . . . . . . . . . . . . . . . . . . . . 81
4.4. Datos asociados con una muestra de ventas diarias (en millones de pesos) de una empresa. . . . . . 85
5.1. Cálculos de los ejemplos 5.2.3 y 5.3.1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.1. Ejemplo de una tabla de doble entrada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.2. Tabla de contingencia asociado con el género (X ) y el nivel educativo (Y ) de una muestra de personas
de una empresa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.3. Tabla de contingencia de frecuencias relativas del ejemplo 6.2.2 . . . . . . . . . . . . . . . . . . 107
6.4. Perles la de la muestra del ejemplo 6.2.2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.5. Perles columna de la muestra del ejemplo 6.2.2. . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.6. Tabla de observaciones de una muestra correspondiente a un conjunto de datos bivariado. . . . . . . 110
6.7. Datos asociados con el peso y la edad de un grupo de 25 niños. . . . . . . . . . . . . . . . . . . 110

TABLAS xix
6.8. Datos asociados con la posición y el puntaje de los competidores del ejemplo 6.5.4. . . . . . . . . . 123
6.9. Datos asociados con las concordancias y discordancias del estudio de mercadeo del ejemplo 6.5.5. . . 125
6.10. Datos asociados con el número de contratos que un gerente reparte entre sus empleados. . . . . . . 127
6.12. Datos asociados con los ingresos de una muestra de empresas de un sector económico particular. . . 128
6.13. Frecuencias acumuladas asociadas con la curva de Lorenz del ejemplo 6.5.6. . . . . . . . . . 130
6.14. Datos asociados con una muestra de utilidades de las acciones X y Y. . . . . . . . . . . . . . . . 132
6.15. Datos asociados con los salarios de una muestra de empleados de una empresa. . . . . . . . . . . . 133
6.16. Datos asociados con las ventas y gastos de una empresa determinada. . . . . . . . . . . . . . . . 133
6.17. Datos asociados con las calicaciones de las asignaturas A y B de una muestra de alumnos. . . . . . 134
6.18. Datos asociados con la tasa media de crecimiento del PIB y del empleo para 25 países de la OCDE
para el periodo 1988-1997. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
6.19. Datos asociados con los ingresos, el género y la preferencia de una medida económica del Gobierno
Nacional de una muestra de empleados de una compañía. . . . . . . . . . . . . . . . . . . . . . 137
7.1. Datos asociados con la clasicación de los empleados de una corporación según el género y el ingreso. 167
7.2. Datos asociados con la clasicación con respecto al asenso y al modo de trabado de un grupo de
empleados de una empresa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
8.1. Datos asociados con el puntaje de las empresas constructoras participantes en la licitación. . . . . . 237
8.2. Datos asociados con los valores obtenidos para el número de proteínas producidaspor un determinado
gen ante diferentes estímulos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
9.1. Probabilidades asociadas con los valores de una v.a. con distribución hipergeométrica de parámetros
n = 10, M = 500 y N = 1, 000, su respectiva aproximación por medio de la distribución binomial de
parámetros n = 10 y π = 0.5, y la diferencia correspondiente. . . . . . . . . . . . . . . . . . . . 270

xx TABLAS
9.2. Probabilidades asociadas con los valores de una v.a. con distribución binomial de parámetros n = 400
y π = 0.005, su respectiva aproximación por medio de la distribución de Poisson de parámetros λ = 2,
y la diferencia correspondiente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
11.1. Valores de la función de distribución acumulada conjunta de las variables asociadas con los resultados
de dos dados distinguibles y balanceados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
C.1. Dominio, rango y clasicación de algunas funciones. . . . . . . . . . . . . . . . . . . . . . . . . 413

Nomenclatura
X Vector aleatorio.
x Valor observado de X.
p Dimensión de un vector aleatorio.
f.d.a. Función de distribución acumulada.
f.d.p. Función de densidad de probabilidad.
f.g.m. Función generadora de momentos.
f.m.p. Función másica de probabilidad.
v.a. Variable aleatoria.
v.a.c. Variable aleatoria. continua.
v.a.d. Variable aleatoria discreta.
(a, b) Intervalo abierto de a a b.
(a, b] Intervalo semiabierto a la izquierda de a a b.
+∞ Más innito.
− Diferencia.
−∞ Menos innito.
< Menor que.
= Igual a.
> Mayor que.
[a, b) Intervalo semiabierto a la derecha de a a b.
xxi
xxii TABLAS
[a, b] Intervalo cerrado de a a b.
#A Cardinal del conjunto A.
≈ Aproximadamente igual a.
X̄ Media muestral de X.
x̄ Media muestral observada de X.

n

r n combinado r.
Final de una demostración.
R Matriz de correlaciones.
µ̆X Moda poblacional de la variable X.
x̆ Moda muestral observada de la variable X.
∩ Intersección.
◦ Compuesta de funciones.
cos(x) Coseno de x.
cot(x) Cotangente de x.
csc(x) Cosecante de x.
∪ Unión.
≡ Equivalente a.
∃ Existe.
∀ Para todo.
d
dx Derivada respecto a x.
Γ(x) Función gamma.
≥ Mayor o igual que.
∈ Pertenece a.
R
Integral.
⇔ Si y solo si.
≤ Menor o igual que.
ln(x) Logaritmo natural de x.
log(x) Logaritmo en base 10 de x.

TABLAS xxiii
C Conjunto de la números complejos.
Corr[X, Y ] Correlación entre X y Y.
Cov[X, Y ] Covarianza entre X y Y.
E[X] Valor esperado de X.
I Conjunto de la números irracionales.
N Conjunto de la números naturales.
P(A) Probabilidad de A.
Q Conjunto de la números racionales.
R Conjunto de la números reales.
R+ Conjunto de los números reales positivos.
Var[X] Varianza de X.
Z Conjunto de la números enteros.
PA Partes del conjunto A.
S Soporte de una función.
máx A Valor máximo del conjunto A.
mı́n A Valor mínimo del conjunto A.
µj j -ésimo momento de X alrededor de la media.
µ0j j -ésimo momento de X.
µX Media poblacional de X.
6= No es igual a.
@ No existe.
∈
/ No pertenece a.
* No está contenido en.
Ω Espacio muestral.
ω Punto muestral.
Φ Conjunto vacío.
Φ(x; µ, σ 2 ) Función de distribución acumulada de una variable aleatoria con distribución normal de
parámetros µ y σ2 .
xxiv TABLAS
φ(x; µ, σ 2 ) Función de densidad de probabilidad de una variable aleatoria con distribución normal de
parámetros µ y σ2 .
Φ(z) Función de distribución acumulada de una variable aleatoria con distribución normal estándar.
φ(z) Función de densidad de probabilidad de una variable aleatoria con distribución normal están-
dar.
π Número de pi o probabilidad de éxito.
πp Percentil p de una población.
± Más o menos
Q
Productoria.
ρXY Coeciente de correlación de Pearson poblacional entre X y Y.
⇒ Entonces.
→ Tiende a.
sec(x) Secante de x.
Σ Matriz de covarianzas.
2
σX Varianza poblacional de X.
σX Desviación estándar poblacional de X.
σxy Covarianza poblacional de (X, Y ).
sin(x) Seno de x.
√n
x Raíz n-ésima de x.
√
x Raíz cuadrada de x.
Final de un ejemplo.
⊂ Es un subconjunto propio de.
⊆ Contenido en.
⊆ Está contenido en.

P
Sumatoria.
tan(x) Tangente de x.
τxy Coeciente de correlación de Kendall observado entre X y Y.
sgn(x) Signo de x.
µ̃X Mediana poblacional de X.

TABLAS xxv
x̃ Mediana muestral observada de X.
4 Diferencia simétrica.
AF
dX Valor observado del coeciente de asimetría de Fisher muestral de X.
AG
dX Valor observado del coeciente de apuntamiento de Fisher de X.
AP
dX Valor observado del coeciente de asimetría de Pearson muestral de X.
AS
cX Valor observado del índice de asimetría de Yule-Bowley muestral de X.
CV
dx Coeciente de variación muestral observado de X.
AC Complemento del conjunto A.
B(α, β) Distribución beta de parámetros α y β.
B(x) Función beta.
Ber(π) Distribución Bernoulli de parámetro π.
Bin(n) Distribución binomial de parámetros n y π.
BN (r, π) Distribución binomial negativa de parámetros r y π.
Ckn Número de combinaciones de un conjunto de n elementos distintos tomados de k en k.
CVX Coeciente de variación poblacional de X.
Dx Desviación media observada de X.
DMx Desviación mediana observada de X.
dx Diferencial de x.
e Número de Euler.
Exp(λ) Distribución exponencial de parámetro λ.
f 0 (x) Derivada de f de x.
f (x) Función de x.
Fi Frecuencia relativa acumulada de la i-ésima clase.
fi Frecuencia relativa de la i-ésima clase.
fn (A) Frecuencia relativa de A.
FX (x) Función de distribución acumulada de X.
fX (x) Función de masa de probabilidad o función de densidad de probabilidad de X.
f•j Frecuencia relativa marginal de la j -ésima columna.

xxvi TABLAS
fi• Frecuencia relativa marginal de la i-ésima la.
fij Frecuencia relativa conjunta de la ij -ésima categoría.
fX|Y Distribución de probabilidad condicional de X dado que Y = y.
FXY (x, y) Función de distribución acumulada conjunta de X y Y.
fXY (x, y) Función de probabilidad conjunta de X y Y.
G(α, β) Distribución gamma de parámetros α y β.
G(r, π) Distribución geométrica de parámetro π.
Hg(n, M, N ) Distribución hipergeométrica de parámetros n, M y N.
IA Función indicadora de A.
Li Límite inferior de un intervalo.
Ls Límite superior de un intervalo.
mX (t) Función generadora de momentos de X.
M N (n, π1 , π2 , . . . , πp ) Distribución multinomial de parámetros n, π1 , π2 , . . . , πp .
N Tamaño de una población nita.
n Tamaño de una muestra.
N (µ, σ 2 ) Distribución normal de parámetros µ y σ2 .
Ni Frecuencia absoluta acumulada de la i-ésima clase.
ni Frecuencia absoluta de la i-ésima clase.
n•j Frecuencia absoluta marginal de la j -ésima columna.
ni• Frecuencia absoluta marginal de la i-ésima la.
nij Frecuencia absoluta conjunta de la ij -ésima categoría.
N B(µX , µY , σX , σY , ρXY ) Distribución normal bivariada de parámetros µX , µY , σX , σY , ρXY .
P Partición.
P (λ) Distribución de Poisson de parámetro λ.
Pkn Número de permutaciones de un conjunto de n elementos distintos tomados de k en k.
pp Percentil p de una muestra.
RX Rango de X.
Rx Rango observado de X.
TABLAS xxvii
rxy Coeciente de correlación de Pearson muestral observado entre X y Y.
RIx Rango intercuartílico observado de X.
rsxy Coeciente de correlación de Spearman observado entre X y Y.

2
SX Varianza muestral o cuasi-varianza de X.
Sx2 Varianza muestral o cuasi-varianza observada de X.
SX Desviación estándar muestral de X.
Sx Desviación estándar muestral observada de X.
Sxy Covarianza muestral observada de (X, Y ).
U (n) Distribución uniforme de parámetro n.
U [a, b] Distribución uniforme continua sobre el intervalo [a, b].
wi Ponderación de X asociado con el i-ésimo individuo, clase o marca de clase.
X Variable aleatoria X.
xi Valor de X asociado con el i-ésimo individuo, clase o marca de clase.
X(i) Estadístico de orden asociado con la i-ésima posición de una muestra aleatoria.
x(i) Valor observado del i-ésimo estadístico de orden.
zα Percentil α de la distribución normal estándar.

Parte I
1
Capı́tulo 1
Elementos generales
1.1. Introducción
En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de
1
involucrarse en la mayoría de las áreas del conocimiento. La estadística es una ciencia auxiliar para
todas las ramas del saber, y su utilidad es evidente teniendo en cuenta que la mayoría de los quehaceres
y las decisiones en cualquier disciplina involucran cierto grado de incertidumbre o incerteza.
Los críticos de la estadística arman que a través de la estadística es posible mostrar o comprobar casi
cualquier cosa; esta es una concepción ligera y profana que se deriva de la ignorancia de la disciplina
estadística, dado que en estos casos se desconoce la teoría subyacente y la forma adecuada de interpre-
tar los resultados que permiten obtener conclusiones acertadas y precisas. Así, algunos investigadores
tendenciosos han abusado de la estadística, elaborando investigaciones de intención, teniendo previa-
mente los resultados que les interesa mostrar a personas ingenuas y no conocedoras de las técnicas
estadísticas. Otros, por ignorancia o negligencia, también abusan de la estadística utilizando métodos
no apropiados o razonamientos erróneos que conducen al fracaso de sus investigaciones.
Sólo adentrándose en un mundo especíco como en las ciencias sociales, la economía y la adminis-
tración, por ejemplo, es posible percibir que la estadística es una herramienta que permite dar luz y
obtener resultados, y por tanto benecios, en cualquier tipo de estudio teórico o aplicado, cuyos mo-
vimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordados desde la perspectiva
1 La ciencia es el conjunto de conocimientos obtenidos mediante la observación y el razonamiento, sistemáticamente

estructurados y de los que se deducen principios y leyes generales (Real Academia Española 2012a). Surge de la obtención
del conocimiento mediante la observación de patrones regulares, de razonamientos y de experimentación en ámbitos
especícos, a partir de los cuales se generan preguntas, se construyen hipótesis, se deducen principios y se elaboran leyes
generales y esquemas metódicamente organizados (Wikipedia 2012b).
1
2 CAPÍTULO 1. ELEMENTOS GENERALES
de las leyes deterministas .

2
Pierre-Simon Laplace 3
, quien contribuyó enormemente al desarrollo
de la teoría de probabilidades armó: Podemos mirar el estado presente del universo como el efecto
del pasado y la causa de su futuro. Se podría condensar un intelecto que en cualquier momento dado
sabría todas las fuerzas que animan la naturaleza y las posiciones de los seres que la componen; si
este intelecto fuera lo sucientemente vasto para someter los datos al análisis, podría condensar en
una simple fórmula el movimiento de los grandes cuerpos del universo y del átomo más ligero; para
tal intelecto nada podría ser incierto y el futuro así como el pasado estarían frente sus a ojos.
Figura 1.1: Pierre-Simon Laplace (1749-1827).
1.2. Formas del saber
Los seres humanos poseen mayores o menores conocimientos, según el modo y el grado de participa-
ción en la cultura; pero de cualquier forma las formas y tipos de conocimientos generan dos modos
principales del saber que son el saber cotidiano y el saber cientíco . Se sabe de manera natural
por el solo hecho de vivir, y se sabe cientícamente cuando existe una disposición de conocer y de
indagar en lo desconocido con los procedimientos pertinentes.
El saber cotidiano es el conocimiento que se adquiere en la experiencia cotidiana, y trata de conocimien-

tos levemente conectados y arraigados entre si; sin embargo, pueden ser conocimientos superciales
constituidos por una yuxtaposición de casos y hechos. Es el modo espontáneo de conocer que se carac-
teriza por ser supercial y se conforma con lo aparente, puesto que está apoyado solo en la evidencia
2 Teoría que supone que la evolución de los fenómenos naturales está completamente determinada por las condiciones
iniciales (Real Academia Española 2012c).
3 Fotografía tomada de la página web http://www.educared.org/global/premiointernacional/finalistas/710/
biograf/Blaplace.html.
1.3. ¾QUÉ ES ESTADÍSTICA? 3
inmediata de lo que pasa, por lo que únicamente percibe la supercie de una realidad. Además, este
saber cotidiano no es sistemático, tanto en el proceso de adquisición y vinculación de la información,
como en el modo de establecer cánones de validación de la información; se limita a percibir lo inmedia-
to a través de experiencias, vivencias, estados de ánimo y emociones de la vida diaria, permaneciendo
en el nivel de la certeza sensorial.
De otra parte, se entiende por conocimiento cientíco, al conjunto de conocimientos racionales, ciertos
o probables, que obtenidos de manera metódica y vericados empíricamente, se sistematizan orgáni-
camente, cuyos contenidos son susceptibles de ser transmitidos.
El saber cientíco es racional, puesto que exige el uso de la razón y de una serie de elementos fun-
damentales como deniciones, proposiciones e hipótesis. Es cierto o probable, porque se trata con
verdades parciales, sujetas a corrección cuando nuevas experiencias demuestran la necesidad de recti-
cación. En la ciencia no existe la certeza absoluta . El conocimiento cientíco es metódico, ya
que no se obtiene al azar, sino mediante reglas lógicas, que acompañadas de procedimientos técnicos
se organizan según convenciones establecidas. También requiere la confrontación con la realidad y la
sistematización orgánica, porque no se trata de conocimientos inconexos sino de un saber ordenado
lógicamente, constituyendo un sistema de generalizaciones y principios que relacionan los hechos entre
si, deduciendo leyes y teorías. Además, los conocimientos de una ciencia deben ser transmisibles por
medio de un lenguaje que le sea propio y que debe responder a todas las exigencias de claridad y
precisión.
1.3. ¾Qué es estadística?
Para denir la estadística se debe precisar cada una de las técnicas que se emplean en los diferentes
campos en los que interviene. La denición dada en seguida permite apreciar la relación entre la
4
estadística y el método cientíco .
Denición 1.3.1. La estadística es la ciencia que se ocupa de los mé-

todos y las técnicas para recoger, clasicar, resumir y analizar conjuntos
de datos; así como de realizar inferencias a partir de ellos, con la nalidad
de tomar decisiones racionales en situaciones que impliquen incerteza.
Nota. Los datos asociados con una realidad determinada pueden provenir de muchas fuentes como
registros históricos, diseños experimentales o muestras.
4 El método cientíco es el camino a seguir mediante una serie de operaciones, reglas y procedimientos jados
de antemano de manera voluntaria y reexiva, para alcanzar un determinado n que puede ser material o conceptual
(Pérez 2004, p. 188).
1.4. Clasicación de la estadística
La estadística se divide en dos grandes ramas de estudio que son la estadística descriptiva, cuando
los resultados del análisis no pretenden ir más allá del conjunto de datos observado, y la estadística
inferencial, cuando el objetivo del estudio es obtener conclusiones para un conjunto de datos más
amplio a partir de uno de menor tamaño. Estas dos ramas no son independientes, por el contrario,
son complementarias, y juntas proporcionan suciente información sobre la realidad, para que, quien
tenga poder de decisión, pueda tomar las medidas necesarias con el mayor grado de certeza posible.
Denición 1.4.1. La estadística descriptiva describe y representa

un grupo de datos utilizando métodos numéricos y grácos que resumen
y presentan la información contenida en ellos.
La estadística descriptiva evidencia tal cual es una situación y muestra lo que hay ; permite explicar
las observaciones que se hagan sobre un evento, fenómeno o problema de investigación, evidenciando
propiamente la forma en que los hechos ocurrieron o se manifestaron.
Denición 1.4.2. La estadística inferencial apoyándose en el cálcu-

lo de probabilidades y a partir de un conjunto de datos menor, permi-
te efectuar estimaciones, predicciones u otras generalizaciones sobre un
conjunto de datos mayor.
La estadística inferencial toma lugar cuando a partir de los resultados obtenidos de un conjunto
de datos dado se obtienen conclusiones acerca de un conjunto de datos más amplio. Es decir, las
conclusiones que se obtienen de los datos en estudio, rebasan los límites de los mismos. Generalmente,
el análisis estadístico inferencial se lleva a cabo para mostrar relaciones de causa y efecto, y para
probar hipótesis y teorías.
1.5. Algunos términos importantes

5
El objeto de estudio de la estadística son los fenómenos colectivos , donde el comportamiento de
6
una serie de características está afectado por la aleatoriedad intrínseca de la naturaleza de los fe-
5 También se puede tratar de un fenómeno individual repetido a través del tiempo (detalles en la sección 1.6). Éste
se puede entender como un fenómeno colectivo al considerar las ocasiones de medición como los elementos unitarios.
6 La aleatoriedad es una característica asociada a todo proceso cuyo resultado no es previsible, mas que en razón
de la intervención del azar, y por ende no se puede determinar en ningún caso antes de que éste se produzca.
1.5. ALGUNOS TÉRMINOS IMPORTANTES 5
nómenos en cuestión. A continuación se presentan algunos términos empleados frecuentemente en la

investigación de tales fenómenos.
Denición 1.5.1. Los individuos o elementos son los entes que se

quieren investigar. Así, una población , colectivo , o universo , se reere
al conjunto de todos los individuos o mediciones que satisfacen ciertas
características propias de la investigación.
Nota. La denición 1.5.1 no se reere únicamente a los seres vivos; una población puede estar consti-
tuida por los habitantes de un país o por los peces de un estanque, así como por los establecimientos
comerciales de un barrio o las viviendas de una ciudad.
Llevando a cabo una investigación se deben tener en cuenta algunas características esenciales al deli-
mitar la población en estudio, a saber, la homogeneidad, el tiempo, la cantidad y el espacio.
La homogeneidad se reere a que todos los miembros de la población tengan en común las caracte-
rísticas que se vayan a considerar en la investigación. Por ejemplo, si se investiga la incidencia de la
drogadicción en mujeres adolescentes, hay que denir precisamente el rango de edad de las jóvenes de
interés, de forma tal que todas las mujeres consideradas sean de la edad requerida.
El tiempo se reere al período donde se ubicaría eventualmente la población de interés. Determinar si

el estudio corresponde a la observación de los elementos en un momento determinado, o si corresponde
al seguimiento de los individuos a lo largo del tiempo.
La cantidad se reere al tamaño de la población. La falta de recursos como tiempo, dinero, espacio y
materiales puede limitar la extensión de la población que se quiere investigar. Por ejemplo, si se quiere
estudiar la preferencia de los colombianos frente a un producto determinado, no es necesario tener
en cuenta todas las personas económicamente activas del país, sino aquellos individuos que tengan
participación en el mercado del producto en cuestión.
El espacio se reere al lugar donde se localiza la población de interés. También, la falta de recursos
puede obligar al investigador a limitar el estudio a un conjunto de elementos más especíco. Siguiendo
el ejemplo anterior, puede que dicho producto se ofrezca principalmente en zonas particulares de las
ciudades intermedias.
Una población puede ser, según su tamaño, de dos tipos, a saber, nita o innita. Una población
nita es aquella donde el número de elementos que la conforma es nito. De otra parte, una población
innita es aquella donde el número de elementos que la forma es innito, o es tan grande que se puede
considerar innito. Por ejemplo, si se realiza un estudio sobre los productos que hay en el mercado,
hay tantos y de tantas calidades que esta población se puede considerar como innita.
Denición 1.5.2. Se denomina muestra a un subconjunto de indivi-

duos o mediciones de una población.
Nota. La cantidad de individuos de una muestra se simboliza con n, mientras que la cantidad de
elementos que constituyen una población nita se representa con N.
Se distinguen dos tipos de muestras. La clasicación de una muestra depende de cuán representativa
sea de la población, lo que se identica por el método de obtención de la misma. Se tienen las
muestras obtenidas a partir de procesos de muestreo no probabilístico y de muestreo probabilístico.
Las muestras no probabilísticas se caracterizan porque el diseño muestral
7
correspondiente se
realiza en forma subjetiva, arbitraria, según el criterio del investigador o del entrevistador de campo.
En el muestreo no probabilístico no existe una oportunidad real de que un elemento en particular de
la población sea seleccionado y por lo tanto no es posible calcular la conabilidad de las inferencias
asociadas. De otra parte, las muestras probabilísticas se fundamentan en el chance que tiene cada
elemento de la población en hacer parte de la muestra. En estas muestras, dadas ciertas condiciones de
conabilidad, error máximo admisible y tamaño poblacional, se deja al azar el diseño de la muestra.
El muestreo probabilístico permite medir la conabilidad de los procesos de inferencia y el error
de muestreo que está asociado intrínsecamente en el proceso (Soto 2001, p.31-33). El muestreo es
indispensable para el investigador ya que en la mayoría de aplicaciones no es conveniente o posible
medir a todos los miembros de una población, esto es, realizar un censo . En tales casos, se requiere
una muestra representativa de la población con el propósito de obtener conclusiones válidas acerca de
todo el colectivo en estudio.
El tamaño de la muestra depende de la precisión con que el investigador desee llevar a cabo el estudio; se
debe usar una muestra tan grande como sea posible teniendo en cuenta los recursos disponibles. Cuanto
más grande sea el tamaño de muestra, mayor será la posibilidad de que la muestra sea representativa
de la población.
Denición 1.5.3. Se llama parámetro a una función denida sobre los

valores de una característica medible de una población. Similarmente,
se denomina estadístico (observado) a una función denida sobre los
valores de una característica medible de una muestra.
Nota. El concepto de parámetro y estadístico son casi idénticos. La única diferencia radica en el
conjunto de datos donde cada cual es calculado; mientras un estadístico se calcula utilizando los datos
de una muestra, un parámetro se calcula utilizando los datos de una población.
Ejemplo 1.5.1. El promedio muestral y el promedio poblacional de una población nita son ejemplos
de un estadístico y de un parámetro respectivamente. Suponga que X representa una característica
7 El diseño muestral comprende todos los aspectos relacionados con la obtención de una muestra respecto a la
características objeto de estudio, como los objetivos de la investigación, la estructura de la población y los recursos
disponibles (humanos, nancieros, materiales, de disponibilidad de tiempo, etc.).
1.6. VARIABLES 7
medible de interés (detalles en la sección 1.6 y 3.2) y que xi representa el valor de X asociado con el
i-ésimo individuo; así, el promedio muestral observado de X, denotado con x̄, se dene como:
n
x1 + x2 + . . . + xn 1X
x̄ = = xi
n n i=1
Análogamente, se dene el valor del promedio poblacional de X, denotado por µX , como:
N
x1 + x2 + . . . + xN 1 X
µX = = xi
N N i=1

Nota. Las expresiones dadas el ejemplo 1.5.1 son casi idénticas, pero la diferencia salta a la vista: en
la primera fórmula, se tiene la información de una muestra; mientras que en la segunda expresión, se
tiene la información de una población.
1.6. Variables
Las variables constituyen la materia prima de toda investigación estadística. En una investigación lo
primero que se debe hacer es delimitar la cuestión a investigar, lo que permite evidenciar las variables
preponderantes del estudio.
Denición 1.6.1. Una variable es una característica observable o me-

dible de un individuo, que se describe acorde a una escala de medición
bien denida. Cada rasgo, aspecto o característica de una población cons-
tituye una variable.
Algunos ejemplos de variables son la edad, el género, la raza, la nacionalidad, la estatura, el peso, el
ingreso, el número de nacimientos, la tasa de suicidios, el producto interno bruto, entre otras.
Nota. Las variables como la inteligencia, el gusto, el miedo y la vocación, por ejemplo, no son variables
observables. Tales características se denominan variables latentes . ¾Cómo realizar estudios que
involucren este tipo de variables? Generalmente se emplean variables auxiliares que reejen el atributo
que se quiere investigar, como los coecientes de inteligencia y las escalas de valores o anidad, por
ejemplo.
Las variables se pueden clasicar según su naturaleza como variables cualitativas o cuantitativas.
Las variables cualitativas son aquellas que se expresan en forma verbal como categorías o atributos.
El género, la raza, la aliación política, la nacionalidad y la profesión son ejemplos de variables
cualitativas.
Las variables cuantitativas son aquellas que varían en términos de cantidad y se registran o expresan
en forma numérica. La edad, el peso, la estatura, la temperatura y el salario son ejemplos de variables
cuantitativas. A su vez, estas variables se clasican como sigue:
• Variables discretas : no admiten siempre un valor intermedio entre dos valores cualesquiera de
la variable. Por ejemplo, el número de hijos de una persona es una variable cuantitativa discreta.
• Variables continuas : siempre admiten un valor intermedio entre dos valores cualesquiera de
la variable. Por ejemplo, el salario de un empleado medido en millones de pesos es una variable
cuantitativa continua.
En ocasiones, por simplicidad, conviene expresar las variables cuantitativas como variables cualitativas.
Por ejemplo, las calicaciones de los estudiantes pueden ser categorizadas y expresadas como una
variable cualitativa. Así, el investigador puede utilizar una escala numérica de 0 a 5 para observar las
calicaciones de los estudiantes, y por comodidad expresar las observaciones por medio de categorías
acorde a un rango especíco de valores en el que la calicación del estudiante se encuentre, como por
ejemplo deciente, regular, bueno y excelente.
De otra parte, las variables tanto cualitativas como cuantitativas, también pueden ser clasicadas
como variables transversales o longitudinales . Las primeras son aquellas en las que el momento
de recolección de la información es el mismo para todos los individuos, o simplemente no es objeto de
estudio; mientras que las variables longitudinales son observadas repetidamente a través del tiempo.
Ejemplo 1.6.1. Una empresa de consultoría está creando un par de formularios para dos clientes
que necesitan información sobre un grupo particular de compañías que les son de interés. El primer
formulario indaga sobre el estado actual de las empresas de exportación respecto al año pasado, y
necesita establecer de éstas: el porcentaje de aumento de sus ventas respecto al año pasado, la cantidad
de clientes nuevos que tiene este año, el número de empleados que maneja y los grupos industriales
a los que exporta. De otro lado, el segundo formulario busca conocer los sectores industriales que se
encuentran en crecimiento constante y su posible horizonte nanciero. Para esto requiere establecer de
las industrias: el sector en el que se encuentra, el porcentaje de aumento en la producción y la cantidad
de clientes nuevos respecto al mes anterior. Clasicar las variables de interés. ¾Cuál formulario es
necesario diligenciar más de una vez?
Solución:
Para el primer formulario, el porcentaje de aumento de sus ventas respecto al año pasado es una
variable cuantitativa continua, ya que este valor puede ser cualquier número real. La cantidad de
clientes nuevos que tiene este año es una variable cuantitativa discreta, dado que si se tienen 10 u 11
clientes nuevos no es posible tener 10.5, por ejemplo. El número de empleados que maneja también
es una variable cuantitativa discreta, siguiendo el mismo razonamiento de la variable anterior. Por
último, los grupos industriales a los que exporta es una variable cualitativa, puesto que está asociada
con un número nito de valores cualitativos, a saber, industrial, comercial y de servicios.
En relación con el segundo formulario, el sector en el que se encuentra es una variable cualitativa como
1.7. MEDICIÓN 9
la última variable del formulario anterior. Además, el porcentaje de aumento en la producción y la

cantidad de clientes nuevos respecto al mes anterior son variables cuantitativas, continua y discreta
respectivamente, tal y como se explicó para el primer formulario.
De otra parte, lo que se debe determinar en cuanto al diligenciamiento de los formularios es el objetivo
de cada uno, es decir, la razón de ser de cada cual. El primer formulario pretende responder a una
cuestión puntual referida a una comparación entre la actualidad y un tiempo pasado, mientras que el
segundo está diseñado para conocer una tendencia con el propósito de conjeturar sobre una situación
futura. Luego, lo más adecuado es que el primer formulario sea diligenciado una sola vez en el tiempo
para realizar dicha comparación (estudio transversal), mientras que el segundo formulario requiere
que sea diligenciado varias veces para establecer la tendencia del crecimiento en el tiempo (estudio
longitudinal). Por ende las variables del primer formulario son variables transversales y las del segundo
son variables longitudinales.
Nota. Un mismo formulario puede contener variables transversales y longitudinales.
1.7. Medición
Cuando se habla de estadísticas o de métodos estadísticos se está inmerso necesariamente en el campo

de la medición. Se quiere obtener información precisa del objeto en relación a las características de
interés, que al ser medibles, deben procurar información concisa y concreta del fenómeno investigado.
Toda información que pueda ser obtenida con estas características se le considera real y verdadera,
y por tanto se le adjudica validez. Por consiguiente, la medición es fundamental para que los juicios
sean acertados y validos.
Denición 1.7.1. La medición es un proceso mediante el cual se asig-

nan valores cuantitativos o cualitativos a los atributos de los elementos
objeto de estudio, de acuerdo a unas reglas claramente preestablecidas.
Cuando se trata de objetos físicos el proceso de medición es directo, porque es cuestión de seguir
cuidadosamente unas reglas acordadas de antemano expresadas mediante una escala determinada.
Por ejemplo, es fácil tomar la estatura de una persona, dado que no hay dicultades en asignar un
número a la distancia que hay desde la planta de los pies hasta la coronilla del individuo de acuerdo
con la escala de una cinta métrica.
Denición 1.7.2. Una escala de medición es un esquema especíco

para asignar símbolos o números con el objeto de designar los valores de
una variable.
La taxonomía más conocida sobre las escalas de medición la presenta Stevens (1951) quien las clasica
en nominales, ordinales, de intervalos y de razón:
La escala nominal es aquella donde se clasican los individuos en categorías distintas. Consiste en
agrupar los individuos de acuerdo a alguna cualidad que los hagan propios de una categoría determi-
nada.
Es posible utilizar números en las escalas nominales, pero éstos no representan magnitudes absolutas.
Los números solo se utilizan con el propósito de etiquetar una determinada categoría. Por ejemplo, en
algunas encuestas se asigna el número 1 al género masculino y el número 2 al género femenino, con el
propósito de facilitar el almacenamiento y manejo de la información, pero ello no quiere decir que el
género masculino tenga mayor o menor valor que el género femenino.
Los números utilizados para efectos de identicación en una escala nominal, nunca se utilizan para
llevar a cabo procedimientos aritméticos. Su única función es identicar. De hecho, la medición en
una escala nominal es limitada porque solo permite efectuar una clasicación, mas no establecer la
magnitud de lo que se clasica.
La escala ordinal es aquella donde se clasican las unidades de observación en una posición con
relación a cierto atributo, pero sin indicar la distancia que hay entre las posiciones. Cuando se asignan
números es solo para indicar el orden de las posiciones de lo que se está identicando. Por ejemplo,
una junta directiva se encuentra analizando tres diferentes alternativas A, B y C para una campaña
de mercadeo, y deciden que la alternativa A es la mejor y que la B es la peor; así, se han ordenado
las alternativas de acuerdo a la conveniencia para la campaña, pero no es posible evidenciar que tan
conveniente es la alternativa A respecto a las otras dos alternativas.
Con una escala ordinal tampoco se deben llevar a cabo las operaciones aritméticas. La diferencia
que pueda haber entre los elementos observados, no está constituida por unidades absolutas que se
puedan utilizar para determinar la distancia entre los objetos medidos. Por ejemplo, en una carrera
en la que no ha sido tomado el tiempo de los competidores, es posible establecer quién llegó primero,
y quién llegó segundo, pero no es posible establecer la diferencia entre los tiempos de llagada de los
competidores.
La escala de intervalo es aquella donde se ordenan los elementos según la magnitud del atributo que
representan y se proveen intervalos iguales entre las unidades de medida. No posee un cero absoluto,
dado que es establecido por convención de forma arbitraria por los expertos en el área de estudio; el 0
no implica la ausencia del atributo. Por ejemplo, la escala de medida de la inteligencia posee un valor
0, pero éste no indica que un ser humano no tenga inteligencia. Análogamente, si la temperatura de
un objeto es 0 grados centígrados, no es cierto que dicho elemento carezca de temperatura, ya que la
designación del valor 0 es arbitraria y convencional.
Una diferencia de cierta magnitud en una escala de intervalo signica lo mismo para todas las posibles
diferencias con esa misma magnitud. Por ejemplo, la diferencia en la temperatura entre 1 y 2 es
equivalente a la diferencia entre 101 y 102 .
1.8. LA INVESTIGACIÓN ESTADÍSTICA 11
Por último, la escala de razón es aquella donde el punto 0 no es arbitrario y corresponde a una
total ausencia de la característica observada. Por ejemplo, la escala de medición de una regla de 10
centímetros es de razón, la cual está dividida en 10 unidades cada una de igual magnitud a partir de
un punto 0 absoluto y verdadero.
Algunas variables con las que se utiliza este tipo de escala se reeren a la ejecución de tareas motoras
y a los de aspectos siológicos. Dos ejemplos clásicos de la escala de razón son las medidas empleadas
para cuanticar la estatura y el peso de una persona. Además, dado el carácter absoluto del 0, la
razón entre los valores involucrados en esta escala de medida hace sentido.
1.8. La investigación estadística
En esta sección se señala el esquema de una investigación estadística, de la cual se hará énfasis en los
tópicos que se consideran de mayor relevancia e interés para el lector. El esquema de una investigación
estadística es el siguiente:
i. Planteamiento del problema.
ii. Introducción y justicación.
iii. Preguntas de investigación y/o formulación de las hipótesis.
iv. Objetivos.
v. Fundamentación teórica y de referencia.
vi. Población, muestra y medición.
vii. Diseño de la investigación.
viii. Presentación y publicación
ix. Cronograma y presupuesto.
x. Bibliografía.
Nota. Este es apenas un esquema de una investigación estadística y no es lineal e irreversible.
Planteamiento del problema
¾Qué realidad interesa investigar?
En una investigación es absolutamente necesario establecer qué y por qué se quiere estudiar algo.
Para ello, se debe lograr una delimitación clara, concreta e inteligible del problema que se quiere
abordar, con el propósito de evidenciar su accesibilidad y solubilidad, de forma tal que por medio de
una revisión bibliográca responsable sea posible conocer el estado del arte, los resultados obtenidos
en investigaciones similares y corroborar las proposiciones básicas concebidas inicialmente.
Introducción y justicación
¾Qué se sabe de la realidad que interesa investigar? ¾Por qué interesa investigar esta realidad?
Antes de realizar cualquier investigación es obligatorio identicar qué se sabe acerca de la realizad
que se quiere examinar, con el propósito de establecer un punto de partida propio y real para el
estudio. Esto permite contextualizar e involucrar a todos los agentes de quienes pueda depender en
alguna medida la investigación. Por lo mismo es muy importante justicar apropiadamente por qué
es menester investigar tal realizad. De aquí depende que sea interesante y conveniente para todos los
actores involucrados, pues de ello depende muchas veces la consecución de los recursos.
Preguntas de investigación y/o formulación de las hipótesis
¾Qué particularidades interesan de los hechos objeto de estudio?
Una hipótesis es una explicación provisional de los hechos objeto de estudio y su formulación depende
del conocimiento que el investigador posea sobre la población investigada. Una hipótesis estadística
debe ser susceptible de prueba, esto es, se debe poder docimar o juzgar para su aceptación ó rechazo.
Objetivos
¾Qué se quiere encontrar en el fenómeno objeto de estudio? ¾Qué se espera que suceda con la inter-
vención?
Luego de establecer los hechos objeto de estudio, se debe presupuestar hasta dónde se quiere llegar
con la investigación; en otras palabras, se debe jar cuáles son los objetivos de la investigación.
Éstos se deben plantear de tal forma que no haya lugar a confusiones o ambigüedades. Además, es
recomendable diferenciar los objetivos a corto, mediano y largo plazo, así como los objetivos generales
y los especícos.
Fundamentación teórica y de referencia
¾En qué se apoya el investigador para estudiar esta realidad?

1.8. LA INVESTIGACIÓN ESTADÍSTICA 13
Se debe evidenciar todo el bagaje teórico que dirige la investigación, describiendo completamente el
sustento teórico del problema y las evidencias de todo tipo que se encuentren alrededor del mismo.
En la fundamentación también se denen los términos más relevantes del estudio, ilustrando sus
principales rasgos y características.
Población, muestra y medición
¾Quiénes forman parte de la realidad que se estudia? ¾De ellos, quiénes serán los informantes? ¾Qué
y cómo se quiere medir?
La unidad de observación , entendida como cada elemento de la población estudiada, debe ser
denida previamente, de tal forma que se destaquen todas sus características; pues, al n de cuentas,
es sobre las unidades de observación que se hace la medición. Una unidad de observación puede
estar constituida por un elemento (unidad de observación simple) o por varios elementos (unidad de
observación compleja).
De otra parte, el criterio sobre el proceso de medición debe ser previamente denido y unicado. Por
ejemplo, si se trata de medidas de longitud, volumen o peso, se debe establecer bajo qué unidad de
medida se tomarán las observaciones, ya sea en metros, pulgadas, libras, kilogramos, etc. Así mismo,
se deben detallar las condiciones bajo las cuales se ha de efectuar la toma de la información.
En variadas circunstancias, estudiar todos y cada uno de los elementos que conforman la población no
es aconsejable, ya sea porque los recursos económicos y humanos son limitados, la homogeneidad de sus
elementos no justica un censo, o tal vez porque puede ser necesario destruir la unidad de observación.
Por tales motivos se recurre al análisis de los elementos de una muestra con el n de hacer inferencias
respecto a la población. La muestra en cuestión debe ser representativa de la población, esto es, sus
elementos deben ser escogidos de manera aleatoria de tal forma que reejen las características propias
de todos los individuos que conforman el colectivo en estudio.
Diseño de la investigación
¾Cómo se desarrolla la investigación? ¾Cómo se organiza la investigación?
En esta etapa se presenta el panorama metodológico completo que evidencia la forma en que se
organiza todo el proceso de investigación y los aspectos metodológicos esenciales que guían el trabajo
del investigador. En esta fase es de suma importancia la claridad y la precisión para dar cuenta del
posicionamiento del investigador en el mapa metodológico de la investigación cientíca. Dentro del
panorama metodológico se deben contemplar de manera particular los siguientes aspectos: recolección,
crítica, clasicación y ordenación, y análisis de la información.
Una de las etapas más importantes de la investigación es la recolección de la información, que ha de

8
partir a menos que se tenga experiencia con muestras análogas de una o varias muestras piloto en
las que se pondrán a prueba los instrumentos de medición y se obtendrá una idea preliminar de la
variabilidad de la población, con el n de calcular el tamaño exacto de la muestra que conduzca a una
estimación de los parámetros con la precisión deseada.
Establecer las fuentes de información, así como la complejidad del instrumento de medición, son
decisiones que se han de tomar teniendo en cuenta todos los factores involucrados en la observación
de los elementos objeto de estudio. Se debe, entonces, descubrir dónde está la información, cómo y a
qué costo se puede conseguir.
Después de reunir la información pertinente, se necesita la depuración de los datos recogidos. Para
hacer la crítica de la información, es fundamental el conocimiento de la población por parte de quien
depura, para que sea posible detectar, por ejemplo, falsedades en las respuestas, incomprensión a las
preguntas, o respuestas al margen de todas las posibles causas de nulidad de una pregunta. Una vez
separado el material de desecho de la información debidamente depurada se procede a establecer las
clasicaciones respectivas, y con la ayuda de hojas de trabajo, se ordenan las respuestas y se preparan
los modelos de tabulación de las variables que intervienen en la investigación. Los avances tecnológicos
hacen que estas tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo.
La estadística ofrece métodos y procedimientos objetivos que convierten las especulaciones de primera
mano en aseveraciones cuya conabilidad puede ser evaluada en la toma de decisiones. Esta es la fase
de cálculo de los estadísticos, el ajuste de los modelos y la prueba de las hipótesis estadísticas, con el
n de establecer y redactar las conclusiones denitivas.
Presentación y publicación
La información adquiere más claridad cuando se presenta en una forma adecuada. Los cuadros, las
tablas y los grácos facilitan el análisis, pero se debe tener especial cuidado con las variables que se
van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y grácos
redundantes que, antes que claridad, creen confusión. Además, la elección de los medios para mostrar
los resultados, se debe hacer no solo en función de las variables de interés, sino del lector a quien va
dirigido el informe.
8 Una muestra piloto es un subconjunto de objetos de estudio que no son necesariamente seleccionados bajo el rigor
teórico de una muestra probabilística. Una muestra piloto permite realizar una descripción preliminar del fenómeno
de estudio y probar varios pasos metodológicos de la investigación, con el n de realizar correcciones y examinar los
supuestos teóricos de las etapas posteriores.
1.9. COMENTARIOS 15
1.9. Comentarios
En este capítulo se presentan algunos conceptos básicos de estadística, con el propósito de alentar su
estudio y esclarecer las concepciones falsas que se tengan al respecto; como creer que la estadística
únicamente trata con los porcentajes y las frecuencias que aparecen continuamente en los periódicos.
Así, en este capítulo y en los siguientes, se muestra una concepción real de la estadística descriptiva
por medio de sus aplicaciones, dado que es una herramienta de gran utilidad, que requiere un uso
adecuado e inteligente.
Es indispensable tener claras las premisas y los fundamentos de la estadística, para que posteriormente
se entiendan los conceptos que se presentan, se apliquen los métodos de manera correcta, y se analicen
los resultados obtenidos objetivamente, con el n de no cometer errores astronómicos como, por
ejemplo, establecer que tomar café produce cáncer, conclusión que eventualmente podría surgir de
un estudio cuyos pacientes son en su mayoría fumadores.
Por último, se resalta la importancia de una investigación cientíca como herramienta de estudio, dado
que a través de las hipótesis, los protocolos y/o las metodologías desarrolladas en una investigación de
tales características, es posible obtener conclusiones válidas sobre un tema de interés, con el propósito
de tomar decisiones conscientes en situaciones que impliquen incertidumbre.
1.10. Ejercicios
1.1 Clasicar se según su naturaleza y establecer la escala de medición de las siguientes variables:
a. Estrato socio-económico. j. Edad en años cumplidos.
b. Género. k. Categoría de un hotel.
c. Número de errores.
l. Opinión.
d. Filiación política.
m. Profesión.
e. Calicación de una prueba.
n. Número de hermanos.
f. Nivel educativo.
ñ. Ingresos mensuales.
g. Estatura.
h. Temperatura. o. Utilidades anuales.
i. Clasicación étnica. p. Tiempo requerido para ejecutar una tarea.
1.2 Proponer una posible unidad de observación para cada variable del numeral anterior.
1.3 Un investigador educativo quiere evaluar la efectividad de un nuevo método para enseñar a leer a
estudiantes sordos. El aprovechamiento al nal del periodo de enseñanza se mide con la puntuación
del estudiante en una prueba de lectura.
a. ¾Cuál es la variable de estudio? ¾Qué tipo de variable de es? ¾Cuál es la escala de medición?
b. ¾Cuál es la unidad de observación?
c. Identicar la población de interés para el investigador.
1.4 Una empresa tuvo el año pasado algunas ventas de gran importancia. Los datos correspondientes
(en millones de pesos) se muestran en la siguiente tabla:
100,224.95 103,534.54 80,479.93 97,141.20 88,540.67

97,788.97 104,677.53 96,922.26 111,849.34 97,658.20
83,544.03 85,503.09 113,221.35 108,896.68 111,106.26
92,809.99 95,635.89 109,069.38 101,072.17 105,795.74
a. Calcular la venta promedio.
b. Calcular la media muestral de cada una de las muestras conformadas por las siguientes obser-
vaciones: {10; 15}, {1; 2; 5; 10; 13} y {1; 4; 7; 9; 12; 15; 19; 20}. Las observaciones están ordenadas
por las.
c. ¾Qué puede concluir de los valores obtenidos en el numeral anterior?
1.5 Haciendo un estudio sobre la intención de voto en una población conformada por 5 millones de
votantes, de los cuales 2,900,000 son mujeres, se elige una muestra formada por 3,000 personas.
¾Cuántas mujeres y cuántos hombres deberá haber en la muestra elegida guardando las propor-
ciones dadas en la población?
1.6 ¾Cuáles son las principales diferencias entre la estadística descriptiva y la estadística inferencial?
1.7 ¾Las siguientes poblaciones son nitas o innitas? ¾Por qué?
a. Artículos elaborados por una fábrica determinada.
b. Lotes de artículos elaborados por una fábrica determinada el año pasado.
c. Bacterias que se encuentran en un pozo.
d. Empresas nacionales cuyas utilidades superan un millón de dólares anuales.
e. Posibles causas de la mala alimentación en una población determinada.
f. Epidemias reportadas en el mundo el año pasado.
1.8 Dada las motivaciones actuales que se tienen sobre el estudio del ser humano y sus interacciones
con el sexo opuesto, un centro de investigación decidió estudiar a tres grupos de personas de
manera independiente. El primero está conformado por 15 hombres y 15 mujeres, el segundo por
20 hombres y 10 mujeres, y el tercero por 10 hombres y 20 mujeres. El objetivo del estudio es
detectar los comportamientos que se encuentran solamente en uno de los grupos, es decir, aquellos
comportamientos que no se tengan en más de uno de ellos. ¾Este estudio haría uso de la estadística
descriptiva o de la estadística inferencial? ¾Por qué?
1.9 En los siguientes casos identicar la población, la muestra, la unidad de observación, la variable
de interés y si la medición es cuantitativa o cualitativa:
1.10. EJERCICIOS 17
a. Varias veces durante el día un ingeniero de control de calidad de una fábrica, seleccionada
aleatoriamente algunos artículos producidos, los examina y registra el número de imperfecciones
que encuentra en cada artículo.
b. Durante una auditoria, cierta cantidad de cuentas de una rma fueron seleccionadas aleatoria-
mente y examinadas en busca del número de errores.
c. Un examen de inteligencia es aplicado a un grupo de niños que reciben educación especial.

Todos los niños cursan el segundo grado y han sido escogidos para recibir un nuevo programa
de instrucción impartido en una escuela del distrito. El examen debe ser aplicado antes y
después de que reciban la instrucción.
d. Un gerente desea conocer si aquellos empleados que reciben 25 días de vacaciones son más
productivos durante el año que aquellos que reciben solo 15 días. El gerente selecciona una
muestra de 40 trabajadores y registra su rendimiento.
1.10 En los siguientes casos distinguir las muestras aleatorias de las que no lo son:
a. Un fabricante necesita tener la certeza de que menos del 2 % de los artículos de un embarque
son defectuosos, de modo que prueba cierta cantidad de ellos tomados de los que vienen arriba
de un cargamento.
b. El Ministerio de Salud desea saber si una tienda particular reúne los requisitos del código
sanitario. Para ello decide visitar la tienda el quinto día de cada mes.
c. La rectoría de una universidad desea establecer la proporción de estudiantes activos que están de
acuerdo con una reforma del reglamento estudiantil, por lo que contrata a un grupo de personas
para indagar sobre tal cuestión a los estudiantes que logren contactar un día determinado en
la plaza central de la institución.
1.11 Establecer las diferencias entre:
a. Parámetro y estadístico.
b. Población y muestra.
c. Muestro probabilístico y muestreo no probabilístico.
1.12 Enumerar los siguientes términos en el orden adecuado: conocimiento, datos e información. Jus-
ticar.
1.13 Identicar tres tópicos actuales relacionados con la política, la economía y las ciencias sociales,
de los cuales se requiera algún tipo de información. Describir la información que se necesita para
investigar cada tópico.
1.14 Describir tres técnicas reconocidas del muestro no probabilístico.
1.15 Realizar el esqueleto de una investigación cientíca para un tema que le sea de particular interés,
en el cual haga mención de los puntos más importantes de una investigación estadística.
Capı́tulo 2
Tablas y grácas estadísticas
2.1. Introducción
Una de las primeras etapas en el análisis estadístico es la exploración de los datos, en la cual se resume
la información de las variables de manera compacta y precisa. Con este n se generan tablas y grácas
que evidencien claramente el comportamiento de las variables de manera individual y conjunta. Sin
1
embargo, una de las aplicaciones que mayor relevancia tiene este tipo de análisis es la depuración de
la información, puesto que la mayoría de anomalías se reejan de manera particular dentro del análisis
exploratorio de los datos. Por ello es que la mayoría de tales análisis enfatizan el estudio univariado
de los datos, es decir, de una sola variable a la vez.
La depuración de la información no es la única utilidad que tiene la exploración de los datos, ya

que también permite evidenciar tendencias de los individuos investigados y clasicar tales unidades de
acuerdo a los parámetros de homogeneidad establecidos, o estudiar la interacción entre varias variables
de interés.
Nota. Algunas anomalías de los datos pueden ser: datos faltantes, pérdidas de formato, errores de
digitación, valores no probables y no respuesta, por ejemplo.
1 La depuración es el proceso mediante el cual se realiza una inspección en busca de anomalías dentro de la estructura
de datos que posteriormente son eliminadas y/o corregidas.
18
2.2. TABLAS ESTADÍSTICAS 19
2.2. Tablas estadísticas
Considere un conjunto de n individuos asociado con una variable cuyas modalidades o valores han
sido agrupados en k clases o categorías denotadas con C1 , C2 , . . . , Ck . Para cada una de las k clases
se denen las siguientes magnitudes:
Denición 2.2.1. La frecuencia absoluta de la clase Ci , denotada con ni , es la

cantidad de observaciones que hacen parte de la i-ésima categoría para i = 1, . . . , k .
Denición 2.2.2. La frecuencia relativa de la clase Ci , denotada con fi , es la propor-

ción de la frecuencia absoluta de la i-ésima categoría respecto al total de observaciones,
esto es,
ni
fi =
n
para i = 1, . . . , k .
Nota. Multiplicado por 100 % la fórmula de la denición 2.2.2, fi representa el porcentaje de individuos
comprendidos en la clase correspondiente.
Denición 2.2.3. La frecuencia absoluta acumulada de la clase Ci , denotada con

Ni , es la cantidad de individuos cuya modalidad es inferior o igual a la i-ésima categoría,
es decir,
i
X
Ni = nj
j=1
para i = 1, . . . , k .
Denición 2.2.4. La frecuencia relativa acumulada de la clase Ci , denotada con

Fi , es la proporción de individuos respecto al total de observaciones cuya modalidad es
inferior o igual a la i-ésima categoría, es decir,
Ni
Fi =
n
para i = 1, . . . , k .
20 CAPÍTULO 2. TABLAS Y GRÁFICAS ESTADÍSTICAS
Nota. Las frecuencias acumuladas se calculan para variables medidas en una escala al menos de tipo
ordinal; aunque también se pueden calcular para variables nominales, su interpretación es de cuidado,
de acuerdo al orden arbitrario de las clases establecido previamente.
Se llama distribución de frecuencias a la tabla que contiene las categorías junto con las frecuen-
cias correspondientes. Una tabla con tales características sirve para presentar de forma ordenada la
distribución de los datos. Su forma general se presenta en la tabla 2.1.
Proposición 2.2.1. En una distribución de frecuencias de una categoría con k clases se cumplen las
siguientes propiedades:
i. iii.
k
X i
X
fi = 1 Fi = fk
i=1 k=1
ii. iv.
Nk = n Fk = 1
La demostración se deja como ejercicio para el lector.
Ci ni fi Ni Fi
C1 n1 f1 N1 F1
C2 n2 f2 N2 F2
. . . . .
. . . . .
. . . . .
Ck nk fk n 1
Total n 1 N.A. N.A.
Tabla 2.1: Formato general de una distribución de frecuencias.
2.2.1. Tablas para variables cualitativas
A continuación se presentan algunos ejemplos relacionados con el resumen de la información asociada

con variables cualitativas. En la construcción de las tablas estadísticas correspondientes se debe tener
en cuenta la escala de medición para establecer si es pertinente emplear las frecuencias acumuladas.
Ejemplo 2.2.1. Considerar el conjunto de datos de la tabla 2.2 asociados con una encuesta de opinión
acerca de una medida económica. Elaborar la tabla de frecuencias correspondiente.
Solución:
La variable opinión, es una variable cualitativa nominal que toma los valores A favor, En contra
y NS/NR, de tal forma que el número de clases es k = 3. La tabla 2.3 corresponde a la distribución
de frecuencias requerida.
1 0 0 1 1 3 1 3 1 3
0 0 0 3 0 0 0 1 1 0
1 0 0 0 0 0 1 1
Tabla 2.2: Datos asociados con una encuesta de opinión acerca de una medida económica. 1=A favor; 0=En contra;
3=No Sabe/No Responde (NS/NR).
Ci ni fi
A favor 10 35.7 %
En contra 14 50.0 %
NS/NR 4 14.3 %
Total 28 100 %
Tabla 2.3: Distribución de frecuencias de los datos de la tabla 2.2.
Como la escala de medición de la variable opinión es nominal entonces no hacen sentido las frecuen-
cias acumuladas.
Ejemplo 2.2.2. Considerar el conjunto de datos de la tabla 2.4 asociados con el nivel educativo de
algunos empleados de una empresa. Elaborar la tabla de frecuencias correspondiente.
B D M B B P B M B B
B P B M B B M B M B
B B B B B B P B B B
B M B P B B M B B B
D B M B P B B B P P
Tabla 2.4: Datos asociados con el nivel educativo de algunos empleados de una empresa. B= Bachillerato; P= Pregrado;
M= Maestría; D= Doctorado.
Solución:
La variable nivel educativo, es una variable cualitativa ordinal que toma los valores Bachillerato,
Pregrado, Maestría y Doctorado, por lo que el número de categorías es k = 4. La tabla 2.5
corresponde a la distribución de frecuencias requerida.
Como la escala de medición de la variable nivel educativo es ordinal entonces hacen sentido las
frecuencias acumuladas.
Otro tipo de tablas para variables cualitativas son generadas a partir de dos o más variables cualita-
tivas, denominadas tablas de clasicación a p vías, donde p es el número de variables cualitativas que
se estén considerando. En el ejemplo 2.2.3 se presenta una tabla a dos vías de clasicación.
Ci ni fi Ni Fi
Bachillerato 33 66.0 % 33 66.0 %
Pregrado 7 14.0 % 40 80.0 %
Maestría 8 16.0 % 48 96.0 %
Doctorado 2 4.0 % 50 100 %
Total 50 100 % N.A. N.A.
Ejemplo 2.2.3. Un estudio sobre el comportamiento de diferentes razas de perros generó la clasi-
cación que se presenta en la tabla 2.6 respecto a su tamaño (T ) y su afectividad (A).
Raza T A Raza T A
bass Peq Baja galg Gra Baja
beau Gra Alta gasc Gra Baja
boxe Med Alta labr Med Alta
buld Peq Alta masa Gra Alta
bulm Gra Baja mast Gra Baja
cani Peq Alta peki Peq Alta
chih Peq Alta podb Med Alta
cock Med Alta podf Gra Baja
coll Gra Alta poin Gra Baja
dalm Med Alta sett Gra Baja
dobe Gra Baja stbe Gra Baja
dogo Gra Baja teck Peq Alta
foxh Gra Baja tern Gra Baja
foxt Peq Alta
Tabla 2.6: Datos asociados con la clasicación con respecto al tamaño y a la afectividad de un grupo de perros. Peq=
Pequeño; Med= Mediano; Gra= Grande.
Con el propósito de empezar una campaña de mercadeo con esta clasicación, interesa conocer el
porcentaje de razas que son grandes y afectivas, y también el porcentaje de razas que son pequeñas y
afectivas. Para tal n se genera la tabla 2.7 a dos vías de clasicación con las variables en cuestión.
De esta tabla se concluye que las razas de perros cuyos tamaños son grandes, en su mayoría son poco
afectivas, mientras que las razas de perros cuyo tamaño es pequeño frecuentemente son muy afectivas,
por lo que en la campaña se considerará un enfoque publicitario en las razas de perros pequeños.
T \A Alta Baja Total

Grande 11.1 % 44.4 % 55.5 %
Mediano 18.5 % 0.0 % 18.5 %
Pequeño 22.2 % 3.7 % 25.9 %
Total 51.8 % 48.1 % 1.00 %
Tabla 2.7: Tabla a dos vías de clasicación de los datos de la tabla 2.6.
2.2.2. Tablas para variables cuantitativas
Cuando una variable es cuantitativa de razón, no se dispone directamente de un conjunto de k clases

para elaborar la tabla de distribución de frecuencias. El siguiente es un procedimiento que permite
crear las categorías para este tipo de variables:
1. Seleccionar el número de categorías k. Para tal n se distinguen tres alternativas:
i. Elegir arbitrariamente k tal que5 ≤ k ≤ 16.

√
ii. Elegir k mediante la fórmula k ≈ n.
iii. Elegir k mediante la fórmula k ≈ 1 + 3.3 log(n). Esta fórmula se conoce como la regla de
Sturges (Sturges 1926).
Nota. Los resultados de estas fórmulas generalmente no coinciden, así que el usuario decidirá a
conveniencia cuantas clases utilizar.
2. Obtener el mínimo y el máximo de los valores que de la variable. Si X es la variable de interés

entonces el mínimo y el máximo de X se denotan con xmı́n y xmáx respectivamente.
3. Calcular el rango o recorrido de X. El rango se simboliza con RX y su fórmula es:
RX = xmáx − xmı́n
4. Calcular la amplitud de las categorías. La amplitud se denota con a y por facilidad conviene
que sea igual para todas las clases. La fórmula de la amplitud es:
RX
a= (2.1)
k
5. Establecer las categorías de la siguiente manera:
• C1 = {x : l0 ≤ x < l1 } donde l0 = xmı́n y l1 = l0 + a.

• C2 = {x : l1 ≤ x < l2 } donde l2 = l1 + a .
.
.
.
• Ci = {x : li−1 ≤ x < li } donde li = li−1 + a.

.
.
.
• Ck = {x : lk−1 ≤ x ≤ lk } donde lk = lk−1 + a = xmáx .
Ejemplo 2.2.4. Considerar el conjunto de datos de la tabla 2.8 asociados con las ganancias (en
millones de pesos) en un día determinado de una muestra de empresas de una ciudad. Elaborar la
distribución de frecuencias correspondiente.
103.1 82.1 106.2 100.9 91.8 96.1 126.9

119.8 93.1 86.8 75.2 93.0 82.3 94.8
64.2 105.3 108.0 86.3 81.8 138.1 92.5
66.3 66.6 142.2 96.5 74.8 95.4 100.1
81.9 112.0 116.8 103.2 66.1 60.4 78.7
Tabla 2.8: Datos asociados con las ganancias en un día determinado de una muestra de empresas de una ciudad.
Solución:
La variable ganancias es una variable cuantitativa de razón. Es claro que esta variable no está dada
en categorías, por lo que es necesario elaborar las clases pertinentes como sigue:
√
1. Se opta por trabajar con k = 6 clases dado que 35 = 5.916 ≈ 6 y 1 + 3.3 log10 (35) = 6.095 ≈ 6.
2. xmı́n = 60.4 y xmáx = 142.2.
3. RX = xmáx − xmı́n = 142.2 − 60.4 = 81.8.
4. a = 81.8/6 = 13.63.
5. Las clases resultantes son:
• C1 = {x : l0 ≤ x < l1 } donde l0 = 60.40 y l1 = 60.40 + 13.63 = 74.03.

• C2 = {x : l1 ≤ x < l2 } donde l2 = 74.03 + 13.63 = 87.67.
• C3 = {x : l2 ≤ x < l3 } donde l3 = 87.67 + 13.63 = 101.30.
• C4 = {x : l3 ≤ x < l4 } donde l4 = 101.30 + 13.63 = 114.93.
• C5 = {x : l4 ≤ x < l5 } donde l5 = 114.93 + 13.63 = 128.57.
• C6 = {x : l5 ≤ x ≤ l6 } donde l6 = 128.57 + 13.63 = 142.20.
Lo que sigue es enumerar la cantidad de datos en cada categoría, y así obtener la distribución de
frecuencias requerida (tabla 2.9).
Dado que las ganancias están medidas en una escala de razón hacen sentido las frecuencias acumuladas.

2.3. GRÁFICAS ESTADÍSTICAS 25
Ci ni fi Ni Fi
[60.40; 74.03) 5 14.3 % 5 14.3 %
[74.03; 87.67) 9 25.7 % 14 40.0 %
[87.67; 101.30) 10 28.6 % 24 68.6 %
[101.30; 114.93) 6 17.1 % 30 85.7 %
[114.93; 128.57) 3 8.6 % 33 94.3 %
[128.57; 142.20] 2 5.7 % 35 100 %
Total 35 100 % N.A N.A
2.3. Grácas estadísticas
En la estadística descriptiva se utilizan grácas de diversos tipos dependiendo de las características en

estudio. Entre ellos se destacan los siguientes: diagramas de barras, diagramas de sectores, pictogramas,
diagramas de tallo y hojas, histogramas y polígonos de frecuencias. Es una buena costumbre elaborar
una gráca para cada distribución de frecuencias que tenga lugar.
2.3.1. Grácos para variables cualitativas
Diagrama de barras
Un diagrama de barras es una representación gráca en la que cada una de las modalidades de la
variable de interés se representa mediante una barra. En este gráco se disponen los datos en el
primer cuadrante de unos ejes coordenados, levantando sobre el eje de las abscisas (eje x) una barra
para cada modalidad de la variable. La altura de la barra debe ser proporcional a la frecuencia absoluta
o relativa que se representa en el eje de las ordenadas (eje y ).
Nota. Estos diagramas se utilizan tanto para variables cualitativas como cuantitativas discretas cuando
la cantidad de categorías lo permite.
Ejemplo 2.3.1. En la gura 2.1 se muestra un diagrama de barras en el que se representa el estado
civil de una muestra de personas de una localidad.
Diagrama de sectores
En el diagrama de sectores se divide un círculo en tantas porciones como categorías tenga la variable,
de modo que a cada clase le corresponda un sector del círculo proporcional a su frecuencia absoluta o
Figura 2.1: Ejemplo de un diagrama de barras.
relativa. El arco de cada porción se puede calcular usando la siguiente regla de tres:
n −→ 360o
ni −→ vi
lo que da como resultado

ni × 360o
vi =
n
donde vi es el ángulo asociado con el sector circular de la i-ésima categoría para i = 1, . . . , k .
Ejemplo 2.3.2. En la gura 2.2 se presenta un diagrama de sectores relacionado con la clasicación
de una muestra de empresas de una ciudad.
Nota. En algunas situaciones es de interés comparar dos conjuntos de datos. En tales casos es acon-
sejable el uso de las frecuencias relativas en los grácos para efectuar directamente la comparación.
Además, si los grácos usan los ejes coordenados, se debe procurar que éstos tengan la misma escala
de medida.
Figura 2.2: Ejemplo de un diagrama de sectores.
2.3.2. Grácos para variables cuantitativas
Para las variables cuantitativas, se consideran dos tipos de grácos en función del uso de las frecuencias
absolutas o relativas, a saber, diagramas diferenciales y diagramas integrales.
Denición 2.3.1. Un diagrama diferencial es un gráco donde se

representan las frecuencias absolutas o relativas. Mientras que un dia-
gramas integral es un gráco en el que se representan las frecuencias
absolutas o relativas acumuladas.
Nota. Dado que los diagramas integrales se construyen a partir de las frecuencias acumuladas, éstos
dan lugar a grácos crecientes.
Como se ha visto, hay dos tipos de variables cuantitativas: discretas y continúas. A continuación se
muestran algunas representaciones grácas para cada una de ellas.
Grácos para variables cuantitativas discretas
Cuando se trabaja con una variable cuantitativa discreta, se utiliza como diagrama diferencial un
diagrama de barras. Se recomienda que las barras sean estrechas para evidenciar que los valores que
toma la variable son discretos. El diagrama integral tiene, dada la naturaleza de la variable, forma de
escalera.
Ejemplo 2.3.3. Para la información dada en la tabla 2.10 elaborar los diagramas diferencial e integral
correspondientes.
Número de hijos 1 2 3 4
Frecuencia 1 3 5 3
Tabla 2.10: Clasicación de un grupo de familias por el número de hijos.
Solución:
En primer lugar, se debe obtener la distribución de frecuencias del número de hijos. Tal distribución
se presenta en la tabla 2.11. Con las frecuencias relativas se realizan los diagramas requeridos. Los
grácos utilizando las frecuencias absolutas son idénticos salvo por un cambio de escala en el eje de
las ordenadas.
Se observa que el gráco integral es creciente y que los saltos corresponden a la magnitud de las
barras del gráco diferencial. En la gura 2.3 se presentan estos grácos.
Ci ni fi Ni Fi
1 1 0.083 1 0.083
2 3 0.250 4 0.333
3 5 0.416 9 0.750
4 3 0.250 12 1
Total 12 1 N.A. N.A.
Grácos para variables cuantitativas continuas
Histogramas y polígonos de frecuencias
Cuando las variables son cuantitativas continuas se utilizan los histogramas y los polígonos de fre-
cuencias. Un histograma se construye a partir de la distribución de la frecuencias asociando a cada
categoría un rectángulo que tiene a cada intervalo como base. El criterio para calcular la altura de
Figura 2.3: Grácos diferencial (a) e integral (b) de los datos de la tabla 2.10.
cada rectángulo es mantener la proporcionalidad entre la frecuencia de cada intervalo y el área del
mismo.
Una vez se ha elaborado el histograma, el polígono de frecuencias consiste en unir mediante líneas
rectas los puntos superiores de cada rectángulo localizados en los puntos medios de cada intervalo.
Tales cantidades se denominan marcas de clase y están dadas por
li−1 + li
xi =
2
donde xi denota la marca de clase, y li−1 y li son el límite inferior y superior respectivamente de
i-ésimo intervalo para i = 1, . . . , k .
Un polígono de frecuencias acumulado u ojiva es un diagrama integral para una variable cuan-
titativa continua, y se obtiene de la misma forma que un polígono de frecuencias corriente, pero en
lugar de dibujar el polígono sobre el histograma, se representa sobre el diagrama de barras de las
frecuencias acumuladas.
Ejemplo 2.3.4. En la gura 2.4 se presenta un ejemplo de un polígono de frecuencias y un polígono

de frecuencias acumulado.
Nota. Con el propósito de facilitar la lectura de los histogramas y de representar la información con
mayor precisión, es costumbre suavizar los polígonos de frecuencias como se ilustra en la gura 2.5.
Figura 2.4: Ejemplo de un polígono de frecuencias (a) y de un polígono de frecuencias acumulado (b).
Figura 2.5: Ejemplo de un polígono de frecuencias suavizado.

Pictogramas
Un pictograma expresa con dibujos alusivos al tema de estudio las frecuencias de las modalidades de
la variable. Estos grácos se hacen representando a diferentes escalas un mismo dibujo. El escalamiento
de los dibujos debe ser de tal forma que el tamaño de cada uno de ellos sea proporcional a la frecuencia
absoluta o relativa de la modalidad que representa. Este tipo de grácos suele usarse en los medios de
comunicación, para que sean comprendidos por el público no especializado, sin que sea necesaria una
explicación compleja.
Ejemplo 2.3.5. En la gura 2.6 se presenta un pictograma

2
en el que se evidencia el número de
hectáreas de trigo cultivadas entre 1992 y 1997.
Figura 2.6: Ejemplo de un pictograma.
Cartogramas
Los cartogramas se utilizan cuando los datos disponibles hacen referencia a diferentes zonas geográ-
cas, de forma tal que los diferentes valores de la variable se indican con diferentes colores y tramas
sobre la zona correspondiente de acuerdo con el carácter que representan.
Ejemplo 2.3.6. En la gura 2.7 se presenta un cartograma

3
en el que se evidencia la urbanización
en el mundo atendiendo a la industrialización.
Diagrama de tallos y hojas
Similar a un histograma, un diagrama de tallos y hojas es una forma adicional de representar

las frecuencias asociadas con una variable cuantitativa, donde las clases conforman los tallos y las
frecuencias correspondientes al interior de cada tallo son las hojas . Una forma de elaborar el diagrama
si los datos son números de dos cifras, por ejemplo, consiste en escoger cada tallo como el primer dígito
2 Gráca tomada de la página web http://profematesnoemi.blogspot.com/2011/04/

ejemplos-de-pictogramas-estadisticos.html.
3 Gráca tomada de la página web http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica/
cartograma.html.
Figura 2.7: Ejemplo de un cartograma.
de los datos y cada hoja como el último dígito; de tal forma que si el dato es 42 entonces el tallo es
4 y la hoja es 2. El diagrama usa una representación en dos columnas; en la primera se ordenan los
valores de los tallos, y en la segunda, separada por una línea vertical de la primera, se colocan dentro
los valores de cada hoja ordenados ascendentemente sin importar que haya valores repetidos.
Nota. Cuando los datos son números muy grandes es necesario aproximarlos a cantidades cercanas a
cientos, dependiendo de las diferencias que se presenten.
44 45 50 62 45 51 44 50 58 44
49 62 61 53 56 56 60 54 55 47
Tabla 2.12: Datos asociados con el número de clientes de un almacén atendidos en los últimos 20 días.
Ejemplo 2.3.7. Un almacén reconocido con una capacidad máxima de atención de 60 clientes está
considerando contratar más personal, puesto que en los últimos días se ha visto corta de empleados
para atender a la clientela. Para vericar esto se realiza un diagrama de tallos y hojas con la información
de la tabla 2.12 correspondiente al número de clientes atendidos en los últimos 20 días.
Una vez realizado este diagrama de tallo y hojas (tabla 2.13), el almacén decide no contratar más
personal, puesto que la capacidad de atención a sido superada únicamente en 3 ocasiones.
Diagramas de líneas
2.4. COMENTARIOS 33
Tallo | hojas
4 | 4445579
5 | 001345668
6 | 0122
Tabla 2.13: Ejemplo de un diagrama de tallo y hojas.
Los diagramas de líneas son grácos diseñados especialmente para representar una estructura
especial de datos longitudinales (detalles en la sección 1.6) denominada serie de tiempo. Este tipo
de datos surge cuando un mismo individuo es observado en diferentes ocasiones momentos con el
propósito de analizar la evolución de la variable de estudio a través del tiempo y de realizar pronósticos
con base en la tendencia observada. En estos diagramas la variable de estudio se presenta en el eje
y, mientras que los tiempos de medición correspondientes se muestran en el eje x, de tal forma que
se unen mediante líneas rectas las observaciones registradas. Ejemplos clásicos de las series de tiempo
son las series económicas.
Ejemplo 2.3.8. En la gura 2.8 se presenta un ejemplo de una serie de tiempo correspondiente al
4
precio nal (en miles de pesos) del galón de gasolina corriente en Bogotá .
2.3.3. Sobre los grácos
Cuando se elabora un gráco hay que tener en mente su objetivo primordial: dar a entender de
manera clara y sencilla el comportamiento de una o varias variables e identicar fácilmente cualquier
fenómeno de interés, como la concentración de los valores de una variable en alguna clase, la existencia
categorías sin propósito, la presencia de datos atípicos, etc. Por tal motivo, se debe tener especial
atención en las partes que conforman los grácos, como el título principal, el título de los ejes, el
color, el tamaño y la escala, ya que se puede desviar la atención del gráco cuando éste es muy
estrambótico o colorido, o dicultar la lectura cuando se desconoce el signicado de los ejes, por
ejemplo.
2.4. Comentarios
En este capítulo se abordan las formas básicas de resumir variables cualitativas y cuantitativas por
medio de tablas y grácas. Las tablas permiten evidenciar cómo se comportan las variables respecto a
4 Datos tomados de la página web http://www.unalmed.edu.co/~ndgirald/programas/R/curso%20series/ejemplo.

gasolina.bogota.r.
Figura 2.8: Ejemplo de una serie de tiempo.
los grupos o categorías que ellas mismas denen con relación a la información que se tiene, dependiendo
de las especicaciones del problema y de las necesidades del investigador.
De otro lado, es de suma importancia la representación gráca si se quiere evidenciar la información

que se encuentra almacenada en las bases de datos, puesto que tales representaciones hacen más fácil
asimilar y mostrar las características de las variables de interés. Para estos casos los grácos también
son de mucha utilidad, ya que al ser de fácil interpretación, es posible utilizarlos para comparar varios
fenómenos a la vez de manera descriptiva.
2.5. Ejercicios
2.1. Los datos que aparecen a continuación corresponden a los porcentajes de rentabilidad de las
acciones de una muestra de 25 empresas.
2.5. EJERCICIOS 35
30.8 20.3 24.0 29.6 19.4 38.0 24.5 21.5 25.6

30.8 32.9 30.3 39.5 13.3 28.0 19.9 24.6 32.3
30.7 20.3 24.7 18.7 36.8 31.2 50.9
a. Elaborar una tabla de frecuencias de cinco clases, el histograma y la ojiva correspondiente.

Comentar los resultados.
b. Responder:
i. ¾Qué porcentaje de acciones tienen el porcentaje de rentabilidad mayor que 28.34 %?
ii. ¾Cuántas acciones tienen el porcentaje de rentabilidad entre 35.86 % y 43.38 %?
iii. ¾Qué porcentaje de acciones tienen el porcentaje de rentabilidad entre 43.38 % y 50.90 %?
iv. ¾Cuántas acciones tienen el porcentaje de rentabilidad menor que 28.34 % o mayor que
43.38 %?
2.2. Los datos que se presentan a continuación corresponden a las cuentas telefónicas mensuales (en
miles de pesos) de una muestra de residentes de un sector de una ciudad:
21.48 21.15 25.12 23.47 27.81 19.80 36.05 28.50 26.66

20.35 30.22 25.49 20.80 23.83 25.35 23.48 25.81 21.07
22.98 27.24 30.16 21.36 20.91 27.36 26.98 33.54 20.24
28.52 27.34 31.87 21.63 22.30 21.22 27.36 23.39 23.96
22.58 25.87 27.29 29.80 17.13 34.55 24.09 22.21 30.23
26.83 30.96 33.38 20.77 19.98 35.87 22.02
a. Elaborar la tabla de frecuencias.
b. ¾Cuáles son las categorías o clases de cuentas que ocurrieron con menor frecuencia?
c. Realizar un gráco con el cual se pueda discutir la siguiente armación: hay concentración de
los montos de las cuentas telefónicas.
2.3. Se ha realizado una encuesta a 600 personas que se encuentran en un centro comercial sobre
el tipo de almacén que más frecuentan dándoles a escoger algunas opciones que guran en un
formulario. Se han obtenido los siguientes porcentajes: calzado, 10 %; vestimenta, 18 %; artículos
deportivos, 12 %; artículos decorativos, 4 % y alimentación, 26 %. Hacer la tabla de las frecuencias
y el gráco correspondiente. ¾Como podría utilizar esta información el administrador del centro
comercial?
2.4. Para decidir sobre el número de mostradores de servicio necesarios para las tiendas que se construi-
rán en el futuro, una cadena de supermercados desea obtener información acerca de la duración
(en minutos) requerida para atender a sus clientes. Para encontrar la distribución de tiempos de
servicios a clientes se registró la siguiente información correspondiente a 70 clientes:
a. Construir un diagrama de tallos y hojas.
b. Realizar un histograma de frecuencias relativas.

4.6 1.3 0.2 0.7 0.7 1.3 0.7 0.2 2.3 3.7 6.6 2.5
0.6 2.1 0.7 0.6 1.6 1.3 0.4 0.6 3.2 3.1 4.4 0.6
0.5 1.2 0.9 1.9 1.6 1.3 3.0 0.1 0.7 0.0 0.8 0.1
1.2 3.0 3.5 2.2 0.1 0.1 5.8 1.7 0.8 1.7 1.3 2.5
7.0 4.0 1.0 2.6 0.2 0.3 0.1 0.2 0.9 7.8 2.9 0.1
1.9 4.9 2.1 2.1 0.9 0.2 6.8 0.4 6.3 2.2
c. Comparar los grácos de los incisos anteriores. ¾Muestran estos diagramas la misma informa-
ción?
d. ¾Qué fracciones de los tiempos de servicio son menores o iguales a un minuto? ¾Y entre uno
y dos minutos? ¾Cuáles son los tiempos de servicio mínimo y máximo?
e. Describir la distribución de los datos.
2.5. La gerencia de una empresa mencionó en su informe anual las siguientes cifras en miles de millones
de pesos correspondientes a las ventas netas y el costo de producción desde 2000.
Año 2000 2001 2002 2003 2004 2005

Ventas 13.66423 16.04312 13.87701 15.69092 15.36861 15.64851
Costo 9.56496 11.23018 9.71390 10.98364 10.75802 10.95395
Año 2006 2007 2008 2009 2010 2011
Ventas 14.56017 14.13358 15.86530 14.49018 14.24122 16.34574
Costo 10.19211 9.893505 11.10571 10.14312 9.96885 10.05345
a. Calcular y representar anualmente la utilidad neta entendida como la diferencia entre las
ventas y el costo de producción.
b. Calcular y representar el cambio porcentual de la utilidad neta respecto al año inmediatamente

anterior.
c. ¾En que año se logró la utilidad máxima? ¾Y la utilidad mínima? ¾Cuáles fueron estas utili-
dades? ¾En qué periodo se presentó el mayor cambio en las utilidades? ¾Y el menor? ¾Cuál
fue la magnitud de estos cambios?
2.6. El valor de una variable cuantitativa se mide una vez al año durante un periodo de 10 años. A
continuación se presentan los resultados obtenidos:
Año 1 2 3 4 5 6 7 8 9 10
Medición 61.5 62.3 60.7 59.8 58.0 58.2 57.5 57.5 56.1 56.0
a. Realizar un diagrama de líneas.
b. Describir las mediciones a partir de la gráca obtenida en el numeral anterior.

2.5. EJERCICIOS 37
2.7. ¾Qué es un diagrama de Pareto? ¾Cuáles son sus características? ¾Cómo se utiliza? ¾Para que
sirve?
Utilizando un diagrama de Pareto, analizar las pérdidas por rechazos en una fábrica de papel,
teniendo en cuenta que se han detectado los conceptos que se muestran en la siguiente tabla, en
5
la que se indican los costes asociados (en miles de Euros) a cada concepto .
Concepto Perdida anual

Paralización del trabajo por avería de la máquina A 3.7
Paralización del trabajo por avería de la máquina B 52.2
Paralización del trabajo por avería de la máquina C 7.8
Paralización del trabajo por avería de la máquina D 1.9
Reclamaciones de clientes 2.8
Lotes sobrantes 6.7
Papel inutilizado durante su utilización 87.6
Inspecciones suplementarias 7.1
Coste excesivo del material 4.2
Costes elevados de vericación 0.7
2.8. Calcular los datos que faltan en la siguiente tabla y elaborar el gráco diferencial e integral
correspondientes.
Ci ni fi Ni
[0; 10) 60 f1 60
[10; 20) n2 0.4 N2
[20; 30) 30 f3 170
[30; 100) n4 0.1 N4
[100; 200] n5 f5 200
Total n N.A.
2.9. En la siguiente tabla se muestran las cifras (en millones de USD) relacionadas con películas
6
más taquilleras de los últimos años . Los datos corresponden a la taquilla en Estados Unidos, la
recaudación mundial, el presupuesto y el año de estreno.
5 Datos tomados de la página web http://www.jomaneliga.es/PDF/Administrativo/Calidad/Diagrama_de_Pareto.

pdf.
6 Datos tomados de la página web http://www.boxofficemojo.com/alltime/world/.
# Película Distribuidor Taquilla Recaudación Presupuesto Año

1 Avatar 20th Century 760.5 (27.3 %) 2,782.2 387.0 2009
Fox
2 Titanic Paramount Pic- 658.6 (30.1 %) 2,185.3 200.0 1997
tures
3 Los vengadores Marvel Studios / 600.0 (41.3 %) 1,436.2 220.0 2012
Paramount Pic-
tures / Walt Dis-
ney Pictures
4 Harry Potter y Warner Bros 381.0 (28.7 %) 1,328.4 250.0 2011
las reliquias de la
muerte Parte 2
5 Transformers: el Paramount Pic- 352.3 (31.4 %) 1,123.7 195.0 2011
lado oscuro de la tures / Dream-
luna Works
6 El Señor de New Line Cine- 377.8 (33.7 %) 1,119.9 94.0 2003
los Anillos: el ma
retorno del rey
7 Piratas del cari- Walt Disney Pic- 423.3 (40 %) 1,066.1 225.0 2006
be: el cofre del tures
hombre muerto
8 Toy Story 3 Walt Disney Pic- 415.0 (39 %) 1,063.1 200.0 2010
tures / Pixar
9 Piratas del ca- Walt Disney Pic- 241.0 (23.2 %) 1,043.8 250.0 2011
ribe: en mareas tures
misteriosas
10 Guerra de las ga- 20th Century 474.5 (46.2 %) 1,027.0 115.0 1999
laxias: la amena- Fox
za fantasma
11 Alicia en el país Walt Disney Pic- 334.1 (33.6 %) 1,024.2 200.0 2010
de las maravillas tures
12 Batman: el caba- Warner Bros 533.3 (53 %) 1,001.9 185.0 2008
llero de la noche
a. Representar separadamente la información relacionada con el distribuidor y el año de estreno.

Comentar los resultados obtenidos.
b. Calcular la taquilla fuera de los Estados Unidos y la utilidad neta entendida como la diferencia
entre la recaudación y el presupuesto.
c. Realizar un histograma de frecuencias relativas para la utilidad neta de las películas y con ésta
describir la distribución de las ganancias de los distribuidores.
2.10. A continuación se muestra la distribución del consumo anual (en puntos porcentuales) de un país
y de una de sus ciudades principales. Realizar un diagramas de sectores y de barras en cada caso y
2.5. EJERCICIOS 39
comentar los resultados obtenidos. ¾Cuáles grácos deben ser publicados? ¾Cuáles sectores tienen
mayor consumo? ¾Cuáles sectores tienen el menor consumo?
Categoría País Ciudad

Comida 12.8 13.6
Bebidas alcohólicas 0.9 1.1
Hogar 34.4 33.6
Prendas de vestir y servicios 3.5 4.9
Transporte 15.8 16.3
Salud 6.5 6.1
Entretenimiento 5.3 6.3
Cuidado personal y servicios 1.2 1.6
Lectura 0.2 0.2
Educación 2.2 0.6
Productos de tabaco 0.8 0.8
Varios 1.7 1.5
Donaciones 3.5 3.4
Seguros y pensiones 11.2 10.0
2.11. ¾Qué es un diagrama de puntos? ¾Cuáles son sus características? ¾Cómo se utiliza? ¾Para que
sirve? Mostrar una aplicación al respecto.
2.12. A continuación se presenta un conjunto de datos asociados con a la preferencia que tienen los
individuos en relación con la marca de vehículos según su punto de fabricación. En este formulario
se tuvieron en cuenta la zona de procedencia de los vehículos (1=Asia; 2=Europa; 3=Estados
Unidos), el género (0=Masculino; 1= Femenino) y la edad (en años cumplidos) de los individuos
que respondían el formulario.
a. Clasicar las variables.
b. Realizar un diagrama de barras para cada variable.
c. Elaborar una tabla a tres vías de clasicación con las frecuencias relativas tomando como
clases para la edad los siguientes intervalos: 26-30 años, 31-35 años y 36-40 años.
d. Comentar los resultados obtenidos.

Marca Género Edad Marca Género Edad

2 0 36 2 1 32
3 1 36 2 1 32
2 1 32 2 0 32
1 1 36 3 0 33
1 0 32 3 1 35
1 0 29 3 1 34
3 0 35 3 0 32
2 0 32 3 1 32
2 0 32 3 0 36
2 0 32 1 1 29
3 1 36 1 1 32
2 0 34 1 1 32
2 1 32 2 1 36
2 0 32 2 1 34
2 0 33 2 0 32
2 1 29 3 0 32
2 1 36 1 1 30
2 0 36 2 1 32
3 1 33 3 1 33
3 1 34 3 1 38
2 0 33 3 1 34
2 1 32 3 1 33
2 1 32 3 1 28
3 1 36 3 1 33
1 0 32 2 1 32
Capı́tulo 3
Medidas de tendencia central y de posición
3.1. Introducción
Cuando se realiza un análisis descriptivo de las variables de estudio que permita descubrir las anoma-
lías, estructuras, frecuencias y demás características relevantes de la información, se da un paso más
allá en el análisis pues se indaga ahora por las propiedades de la distribución de los datos. Con las
medidas estadísticas de tendencia central se quiere estudiar si los datos parecen estar agrupados en
uno o más grupos y que cantidades podrían ser representantes de tales grupos, o por el contrario, si
los datos se encuentran dispersos entre sí.
3.2. Medidas estadísticas de tendencia central
En el capítulo 2 se ha hecho referencia a la clasicación, ordenación y presentación de datos, limitando

el análisis de la información a la interpretación de las distribuciones de frecuencias. Otra perspectiva
del análisis estadístico se apoya en cantidades que resuman apropiadamente la información.
Al inspeccionar la información mediante la representación gráca se evidencia la distribución de los

datos en cuanto a la frecuencia con que se presentan los valores; por ejemplo, algunos valores son
más frecuentes que otros o tienen frecuencias muy bajas y se encuentran más alejados de los demás.
De este modo se puede observar una tendencia de los datos a agruparse alrededor de los valores más
frecuentes, haciendo que las grácas adquieran formas especiales (algunos ejemplos en la gura 3.1).
De aquí surge la necesidad de las medidas de tendencia central. Tales medidas son de gran importancia
en el análisis de la información, sin embargo, su interpretación no debe se hacer separadamente de las
41
42 CAPÍTULO 3. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
medidas estadísticas de dispersión (capítulo 4), ya que la calidad de las medidas de tendencia central
está asociada intrínsecamente con el grado de concentración de la información.
Figura 3.1: Algunas formas de una distribución de frecuencias.
3.2.1. La media aritmética

1
La media aritmética o el promedio de un conjunto de realizaciones de una variable se calcula como
la suma de todas las observaciones del conjunto dividiendo después entre la cantidad de datos del
conjunto. Esta medida le otorga a todas las observaciones la misma importancia relativa dentro del
conjunto de datos.
1 Una realización de una variable se reere explícitamente al valor observado de esta variable obtenido a partir de
la medición concreta de un individuo particular objeto de estudio.
3.2. MEDIDAS ESTADÍSTICAS DE TENDENCIA CENTRAL 43
Denición 3.2.1. Sea x1 , x2 , . . . , xn un conjunto de n realizaciones de

una variable X. La media aritmética (o simplemente media) de este
conjunto de datos, denotada con x̄, está dada por:
n
1X
x̄ = xi .
n i=1
Nota. Lamedia muestral observada de una variable X se simboliza con x̄, mientras que la media
2
poblacional se denota con µX . Así, cuando se dispone de una población nita, se tiene que
N
1 X
µX = xi
N i=1
donde N es el tamaño de la población. Además, la media se calcula para variables medidas en una
escala de intervalo o de razón.
Cuando los datos de una muestra están agrupados en una distribución de frecuencias, la media arit-
mética se calcula con la fórmula
Pk
ni xi
x̄ = Pi=1
k
i=1 ni
o con la fórmula
k
X
x̄ = fi xi
i=1
donde k es el número de clases, ni es la frecuencia absoluta, fi es la frecuencia relativa y xi es la clase

o la marca de clase de la i-ésima categoría para i = 1, . . . , k . La demostración de la equivalencia entre
estas dos fórmulas se deja como ejercicio para el lector.
Ejemplo 3.2.1. Calcular el promedio de los datos de la tabla 2.9.
Solución:
Para calcular el promedio requerido primero se deben calcular las marcas de clase, es decir, calcular
para cada categoría
li−1 + li
xi =
2
donde li−1 y li son los límites inferior y superior de la i-ésima clase respectivamente para i = 1, . . . , 6.
Una vez calculadas las marcas de clase, se calcula el valor promedio de las ganancias aplicando la
fórmula del promedio para datos agrupados.
En la tabla 3.1 se presentan los cálculos pertinentes y los resultados obtenidos.
2 La media muestral X̄ = 1 Pn
Xi corresponde a la variable promedio de la muestra cuyos valores dependen
n i=1 Pn
1
de la muestra recogida; mientras que la media muestral observada x̄ = n i=1 xi compete a un valor especíco de la
variable X̄ calculada a partir de los datos de una muestra determinada.
Clase xi ni ni xi
[60.40 ; 74.03) 67.22 5 336.08
[74.03 ; 87.67) 80.85 9 727.65
[87.67 ; 101.30) 94.48 10 944.83
[101.30 ; 114.93) 108.12 6 648.70
[114.93 ; 128.57) 121.75 3 365.25
[128.57 ; 142.20] 135.38 2 270.77
Total N.A. 35.0 3293.28
Tabla 3.1: Cálculos del ejemplo 3.2.1.
Como Pn
ni xi 3293.3
Pi=1
n = = 94.09
i=1 ni 35
entonces el valor promedio de las ganancias de las empresas es 94.09 millones.
A continuación se presentan algunas propiedades de la media aritmética:
Proposición 3.2.1. Sea X una variable y a, b números reales. Entonces se tiene que:
i. Si X=a entonces X̄ = a.
ii. Si Y = aX + b entonces Ȳ = aX̄ + b.

3
iii. Si X y Y son variables conmensurables y W = aX + bY entonces W̄ = aX̄ + bȲ .
Nota. El tercer numeral de la proposición 3.2.1 se puede generalizar a la siguiente propiedad: si

Pm
a1 , a2 , . . . , am son m números reales, X1 , X2 , . . . , Xm son m variables conmensurables y W = i=1 ai Xi
Pm
entonces W̄ = i=1 ai X̄i .
Ejemplo 3.2.2. Una compañía vende un promedio mensual de $47,700,000. La compañía paga men-
sualmente al Estado un impuesto igual al 17 % sobre las ventas. La utilidad de la compañía se calcula
teniendo en cuenta que quincenalmente paga $12,000,000 correspondientes a gastos jos de funciona-
miento además del impuesto sobre las ventas. Calcular la utilidad mensual promedio de la compañía.
Solución:
En esta situación x̄ = $47, 700, 000 donde X representa la venta mensual de la empresa. Como la
compañía paga mensualmente al Estado un impuesto igual al 17 % sobre las ventas y además gasta
3 Se dice que X y Y son variables conmensurables cuando existe una unidad común de medida en términos de la
cual tanto X como Y se pueden medir.
$12,000,000 quincenales correspondientes a gastos jos de funcionamiento entonces se concluye que
Y = (X − 0.17X) − (2 · 12, 000, 000) = 0.83X − 24, 000, 000
donde Y denota la utilidad mensual de la compañía. En consecuencia,
Ȳ = 0.83X̄ − 24, 000, 000
y por lo tanto ȳ = (0.83)(47, 700, 000) − 24, 000, 000 = 15, 591, 000 es la utilidad mensual promedio de
la empresa.
Proposición 3.2.2. Si x1 , x2 , . . . , xn es un conjunto de n realizaciones de una variable X entonces:
n
X n
X
xi = nx̄ y (xi − x̄) = 0.
i=1 i=1
Nota. Las propiedades de la media poblacional son análogas.
Ejemplo 3.2.3. De 500 estudiantes cuya estatura promedio es 1.57 metros, 150 son mujeres. Si la
estatura promedio de las mujeres es 1.52 metros, ¾cuál es la estatura promedio de los hombres?
Solución:
En este caso n = 500 (total de individuos en la muestra), n1 = 150 (total de mujeres) y n2 =

500 − 150 = 350 (total de hombres). Además, el promedio general es x̄ = 1.57 y el promedio de las
mujeres es x̄1 = 1.52. Sea x̄2 es el promedio de los hombres. Luego,
P500
i=1 xi
x̄ =
500
n1 x̄1 + n2 x̄2
1.57 =
500
(150)(1.52) + 350(x̄2 )
1.57 =
500
y por lo tanto
(1.57)(500) − (150)(1.52)
x̄2 = = 1.59
350
De este modo el promedio de los hombres es 1.59 metros.
Las siguientes son algunas observaciones acerca de la media aritmética:
• Es de uso cotidiano.
• Tiene propiedades aritméticas directas y sencillas de aplicar.
4
• Es sensible a datos atípicos .
• Corresponde a uno de los valores menos frecuentes del conjunto de datos cuando la distribución
de los datos tiene forma de U (distribución (a) de la gura 3.1).
3.2.2. La media aritmética ponderada
Se ha visto que la media aritmética se calcula con base en la magnitud de los datos, otorgándoles
igual importancia ponderación o peso a cada uno de ellos: 1/n para un conjunto de datos con n
elementos. Sin embargo, en algunas ocasiones la importancia relativa de los valores de la variable no
es la misma en todos los casos, por lo que los datos son ponderados de tal forma que esta importancia
se vea reejada en las estadísticas asociadas.
Denición 3.2.2. La media aritmética ponderada es un promedio

que tiene en cuenta la importancia relativa de cada uno de los datos. La
fórmula de la media aritmética ponderada es
P
w i xi
x̄ = Pi
i wi
donde wi es la ponderación y xi es el dato, la clase o la marca de clase

correspondiente.
Nota. El límite superior de las sumatorias de la fórmula anterior depende de si se dispone de datos
agrupados o no agrupados.
Ejemplo 3.2.4. Las calicaciones de un estudiante están conformadas de acuerdo a la información

que se presenta en la tabla 3.2. Calcular la calicación promedio del estudiante.
Actividad Calicación Valor

Examen 4.5 40 %
Trabajo 1.0 10 %
Investigación 3.5 50 %
Tabla 3.2: Datos asociados con las calicaciones de un estudiante.
Solución:
4 Los datos atípicos (outliers en inglés) son datos muy grandes o muy pequeños comparados con el grueso del
conjunto de datos. Son observaciones con un comportamiento extraño porque toman valores que no se esperan (detalles
en la sección 4.4).
Se observa que las actividades académicas no tienen el mismo peso en la evaluación de la asignatura.
Por lo tanto, siguiendo la fórmula del promedio ponderado se obtiene que
(4.5)(0.4) + (1.0)(0.10) + (3.5)(0.50)

x̄ = = 3.65.
0.40 + 0.10 + 0.5
Luego, el estudiante aprueba la asignatura con 3.42.
3.2.3. La mediana
Otra medida de tendencia central es la mediana, la cual no se basa en la magnitud de los valores,
como la media aritmética, sino en la posición central que ocupa en el conjunto de datos ordenado
ascendentemente, dividiendo la información en dos partes iguales.

una variable X. La mediana de este conjunto de datos, denotada con
x̃, se calcula como sigue:

x n+1 si n es impar
( )
x̃ = x n 2 +x n +1
(
 2 ) (2 )
2 si n es par
donde x(i) es la observación que ocupa la i-ésima posición del conjunto

de datos ordenado ascendentemente para i = 1, . . . , n.
Nota. Lamediana muestral observada de una variable X se simboliza con x̃, mientras que la
5
mediana poblacional se denota con µ̃X . Además, la mediana se calcula para variables medidas en
al menos una escala ordinal.
6
Así, para determinar la mediana de un conjunto de n datos brutos , se realiza el siguiente procedi-
miento:
i. Ordenar los datos ascendentemente.
ii. Calcular el valor de la mediada dependiendo de si n es par ó impar:
• Si n es impar, entonces, la mediana es el dato en el centro del conjunto de valores, es decir,

n+1
el dato que se encuentra en la posición
2 .
• Si n es par, entonces, la mediana es la media de los dos datos que ocupan las posiciones
n n
centrales, esto es, el promedio de los datos que se encuentran en las posiciones
2 y 2 + 1.
5 El lector ya está familiarizado con la diferencia entre un estadístico y su realización.
6 Los datos brutos son datos sin agrupar o alguna otra modicación.
Ejemplo 3.2.5. Los datos de la tabla 3.3 corresponden al número de hijos de una muestra de em-
pleados de una empresa. Calcular e interpretar la mediana.
Solución:
El tamaño de la muestra es n=40. Ahora, debido a que el total de datos es par y que los datos de
la tabla están organizados ascendentemente, se tiene que la mediana es el valor ubicado entre las
n n
observaciones de las posiciones
2 = 20 y
2 + 1 = 21. Por lo tanto la mediana es
1+1
x̃ = = 1.
2
Este valor indica que la mitad de los empleados no tienen hijos o tienen uno solo.
¾De qué otra manera se puede interpretar la mediana en este caso?
Número de hijos 0 1 2 3 4 Total

Frecuencia 12 12 6 4 6 40
Tabla 3.3: Datos asociados con el número de hijos de una muestra de empleados de una empresa.
Cuando los datos están agrupados en una tabla de frecuencias por intervalos, el cálculo de la mediana
es como sigue:
(0.5)n − Ni−1
x̃ = li−1 + (li − li−1 )
ni
donde i = mı́n{j : Nj > (0.5)n} es el número de la primera clase cuya frecuencia absoluta acumulada
es superior a (0.5)n.
Ejemplo 3.2.6. Calcular e interpretar la mediana de los datos del ejemplo 2.9.
Solución:
Se observa que las ganancias se encuentran organizadas en una tabla de frecuencias. En este caso i es
el número del primer intervalo cuya frecuencia absoluta acumulada es superior a (0.5)n = (0.5)(35) =
17.5; este intervalo es el número 3. Así, se obtiene que:
17.5 − (5 + 9)
x̃ = 87.67 + (101.30 − 87.67) = 92.44.
10
Entonces la mitad de las empresas tiene ganancias inferiores a 92.44 millones. Además, parece que
el valor de la ganancia mediana (92.44 millones) y el valor de la ganancia promedio (94.09 millones)
7
no dieren signicativamente . Esto sugiere que no hay ganancias atípicas que inuyan de manera
importante en la distribución de los datos. Es decir, la distribución de las ganancias de las empresas
parece ser simétrica con respecto a 94.09 millones.
7 Para comprobar este hecho formalmente es necesario docimar una hipótesis estadística.
Las siguientes son algunas observaciones acerca de la mediana:
8
• No se ve afectada por datos atípicos, es decir, es robusta frente a observaciones extremas, ya
que no depende de los valores que toma la variable, sino del orden de los mismos. Por ello, el
uso de la mediana es adecuado cuando la distribución de los datos no es simétrica.
• No tiene propiedades aritméticas directas y sencillas de aplicar como la media aritmética.
3.2.4. La moda
La moda, como su nombre lo indica, es el valor más común (de mayor frecuencia) en un conjunto de
datos. Una distribución de datos puede tener una moda unimodal, dos modas bimodal o varias
modas multimodal. Asimismo, puede ocurrir que la distribución de los datos no tenga moda.
Denición 3.2.4. Se llama moda a cualquier valor que maximice la

distribución de frecuencias de un conjunto de datos.
Nota. La moda muestral observada de una variable X se simboliza con x̆, mientras que la moda
poblacional se denota con µ̆X . Además, la moda se calcula para variables medidas en cualquier tipo
de escala.
Ejemplo 3.2.7. Calcular e interpretar la moda de los datos del ejemplo 3.2.5.
Solución:
Aquí se trata de un conjunto de datos bimodal debido a que hay dos valores de la variable que
maximizan la distribución de frecuencias. Estos valores de la variable son el valor 0 y el valor 1,
ambos con frecuencia absoluta igual a 12, lo que quiere decir que lo más frecuente para este grupo de
empleados es que no tengan hijos o tengan uno solo.
Cuando los datos están agrupados en una tabla de frecuencias por intervalos, el cálculo de la moda es
como sigue:
ni − ni−1
x̆ = li−1 + (li − li−1 )
(ni − ni−1 ) + (ni − ni+1 )
donde i ∈ {j : nj ≥ nl , ∀l = 1, . . . , k} es el número de un intervalo cuya frecuencia absoluta es la
mayor y k es el número de categorías.
8 Una medida se llama robusta si su magnitud no se altera notoriamente cuando hay cambios drásticos en la
estructura general del conjunto de datos donde es calculada.
Ejemplo 3.2.8. Calcular e interpretar la moda de los datos del ejemplo 2.9.
Solución:
Se observa que las ganancias se encuentran organizadas en una tabla de frecuencia. En este caso i es
el número del intervalo cuya frecuencia absoluta es la mayor; este intervalo es el número 3. Así, se
obtiene que:
10 − 9
x̆ = 87.67 + (101.30 − 87.67) = 90.39.
(10 − 9) + (10 − 6)
La moda sugiere que las ganancias que aparecen con mayor frecuencia se encuentran alrededor de
93.39 millones y pertenecen al intervalo donde se encuentra tal ganancia modal.
Las siguientes son algunas observaciones acerca de la moda:
• Puede no ser única.
• No tiene propiedades aritméticas directas y fáciles de aplicar como la media aritmética.
3.2.5. La media geométrica
Una medida originada a partir de la geometría es la media geométrica, la cual hace parte de las
medias pitagóricas : la media aritmética, la media geométrica y la media armónica.
Denición 3.2.5. Sea x1 , x2 . . . , xn un conjunto de n realizaciones de

una variable X . La media geométrica de este conjunto de datos, de-
notada con Gx , se calcula como la raíz n-ésima de la productoria de los
valores del conjunto de datos, es decir:
v
u n
uY
n
Gx = t xi .
i=1
Nota. La media geométrica se calcula sobre un conjunto de datos cuyos valores sean números no
9
negativos, usualmente porcentajes y tasas .
Una forma de saber cómo y cuándo se debe usar la media geométrica es teniendo en cuenta lo siguiente:
si el total se obtiene de una productoria de valores, ¾cuál es el valor que al reemplazarlo en todas las
9 Una tasa se reere a la relación entre dos magnitudes asociada con la relación entre la cantidad y la frecuencia de
un fenómeno. Son ejemplos la tasa de inación, la tasa de desempleo y la tasas de natalidad (Real Academia Española
2012d).
observaciones daría como resultado el mismo total? Es decir, la media geométrica se usa cuando el
total corresponde al producto de diferentes observaciones, mientras que la media aritmética se utiliza
cuando el total es obtenido mediante la adición de las observaciones.
Ejemplo 3.2.9. Se tiene un activo en la banca que genera ganancias del 30 % en el primer año, 20 %
en el segundo y 60 % en el tercero. ¾Cuál es la ganancia promedio?
Solución:
Lo primero que se debe observar es que el promedio requerido no es el promedio aritmético, pues lo
que se tiene no es una adición de capital en cada año, sino una multiplicación del mismo. En el primer
año se multiplica por 1.3, en el segundo por 1.2 y en el tercero por 1.6; y así, la ganancia que se obtiene
al nal de los tres años está multiplicada por estas tres cantidades. Luego, la ganancia promedio se
obtiene mediante:
p
3
√
3
Gx = (1.3)(1.2)(1.6) = 2.496 = 1.356.
En consecuencia, la ganancia promedio del activo es 35.6 %.
Nota. En ejemplo 3.2.9 la media aritmética y la media geométrica dieren notablemente.
A continuación se presenta una propiedad de la media geométrica:
Proposición 3.2.3. Sea x1 , x2 . . . , xn un conjunto de n realizaciones de una variable X. Entonces

se tiene que:
log(x) = log(Gx )
esto es,
v 
n u n
1 X u
n
Y
log(xi ) = log  t xi  .
n i=1 i=1
Ejemplo 3.2.10. Comprobar el resultado de la proposición 3.2.3 con la información del ejemplo 3.2.9.
Solución:
El promedio de los logaritmos de los datos es:
log(1.3) + log(1.2) + log(1.6) 0.114 + 0.079 + 0.204

log(x) = = = 0.132
3 3
que es igual al logaritmo de la media geométrica log (Gx ) = log(1.356) = 0.132.
A continuación se presenta sin demostración una proposición que establece la relación entre la mag-
nitudes de la media geométrica y de la media aritmética de un conjunto de observaciones positivas.
Esta proposición fue presentada por Augustin Louis Cauchy 10
en el siglo XIX y es como sigue:
10 Fotografía tomada de la página web http://www.saintpol.fr/genealogie/thematiques/cauchy.html.

Proposición 3.2.4. Si x1 , x2 , . . . , xn es un conjunto de n números reales positivos entonces se satis-

face que
v
u n n
uY 1X
n
t xi ≤ xi ,
i=1
n i=1
es decir, la media geométrica no supera la media aritmética de un conjunto de observaciones positivas.
Figura 3.2: Augustin Louis Cauchy (17891857).
Las siguientes son algunas observaciones acerca de la media geométrica:
• Es menos sensible a datos atípicos que la media aritmética.
• Es igual a 0 si algún valor del conjunto de datos es nulo.
• En algunos casos no está denida para conjuntos de datos que tengan valores negativos.
3.2.6. La media armónica
La media armónica última de las medias pitagóricas se enfoca en el promedio de medidas de razón.
Denición 3.2.6. Sea x1 , x2 . . . , xn un conjunto de n realizaciones de

una variable X. La media armónica de este conjunto de datos, deno-
tada con Hx , se calcula como el inverso de la media aritmética de los
inversos de los datos, es decir:
n
Hx = Pn 1 .
i=1 xi
En variadas ocasiones esta medida de tendencia central no ha sido bien implementada, ya que existe
una confusión generalizada a la hora de decidir si usar la media aritmética o la media armónica como
medida de resumen.
Ejemplo 3.2.11. Se dispone de la información dada en la tabla 3.4 acerca de tres autos y sus
velocidades. Calcular la razón promedio de las velocidades.
Auto Velocidad (km/h)

A 10
B 20
C 30
Tabla 3.4: Datos asociados con las velocidades de tres vehículos.
Solución:
La media aritmética se utiliza cuando los denominadores se mantienen constantes, esto es, cuando el
tiempo es constante; mientras que la media armónica se emplea cuando el tiempo no es constante.
Por ello, solo con esta información no es posible decidir cuál de las dos medias es la correcta, así que
se consideran los siguientes escenarios:
1. Todos los autos viajan un periodo de 24 horas.
2. Todos los autos recorren una distancia de 30 kilómetros.
Luego, en el escenario 1, el tiempo total es(3)(24) = 72 horas y la cantidad de kilómetros recorridos es

240 + 480 + 720 = 1440; así, la velocidad promedio es 1440/72 = 20 kilómetros por hora. De otro lado,
en el escenario 2, se recorren 90 kilómetros y se emplean 1 + 1.5 + 3 = 5.5 horas, luego la velocidad
promedio es: 90/5.5 = 16.36 kilómetros por hora.
En otras palabras se puede decir que en el escenario 1, al mantenerse constante el tiempo de trabajo,
se mantiene jo el denominador de la razón y por tanto se debe usar la media aritmética:
10 + 20 + 30
x̄ = = 20
3
Además, en el escenario 2, al mantenerse constante la distancia recorrida, se mantiene jo el numerador

de la razón y por tanto se debe usar la media armónica:
3
Hx = 1 1 1 = 16.363
10 + 20 + 30
Se observa que son los mismos resultados obtenidos con el razonamiento inicial.
A continuación se presenta una propiedad de la media armónica:
Proposición 3.2.5. Sea x1 , x2 . . . , xn un conjunto de n realizaciones de una variable X. Entonces

se tiene que:
1 1
=
x Hx
esto es,
n
X 1 1
= .
x Pn n
i=1 i
1
i=1 xi
Ejemplo 3.2.12. Comprobar el resultado de la proposición 3.2.5 con la información del ejemplo
3.2.11.
Solución:
El promedio de los inversos de los datos es:
1 1 1
1 10 + 20 + 30 0.100 + 0.050 + 0.033
= = = 0.061
x 3 3
1 1
que es igual al inverso de la media armónica
Hx = 16.363 = 0.061.
Las siguientes son algunas observaciones acerca de la media armónica:
• No está denida cuando en el conjunto de datos alguno de los valores es nulo o en el caso de que
la suma de sus inversos sea igual a 0.
• Se garantiza su existencia si todos los datos del conjunto son positivos ó negativos.
• Resulta poco afectada por la existencia de valores grandes en el conjunto de datos; mientras
que es sensible a los valores cercanos a 0.
3.3. MEDIDAS DE POSICIÓN 55
3.3. Medidas de posición
Las medidas de posición permiten conocer otros puntos característicos de la distribución de los datos
diferentes a las medidas de tendencia central, que permiten dividir la información a conveniencia.
A continuación se presentan las medidas de posición de uso frecuente en estadística: el rango y los
percentiles.
3.3.1. El rango
En este ámbito, el rango de un conjunto de observaciones corresponde a los valores que describen la
posición en la que se encuentra cada valor del conjunto de datos ordenado ascendentemente.
Denición 3.3.1. El rango de un conjunto de datos se reere a cualquier

dispositivo que establece la posición de cada observación del conjunto de
datos ordenado ascendentemente.
Nota. No se debe confundir el rango de un conjunto de datos denido en esta sección con el rango de-
11
nido en la sección 2.2.2 para elaborar histogramas. De otro lado, cuando haya empates la asignación
del rango varía según el objetivo de la misma. En unos casos se asigna la posición de manera aleato-
ria entre los individuos empatados y en otros se asigna el promedio de las posiciones que tomarían,
eventualmente.
52 56 50 41 50 62 55 46 62 48
46 62 53 55 43 42 47 50 42 65
Tabla 3.5: Datos asociados con los puntajes de una muestra de 20 empresas en relación a la calidad de sus servicios.
Ejemplo 3.3.1. Los datos de la tabla 3.5 corresponden a los puntajes de una muestra de 20 empresas
en relación a la calidad de sus servicios. Encontrar el rango del conjunto de datos.
Solución:
Lo primero que se debe hacer es ordenar los datos ascendentemente sin perder su identicación. Una
vez hecho esto, es claro que los valores 41 y 65 son el mínimo y el máximo de dicho conjunto de datos
y que hay solo una empresa con cada uno de estos valores, en este caso los individuos 7 y 20; por lo
tanto la posición que tendrán estos individuos en el rango es 1 y 20 respectivamente.
Para asignar la segunda posición se debe observar que hay dos individuos con el siguiente valor más
bajo (42), luego a estas empresas (individuos 12 y 18) se les puede asignar aleatoriamente las posiciones
11 Un empate ocurre cuando dos individuos tienen el mismo valor de la variable.

2 y 3, o también se les puede asignar una posición promedio, esto es:
2+3
= 2.5.
2
De esta manera el valor en el rango de los individuos 12 y 18 es 2.5 para ambos. Siguiendo con este
procedimiento se obtiene el rango que se presenta en la tabla 3.6.
12.0 16.0 10.0 1.0 10.0 18.0 14.5 5.5 18.0 8.0
5.5 18.0 13.0 14.5 4.0 2.5 7.0 10.0 2.5 20.0
Tabla 3.6: Rango del conjunto de datos de la tabla 3.5 .
3.3.2. Los percentiles
Los percentiles son valores que se caracterizan por superar cierto porcentaje de observaciones del
conjunto de datos. Los percentiles son medidas de posición usadas constantemente para describir los
de datos en relación a una posición de interés.
Denición 3.3.2. El p-ésimo (punto) percentil es un valor tal que por

lo menos un p% de los datos tienen máximo dicho valor y al menos un
(100 − p) % de los datos tienen este valor o uno mayor.
Nota. El percentil p de una muestra se denota con pp y el de una población con πp .
Un percentil es un valor que acumula un porcentaje especíco de los datos. Se disponen principal-
mente de los percentiles como medidas de posición, y asociados a éstos como casos particulares se
tienen los cuartiles (percentiles 25, 50 y 75), por ejemplo.
Dependiendo de cómo estén dispuestos los datos (brutos o agrupados) el cálculo de los percentiles se
hará de una manera u otra. Si los datos no están agrupados, para calcular el p-ésimo percentil de un
conjunto de n datos se deben seguir los siguientes pasos:
1. Ordenar los datos ascendentemente.
2. Calcular el índice i a través de la fórmula
i = np/100
donde p el percentil de interés y n el tamaño de la muestra.
3. Calcular el percentil de acuerdo a uno de los siguientes casos:

3.3. MEDIDAS DE POSICIÓN 57
• i no es entero, se redondea al entero siguiente. Este valor aproximado de i indica

Si el índice
la posición delp-ésimo percentil.
• Si i es entero, el p-ésimo percentil es el promedio de los valores de los datos ubicados en las
posiciones i y i + 1.
Ejemplo 3.3.2. Calcular e interpretar el decil 6 (percentil 60) para los datos del ejemplo 3.3.
Solución:
Como se trata de un conjunto de datos discretos organizados en una tabla de frecuencias, el percentil
60 se calcula siguiendo los siguientes pasos:
1. Los datos ya están organizados ascendentemente en la tabla.
2. Calcular el índice i a través de la fórmula
i = np/100 = (40)(60)/100 = 24.
3. Como i es entero, el percentil 60 es el promedio de los valores de los datos ubicados en las
1+2
posiciones 24 y 25. En consecuencia, el percentil 60 es p60 = 2 = 1.5.
Este valor indica que el 60 % de los empleados tienen dos hijos o menos. ¾De qué otra manera se puede
interpretar el percentil 60 en este caso?
Cuando los datos están agrupados en una tabla de frecuencias por intervalos, el cálculo del p-ésimo
percentil es como sigue:
(p %)n − Ni−1
pp = li−1 + (li − li−1 ) (3.1)
ni
donde i = mı́n{j : Nj > (p %)n} es el número de la primera clase cuya frecuencia absoluta acumulada
es superior a (p %)n.
Nota. La fórmula anterior es casi la misma fórmula para calcular la mediana, solamente que en lugar
de escribir (0.5)n se escribe (p %)n. De hecho, la mediana es un caso particular de un percentil: es el
percentil 50, es decir, el percentil calculado cuando p = 50.
Ejemplo 3.3.3. Calcular e interpretar el decil 8 (percentil 80) para los datos del ejemplo 3.2.1.
Solución:
Se observa que las ganancias se encuentran organizadas en una tabla de frecuencias. En este caso i es
número del primer intervalo cuya frecuencia absoluta acumulada es superior a (0.80)n = (0.80)(35) =
28.0; este intervalo es el número 4. Así, se obtiene que:
(0.80)(35) − 24
p80 = 101.3 + (13.6) = 110.4.
6
Entonces se tiene que el 80 % de las empresas tiene ganancias inferiores a 110.4 millones. ¾De qué otra
manera se puede interpretar el percentil 80 en este caso?
3.3.3. Los cuartiles
Los tres cuartiles son un caso particular de percentiles. Éstos dividen el conjunto de datos en cuatro
partes con el mismo porcentaje de datos. Los cuartiles están dispuestos de la siguiente forma: el
primer cuartil, simbolizado con q1 , es el percentil 25; el segundo cuartil q2 , es el percentil 50, es decir,
la mediana; y el tercer cuartil q3 , es el percentil 75. Así,
q1 = p25 , q2 = p50 y q3 = p75 .
Una aplicación de los cuartiles en estadística consiste en realizar un gráco que describe adecuadamente
la forma de la distribución de un conjunto de datos; tal diagrama también sirve para detectar datos
atípicos. Este gráco es denominado diagrama de caja , boxplot en inglés, y es materia de estudio
en la sección 4.4.
Ejemplo 3.3.4. Calcular e interpretar los cuartiles del ejemplo 2.9.
Solución:
Aquí, los índices i, j y k corresponden a los números de los intervalos cuya frecuencia absoluta acu-
mulada es superior a (0.25)(35) = 8.75, (0.5)(35) = 17.50 y (0.75)(35) = 26.25 respectivamente. De
esta manera los cuartiles que se obtienen para este conjunto de datos son:
(0.25)(35) − 5
q1 = 74.03 + (13.63) = 79.71,
9
(0.50)(35) − 14
q2 = 87.67 + (13.63) = 92.44,
10
(0.75)(35) − 24
q3 = 101.30 + (13.63) = 106.41.
6
Con esto se puede decir que el 50 % de las ganancias se encuentra entre 79.71 y 106.41 millones, y que
el 25 % de las empresas con menores utilidades tienen ganancias inferiores a 79.6 millones, así como
el 25 % de las empresas con mayores utilidades tienen ganancias superiores a 106.41 millones.
3.4. Comentarios
Como parte de una revisión inicial de los datos, las medidas de tendencia central y de posición son
las primeras en proveer información sobre el comportamiento de los datos, como alrededor de cuáles
valores se concentran, cuáles valores son los más frecuentes y cómo se encuentran ordenados. A pesar
de que estas medidas son de cálculo e interpretación simple, tiende a haber un mal uso de las mismas,
ya sea a la hora de calcularlas o de interpretarlas, ya que fácilmente se puede utilizar el promedio
aritmético como medida de tendencia central cuando en realidad se debe usar la media geométrica, por
ejemplo; y aunque en algunos casos las diferencias no sean grandes numéricamente, éstas sí pueden
traer consecuencias graves dependiendo del contexto de las cifras. Errores tan simples como estos se
cometen día a día y por esto es que en este capítulo se enfatiza el uso adecuado de tales medidas.
3.5. EJERCICIOS 59
3.5. Ejercicios
3.1. Una compañía de mercadeo tiene dentro de su sta a 24 profesionales que realizan tareas por fuera
de la empresa con mucha frecuencia. A la gerente de esta empresa le tiene preocupada la falta
de puntualidad de sus trabajadores ya que ha recibido varias quejas en los últimos meses y cree
que esto puede dañar la reputación de la empresa. Los datos de la siguiente tabla corresponden
a la tardanza (en minutos) en llegar a las citas de trabajo de algunos empleados, clasicada por
el género:
Mujeres 6.3 10.0 9.2 7.3 4.1 6.4 9.8 8.4 5.2 0.4 5.0 0.6
Hombres 5.1 4.4 0.9 3.2 5.9 6.2 1.4 3.9 0.1 4.2 8.3 7.3
a. Calcular e interpretar la media, la mediana y la moda de la tardanza de los empleados.
b. El gerente tiene la sospecha de que algún género es más incumplido que otro. ¾Qué es posible
sugerir con base en la media, la media y la moda?
c. Si la tardanza en llegar a las citas de trabajo de las mujeres aumenta (o disminuye) x %,

calcular el valor de x de tal forma que el tiempo promedio de retraso de las mujeres coincida
con el de los hombres.
3.2. ¾Cuando es aconsejable utilizar la media geométrica? ¾Y cuando la media armónica?
3.3. El precio de una acción (Y ) se modica multiplicativamente según los cambios mensuales en la
tasa de cambio del Euro (T C ) según la siguiente regla:
(
y = 1.3 si T C ≥ 3, 000;
y = 0.9 si T C < 3, 000.
Acorde a las variaciones de la tasa de cambio para los 12 meses de la siguiente tabla, si el valor
inicial de una acción es 4, 250, calcular para ésta la valorización (o depreciación) promedio y el
valor al nal del periodo.
Si se tiene la misma inquietud anterior, ahora por semestre, ¾qué valores se obtendrían?
Mes 1 2 3 4 5 6
Semestre 1 3,148 3,087 3,210 2,956 3,215 3,053
Semestre 2 2,999 3,106 3,202 3,157 3,285 3,111
3.4. Calcular e interpretar la razón media del número de actividades por hora con la que los traba-
jadores de una fábrica realizan sus actividades (procesos de manufactura). En la siguiente tabla
se presentan los tiempos (en horas) en los que los trabajadores realizan 20 actividades, las cuales
conforman la cadena de producción.
42.20 45.70 34.60 40.20 48.90 43.80 46.00 39.50 57.80 37.20
56.40 40.30 46.90 41.70 27.20 51.70 37.90 39.60 59.00 39.00
3.5. Veintiuna personas en un salón de clase tienen una altura promedio de 168 centímetros. Si al
salón entra una persona adicional, entonces, ¾cuál es la altura que debe tener esta persona para
que la altura promedio se incremente un centímetro?
3.6. El siguiente conjunto de datos corresponde al origen y la estadía de los visitantes hospedados en
hoteles de categoría I a IV de un sector turístico determinado. Calcular la media aritmética del
número de visitantes por nacionalidad.
Categoría Nacionales ( %) Visitantes (#)

I 75.3 253,175
II 84.7 140,810
III 71.8 47,900
IV 88.0 21,372
3.7. Una empresa de manufacturación de productos químicos tiene una producción diaria de smog
3 3 3
de 110 cm en el ala A, de 80 cm en el ala B y de 149 cm en el ala C. Por otra parte el
Gobierno, decide crear una política en la cual la producción promedio máxima admisible de smog
por una empresa de químicos sea de 112.1 cm3 por día. Si la compañía mantiene una actividad de
3
producción de smog que culmina en 80 mts en cada ala, entonces se puede decir que la empresa
cumple con el requerimiento. Calcular e interpretar el valor promedio de la producción de smog
por día.
3.8. Con la información dada en la siguiente tabla, calcular la calicación de un estudiante en la

última unidad de una asignatura considerando que quiere aprobar la materia con 3.1.
Unidad Valor ( %) Calicación

I 20 3.7
II 25 2.4
III 20 3.0
IV 15 3.2
V
3.9. Sea x1 , x2 , . . . , xn un conjunto de n realizaciones de una variable X . La media potencial de

grado α de este conjunto de datos, denotada con x̄α , está dada por:
n
! α1
1X α
x̄α = x
n i=1 i
donde α es un número real. Demostrar que x̄1 = x̄ y que x̄−1 = Hx .

3.5. EJERCICIOS 61
3.10. Un grupo de 200 estudiantes, cuya estatura promedio es de 160.96 centímetros se divide en dos
grupos, uno con una estatura promedio de 163.4 centímetros y otro con una de 157.3 centímetros.
¾Cuántos estudiantes en cada grupo?
3.11. A continuación se presentan los salarios mensuales en miles de pesos, pagados por una empresa
estatal a su personal. En la empresa se presenta un conicto laboral. El gerente propone un
aumento del 2 % para cada uno de los empleados y la junta directiva propone un aumento de 5
mil pesos quincenales para cada empleado.
Salario 300 400 500 600 700

Frecuencia 10 16 35 26 13
a. Con base en el promedio, ¾qué es más ventajoso para el Estado y qué para cada grupo de
empleados?
b. Para cada propuesta, calcular el salario a partir del cual se encuentra el 10 % de los empleados
mejor pagos de la compañía.
c. Ambas partes reconsideran sus propuestas. El gerente ahora propone un aumento de 5 %.

Calcular el valor del aumento quincenal que debe proponer la junta directiva para que en
promedio ésta sea superior a la propuesta del gerente por $10,000 mensuales.
3.12. Una de las metas de toda administración pública o privada es ganar lo más posible en relación
con el capital invertido en la empresa. Una medida del éxito en alcanzarla es el retorno sobre
la aportación, que es la relación de la ganancia neta entre el valor de las acciones. Los datos
presentados a continuación corresponden a los porcentajes de ganancia sobre las acciones para
una muestra de empresas gubernamentales del país.
# Aportación Frecuencia
1 2.0 - 5.0 4
2 5.0 - 8.0 7
3 8.0 - 11.0 11
4 11.0 - 14.0 16
5 14.0 - 17.0 21
6 17.0 - 20.0 14
7 20.0 - 23.0 9
8 23.0 - 26.0 4
a. Completar la tabla de frecuencias y representar grácamente la distribución.
b. Calcular e interpretar la media, la mediana y la moda.
c. Describir la distribución de los porcentajes de ganancia a partir de los resultados obtenidos en

el numeral anterior.
d. Calcular e interpretar los cuartiles.

3.13. Demostrar que si el producto de dos números positivos es igual a 1 entonces la suma de los mismos
no es menor que 2. Generalizar esta proposición.
3.14. Escribir la fórmula de la media geométrica y de la media armónica cuando los datos están agru-
pados en una tabla de frecuencias.
3.15. La cantidad de viajeros por hora de cada estación de una empresa de transporte en un día
determinado es como sigue:
Estación 1 2 3 4 5
Viajeros por hora 13,050 8,545 10,453 12,093 9,448
Calcular el promedio de viajeros por hora de las estaciones de la empresa.
3.16. La media aritmética de los salarios quincenales de los empleados de una empresa fue $360,000. El
promedio de los salarios de los hombres y de las mujeres fue respectivamente $370,000 y $340,000.
Determinar el porcentaje de hombres y mujeres de la compañía.
3.17. La siguiente tabla contiene los salarios quincenales (en miles de pesos) de una muestra de traba-
jadores:
Salario 550 600 700 800 3,000

a. Completar la tabla de frecuencias.
b. Determinar e interpretar la moda, la media, la mediana y el rango.
c. Calcular e interpretar los cuartiles.
d. Rehacer los numerales anteriores teniendo en cuenta que todos los empleados reciben un sub-
sidio mensual de transporte de $50, 000.
3.18. Para ocupar un puesto de trabajo vacante, la gerencia de una compañía realiza diferentes pruebas
a los aspirantes, cada una de ellas con una importancia determinada. Los resultados de las pruebas
de los dos mejores aspirantes son los siguientes:
Prueba Importancia Aspirante 1 Aspirante 2

Cultura general 1 9 7
Contabilidad 3 6 5
Idiomas 6 7 10
Informática 2 10 4
a. ¾Qué aspirante obtendrá el puesto de trabajo?

3.5. EJERCICIOS 63
b. Si un tercer aspirante obtiene las mismas notas del aspirante número 2 excepto en informática,
¾cuánto debe ser la calicación de este nuevo aspirante para obtener la misma calicación
promedio del aspirante 1?
3.19. Una entidad nanciera ha comprado dólares estadounidenses a diferentes precios (en pesos) du-
rante una semana de acuerdo a la siguiente tabla:
Pesos por dólar 1,851 1,840 1,841 1,847 1,842 1,856 1,843
Frecuencia 64 55 75 34 56 76 45
Calcular el promedio de pesos por dólar al nal de la semana.
3.20. Una agencia ha asignado un grupo de cinco empleados para completar un servicio de excursión
para un grupo de turistas. Las razones de eciencia (en minutos por turista) se dan a continuación.
Empleado Efectividad
A 10
B 8
C 15
D 12
E 9
Encontrar el promedio de efectividad de los empleados.
3.21. Un capital de $100,000,000 se coloca al 4 % el primero de enero de 2000. Si el interés se capitaliza

anualmente los días primero de enero, calcular el promedio del dinero invertido entre el 31 de
diciembre de 2000 y el 31 de diciembre de 2011.
3.22. Demostrar que si X es una variable y a es un número real positivo entonces se tiene que:
i. Si X=a entonces GX = a y HX = a.
ii. Si Y = aX entonces GY = aGX y HY = aHX .
¾Por qué a debe ser un número real positivo?
3.23. Un curso tiene 35 hombres con una edad media de 17.5 años y 15 mujeres que en promedio son
22 % más jóvenes que los hombres. ¾Cuál es la edad media del curso?
3.24. Se sabe que ninguna de las sucursales de una empresa comercial tiene más de 9 empleados o
menos de 7. La mayoría tiene 8 trabajadores, pero el 25 % tiene 9 funcionarios y una de cada 10
sucursales tiene 7 empleados. ¾Cuál es el promedio de empleados por sucursal?
3.25. ¾Qué es la media recortada? ¾Cuáles son sus características? ¾Cómo se utiliza? ¾Para que sirve?
Mostrar una aplicación al respecto.
Capı́tulo 4
Medidas de dispersión
4.1. Introducción
En el análisis de la información no bastan las medidas de tendencia central y de posición, ya que

describir un fenómeno solo con estas medidas puede llevar a conclusiones erróneas que no son eles a
la realidad, dado que pueden existir datos atípicos (detalles en la sección 4.4) que no se ajustan a la
descripción, por ejemplo.
Si dos conjuntos de datos tienen la misma media aritmética, no implica que la distribución de las
observaciones en ambos casos sea exactamente la misma, puesto que el grado de homogeneidad de
la información puede ser diferente. Por ejemplo, considere los datos que se presentan en la tabla 4.1
asociados con los salarios anuales (en millones de pesos) de una muestra de supervisores de ventas de
dos empresas. Se observa que ambos conjuntos de datos tienen la misma media (33.5 millones de pesos)
y la misma mediana (34.0 millones de pesos), por lo que si se limita el estudio de las observaciones
únicamente a estas medidas de tendencia central no es posible diferenciar la distribución de los salarios
de las dos compañías. Mas sin embargo, estas dos distribuciones son diferentes: los salarios de los
supervisores de la segunda empresa son más heterogéneos que los de la primera.
Empresa 1 34.5 30.7 32.9 36.0 34.1 34.0 32.3

Empresa 2 34.0 27.5 31.6 39.7 35.3 34.7 31.7
Tabla 4.1: Datos asociados con los salarios anuales de una muestra de supervisores de ventas de dos empresas.
En consecuencia, una medida de tendencia central por sí sola no es suciente para describir comple-
tamente la tendencia de un conjunto de datos; siempre es necesaria una medida que cuantique la
64
4.2. EL RANGO 65
variabilidad de los datos con respecto a tal medida de resumen.
4.2. El rango
El rango es una medida de dispersión empleada en la sección 2.4 para construir histogramas. Es una
medida que está asociada con la amplitud del conjunto de datos.

una variable X . El rango observado de este conjunto de datos, denotado
con Rx , se calcula como la diferencia entre el valor máximo y el valor
mínimo del conjunto de datos. Es decir:
Rx = xmáx − xmı́n
donde xmı́n y xmáx son respectivamente el valor mínimo y máximo de las

n observaciones.
Nota. No se debe confundir el rango de un conjunto de datos denido en esta sección con el rango
denido en la sección 3.3.1 utilizado para describir la posición en la que se encuentra cada valor del
conjunto de datos ordenado ascendentemente.
Ejemplo 4.2.1. Teniendo en cuenta los datos de la tabla 4.1, calcular e interpretar el rango para
cada empresa.
Solución:
El rango de la empresa 1 es
Rx = xmáx − xmı́n = 36.0 − 30.7 = 5.3,
mientras que el rango de la empresa 2 es
Rx = xmáx − xmı́n = 39.7 − 27.5 = 12.2.
Se observa que el recorrido de los salarios de la segunda empresa es mayor que el recorrido de los
salarios de la primera en 6.9 millones de pesos.
Las siguientes son algunas observaciones acerca del rango:
• Está dado en las mismas unidades de la variable de estudio.

66 CAPÍTULO 4. MEDIDAS DE DISPERSIÓN
• Es sensible a valores extremos.
• No da razón de la dispersión de los datos respecto a un valor particular o a una medida de

tendencia central.
4.3. El rango intercuartílico
El rango intercuartílico es una medida de dispersión que no está inuenciada por los valores extremos
de los datos como sí lo está el rango. En el rango intercuartílico se concentran el 50 % de las observa-
ciones que no hacen parte del 25 % de los valores más bajos ni del 25 % de los valores más altos del
conjunto de datos.

una variable X. El rango intercuartílico observado de este conjunto
de datos, denotado con RIx , se calcula como la diferencia entre el tercer
y primer cuartil del conjunto de datos. Es decir:
RIx = q3 − q1
donde q1 y q3 son respectivamente el primer y tercer cuartil de las n

observaciones.
Ejemplo 4.3.1. Teniendo en cuenta los datos de la tabla 4.1, calcular e interpretar el rango inter-
cuartílico para cada empresa.
Solución:
El rango intercuartílico de la empresa 1 es
RIx = q3 − q1 = 34.30 − 32.60 = 1.70,
mientras que el rango intercuartílico de la empresa 2 es
RIx = q3 − q1 = 35.00 − 31.65 = 3.35.
Se observa que el recorrido del 50 % de los salarios intermedios de la segunda empresa es mayor que
el mismo recorrido de los salarios de la primera en 1.65 millones de pesos. Aunque todavía hay una
diferencia clara, no es tan notoria como sí lo es con el rango, lo que sugiere la presencia de sueldos
considerablemente superiores de la primera empresa comparados con los de la segunda.
Las siguientes son algunas observaciones acerca del rango intercuartílico:

4.4. DIAGRAMA DE CAJA Y BIGOTES 67
• Está dado en las mismas unidades de la variable de estudio.
• Es una medida robusta poco inuenciable frente a valores extremos.
• No da razón de la dispersión de los datos respecto a un valor particular o a una medida de

tendencia central.
El rango intercuartílico se utiliza para construir un diagrama usado frecuentemente en estadística,

denominado diagrama de caja, extremadamente útil para describir la distribución de un conjunto de
datos.
4.4. Diagrama de caja y bigotes
El diagrama de caja y bigotes (boxplot en inglés) es una representación gráca que sirve para
identicar algunas características fundamentales de la distribución de un conjunto de datos, tales
como la localización, la dispersión, la simetría y la detección de datos atípicos. En este diagrama se
representan los tres cuartiles y los datos atípicos de los datos con base en un rectángulo alineado
vertical u horizontalmente. La construcción vertical de este gráco asociado con las observaciones de
una variable X es como sigue:
i. Obtener los cuartiles q1 , q2 y q3 del conjunto de datos.
ii. Dibujar un rectángulo paralelo al eje y tal que su lado mayor inicie en q1 y termine q3 . El ancho
de la caja no es de relativa importancia pero debe ser menor que el largo del rectángulo.
iii. Trazar los segmentos de la caja hasta los limites
Li = máx{xmı́n , q1 − (1.5)RIx } y Ls = mı́n{xmáx , q3 + (1.5)RIx }
donde RIx es el rango intercuartilico. Por lo tanto estos segmentos se extienden de Li a q1 y de

q3 a Ls . Tales líneas, denominadas bigotes , se dibujan de manera centrada respecto al ancho de
la caja.
iv. Señalar y resaltar los valores que se encuentran por fuera del intervalo [Li , Ls ].
v. Trazar una línea horizontal dentro de la caja a la altura de q2 .
En resumen, una gráca de este tipo está constituida por una caja rectangular cuyo lado mayor
representa el rango intercuartílico. Este rectángulo está dividido por un segmento transversal que
indica donde se localiza la mediana y por lo tanto evidencia su relación con los demás cuartiles. Las
líneas que sobresalen de la caja tienen un límite de prolongación, de modo que cualquier dato que
no se encuentre dentro de este rango es marcado e identicado individualmente. En la gura 4.1 se
presenta un ejemplo de un diagrama de caja.
Figura 4.1: Ejemplo de un diagrama de caja y bigotes.
Denición 4.4.1. Todo dato de una variable X que está más aleja-
do de (1.5)RIx del cuartil más cercano se dice que es un dato atípico
(outlier en inglés). Un dato atípico se denomina extremo si está ubica-
do a una distancia mayor de (3.0)RIx del cuartil más cercano y se llama
moderado en otro caso.
Ejemplo 4.4.1. Hacer un diagrama de caja y bigotes para los datos de la tabla 2.9. Describir la
distribución de las observaciones de acuerdo con el gráco obtenido.
Solución:
4.5. LA DESVIACIÓN DE UN DATO 69
La construcción del diagrama es como sigue:
i. Obtener los cuartiles de las ganancias: q1 =81.85, q2 = 93.10 y q3 = 104.25.
ii. Dibujar un rectángulo paralelo al eje y tal que su lado mayor inicie en 81.85 y termine en el valor
104.25.
iii. Trazar los bigotes de la caja hasta Li = 60.40 y Ls = 137.85. Por ende estos segmentos se
extienden de 81.85 a 60.4 y de 104.25 a 137.85.
iv. Señalar y resaltar los valores que se encuentren por fuera del intervalo [60.40,137.85]. Estas ob-
servaciones son 138.1 y 142.2.
v. Trazar una línea horizontal dentro de la caja a la altura de 93.10.
La distribución de las ganancias parece ser simétrica alrededor de la mediana, esto es, el reparto de las
utilidades aparenta ser equilibrado o semejante en torno a 93.1 millones de pesos diarios dado que la
caja esta divida en dos partes iguales por la ganancia mediana y los bigotes tienen aproximadamente
la misma extensión. Se presentan apenas un par de observaciones atípicas correspondientes a dos
empresas con ganancias diarias superiores a todas las demás con una diferencia notoria, pero según
parece no inuencian en gran medida la distribución de las utilidades puesto que la ganancia promedio
(94.09 millones de pesos) no diere marcadamente de la ganancia mediana.
4.5. La desviación de un dato
A continuación se presenta la desviación de un dato como punto de referencia para la construcción de

medidas de dispersión con respecto a la media aritmética.
Denición 4.5.1. Sea x1 , x2 , . . . , xn un conjunto de n realizaciones

de una variable X. La desviación de la i-ésima observación para
i = 1, . . . , n, denotada con di , está dada por:
di = xi − x̄
donde x̄ es el promedio observado del conjunto de datos.
Nota. Una desviación positiva (di > 0) indica que el dato es mayor que el promedio, mientras que
una desviación negativa (di < 0) señala que el dato es menor que la media. Una desviación igual a 0
quiere decir que el dato es exactamente igual al promedio. Además, en la proposición 3.2.2 se muestra
Pn
que si x1 , x2 , . . . , xn es un conjunto de n realizaciones de una variable X entonces i=1 (xi − x̄) = 0,
Pn
esto es, i=1 di = 0.
Figura 4.2: Diagrama de caja y bigotes de los datos de la tabla 2.8.
Las desviaciones de las observaciones se utiliza para estudiar la dispersión de la distribución de un

conjunto de datos cuantitativos. Teniendo en cuenta que la desviación de una observación representa
la diferencia entre un dato y la media del conjunto de datos de la cual ésta proviene, se podría pensar
que el promedio de todas las desviaciones proporciona una medida de la dispersión de todos los datos
con respecto al promedio, pero esto no ocurre porque la suma de todas las desviaciones siempre es
igual 0. Este hecho motiva la siguiente medida de dispersión.
4.6. LA VARIANZA 71
4.6. La varianza
Aunque el rango es una medida asociada con la extensión de todo conjunto de datos y el rango inter-
cuartílico es una medida relacionada con la amplitud correspondiente al 50 % de los datos intermedios,
ninguna de estas medidas de dispersión tiene en cuenta cómo se distribuyen las observaciones de la
variable de estudio respecto a alguna medida de tendencia central, como el promedio, por ejemplo.
Una medida de uso común que sí toma en cuenta tal repartición de los datos respecto a la media
aritmética es la varianza. Esta medida evalúa la manera en que uctúan los valores de una variable
respecto al promedio.

una variable X . La varianza muestral de este conjunto de datos, de-
notada con Sx2 , está dada por:
n
1 X
Sx2 = (xi − x̄)2
n − 1 i=1
Nota. La varianza muestral se dene como el promedio de los cuadrados de las desviaciones de
1 2 2
los datos de la muestra . La varianza muestral observada de una variable X se simboliza con Sx ,
mientras que la varianza poblacional 2
se denota con σX . Así, cuando se dispone de una población
nita, se tiene que
N
2 1 X
σX = (xi − µX )2
N i=1
donde N es el tamaño de la población. Esta denición únicamente hace sentido cuando se tiene una
población nita. Además, como con otros estadísticos, la notación de la varianza incluye un subíndice
para enfatizar la variable sobre la cual se calcula.
Nota. La denición de la varianza poblacional (parámetro) y de la varianza muestral (estadístico)

es casi idéntica salvo que en la muestral se resta 1 en el denominador del cociente. La razón de esta
diferencia se justica fácilmente dentro del marco conceptual de la estadística inferencial.
Cuando los datos de una muestra están agrupados en una distribución de frecuencias la varianza
muestral se calcula con la fórmula
k
1 X
Sx2 = ni (xi − x̄)2
n − 1 i=1
1 En este libro la varianza muestral, la cuasi-varianza y la varianza corregida son sinónimos.
2 Como con cualquier otro estadístico, la varianza muestral S 2 = 1 Pn (X − X̄)2 corresponde a la variable
X n−1 i=1 i
varianza de la muestra cuyos valores dependen de la muestra recogida; mientras que la varianza muestral observada
1 Pn
Sx2 = n−1
2
i=1 (xi − x̄) compete a un valor especíco de la variable
2
SX calculada a partir de los datos de una muestra
determinada.
donde k es el número de clases, ni es la frecuencia absoluta y xi es la clase o marca de clase de la

i-ésima categoría para i = 1, . . . , k .
La varianza evidencia la dispersión (variabilidad) de la distribución de un conjunto de datos respecto

al promedio. Cuanto más pequeño es el valor de la varianza, es menor la dispersión de los datos o
son más homogéneos respecto a la media. En consecuencia, si la varianza es un valor pequeño
implica que los datos están poco dispersos respecto al promedio; en tanto que si la varianza es un
valor grande sucede lo contrario. En otras palabras, cuanto más pequeño es el valor de la varianza,
la media es una cantidad más representativa del conjunto de datos.
Aunque la varianza está asociada directamente con la variación de un conjunto de datos, su interpre-
tación se puede complicar debido a que está dada en unidades cuadráticas (unidades de medición
elevadas al cuadrado). Tal aspecto se debe tener en cuenta en la interpretación para describir correc-
tamente la realidad estudiada.
Nota. El valor mínimo que puede asumir la varianza es el valor 0, caso en el que todos los datos son
iguales al promedio.
Ejemplo 4.6.1. Calcular e interpretar la varianza de los siguientes datos asumiendo que éstos cons-
tituyen una población.
i 1 2 3 4 5
xi 62 80 83 72 73
Solución:
En este caso N =5 y además la media poblacional de estos datos es
N
1 X 62 + 80 + . . . + 73
µX = xi = = 74.
N i=1 5
Por lo tanto, la varianza poblacional es:
N
2 1 X (62 − 74)2 + (80 − 74)2 + . . . + (73 − 74)2
σX = (xi − µX )2 = = 53.2.
N i=1 5
3
Este valor, 53.2, parece ser un valor grande, por lo que para este conjunto de datos se tiene una alta
dispersión con respecto al promedio, es decir, los datos parecen no estar agrupados respecto a 74.
Ejemplo 4.6.2. Calcular el varianza de los datos de la tabla 2.9.
Solución:
3 Se utiliza la expresión parece ser porque no hay un punto de comparación para establecer cuando una cantidad
es pequeña o grande. Por tal motivo se debe recurrir a medidas que den cuenta de cómo realizar esta calicación de
manera apropiada de acuerdo a ciertos estándares de precisión (detalles en la sección 4.10).
4.6. LA VARIANZA 73
Para calcular la varianza primero se deben calcular las respectivas marcas de clase como en el ejemplo
3.2.1. Una vez calculadas las marcas de clase, se calcula la varianza de las ganancias aplicando la
fórmula para datos agrupados. En la tabla 4.2 se presentan los cálculos pertinentes.
Clase xi ni ni xi ni (xi − x̄)2

[60.4; 74.0) 67.22 5 336.08 3,611.90
[74.0; 87.7) 80.85 9 727.65 1,578.59
[87.7; 101.3) 94.48 10 944.83 1.52
[101.3; 114.9) 108.12 6 648.70 1,179.84
[114.9; 128.6) 121.75 3 365.25 2,294.59
[128.6; 142.2] 135.38 2 270.77 3,409.65
Total N.A. 35.00 3293.28 12,076.65
Así, la magnitud de la varianza muestral de las ganancias es igual a
k
1 X 12, 076.65
Sx2 = ni (xi − x̄)2 = = 355.18.
n − 1 i=1 35 − 1
Considerando el valor 355.18 millones de pesos cuadrados como alto, se concluye que las ganancias
están muy dispersas respecto a la ganancia promedio que corresponde a 94.09 millones de pesos.
Nota. En el ejemplo 4.6.2 las unidades de la varianza son unidades cuadráticas y la interpretación de
la misma se hace sin tener en cuenta algún punto de referencia considerándola simplemente como un
valor grande.
A continuación se presentan algunas propiedades de la varianza muestral:
Proposición 4.6.1. Sea X una variable y a, b números reales. Entonces se tiene que:
2
i. Si X=a entonces SX = 0.
ii. Si Y = aX + b entonces SY2 = a2 SX

2
.
Demostración:
i. Si X=a entonces X̄ = a y por lo tanto:
n n
2 1 X 1 X
SX = (Xi − X̄)2 = (a − a)2 = 0.
n − 1 i=1 n − 1 i=1
ii. Si Y = aX + b entonces se sigue que:
n
1 X
SY2 = (Yi − Ȳ )2
n − 1 i=1
n
1 X
= ((aXi + b) − (aX̄ + b))2
n − 1 i=1
n
1 X
= (aXi + b − aX̄ − b)2
n − 1 i=1
n
1 X
= (aXi − aX̄)2
n − 1 i=1
n
1 X
= (a(Xi − X̄))2
n − 1 i=1
n
1 X 2
= a (Xi − X̄)2
n − 1 i=1
n
1 X
= a2 (Xi − X̄)2
n − 1 i=1
= a2 SX
2
.
Ejemplo 4.6.3. Los siguientes datos están asociados con los salarios quincenales (en miles de pesos)
de una muestra de empleados de una compañía. Los empleados piden un reajuste quincenal de 15 %
sobre su salario, pero el Estado ofrece un reajuste de 18 % más una bonicación mensual de cuarenta
mil pesos. Calcular el promedio y la varianza para las dos propuestas.
230 310 240 280 200 230 280 250 200
Solución:
Primero se debe calcular el promedio y la varianza de los salarios quincenales de los empleados (X ),
de donde
n n
1X 1 X
x̄ = xi = 246.66 y Sx2 = (xi − x̄)2 = 1, 400.
n i=1 n − 1 i=1
Sea Y1 el salario quincenal de los empleados (en miles de pesos) ajustado con la propuesta que ellos
mismos han dado. Este reajuste consiste en un aumento quincenal de 15 % y en consecuencia
Y1 = 1.15X,
4.6. LA VARIANZA 75
lo que implica un salario quincenal promedio de
ȳ1 = 1.15x̄ = (1.15)(246.66) = 283.66
con una varianza de

Sy21 = 1.152 Sx2 = 1.152 (1, 400) = 1, 851.50.

De otra parte, el Estado ofrece un reajuste de 18 % más una bonicación mensual de cuarenta mil
pesos, esto es, veinte mil pesos quincenales. Si Y2 denota el salario quincenal (en miles de pesos)
ajustado con la propuesta del Estado entonces se obtiene que
Y2 = 1.18X + 20
lo que implica un salario promedio de
ȳ2 = 1.18x̄ + 20 = (1.18)(246.66) + 20 = 311.06
con una varianza de

Sy22 = 1.182 Sx2 = 1.182 (1, 400) = 1949.36.

Por lo tanto la propuesta que aparentemente tiene más dispersión con respecto al salario quincenal
promedio es la propuesta del Estado.
Ejemplo 4.6.4. Calcular la varianza de la utilidad mensual de la compañía del ejemplo 3.2.2 teniendo
en cuenta que la varianza de la venta mensual es $2 273,500.
Solución:
Dado que la utilidad mensual (Y ) de la compañía es una variable dada por:
Y = 0.83X − 24, 000, 000
donde X representa la venta mensual de la empresa, se obtiene que
Sy2 = 0.832 Sx2 = 0.832 (273, 500) = 188, 414.15.

Proposición 4.6.2. Si x1 , x2 , . . . , xn es un conjunto de n realizaciones de una variable X entonces:
n
X n
X
(xi − x̄)2 = x2i − nx̄2 .
i=1 i=1
Demostración:
n
X n
X
(xi − x̄)2 = (x2i − 2xi x̄ + x̄2 )
i=1 i=1
n
X n
X n
X
= x2i − 2xi x̄ + x̄2
i=1 i=1 i=1
n
X n
X
= x2i − 2x̄ xi + nx̄2
i=1 i=1
n
X
= x2i − 2x̄(nx̄) + nx̄2
i=1
n
X
= x2i − 2nx̄2 + nx̄2
i=1
n
X
= x2i − nx̄2 .
i=1

Nota. En virtud de la proposición 4.6.2 se tiene que una forma alternativa para calcular la varianza
muestral observada de una variable X es:
n
!
1 X
Sx2 = x2i − nx̄ 2
.
n−1 i=1
Ejemplo 4.6.5. El cálculo de Sx2 en el ejemplo 4.6.3 también se puede lograr como sigue:
n
!
1 X 1
Sx2 x2i 2
558, 800 − (9) 246, 662 = 1, 400.

= − nx̄ =
n−1 i=1
9−1
Las siguientes son algunas observaciones acerca de la varianza:
• La relación entre la varianza y la dispersión de un conjunto de datos es directa.
• Está dada en unidades cuadráticas.
• Es sensible a datos atípicos.
• Es un valor no negativo.
Nota. Si X y Y son variables conmensurables, a, b números reales y W = aX + bY entonces
2
SW 6= a2 SX
2
+ b2 SY2 .
¾El lector puede dar un ejemplo que rectique este hecho?

4.7. LA DESVIACIÓN ESTÁNDAR 77
4.7. La desviación estándar
La interpretación de la varianza no es directa porque está expresada en unidades cuadráticas. Por

ejemplo, si la variable de interés está medida en pesos, la varianza estará dada en pesos al cuadrado.
Este aspecto diculta la interpretación porque relacionar valores en unidades cuadráticas con valores
en unidades lineales (unidades sin elevar al cuadrado) puede llevar a conclusiones erróneas cuando
no se da a la varianza una calicación adecuada en las unidades reales; por tal motivo en los ejemplos
de la sección anterior se utiliza la palabra aparentemente para resaltar este hecho. La siguiente
medida de dispersión resuelve este inconveniente.
Denición 4.7.1. La desviación estándar o desviación típica se

dene como la raíz cuadrada positiva de la varianza.
Nota. De acuerdo con la denición 4.7.1, si x1 , x2 , . . . , xn es un conjunto de n realizaciones de una

variable X entonces la desviación estándar muestral observada de X , denotada con Sx , está dada
por:
v
u n
u 1 X
Sx = t (xi − x̄)2 .
n − 1 i=1
Similarmente, si se dispone de una población nita de tamaño N, entonces la desviación estándar

poblacional de X, denotada con σX , está dada por:
v
u
u1 X N
σX =t (xi − µX )2 .
N i=1
4
Se observa que Sx es la realización de un estadístico , mientas que σX es una parámetro.
Nota. Las unidades de la desviación estándar son las mismas unidades de la variable de estudio. Por
ello, la interpretación de esta medida es inmediata y comparable con los valores de la variable.
Ejemplo 4.7.1. Calcular la desviación estándar de la utilidad mensual de la compañía del ejemplo
4.6.4.
Solución:
Como Sy2 = 374, 394.15 se sigue que la desviación estándar de la utilidad mensual es $611,870 dado
que
q p
Sy = Sy2 = 374, 394.15 = 611.87.

4 Corresponde
q Pn
2 = 1
a un valor especíco de la variable SX n−1 i=1 (Xi − X̄)2 calculada a partir de los datos de
una muestra determinada.

Las siguientes son algunas observaciones acerca de la desviación estándar:
• La relación entre la desviación estándar y la dispersión de un conjunto de datos es directa.
• Está dada en unidades lineales.
4.8. Estandarización
En seguida se presenta una metodología para comparar magnitudes que en principio no lo son, con el
propósito de investigar una variable de interés en escenarios disímiles.
Denición 4.8.1. Se denomina estandarización o tipicación al

proceso de restar de una variable la media y luego dividir por la desvia-
ción típica.
Nota. De este modo, si x1 , x2 , . . . , xn es un conjunto de n realizaciones de una variable X entonces

cuando se realiza este proceso se obtiene una nueva variable, denotada con Z, cuyas observaciones
está dadas por
xi − x̄
zi =
Sx
para i = 1, 2, . . . , n. Cuando se trata con una población se sigue que
X − µX
Z= .
σX
La variable Z se denomina variable estandarizada o variable tipicada .
5
Una variable estandarizada es una variable adimensional y permite hacer comparaciones entre magni-
tudes que en principio no son comparables. Esto se aplica al caso en que se quiera comparar individuos
semejantes de poblaciones diferentes. Por ejemplo, si se quiere comparar el nivel académico de dos
estudiantes de diferentes universidades para otorgar una beca de estudios, en principio será injusto
concederla directamente al que posea una nota media más elevada, ya que la dicultad para conse-
guir una buena calicación puede ser mucho mayor en un centro que en el otro, lo que limita las
posibilidades de uno de los estudiantes y favorece al otro. En este caso, se aconseja comparar las
calicaciones tipicadas de ambos estudiantes por medio del promedio y desviación típica de las notas
correspondientes de los alumnos de cada universidad.
5 Se dice que una variable es adimensional cuando no tiene unidades de medición.

4.9. TEOREMA DE CHEBYSHEV 79
Proposición 4.8.1. Sea x1 , x2 , . . . , xn un conjunto de n realizaciones de una variable X y Z una

variable estandarizada cuyas observaciones están dadas por
xi − x̄
zi =
Sx
para i = 1, 2, . . . , n. Entonces se tiene que
z̄ = 0 y Sz2 = 1.
La demostración queda como ejercicio para el lector.
Ejemplo 4.8.1. Teniendo en cuenta los datos de la tabla 4.1, estandarizar las observaciones de cada
empresa. Comentar los resultados obtenidos.
Solución:
En este caso se tiene que
x̄1 = 33.500, x̄2 = 1.708, Sx1 = 33.500 y Sx2 = 3.791
donde x̄i y Sxi son respectivamente la media muestral y la desviación estándar muestral de los salarios
de los supervisores de la i-ésima empresa para i = 1, 2. En la siguiente tabla se presentan los salarios
estandarizados de cada empresa:
Empresa 1 0.585 −1.639 −0.351 1.463 0.351 0.292 −0.702

Empresa 2 0.131 −1.582 −0.501 1.635 0.474 0.316 −0.474
Por ejemplo, se observa que el individuo 1 de la primera empresa es denitivamente mejor pago en
su contexto que el individuo 1 de la segunda compañía a pesar de que tienen salarios muy próximos,
dado que el puntaje estandarizado del primer individuo es superior que el mismo puntaje del otro
empleado. Tal comparación solo se puede realizar eliminando el efecto de la escala en las observaciones
asociadas. Además, se observa que la media y la desviación estándar de los salarios estandarizados de
cada empresa son 1 y 0 respectivamente.
4.9. Teorema de Chebyshev
El matemático ruso Pafnuty Chebyshev 6

cuyo trabajo generó grandes avances en la probabilidad y
la estadística, se distingue por un teorema muy popular bautizado con su mismo nombre, en la cual se
evidencia la relación de la proporción de observaciones en un rango dado con la media y la desviación
estándar de la población correspondiente.
6 Fotografía tomada de la página web http://mimosa.pntic.mec.es/jgomez53/matema/conocer/chebyshev.htm.

Figura 4.3: Pafnuty Chebyshev (1821-1894).
Teorema 4.9.1. Para cualquier población con media µX y desviación estándar σX , por lo menos
el100(1 − 1/k 2 ) % de las observaciones de la variable X se encuentran a una distancia de la media
menor que kσX , para cualquier número k ≥ 1. De otra forma, dentro del intervalo que va de µX −kσX
2
a µX + kσX se encuentra por lo menos el 100(1 − 1/k ) % de los datos de la población.
teorema de Chebys-
La formulación matemática y la demostración del teorema 4.9.1 conocido como
hev o desigualdad de Chebyshev se presenta en la sección 8.7 con la noción de probabilidad.
Ejemplo 4.9.1. Determinar un intervalo que contenga al menos 95 % de las observaciones de una
población con media 26 y desviación estándar 3.
Solución:
100 1 − 1/k 2 % = 95 %

1
1 − 2 = 0.95
k
1
= 0.05
k2 r
1
k=
0.05
k = 4.472.
4.10. EL COEFICIENTE DE VARIACIÓN DE PEARSON 81
Por lo tanto un intervalo que contiene por lo menos el 95 % de las observaciones de esta población es
aquel que va de 26 − (4.472)(3) = 12.583 a 26 + (4.472)(3) = 39.416.
La tabla 4.3 proporciona algunos valores de k y los porcentajes correspondientes. Por ejemplo, de
acuerdo con el teorema de Chebyshev, al menos el 55.6 % de los datos de la población se encuentran a
una distancia de la media menor que 1.5 veces la desviación estándar. O, dicho de otra forma, dentro
del intervalo que va de µX − (1.5)σX hasta µX + (1.5)σX , sin importar el valor de µX y de σX , se
encuentra por lo menos el 55.6 % de los datos de la población.
Ejemplo 4.9.2. Considerar los datos de la primera empresa de la tabla 4.1. Estos datos tienen
una media de 33.500 con una desviación estándar de 1.708 ambas cantidades dadas en millones
de pesos. Asumiendo que estos datos conforman las observaciones de una población, el teorema de
Chebyshev asegura que al menos 55.6 % de los salarios se encuentran a una distancia de la media
menor que (1.5)(1.708)=2.561 millones de pesos. En otras palabras, dentro del intervalo que va de
30.938 a 36.062 millones de pesos están por lo menos el 55.6 % de los salarios. Análogamente, dentro
del intervalo que va de 27.523 a 39.477 millones de pesos se encuentra por lo menos el 75.0 % de los
salarios de los supervisores de la empresa.
k 1.5 2.0 2.5 3.0 3.5 4.0

100(1 − 1/k 2 ) % 55.6 % 75.0 % 84.0 % 88.9 % 91.8 % 93.7 %
Tabla 4.3: Algunos valores asociados con el teorema de Chebyshev.
La ventaja del teorema de Chebyshev es que se puede aplicar a cualquier población. Pero, en con-
trapartida, tiene un inconveniente importante. Para muchas poblaciones, el porcentaje de valores que
se encuentran en un intervalo determinado es mucho mayor que el mínimo asegurado por el teorema.
Para poblaciones con distribuciones que tengan forma acampanada (ver la distribución (d) de la gu-
ra 3.1), es posible establecer una regla empírica que proporcione valores ables, como sigue: para
poblaciones con una distribución de frecuencias que tenga forma de campana, aproximadamente el
68 % de los valores de la población se encuentran a una distancia de la media menor que una desvia-
ción estándar, y aproximadamente el 95 % están a una distancia de la media menor que dos veces la
desviación estándar.
4.10. El Coeciente de variación de Pearson
Analizando la variabilidad de un conjunto de datos con respecto a la media, la desviación estándar es

una medida óptima que reeja tal característica. A diferencia de la varianza, la desviación estándar
está dada en las unidades originales de la variable de estudio y por ello su interpretación es directa:
cuanto más pequeña es la magnitud de la desviación estándar, menor es la dispersión del conjunto
de datos con respecto al promedio. Pero aún la palabra pequeña no tiene un signicado preciso.
¾Cuando la desviación estándar se considera estadísticamente como un valor pequeño?
De otra parte, para comparar la dispersión de dos o más conjuntos de datos no es adecuado confrontar
simplemente las varianzas o las desviaciones estándar, puesto que tales medidas están inuenciadas
por la escala de medida de los datos. Es necesario, por lo tanto, eliminar tal inuencia generada por
las unidades de medida. El coeciente de variación de Pearson, en honor al matemático británico Karl
Pearson 7
, es una medida relativa
8
de dispersión que permite solucionar estas inquietudes.
Figura 4.4: Karl Pearson (1857-1936).
Denición 4.10.1. El coeciente de variación de Pearson (o sim-

plemente coeciente de variación) se dene que como el valor absoluto
del cociente entre la desviación estándar y la media del conjunto de datos
correspondiente.
Nota. De acuerdo con la denición 4.10.1, si se dispone de la información de una muestra asociada con
una variable X entonces el valor observado del coeciente de variación muestral de X , denotado
con CV
d x, está dado por
Sx
CV x =
d
x̄
donde |a| es el valor absoluto de a. Similarmente, el coeciente de variación poblacional de una
variable X , denotado con CVX , está dado por

σX
CVX =
.
µX
7 Fotografía tomada de la página web http://www.apprendre-math.info/history/photos/Pearson.jpeg.
8 Una medida relativa es aquella medida que dene su valor en relación a otra cantidad.
4.10. EL COEFICIENTE DE VARIACIÓN DE PEARSON 83
Como se ha visto, para establecer el tamaño relativo de la desviación estándar se utiliza el promedio,
comparando la magnitud de la dispersión de la variable con la media del conjunto de datos, de tal
forma que la apreciación correspondiente es relativa al valor del promedio. Además, como se trata de
un cociente, las unidades del numerador y del denominador se cancelan y en consecuencia el coeciente
de variación es una medida adimensional, lo que quiere decir que carece de unidades de medición. Por
ello, se acostumbra expresar el coeciente en porcentaje y dependiendo del valor que tome se dice que
si el coeciente de correlación:
• Está entre 0 % y 5 % entonces la dispersión del conjunto de datos es mínima.
• Está entre 5 % y 15 % entonces la dispersión del conjunto de datos es moderada.
• Es superior a 15 % entonces la dispersión del conjunto de datos es alta.
Ejemplo 4.10.1. Un inversionista potencial piensa adquirir acciones en una de dos compañías A o
B listadas en la bolsa de valores. Si ninguna de las compañías ofrece dividendos a sus clientes y ambas
tienen igual clasicación en términos de crecimiento potencial como lo aseguran varios servicios de
inversión el posible inversionista quizás considere la volatilidad (variabilidad) de ambas acciones para
tomar una decisión en cuanto a la inversión. En los últimos meses, el precio promedio de las acciones
en la compañía A fue de USD 50 con una desviación estándar de USD 10. Además, durante el mismo
periodo, el precio promedio de las acciones en la compañía B fue de USD 12 con una desviación
estándar de USD 4. ¾Cómo puede determinar el inversionista cuáles acciones son más variables?
Solución:
En términos de la desviación estándar, el precio de las acciones de la compañía A parece más volátil
que el de las acciones de la compañía B. Sin embargo, como los precios promedio por acción de las dos
compañías son tan diferentes, será conveniente que el inversionista potencial considere la variabilidad
del precio con respecto al promedio a n de examinar la volatilidadestabilidad de ambas acciones. Si
X denota el precio (en dólares) de las acciones en el periodo de tiempo examinado, para la compañía
A, el coeciente de variación es d x = |(10/50)100 %| = 20.0 %; mientras
CV que para la compañía B,
el coeciente de variación es d x = |(4/12)100 %| = 33.3 %. Entonces, en
CV relación con la media, el
precio de las acciones de la compañía B es mucho más variable que el de las acciones de la compañía
A.
Nota. El coeciente de variación sirve para comparar la variabilidad de dos conjuntos de datos respecto
a la media, mientras que si se quiere comparar a dos individuos de cada uno de estos conjuntos, es
necesario utilizar los valores estandarizados.
Las siguientes son algunas observaciones acerca del coeciente de variación:
• La relación entre el coeciente de variación y la dispersión de un conjunto de datos es directa.
• Es una medida adimensional.
• Es sensible a valores atípicos.

• Si el promedio es igual a 0 entonces el coeciente de variación no está denido.
4.11. Otras medidas de dispersión
A continuación se presentan algunas medidas de dispersión basadas en el valor absoluto cuya magnitud
depende del posicionamiento de los datos respecto a la media y la mediana.
La desviación media es una medida que captura las desviaciones absolutas de los datos respecto a la
media. Esta medida también se denomina desviación absoluta.
Denición 4.11.1. Sea x1 , x2 , . . . , xn un conjunto de n realizaciones

de una variable X. La desviación media de este conjunto de datos,
denotada con Dx , está dada por:
n
1X
Dx = |xi − x̄|
n i=1
La desviación mediana es similar a la desviación media, pero ahora las desviaciones se calculan respecto
a la mediana del conjunto de datos.

una variable X . La desviación mediana de este conjunto de datos,
denotada con DMX , está dada por:
n
1X
DMx = |xi − x̃|
n i=1
donde x̃ es la mediana observada del conjunto de datos.
Nota. Las unidades en las que están dadas tanto la desviación media como desviación mediana son
unidades lineales. Además, de ser requeridos, los parámetros correspondientes se denen análogamente.
Ejemplo 4.11.1. Considerar los datos de la tabla 4.4 asociados con una muestra de ventas diarias
(en millones de pesos) de una empresa con 30 sucursales en el país. Si esta empresa tiene un contrato
con una compañía de contaduría que asegura que sus ingresos diarios no tienen una dispersión mayor
4.11. OTRAS MEDIDAS DE DISPERSIÓN 85
a $2,000,000, ¾qué se podría concluir al realizar una comparación de la desviación media, la desviación
mediana, la desviación estándar y el rango intercuartílico junto con un diagrama de caja y bigotes?
7.00 11.85 14.17 7.84 6.05 12.01 10.28 13.08 14.57 6.10
7.73 9.91 8.18 10.59 7.63 7.02 8.88 13.88 10.55 13.42
11.23 9.20 8.92 9.84 8.93 9.86 9.40 7.82 10.24 9.74
Tabla 4.4: Datos asociados con una muestra de ventas diarias (en millones de pesos) de una empresa.
Solución:
Teniendo en cuenta que la media y la mediana de las ventas diarias (X ) de las 30 sucursales de la
empresa son respectivamente 9.86 y 9.79 millones de pesos, se obtienen los resultados que se presentan
en seguida y el diagrama de caja y bigotes de la gura 4.5.
Medida Dx DMx RIx Sx

Dispersión 1.84 1.83 3.13 2.35
Teniendo en cuenta que las medidas toman posiciones opuestas respecto a la dispersión mencionada
en el contrato, la inspección del diagrama de caja toma un papel decisivo. Éste muestra que no
hay evidencia de datos atípicos, por lo que la desviación estándar no se encuentra inada por
observaciones extremas. Además, el rango intercuartílico, que es una medida robusta frente a los
observaciones atípicas, también muestra un fallo negativo respecto a la dispersión establecida en el
contrato. Así, se puede concluir que la dispersión encontrada en la muestra excede efectivamente lo
estipulado.
A continuación se presenta sin demostración una proposición que relaciona las magnitudes de algunas
medidas de dispersión:
Proposición 4.11.1. Si x1 , x2 , . . . , xn es un conjunto de n realizaciones de una variable X entonces

se tiene que
0 ≤ DMx ≤ Dx ≤ Sx y 0 ≤ Dx ≤ Rx /2
donde Sx y Rx son respectivamente la desviación estándar muestral y el rango de la variable X.
Las siguientes son algunas observaciones acerca de la desviación media y la desviación mediana:
• La relación entre la desviación media y la dispersión de un conjunto de datos es directa. Esto

mismo sucede con la desviación mediana.
• La desviación media y la desviación mediana son valores no negativos.

Figura 4.5: Diagrama de caja y bigotes de los datos de la tabla 4.4.
• La desviación media es sensible a datos atípicos, mientras que la desviación mediana es más
robusta frente a este tipo de observaciones.
4.12. Comentarios
Como es costumbre en el inicio de todo tipo de estudio, lo primero que se hace es la exploración
y la descripción de la información para conocer el material del cual se dispone y cómo se puede
emplear. En este capítulo se muestra cómo analizar más detalladamente la información disponible
para conocer un elemento fundamental de ésta: su dispersión. La variabilidad de un conjunto de datos
se explora a través de diferentes medidas que dan cuenta de la homogeneidad o heterogeneidad de
las observaciones respecto a las medidas de tendencia central.
Este paso descriptivo cobra especial importancia a medida que una investigación avanza puesto que
4.13. EJERCICIOS 87
las decisiones que se tomen posteriormente se verán inuenciadas por la dispersión de las variables
de estudio y la precisión de las medidas de los estadísticos calculados. Inclusive, en la vida cotidiana,
el conocimiento de la variabilidad es tenido en cuenta aún en los procesos más simples, como en la
planeación de cronogramas y la realización de reuniones.
También se enseña una de las mejores formas grácas de resumir toda la información proporcionada
por las medidas de localización y de dispersión, por medio de un solo gráco, denominado diagrama de
caja y bigotes. Éste permite describir y analizar a profundidad la posición y la forma de la distribución
de un conjunto de datos cuantitativos.
4.13. Ejercicios
4.1. Demostrar que si X es una variable y a, b son números reales entonces se tiene que:
i. Si X=a entonces SX = 0.
ii. Si Y = aX + b entonces SY = |a|SX .
4.2. Demostrar que si X es una variable y a es un número real entonces se tiene que:
i. Si X=a y a 6= 0 entonces CV
d X = 0.
ii. Si Y = aX entonces CV
dX = CV
dY .
iii. Si Y =X +a y a≥0 entonces d Y ≤ CV
CV dX .
4.3. Establecer la escala de medición requerida para cada medida de dispersión presentada en este
capítulo.
4.4. Con la información del ejercicio 3.11, calcular, interpretar y comparar el coeciente de variación
de cada propuesta. ¾Qué es más ventajoso para el Estado y qué para cada grupo de empleados?
4.5. Sean X y Y dos variables tales que:
10
X 10
X 10
X 10
X
xi = 110, yi = 60, x2i = 3156 y yi2 = 1138.
i=1 i=1 i=1 i=1
Para cada variable calcular el coeciente de variación. Interpretar y comparar los resultados
obtenidos.
4.6. Con la información del ejercicio 3.12, calcular e interpretar el coeciente de variación.
4.7. Una compañía evalúa la eciencia del transporte público y privado que utilizan sus empleados
para ir a trabajar diariamente. En la siguiente tabla se presenta un par de muestras asociadas
con el tiempo (en minutos) de cada modo de transporte. Calcular el promedio y la desviación
estándar en cada caso. Con base en los resultados obtenidos, ¾qué modo de transporte se debe
preferir?
Particular 14 15 17 14 10 16 17 16 13 15
Público 20 19 18 15 14 14 13 21 22 10
4.8. Con la información del ejercicio 3.17, calcular las medidas de dispersión y realizar un diagrama
de caja y bigotes. Con base en los resultados obtenidos, ¾qué se puede asegurar acerca de la
situación salarial de los empleados?
4.9. Sea µX la media poblacional de una variable X y x1 , x2 , . . . , xn un conjunto de n realizaciones

de X . Demostrar que
n
X
(xi − µ)2 = (n − 1)Sx2 + (x̄ − µ)2
i=1
y
n n
1 XX
Sx2 = (xi − xj )2 .
n − 1 i=1 j=1
donde x̄ y Sx2 son respectivamente la media y la varianza observada de X.
4.10. En un estudio de tiempos llevado a cabo en una planta manufacturera, el tiempo (en minutos)
requerido para completar cierta operación se mide para un grupo de trabajadores. Se encuentra
que la media y la desviación estándar son 12.8 y 1.7 minutos respectivamente. Describir los datos
de la muestra utilizando la regla empírica. ¾Qué es necesario suponer sobre la distribución de los
tiempos para que el uso de la regla empírica sea adecuado? ¾Esta descripción coincide con la que
sugiere la desigualdad de Chebyshev?
4.11. Los siguientes datos corresponden al tiempo (en horas) utilizado para preparar un examen de
conocimiento y las calicaciones correspondientes (en una escala de 0 a 5) de una muestra de
aspirantes a un cargo especíco de una compañía. El jefe de personal de la empresa asegura que
el tiempo requerido para tener buenos resultados en la prueba es cercano a 8 horas. Teniendo en
cuenta las medidas de dispersión y un diagrama de caja y bigotes, ¾qué se puede asegurar acerca
de lo que sugiere el funcionario?
Tiempo 03 36 69 912 1215

Calicación 01 12 23 34 45
4.12. Con el propósito de estudiar la relación entre la inteligencia y los ingresos se tomaron dos muestras,
una de ellas conformada por individuos de cociente intelectual (CI ) inferior a 95 y otra conformada
por los demás; de cada persona se observó el salario mensual familiar (en salarios mínimos). Para
cada grupo calcular las medidas de dispersión y realizar un diagrama de caja y bigotes. ¾Los
resultados sugieren que las personas más inteligentes tienen mayores ingresos?
4.13. EJERCICIOS 89
Salario 12 23 34 45 56 67

Frecuencia (CI < 95) 15 35 40 30 25 15
Frecuencia (CI ≥ 95) 19 26 35 40 52 28
4.13. Demostrar que cuando los datos de una muestra están agrupados en una distribución de frecuen-
cias, la varianza se calcula con la fórmula
k
!
1 X
2
ni xi − nx̄
n−1 i=1
donde k es el número de clases, ni es la frecuencia absoluta y xi es la clase o la marca de clase

de la i-ésima categoría para i = 1, . . . , k .
4.14. Con la información del ejemplo 4.6.3, calcular, interpretar y comparar el coeciente de variación
para cada propuesta.
4.15. Considerar una población que consta del número de profesores en cada una de las universidad
pequeñas de una ciudad. El número de profesores por universidad tiene un promedio de 175 y
una desviación de estándar de 15.
a. Usar le teorema de Chebyshev para describir el porcentaje de universidades que tienen entre
145 y 205 profesores.
b. Si la distribución del número de profesores tiene forma acampanada, ¾qué fracción de las
universidades tiene mas de 190 profesores?
4.16. Se analizaron en el primer semestre de 2006 los gastos de una empresa de construcción y se
obtuvo un promedio de 174 millones de dólares y una desviación típica de 9 millones de dólares.
Se determinó luego que los contadores de esta empresa habían prescindido de 3 millones de
dólares en los gastos por un error de apreciación. Corrigiendo las medidas enunciadas, obtenga el
coeciente de variación de los gastos de esta empresa.
4.17. Los siguientes datos representan las puntuaciones de ambivalencia social para un grupo de per-
sonas, según los resultados de una prueba psicológica. Se observa que cuanto más alta se la
puntuación, mas fuete es la ambivalencia.
9 13 12 14 15 11 10 4 10
8 19 13 11 17 9 11 14 12
a. Calcular e interpretar el coeciente de variación.
b. Si la gerencia de la empresa a la que pertenecen las personas observadas le asegura al Ministerio

de Salud que la variabilidad de la ambivalencia es 2.5, lo que sugiere una estabilidad razonable
en el estado psicológico de los trabajadores, ¾qué se podría concluir al realizar una comparación
de la desviación media, la desviación mediana, la desviación estándar y el rango intercuartílico
junto con un diagrama de caja y bigotes?
c. Debido a un error en el instrumento de medición, la puntuación de los empleados requiere

un reajuste de la forma aX + b donde X es el puntaje de la ambivalencia de los empleados.
Calcular a y b de forma tal la puntuación promedio de ambivalencia disminuya a 10 con un
coeciente de variación de 5 %. ¾Qué indican estos valores?
d. ¾Qué fracción de las puntuaciones está efectivamente a dos desviaciones estándar del promedio
de la muestra? ¾Qué indican la desigualdad de Chebyshev y la regla empírica al respecto? Con
los resultados obtenidos, ¾cómo se puede describir la distribución de las puntuaciones?
4.18. En cierta región la distribución de predios por extensión tiene una media de 35.4 hectáreas y una
desviación típica de 19.33 hectáreas, mientras que la distribución por canon de arrendamiento
tiene una media de $245,750 y una desviación de $7,470. ¾Cual de las dos distribuciones tiene
mayor variabilidad? ¾Por qué?
4.19. Con la información del ejemplo 4.6.4, calcular e interpretar el coeciente de variación de las
utilidades.
Capı́tulo 5
Medidas de forma
5.1. Introducción
Una vez iniciada la síntesis y la descripción de la información, por medio de las medidas de tendencia
central, de posición y de dispersión, es necesario conocer más sobre la distribución de los datos, como la
1
forma y el sesgo . Para ello están concebidas las medidas de forma, las cuales proporcionan información
relacionada con la conguración y el arreglo de las observaciones de interés.
En primer lugar, se quiere saber si los datos se distribuyen de forma simétrica respecto al promedio
2
aritmético , o si bien la gráca que representa la distribución de frecuencias tiene una forma diferente.
Si la distribución de los datos es simétrica, se quiere investigar el grado de apuntamiento de la curva,
es decir, si la gráca es apuntada larga y estrecha o por el contrario aplanada corta y achatada,
y con ello estudiar la dispersión y las frecuencias de las observaciones alrededor del promedio. Este
apuntamiento se mide por medio de una comparación con una distribución de datos que se considera
normal (detalles en la sección 10.3).
1 En este contexto, el término sesgo hace referencia a la desviación de una forma respecto a una determinada de
antemano.
2 Como eje de simetría se considera una recta paralela al eje y que pasa por la media de la distribución de frecuencias.
Si una distribución es simétrica, existe el mismo número de valores a la derecha que a la izquierda del promedio
(Wikipedia 2012a).
91
92 CAPÍTULO 5. MEDIDAS DE FORMA
5.2. Medidas de asimetría
Para establecer si una distribución de frecuencias es simétrica, hay que precisar con respecto a qué
valor es simétrica. Un buen candidato para ello es el promedio aritmético del conjunto de datos.
Denición 5.2.1. Se dice que una distribución de frecuencias es simé-

trica con respecto a la media cuando lo es su representación gráca, es
decir, cuando los datos equidistantes a la media tienen frecuencias igua-
les. Una distribución de frecuencias que no es simétrica, se denomina
asimétrica .
Nota. En la denición 5.2.1, la asimetría puede ser a la derecha asimetría positiva o a la izquierda
asimetría negativa si la representación gráca está más estirada hacia la derecha o la izquierda
respectivamente.
En la gura 5.1 se presentan tres ejemplos de distribuciones de frecuencias representadas con histo-
3
gramas y polígonos de frecuencias suavizados simétricos y asimétricos (con sesgo). En lo que sigue
se consideran algunos factores y medidas que indican y cuantican el sesgo de una distribución de
datos con respecto al promedio. Las medidas de asimetría o coecientes de sesgo tienen como nalidad
establecer el grado de simetría (o asimetría) que presenta una distribución de forma objetiva y precisa.
5.2.1. Inspección de las medidas de tendencia central
Calculando las medidas de tendencia central (considerando conjuntos de datos unimodales) es posible
identicar la simetría o asimetría de una distribución mediante los siguientes casos:
• En una distribución simétrica (gráco (b) de la gura 5.1), la media, la media y la moda siempre
coinciden. Es decir, se cumple la relación:
M edia = M ediana = M oda.
En este tipo de distribuciones, los datos se encuentran repartidos a lo largo del recorrido de
forma que todas las medidas de tendencia central están justo en el centro del conjunto de datos.
• Si la distribución es asimétrica a la izquierda (gráco (a) de la gura 5.1), el orden en que

aparecen es media-mediana-moda. Es decir, se cumple la relación:
M edia < M ediana < M oda.

3A groso modo, un polígono de frecuencias suavizado se reere a la representación gráca de una distribución
de frecuencias en la que no se realzan las barras del histograma, sino la forma curvilínea del polígono de frecuencias
correspondiente.
5.2. MEDIDAS DE ASIMETRÍA 93
• Si la distribución es asimétrica a la derecha (gráco (c) de la gura 5.1) entonces el orden en

que aparecen las medidas de tendencia central es moda-mediana-media. Es decir, se cumple la
relación:
M oda < M ediana < M edia.
Nota. La representación gráca de una distribución simétrica no tiene que se acampanada necesaria-
mente; una distribución simétrica puede tener forma de U como en la distribución (a) de la gura
3.1), aunque en este caso la distribución es bimodal.
Figura 5.1: Algunas distribuciones de frecuencias.
Ejemplo 5.2.1. Inspeccionar las medidas de tendencia central de los datos de la tabla 2.9.
Solución:
Como se observa en los ejemplos 3.2.1, 3.2.6 y 3.2.8, en este caso se tiene que
x̄ = 94.09, x̃ = 92.44 y x̆ = 90.39
donde X denota las ganancias diarias de una muestra de empresas. Como x̆ < x̄ < x̃, la inspección de
las medidas de tendencia central sugiere que la distribución de estas ganancias es sesgada positivamente
o a la derecha; esto indica que hay algunas compañías con utilidades considerablemente superiores a
las ganancias de las demás. Sin embargo, la magnitud de las medidas de tendencia central no diere
en gran medida, por lo que el sesgo de la distribución es ligero y apenas notorio (como se establece
objetivamente en los ejemplos 5.2.2, 5.2.3 y 5.2.4) y por lo tanto las utilidades aparentemente superiores
son poco inuyentes.
En la gura 5.2 se muestra un histograma y un diagrama de caja y bigotes asociados con las ganancias
de las compañías objeto de estudio. En el histograma se observa la simetría aproximada y el ligero
sesgo positivo de la distribución de las utilidades, como también la proximidad de las medidas de
tendencia central que están señaladas en la mitad de la gura (a) con líneas verticales punteadas
que casi coinciden. De otra parte, en el diagrama de caja y bigotes se observa la simetría de la
distribución de las ganancias dado que la extensión de los bigotes es la misma y la caja esta partida
en dos partes iguales por la utilidad mediana; en este diagrama también se observa el ligero sesgo
positivo de la distribución de las ganancias debido a un par de observaciones señaladas a la derecha
correspondientes a las utilidades de dos empresas sobresalientes en relación con las utilidades de las
demás.
En consecuencia, la distribución de las ganancias diarias de las empresas se puede considerar aproxi-
madamente simétrica y así las utilidades diarias de las empresas están equilibradas razonablemente
alrededor de la ganancia promedio (94.09 millones).
Figura 5.2: Histograma (a) y diagrama de caja y bigotes (b) asociados con los datos de la tabla 2.9.
5.2.2. El coeciente de asimetría de Pearson
Cuando un conjunto de datos es unimodal, la siguiente medida es útil para establecer el sesgo de la
distribución de la variable de estudio:
Denición 5.2.2. El coeciente de asimetría de Pearson se cal-

cula como la diferencia entre la media aritmética y la mediana dividida
por la desviación estándar del conjunto de datos.
una variable X entonces el valor observado del coeciente de asimetría de Pearson muestral
de X, denotado con AP
dX , está dado por
d X = x̄ − x̆
AP
Sx
donde x̄, x̆ y Sx son respectivamente los valores observados del promedio, la moda y la desviación
estándar de la muestra. La denición del coeciente de asimetría de Pearson poblacional es análoga.
En cuanto a la interpretación, dada una variable X,

AP
d X = 0, se dice que la distribución
cuando
de X es simétrica; cuando AP
d X < 0, se dice que la distribución de X es sesgada negativamente o a
la izquierda; y cuando AP
d X > 0, se dice que la distribución de X es sesgada positivamente o a la
derecha.
Nota. Como se ha visto, para calcular el coeciente de asimetría de Pearson se requiere que la dis-
tribución de los datos sea unimodal. Además, este coeciente se trata de una medida estadística
adimensional, es decir, que no tiene unidades de referencia.
Ejemplo 5.2.2. Calcular e interpretar el coeciente de asimetría de Pearson de los datos de la tabla
2.9.
Solución:
Como se evidencia en los ejemplos 5.2.1 y 4.6.2, en este caso se tiene que
√ x̄ = 94.09, x̆ = 90.39 y
Sx = 355.18 = 18.85. En consecuencia, el valor observado del coeciente de asimetría de Pearson es
d X = x̄ − x̆ = 94.09 − 90.39 = 0.19.

AP
Sx 18.85
Como el valor del coeciente es un número positivo que corresponde a una magnitud que en relación
con los valores de la variable y las medidas de tendencia central no diere de 0, se conrma la simetría
aproximada de la distribución de las ganancias de las empresas, tal y como se estableció en el ejemplo
5.2.1.
Las siguientes son algunas observaciones acerca del coeciente de asimetría de Pearson:
• Es de uso restringido dado que se aplica únicamente a distribuciones unimodales.
• No tiene propiedades aritméticas directas y sencillas de aplicar.
5.2.3. El coeciente de asimetría de Fisher
El coeciente de asimetría de Pearson solo aplica a distribuciones de forma aproximadamente acam-

panada y unimodales. Para distribuciones de otro tipo se puede utilizar, entre otros, el denominado
coeciente de asimetría de Fisher, denominado así en honor a Ronald Fisher 4

.

una variable X. El coeciente de asimetría de Fisher de este con-
junto de datos, denotado con AF
dX , está dado por:
n
1 X
AF
dX = (xi − x̄)3
nSx3 i=1
donde x̄ y Sx son respectivamente los valores observados del promedio y

la desviación estándar de la muestra.
Nota. El coeciente de asimetría de la denición 5.2.3 corresponde al valor observado del coeciente
de asimetría de Fisher muestral . Este coeciente es una medida adimensional y por ende se
puede expresar en porcentaje al igual que el coeciente de asimetría de Pearson y su interpretación es
análoga. De otra parte, cuando se tiene una población nita, la denición del coeciente de asimetría
de Fisher poblacional es análoga.
Cuando los datos de una muestra están agrupados en una distribución de frecuencias el coeciente de
asimetría de Fisher muestral se calcula con la fórmula
k
1 X
AF
dX = ni (xi − x̄)3
nSx3 i=1

Ejemplo 5.2.3. Calcular e interpretar el coeciente de asimetría de Fisher de los datos de la tabla
2.9.
Solución:
Para calcular este coeciente primero se deben calcular las respectivas marcas de clase como en el
ejemplo 3.2.1. Una vez calculadas las marcas de clase, se calcula el coeciente de asimetría de Fisher
de las ganancias aplicando la fórmula para datos agrupados. En la tabla 5.1 se presentan los cálculos
pertinentes. Además, como en el ejemplo 5.2.2, se tiene que Sx = 18.85.
Así, la magnitud del coeciente de asimetría de Fisher de las ganancias es igual a
k
1 X 102, 803.76
AF
dX = ni (xi − x̄)3 = = 0.44.
nSx3 i=1 (35)(18.853 )
Aunque el valor de este coeciente no coincide con el del ejemplo 5.2.2, su interpretación es análoga
y la conclusión acerca de la distribución de las ganancias es idéntica.
4 Fotografía tomada de la página web http://trailblazing.royalsociety.org/?p=6&eventIdInfoTab=120.
Clase xi ni ni (xi − x̄)3 ni (xi − x̄)3

[60.4; 74.0) 67.22 5 −97, 077.66 2,609,170.16
[74.0; 87.7) 80.85 9 −20, 906.50 276,881.67
[87.7; 101.3) 94.48 10 0.59 0.23
[101.3; 114.9) 108.12 6 16,544.77 232,004.97
[114.9; 128.6) 121.75 3 63,459.75 1,755,054.82
[128.6; 142.2] 135.38 2 140,782.81 5,812,855.04
Total N.A. 35.00 102,803.76 10,685,966.89
Tabla 5.1: Cálculos de los ejemplos 5.2.3 y 5.3.1.
Las siguientes son algunas observaciones acerca del coeciente de asimetría de Fisher:
• Se utiliza para cualquier tipo de distribuciones.
Figura 5.3: Ronald Fisher (1890-1962).

5.2.4. El índice de asimetría de Yule-Bowley
Si una distribución de frecuencias es simétrica, es claro que la distancia que hay entre el tercer cuartil
y la mediana debe ser la misma que la que hay entre la mediana y el primer cuartil, esto es
q3 − q2 = q2 − q1 .
Similarmente, una pista para saber si una distribución de frecuencias es sesgada positivamente es que
se cumpla que
q3 − q2 > q2 − q1 ,
y por analogía, si la distribución es sesgada negativamente entonces se sigue que
q3 − q2 < q2 − q1 .
Teniendo en cuenta las relaciones entre los cuartiles, con el propósito de obtener una medida adimen-
sional que cuantique el sesgo de una distribución de frecuencias, se dene el siguiente índice:
Denición 5.2.4. Dadas las observaciones de una muestra de una va-

riable X , el valor observado del índice de asimetría de Yule-Bowley
de este conjunto de datos, denotado con AS
c X, está dado por:
c X = (q3 − q2 ) − (q2 − q1 )
AS
q3 − q1
donde q1 , q2 y q3 son los cuartiles de las observaciones.
Nota. La interpretación del índice de asimetría de Yule-Bowley es análoga a la de los otros coecientes
de asimetría, pero en este caso se tiene que −1 ≤ AS
c X ≤ 1.
Ejemplo 5.2.4. Calcular e interpretar el coeciente de asimetría de Yule-Bowley de los datos de la

tabla 2.9.
Solución:
Como se muestra en el ejemplo 3.3.4, en este caso se sigue que
q1 = 79.71, q2 = 92.44, y q3 = 106.41.
Así, la magnitud del coeciente de asimetría de Yule-Bowley de las ganancias es igual a
c X = (q3 − q2 ) − (q2 − q1 ) = (106.41 − 92.44) − (92.44 − 79.71) = 0.05.

AS
q3 − q1 106.41 − 79.71
Aunque el valor de este coeciente no coincide con los de los ejemplos 5.2.2 y 5.2.3, su interpretación
es análoga y la conclusión acerca de la distribución de las ganancias es idéntica.
5.3. MEDIDAS DE APUNTAMIENTO 99
Las siguientes son algunas observaciones acerca del coeciente de asimetría de Yule-Bowley:
• Únicamente toma valores entre −1 y 1.
• No tiene propiedades aritméticas directas y sencillas de aplicar.
• No es sensible a datos atípicos.
Nota. Cuando se investiga la simetría de una distribución de frecuencias se recomienda utilizar las
tres medidas de asimetría con el propósito de contrastar la información que proporcionan y describir
precisamente la forma correspondiente.
5.3. Medidas de apuntamiento
Las medidas de apuntamiento también denominadas medidas de curtosis o de concentración central

estudian la concentración de frecuencias de una distribución en torno al promedio. A mayor o menor
concentración de frecuencias alrededor de la media en la región central de las observaciones, se obtiene
una distribución más o menos apuntada. Por esta razón, las medidas de curtosis se aplican a dis-
tribuciones de frecuencias campaniformes, es decir, distribuciones unimodales simétricas o con ligera
asimetría.
Para investigar el apuntamiento de una distribución de frecuencias es necesario denir previamente una
distribución que se va a tomar como punto de referencia. Esta distribución se denomina distribución
normal.
Denición 5.3.1. La distribución normal corresponde a una distri-

bución de frecuencias cuyo polígono de frecuencias de una variable X
con media µX y desviación σX corresponde a la función
2
1

x−µX
−1
fX (x) = √ e 2 σX
2πσX
donde π es el número pi y e es el número de Euler.
Nota. La denición 5.3.1 es apenas una denición preliminar de la distribución normal. En la gura 5.4
se presenta una ejemplo de la distribución normal. Esta distribución se estudia detalladamente en la
sección 10.3.2 y es el punto de referencia para decidir si una distribución de frecuencias es apuntada
o aplanada.
A continuación se presenta una medida para cuanticar el grado de apuntamiento de una distribución
de frecuencias dada:
Figura 5.4: Gráco de la distribución normal con media 0 y varianza 1.

una variable X. El valor observado del coeciente de apuntamiento
de Fisher de este conjunto de datos, denotado con AG
dX , está dada
por:
n
1 X
AG
dX = (xi − x̄)4 − 3.
nSx4 i=1
donde x̄ y Sx son respectivamente los valores observados del promedio y
la desviación estándar de la muestra.
coeciente
Nota. La magnitud del coeciente de la denición 5.3.2 corresponde al valor observado del
de apuntamiento de Fisher muestral . Este coeciente también se llama curtosis y es una medida
adimensional al igual que los otros coecientes. Además, cuando se tiene una población nita, la
denición del coeciente de apuntamiento de Fisher poblacional es análoga.
Cuando los datos de una muestra están agrupados en una distribución de frecuencias el coeciente de
5.3. MEDIDAS DE APUNTAMIENTO 101
apuntamiento de Fisher muestral se calcula con la fórmula
k
1 X
AG
dX = ni (xi − x̄)4 − 3
nSx4 i=1

De otra parte, para la distribución normal estándar se tiene que la curtosis es exactamente igual a 0.
De este modo, trabajando con datos muestrales de una variable X, se clasican las distribuciones de
frecuencias como:
• Leptocúrtica : cuando AG
d X > 0, es decir, cuando la distribución de frecuencias es más apuntada
que la normal.
• Mesocúrtica : cuando AG
d X = 0, es decir, cuando la distribución de frecuencias es tan apuntada
como la normal.
• Platicúrtica : cuando AG
d X < 0, es decir, cuando la distribución de frecuencias es menos apun-
tada que la normal.
En la gura 5.5 se muestra un ejemplo de algunas distribuciones simétricas con distintos grados de
apuntamiento. En la gura (a) las observaciones se encuentran altamente dispersas en torno a la
media y están asociadas con una distribución más aplanada que la normal, mientras que en la gura
(c) los valores de la variable están mucho más concentrados alrededor del promedio y conforman
una distribución mucho más apuntada que la normal. Por último, la gura (b) corresponde a una
distribución intermedia que sí corresponde a una distribución catalogada como normal.
Figura 5.5: Ejemplos de algunas distribuciones simétricas con distintos grados de apuntamiento.
Ejemplo 5.3.1. Calcular e interpretar el coeciente de apuntamiento de Fisher de los datos de la

tabla 2.9.
Solución:
En los ejemplos 5.2.2, 5.2.3 y 5.2.4 se establece que la distribución de las ganancias de las empresas
objeto de estudio es aproximadamente normal. Por lo tanto es de interés calcular el grado de apunta-
miento de esta distribución con el propósito de establecer si puede ser catalogada como normal.
Para calcular el coeciente requerido primero se deben calcular las respectivas marcas de clase como
en el ejemplo 3.2.1. Una vez calculadas las marcas de clase, se calcula la curtosis de las utilidades
aplicando la fórmula para datos agrupados. En la tabla 5.1 se presentan los cálculos pertinentes.
Además, como en el ejemplo 5.2.2, se tiene que Sx = 18.85.
Así, la magnitud del coeciente de apuntamiento de Fisher de las ganancias es igual a
k
1 X 10, 685, 966.89
AG
dX = ni (xi − x̄)4 − 3 = − 3 = −0.58.
nSx4 i=1 (35)(18.854 )
Dado que el valor de la curtosis es negativo se sigue que la distribución de las ganancias es platicúrtica,
esto es, más aplanada que la normal. Sin embargo, examinando el valor del coeciente a la luz de los
valores de la variable y de las medidas de tendencia central, se concluye que su magnitud no es
considerable y que la distribución de las utilidades de las empresas se puede catalogar como normal.
5.4. Comentarios
Tener conocimiento sobre la forma de una distribución permite realizar descripciones conables so-
bre el comportamiento de las observaciones de una variable de interés. Dependiendo de la forma de
la distribución de frecuencias de un conjunto de datos es posible establecer la acomodación de las
observaciones alrededor del promedio, precisar aún más su grado de homogeneidad y catalogar si se
pueden catalogar o no como normales. Estas características están relacionadas intrínsecamente con la
cantidad de información que una muestra puede aportar respecto al comportamiento de la población
de la cual proviene: cuando la distribución de la población es heterogénea y diere signicativamente
de la normal, las muestras de tamaño pequeño pueden no captar todos los aspectos relacionados
con la población. De otro lado, cuando una población es homogénea y clasicada como normal, una
muestra de tamaño pequeño puede ser suciente para obtener información conable acerca de los
rasgos objeto de estudio de la población.
El conocimiento sobre la asimetría de la distribución también es de utilidad práctica. Evidenciar la

dirección en la que se encuentra la fuente de sesgo es fundamental porque así es posible detectar las
observaciones que se encuentran agrupadas en alguno de los extremos de la distribución que no hacen
5.5. EJERCICIOS 103
parte del grueso de la información.
Con lo que se ha estudiado hasta ahora, se ha mostrado cómo describir un conjunto de datos de
una variable a través de grácas y de medidas estadísticas. Las grácas evidencian de forma sencilla
el comportamiento de los datos, mientras que las medidas estadísticas evidencian de forma precisa y
objetiva las características de la distribución de las observaciones que se han intuido con los diagramas.
En el siguiente capítulo se extienden estas prácticas a casos donde se tenga en cuenta más de una
variable a la vez y se quiera investigar la relación entre éstas.
5.5. Ejercicios
5.1. Demostrar que si X es una variable y a, b son números reales entonces se tiene que:
i. Si X=a entonces AF
dX yAG
d X no están denidos.
ii. Si Y = aX + b entonces AF
d Y = sgn(a)AF
d X donde sgn(x) denota el signo de x.
iii. Si Y = aX + b entonces AG
d Y = AG
dX .
5.2. Escribir las versiones poblacionales de las medidas estadísticas presentadas en este capítulo.
5.3. Establecer la escala de medición requerida para cada medida de dispersión presentada en este
capítulo.
5.4. Con la información del ejercicio 3.12:
a. Inspeccionar las medidas de tendencia central.
b. Calcular e interpretar las medidas de asimetría.
c. Realizar un histograma y un diagrama de caja y bigotes.
d. Con base en los resultados obtenidos en los incisos anteriores, ¾qué se puede establecer acerca
de la forma de la distribución de la variable de estudio?
e. Si es menester, calcular e interpretar el coeciente de apuntamiento de Fisher.
5.5. Rehacer los incisos del ejercicio 5.4 con la información del ejercicio 3.17.
5.6. Rehacer los incisos del ejercicio 5.4 con la información del ejercicio 4.12.
Capı́tulo 6
Medidas descriptivas para dos variables
6.1. Introducción
Muchos estudios, prácticos y teóricos, indagan directa o indirectamente por el vínculo que tienen las
variables entre sí. Por ejemplo, puede ser de interés especicar la relación entre fumar y el cáncer de
pulmón, o la actividad física y el peso corporal, o el estrato socioeconómico y el patrimonio. Con el
propósito de investigar el nexo entre dos variables, se quiere describir el comportamiento del conjunto
de datos correspondiente mediante grácas que evidencien la interacción entre las características objeto
de estudio, y a través de medidas estadísticas que den cuenta de la asociación entre las variables de
interés.
6.2. Tablas de doble entrada
En este escenario se dispone de un conjunto de n individuos, cada uno de ellos observado en dos
atributos que en adelante se representan mediante X y Y . Se supone que la variable X tiene k
categorías, es decir, X asume los valores x1 , x2 , . . . , xk , y que la variable Y tiene p categorías, es decir,
Y asume los valores y1 , y2 , . . . , yp . Las categorías de las variables están dadas naturalmente cuando
las variables son cualitativas, o se pueden construir por medio de intervalos cuando las variables son
cuantitativas.
Con el propósito de reunir en una sola estructura toda la información disponible, se elabora una tabla
de frecuencias conformada por k×p casillas o categorías, denotadas con Cij , para i = 1, . . . , k y
j = 1, . . . , p, organizadas de tal forma que se tengan k las y p columnas con las categorías de las
104
6.2. TABLAS DE DOBLE ENTRADA 105
variables X y Y respectivamente. Tal estructura se denomina tabla de doble entrada 1

.
Nota. La letra i se utiliza como elemento genérico de las categorías de la variable X de las las, es
decir, i es un valor que varía entre 1 y k, y j se utiliza como elemento genérico de las categorías de la
variable Y de las columnas, esto es, j es un valor que varía entre 1 y p.
Denición 6.2.1. La frecuencia absoluta conjunta de la clase Cij ,

denotada con nij , es la cantidad de observaciones que hacen parte de la
i-ésima la y la j -ésima columna para i = 1, . . . , k y j = 1, . . . , p.
Denición 6.2.2. La frecuencia relativa conjunta de la clase Cij ,

denotada con fij , es la proporción de la frecuencia absoluta conjunta de
la ij -ésima categoría respecto a la cantidad total de observaciones, esto
es,
nij
fij =
n
para i = 1, . . . , k y j = 1, . . . , p.
Nota. Multiplicado por 100 % la fórmula de la denición 6.2.2, fij representa el porcentaje de indivi-
duos comprendidos en la categoría correspondiente.
Denición 6.2.3. La frecuencia absoluta marginal de la la i, de-

notada con ni• , es el total de observaciones de la i-ésima categoría de
la variable de las las para i = 1, . . . , k . Así mismo, la frecuencia ab-
soluta marginal de la columna j , denotada con n•j , es el total de
observaciones de la j -ésima categoría de la variable de las columnas para
j = 1, . . . , p.
Nota. Es claro que a partir de la denición 6.2.3 se tiene que
p
X
ni• = ni1 + ni2 + . . . + nip = nij para i = 1, . . . , k ,
j=1
y además
k
X
n•j = n1j + n2j + . . . + nkj = nij para j = 1, . . . , p.
i=1
1 Esta conguración también se denomina tabla de contingencia o tabla de clasicación

106 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
Denición 6.2.4. La frecuencia relativa marginal de la la i, deno-

tada con fi• , es la proporción de observaciones de la i-ésima categoría de
la variable de las las respecto al total de observaciones para i = 1, . . . , k .
Así mismo, la frecuencia relativa marginal de la columna j , deno-
tada con f•j , es la proporción de observaciones de la j -ésima categoría
de la variable de las columnas respecto al total de observaciones para
j = 1, . . . , p.
Nota. Es claro que a partir de la denición 6.2.4 se tiene que
ni•
fi• = para i = 1, . . . , k ,
n
y además
n•j
f•j = para j = 1, . . . , p.
n
Ejemplo 6.2.1. En la tabla 6.1 se presenta un ejemplo en el que se tiene de una tabla de doble
entrada con las frecuencias absolutas y relativas de una variable X de las las con k niveles y una
variable Y p niveles. Por ejemplo, n23 representa la frecuencia absoluta conjunta
de las columnas con
de la categoría 2 de la variable X y de la categoría 3 de la variable Y , mientras que f•1 simboliza la
frecuencia relativa marginal de la categoría 1 de la variable Y .
X \Y y1 y2 ··· yp Total
x1 n11 \ f11 n12 \ f11 ··· n1p \ f1p n1• \ f1•
x2 n21 \ f21 n22 \ f22 ··· n2p \ f2p n2• \ f2•
. . . . . .
. . . . . .
. . . . . .
xk nk1 \ fk1 nk2 \ fk2 ··· nkp \ fkp nk• \ fk•
Total n•1 \ f•1 n•2 \ f•2 ... n•p \ f•p n\1
Tabla 6.1: Ejemplo de una tabla de doble entrada.
Proposición 6.2.1. En una tabla de doble entrada de k×p se cumplen las siguientes propiedades:
i. iii.
p
k X k p p
X
X X X
nij = ni• = n•j = n. fi• = fij para i = 1, . . . , k .
i=1 j=1 i=1 j=1 j=1
ii. iv.
X p
k X k
X p
X k
X
fij = fi• = f•j = 1. f•j = fij para j = 1, . . . , p.
i=1 j=1 i=1 j=1 i=1

6.3. PERFILES O DISTRIBUCIONES CONDICIONADAS 107
X \Y Bachillerato Pregrado Posgrado Total

Hombre 4 9 12 25
Mujer 12 7 2 21
Total 16 16 14 46
Tabla 6.2: Tabla de contingencia asociado con el género (X ) y el nivel educativo (Y ) de una muestra de personas de
una empresa.
Ejemplo 6.2.2. La tabla 6.2 corresponde a una tabla de contingencia en la que se estudia la variable
género (X ) y nivel educativo (Y ) de una muestra de personas de una empresa. Obtener las frecuencias
relativas conjuntas y marginales correspondientes.
Solución:
k = 2, p = 3, n1• = 25, n2• = 21, n•1 = 16, n•2 = 16, n•3 = 14 y n = 46.
En la tabla 6.3 se presentan las frecuencias relativas correspondientes que han sido calculadas con
respecto al tamaño de la muestra, es decir, con respecto a n = 46, usando las fórmulas
nij ni• n•j

fij = , fi• = y f•j =
46 46 46
donde nij es la frecuencia absoluta conjunta de la ij -ésima categoría para i = 1, 2 y j = 1, 2, 3.
Por ejemplo, se observa que el porcentaje de empleados que son hombres es 54.3 %, el porcentaje
de empleados que tienen estudios de posgrado es 30.4 % y que el porcentaje de empleados que son
hombres y tienen bachillerato es 48.7 %.

Hombre 8.7 % 19.6 % 26.1 % 54.3 %
Mujer 26.1 % 15.2 % 4.3 % 45.7 %
Total 34.8 % 34.8 % 30.4 % 100.0 %
Tabla 6.3: Tabla de contingencia de frecuencias relativas del ejemplo 6.2.2
6.3. Perles o distribuciones condicionadas
Los perles o distribuciones condicionadas corresponden a tablas bidimensionales en las que interesa
investigar el comportamiento de una variable dado un valor especíco de la otra. En el caso bidimen-
sional se destacan los perles la y los perles columna.
Denición 6.3.1. Los perles la están asociados con una tabla de
doble entrada en la que se calculan las frecuencias relativas conjuntas
respecto a los totales de las las correspondientes. Análogamente, los
perles columna están asociados con una tabla de doble entrada en la
que se calculan las frecuencias relativas conjuntas respecto a los totales
de las columnas correspondientes.
Nota. A partir de la denición 6.3.1, dada una tabla de contingencia de k ×p, se tiene que la frecuencia
relativa de la ij -ésima categoría de una tabla de perles la, denotada con fij|i• , está dada por:
nij
fij|i• = ,
ni•
mientras que la frecuencia relativa de la ij -ésima categoría de una tabla de perles columna, denotada
con fij|•j , se está dada por:
nij
fij|•j =
n•j
para i = 1, . . . , k y j = 1, . . . , p.
Proposición 6.3.1. En una tabla de perles la o columna de k×p se cumplen las siguientes
propiedades:
i. iii.
fij fij
fij|i• = para i = 1, . . . , k y j = 1, . . . , p. fij|i• = para i = 1, . . . , k y j = 1, . . . , p.
fi• fi•
ii. iv.
p
X k
X
fij|i• = 1 para i = 1, . . . , k . fij|•j = 1 para j = 1, . . . , p.
j=1 i=1
Ejemplo 6.3.1. Elaborar los perles la y los perles columna de la muestra para la tabla bidimen-
sional del ejemplo 6.2.2.
Solución:
Los perles la y los perles columna de la muestra se presentan respectivamente en las tablas 6.4 y
6.5. Las frecuencias relativas de estas tablas se calcularon con las fórmulas
nij nij
fij|i• = y fij|•j =
ni• n•j
para i = 1, 2 y j = 1, 2, 3.
Por ejemplo, se observa que de los hombres, tiene posgrado el 48.0 % (tabla 6.4), mientras que de los
individuos con posgrado, es hombre el 85.7 % (tabla 6.5).
6.4. GRÁFICAS PARA DOS VARIABLES 109

Hombre 16.0 % 36.0 % 48.0 % 100.0 %
Mujer 57.1 % 33.3 % 9.5 % 100.0 %
Total 34.8 % 34.8 % 30.4 % 100.0 %
Tabla 6.4: Perles la de la muestra del ejemplo 6.2.2.

Hombre 25.0 % 56.3 % 85.7 % 54.3 %
Mujer 75.0 % 43.8 % 14.3 % 45.7 %
Total 100.0 % 100.0 % 100.0 % 100.0 %
Tabla 6.5: Perles columna de la muestra del ejemplo 6.2.2.
Nota. Al interpretar las frecuencias relativas de los perles es indispensable jarse cuál es el grupo de
individuos de referencia.
6.4. Grácas para dos variables
Es costumbre presentar al lado de cada tabla de contingencia una gráca que permita evidenciar
fácilmente el comportamiento de los valores presentados en la misma. A continuación se presentan
una serie de ejemplos en los que se ilustra la información contenida en tablas bidimensionales corrientes
y tablas de perles.
Ejemplo 6.4.1. En las guras 6.1 y 6.2 se presentan dos grácos de barras de las frecuencias relativas
del género frente al nivel educativo del ejemplo 6.2.2.
Cuando se trabaja con dos variables cuantitativas, es costumbre denominar a la variable X repre-
sentada en el eje x variable independiente y a la variable Y representada en el eje y variable
dependiente . Las observaciones que resultan de la medición de las variables X y Y sobre cada indivi-
duo de un grupo especíco se considera como un conjunto de realizaciones de la variable bidimensional
(X, Y ) y se denomina conjunto de datos bivariados . Así, la observación de las variables sobre el i-
ésimo individuo de una muestra de tamaño n se representa mediante la dupla (xi , yi ) para i = 1, . . . , n.
Por último, también es costumbre mostrar las observaciones de una muestra correspondiente a un con-
junto de datos bivariado mediante una tabla horizontal (o vertical) como se ilustra en la tabla 6.6.
Ejemplo 6.4.2. En un grupo de 25 niños se miden las cantidades antropométricas de peso (en
kilogramos) y edad (en años cumplidos), obteniéndose los resultados que se presentan en la tabla 6.7.
2
Elaborar una gráca cartesiana del peso (Y ) frente a la edad (X ) con este conjunto de datos.
2 Una gráca cartesiana donde las abscisas y las ordenadas corresponden respectivamente a los valores observados de
Figura 6.1: Gráco de barras tridimensional de las frecuencias relativas del ejemplo 6.2.2.
Variable X x1 x2 ··· xn
Variable Y y1 y2 ··· yn
Tabla 6.6: Tabla de observaciones de una muestra correspondiente a un conjunto de datos bivariado.
Edad 12.3 13.2 12.5 13.1 12.9 13.1 12.4 12.9 13.2 12.3 12.4 13.0 12.5
Peso 39.5 41.0 39.7 40.8 40.7 41.3 39.2 40.4 41.2 38.8 39.4 40.2 39.7
Edad 12.6 12.8 12.9 12.5 13.1 13.0 12.7 12.2 13.3 12.4 12.3 12.6
Peso 39.8 40.0 40.3 39.6 41.1 41.3 40.3 39.4 41.1 39.9 39.6 40.2
Tabla 6.7: Datos asociados con el peso y la edad de un grupo de 25 niños.
Solución:
En la gura 6.3 se muestra el diagrama de dispersión del peso frente a la edad de los ocho niños.
Se observa que la relación entre las variables es directa y aparentemente fuerte. En las secciones
posteriores se estudian algunas medidas para cuanticar este hecho.
un par de variables se denomina diagrama de dispersión , dispersograma o nube de puntos . Este tipo de grácas
se utiliza cuando las variables objeto de estudio son cuantitativas.
6.5. MEDIDAS DE ASOCIACIÓN 111
Figura 6.2: Gráco de barras de las frecuencias relativas del ejemplo 6.2.2.
Es importante resaltar que las nubes de puntos apenas sugieren cómo es la relación entre un par de
variables cuantitativas, mas no tienen la última palabra al respecto. En algunos escenarios esta señal
es lo sucientemente clara como se evidencia en la gura 6.3 donde la relación es lineal. En estos
casos es posible establecer sin problemas el tipo de relación funcional entre las variables de estudio,
ya sea lineal, cuadrática, cúbica, logarítmica o exponencial, por ejemplo (gura 6.4). Sin embargo,
algunas ocasiones no es posible determinar fácilmente esta relación de manera precisa. Un par de
ejemplos al respecto se ilustran en los diagramas de dispersión (a) y (b) de la gura 6.5, donde solo se
puede evidenciar una región en la cual la densidad de puntos es mayor, lo que señala la presencia de
combinaciones de valores de las variables que son más frecuentes que otros, pero no es claro identicar
una relación particular. Así mismo, se pueden dar situaciones en las que no sea posible evidenciar una
relación entre las variables de estadio, ya que hay diagramas de dispersión como el (c) de la gura 6.5,
donde no es posible establecer directamente un vinculo entre las variables, aunque esto no signica
necesariamente que tal relación no exista.
6.5. Medidas de asociación
A continuación se mencionan algunas medidas de uso común para describir y cuanticar objetivamente
la posible relación existente entre dos variables cuantitativas. Entro otras medidas de asociación se
Figura 6.3: Dispersograma del peso frente a la edad de los 25 niños.
destacan la covarianza y los coecientes de correlación.
6.5.1. Covarianza
La covarianza es una medida de asociación entre dos variables cuantitativas que permite establecer
el modo de la relación lineal entre las características objeto de estudio. Esta medida mesura la
variabilidad conjunta de un par de variables y sirve como insumo para constituir otras medidas de
asociación.
Denición 6.5.1. Sea (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) un conjunto de n

realizaciones de una variable bidimensional (X, Y ). La covarianza de
este conjunto de datos, denotado con Sxy , está dada por:
n
1 X
Sxy = (xi − x̄)(yi − ȳ)
n − 1 i=1
Figura 6.4: Ejemplos de diagramas de dispersión en los que se evidencia una relación cuadrática (a), cúbica (b),
exponencial (c) y logarítmica (d).
Nota. La covarianza muestral observada de una variable bidimensional (X, Y ) se simboliza con
Sxy , mientras que lacovarianza poblacional se denota con σXY . Así, cuando se dispone de una
población nita, se tiene que
N
1 X
σxy = (xi − µX )(yi − µY )
N i=1
donde N es el tamaño de la población. Se resalta el hecho de que la covarianza es una medida expresada
con unidades mixtas (unidades de la variable independiente multiplicadas por las unidades de la
variable dependiente) de asociación que describe la variabilidad conjunta de dos variables cuantitativas.
Considerar una nube de puntos conformada por una muestra de n realizaciones de la variable bidi-
mensional (X, Y ) cuyo centro es el punto (x̄, ȳ). La representación de (xi − x̄, yi − ȳ) para i = 1, . . . , n
resulta en una traslación de la nube de puntos original al origen (0, 0). De esta forma, el diagrama de
dispersión queda dividido en cuatro cuadrantes como se observa en las nubes de puntos de la gura
6.6. Los datos bivariados que se encuentran en el primer y tercer cuadrante contribuyen positivamente
Figura 6.5: Ejemplos de diagramas de dispersión en los que no se evidencia directamente una relación entre a las
variables.
al valor de la covarianza, mientras que los datos bivariados que se encuentran en el segundo y cuarto
cuadrante lo hacen negativamente. De este modo:
• Si hay mayoría de puntos en el tercer y primer cuadrante entonces se tiene que Sxy > 0,
lo que quiere decir que la variable dependiente tiende a aumentar cuando lo hace la variable
independiente (relación directa).
• Si hay mayoría de puntos en el segundo y cuarto cuadrante entonces se tiene que Sxy < 0,
lo que quiere decir que la variable dependiente tiende a disminuir cuando lo hace la variable
independiente (relación inversa).
• Si los puntos se reparten equitativamente alrededor de (x̄, ȳ) entonces se tiene que Sxy = 0.
Nota. Cuando los puntos se reparten de modo más o menos homogéneo entre los cuadrantes primero
y tercero, y segundo y cuarto, se tiene que la covarianza de las variables es aproximadamente igual
a 0. Esto no quiere decir de ningún modo que no exista ninguna relación entre las dos variables; de
hecho este nexo puede existir como se aprecia en el diagrama de dispersión (d) de la gura 6.6.
Ejemplo 6.5.1. Calcular e interpretar la covarianza entre la edad y el peso con el conjunto de datos
bivariado del ejemplo 6.4.2.
Solución:
Para obtener la covarianza entre la edad y el peso primero se deben calcular los promedios de estas
variables. En este caso se tiene que x̄ = 12.728 y ȳ = 40.180. Luego de calcular los respectivos
promedios, se procede a calcular las diferencias y los productos, de tal forma que la covarianza entre
Figura 6.6: Ejemplos de nubes de puntos de un par de variables con relación directa (a), relación inversa (b) y
covarianza nula (c y d).
la edad y el peso es
n
1 X
Sxy = (xi − x̄)(yi − ȳ)
n − 1 i=1
1
= ((12.3 − 12.728)(39.5 − 40.180) + . . . + (12.6 − 12.728)(40.2 − 40.180))
25 − 1
= 0.226.
Dado que la covarianza entre la edad y el peso es positiva entonces la relación entre las dos variables
es directa como se aprecia en la gura 6.3. Las las unidades de la covarianza son unidades mixtas que
en este caso corresponden a años × kilogramo.
A continuación se presentan algunas propiedades de la covarianza:

Proposición 6.5.1. Sea (X, Y ) una variable bidimensional y a, b, c y d números reales. Entonces se
tiene que:
i. SXY = SY X .
2
ii. SXX = SX .
iii. Si V = aX + b y W = cY + d entonces SV W = acSXY .
Demostración:
i.
n n
1 X 1 X
SXY = (Xi − X̄)(Yi − Ȳ ) = (Yi − Ȳ )(Xi − X̄) = SY X .
n − 1 i=1 n − 1 i=1
ii.
n n
1 X 1 X
SXY = (Xi − X̄)(Xi − X̄) = (Xi − X̄)2 = SX
2
.
n − 1 i=1 n − 1 i=1
iii. Si V = aX + b y W = cY + d entonces se sigue que:
n
1 X
SV W = (Vi − V̄ )(Wi − W̄ )
n − 1 i=1
n
1 X
= ((aXi + b) − (aX̄ + b))((cYi + d) − (cȲ + d))
n − 1 i=1
n
1 X
= (aXi + b − aX̄ − b)(cYi + d − cȲ − d)
n − 1 i=1
n
1 X
= a(Xi − X̄)c(Yi − Ȳ )
n − 1 i=1
n
1 X
= ac(Xi − X̄)(Yi − Ȳ )
n − 1 i=1
n
1 X
= ac (Xi − X̄)(Yi − Ȳ )
n − 1 i=1
= acSXY .
Ejemplo 6.5.2. La covarianza entre los costos de producción (C ) y las utilidades (U ) de una compañía
es 5.61. El presidente de la empresa está implementando una política de calidad para que los costos
disminuyan 1 % y las utilidades aumenten 5 %. ¾Con esta política de calidad la covarianza entre
los costos de producción y las utilidades aumenta o disminuye? Si el incremento porcentual de las
utilidades es 10 %, ¾en cuántos puntos porcentuales deben disminuir los costos de producción bajo la
política de calidad para que la covarianza entre las variables alcance las 6 unidades mixtas?
Solución:
Si SV W denota la covarianza entre los costos de producción y las utilidades bajo la política de calidad
entonces
V = C − 0.01C = 0.99C y W = U + 0.05U = 1.05U.
En consecuencia,
SV W = (0.99)(1.05)SXY = (1.0395)(5.61) = 5.831
y por lo tanto con está política la covarianza entre las variables aumenta.
De otra parte, sea x el decremento porcentual de los costos de producción para que la covarianza bajo
la política de calidad sea igual a 6 unidades mixtas. Entonces se sigue que
(1 − x)(1.10)(5.61) = 6.
Despejando x de esta ecuación se obtiene que x = 0.0277 y por lo tanto la decremento porcentual de
los costos de producción debe ser de 2.77 %.
Proposición 6.5.2. Si (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) es un conjunto de n realizaciones de una variable

bidimensional (X, Y ) entonces:
n
X n
X
(xi − x̄)(yi − ȳ) = xi yi − nx̄ȳ.
i=1 i=1
Demostración:
n
X n
X
(xi − x̄)(yi − ȳ) = (xi yi − ȳxi − x̄yi + x̄ȳ)
i=1 i=1
n
X n
X n
X n
X
= xi yi − ȳxi − x̄yi + x̄ȳ
i=1 i=1 i=1 i=1
Xn n
X n
X
= xi yi − ȳ xi − x̄ yi + nx̄ȳ
i=1 i=1 i=1
Xn
= xi yi − ȳ(nx̄) − x̄(nȳ) + nx̄ȳ
i=1
Xn
= xi yi − nx̄ȳ − nx̄ȳ + nx̄ȳ
i=1
n
X
= xi yi − nx̄ȳ.
i=1
En el sección ?? se señala que la varianza de una suma de dos variables no coincide con la suma de
las varianzas de las variables. En la siguiente proposición se establece a qué corresponde la varianza
de esta suma.
Proposición 6.5.3. Si X y Y son variables conmensurables y W =X +Y entonces
2 2
SW = SX + SY2 + 2SXY .
Demostración:
n
2 1 X
SW = (Wi − W̄ )2
n − 1 i=1
n
1 X
= (Xi + Yi − (X̄ + Ȳ ))2
n − 1 i=1
n
1 X
= (Xi + Yi − X̄ − Ȳ )2
n − 1 i=1
n
1 X
= ((Xi − X̄) + (Yi − Ȳ ))2
n − 1 i=1
n
1 X
(Xi − X̄)2 + 2(Xi − X̄)(Yi − Ȳ ) + (Yi − Ȳ )2

=
n − 1 i=1
n n n
!
1 X X X
= (Xi − X̄)2 + 2(Xi − X̄)(Yi − Ȳ ) + (Yi − Ȳ )2
n−1 i=1 i=1 i=1
n n n
!
1 X
2
X
2
X
= (Xi − X̄) + (Yi − Ȳ ) + 2 (Xi − X̄)(Yi − Ȳ )
n−1 i=1 i=1 i=1
n n n
1 X 1 X 1 X
= (Xi − X̄)2 + (Yi − Ȳ )2 + 2 (Xi − X̄)(Yi − Ȳ )
n−1 i=1
n−1 i=1
n − 1 i=1
2
= SX + SY2 + 2SXY .
A continuación se presenta una expresión que generaliza la identidad de la proposición 6.5.3:

Proposición 6.5.4.
Pm
Si X1 , . . . , Xm son m variables conmensurables y W = i=1 Xi entonces
m
X m X
X m
2 2
SW = SX i
+2 SXi Xj .
i=1 i=1 j=1
1≤i<j≤m
Las siguientes son algunas observaciones acerca de la covarianza:
• Está dada en unidades mixtas.
6.5.2. Coeciente de correlación de Pearson
La covarianza es una medida de variabilidad conjunta que indica la forma en la que dos variables
cuantitativas continuas están relacionadas linealmente. Una covarianza grande indica que hay una
relación de tipo lineal entre las dos variables. Pero, ¾qué signica que la covarianza sea grande?
¾Cómo se puede calicar la magnitud de la covarianza? De hecho, la magnitud de la covarianza
depende de la escala de medida que se utiliza. Por esta razón, es difícil, en casos concretos, establecer
a simple vista, si la covarianza es grande o no (Blanco 2004).
La covarianza está dada en unidades mixtas de medición, lo que motiva denir una medida de la
relación entre dos variables cuantitativas, que no se vea afectada por los cambios de unidad de
medida, es decir, que sea adimensional. Una forma de conseguir esto es dividir la covarianza por el
producto de las desviaciones estándar de cada variable.
Denición 6.5.2. El coeciente de correlación de Pearson (o sim-

plemente coeciente de correlación) entre dos variables se dene como el
cociente entre la covarianza y el producto de las desviaciones estándar
de las variables del conjunto de datos bivariado correspondiente.
una variable bidimensional (X, Y ) entonces el valor observado del coeciente de correlación de
Pearson muestral entre X y Y , denotado con rxy , está dado por
Sxy
rxy = .
Sx Sy
Similarmente, el coeciente de correlación de Pearson poblacional entre X y Y, denotado con

ρXY , está dado por
σXY
ρXY = .
σX σY
El coeciente de correlación está ligado directamente con el grado de la asociación lineal de las
variables. De hecho, el coeciente de correlación únicamente mesura la fortaleza de la relación lineal
entre dos variables cuantitativas continuas. Además, al igual que la covarianza, con el coeciente de
correlación también es posible identicar si la relación entre las variables es directa o inversa, pues los
signos del coeciente y de la covarianza son iguales.
Al igual que el índice de Yule-Bowley, el coeciente de correlación siempre toma valores entre −1 y
1. De esta forma, a medida que el coeciente se acerca a 0, la relación lineal entre las variables se
debilita, y en caso contrario, a medida que el coeciente se acerca a −1 o 1, la relación lineal entre las
variables se fortalece de manera inversa o directa respectivamente. De este modo si el valor absoluto
del coeciente:
• Es igual a 1 entonces la relación lineal entre las variables es perfecta.
• Está entre 0.9 y 1 entonces la correlación entre las variables es alta o fuerte.
• Está entre 0.7 y 0.9 entonces la relación entre las variables es moderada.
• Está entre 0.5 y 0.7 entonces la relación lineal entre las variables aceptable.
• Está entre 0 y 0.5 entonces la relación lineal entre las variables reducida o mínima.
• Es igual a entonces no existe una relación lineal entre las variables.
En la gura 6.7 se presentan algunos ejemplos de nubes de puntos con diferentes grados de correlación.
Ejemplo 6.5.3. Calcular el coeciente de correlación entre la edad y el peso de los datos del ejemplo
6.4.2.
Solución:
Para calcular el coeciente de correlación de Pearson entre la edad y el peso se necesita obtener
previamente las desviaciones estándar correspondientes. En este caso se tiene que Sx = 0.339 y
Sy = 0.724. Así, el coeciente de correlación es
Sxy 0.226
rxy = = = 0.920.
Sx Sy (0.339)(0.724)
Este coeciente indica que la relación lineal entre la edad y el peso de los niños es directa y además
fuerte.
Figura 6.7: Ejemplos de nubes de puntos con su respectivo coeciente de correlación.
Las siguientes son algunas observaciones acerca del coeciente de correlación de Pearson:

6.5.3. Coeciente de correlación de Spearman
El coeciente de correlación de Spearman tiene la misma intensión del coeciente de correlación de

Pearson, solo que en este caso el coeciente se calcula sobre el rango (detalles en la sección 3.3.1) de
las variables de interés. Esta es una medida de asociación ventajosa para los casos donde se tienen
variables cuantitativas discretas o variables mesuradas en una escala al menos de tipo ordinal, ya que
el coeciente de correlación de Pearson se dene para variables cuantitativas continuas.
Denición 6.5.3. Sea (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) un conjunto de n

realizaciones de una variable bidimensional (X, Y ). El coeciente de
correlación de Spearman de este conjunto de datos, denotado con
rsxy , está dada por:
Pn
¯ (ỹi − ỹ)
(x̃i − ỹ) ¯
rsxy = Pn i=1 ¯ Pn ¯
( i=1 (x̃i − x̃)) ( i=1 (ỹi − ỹ))
donde x̃i y ỹi son respectivamente los rangos de xi y yi del i-ésimo

individuo para i = 1, . . . , n.
Nota. El coeciente de correlación de Spearman no es más que el coeciente de correlación de Pearson

aplicado a los rangos de las variables y su interpretación es análoga.
Ejemplo 6.5.4. Uno de los competidores se dio cuenta de que las posiciones en las que los individuos
se encontraban habían sido asignadas para favorecer a algunos, siendo los más favorecidos los que
se encontraban en las últimas posiciones. Mediante la asociación entre las posiciones y el puntaje
obtenido que se presentan en la tabla 6.8 colaborar la armación del competidor.
Solución:
En la tabla 6.8 se presentan los rangos de la posición (X ) y el puntaje (Y ) de los competidores. En

consecuencia, se tiene que el coeciente de correlación de Spearman es
−1.105
rsxy = = −0.032.
(5.916)(5.891)
Por lo tanto se concluye que las posiciones no se encontraban favorecidas, o en el caso de que lo
hubieran estado, no se vio reejado en el resultado del torneo.
Las siguientes son algunas observaciones del coeciente de correlación de Spearman:
• Se calcula para variables mesuradas en una escala al menos de tipo ordinal.

• Es más robusta a datos atípicos en comparación con el coeciente de correlación de Pearson.
# Posición Puntaje Rango de Pos. Rango de Pun.

1 1.00 52.00 1.00 12.00
2 2.00 46.00 2.00 5.50
3 3.00 56.00 3.00 16.00
4 4.00 62.00 4.00 18.00
5 5.00 50.00 5.00 10.00
6 6.00 53.00 6.00 13.00
7 7.00 41.00 7.00 1.00
8 8.00 55.00 8.00 14.50
9 9.00 50.00 9.00 10.00
10 10.00 43.00 10.00 4.00
11 11.00 62.00 11.00 18.00
12 12.00 42.00 12.00 2.50
13 13.00 55.00 13.00 14.50
14 14.00 47.00 14.00 7.00
15 15.00 46.00 15.00 5.50
16 16.00 50.00 16.00 10.00
17 17.00 62.00 17.00 18.00
18 18.00 42.00 18.00 2.50
19 19.00 48.00 19.00 8.00
20 20.00 65.00 20.00 20.00
Tabla 6.8: Datos asociados con la posición y el puntaje de los competidores del ejemplo 6.5.4.
6.5.4. Coeciente de correlación de Kendall
De manera más general, a continuación se desarrolla una medida de asociación para variables mesu-
radas en una escala ordinal, la cual se basa en los rangos de las variables, al igual que el coeciente
de correlación de Spearman.
Denición 6.5.4. (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) un conjunto de n

Sea
realizaciones de una variable bidimensional (X, Y ). El coeciente de
correlación de Kendall de este conjunto de datos, denotado con τxy ,
está dada por:
C −D
τ= 1
2 n(n− 1)
donde C representa el número de concordancias y D el número de
discordancias .
Nota. En la denición 6.5.4, se dice que hay una concordancia entre el par (xi , yi ) y (xj , yj ), si xi < xj
y yi < yj , o, si xi > xj y yi > yj ; además se dice que hay una discordancia si xi < xj y yi > yj , o,
xi > xj y yi < yj para i, j = 1, . . . , n con i 6= j .
Nota. El coeciente de correlación de Kendall así denido se debe usar en los casos donde no hay
empates para que sea posible denir las concordancias y las discordancias. Como los otros coecientes
de correlación, el valor de este coeciente se siempre se encuentra entre −1 y 1, y su interpretación es
análoga.
Ejemplo 6.5.5. En un estudio de mercadeo se quiere establecer si hay una asociación entre el por-
3
centaje de contenido de un insumo de un producto y una medida de complacencia escalada entre uno
y diez. En dicho estudio se obtuvo la información una muestra de consumidores que se presenta en la
tabla 6.9. Calcular e interpretar el coeciente de correlación de Kendall.
Solución:
Para encontrar el coeciente de correlación de Kendall entre el porcentaje de contenido (X ) y la medida

de complacencia (Y ), lo primero que se debe hacer es calcular las concordancias (C) y discordancias
(D) de cada par de parejas. En las columnas 3 a 6 de la tabla 6.9 se presentan las concordancias y
discordancias de todos los datos bivariados con las parejas (x1 , y1 ) y (x2 , y2 ). Una vez se realizo este
proceso para todas las parejas, se tiene que el número de concordancias es C = 18 y que el número
de discordancias es D = 10, y por lo tanto
18 − 10 8
τxy = 1 = = 0.286.
2 (8)(7)
28
Este valor del coeciente indica que las variables sí están correlacionadas positivamente pero no de una
forma contundente, y por lo tanto el porcentaje de contenido del insumo y la medida de complacencia
no están asociadas inequívocamente, y en consecuencia se deben tener en cuenta otras variables con
el propósito de investigar el nivel de complacencia del producto.
Las observaciones del coeciente de correlación de Kendall son análogas a las del coeciente de corre-
lación de Spearman.
3 Satisfacción, placer y contento que resulta de algo (Real Academia Española 2012b).
# Cont. Calif. C (0.10,1.00) D (0.10,1.00) C (0.15,4.00) D (0.15,4.00) ...

1 0.10 1.00 − − − − ...
2 0.15 4.00 1 0 − − ...
3 0.20 7.00 1 0 1 0 ...
4 0.25 9.00 1 0 1 0 ...
5 0.30 3.00 1 0 1 1 ...
6 0.35 2.00 1 0 1 1 ...
7 0.40 5.00 1 0 1 0 ...
8 0.45 8.00 1 0 1 0 ...
Tabla 6.9: Datos asociados con las concordancias y discordancias del estudio de mercadeo del ejemplo 6.5.5.
6.5.5. Coeciente de Gini
El coeciente de Gini mas que una medida de asociación es una medida de la desigualdad ideada por
el italiano Corrado Gini 4
. Normalmente se utiliza para medir la desigualdad de la repartición de la
riqueza, pero se puede utilizar para medir la distribución de cualquier variable.
Denición 6.5.5. Sea X una variable cuantitativa dada en una distri-

bución de frecuencias con k categorías. El coeciente de Gini de este
conjunto de datos, denotado con Gx , se dene como
k
X
Gx = 1 − fi (Ui−1 + Ui )
i=1
donde Pj
ni xi
Uj = Pki=1 para j = 1, . . . , k ,
i=1 ni xi
ni es la frecuencia absoluta, fi es la frecuencia relativa y xi es la clase o
la marca de clase de la i-ésima categoría para i = 1, . . . , k . Además, se
dene U0 = 0.
Nota. Cuando las observaciones de una variable X no están agrupados en una tabla de frecuencias
se tiene que ni = 1 y fi = 1/n para i = 1, . . . , n donde n es el numero de datos que se tienen a
disposición. En este caso es fundamental ordenar los datos ascendentemente para que la fórmula del
coeciente haga sentido.
El coeciente de Gini es un número comprendido entre 0 y 1, usualmente expresado en porcentaje

(cuando es expresado de esta forma se conoce como índice). El valor 0 corresponde a un caso donde
4 Fotografía tomada de la página web http://www.metronjournal.it/storia/ginibio.htm.

Figura 6.8: Corrado Gini (1884-1965).
hay perfecta igualdad en la distribución de la variable todos los individuos tienen la misma cantidad
de riqueza y el valor 1 corresponde a un caso donde hay perfecta discrepancia en la repartición un
individuo posee toda la riqueza y los demás nada.
En la práctica, tratándose de la riqueza de los países, los valores del coeciente varían desde aproxi-
madamente 0.2, para países históricamente igualitarios como Bulgaria, Hungría, la república Checa y
Eslovaca y Polonia, hasta 0.6 para países centro y suramericanos donde las elites poderosas dominan
la economía. La evolución del coeciente Gini es particularmente útil en la medida que revela tenden-
cias. Muestra la evolución hacia una igualdad mayor en Cuba desde 1953 hasta 1986 (0.55 a 0.22) y el
crecimiento de la desigualdad en los Estados Unidos en las últimas tres décadas durante las cuales el
coeciente de Gini pasó de 0.35 en los setenta a 0.40 actualmente (½y aún está subiendo!). La mayoría
de los países europeos y Canadá están ubicados alrededor de 0.30, Japón y algunos países asiáticos
llegan a 0.40, mientras que la mayoría de los países africanos exceden 0.45. En la gura 6.9 se presenta
5
un cartograma donde se evidencian los valores del coeciente de Gini a nivel mundial.
Ejemplo 6.5.6. Calcular el Coeciente de Gini para el conjunto de datos de la tabla 6.10 corres-
pondiente al número de cuentas que un gerente reparte entre sus empleados. Calcular e interpretar el
coeciente de Gini.
Solución:
A en la tabla 6.11 se presentan los cálculos necesarios para obtener el coeciente de Gini del número de
cuentas (X ). En este caso, debido a la ausencia de intervalos, las marcas de clase xi corresponden a las
mismas categorías del número de cuentas. Se calculan las frecuencias relativas como de costumbre y los
productos ni xi que corresponden al total de cuentas repartidas entre los empleados que recibieron un
5 Gráca tomada de la página web http://en.wikipedia.org/wiki/Image:World_Map_Gini_coefficient_with_

legend_2.png?uselang=es.
Figura 6.9: Cartograma cartograma donde se evidencian los valores del coeciente de Gini a nivel mundial .
xi ni
1 2
2 2
4 1
Total 5
Tabla 6.10: Datos asociados con el número de contratos que un gerente reparte entre sus empleados.
P4
monto de cuentas determinado; además resulta que el total de cuentas repartidas es i=1 ni xi = 10.
También se calcula Ui para cada categoría como el acumulado de la columna precedente conformada
n x
por los P i i . Finalmente, en la última columna se presentan los términos involucrados en la fórmula
ni x i
del coeciente, obteniéndose que
k
X
Gx = 1 − fi (Ui−1 + Ui ) = 1 − 0.72 = 0.28.
i=1
Este valor del coeciente de Gini indica que la repartición de las cuentas aunque no fue absolutamente
igualitaria, no es desigual, situación que tiende a la equidad en la repartición de la carga laboral entre
los empleados.
Ejemplo 6.5.7. La Gobernación de una ciudad arma que las empresas de un determinado sector
ni xi
xi ni fi ni xi P
ni xi Ui fi (Ui−1 + Ui )
1 2 0.4 2 0.2 0.2 0.08
2 2 0.4 4 0.4 0.6 0.32
4 1 0.2 4 0.4 1 0.32
Total 5 1 10 1 N.A. 0.72
económico se encuentran equilibradas respecto a los ingresos que devengan. Por tal motivo los entes
de control del Estado aseguran que no es necesario ofrecer estímulos ni subsidios para las compañías
de dicho sector. Una de las empresas que no está de acuerdo con la posición del Gobierno obtiene una
muestra de los ingresos (en millones) de diez empresas del sector como se observa en la tabla 6.12.
Con base en el coeciente de Gini, ¾el Gobierno debe reconsiderar su posición?
1240 840 2000 1456 973 907 1490 789 1423 600
Tabla 6.12: Datos asociados con los ingresos de una muestra de empresas de un sector económico particular.
Solución:
Para calcular el coeciente de Gini de los ingresos (X ), primero se ordenan los datos ascendentemente
y en seguida calcular los valores de Ui para i = 1, . . . , 10 obteniéndose los siguientes resultados:
0.009 0.079 0.154 0.235 0.322 0.432 0.559 0.689 0.822 1.000
En consecuencia, se sigue que
(2)(4.301) − 1
Gx = 1 − = 0.239.
10
Este valor del coeciente de Gini indica que no se trata de una situación de equidad perfecta, aunque
ciertamente no es una situación de desigualdad apremiante, por lo que la posición del Gobierno es
acertada y las objeciones de la empresa no tienen fundamento.
La curva de Lorenz es una representación gráca que se utiliza frecuentemente para plasmar la
distribución relativa de una variable en un dominio determinado. El dominio puede ser el conjunto
de hogares o personas de una región o país y la variable cuya distribución se estudia puede ser el
ingreso de los hogares o las personas, por ejemplo. La curva se traza considerando en el eje horizontal
el porcentaje acumulado de individuos del dominio en cuestión y en el eje vertical el porcentaje
acumulado de la variable de interés. Cada punto de la curva se lee como el porcentaje acumulado de
los individuos involucrados en la investigación. La curva parte del origen (0, 0) y termina en el punto
(1, 1) y de esta forma, si la variable estuviera distribuida de manera perfectamente equitativa, la curva
coincidiría con la línea de 45 grados que pasa por el origen; y si existiera desigualdad perfecta, la
curva coincidiría con el eje horizontal hasta el punto (1, 0) donde saltaría al punto (1, 1). En general,
la curva se encuentra en una situación intermedia entre estos dos extremos. En resumen, tratando
con la riqueza, lo que se ha hecho es un gráco de líneas correspondiente a la cantidad de riqueza

acumulada frente a la cantidad de individuos acumulado para ese monto de riqueza.
Si la curva de Lorenz se encuentra siempre por encima de otra y, por lo tanto, está más cerca de
la línea de 45 grados, se puede establecer sin ambigüedad que la primera distribución exhibe menor
grado desigualdad que la segunda. Esta comparación gráca entre distribuciones de distintos dominios
geográcos o temporales es la principal utilidad de la curva de Lorenz. En la gura 6.10 se presenta
un ejemplo de la curva de Lorenz.
Figura 6.10: Ejemplo de la curva de Lorenz.
Ejemplo 6.5.8. Representar la curva de Lorenz correspondiente para los datos del ejemplo 6.5.6.
Solución:
Para obtener la curva de Lorenz del ejemplo 6.5.6 donde el coeciente de Gini es de 0.28 revelando un
caso de aparente igualdad en la repartición de las cuentas, se deben gracar los valores de tabla 6.13
que se muestra a continuación:
Para gracar la curva de Lorenz se debe representar en el plano cartesiano la unión de los puntos
dados en la tabla 6.13, es decir, la unión de los puntos (0, 0), (0.4, 0.8), (0.8, 0.6) y (1, 1). En el eje x
Fi Ui Igualdad
0 0 0
0.4 0.2 0.4
0.8 0.6 0.8
1 1 1
Tabla 6.13: Frecuencias acumuladas asociadas con la curva de Lorenz del ejemplo 6.5.6.
se ubican las frecuencias relativas acumuladas Fi , referidas al porcentaje acumulado de individuos, en

este caso empleados, y en el eje y se ubican el porcentaje acumulado de la riqueza Ui que indica el
porcentaje de bienes repartidos, en este caso cuentas. En la gráca también se presenta la línea de
igualdad que es el punto de referencia para la comparación con la curva obtenida. En caso de equidad,
por ejemplo, si se ha acumulado el 40 % de los empleados también se tiene acumulado el 40 % de las
cuentas repartidas. En la gura 6.11 se presenta el gráco correspondiente que conrma lo que sugiere
el coeciente de Gini, esto es, un caso en el que la repartición de las cuentas es más bien igualitaria.
Figura 6.11: Curva de Lorenz asociada con la repartición de las cuentas del ejemplo 6.5.6.
6.6. COMENTARIOS 131
6.6. Comentarios
En este capítulo se da hace introducción al análisis conjunto de dos variables, puesto que muchos
estudios prácticos y teóricos, indagan directa o indirectamente por la relación que tienen las variables
entre sí. La relación entre dos variables puede ser lineal o no lineal, algo que se olvida y menosprecia
frecuentemente, y por lo tanto las medidas que se utilicen deben corresponder apropiadamente al tipo
de relación que se investiga.
Además, uno de los elementos más importantes en este contexto es entender e interpretar las relaciones
de las variables a través de tablas cruzadas y de los coecientes de correlación, que se deben aplicar
prudentemente dependiendo del tipo escala de medida en que estén dadas las variables de estudio.
Por último, se estudian una medida y un gráco cuyo propósito es inspeccionar la forma en que
se distribuye o reparte una variable entre los individuos asociados. Esta medida es de gran utilidad
práctica y se emplea usualmente para estudiar la repartición de la riqueza entre las personas de una
población determinada.
6.7. Ejercicios
6.1 Considerar la siguiente información:
10
X 10
X 10
X 10
X 10
X
xi = 110, yi = 60, x2i = 3156, yi2 = 1, 138 y xi yi = 1, 868.
i=1 i=1 i=1 i=1 i=1
a. ¾Cuál es el tamaño de la muestra?
b. Calcular el promedio de X y Y.
c. Calcular la varianza de X y Y.
d. Calcular la desviación típica de X y Y.
e. Calcular e interpretar la covarianza entre X y Y.
f. Calcular e interpretar el coeciente de correlación de Pearson entre X y Y.
g. Calcular e interpretar nuevamente el coeciente de correlación de Pearson si para todos los
individuos de la muestra la variable X aumenta en 5 % y la variable Y aumenta en 3 %.
1
6.2 Sean X y Y dos variables tales que rxy = 2, Sx2 = 1 y Sy2 = 2. Calcular
2
Sw donde W = X − 2Y .
6.3 Sea (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) un conjunto de n realizaciones de una variable bidimensional
(X, Y ). Una fórmula alternativa para calcular el coeciente de correlación de Spearman es
n
6 X
rsxy = 1 − 2
(x̃i − ỹi )2i
n(n − 1) i=1
donde x̃i y ỹi son respectivamente los rangos de xi y yi del i-ésimo individuo para i = 1, . . . , n.
Corroborar que esta fórmula del coeciente de correlación de Spearman coincide con la fórmula
dada en la denición 6.5.3 utilizando los datos del ejemplo 6.5.4.
6.4 Calcular el coeciente de correlación de Spearman y de Kendall utilizando los datos del ejemplo
6.4.2. Interpretar y comparar los resultados obtenidos.
6.5 Se sabe que hay una relación entre la utilidad de las acciones X y Y. La tabla 6.14 corresponde
a una muestra de los benecios asociados con estas acciones. Realizar un gráco de dispersión y
calcular las medidas de asociación a que haya lugar entre las variables. ¾Qué se puede decir del
nexo entre las utilidades de las acciones?
# X Y # X Y
1 1253.81 91.73 21 2193.91 -66.97
2 2264.64 -18.00 22 1958.28 -125.78
3 1567.86 182.91 23 1994.85 -141.20
4 1299.00 145.70 24 2694.94 47.25
5 2389.47 48.43 25 1445.50 214.17
6 2592.27 60.64 26 2083.25 -122.08
7 2462.54 90.10 27 2642.54 55.99
8 2311.34 -14.58 28 1386.89 215.28
9 2128.80 -107.84 29 2143.09 -88.31
10 3312.81 -13.98 30 1814.38 -57.72
11 1939.12 -120.26 31 1770.48 -15.84
12 3136.20 -51.42 32 3278.51 -31.73
13 2329.68 19.92 33 2498.77 78.84
14 1883.61 -119.30 34 3196.21 -31.06
15 1277.64 96.02 35 2252.69 -36.40
16 2893.56 -15.71 36 2946.31 -37.71
17 3045.40 -49.74 37 1886.00 -88.03
18 2060.51 -124.28 38 1848.70 -59.02
19 2378.64 58.66 39 2499.54 74.20
20 2511.22 68.92 40 1960.95 -130.21
Tabla 6.14: Datos asociados con una muestra de utilidades de las acciones X y Y.
6.6 La junta directiva de una empresa dice tener una estructura horizontal, lo cual se podría ver
reejado mediante la equidad salarial. Con base en la información de la tabla 6.15, ¾qué indican
el coeciente de Gini y la curva de Lorenz acerca de la aseveración de la junta directiva?
6.7 Una empresa ha trabajado hasta ahora con la hipótesis de que las ventas de un período dependen
linealmente de los gastos de publicidad efectuados en el período anterior. En este momento, soli-
citan la realización de un análisis que ponga de maniesto si la hipótesis, hasta ahora mantenida,
se puede seguir sosteniendo con los datos que suministran. Las cifras se muestran en la tabla 6.16
y están dadas en miles de millones de pesos.
6.7. EJERCICIOS 133
Salario Frecuencia
1,485,000 1
1,689,000 1
1,714,000 1
1,751,000 1
1,916,000 1
1,942,000 1
1,943,000 1
1,966,000 1
1,990,000 1
2,047,000 1
2,115,000 1
2,191,000 1
2,242,000 1
2,661,000 1
2,727,000 1
Tabla 6.15: Datos asociados con los salarios de una muestra de empleados de una empresa.
Año Gasto Venta

1987 21 17
1988 22 19
1989 25 20
1990 26 21
1991 27 23
1992 29 24
1993 30 26
Tabla 6.16: Datos asociados con las ventas y gastos de una empresa determinada.
a. ¾Se incrementarán las ventas del período siguiente al aumentar los gastos en publicidad del
período actual?
b. ¾Es adecuado suponer que el ajuste entre estas variables es efectivamente lineal teniendo en
cuenta los valores de las variables?
6.8 Las calicaciones que se presentan en la tabla 6.17 corresponden a las notas de 25 alumnos en las
asignaturas A y B.
a. Obtener la tabla de frecuencias conjunta.
b. ¾Qué proporción de alumnos obtienen más de cinco en ambas asignaturas? ¾Qué proporción
de alumnos obtienen más de un cinco en A? ¾Y en B?
c. Representar grácamente la situación.
d. Hallar e interpretar el coeciente de correlación correspondiente.

# A B # A B
1 4 3 14 8 7
2 5 5 15 8 7
3 5 5 16 8 8
4 5 6 17 8 8
5 6 7 18 8 8
6 6 7 19 8 8
7 7 7 20 9 8
8 7 7 21 9 8
9 7 7 22 9 8
10 7 7 23 9 10
11 7 8 24 9 10
12 7 8 25 10 10
13 7 8
Tabla 6.17: Datos asociados con las calicaciones de las asignaturas A y B de una muestra de alumnos.
6.9 Demostrar que si (X, Y ) es una variable bidimensional y a, b, c y d son números reales entonces
se tiene que:
i. rXY = rY X .
ii. rXX = 1.
iii. Si V = aX + b y W = cY + d entonces rV W = sgn(a)sgn(c)rXY donde sgn(x) denota el signo
de x.
iv. |rXY | = 1 si y solo si aX + bY = 0 donde a y b no son simultáneamente 0.
2 2
6.10 Si en una distribución bidimensional se tiene que Sx+y = 10.3 y Sx−y = 8.1, calcular la covarianza
entre 2X − 1 y 4Y + 2.
Pm
6.11 Demostrar que si X1 , . . . , Xm son m variables conmensurables y W = i=1 Xi entonces
m
X m X
X m
2 2
SW = SX i
+ SXi Xj .
i=1 i=1 j=1
i6=j
6.12 En la tabla 6.18 se presentan los datos correspondientes a la tasa media de crecimiento del PIB y
del empleo para 25 países de la OCDE para el periodo 1988-1997.
a. Hacer un diagrama de dispersión de la tasa media de crecimiento del PIB frente a la tasa media
de crecimiento del empleo.
b. Calcular e interpretar la covarianza entre la tasa media de crecimiento del PIB y la tasa media
de crecimiento del empleo.
c. Calcular e interpretar el coeciente de correlación de Pearson entre la tasa media de crecimiento

del PIB y la tasa media de crecimiento del empleo.
6.7. EJERCICIOS 135
País Empleo PIB Empleo PIB

Australia 1.68 3.04
Corea 2.57 7.73
Austria 0.65 2.55
Luxemburgo 3.02 5.64
Bélgica 0.34 2.16
Holanda 1.88 2.86
Canadá 1.17 2.03
Nueva Zelanda 0.91 2.01
Dinamarca 0.02 2.02
Noruega 0.36 2.98
Finlandia -1.06 1.78
Portugal 0.33 2.79
Francia 0.28 2.08
España 0.89 2.60
Alemania 0.08 2.71
Suecia -0.94 1.17
Grecia 0.87 2.08
Suiza 0.79 1.15
Islandia -0.13 1.54
Turquía 2.02 4.18
Irlanda 2.16 6.40
Reino Unido 0.66 1.97
Italia -0.30 1.68
USA 1.53 2.46
Japón 1.06 2.81
Tabla 6.18: Datos asociados con la tasa media de crecimiento del PIB y del empleo para 25 países de la OCDE para
el periodo 1988-1997.
6.13 En la tabla 6.19 se presenta un conjunto de datos asociado con el ingreso (en millones de pesos),
el género y la preferencia de una medida económica del Gobierno Nacional de una muestra de
empleados de una compañía. Para hombres y mujeres separadamente:
a. Realizar un histograma y calcular la media, la mediana y la moda de los cuartiles de la variable

ingresos.
b. Realizar un diagrama de caja y calcular la desviación estándar, la desviación media y la des-

viación mediana de la variable ingresos.
c. Calcular el coeciente de asimetría de Pearson, el coeciente de asimetría de Fisher y el índice

de asimetría de Yule-Bowley de la variable ingresos.
d. Calcular el coeciente de apuntamiento de Fisher de la variable ingresos.
e. Estandarizar la variable ingresos. ¾Hay observaciones atípicas? ¾Si las hay, cuáles son?
f. Interpretar, comentar y comparar los resultados obtenidos en los incisos anteriores.
6.14 Con la información del ejercicio 6.13:

a. Construir la variable salario con los siguientes valores:
• BAJO: 1 salario mínimo o menos.
• MEDIO: entre 1 y 2 salarios mínimos.
• ALTO: 2 salarios mínimos o más.
Hacer la tabla de contingencia bidimensional de frecuencias relativas de salario frente a prefe-

rencia. Hacer el gráco correspondiente.
b. Hacer la tabla de perles la y el gráco correspondiente.
c. Hacer la tabla de perles columna y el gráco correspondiente.
d. Interpretar y comentar los resultados obtenidos en los incisos anteriores.

6.7. EJERCICIOS 137
Ingresos Género Preferencia Ingresos Género Preferencia

2.405 Mujer A favor 0.979 Mujer A favor
0.407 Hombre A favor 2.131 Mujer A favor
0.827 Mujer En contra 1.545 Mujer A favor
0.020 Mujer A favor 3.267 Hombre En contra
1.629 Mujer A favor 2.697 Hombre A favor
2.000 Mujer En contra 0.898 Hombre A favor
2.555 Mujer A favor 2.629 Mujer NS/NR
0.013 Mujer A favor 0.880 Mujer En contra
1.197 Mujer NS/NR 3.409 Hombre A favor
1.167 Hombre A favor 0.711 Mujer En contra
5.421 Mujer En contra 0.763 Mujer En contra
0.484 Hombre A favor 0.637 Hombre A favor
2.560 Mujer A favor 1.227 Mujer En contra
1.472 Hombre A favor 1.445 Mujer En contra
3.031 Hombre En contra 2.627 Mujer En contra
2.604 Mujer En contra 1.074 Mujer A favor
1.783 Mujer En contra 1.319 Mujer NS/NR
1.616 Mujer En contra 1.904 Mujer En contra
3.438 Hombre A favor 1.897 Mujer NS/NR
1.473 Hombre A favor 0.592 Hombre A favor
0.434 Mujer A favor 0.823 Mujer NS/NR
Tabla 6.19: Datos asociados con los ingresos, el género y la preferencia de una medida económica del Gobierno Nacional
de una muestra de empleados de una compañía.
Parte II
Probabilidades
138
Capı́tulo 7
Fundamentos de probabilidad
7.1. Introducción
Si el propósito central del investigador es describir los resultados de un experimento concreto, las
técnicas presentadas en las secciones anteriores se pueden considerar sucientes. No obstante, si se
quiere utilizar la información obtenida para extraer conclusiones generales sobre los objetos de un
conjunto de datos mayor que comparten las mismas propiedades de los datos iniciales, entonces estas
técnicas constituyen solo el principio del análisis y se debe recurrir a los métodos de la inferencia
estadística , los cuales implican el uso apropiado de la teoría de la probabilidad.
7.2. Experimentos determinísticos y experimentos aleatorios
La teoría de la probabilidad se desenvuelve en medio de los diversos resultados y los posibles sucesos
(eventos) que se pueden obtener cuando se realiza un experimento (cualquier acción o proceso que
genera observaciones o datos directa o indirectamente). El término experimento se utiliza en la teoría
de la probabilidad para describir virtualmente cualquier acción o proceso que genera un conjunto de
datos.
Denición 7.2.1. Un experimento determinístico es cualquier ex-

perimento que, al repetirse bajo las mismas condiciones, genera siempre
el mismo resultado.
139
140 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Ejemplo 7.2.1. El siguiente experimento corresponde a un experimento determinístico. Considerar

un objeto de cualquier masa partiendo de un estado inicial de reposo y dejado caer al vacío desde lo
√
alto de una torre. Éste llega siempre al suelo con la misma velocidad, a saber, v= 2gh, donde v es
la velocidad del cuerpo al llegar al suelo, g es la aceleración de la gravedad y h es la altura de la torre.
Se supone que no existe rozamiento con el aire.
Sin embargo, hay experimentos cuyos resultados no son determinados si las condiciones se mantienen
constantes. Tales experimentos se denominan experimentos aleatorios.
Denición 7.2.2. Un experimento aleatorio o estocástico es cual-

quier experimento que satisface las siguientes condiciones:
• Todos los posibles resultados del experimento son conocidos antes

de ejecutarlo.
• El resultado de cualquier ejecución del experimento no se puede

conocer de antemano.
Ejemplo 7.2.2. Ejemplos comunes de experimentos aleatorios, son los juegos de azar que están
relacionados con las cartas y los lanzamientos de dados o monedas. Sin embargo, hay otros tipos de
ejemplos de experimentos aleatorios como los siguientes:
1. Seleccionar aleatoriamente una ciudad de un país y registrar para ésta el número de empresas
de servicios.
2. Seleccionar aleatoriamente tres propuestas de ley del Congreso y registrar si fueron o no apro-
badas.
3. Seleccionar aleatoriamente una empresa de una ciudad y registrar su actividad.
¾Puede el lector identicar las características de un experimento aleatorio en estos ejemplos?
7.3. Espacios muestrales y eventos
El primer paso para analizar un experimento aleatorio consiste en denir cuidadosamente los resultados
experimentales. Cuando se denen todos los posibles resultados de un experimento estocástico, se
identica el denominado espacio muestral del experimento.
7.3. ESPACIOS MUESTRALES Y EVENTOS 141
Denición 7.3.1. El conjunto de todos los posibles resultados de un

experimento aleatorio se llama espacio muestral (o de resultados) y se
Ω. Los elementos del espacio muestral se denominan puntos
denota con
muestrales y se simbolizan con ω1 , ω2 , . . .
Ejemplo 7.3.1. Considerar las siguientes situaciones:
• Se instala una computadora nueva en un banco. La computadora controla todas las transfe-
rencias bancarias guardando el valor exacto de cada transacción, mas sin embargo no registra
transacciones menores a un millón ni mayores a cien millones. Se dene el experimento aleatorio
como los valores que registra la computadora.
• Una fábrica que elabora diferentes clases de un artículo determinado tiene un método para la
identicación de las unidades terminadas que fue concebido para diferenciarlas y clasicarlas
por categorías. Se dene el experimento aleatorio como la extracción y la clasicación de los
artículos entre todos los fabricados hasta el día de ayer.
¾Cuál es el espacio muestral en cada caso? ¾Cuál es la diferencia entre estos dos espacios muestrales?
Solución:
En la primera situación el espacio muestral es el conjunto de todos los valores que se encuentren entre
1 millón y 100 millones, ya que el resultado del experimento es el valor de la transacción que registra
la computadora.
Para el segundo experimento el espacio muestral es el conjunto de todas las identicaciones de los
artículos que se han producido hasta el día de ayer.
La diferencia más importante entre estos dos espacios muestrales radica en su tamaño, ya que el
primero tiene un número innito de posibles resultados mientras que el segundo tiene un número
nito de resultados.
Denición 7.3.2. Cualquier subconjunto del espacio muestral se llama

evento o suceso aleatorio .
Nota. Los eventos aleatorios usualmente se simbolizan con letras mayúsculas como A, B o C , por
ejemplo. Además, si A es un evento y el resultado observado del experimento aleatorio es un elemento
de A signica que el evento A ha sucedido. Cuando un evento tiene un solo elemento se denomina
evento elemental o simple .
Denición 7.3.3. En particular, Φ y Ω son eventos aleatorios, esto

es, subconjuntos de Ω. El conjunto Φ es denominado evento imposible ,
que nunca sucede, y el conjunto Ω se llama evento seguro , que siempre
sucede.
Ejemplo 7.3.2. Considerar el experimento aleatorio lanzar un dado corriente una vez. En este caso
se tiene que:
• El espacio muestral del experimento es Ω = {1, 2, 3, 4, 5, 6}.

• Los puntos muestrales son ω1 = 1, ω2 = 2, ω3 = 3, ω4 = 4, ω5 = 5 y ω6 = 6.
• Algunos eventos del experimento son:
a. A: el resultado del lanzamiento es un número par, es decir, A = {2, 4, 6}.

b. B : el resultado del lanzamiento es superior a 2, es decir, B = {3, 4, 5, 6}.
c. C : el resultado del lanzamiento no es 1 ni 6, es decir, C = {2, 3, 4, 5}.
d. D: el resultado del lanzamiento es 7, es decir, D = Φ.
• El evento imposible es Φ y el evento seguro es Ω = {1, 2, 3, 4, 5, 6}.

Ejemplo 7.3.3. Obtener el espacio muestral del experimento aleatorio que consiste en seleccionar
aleatoriamente tres leyes del Congreso y registrar si fueron o no aprobadas.
Solución:
En este caso el espacio muestral del experimento aleatorio es
Ω = {(s, s, s), (n, s, s), (s, n, s), (s, s, n), (n, n, s), (n, s, n), (s, n, n), (n, n, n)}.
donde s signica que sí ha sido aprobada la ley y n que no ha sido aprobada la ley.
Ejemplo 7.3.4. Obtener el espacio muestral de cada experimento del ejemplo 7.3.1.
Solución:
En la primera situación el espacio muestral es el conjunto de todos los valores que se encuentren entre
1 millón y 100 millones. Esto corresponde a
Ω = {x : 1, 000, 000 ≤ x ≤ 100, 000, 000}.

De otra parte, el espacio muestral en la segunda situación es el conjunto de todas las identicaciones
de los artículos que se han producidos hasta el día de ayer. Esto es
Ω = {Id1 , Id2 , . . . , Idn }

donde Idi es la i-ésima identicación en la que es posible clasicar el artículo para i = 1, . . . , n.
7.4. OPERACIONES CON EVENTOS ALEATORIOS 143
7.4. Operaciones con eventos aleatorios
El cálculo de las probabilidades está relacionado intrínsecamente con el manejo de los eventos alea-
torios. Manejar apropiadamente las operaciones entre conjuntos es de fundamental importancia para
desarrollar y aplicar el cálculo de las probabilidades en los escenarios teóricos y de aplicación. En el
apéndice B se presentan algunos detalles al respecto.
Denición 7.4.1. Sean A y B dos eventos aleatorios del espacio mues-

tral Ω. Se denomina evento intersección de A y B , denotado con A∩B ,
al evento conformado por todos los puntos muestrales que pertenecen a
A y a B simultáneamente. Esto es:
A ∩ B = {ω ∈ Ω : ω ∈ A y ω ∈ B}.

tral Ω. Se denomina evento unión de A y B, denotado con A ∪ B, al
evento conformado por todos los puntos muestrales que pertenecen a A,
a B o ambos simultáneamente. Esto es:
A ∪ B = {ω ∈ Ω : ω ∈ A o ω ∈ B}.

tralΩ. Se denomina evento diferencia entre A y B, denotado con
A − B , al conjunto conformado por todos los puntos muestrales que
pertenecen a A pero no pertenecen a B. Esto es:
A − B = {ω ∈ Ω : ω ∈ A y ω∈
/ B}.
Denición 7.4.4. Sea A un evento aleatorio de un espacio muestral

Ω. El evento complemento de A, denotado con AC , es el conjunto
conformado por todos los puntos muestrales que no pertenecen a A. Es
decir:
AC = {ω ∈ Ω : ω ∈
/ A}.
Ejemplo 7.4.1. Se lanza un dado corriente una vez. Considerar A como al evento el resultado
obtenido es un número impar y B como al evento el resultado obtenido es al menos 3. Entonces, en
este caso se sigue que:
• El espacio muestral y los eventos A y B son respectivamente Ω = {1, 2, 3, 4, 5, 6}, A = {1, 3, 5}

y B = {3, 4, 5, 6}.
• Los eventos complementarios de los eventos A y B son respectivamente AC : el resultado obtenido
C C
es un número par y B : el resultado obtenido es a lo más 2, es decir, A = {2, 4, 6} y
B C = {1, 2}.
• La intersección de A y B es el evento A ∩ B : el resultado obtenido es un número impar distinto

de 1, se decir, A ∩ B = {3, 5}.
• La unión de A y B es el evento A ∪ B : el resultado obtenido es un número distinto de 2, es

decir, A ∪ B = {1, 3, 4, 5, 6}.
• La diferencia entre A y B es el evento A − B: el resultado obtenido es el número 1, es decir,

A − B = {1}.
• La diferencia entre B y A es el evento B − A: el resultado obtenido es un número par distinto

de 2, es decir, B − A = {4, 6}.
Denición 7.4.5. Sean A y B dos eventos aleatorios de un espacio

muestral Ω. Si los eventos A y B no tienen en común ningún punto
muestral entonces se denominan mutuamente excluyentes o disjun-
tos , esto es, los eventos A y B son mutuamente excluyentes si
A ∩ B = Φ.
Denición 7.4.6. Sean A1 , A2 , . . . , An eventos aleatorios no vacíos de

un espacio muestral Ω.
• Si A1 ∪ A2 ∪ . . . ∪ An = Ω entonces estos n eventos se denominan

eventos colectivamente exhaustivos .
• Si A1 , A2 , . . . , An son eventos colectivamente exhaustivos y además
son mutuamente excluyentes dos a dos entonces estos n eventos
conforman una partición de Ω.
Nota. Sea A un evento aleatorio de un espacio muestral Ω. Se observa que los eventos A y AC son
C
mutuamente excluyentes, dado que A ∩ A = Φ, y además son colectivamente exhaustivos, puesto que
A ∪ AC = Ω. En otras palabras, A y AC conforman una partición de Ω.
Un instrumento útil para abordar las operaciones entre eventos aleatorios son los diagramas de Venn.
En la guras B.2 y B.3 se muestra una representación gráca de los conceptos presentados anterior-
mente.
Ejemplo 7.4.2. Sea Ω = {1, 2, 3, 4, 5, 6} el espacio muestral asociado con el experimento del ejemplo
7.4.1. Se consideran los eventos A = {2, 6}, B = {1, 4}, C = {3, 5} y D = {2, 3, 4, 5}. En este caso se
tiene que:
• A, B y C conforman una partición de Ω porque son eventos no vacíos tales que A ∪ B ∪ C = Ω,

A ∩ B = Φ, A ∩ C = Φ y B ∩ C = Φ.
• A, B y D son colectivamente exhaustivos porque A ∪ B ∪ D = Ω, pero no conforman una
partición de Ω porque B ∩ D 6= Φ.
• A, C y D no son colectivamente exhaustivos y por lo tanto tampoco conforman una partición
de Ω porque A ∪ C ∪ D 6= Ω.

Ejemplo 7.4.3. La junta directiva de una empresa productora de alimentos quiere lanzar un nue-
vo producto en una ciudad. Para esto la empresa realiza un estudio de mercadeo en el cual se pide
establecer: ¾Cuál es la población de referencia (Ω)? ¾Cuáles son los posibles consumidores del pro-
ducto (A)? Si el producto fue diseñado para personas entre los 11 y 30 años, ¾cuál es la población
objetivo (B )? ¾Cuál es la población objetivo si se quiere que ésta tenga la posibilidad de comprar el
producto (C )? ¾Qué población hay que tener en cuenta para realizar las campañas publicitarias (D )?
Con los conjuntos de individuos establecidos anteriormente, ¾es posible obtener una partición de los
consumidores del producto?
Solución:
Es necesario tener en cuenta que el producto se va a distribuir por toda la ciudad, luego la población
de referencia es
Ω = {Los individuos que transitan por la ciudad}.
Sin embargo, no todos los individuos que transitan por la ciudad son consumidores potenciales del
producto, ya que los recién nacidos no pueden ingerir alimentos sólidos en sus primeros meses de vida.
Por lo tanto, el conjunto que reúne los posibles consumidores del producto es
A = Ω − {Los recién nacidos que transitan por la ciudad}.
De otra parte, si el producto fue diseñado para personas entre los 11 y 30 años, como se establece una
condición particular para la población objetivo entonces se tiene que ésta es igual a
B = {Las personas que transitan por la ciudad que tienen entre 11 y 30 años de edad}.
Ahora, teniendo en cuenta que no todos los consumidores potenciales tienen la capacidad de comprar
el producto en primera instancia, se sigue que
C = {Las personas que tienen uso libre de capital para la adquisición de productos alimentarios}
y en consecuencia la población que se debe tener en cuenta para realizar las campañas publicitarias es
D = B ∩ C . Ahora, para establecer si los conjuntos B , C y D conforman una partición de A, basta ver
que no se cumple al menos una de las condiciones necesarias para tener una partición. Por ejemplo,
se observa que B ∩ C 6= Φ y por lo tanto B, C y D no conforman una partición de A.
A continuación se presentan algunas propiedades relacionadas con las operaciones entre eventos que
son de uso común en el cálculo de probabilidades. Estas propiedades también se estudian con cierto
detalle en el apéndice B.
Proposición 7.4.1. Sean A, B y C eventos aleatorios de un espacio muestral Ω. Entonces se cumplen

las siguientes leyes:
i. Leyes conmutativas: v. Leyes de la diferencia:

a. A ∪ B = B ∪ A. a. A − B = A ∩ BC .
b. A ∩ B = B ∩ A. b. A − B = A − (A ∩ B).
ii. Leyes asociativas: c. A − B = (A ∪ B) − B .
a. A ∪ (B ∪ C) = (A ∪ B) ∪ C = A ∪ B ∪ C . d. A − (B − C) = (A − B) ∪ (A − C).
b. A ∩ (B ∩ C) = (A ∩ B) ∩ C = A ∩ B ∩ C . e. A − (B ∪ C) = (A − B) ∩ (A − C).
iii. Leyes distributivas: f. (A − B) ∪ (A ∩ B) = A.

g. (A − B) ∩ (A ∩ B) = Φ.
a. A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
b. A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C). vi. Leyes de De-Morgan:
c. (A ∪ B) − C = (A − C) ∪ (B − C).
a. (A ∪ B)C = AC ∩ B C .
iv. Leyes complementarias: b. (A ∩ B)C = AC ∪ B C .
A ∪ AC = Ω.
a.
vii. Leyes de idempotencia:
b. A ∩ AC = Φ.
c. A ∪ Ω = Ω. a. A ∪ A = A.
d. A ∩ Ω = A. b. A ∩ A = A.
e. A ∪ Φ = A. viii. Ley involutiva:
C
f. A ∩ Φ = Φ. AC = A.
Ejemplo 7.4.4. Un laboratorio produce entre otros un bio-tejido para reforzar la piel del cuello,
patas y abdomen, de un conjunto particular de animales, entre los cuales se encuentran los porcinos,
ovinos y los bovinos. El laboratorio quiere recoger los tejidos producidos para bovinos o porcinos pero
que sean refuerzo únicamente para el cuello. Al nal del día se entregan al laboratorio los tejidos que
refuerzan los tejidos para porcinos, ovinos y bovinos en tres bolsas diferentes. ¾Es posible obtener los
productos que quiere el laboratorio de estas tres bolsas? De ser posible, ¾cómo se obtendrían?
Solución:
Lo que busca el laboratorio es un conjunto de tejidos proveniente de la operación A ∩ (B ∪ C),

donde A es el lugar de refuerzo del bio-tejido que corresponde al cuello, mientras que B y C son
respectivamente los tejidos que corresponden a los bovinos y a los porcinos. Por lo tanto, teniendo en
cuenta la disposición de los tejidos de las tres bolsas, para obtener los tejidos especícos que necesita
el laboratorio de las tres bolsas, se debe realizar la operación (A ∩ B) ∪ (A ∩ C).
Ejemplo 7.4.5. Con la información del ejemplo 7.4.2, vericar que (A ∪ B)C = AC ∩ B C y que
C C C
(A ∩ B) = A ∪ B .
Solución:
En el primer caso, se observa que A ∪ B = {1, 2, 4, 6} y en consecuencia (A ∩ B)C = {3, 5}. Como
A = {1, 3, 4, 5} y B = {2, 3, 5, 6} entonces AC ∩ B C = {3, 5}, lo que comprueba la primera
C C
C C
igualdad. De otra parte, se tiene que A ∩ B = Φ y por lo tanto (A ∩ B) = Ω. Como A = {1, 3, 4, 5}
C C C
y B = {2, 3, 5, 6} entonces A ∪ B = Ω, lo que vericada la segunda igualdad.
Proposición 7.4.2. Sean A1 , A2 , . . . , An , A y B eventos aleatorios no vacíos de un espacio muestral

Ω. Entonces, se satisfacen las siguientes propiedades:
i. Los eventos A∩B y AC ∩ B conforman una partición de B.
ii. Si los eventos A1 , A2 , . . . , An conforman una partición de Ω entonces los eventos A1 ∩ B, A2 ∩

B, . . . , An ∩ B conforman una partición de B.
Ejemplo 7.4.6. Considerar el espacio muestral del ejemplo 7.4.2. Se observa que:
• Sean los eventos A = {1, 3, 5} y B = {3, 4, 5, 6}. Entonces, los eventos A ∩ B = {3, 5} y
AC ∩ B = {4, 6} conforman una partición de B.
• Sean los eventosA1 = {1, 3}, A2 = {2, 4, 6}, A3 = {5} y B = {3, 4, 5, 6}. Los eventos A1 , A2 y
A3 conforman una partición de Ω. Ahora, se tiene que los eventos A1 ∩ B = {3}, A2 ∩ B = {4, 6}
y A3 ∩ B = {5} conforman una partición de B .

7.5. Asignación de probabilidades
Antes de señalar cómo se utilizan las probabilidades, es necesario conocer de donde provienen y cómo
se calculan. A continuación se presentan tres formas de calcular o estimar la probabilidad de un evento,
a saber, mediante los siguientes métodos: frecuentista, clásico y subjetivo. Estos métodos no son de
ninguna forma una denición de probabilidad, son apenas algunas formas de asignar probabilidades.
Denición 7.5.1. La probabilidad de un evento aleatorio A, deno-

tada con P(A), es una medida de la incertidumbre relacionada con la
posibilidad de la ocurrencia del evento A.
La denición axiomática de probabilidad está fuera de los intereses de este libro.
7.5.1. Método frecuentista
Este método se basa en el concepto de frecuencia relativa (detalles en la sección 2.2) asociada con
la ocurrencia de un evento cuando se repite un experimento aleatorio un gran número de veces. Este
método se utiliza cuando los eventos se observan empíricamente, estimando la probabilidad de que
un evento particular ocurra por medio la frecuencia relativa constituida con base en la información
histórica.
Denición 7.5.2. Se supone que un experimento aleatorio se repite n

veces y que un evento A asociado con estos experimentos ocurre exac-
tamente k veces. Entonces, la frecuencia relativa de A, denotada con
fn (A), se dene como la proporción entre la cantidad de veces que ocurre
el evento A y el número total de repeticiones del experimento aleatorio.
Esto es:
k
fn (A) = .
n
Nota. Si se calcula esta frecuencia relativa cada cierto número de ensayos, a medida que aumenta el
número de repeticiones del experimento aleatorio, las frecuencias relativas correspondientes son más
estables, es decir, tienden a ser casi las mismas. En este caso, se dice que el experimento muestra
regularidad estadística (estabilidad en las frecuencias relativas).
La mayoría de los experimentos aleatorios de importancia práctica tienen regularidad. Por esto es
posible establecer que la frecuencia relativa de un evento A correspondiente a un gran número de
7.5. ASIGNACIÓN DE PROBABILIDADES 149
repeticiones de un experimento aleatorio es aproximadamente igual a la probabilidad del evento A, es

decir
P(A) = lı́m fn (A).
n→∞
Denición 7.5.3. Sea A un evento asociado con un experimento alea-

torio. La probabilidad empírica es igual a la frecuencia relativa de A
al efectuar el experimento tantas veces como sea posible.
Nota. Cuando se usa la denición empírica de probabilidad, es importante tener en cuenta los sigui-
entes aspectos:
• La probabilidad obtenida de esta manera es únicamente una estimación del valor real.
• Cuanto mayor sea el número de experimentos, tanto mejor será la estimación de la probabilidad.
• La validez de esta estimación depende de que las condiciones en que se realiza el experimento
sean idénticas.
a. Una máquina produce 100 tubos de ensayo cada 5 minutos. Esta máquina empieza su funciona-
miento a las 8:00 a.m. y termina a las 8:00 p.m., hora en la que se toma una muestra de tamaño
n del lote y se revisa el número de tubos de ensayo defectuosos. Si el número de tubos defectuosos
es mayor que una cantidad predeterminada por el departamento de control de calidad entonces
la producción del día se puede distribuir, de otra manera no es posible. Teniendo en cuenta que
no hay cambios en el programa de producción de un día a otro: ¾Cual es la probabilidad de que
la producción de un día no se pueda distribuir? ¾Es correcto estimar la probabilidad mediante la
frecuencia relativa?
b. Un complejo de ocinas se jacta de tener uno de los mejores controles de seguridad. Se quiere
corroborar lo anterior estimando la probabilidad de que una persona que no trabaje en la ocina
pueda pasar sin tener que anunciarse en recepción. ¾Cómo se calcula esta probabilidad? ¾Es correcto
estimar la probabilidad mediante la frecuencia relativa?
Solución:
En la situación a. si se toman los registros de producción durante cierto número de días entonces se
puede calcular la probabilidad de que la producción de un día no se pueda distribuir mediante:
No. de días en los que la producción no se pudo distribuir

.
No. de días en los que se tomaron los registros
Además, es correcto estimar esta probabilidad mediante el método frecuentista porque se considera
que no hay cambios en el programa de producción de un día a otro.
En la situación b. si se toman los registros de seguridad de un periodo determinado de tiempo entonces

se puede calcular la probabilidad de que una persona que no trabaje en la ocina pueda pasar sin
tener que anunciarse en recepción como sigue:
No. de personas que ingresaron al complejo sin tener que anunciarse y que no trabajan allí
.
No. de personas que entraron al complejo sin trabajar en él
En este caso, es correcto calcular esta probabilidad por medio de la frecuencia relativa siempre y
cuando las condiciones de seguridad no varíen drásticamente de un día a otro.
7.5.2. Método clásico
Es posible identicar diversos casos en los que se asocie la misma probabilidad a cada evento elemental
de un experimento aleatorio. En tales escenarios, se habla de experimentos laplacianos o clási-
cos , donde se tienen nitos resultados que suceden con la misma probabilidad (eventos elementales
equiprobables). Los juegos de azar hacen parte de este tipo de experimentos.
Denición 7.5.4. Ω 6= Φ un espacio muestral nito asociado con un

Sea
A un evento aleatorio incluido en Ω. Se dene la
experimento laplaciano y
probabilidad clásica de A, denotada con P(A), como el cociente entre
el número de puntos muestrales de A y el número de puntos muestrales
de Ω. Esto es:
#A
P(A) =
#Ω
donde # es el número de elementos de un conjunto dado.
Nota. Es importante recalcar que este método para calcular probabilidades es útil siempre y cuando
todos los puntos muestrales sean equiprobables y el espacio muestral sea contable, de lo contrario,
las probabilidades obtenidas no son conables. En este caso no se realiza ninguna aproximación de la
probabilidad, ya que en este caso se emplea toda la información del espacio muestral.
Ejemplo 7.5.2. Un joven se vio obligado a cambiar de país por lo cual está buscando un colegio
en el cual pueda continuar con sus estudios, sin embargo el único criterio que tiene en cuenta para
seleccionar la institución educativa es que la proporción de mujeres sea por lo menos del 70 %. Este
joven realizó un pequeño cálculo de probabilidades para determinar la repuesta de sus padres frente
a su propuesta: si las posibles respuestas de los padres son sí y no (el espacio muestral -pensaba
el joven-) entonces la probabilidad de que aceptaran la propuesta empleando el método de asignación
clásico de probabilidades es 1/2. Para aumentar sus posibilidades el joven dio a sus padres varias
propuestas de colegios. La respuesta de los padres del joven fue negativa para cada una de ellas.
Discutir el motivo por el cual el joven no pudo obtener al menos un sí de sus padres para alguno de
los colegios que propuso.
Solución:
7.5. ASIGNACIÓN DE PROBABILIDADES 151
Lo primero que se debe tener en cuenta es que el joven no tomó en cuenta los criterios que tenían
sus padres frente al tipo de colegio al cual querían que su hijo ingresara. Ellos estaban considerando
que su hijo se distraería tanto con sus compañeras que decidieron que cualquier colegio que no fuera
masculino no sería la primera ni la segunda opción. Es decir, los eventos simples en este caso no eran
equiprobables.
Ejemplo 7.5.3. Un laboratorio obtiene muestras de sangre de sus pacientes para realizar una variedad
de pruebas, dentro de las cuales se encuentra una que emplea el conteo de células CD4. El laboratorio
quiere determinar la probabilidad de que al seleccionar una célula de la muestra corresponda a una
tipo CD4. ¾Cómo se calcula esta probabilidad mediante el método clásico? Asumir que el método de
selección de la célula no marca la diferencia.
Solución:
En este caso primero se dene el espacio muestral, que corresponde a cada una de las células que se
encuentran dentro de la muestra de sangre (no los tipos de célula). Luego, la probabilidad deseada
viene dada por:
No. de células tipo CD4 en la muestra de sangre
.
No. de células en la muestra de sangre
Se observa que este método sugiere que todas las células en la muestra tienen la misma posibilidad de
ser escogidas.
7.5.3. Método subjetivo
Existen algunos eventos cuyas probabilidades no se deben calcular por medio del método frecuentista
o clásico, sino que se estiman mediante el grado de credibilidad basándose en experiencias pasadas.
Aquel mecanismo que permite asignar probabilidades de esta forma se denomina método subjetivo.
Denición 7.5.5. La probabilidad subjetiva se dene como la proba-

bilidad que expresa un grado de creencia individual sobre la posibilidad
de que un evento ocurra.
Nota. La probabilidad subjetiva no depende del tratamiento matemático ni de la noción de experimen-

tos repetibles. La magnitud de la probabilidad que una persona experimentada asigna subjetivamente
a un evento depende del grado de crédito que esa persona le dé a la ocurrencia del evento. Esa es
la razón por la que es posible asignarle probabilidades a eventos que solo se presentan una vez, co-
mo por ejemplo, el evento de ganar una determinada competencia atlética. A diferencia del método
frecuentista, la probabilidad subjetiva no depende de la repetición de un experimento.
Ejemplo 7.5.4. Un par de amigos que siempre se han cubierto la espalda cuando sus novias no
sabían donde andaban, se vieron perjudicados por el conocimiento subjetivo de la probabilidad de que
su amigo les cubriera la espalda aun cuando no alcanzara a avisarle, que estimaban como del 100 %.
La novia de uno de ellos, sospechando del apoyo mutuo que tenían decidió llamar al amigo de su novio
a preguntarle si sabía en donde se encontraba y con quién; el amigo respondió que se encontraba con
él, lo cual conrmó la sospecha que ya tenía la novia porque tenía a su novio muy callado al lado de
ella. Comentar cómo se involucró la asignación subjetiva de probabilidades en la situación anterior.
Solución:
Sólo hay que notar que para este par de amigos esta clase de situaciones eran muy comunes, por
lo que cuando alguna de estas situaciones ocurría (novia llamando a preguntar por su novio) ellos
asumían con probabilidad 1 que se trataba de una situación real, en la que su amigo necesitaba que
lo cubrieran. Luego, el método subjetivo se ve reejado en el grado de credibilidad que los amigos le
dan a una situación basados en lo que han hecho en el pasado, esto es, su experiencia cubriéndose la
espalda.
7.6. Propiedades de la probabilidad
Cuando se trabaja con probabilidades, sin importar cual sea la forma en que se asignen, siempre se
deben satisfacer las condiciones que se presentan a continuación, pues formalmente son ellas las que
denen propiamente una medida de probabilidad.
Denición 7.6.1. SeaΩ un espacio muestral no vacío y A1 , A2 , . . . even-

tos aleatorios mutuamente excluyentes incluidos en Ω. Se dice que P(·)
es una medida de probabilidad sobre Ω si se satisfacen las siguientes
propiedades:
i. P(A) ≥ 0 para cualquier evento aleatorio A incluido en Ω.
ii. P(Ω) = 1.
iii. P(A1 ∪ A2 ∪ . . .) = P(A1 ) + P(A2 ) + . . ..
Nota. La parte iii. de la denición 7.6.1 se puede escribir como

∞ ∞
!
[ X
P Ai = P(Ai )
i=1 i=1
donde A1 , A2 , . . . eventos aleatorios mutuamente excluyentes.
La proposición que se presenta a continuación resume las propiedades más importantes de una medida
de probabilidad que son de uso frecuente en el cálculo de probabilidades:
Proposición 7.6.1. Sea Ω un espacio muestral no vacío, A y B eventos aleatorios incluidos en Ω y

P(.) una medida de probabilidad sobre Ω. Entonces se satisface que:
7.6. PROPIEDADES DE LA PROBABILIDAD 153
i. P(Φ) = 0.
ii. Si A∩B =Φ P(A ∪ B) = P(A) + P(B).

entonces

iii. P(A) = P(A ∩ B) + P A ∩ B C .
iv. Si A1 , A2 . . . , An son eventos mutuamente excluyentes dos a dos (Ai ∩ Aj = Φ para todo i 6= j )
Sn Pn
entonces P ( i=1 Ai ) = i=1 P(Ai ).

v. P AC = 1 − P(A).
vi. P(A − B) = P(A) − P(A ∩ B).
vii. Si A⊆B entonces P(A) ≤ P(B) y P(B − A) = P(B) − P(A).
Demostración:
i. P(Ω) = P(Ω ∪ Φ ∪ Φ . . .) = P(Ω) + P(Φ) + P(Φ) + . . .=1. Como P(Φ) ≥ 0 entonces P(Φ) = 0.
ii. P(A ∪ B) = P(A ∪ B ∪ Φ ∪ Φ ∪ . . .) = P(A) + P(B) + P(Φ) + P(Φ) + . . . = P(A) + P(B).

iii. P(A) = P(A ∩ Ω) = P A ∩ B ∪ B C = P (A ∩ B) ∪ A ∩ B C = P(A ∩ B) + P A ∩ B C .
iv. P(A1 ∪ A2 ∪ . . . ∪ An ) = P(A1 ∪ A2 ∪ . . . ∪ An ∪ Φ ∪ Φ ∪ . . .) = P(A1 ) + P(A2 ) + . . . + P(An ) +

P(Φ) + P(Φ) + . . . = P(A1 ) + P(A2 ) + . . . + P(An ).

v. P(Ω) = P A ∪ AC = P(A) + P AC = 1. En consecuencia P AC = 1 − P(A).
vi. P(A) = P((A − B) ∪ (A ∩ B)) = P(A − B) + P(A ∩ B). Como P(A) = P(A − B) + P(A ∩ B) entonces
P(A − B) = P(A) − P(A ∩ B).

vii. P(B) = P(B ∩ Ω) = P B ∩ A ∪ AC = P (B ∩ A) ∪ B ∩ AC = P(B ∩ A) + P B ∩ AC .
Como P(B) = P(A) + P(B − A) entonces P(A) ≤ P(B) y P(B − A) = P(B) − P(A).
Proposición 7.6.2. Sea Ω un espacio muestral no vacío y A, B y C eventos aleatorios incluidos en

Ω. Entonces se satisface que:
i. P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
ii. P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C).
Demostración:
i.
P(A ∪ B) = P ((A − B) ∪ (A ∩ B) ∪ (B − A))

= P(A − B) + P(A ∩ B) + P(B − A)
= P(A − B) + P(A ∩ B) + P(B − A) + P(A ∩ B) − P(A ∩ B)
= (P(A − B) + P(A ∩ B)) + (P(B − A) + P(A ∩ B)) − P(A ∩ B)
= P((A − B) ∪ (A ∩ B)) + P((B − A) ∪ P(A ∩ B)) − P(A ∩ B)
= P(A) + P(B) − P(A ∩ B).
ii.
P(A ∪ B ∪ C) = P((A ∪ B) ∪ C)
= P(A ∪ B) + P(C) − P((A ∪ B) ∩ C)
= P(A) + P(B) − P(A ∩ B) + P(C) − P((A ∩ C) ∪ (B ∩ C))
= P(A) + P(B) + P(C) − P(A ∩ B)
− [P(A ∩ C) + P(B ∩ C) − P((A ∩ C) ∩ (B ∩ C))]
= P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C).
Ejemplo 7.6.1. Sean A, B y C eventos tales que P(A) = 0.50, P(B) = 0.26, P(C) = 0.55, P(A ∪ B) =
0.61, P(A ∩ C) = 0.25, P(B ∩ C) = 0.15 y P(A ∩ B ∩C) = 0.05. Con
base en esta información, calcular
C C
las siguientes probabilidades: P(A ∪ B), P A ∩ C , P A ∪ C y P(A ∪ B ∪ C).
Solución:
Aplicando la proposición 7.6.2 se obtiene que
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) = 0.50 + 0.26 − 0.15 = 0.61.

C

Empleando la proposición 7.6.1 se sigue que P(A) = P(A ∩ C) + P A ∩ C de donde
P A ∩ C C = P(A) − P(A ∩ C) = 0.50 − 0.25 = 0.25.

Por otra parte, utilizando las leyes de Morgan se concluye que
C
P AC ∪ C = 1 − P AC ∪ C = 1 − P A ∩ C C = 1 − 0.25 = 0.75.

Por último, aplicando nuevamente la proposición 7.6.2 se tiene que
P(A ∪ B ∪ C) = 0.50 + 0.26 + 0.55 − 0.15 − 0.25 − 0.15 + 0.05 = 0.81.
Estas probabilidades se pueden recticar con el diagrama de Venn que se ilustra en la gura 7.1.
7.7. MÉTODOS DE CONTEO 155
Figura 7.1: Diagrama de Venn del ejemplo 7.6.1.
7.7. Métodos de Conteo
A pesar de la complejidad de muchos procedimientos avanzados, proporcionados por la tecnología

moderna, el simple proceso de contar resultados de un experimento aleatorio continúa jugando un
papel importante en problemas prácticos de la vida cotidiana. En algunas circunstancias la tarea no
resulta tarea fácil si no se desarrollan técnicas especiales de conteo. Debido a que, frecuentemente,
es necesario determinar cantidades como estas para poder calcular probabilidades, entonces, se hace
obligatorio estudiar algunas técnicas.
7.7.1. Enumeración
La primera regla se basa en tratar de enumerar todos los elementos de un espacio muestral y luego
contar los elementos pertenecientes a un evento de interés. Esta técnica es adecuada cuando el número
de resultados posibles no es muy grande.
La forma en que pueden resultar todos los elementos de un espacio muestral depende de si se consideran
o no el orden y el reemplazamiento entre las competentes que conforman los puntos muestrales. A
continuación se presentan algunos ejemplos para ilustrar estas características.
Ejemplo 7.7.1. (Selección con reemplazo y con orden) Una empresa tiene cuatro propuestas de
inversión en la Bolsa de Valores aviación (A), ganado (G), redes sociales (R) y nutrición (N ) y
quiere entregar un par de estas propuestas a cada asociado. Se debe tener en cuenta que existe la
posibilidad de entregar una misma propuesta varias veces y que la forma de ejecutar las propuestas
es en serie una tras otra, esto es, primero se debe ejecutar una propuesta y una vez terminada la
siguiente. La empresa quiere determinar cuántos asociados necesita para analizar todas las posibles
alternativas de inversión.
Solución:
Se quiere determinar cuántas son las distintas maneras de seleccionar las dos propuestas teniendo en
cuenta que cada asociado tendrá a su cargo el análisis de solo un par de estas propuestas. En este
caso la selección de las propuestas se hace con reemplazo y con orden, ya que se puede examinar una
misma propuesta varias veces y el análisis de un par de propuestas diferentes varía dependiendo de
cual se ejecute primero. Como la selección es con reemplazo, entonces, se selecciona una propuesta y
se vuelve a introducir en el folder de posibilidades antes de seleccionar la segunda. Por lo tanto, el
espacio muestral es:
Ω = {(A, A), (A, V ), (A, R), (A, N ), (V, V ), (V, A), (V, R), (V, N ),
(R, R), (R, A), (R, V ), (R, N ), (N, N ), (N, A), (N, R), (N, V )}.
Por lo tanto, se necesitan 16 asociados para analizar todas las posibles alternativas de inversión.
Ejemplo 7.7.2. (Selección con reemplazo y sin orden) Si en el ejemplo 7.7.1 el orden en el que se
ejecutan las propuestas no marca la diferencia, ¾cuántos asociados son necesarios para analizar todas
las posibles alternativas de inversión?
Solución:
Esta situación solo diere de la anterior en cuanto a que ahora evaluar el par las propuestas {A; V } y
{V ; A} es equivalente. Por tanto el espacio muestral correspondiente se ve reducido a:
Ω = {{A, A}, {A, V }, {A, R}, {A, N }, {V, V }, {V, R}, {V, N }, {R, R}, {R, N }, {N, N }}.
En consecuencia, si el orden en el que se ejecutan las propuestas no marca la diferencia entonces se

necesitan 10 asociados para analizar todas las posibles alternativas de inversión.
Ejemplo 7.7.3. (Selección sin reemplazo y con orden) Un grupo de congresistas necesita aprobar
cuatro proyectos de ley denotados con P1 , P2 , P3 y P4 . En un día los congresistas pueden votar dos
proyectos, pero saben que dependiendo de cuáles sean y el orden en el que se presenten, tienen una
mayor o menor posibilidad de que sean aprobados. A este grupo de congresistas les interesa saber de
cuántas formas se pueden presentar los dos proyectos de ley en un día y cuáles son las posibilidades.
Solución:
En esta situación el orden sí es importante dado que el primer proyecto en evaluarse puede interferir
con la aprobación del segundo, pero el reemplazamiento no tiene lugar porque una vez un proyecto
sea votado no tiene sentido volverlo a votar el mismo día, así que el espacio muestral está dado por:
Ω = {(P1 , P2 ), (P1 , P3 ), (P1 , P4 ), (P2 , P1 ), (P2 , P3 ), (P2 , P4 ),

(P3 , P1 ), (P3 , P2 ), (P3 , P4 ), (P4 , P1 ), (P4 , P2 ), (P4 , P3 )}.
Luego, hay 12 posibilidades para presentar los proyectos de ley.

Ejemplo 7.7.4. (Selección sin reemplazo y sin orden) Si en el ejemplo 7.7.3 el orden en el que se
votan los proyectos de ley en realidad no interere con la evaluación de los mismos, ¾de cuántas formas
se pueden presentar los dos proyectos de ley en un día?
Solución:
En comparación con el caso anterior, aquí se deja de tener en cuenta el orden en el que se presenten
las propuestas, por lo que las posibles parejas de proyectos de ley son:
Ω = {{P 1, P 2}, {P 1, P 3}, {P 1, P 4}, {P 2, P 3}, {P 2, P 4}, {P 3, P 4}}.
Por consiguiente, si el orden en el que se votan los proyectos no interere con la evaluación de los
mismos entonces solo hay 6 posibilidades para presentar proyectos de ley.
7.7.2. Diagramas de árbol
Cuando el número de posibles formas de ejecutar un proceso no es muy grande, se recomienda utilizar
una representación gráca conocida como diagrama de árbol para evidenciar todas las posibilidades
asociadas. Un diagrama de árbol consta de una serie de ramas que corresponden a cada una de las
formas en que se puede realizar las operaciones de un proceso determinado.
Ejemplo 7.7.5. La unidad administrativa de una empresa tiene dos instancias de clasicación de
documentos que al parecer le están generando retrasos ya que alguna de las instancias es más eciente
que la otra. La empresa ha decidido determinar donde está el problema y para ello quiere listar todas
las variantes del proceso de clasicación. En la primera etapa los documentos llegan a la ocina y se
clasican en tres temas (bancarrota, fusiones y pleitos). Una vez clasicados por tema se envían a
las dependencias correspondientes donde se vuelven a clasicar pero esta vez por valor (alto, medio y
bajo). ¾De cuántas formas distintas puede procesar un documento esta unidad administrativa?
Solución:
El diagrama de árbol correspondiente a esta situación se presenta en la gura 7.2. Como se observa en
este diagrama, las diferentes posibilidades se pueden enumerar teniendo en cuenta las últimas ramas
del gráco. Se nota que hay en total nueve maneras diferentes de procesar los documentos.
7.7.3. Principio fundamental del conteo
El principip fundamental del conteo asegura que si una colección de k experimentos pueden
ocurrir de n1 , n2 , . . . , nk maneras distintas, entonces el número de posibles resultados de los k experi-
Qk
mentos realizados en el orden indicado es i=1 ni = n1 × n2 × . . . × nk .
Bajo
Pleitos Medio
Alto
Bajo
Fusiones Medio
Alto
Bajo
Bancarrota Medio
Alto
Figura 7.2: Ejemplo de un diagrama de árbol.
Ejemplo 7.7.6. Una empresa de modistería está a punto de sacar al mercado su nueva colección:
Siempre perfecta, siempre distinta. La idea característica de esta colección es que cualquier empresaria
que se encuentre corta de tiempo pueda escoger cualquier prenda blusa, falda, zapatos, bolso y
pañoleta de su vestier sin tener que pensar en que las prendas combinen, ya que todas las prendas de
la colección combinan entre sí. Esta empresa está interesada en saber si con tres modelos de blusas,
dos modelos de faldas, cuatro modelos de zapatos, tres modelos de bolso y un solo modelo de pañoleta,
es posible obtener más de 100 conjuntos.
Solución:
Como la selección de cada tipo de prenda es un experimento entonces se pueden obtener
3 × 2 × 4 × 3 × 1 = 72
posibles conjuntos y por consiguiente no es posible obtener más de 100 conjuntos como quería la
empresa.
Ejemplo 7.7.7. Un dado corriente se lanza dos veces. Determinar el número de formas en que se
pueden obtener los posibles resultados en los dos lanzamientos.
Solución:
Como los dos lanzamientos no están relacionados de forma alguna cuando se ejecutan y como el
dado puede caer de seis formas distintas, entonces el número total de posibles resultados en los dos
lanzamientos es 6 × 6 = 36.
Ejemplo 7.7.8. Considerar el ejemplo 7.7.5 donde se clasican los documentos que arriban a la unidad
administrativa de una empresa. Calcular nuevamente el número de formas en la que un documento
puede ser procesado, teniendo en cuenta que también hay una instancia en la que el proceso puede
terminar de cuatro formas posibles: victoria, conciliación, derrota y suspendido.
Solución:
Los experimentos que se consideran corresponden a las tres etapas del proceso de clasicación de los
documentos, que pueden ocurrir respectivamente de 3, 3 y 4 formas diferentes. Entonces el número
total de formas en las que se puede procesar un documento es 3 × 3 × 4 = 36.
Ejemplo 7.7.9. Una fábrica de zapatos se caracteriza por la variedad de productos que tiene. Esto se
debe principalmente a que al diseñar una nueva forma para sus zapatos siempre se obtienen al menos
30 variantes respecto al diseño nal aunque todos tengan la misma forma. Uno de los directores se
pregunta si aún con dos máquinas en reparación se pueden cumplir con el mínimo de 30 variantes
por diseño. Las máquinas con las que se dispone para trabajar en serie son: pintura con 7 variantes,
supercie con 2 variantes, guras 1 variante y accesorios con 2 variantes. ¾Qué respuesta se le daría
al director respecto al mínimo de variantes que se debe cumplir?
Solución:
Teniendo en cuenta que cada uno de los objetivos de las máquinas son los experimentos de interés, se
sigue que los posibles resultados de las respectivas variantes son 7, 2, 1 y 2. Por ende, la cantidad de
variantes por diseño que se pueden obtener en el producto nal es 7 × 2 × 1 × 2 = 28, cifra que no
cubre la cantidad mínima de variantes deseada.
7.7.4. Principio de la adición
El principio de la adición asegura que si los eventos aleatorios A1 , A2 , . . . , Ak son mutuamente

Sk
excluyentes y si éstos ocurren de n1 , n2 , . . . , nk formas diferentes, entonces, el evento i=1 Ai = A1 ∪
Pk
A2 ∪ . . . ∪ Ak ocurre de i=1 ni = n1 + n2 + . . . + nk maneras distintas.
Ejemplo 7.7.10. En el lanzamiento de dos dados corrientes, ¾cuántos resultados corresponden a

lanzamientos donde la suma de los números obtenidos es siete u ocho?
Solución:
Sean A1 y A2 los eventos la suma de los números obtenidos es siete y la suma de los números
obtenidos es ocho respectivamente. En esta situación se tiene que A1 y A2 ocurren de 6 y 5 formas

distintas respectivamente dado que
A1 = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)} y A2 = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}.
Como A1 y A2 son mutuamente excluyentes entonces el evento A1 ∪ A2 que corresponde a la suma
de los números obtenidos es siete u ocho puede ocurrir de 6 + 5 = 11 maneras distintas.
Ejemplo 7.7.11. Se considera el experimento que consiste en lanzar una moneda corriente al aire
tres veces. ¾De cuántas formas se pueden obtener una, dos o tres caras?
Solución:
Sean A1 , A2 y A2 los eventos se obtiene una cara en los tres lanzamientos, se obtienen dos caras
en los tres lanzamientos y se obtienen tres caras en los tres lanzamientos respectivamente. En esta
situación se tiene que A1 , A2 y A3 ocurren de 3, 3 y 1 formas posibles respectivamente dado que
A = {(c, s, s), (s, c, s), (s, s, c)}, B = {(s, c, c), (c, s, c), (c, c, s)} y D = {(c, c, c)}
donde c y s denotan cara A1 , A2 y A3 son mutuamente excluyentes
y sello respectivamente. Como
dos a dos entonces el evento A1 ∪ A2 ∪ A3 que corresponde a se obtienen una, dos o tres caras en los
tres lanzamientos puede ocurrir de 3 + 3 + 1 = 7 maneras diferentes.
7.7.5. Permutaciones
Como se ha mencionado anteriormente, la cantidad de posibilidades en que un experimento o proceso

puede resultar se ve afectada por el orden en que se listen las componentes de los puntos muestrales.
Denición 7.7.1. Una permutación es un arreglo ordenado de una

cantidad nita de objetos distintos.
Nota. Es importante tener en cuenta que toda permutación se puede identicar como una muestra
seleccionada con o sin reemplazo, pero siempre teniendo en cuenta el orden de los elementos que la
componen.
Ejemplo 7.7.12. Un experimento donde prima el orden en el que se ejecutan los procesos que lo
componen es aquel que se realiza cuando una persona se viste. Allí se evidencia claramente la diferencia
en el resultado del experimento cuando se cambia el orden de ejecución de los procesos, ya que no es
lo mismo ponerse primero la ropa interior y luego los pantalones, a ponerse primero los pantalones y
luego la ropa interior, por ejemplo.
Ejemplo 7.7.13. El arreglo (a, c) es un ejemplo de una permutación de las letras a, b, c y d, pero
tomando solamente dos de ellas a la vez. Hay un total de 12 permutaciones de estas cuatro letras
tomándolas de 2 en 2. Estas permutaciones son (a, b), (a, c), (a, d), (b, a), (b, c), (b, d), (c, a), (c, b),
(c, d), (d, a), (d, b) y (d, c).
El número total de permutaciones de un conjunto de objetos se puede calcular a través del teorema
fundamental del conteo. Pero para algunas situaciones especiales hay fórmulas que permiten calcular
la cantidad de permutaciones sin tener que aplicar directamente este teorema.
Permutaciones de n objetos distintos sin repetición tomados todos a la vez
El número de permutaciones de un conjunto de n elementos distintos sin repetición tomados todos a

la vez es igual a n! donde ! n (detalles en la sección A.4). Esta fórmula se deriva
denota el factorial de
del teorema fundamental del conteo como sigue: el primer elemento se puede seleccionar de n formas,
en seguida, el segundo elemento se puede seleccionar de n − 1 formas dado que el primer elemento ya
ha sido seleccionado, y así sucesivamente hasta llegar al último elemento que solo se puede seleccionar
de una forma porque ya han sido seleccionados los n−1 objetos precedentes.
Ejemplo 7.7.14. Un joven prepara café con leche todas las mañanas llenando el 80 % de la tasa con
café, el 18 % con leche y el 2 % restante con azúcar. Si el muchacho en una de sus parrandas acaba
con el suministro de alcohol del lugar, a la mañana siguiente o cuando se logre levantar intenta
hacer un café con leche. Teniendo en cuenta su estado, ¾de cuántas formas puede prepararse el café
utilizando cada ingrediente una sola vez y manteniendo constantes los porcentajes de preparación?
¾Cuál es la probabilidad de que se prepare el café con leche como de costumbre asumiendo que todos
los ingredientes se utilizan una sola vez y que tienen la misma posibilidad de ser seleccionados?
Solución:
Como solo hay tres ingredientes entonces el número de formas diferentes en las que se puede prepa-
rar el café con leche manteniendo la proporción de los ingredientes es 3! = 6 y por consiguiente la
probabilidad de que se prepare el café con leche como de costumbre es de 0.16667.
Ejemplo 7.7.15. Se le pide a un consumidor que ordene, por orden de preferencia, el sabor de cinco
cosechas de vino. Si al consumidor le es indiferente cualquiera de estas cinco cosechas entonces el
número de arreglos diferentes que resultan es 5! = 120.
Permutaciones de n objetos distintos sin repetición tomados de k en k
El número de permutaciones de un conjunto de n elementos distintos sin repetición tomados de k en

k es igual a
n!
Pkn =
(n − k)!
donde k es un número entero positivo tal que k ≤ n. Cuando se observa la similitud entre este caso
y el anterior, se hace evidente que esta fórmula se deriva fácilmente de la anterior ya que no se están
teniendo en cuenta las posibilidades que generan los elementos que no son seleccionados.
Ejemplo 7.7.16. Siguiendo con el ejemplo 7.7.13, el número de permutaciones de las letras a, b, c y
4!
d, tomadas de dos en dos, es igual a P24 = (4−2)! = 12.
Ejemplo 7.7.17. ¾Cuántos números de tres cifras sin repetir dígitos se pueden formar con los números
2, 4, 5, 7 y 8?
Solución:
Como interesan los números de tres cifras sin repetir dígitos formados con los números 2, 4, 5, 7 y 8,
5!
entonces se pueden obtener P35 = (5−3)! = 60 números diferentes.
Ejemplo 7.7.18. Una sección de maquinaria determinada que consta de cuatro piezas puede ser
ensamblada poniendo las competentes en cualquier orden. Se quiere estudiar el tiempo de armado
para esta sección de maquinaria midiendo el tiempo que requiere cada una de las acomodaciones
resultantes al tomar las piezas en distinto orden. ¾Cuántas de estas mediciones habrá que hacer?
Solución:
Como hay cuatro piezas diferentes y se requiere el armado de todas ellas, entonces el número total de
4!
mediciones es P44 = (4−4)! = 24.
Permutaciones de n objetos distintos con repetición tomados de k en k
El número de permutaciones de un conjunto de n elementos distintos con repetición tomados de k en k

es igual a nk donde k es un número entero positivo. La cantidad de permutaciones de este tipo también
se deduce por medio del principio fundamental del conteo. Como la primera selección se puede realizar
de n maneras distintas y el experimento se realiza con reemplazamiento (el elemento elegido se devuelve
al saco de posibilidades), entonces la segunda selección se vuelve a realizar considerandon elementos.
y Continuando de esta manera hasta la k -ésima extracción se obtiene la fórmula correspondiente.
Ejemplo 7.7.19. Una rma consultora cobra 700 USD por cada caso que atiende. Esta empresa suele
adquirir siete casos por temporada. Una vez se tienen los siete casos, la compañía examina todas las
posibles permutaciones de cuatro casos con repetición para revisarlas cuantas veces sea necesario y así
determinar cual de todas ellas es la más rentable. Recientemente ha llegado una cantidad nunca antes
vista de consultas, 11 en total, y emplearon el personal de costumbre para estudiar las permutaciones
de cuatro casos. En la tarde, el grupo encargado de inspeccionar las permutaciones se quejó diciendo
que ellos no tenían la capacidad para realizar el trabajo con la misma cantidad de miembros y en los
lapsos de tiempo en que deben entregar sus resultados. ¾Se justica la posición de los trabajadores?
Solución:
Lo primero que se debe tener en cuenta es que usualmente los trabajadores están a acostumbrados
74 = 2, 401 posibilidades de casos, pero con los 11 asesorías los empleados deben estudiar
a analizar
4
11 = 14, 641 posibilidades, que corresponde aproximadamente a seis veces más de lo que están
acostumbrados a analizar, luego, a pesar de que la diferencia entre 7 y 11 no es muy grande, sí lo es
la diferencia en el trabajo que esto representa, por lo cual los trabajadores sí tienen razón en hacer la
queja.
Ejemplo 7.7.20. ¾Cuántos números de dos cifras se pueden formar usando los dígitos 2, 3 y 5 si se
permiten dígitos repetidos?
Solución:
Como hay tres elementos disponibles para formar los números de dos cifras y además se permite la
repetición de dígitos, entonces se tienen 32 = 9 posibilidades, a saber, 55, 52, 53, 25, 22, 23, 35, 32 y
33.
Ejemplo 7.7.21. ¾De cuántas formas es posible contestar un examen con diez preguntas de selección
múltiple donde cada pregunta tiene cuatro alternativas de respuesta?
Solución:
Como se tienen cuatro opciones de respuesta para cada una de las diez preguntas, se sigue que hay
410 = 1, 048, 576 formas de responder el examen.
Ejemplo 7.7.22. Un ladrón quiere abrir una caja fuerte. Observa que para abrirla debe manipular
un dispositivo de seguridad formado por cinco anillos que están marcados con los dígitos 1, 2, 3, 4
y 5, pero no sabe la combinación correcta. ¾Cuál es la mayor cantidad de intentos incorrectos que el
ladrón puede realizar antes de encontrar la combinación correcta?
Solución:
En cada uno de los cinco anillos se pueden utilizar los 5 dígitos. Por lo tanto, hay 55 = 3, 125
posibilidades de escoger una clave. Pero como una de estas 3,125 es la correcta, entonces la mayor
cantidad de intentos incorrectos que el ladrón puede realizar antes de encontrar la combinación correcta
es 3,124.
Permutaciones circulares
El número de permutaciones de un conjunto de n elementos distintos acomodados en un círculo de

n posiciones es (n − 1)!. Se evidencia que en los arreglos circulares la noción de principio se pierde
porque la primera posición no está denida. Este lugar se debe establecer arbitrariamente en cualquier
posición del arreglo y por tal motivo el número total de permutaciones se reduce en comparación con
los arreglos que no son circulares.
Ejemplo 7.7.23. Si interesa ubicar a cuatro personas una al lado de la otra en una la, el número
total de arreglos es 4! = 60. Ahora bien, si se deben sentar alrededor de una mesa redonda, ¾de cuántas
maneras es posible hacerlo?
Solución:
En una mesa redonda no se tiene un comienzo o un nal a diferencia del escenario en el que las
personas se sientan en una la. Este hecho hace que se pierda un nivel en el número de arreglos.
Como se acomoda a una persona en un lugar jo y luego se ubican a las otras tres personas, entonces
se obtienen (4 − 1)! = 6 arreglos diferentes en los que se pueden sentar las cuatro personas en una
mesa redonda.
Ejemplo 7.7.24. ¾De cuántas formas se pueden sentar cuatro personas alrededor de una mesa redonda
si dos de ellas no deben estar una al lado de la otra?
Solución:
Hay 3! = 6 formas de acomodar a cuatro personas en una mesa redonda. Ahora, hay 2! maneras en las
(3 − 1)!2! es la cantidad total de
que dos personas se pueden sentar una al lado de la otra, por lo que
formas en las que estas dos personas se pueden ubicar juntas en una mesa redonda. En consecuencia,
se tiene que
3! − (3 − 1)!2! = 3! − 2!2! = 2
es el número de arreglos requerido.
Permutaciones de n objetos repartidos en varias categorías
El número de permutaciones de un conjunto de n objetos repartidos en varias categorías es igual a

n1 n!
=
n1 , n2 , . . . , nk n1 !n2 ! . . . nk !
donde ni es la cantidad de elementos del i-ésimo tipo para i = 1, . . . , k con n1 + n2 + . . . + nk = n. La

fórmula anterior se obtiene teniendo en cuenta que los elementos de la i-ésima categoría no se pueden
diferenciar entre sí, por lo que hay ni ! permutaciones de estos elementos que hacen alusión al mismo
arreglo puesto que pertenecen a la misma categoría. Por consiguiente, es necesario descontar todas
las permutaciones repetidas de los elementos de cada categoría que se encuentran enumeradas en la
cantidad n!.
Ejemplo 7.7.25. ¾Cuántas palabras distintas con o sin sentido se pueden formar con las letras de
la palabra estadística?
Solución:
En la palabra estadística hay n = 11 letras, distribuidas así: 1 e, 2 s, 2 t, 2 a, 1 d, 2 i y 1
c. Por lo tanto, se concluye que es posible formar

11 11!
= = 2, 494, 800
1, 2, 2, 2, 1, 2, 1 1! × 2! × 2! × 2! × 1! × 2! × 1!
palabras distintas con las letras de la palabra estadística.
Ejemplo 7.7.26. En una clase de biología molecular tienen la siguiente secuencia de ADN:
ATGCAAATCCATCCCG
Para que los alumnos de la clase comprendan porque es necesario el uso de métodos computacionales
intensivos se les pregunta: ¾cuántas posibles secuencias del mismo tamaño que la anterior es posible
encontrar usando las mismas bases nitrogenadas que se tienen en el ejemplo?
Solución:
En este caso la cantidad de tipos o categorías es 4, a saber A, T, G y C, de las cuales se tienen 5 A,
3 T, 2 G y 6 C bases nitrogenadas. Por lo tanto, la cantidad total de posibles secuencias está
dada por:
16!
= 20, 180, 160.
5!3!2!6!

Ejemplo 7.7.27. Un grupo de investigación de agronomía está interesado en analizar un nuevo

procedimiento para la adecuación del suelo, que consiste en aplicar en el suelo las sustancias A, G,
W y J en un orden especíco. Para realizar el experimento los integrantes del grupo tienen pensado
el uso de un lote, pero necesitan determinar el número de parcelas en que se debe dividir. ¾Cuántas
parcelas se deben obtener si las sustancias se deben aplicar 2, 1, 3 y 3 veces respectivamente?
Solución:
Como es necesario tener en consideración el orden en el cual se esparcen las sustancias en el suelo y
cada sustancia se puede considerar como una categoría diferente entonces la cantidad de parcelas que
se necesitan es
9!
= 5, 040.
2!1!3!3!

7.7.6. Combinaciones
Cuando se trata con permutaciones de objetos, el orden de selección o de colocación es fundamental.

Hay ocasiones en las que no interesa considerar conjuntos de objetos ordenados. Cuando esto ocurre,
el arreglo se denomina combinación.
Denición 7.7.2. Una selección de k objetos de un conjunto de n ob-

jetos distintos, sin importar el orden en que los k objetos sean escogidos,
se llama combinación .
Ejemplo 7.7.28. Todas las posibles combinaciones de las letras a, b, c, d y e, tomadas de dos en dos
son {a, b}, {a, c}, {a, d}, {a, e}, {b, c}, {b, d}, {b, e}, {c, d}, {c, e} y {d, e}. Es decir, en total hay 10
posibles formas de escoger dos letras de un total de cinco, cuando el orden no importa y la selección
se hace sin reemplazamiento. Se observa que las combinaciones {a, b} y {b, a} coinciden dado que el
orden de los elementos no marca la diferencia.
El número de combinaciones de un conjunto de n elementos distintos sin repetición tomados de k en

k es igual a

n n!
=
k (n − k)!k!
donde k es un número entero positivo tal que k ≤ n. Esta fórmula se obtiene considerando que el
número total de permutaciones de un conjunto de n elementos distintos sin repetición tomados de k
n!
en k es igual a
(n−k)! y que en las combinaciones el orden de los elementos no es de interés, por lo que
solo interesa tener 1 sola de las k! posibles permutaciones de los k objetos.
Ejemplo 7.7.29. Un abogado se encuentra en aprietos para defender a su cliente, ya que a pesar
de tener siete posibles argumentos, todos carecen de carácter probatorio y además solo puede utilizar
tres de ellos en el juicio. Si, de todas las posibles combinaciones únicamente hay ocho que lo pueden
llevar a ganar el caso, ¾cuál es la probabilidad de que escogiera una de estas posibilidades de manera
aleatoria?
Solución:
Como el total de combinaciones de tres argumentos de siete posibles viene dado por

7 7!
= = 35,
3 (7 − 3)!3!
entonces la probabilidad de que se escoja una de las posibilidades que lo pueden llevar a la victoria es
8/35 = 0.22857. ¾Cuál es el método de asignación de probabilidades se utilizó en este caso? ¾Qué es
necesario suponer para emplearlo?
7.8. Probabilidad condicional
Hay situaciones en las que interesa la probabilidad de un evento A, teniendo en cuenta que otro
evento B ha ocurrido. Así, la cuestión principal es cuanticar el chance de ocurrencia de un evento
dependiendo de la ocurrencia de otro(s) suceso(s). Tales probabilidades se denominan probabilidades
condicionales.
7.8. PROBABILIDAD CONDICIONAL 167
Denición 7.8.1. Sea Ω un espacio muestral no vacío y A y B dos

eventos aleatorios incluidos en Ω. La probabilidad condicional o a
posteriori de A dado B, denotada con P(A|B), se dene como
P(A ∩ B)
P(A|B) =
P(B)
siempre que P(B) > 0.
Ejemplo 7.8.1. Los 700 empleados de una corporación, se clasican por género y por el monto de su
salario dependiendo de si ganan menos de o más de $20,000 diarios, como se muestra en la tabla 7.1.
< 20, 000 (L) ≥ 20, 000 (G) Total

Mujeres (M ) 210 80 290
Hombres (H ) 105 305 410
Total 315 385 700
Tabla 7.1: Datos asociados con la clasicación de los empleados de una corporación según el género y el ingreso.
Si un empleado de la corporación es seleccionado aleatoriamente, encuentre la probabilidad de que el

empleado a. gane al menos $20,000, dado que es hombre y b. sea hombre, dado que gana al menos
$20,000.
Solución:
a. La probabilidad de que un empleado gane al menos $20,000, dado que es hombre es igual a:
305
P(G ∩ H) 700 305
P(G|H) = = 410 = = 74.39 %.
P(H) 700
410
b. La probabilidad de que el empleado sea hombre, dado que gana $20,000 ó más es igual a:
305
P(H ∩ G) 700 305
P(H|G) = = 385 = = 79.22 %.
P(G) 700
385
Proposición 7.8.1. Sea Ω un espacio muestral no vacío y A, B , C , A1 , A2 , . . . , An , . . . eventos

aleatorios incluidos en Ω con P(A) > 0. Entonces se satisfacen las siguientes propiedades:
i. P(B|A) > 0.
ii. P(Ω|A) = 1 y P(A|A) = 1.
iii. P(A1 ∪ A2 ∪ . . . |A) = P(A1 |A) + P(A2 |A) + . . . siempre que A1 , A2 , . . . sean eventos mutuamente
excluyentes.
iv. P(B|Ω) = P(B).
v. P(B|A) = 0 siempre que A y B sean eventos excluyentes.
vi. P(B|A) = P(A ∩ B|A).
vii. P(B ∩ C|A) = P(B|A ∩ C)P(C|A) siempre que P(A ∩ C) > 0.
Nota. Las propiedades i., ii. y iii. de la proposición 7.8.1 indican que P(·|A1 ) es una medida de
probabilidad sobre Ω. Además, la propiedad iii. se puede escribir como
∞
[
! ∞
X

P Ai A = P(Ai |A)
i=1 i=1
donde A1 , A2 , . . . eventos aleatorios mutuamente excluyentes.
Ejemplo 7.8.2. Calcular P(A ∪ B|C) utilizando la información de la gura 7.1 del ejemplo 7.6.1.
Solución:
Como los eventos A y B no son excluyentes, entonces se hace necesario reescribir esta unión como
A ∪ B = (A − B) ∪ B . Teniendo en cuenta que P(·|C) es una medida de probabilidad, se sigue que
P(A ∪ B|C) = P((A − B) ∪ B|C)

= P((A − B)|C) + P(B|C)
P((A − B) ∩ C) P(B ∩ C)
= +
P(C) P(C)
0.20 0.15
= +
0.55 0.55
= 0.63636.
7.9. Teorema de la multiplicación
De los resultados de la proposición 7.8.1 e incluso de la denición 7.8.1, surge la necesidad de establecer
cómo se puede expresar la probabilidad de la intersección de dos eventos o más eventos a través de la
probabilidad a posteriori.
7.9. TEOREMA DE LA MULTIPLICACIÓN 169
Teorema 7.9.1. Sea Ω un espacio muestral no vacío y A y B dos eventos aleatorios incluidos en Ω.
Entonces se satisface que
P(A ∩ B) = P(A|B)P(B)
donde P(A) > 0.
Nota. El teorema 7.9.1 se conoce como teorema de la multiplicación . La fórmula que este teorema
sostiene es equivalente a P(A ∩ B) = P(B|A)P(A) donde P(B) > 0. Este hecho se sigue fácilmente
intercambiando A por B y B por A en la fórmula del teorema.
Ejemplo 7.9.1. Una caja tiene diez artículos, de los cuales tres son defectuosos. Se extraen dos
elementos, uno tras otro y sin reemplazo. ¾Cuál es la probabilidad de extraer un artículo defectuoso
seguido de otro defectuoso?
Solución:
Sea A el evento el primer artículo extraído es defectuoso y B el evento el segundo artículo extraído
es defectuoso. Se pide calcular P(A ∩ B).
Debido a que tres de los diez artículos son defectuosos, se tiene que P(A) = 3/10. Como ya se ha
extraído un artículo defectuoso de la caja, entonces quedan en total nueve objetos disponibles, entre
los cuales, hay ahora dos defectuosos. Por lo tanto, P(B|A) = 2/9 y también
3 2
P(A ∩ B) = P(A)P(B|A) = × = 0.06666.
10 9
En consecuencia, la probabilidad de extraer un artículo defectuoso seguido de otro defectuoso es
0.06666.
En seguida se presenta un ejemplo tomado de Hogg, McKean & Craig (2005, p. 26) en el que se
ilustran varios aspectos de la probabilidad condicional:
Ejemplo 7.9.2. Se quiere investigar el porcentaje de niños abusados en cierta población. Los eventos
de interés son: el niño fue abusado (A), y su complemento, el niño no fue abusado (N = AC ). Para los
propósitos de este ejemplo, se asume que P(A) = 0.01 y, por lo tanto, P(N ) = 0.99. La clasicación
sobre si el niño fue o no abusado está basada en el dictamen médico de un doctor. Algunas veces
los doctores clasican un niño que sí fue abusado como si éste no hubiera sido abusado (ND ), y
otras veces los doctores clasican un niño que no fue abusado como si éste sí hubiera sido abusado
(AD ). Las probabilidades de estos errores de clasicación son P(ND |A) = 0.04 y P(AD |N ) = 0.05; y
además, las probabilidades de que los doctores tomen las decisiones acertadas son P(AD |A) = 0.96 y
P(ND |N ) = 0.95. Se quiere determinar la probabilidad de que un niño tomado al azar sea clasicado
por un doctor como abusado.
Solución:
Como un niño puede ser clasicado por un doctor como abusado en dos eventualidades, a saber,
A ∩ AD o N ∩ AD , entonces se tiene que
P(AD ) = P((A ∩ AD ) ∪ (N ∩ AD ))
= P(A ∩ AD ) + P(N ∩ AD )
= P(AD |A)P(A) + P(AD |N )P(N )
= (0.96)(0.01) + (0.05)(0.99)
= 0.0591
que corresponde a una cifra considerable comparada con la probabilidad de que un niño haya sido
abusado. Además, la probabilidad de que un niño haya sido abusado dado que el doctor lo clasico
como abusado es
P(A ∩ AD ) (0.96)(0.01)
P(A|AD ) = = = 0.1624
P(AD ) 0.0591
que es baja. De la misma manera, la probabilidad de que un niño no haya sido abusado dado que
el doctor lo clasico como abusado es 0.8376. La razón por la cual se tiene estas probabilidades tan
desconcertantes, es porque la probabilidad de los errores de los doctores son muy altos en comparación
con la fracción de la población que fue abusada. Una investigación como esta puede resultar en un
mejor entrenamiento de los doctores para clasicar niños que han sido abusados.
Proposición 7.9.2. Sea Ω un espacio muestral no vacío y A1 , A2 , . . . , An eventos aleatorios incluidos
en Ω. Entonces se satisface que
P(A1 ∩ A2 ∩ . . . ∩ An ) = P(A1 )P(A2 |A1 )P(A3 |A1 ∩ A2 ) . . . P(An |A1 ∩ A2 ∩ . . . ∩ An−1 )
donde P(A1 ∩ A2 ∩ . . . ∩ An−1 ) > 0.
Ejemplo 7.9.3. Un corredor de bolsa está seguro de tener la fórmula para obtener grandes dividendos
basado en los siguientes eventos: inversiones de alto riesgo (R), inversiones con un capital inicial
de dos millones de dólares (C ) y inversiones con ganancias mayores al 184 % (G). El inversionista
cree que la probabilidad de obtener ganancias mayores al 184 % es mayor a 0.7 si previamente se hace
una inversión de dos millones de dólares y se intenta una inversión de alto riesgo. Esta premisa la
obtuvo basándose en las siguientes probabilidades: P(R) = 0.25, P(C|R) = 0.05 y P(R ∩ C ∩ G) = 0.01.
Comprobar lo que asegura el corredor de bolsa.
Solución:
Se debe comprobar si efectivamente se cumple que P(G|R ∩ C) > 0.7. Siguiendo la proposición 7.9.2
se obtiene que P(R ∩ C ∩ G) = P(R)P(C|R)P(G|R ∩ C) de donde
P(R ∩ C ∩ G) 0.01
P(G|R ∩ C) = = = 0.8.
P(R)P(C|R) (0.25)(0.05)
Por lo tanto, la propuesta del inversionista es correcta.
7.10. TEOREMA DE LA PROBABILIDAD TOTAL 171
7.10. Teorema de la probabilidad total
A continuación se presenta un resultado que se utiliza frecuentemente para calcular probabilidades

con base en información parcial relacionada con el chance de la ocurrencia de otros eventos de interés.
Este teorema se conoce como teorema de la probabilidad total .
Teorema 7.10.1. Sea E1 , E2 , . . . , En una partición de espacio muestral Ω vacío tal que la proba-
bilidad de cada uno de los eventos asociados es distinta de 0 y conocida. También sea A un evento
aleatorio del que se conocen las probabilidades condicionales P(A|E1 ), P(A|E2 ), . . . , P(A|En ). Entonces
la probabilidad del suceso A está dada por:
n
X
P(A) = P(Ei )P(A|Ei ).
i=1
Demostración:
Como E1 , E2 , . . . , En es una partición de Ω, entonces se tiene que
A = (A ∩ E1 ) ∪ (A ∩ E2 ) ∪ . . . ∪ (A ∩ En ).
Así, se obtiene que
P(A) = P((A ∩ E1 ) ∪ (A ∩ E2 ) ∪ . . . ∪ (A ∩ En ))
= P(A ∩ E1 ) + P(A ∩ E2 ) + . . . + P(A ∩ En )
= P(E1 )P(A|E1 ) + P(E2 )P(A|E2 ) + . . . + P(En )P(A|En )
Xn
= P(Ei )P(A|Ei )
i=1

Ejemplo 7.10.1. Una compañía dedicada al transporte público emplea tres líneas de una ciudad, de
forma que el 60 % de los autobuses cubre el servicio de la primera línea, el 30 % cubre la segunda y el
10 % cubre el servicio de la tercera línea. Se sabe que la probabilidad de que, diariamente, un autobús
se averíe en cada línea es del 2 %, 4 % y 1 % respectivamente. Determinar la probabilidad de que, en
un día, un autobús sufra una avería.
Solución:
Sea Ei el evento el autobús cubre el servicio de la línea i con i = 1, 2, 3, del tal forma que, E1 es el
evento el autobús cubre el servicio de la línea 1, por ejemplo. Sea A el evento el autobús sufre una
avería. De acuerdo con el teorema de la probabilidad total y teniendo en cuenta las probabilidades
dadas se tiene que
3
X
P(A) = P(Ei )P(A|Ei )
i=1
= P(E1 )P(A|E1 ) + P(E2 )P(A|E2 ) + P(E3 )P(A|E3 )

= (0.6)(0.02) + (0.3)(0.04) + (0.1)(0.01)
= 0.025.
Por consiguiente, la probabilidad de que, en un día, un autobús sufra una avería es 0.025.
Ejemplo 7.10.2. Una empresa elabora sus productos en cuatro fábricas, a saber, fábrica 1, fábrica
2, fábrica 3 y fábrica 4. El porcentaje de producción total que se elabora en cada fábrica es del 40 %,
30 %, 20 % y 10 % respectivamente, y además el porcentaje de envasado incorrecto en cada fábrica es
del 1 %, 2 %, 7 % y 4 %. Tomando un producto de la empresa al azar, ¾cuál es la probabilidad de que
se encuentre envasado de forma incorrecta?
Solución:
Sea A el evento el producto está envasado defectuosamente y Fi el evento el envase proviene de la
fábrica i con i = 1, 2, 3, 4. Cada producto puede provenir de cada una de las cuatro fábricas. Según
el teorema de la probabilidad total y teniendo en cuenta las probabilidades dadas se obtiene que
4
X
P(A) = P(Fi )P(A|Fi )
i=1
= P(F1 )P(A|F1 ) + P(F2 )P(A|F2 ) + P(F3 )P(A|F3 ) + P(F4 )P(A|F4 )
= (0.4)(0.01) + (0.3)(0.02) + (0.2)(0.07) + (0.1)(0.04)
= 0.028.
En consecuencia, la probabilidad de que un producto de la empresa seleccionado al azar se encuentre

envasado de forma incorrecta es 0.028.
Ejemplo 7.10.3. Un grupo de investigadores tienen cinco estanques en los que mantienen a diferentes
grupos de tortugas de la misma especie con las mismas características pero que provienen de diferente
madre. El grupo está interesado en conocer el comportamiento de las tortugas cuando cambia su
ambiente inicial (estanque y tortugas compañeras) al transferirlas a otro ambiente diferente; las
probabilidades de que una tortuga fuera colocada en un estanque particular eran P(E1 ) = 0.3, P(E2 ) =
0.2, P(E3 ) = 0.15, P(E4 ) = 0.15 y P(E5 ) = 0.2 donde Ei es el evento una tortuga es colocada en
el estanque i con i = 1, 2, 3, 4, 5. Cuando empezaron a realizar el experimento se dieron cuenta que
las tortugas se estaban muriendo en unos estanques más que en otros y mediante registros históricos
determinaron que la proporción de muertes de tortugas, de similares condiciones a las de la actual
investigación, eran de 4 %, 3 %, 5 % ,1 % y 7 % respectivamente. Los investigadores quieren conocer cuál
es la probabilidad de que una tortuga de su investigación muera, para comparar si el comportamiento
evidenciado por sus colegas es anormal.
Solución:
Como los estanques crean una partición de la población se pude encontrar la probabilidad de que una
tortuga de la investigación muera (F ) con base en la proporción de las muertes que se tienen en cada
7.11. TEOREMA DE BAYES 173
estanque, esto es:
5
X
P(F ) = P(Ei )P(F |Ei )
i=1
= P(E1 )P(F |E1 ) + P(E2 )P(F |E2 ) + P(E3 )P(F |E3 ) + P(E4 )P(F |E4 ) + P(E5 )P(F |E5 )
= (0.3)(0.04) + (0.2)(0.03) + (0.15)(0.05) + (0.15)(0.01) + (0.2)(0.07)
= 0.041.
Luego, la probabilidad de que una tortuga de la investigación muera es de 0.041 que en realidad no
es una situación que esté fuera de lo normal.
7.11. Teorema de Bayes
El teorema de Bayes 1
es una técnica muy popular para calcular probabilidades condicionales y
es la base de la teoría estadística bayesiana en donde a partir de un conjunto de probabilidades
llamadas a priori o sin corregir, se calcula un conjunto de probabilidades a posteriori o corregida, que
corresponden a una modicación de las primeras ante la evidencia de que un determinado suceso ha
ocurrido.
Figura 7.3: Thomas Bayes (1702-1761).
Teorema 7.11.1. Sea E1 , E2 , . . . , En una partición de espacio muestral Ω vacío tal que la proba-
bilidad de cada uno de los eventos asociados es distinta de 0 y conocida. También sea A un evento
aleatorio del que se conocen las probabilidades condicionales P(A|E1 ), P(A|E2 ), . . . , P(A|En ). Entonces
la probabilidad del suceso Ej dado el evento A está dada por:
P(Ej )P(A|Ej )
P(Ej |A) = Pn
i=1 P(Ei )P(A|Ei )
1 Fotografía tomada de la página web http://www.ugr.es/~eaznar/fotos_bayes.htm.
para cada j = 1, . . . , n.
Demostración:
Haciendo uso de la probabilidad condicional y del teorema de la probabilidad total se tiene que para
un j dado se satisface que
P(Ej ∩ A)
P(Ej |A) =
P(A)
P(Ej ∩ A)
= Pn
i=1 P(Ei )P(A|Ei )
P(Ej )P(A|Ej )
= Pn
i=1 P(Ei )P(A|Ei )
para cada j = 1, . . . , n.
Ejemplo 7.11.1. Con la información del ejemplo 7.10.1, calcular la probabilidad de que un autobús
que sufrió una avería haya recorrido la primera línea.
Solución:
Según el teorema de Bayes y teniendo en cuenta las probabilidades dadas se tiene que:
P(E1 )P(A|E1 )
P(E1 |A) = P3
i=1 P(Ei )P(A|Ei )
P(E1 )P(A|E1 )
=
P(E1 )P(A|E1 ) + P(E2 )P(A|E2 ) + P(E3 )P(A|E3 )
(0.6)(0.02)
=
(0.6)(0.02) + (0.3)(0.04) + (0.1)(0.01)
= 0.08955.
En consecuencia, la probabilidad de que un autobús que sufrió una avería haya recorrido la primera
línea es 0.08955..
Ejemplo 7.11.2. Con la información del ejemplo 7.10.2, calcular la probabilidad de que un producto
envasado de forma incorrecta provenga de la primera fábrica.
Solución:
Según el teorema de Bayes y teniendo en cuenta las probabilidades dadas se tiene que:
P(F1 )P(A|F1 )
P(F1 |A) = P4
i=1 P(Fi )P(A|Fi )
P(F1 )P(A|F1 )
=
P(F1 )P(A|F1 ) + P(F2 )P(A|F2 ) + P(F3 )P(A|F3 ) + P(F4 )P(A|F4 )
7.12. INDEPENDENCIA ESTADÍSTICA DE EVENTOS 175
(0.4)(0.01)
=
(0.4)(0.01) + (0.3)(0.02) + (0.2)(0.07) + (0.1)(0.04)
= 0.14285.
Por lo tanto, la probabilidad de que un producto envasado de forma incorrecta provenga de la primera
fábrica es 0.14285.
Ejemplo 7.11.3. Continuando con el ejemplo 7.10.3, cierta mañana los investigadores encuentran
una tortuga muerta fuera de los estanques pero necesitan saber de cual estanque es más probable que
haya provenido para mantener el registro de las muertes de la investigación. ¾Cómo se puede resolver
este problema?
Solución:
Se busca el estanque j tal que P(Ej |F ) sea máxima paraj = 1, 2, 3, 4, 5. Por consiguiente, se deben
encontrar primero todas las probabilidades de la forma P(Ej |F ) con j = 1, 2, . . . , 5. Así, se tiene que
P(E1 )P(F |E1 )
P(E1 |F ) = P5
i=1 P(Ei )P(F |Ei )
(0.3)(0.04)
=
(0.3)(0.04) + (0.2)(0.03) + (0.15)(0.05) + (0.15)(0.01) + (0.2)(0.07)
= 0.2926829.
De forma similar se obtienen las demás probabilidades, de forma que:
P(E2 |F ) = 0.14634, P(E3 |F ) = 0.18292, P(E4 |F ) = 0.03658 y P(E5 |F ) = 0.34146.
Luego, lo más probable es que la tortuga provenga del quinto estanque.
7.12. Independencia estadística de eventos
De acuerdo con el teorema 7.9.1, es posible expresar la probabilidad conjunta de dos eventos de
probabilidad no nula como el producto entre la probabilidad de uno de ellos y la probabilidad del otro
sabiendo que ha ocurrido el primero. Si entre dos sucesos no existe ninguna relación cabe esperar que
la expresión sabiendo que no aporte ninguna información.
Denición 7.12.1. Dos eventos aleatoriosA y B incluidos en un espacio

muestral Ω no vacío se llaman independientes si y solo si P(A|B) =
P(A). Los eventos A y B se llaman dependientes en cualquier otro caso.
Nota. A partir de la denición 7.12.1 se observa que el evento A es independiente del evento B si la
probabilidad de A no se ve modicada por la ocurrencia o no ocurrencia de B.
Ejemplo 7.12.1. Se extrae una carta de una baraja de naipe inglés y luego se devuelve. ¾Son inde-
pendientes los eventos la carta es As (A) y la carta es trébol (B )?
Solución:
Como
4 1
P(A) = =
52 13
y
1
P(A ∩ B) 52 1
P(A|B) = = 13 = .
P(B) 52
13
entonces los eventos A y B son independientes.
Las siguientes son consecuencias de la denición 7.12.1:
Proposición 7.12.1. Si los eventos A y B incluidos en un espacio muestral Ω son independientes

entonces son equivalentes las siguientes expresiones:
i. P(B|A) = P(B).
ii. P(A ∩ B) = P(A)P(B).
iii. AC y B son eventos independientes.
iv. A y BC son eventos independientes.
v. AC y BC son eventos independientes.
Ejemplo 7.12.2. Dado que en el ejemplo 7.12.1 se obtuvo que los eventos A y B son independientes
C
entonces en virtud de la proposición 7.12.1 se tiene que la carta no es As (A ) y la carta es
trébol (B ) son eventos independientes, la carta es As (A) y la carta no es trébol (B ) son eventos
C C
independientes y la carta no es As (A ) y la carta no es trébol (B ) son eventos independientes.
Además, se satisface que P(B) = P(B|A) y que P(A ∩ B) = P(A)P(B).
Ejemplo 7.12.3. Un hospital tiene dos ambulancias que trabajan de forma independiente. La pro-
babilidad de que una ambulancia especíca esté disponible cuando se le necesite es 0.94. ¾Cuál es la
probabilidad de que ninguna esté disponible cuando se les necesite? ¾Cuál es la probabilidad de que
por lo menos una ambulancia esté disponible cuando se le necesite?
Solución:
Se dene el evento A como la ambulancia 1 trabaja correctamente y el evento B como la ambulancia
2 trabaja correctamente. Así, el evento ninguna de las dos ambulancias están disponibles está dado
por AC ∩ B C , de tal forma que
P AC ∩ B C = P AC P B C = (1 − 0.94)(1 − 0.94) = (0.06)2 = 0.0036.

A∪B
De otro lado, el evento por lo menos una ambulancia está disponible está dado por y además
P(A ∪ B) = 1 − P (A ∪ B)C = 1 − P AC ∩ B C = 1 − 0.0036 = 0.9964. %

Por lo tanto, la probabilidad de que ninguna esté disponible cuando se les necesite es 0.0036 y la
probabilidad de que por lo menos una ambulancia esté disponible cuando se le necesite es 0.9964.
Ejemplo 7.12.4. En una empresa nanciera un par de empleados discutían sobre los méritos que
se deben realizar para obtener un ascenso. Uno de ellos armaba que había que tener un trabajo
sobresaliente para que lo ascendieran mientras que el otro argumentaba que solo era necesario ser
condescendiente con su jefe para lograr el ascenso y que por tal motivo él no lo había logrado. ¾A
cuál de los empleados se le daría la razón teniendo en cuenta la información de la tabla 7.2?
Solución:
Como la discusión entre los empleados se puede resolver estableciendo si un empleado es ascendido
(A) es independiente de un empleado tiene un trabajo sobresaliente (S ) o de un empleado es
condescendiente con su jefe (C ), entonces para los empleados que tienen un trabajo sobresaliente
10 15 5
P(S)P(A) = 6= P(A ∩ D) =
40 40 40
y en consecuencia ser ascendido no es independiente de ser un trabajador sobresaliente; mientras que
para los empleados que son condescendientes
30 15 10
P(C)P(A) = 6= P(A ∩ C) =
40 40 40
y por lo tanto ser condescendiente no es independiente de ser ascendido. Entonces el primer empleado
es quien tiene la razón.
Sobresaliente Condescendiente Total

Mantiene 5 20 25
Ascenso 5 10 15
Total 10 30 40
Tabla 7.2: Datos asociados con la clasicación con respecto al asenso y al modo de trabado de un grupo de empleados
de una empresa.
7.13. Comentarios
Uno de los conceptos más importantes en la estadística es la probabilidad, que a su vez se fundamenta
en la teoría de conjuntos, aquella que permite el estudio de un todo (abstracto) por medio de sus
partes y sus elementos. Una vez se avanza en esta teoría, es posible construir sobre ésta una medida
de incertidumbre respecto al chance de ocurrencia de un evento o suceso, denominada probabilidad.
Para la asignación de probabilidades se presentan algunos procedimientos, desde el método subjeti-

vo, que consiste en una asignación personal de la posible ocurrencia de un suceso, hasta el método
frecuentista, donde se calculan las probabilidades respectivas con base en la frecuencia relativa de su
ocurrencia en una serie de repeticiones de un experimento. El lector no debe subestimar la construc-
ción teórica de la probabilidad, ya que una vez se interiorizan los conceptos relacionados, trasladarlos
a cualquier caso aplicado es muy útil, posible y no muy complejo.
Además, en este capítulo se muestran algunas de las reglas más usuales para el cálculo de probabilida-
des como el teorema de la probabilidad total y el teorema de Bayes. Por último, se presentan algunas
aplicaciones de la probabilidad cuando dos eventos se relacionan entre sí y cuando son independientes.
7.14. Ejercicios
7.1 Una entidad educativa ha propuesto tres proyectos para la mejora de la educación en cierta región
del país. Parai = 1, 2, 3, se dene Ai como el evento que representa el proyecto i fue aceptado.
Se sabe que P(A1 ) = 0.30, P(A2 ) = 0.22, P(A3 ) = 0.35, P(A1 ∩ A2 ) = 0.08, P(A1 ∩ A3 ) = 0.09,
P(A2 ∩ A3 ) = 0.06, P(A1 ∩ A2 ∩ A3 ) = 0.02. Expresar verbalmente y determinar la probabilidad
de que ocurra cada uno de los siguientes eventos:
a. A1 ∪ A2 .
b. AC C
1 ∩ A2 .
c. A1 ∪ A2 ∪ A3 .
d. AC C C
1 ∩ A2 ∩ A3 .
e. AC C
1 ∩ A2 ∩ A3 .

f. AC C
1 ∩ A2 ∪ A3 .
7.2 La tabla que se muestra a continuación muestra la proporción de adultos de áreas no metropoli-
tanas, clasicados como lectores o no lectores de un periódico y si votaron o no en las elecciones
pasadas.
Votaron Lectores No lectores

Sí 0.63 0.13
No 0.14 0.10
a. Calcular la probabilidad de que un individuo escogido al azar:
1. Ejerza su derecho al voto.
2. Lea el periódico.
3. Ejerza su derecho al voto y lea el periódico.
4. Ejerza su derecho al voto o lea el periódico.

7.14. EJERCICIOS 179
5. Lea el periódico pero no ejerza su derecho al voto.
6. No ejerza su derecho al voto y no lea el periódico.
7. No ejerza su derecho al voto si este era uno de los lectores.
b. ¾Cuáles eventos son independientes? ¾Por qué?
c. ¾Cuáles eventos son excluyentes? ¾Por qué?
7.3 Se selecciona una muestra de 570 encuestados en una ciudad para obtener información acerca del
comportamiento de los consumidores frecuentes de prendas de vestir. Entre las preguntas estaba:
¾Disfruta usted comprando ropa? De 270 hombres, 165 respondieron que sí, y de 300 mujeres, 224
también respondieron armativamente.
a. Si el participante elegido es mujer, ¾cuál es la probabilidad de que no disfrute comprando ropa?
b. Si el participante elegido disfruta comprando la ropa, ¾cuál es la probabilidad de que sea

hombre?
7.4 Sea Ω = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} el espacio muestral correspondiente a un experimento aleatorio

dado y
A = {0, 1, 2, 3}, B = {4, 5, 6, 7}, C = {2, 4, 6} y D = {1, 8, 9}.
eventos incluidos en Ω. Listar los elementos de los conjuntos que corresponden a los siguientes
eventos:
a. (AC ∪ D)C .
b. B ∩ CC .
c. (DC ∩ A)C ∪ C .
d. (ΩC ∩ B)C .
e. B ∩ C ∩ DC .
7.5 Señalar la región del diagrama de Venn que representa cada uno de los siguientes eventos:
C
a. AC ∩ B ∩ C C .
C
b. AC ∩ B C − C C .
c. ((A ∪ B)C ∩ C)C .
d. A − (B ∩ C)C .
e. (A ∪ B ∪ C)C .
7.6 Los estudiantes de un curso de estadística se clasican como estudiantes de administración, eco-
nomía o ingeniería; como repitente o no repitente y también como hombre o mujer. Encuentre el
número total de clasicaciones posibles para los estudiantes de este curso.
7.7 Siete personas se quieren organizar en una la.
a. ¾De cuántas maneras diferentes pueden hacerlo?
b. ¾De cuántas maneras diferentes pueden hacerlo si una de ellas no debe estar al comienzo de la
la?
7.8 ¾De cuántas maneras se pueden sentar seis magistrados en una mesa redonda si:
a. no hay ninguna restricción?
b. hay dos en especial que deben estar juntos?
c. hay dos en especial que no deben estar juntos?
7.9 Una caja contiene siete chas rojas, seis blancas y cuatro azules. ¾Cuántas selecciones de tres
chas se pueden formar si:
a. las tres deben ser rojas?
b. ninguna puede ser blanca?
c. las tres deben ser del mismo color?
d. las tres son de colores diferentes?
7.10 Un director de personal tiene ocho candidatos para cubrir cuatro puestos. De éstos, cinco son
hombres y tres mujeres. Si, de hecho, toda combinación de candidatos tiene la misma probabilidad
de ser elegido que cualquier otra, ¾cuál es la probabilidad de que ninguna mujer sea contratada?
7.11 En una bodega, una caja contiene ocho clavos de 1 pulgada, seis de 1 pulgada y media y cinco de
2 pulgadas. Suponga que se seleccionan cuatro clavos al azar, sin reemplazo y sin orden. ¾Cuál es
la probabilidad de que
a. exactamente tres de los clavos seleccionados sean de 2 pulgadas?
b. los cuatro clavos seleccionados sean del mismo tamaño?
c. entre los clavos seleccionados hallan dos de una pulgada?
7.12 ¾Cuántos números de tres cifras se pueden formar con los dígitos 0, 1, 2, 3, 4, 5 y 6 si pueden
haber repeticiones? ¾Cuántos son pares? ¾Cuántos son mayores que 330?
7.13 Un comité de doce personas será elegido entre diez hombres y diez mujeres. ¾De cuántas formas
se puede hacer la selección si:
a. no hay restricciones?
b. debe de haber seis hombres y seis mujeres?
c. debe de haber un número par de mujeres?
d. debe de haber más mujeres que hombres?
e. debe de haber al menos ocho hombres?
7.14 ¾De cuántas formas diferentes pueden contestarse nueve preguntas de verdadero o falso?
7.15 Un estudiante debe responder siete de diez preguntas de un examen. ¾De cuántas formas puede
hacer su selección si
a. no hay restricciones?
b. debe contestar las dos primeras preguntas?
c. debe contestar al menos cuatro de las primeras seis preguntas?

7.16 ¾De cuántas formas es posible distribuir 12 libros diferentes entre cuatro niños de modo que
a. cada niño reciba tres libros?
b. los dos niños mayores reciban cuatro libros cada uno y los dos menores reciban dos libros cada
uno?
7.17 Demostrar que Pnn = n! donde n es un número entero positivo.
7.18 Demostrar el teorema 7.9.1.
7.19 Demostrar la proposición 7.8.1.
7.20 Calcular P(A ∪ B|C) con la información del ejemplo 7.8.2 utilizando la denición de probabilidad
condicional y la información de la gura 7.1.
7.21 Se ha realizado un estudio para un hipermercado donde se clasican los clientes en aquellos
que visitan el establecimiento de una manera frecuente u ocasional y en aquellos que adquieren
regularmente, ocasionalmente o nunca productos alimenticios. La siguiente tabla presenta las
proporciones correspondientes:
Regular Ocasional Nunca

Visita frecuente 0.19 0.08 0.12
Visita ocasional 0.06 0.07 0.48
a. ¾Cuál es la probabilidad de que un cliente no sea cliente frecuente?
b. ¾Cuál es la probabilidad de que un cliente frecuente adquiera regularmente productos alimen-

ticios?
c. ¾Son independientes los sucesos nunca compra productos alimenticios y visita el hipermer-
cado frecuentemente?
d. ¾Los eventos clientes no ocasionales, clientes que no compran regularmente productos alimen-
ticios y clientes frecuentes y que compran regularmente productos alimenticios conforman
una partición del espacio muestral? ¾Por qué?
7.22 De un estudio realizado en una universidad, se sabe que el 35 % de los estudiantes hacen deporte
por lo menos una vez a la semana y que el 40 % de los estudiantes tienen una nota media superior
a 4.0. Además, el 30 % de los que hacen deporte por lo menos una vez a la semana tienen una
nota media superior a 4.0.
a. ¾Cuál es la probabilidad de que un estudiante elegido al azar haga deporte por lo menos una
vez a la semana y tenga una nota media superior a 4.0?
b. ¾Cuál es la probabilidad de que un estudiante elegido al azar, que tiene una nota media superior
a 4.0, haga deporte por lo menos una vez a la semana?
c. ¾Cuál es la probabilidad de que un estudiante elegido al azar haga deporte por lo menos una
vez a la semana o tenga una nota media superior a 4.0?
d. ¾Cuál es la probabilidad de que un estudiante elegido al azar, que no tiene una nota media
superior a 4.0, no haga deporte por lo menos una vez a la semana?
e. ¾Son independientes los eventos hace deporte por lo menos una vez a la semana y tiene una
nota media superior a 4.0? ¾Son mutuamente excluyentes?
7.23 Un analista de bolsa examina las perspectivas de las acciones de un gran número de compañías.
Cuando se investigó el comportamiento de estas acciones un año antes, se descubrió que el 15 %
experimentaron un crecimiento superior al de la media, el 40 % inferior y el 45 % restante se
mantuvieron alrededor de la media. El 30 % de los valores que crecieron por encima de la media
fueron clasicados como buenas adquisiciones por el analista, al igual que el 15 % de las que
crecieron alrededor de la media y el 20 % de las que tuvieron un crecimiento inferior. ¾Cuál es la
probabilidad de que un valor clasicado como buena adquisición por el analista crezca por encima
de la media del mercado?
7.24 Ejercicio tomado de Blanco (2004, p. 42). Se tiene una población que se desarrolla de la siguiente
manera: una partícula inicial, que constituye la 0-ésima generación, tiene 0, 1 o 2 hijas con pro-
babilidades 1/6, 2/3 y 1/6 respectivamente. Luego de reproducirse la partícula muere. Las hijas
se reproducen independientemente unas de otras e independientemente de la historia familiar, de
la misma manera que la partícula original. La primera generación está compuesta por las hijas
de la partícula inicial, la segunda por las nietas y así sucesivamente. Dado que en la segunda
generación hay una partícula, ¾a qué es igual la probabilidad de que en la primera haya habido
dos partículas? ¾Cuál es la probabilidad de que en la segunda generación haya por lo menos una
partícula?
7.25 Los clientes acostumbran evaluar en forma preliminar el diseño de los productos. En el pasado,
95 % de los productos de gran éxito recibieron críticas favorables, 60 % de los productos con un
éxito moderado recibieron críticas favorables y 10 % de los productos sin mucho éxito recibieron
críticas favorables. Además, 40 % de los productos han sido de gran éxito, 35 % han sido de éxito
moderado y 25 % han sido productos sin mucho éxito.
a. ¾Cuál es la probabilidad de que un producto obtenga una crítica favorable?
b. Si un producto nuevo obtiene una crítica favorable, ¾cuál es la probabilidad de que será un
producto de gran éxito?
c. Si un producto no consigue una crítica favorable, ¾cuál es la probabilidad de que sea un producto
de gran éxito?
7.26 Ejercicio tomado de Blanco (2004, p. 43). La probabilidad de que en un parto gemelar ambos
bebés sean de género masculino es de 0.32, en tanto que la probabilidad de que sean ambos de
género femenino es de 0.28. ¾A qué es igual la probabilidad de que en un parto gemelar, el segundo
niño en nacer sea de género masculino dado que el primero en nacer es de género masculino? Se
supone que es tan probable que el primer niño en nacer sea de género femenino como de género
masculino.
7.27 Una empresa de venta por correos considera tres posibles errores al enviarse un pedido: el artículo
enviado no es el solicitado (A), el artículo se extravía (B ) y el artículo sufre desperfectos en el
transporte (C ). Se sabe que el suceso
A es independiente de los sucesos B y C y que los sucesos B
y C son mutuamente excluyentes. Las probabilidades de los sucesos son P(A) = 3 %, P(B) = 2 %
y P(C) = 5 %. Para un pedido escogido al azar, calcular la probabilidad de que por lo menos uno
de estos errores ocurra.
7.28 Una editorial quiere decidir si va a publicar un libro de estadística para administración. El análisis
de los libros que se publicaron anteriormente indica que 10 % fueron grandes éxitos, 20 % tuvieron
éxito modesto, 40 % lograron recuperar los gastos de inversión y 30 % fueron un fracaso. Sin em-
bargo, antes de tomar una decisión, se va a realizar un dictamen del libro. En el pasado, 99 % de
los grandes éxitos obtuvieron dictámenes favorables, 70 % de los éxitos modesto obtuvieron dic-
támenes favorables, 40 % de los títulos que alcanzaron a recuperar gastos de inversión obtuvieron
dictámenes favorables y 20 % de los fracasos fueron sometidos a esta clase de dictámenes. ¾Qué
proporción de libros de texto reciben dictámenes favorables?
7.29 Tres plantas, A, B y C, fabrican el 50 %, 30 % y 20 % de los objetos de una empresa respectiva-

mente. Además, los porcentajes de producción defectuosa de estas plantas en el mismo orden son
del 3 %, 4 % y 5 %.
a. Si se selecciona un objeto al azar, ¾qué probabilidad tiene de salir defectuoso?
b. Si un objeto resulta ser defectuoso, ¾cuál es la probabilidad de que se haya producido en la

planta A? ¾Y en la planta B? ¾Y en la planta C?
7.30 Sean AyB dos sucesos tales que la probabilidad de B es el doble que la de A; que la probabilidad
de su unión es el doble que la de su intersección; y que la probabilidad de su intersección es de
0.1. Se pide calcular la probabilidad de A. ¾Qué suceso es más probable que ocurra sabiendo que
ya ha ocurrido el otro?
7.31 Una empresa que debe decidir si adquiere un determinado paquete de acciones, solicita un informe
a tres asesores nancieros para que se pronuncien de forma favorable o desfavorable a la compra.
Por experiencias anteriores en operaciones similares, se sabe que los tres asesores tienen actitudes
ante el riesgo diferente e independiente. Esta situación se reeja en las probabilidades de aconsejar
la compra de este tipo de operaciones que son respectivamente 0.8, 0.5 y 0.3. Con esta información
se pide calcular la probabilidad de que
a. al menos uno de ellos aconseje la compra.
b. ninguno de ellos aconseje adquirir el paquete de acciones.
7.32 Una empresa de trabajo temporal ha realizado un amplio estudio sobre los tipos de empleo solici-
tados por los estudiantes de bachillerato, de formación técnica y universitarios. El informe clasica
estos solicitantes de empleo como calicados o no para los trabajos que solicitan, y de los datos
se desprende que solo el 25 % estaban calicados para el trabajo que solicitaban, de los cuales, un
20 % eran estudiantes universitarios, un 30 % tenían formación técnica y un 50 % eran bachilleres.
La situación entre los no calicados es diferente: un 40 % de ellos era estudiante universitario, otro
40 % estudiaban técnica y solo un 20 % se encontraba en bachillerato.
a. ¾Qué porcentaje de estos estudiantes se encontraban en bachillerato y estaban calicados para

los empleos que solicitaban?
b. ¾Cuál es la probabilidad de que uno de estos estudiantes que solicitaba empleo estudiara for-
mación técnica?
c. Entre los estudiantes universitarios que solicitaron empleo, ¾qué porcentaje no estaba calicado
para los puestos de trabajo que solicitaban?
7.33 Sean A y B dos eventos independientes tales que P(A) = P(B) = 0.05. Calcular:
a. P(A ∩ B).
b. P(A ∪ B).

c. P AC ∩ B C .

d. P AC ∪ B C
.
e. P(A|B).

f. P AC |B C .
7.34 Sean A1 , A2 , A3 y A4 eventos aleatorios incluidos en un espacio muestral Ω no vacío. Obtener

una fórmula general para calcular P(A1 ∪ A2 ∪ A3 ∪ A4 ).
Capı́tulo 8
Variables aleatorias
8.1. Introducción
Para el desarrollo de técnicas estadísticas más avanzadas, es conveniente relacionar directamente los
resultados de un experimento aleatorio con números reales, ya que con tal asociación el análisis de las
características de interés es más profundo y productivo.
Las variables aleatorias y sus distribuciones de probabilidad se pueden considerar como una generali-
zación del concepto frecuentista de probabilidad. Se introducen como el modelo matemático ideal al
que se aproximan las distribuciones de frecuencias que se obtendrían como resultado de una repetición
indenida de ensayos de un experimento aleatorio.
Las variables aleatorias se clasican de acuerdo a la numerabilidad de los valores que pueden asumir.
Se estudian las variables aleatorias discretas, que solo pueden adoptar un número nito o una innidad
enumerable de valores, y las variables aleatorias continuas, que surgen cuando se investigan variables
cuyos valores están asociados con una escala continua de medición.
Normalmente, los posibles resultados de un experimento aleatorio (Ω) no son valores numéricos. Por
ejemplo, considere el experimento aleatorio que consiste en lanzar de forma ordenada tres monedas al
aire, con el propósito de estudiar el número de caras (c) y sellos (s) que se obtienen. De esta forma,
el espacio muestral asociado a este experimento es:
Ω = {(c, c, c), (c, c, s), (c, s, c), (c, s, s), (s, c, c), (s, c, s), (s, s, c), (s, s, s)}.
Puede resultar más sencillo utilizar valores numéricos en lugar de trabajar directamente con los ele-
mentos de un espacio muestral como el anterior. Así, es preferible identicar los puntos muestrales
185
186 CAPÍTULO 8. VARIABLES ALEATORIAS
{(c, s, s), (s, c, s), (s, s, c)} con el valor numérico 1, pues éste representa el número de caras obtenidas
cuando se ejecuta el experimento.
Denición 8.1.1. Una v.a. X (abreviado con v.a. X) es una regla o

función que asigna un único número real a cada resultado del espacio
muestral Ω de un experimento aleatorio dado. En símbolos, una v.a. X
es una función de la forma
X : Ω −→ R : ω 7−→ X(ω)
donde R el conjunto de los números reales.
Nota. Las v.a.'s se simbolizan, generalmente, con las letras mayúsculas X, Y y Z. Se utiliza su
correspondiente letra minúscula (x, y, z en este caso) para designar sus posibles valores. Así, por
ejemplo, si X representa la v.a. número de caras obtenido que pueden resultar al lanzar una moneda
tres veces consecutivas, entonces, sus valores son x = 0, 1, 2, 3.
Nota. Como se presenta en Resnick (1998, p. 74) y Gut (2005, p. 25), en la denición formal de una
v.a. se habla de funciones medibles . Este concepto no se presenta en este libro ya que hace parte de
tópicos más avanzados fuera de su alcance.
Ejemplo 8.1.1. Teniendo en cuenta el experimento aleatorio que consiste en lanzar de modo ordenado
tres monedas al aire, se dene la v. a. X como el número de caras obtenido al nal de los tres
lanzamientos. Se obtiene que la v.a. X es una función del espacio muestral
Ω = {(c, c, c), (c, c, s), (c, s, c), (c, s, s), (s, c, c), (s, c, s), (s, s, c), (s, s, s)}
con valores en el subconjunto de números reales {0, 1, 2, 3}. Estos valores se obtienen evaluando X
en cada uno de los puntos muestrales como sigue: X((c, c, c)) = 3, X((c, c, s)) = 2, X((c, s, c)) = 2,
X((s, c, c)) = 2, X((s, s, c)) = 1, X((s, c, s)) = 1, X((c, s, s)) = 1 y X((s, s, s)) = 0.
Anteriormente se ha hecho la distinción entre dos tipos datos numéricos: los discretos y los continuos;
esta misma distinción también se hace con las v.a.'s. Así, en función de los valores que tome la variable,
ésta se puede clasicar como discreta o continua del siguiente modo:
Denición 8.1.2. Una v.a. discreta (abreviado con v.a.d.) es aquella

v.a. que solo puede tomar un número nito o innito numerable de valo-
res. De otra parte, una v.a. continua (abreviado con v.a.c.) es aquella
v.a. que siempre puede tomar un valor intermedio entre cualquier par de
valores dados de la variable.
Nota. De la denición 8.1.2 se sigue que el conjunto de valores de una v.a.c. es un conjunto innito
no numerable.
8.1. INTRODUCCIÓN 187
Denición 8.1.3. Sea X una v.a. bien sea discreta o continua. Se dene
el rango de X , denotado con RX , como el conjunto de todos los posibles
valores que puede asumir X. Esto es:
RX = {x ∈ R : x = X(w) para algún w ∈ Ω}
donde Ω es el espacio muestral dominio de la v.a. X.
a. Algunos estudiantes de ingeniería ambiental están interesados en conocer la anidad que tienen
las personas hacia la ora y fauna que se encuentra dentro y a los alrededores de la ciudad. Para
esto realizaron una muestra piloto con un cuestionario en el cual se preguntaba: ¾le molestaría
tener que clasicar las basuras de su casa?. Registrando la información en una base de datos,
los estudiantes solo guardan los números del 10 al 13, haciendo alusión a las respuestas mucho,
poco, nada y me es indiferente respectivamente.
b. Una empresa minera está empleando una máquina que permite conocer la densidad del suelo (en
kg/m3 ) a un kilómetro de profundidad. Con esta información, algunos especialistas establecen una
medida continua de riesgo que se encuentra entre 0 (riesgo nulo) y 10 (riesgo total), la cual emplean
para decidir si es segura la extracción del material.
En cada caso, ¾cuál es el experimento aleatorio y cómo está denida la v.a. X de interés?
Solución:
En el primer escenario, el experimento es la respuesta a la pregunta ¾le molestaría tener que clasicar
las basuras en su casa?; por consiguiente el espacio muestral es
Ω = {mucho, poco, nada, me es indiferente},
y la v.a. X se dene como
X(mucho) = 10, X(poco) = 11, X(nada) = 12 y X(me es indiferente) = 12.
En el segundo caso, el experimento aleatorio es el valor de la densidad en un punto geográco, por lo

que el espacio muestral está dado por el conjunto de todas las posibles densidades δ , es decir R+ , y la
v.a. de interés se dene como X(δ) = Riesgo asociado a la densidad δ , donde X(δ) es un valor que
se encuentra entre 0 y 10.
Nota. En el segundo escenario del ejemplo 8.1.2 también se puede denir otra v.a. dada por X(δ) = δ .
En este caso no se utiliza esta variable porque no está asociada directamente con la medida de riesgo
de interés.
En las secciones siguientes se estudian los conceptos más importantes relacionados con las v.a.'s,
diferenciando entre v.a.d.'s y v.a.c.'s.
8.2. Variables aleatorias discretas
Para una v.a.d. X, la probabilidad de que X tome cualquiera de sus valores, se modela a través de
una función denominada función másica de probabilidad (o simplemente función de probabilidad o de
masa). Esta función establece la probabilidad de cada valor que toma la v.a. X.
Denición 8.2.1. Sea X una v.a.d. que toma los valores x1 , x2 , . . .

(nitos o innitos enumerables). Una función fX : R −→ [0, 1] es una
función másica de probabilidad (abreviado con f.m.p.) de X si y
solo si (
P(X = x), si x = x1 , x2 , . . .;
fX (x) =
0, en otro caso.
donde X = x es el evento constituido por todos los elementos en el

espacio muestral cuyo valor a través de X es igual a x, es decir:
X = x = {w ∈ Ω : X(w) = x}.
Nota. Si x no es uno de los valores que toma la v.a. X entonces fX (x) = 0. Así, la representación gráca
de la función de probabilidad se realiza mediante un diagrama de barras análogo al de distribución de
frecuencias relativas para variables discretas (detalles en la sección 2.3.2).
Figura 8.1: Gráco de la f.m.p. (a) y de la f.d.a. (b) de la variable del ejemplo 8.1.1.
8.2. VARIABLES ALEATORIAS DISCRETAS 189
Ejemplo 8.2.1. Continuando con el ejemplo 8.1.1 se tiene que la f.m.p. de la variable número de
caras abstenido es:
1
fX (0) = P(X = 0) = P((s, s, s)) = = 0.125,
8
3
fX (1) = P(X = 1) = P({(c, s, s), (s, c, s), (s, s, c)}) = = 0.375,
8
3
fX (2) = P(X = 2) = P({(s, c, c), (c, c, s), (c, s, c)}) = = 0.375, y
8
1
fX (3) = P(X = 3) = P((c, c, c)) = = 0.125.
8
Concretamente, esta función está dada por:


0.125,
 si x = 0, 3;
fX (x) = 0.375, si x = 1, 2;

0, en otro caso.

Además, se observa que:
i. fX (0) = 0.125 > 0, fX (1) = 0.375 > 0, fX (2) = 0.375 > 0 y fX (3) = 0.125 > 0, y que
P4
ii. k=1 fX (xk ) = fX (0) + fX (1) + fX (2) + fX (3) = 0.125 + 0.375 + 0.375 + 0.125 = 1 donde x1 = 0,
x2 = 1, x3 = 2 y x4 = 3.
En la gura 8.1 se presenta el gráco de la f.m.p de la variable X.

Proposición 8.2.1. Sea fX una f.m.p. de una v.a.d. X que asume los valores x1 , x2 , . . . denida
sobre un espacio muestral Ω no vacío. Entonces se satisface que:
i. f (xk ) > 0 para todo valor xk de X.

P
ii. k f (xk ) = 1.
Demostración:
i. Como toda medida de probabilidad es mayor o igual a 0, se sigue que P(X = x) ≥ 0 y por lo
tanto fX (x) ≥ 0 para todo x ∈ R.
ii. Sea RX el rango de X, es decir, RX = {x ∈ R : x = X(w) para algún w ∈ Ω} = {x1 , x2 , . . .}. En
consecuencia, se tiene que
X X
f (xk ) = P(X = xk )
k k
X
= P({w ∈ Ω : X(w) = xk })
k
!
[
=P {w ∈ Ω : X(w) = xk }
k
= P({w ∈ Ω : X(w) = xk para algún xk ∈ RX })
= P(Ω)
= 1.
Ejemplo 8.2.2. Un laboratorio debe sostenerse a través de los servicios que ofrece a la comunidad.
La cantidad de servicios que presta mensualmente sin tener ninguna ganancia es a lo más siete. Se ha
visto que en un mes se pueden ofrecer hasta 15 servicios en las siguientes proporciones 0 %, 1 %, 3 %,
2 %, 3 %, 5 %, 6 %, 7 %, 6 %, 9 %, 10 %, 20 %, 25 %, 1 %, 1 % y 1 %. El laboratorio quiere determinar
la probabilidad de que, en un mes, no logre sostenerse.
Solución:
Estas proporciones son las probabilidades de que la variable X =cantidad de servicios ofrecidos en el
mes asuma los valores 0, 1, 2, . . . , 15. X asuma del 0 al 7. Esto es:
Se pide la probabilidad de que la
7
X
P(X ≤ 7) = P(X = i)
i=0
= P(X = 0) + P(X = 1) + P(X = 2) + . . . + P(X = 7)
= 0 + 0.01 + 0.03 + 0.02 + 0.03 + 0.05 + 0.06 + 0.07
= 0.27.
Luego, la probabilidad de que en un mes dado el laboratorio no logre sostenerse es de 0.27, por lo que
tendrá que acudir a otras fuentes de nanciación con una probabilidad relativamente alta.
Como en el ejemplo 8.2.2, es natural que en la práctica interese la probabilidad de que una v.a.d. tome
algún valor menor o igual a un límite establecido de antemano, ya que hay varios eventos importantes
cuya probabilidad se calcula de esta manera. Por tal motivo es útil denir una función que de cuenta
de esta probabilidad acumulada. Esta función se denomina función de distribución acumulada (o
simplemente función de distribución) y se dene como sigue:
Denición 8.2.2. Sea X una v.a.d. que sume los valores x1 , x2 , . . . (ni-
tos o innitos enumerables). La función de distribución acumulada
(abreviado con f.d.a.) de X es la función FX : R −→ [0, 1] denida por
FX (x) = P(X ≤ x)
para cualquier número real x.
Nota. Si la v.a.d X tiene f.m.p. fX entonces
X
FX (x) = fX (t)
t≤x
donde la suma de la fórmula anterior recorre todos los valores de X que son menores o iguales a t.
También se observa que la f.d.a. está denida para cualquier número real.
Ejemplo 8.2.3. Volviendo al ejemplo 8.1.1, se tiene que la f.d.a. evaluada en los valores que asume
X es:
1
FX (0) = P(X ≤ 0) = fX (0) = = 0.125,
8
1 3 4 1
FX (1) = P(X ≤ 1) = fX (0) + fX (1) = + = = = 0.5,
8 8 8 2
1 3 3 7
FX (2) = P(X ≤ 2) = fX (0) + fX (1) + fX (2) = + + = = 0.875, y
8 8 8 8
1 3 3 1 8
FX (3) = P(X ≤ 3) = fX (0) + fX (1) + fX (2) + fX (3) = + + + = = 1.
8 8 8 8 8
Concretamente, la f.d.a correspondiente a la v.a.d X está dada por:


 0, si x < 0;
 1
8, si 0 ≤ x < 1;



4
FX (x) = 8, si 1 ≤ x < 2;

7,

si 2 ≤ x < 3;
8


1, 3 ≤ x.

si
Además, se observa que:
i. Por ejemplo, si x = 2.7 entonces
X
FX (2.7) = fX (t) = fX (0) + fX (1) + fX (2) = 0.875.
t≤2.7
ii. Si x≤0 entonces FX (x) = 0; y si x≥3 entonces FX (x) = 1.
En la gura 8.1 se presenta el gráco de la f.m.p de la variable X.
Proposición 8.2.2. Sea FX una f.d.a. de una v.a.d. X denida sobre un espacio muestral Ω no
vacío. Entonces se satisface que:
i. Si x es un número real entonces 0 ≤ FX (x) ≤ 1.
ii. Si x es un número real entonces
P(X > x) = 1 − FX (x) y P(X ≥ x) = 1 − FX (x− ).
donde x− representa el máximo valor que puede asumir X estrictamente menor que x.
iii. Si x es un valor que puede asumir X entonces
fX (x) = FX (x) − FX (x− ).
iv. Si a y b son números reales tales que a≤b entonces FX (a) ≤ FX (b), es decir, FX es una función
creciente; y además se tiene que
P(a ≤ X ≤ b) = FX (b) − FX (a− ) y P(a < X < b) = FX (b− ) − FX (a).
Demostración:
i. Si x es un número real entonces

X
FX (x) = P(X ≤ x) = P(X = xk ).
xk ≤x
P
Como k P(X = xk ) = 1 y además para toda xk se tiene que P(X = xk ) ≥ 0, entonces
X X
0≤ P(X = xk ) ≤ P(X = xk ) = 1.
xk ≤x k
En consecuencia, se sigue que 0 ≤ FX (x) ≤ 1.
ii. Primero, se observa que
P(X > x) = 1 − P (X > x)C

= 1 − P {w ∈ Ω : X(w) > x}C

= 1 − P ({w ∈ Ω : X(w) ≤ x})

= 1 − P(X ≤ x)
= 1 − FX (x).
De manera similar, se tiene que
P(X ≥ x) = 1 − P (X ≥ x)C

= 1 − P {w ∈ Ω : X(w) ≥ x}C

= 1 − P ({w ∈ Ω : X(w) < x})

= 1 − P {w ∈ Ω : X(w) ≤ x− }

= 1 − P(X ≤ x− )
= 1 − FX (x− )
donde x− representa el máximo valor que puede asumir X estrictamente menor que x.
iii. Si xk es un valor que asume X entonces x−

k = xk−1 donde k es un número entero tal que k > 1.
Por lo tanto, se sigue que
fX (xk ) = P(X = xk )
k
X k−1
X
= P(X = xi ) − P(X = xi )
i=1 i=1
= P(X ≤ xk ) − P(X ≤ xk−1 )
= FX (xk ) − FX (xk−1 )
= F (xk ) − F (x−
k ).
Trivialmente, si k=1 se obtiene que
fX (x1 ) = P(X = x1 ) = P(X ≤ x1 ) − 0 = FX (x1 ) − FX (x−

1 ).
iv. Si a y b son números reales tales que a≤b entonces FX (a) = P(X ≤ a) ≤ P(X ≤ b) =≤ FX (b),
es decir, FX es una función no decreciente. Ahora, si xq es el mayor valor que asume X tal que
xq ≤ b entonces FX (xq ) = FX (b), en efecto:
FX (xq ) = P(X ≤ xq ) = P(X ≤ xq ) + 0 = P(X ≤ xq ) + P(xq < X ≤ b) = P(X ≤ b) = FX (b).
Sea xl = a− tal que l ≤ q donde x− el máximo valor que puede asumir X estrictamente menor
que x. Así, se observa que
X
P(a ≤ X ≤ b) = P(X = xk )
xk :a≤xk ≤b
X q
= P(X = xk )
k=l+1
q
X l
X
= P(X = xk ) − P(X = xk )
k=1 k=1
= FX (xq ) − FX (xl )
= FX (b) − FX (a− ).
Además, dado que b− = xq−1 se tiene que
P(a < X < b) = P(a ≤ X ≤ b) − P(X = a) − P(X = b)

q
X l
X
= P(X = xk ) − P(X = b) − P(X = xk ) − P(X = a)
k=1 k=1
q
! l
!
X X
= P(X = xk ) − P(X = b) − P(X = xk ) + P(X = a)
k=1 k=1
q−1
X l+1
X
= P(X = xk ) − P(X = xk )
k=1 k=1
= FX (xq−1 ) − FX (xl+1 )
= FX (b− ) − FX (a).

Ejemplo 8.2.4. Continuando con el ejemplo 8.2.2, el laboratorio quiere determinar:
a. ¾Cuál es la probabilidad de que en un mes se tengan por lo menos la cantidad de servicios sucientes
para el sostenimiento del laboratorio?
b. Como en muchos meses han tenido que prestar un gran número de servicios, ¾cuál es la probabilidad
de que no presten menos de 13 servicios en un mes?
c. Si mensualmente se quieren tener entre 8 y 12 servicios prestados inclusive, ¾cuál es la probabilidad

asociada con este requerimiento?
Solución:
a. La probabilidad de que al mes se presten de 8 servicios en adelante es
P(X ≥ 8) = 1 − FX (7) = 1 − 0.27 = 0.73.
b. La probabilidad de que el laboratorio no preste menos de 13 servicios está dada por:
P (X < 13)C = P(X ≥ 13)

= 1 − F (12)
= 1 − 0.97
= 0.03.
c. Por último, para determinar la probabilidad de que se tengan entre 8 y 12 servicios prestados
inclusive, se debe calcular
P(8 ≤ X ≤ 12) = FX (12) − FX (8− )

= FX (12) − FX (7)
= 0.97 − 0.27
= 0.70.
Como con cualquier otra variable, en variadas ocasiones es de interés encontrar un valor que acumule
cierta proporción de la información. En seguida se generaliza el concepto de percentil para v.a.d.'s:
Denición 8.2.3. Sea X una v.a.d. con f.d.a. FX y p un número real tal
que 0 ≤ p ≤ 100. El percentil p de la distribución de X , denotado con
πp , es el valor más pequeño de X que satisface la siguiente desigualdad:
p
≤ FX (πp ).
100
Nota. En la denición 8.2.3 se emplea una desigualdad ya que para algunos percentiles no se tiene un
p
valor de la variable tal que
100 = FX (πp ). Por esta razón un solo valor de la variable puede ser a la
vez más de un percentil.
Ejemplo 8.2.5. La junta directiva de un hospital quiere mejorar su atención en el horario nocturno de
los pacientes que necesitan de atención quirúrgica inmediata. Para esto, se quiere analizar la variable
X dada por número de pacientes que requieren de atención quirúrgica inmediata reportados entre las
19:00 y las 5:00. El analista encargado asegura que la f.m.p. de X es
(
7x e−7
fX (x) = x! , si x = 0, 1, 2, . . .;
0, en otro caso.
Se pide:
a. Calcular el valor de µ̃X tal que P(X ≤ µ̃X ) = (X ≥ µ̃X ).
b. Sabiendo que entre las 19:00 y las 5:00 el hospital solo tiene la capacidad de operar en 5 quirófanos,
determinar el porcentaje de jornadas nocturnas en las que se puede atender a todos los pacientes
que lleguen en la noche.
c. Obtener el rango en que se encuentra el número de pacientes que el hospital debe atender en el
50 % de las noches consideradas como más comunes.
d. Gracar la f.d.a. de X.
Solución:
a. El valor µ̃X que se quiere precisar es el percentil 50, es decir, la mediana. Como X es una v.a.d
entonces µ̃X es el valor más pequeño de X que satisface la desigualdad
µ̃X x −7
X 7 e
0.5 ≤ FX (µ̃X ) = .
x=0
x!
Ahora, evaluando en los valores de 0, 1, 2, . . . se tiene que
0.5 > P(X ≤ 0) = 0.0009,

0.5 > P(X ≤ 1) = 0.0072,
0.5 > P(X ≤ 2) = 0.0296,
0.5 > P(X ≤ 3) = 0.0817,
.
.
.
0.5 > P(X ≤ 6) = 0.4497,

0.5 ≤ P(X ≤ 7) = 0.5987.
En consecuencia, se obtiene que µ̃X = 7

b. Para encontrar el porcentaje de noches en las que el hospital puede atender a todos sus pacientes
entre las 19:00 y las 5:00, basta con calcular
5
X 7x e−7
P(X ≤ 5) = = 0.3007,
x=0
x!
y por lo tanto solo en el 30 % de las noches el hospital puede atender a todos los pacientes que
llegan en la jornada nocturna.
c. El rango en que se encuentra el número de pacientes que el hospital debe atender en el 50 % de

las noches consideradas como más comunes, es aquel rango de valores que va desde el percentil 25
(π25 ) al percentil (π75 ) de la variable X. Como antes, estos percentiles se calculan por inspección
de donde π25 = 7 y π75 = 9. Por consiguiente, se tiene que en aproximadamente el 50 % de las
noches consideradas como más comunes el hospital tendrá que atender a un número de pacientes
que oscila entre 7 y 8, aunque de forma exacta este porcentaje corresponde al 52.98 %.
d. Por último, en la gura 8.2 se muestra la gráca de la f.d.a. de la variable X.
8.3. Variables aleatorias continuas
Cuando la variable objeto de estudio es continua, no hace sentido hacer una suma de las probabilidades
de cada uno de los términos en el sentido de las variables discretas, ya que el conjunto de valores
8.3. VARIABLES ALEATORIAS CONTINUAS 197
Figura 8.2: Gráco de la f.d.a. de la variable del ejemplo 8.2.5.
que toma una variable continua es no numerable. En este caso, se generalizan de modo natural los
R P
conceptos, empleando la integral ( ) en lugar de la suma ( ).
La f.m.p. de una v.a.d. esta asociada con la probabilidad de que la variable tome un valor especíco.
Este concepto no es relevante en el caso de una v.a.c., ya que, como se verá más adelante, en este
caso la probabilidad de obtener un valor especíco es exactamente 0. Sin embargo, se puede construir
una función análoga para una variable continua, llamada función de densidad de probabilidad, que
permite investigar detalladamente la estructura probabilística de la variable de interés.
Denición 8.3.1. Una función fX : R −→ [0, ∞) se dice que es una

función de densidad de probabilidad (abreviado con f.d.p.) de una
v.a.c. X si satisface las siguientes condiciones:
i. fX (x) ≥ 0 para todo x ∈ R.
ii. Para cualquier par de números reales a y b tales que a ≤ b, se tiene

que
Z b
P(a ≤ X ≤ b) = fX (x)dx.
a
iii. El área bajo toda la gráca de fX es 1, esto es:
Z +∞
f (x) dx = 1.
−∞
Nota. En algunas ocasiones, la condición ii. de la denición 8.3.1 se reemplaza por

Z xmáx
fX (x)dx = 1
xmı́n
donde xmı́n y xmáx son respectivamente el valor máximo y mínimo de la variable X. En la gura 8.3
se presenta un ejemplo de una gráca de una f.d.p. de una v.a.c. X.
Nota. Una v.a.c. que satisface las condiciones de la denición 8.3.1 también se denomina v.a. abso-
lutamente continua.
Al igual que en el caso discreto, hay situaciones en las cuales se quiere calcular la probabilidad de
que el valor observado de una v.a.c. X sea menor o igual que algún número real dado. Como antes,
escribiendo FX (x) = P(X ≤ x) para cada número real x, se dice que FX es la función de distribución
acumulada (o simplemente función de distribución) de la variable X.
Denición 8.3.2. La función de distribución acumulada de una

v.a.c. X con función de densidad es fX , es la función FX : R −→ [0, 1]
denida por
FX (x) = P(X ≤ x)
para todo número real x.
Nota. Si la v.a.c X tiene f.d.p. fX entonces

Z x
FX (x) = fX (t)dt.
−∞
En algunas ocasiones, la integral de la fórmula anterior se reemplaza por la integral

Z x
FX (x) = fX (t)dt
xmı́n
Figura 8.3: Ejemplo de gráco de una función de densidad de una v.a.c. X.
para los casos en los que el valor mínimo de la variable exista.
La denición 8.3.2 establece que la f.d.a. de la variable X corresponde a la probabilidad de que X

tome un valor en el intervalo (−∞, x]. Esta probabilidad corresponde al área bajo la gráca de la
f.d.p. de X. En la gura 8.4 se presenta un ejemplo de una f.d.a. de una v.a.c. X.
Proposición 8.3.1. Si FX es una f.d.a. de una v.a.c. X entonces se satisfacen las siguientes propie-
dades:
i. Si x es un número real entonces 0 ≤ FX (x) ≤ 1 y además
lı́m FX (x) = 0 y lı́m FX (x) = 1.

x→−∞ x→∞
ii. Si x es un número real entonces

P(X = x) = 0
y
P(X ≥ x) = P(X > x) = 1 − FX (x).
iii. Si a y b son dos números reales tales que a≤b entonces FX (a) ≤ FX (b), es decir F es creciente;
y además se tiene que
P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a < X < b) = FX (b) − FX (a).
iv. Si fX es la f.d.p. de X entonces
d 0
fX (x) = FX (x) = FX (x)
dx
0
donde FX (x) es la derivada de FX (x) respecto a x.
Demostración:
i. Sea x un número real. Entonces se sigue que:
Z t Z x Z ∞ Z ∞
FX (x) = P(X ≤ x) = fX (t)dt ≤ fX (t)dt + fX (t)dt = fX (t)dt = 1.
−∞ −∞ x −∞
Como para todo x se tiene que P(X = x) ≥ 0 entonces 0 ≤ FX (t) ≤ 1.

Si g es una antiderivada de fX entonces
Z x
lı́m FX (x) = lı́m fX (t)dt
x→−∞ x→−∞ −∞
x
= lı́m g(t)

x→−∞ −∞

= lı́m g(x) − lı́m g(b)
x→−∞ b→−∞
= lı́m g(x) − lı́m g(b)

x→−∞ b→−∞
= lı́m g(x) − lı́m g(x)

x→−∞ x→−∞
= 0.
y también
Z x
lı́m FX (x) = lı́m fX (t)dt
x→∞ x→∞ −∞
Z ∞
= fX (t)dt
−∞
= 1.
ii. Si g es una antiderivada de fX entonces

Z x x
P(X = x) = fX (t)dt = g(t) = g(x) − g(x) = 0

x x
y por lo tanto
P(X ≥ x) = P(X > x; X = x)

= P(X > x) + P(X = x)
= P(X > x) + 0
= P(X > x)
= 1 − P (X > x)C

= 1 − P {w ∈ Ω : X(w) > x}C

= 1 − P ({w ∈ Ω : X(w) ≤ x})

= 1 − P(X ≤ x)
= 1 − FX (x).
iii. Si a y b son dos números reales tales que a≤b entonces
FX (a) = P(X ≤ a) ≤ P(X ≤ b) = FX (b)
es decir FX es una función no decreciente, en efecto:
FX (a) = P(X ≤ a)
Z a
= fX (x)dx
−∞
Z a Z b
≤ fX (x)dx + fX (x)dx
−∞ a
Z b
= fX (x)dx
−∞
= P(X ≤ b)
= FX (b).
Dado que P(X = x) para cualquier número real x, se comprueba que
P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X < b) = P(a < X ≤ b)
y además
FX (b) − FX (a) = P(X ≤ b) − P(X ≤ a)

= (P(X < a) + P(a ≤ X ≤ b)) − P(X ≤ a)
= P(a ≤ X ≤ b).
Rx
iv. Como FX (x) = −∞
fX (t)dt, entonces siguiendo el teorema fundamental del cálculo (detalles en
la proposición C.5.2) se obtiene directamente que
d 0
fX (x) = FX (x) = FX (x)
dx
0
donde FX (x) es la derivada de FX (x) respecto a x.

Figura 8.4: Ejemplo de una f.d.a. de una v.a.c. X.
Nota. Más detalles acerca de la demostración del numeral iv. de la proposición 8.3.1 se pueden en-
contrar en Rudin (1976, p. 133).
Ejemplo 8.3.1. Sea X la v.a. que representa el tiempo (en minutos) que tarda un empleado en
realizar una tarea. Para el caso especíco de una empresa de consultoría determinada, la f.d.p. de la
variable X es: (
ke−x , si x > 0;
fX (x) =
0, si x ≤ 0.
Se pide:
a. Calcular el valor de k.
b. Comprobar que fX es una f.d.p. auténtica.
c. Hallar FX (x).
0
d. Comprobar que FX (x) = fX (x).
e. Calcular la probabilidad de que un empleado gaste:
1. hasta 5 minutos en realizar la tarea.
2. al menos 5 minutos en realizar la tarea.

3. entre 2 y 5 minutos en realizar la tarea.
4. exactamente 5 minutos en realizar la tarea.
Solución:
R∞
a. Como fX es una función de densidad de probabilidad entonces se cumple que
−∞
fX (x)dx = 1.
Luego, se sigue que
Z ∞ Z 0 Z ∞
fX (x)dx = 0dx + ke−x dx
−∞ −∞ 0
Z ∞
−x
=0+k e dx
0
∞
= k −e−x 0

= k lı́m −e−x − (−e−0 )

x→∞
= k(0 − (−1))
= k.
R∞
En virtud de que
−∞
fX (x)dx = k , se concluye que k=1 y por lo tanto
(
e−x , si x > 0;
fX (x) =
0, si x ≤ 0.
b. Toda función de densidad debe ser tal que fX (x) ≥ 0 para todo número real x, y en efecto, en este
caso para todas lasx < 0 se tiene que fX (x) = 0 y para todas las x ≥ 0 se tiene que fX (x) = e−x > 0
−x
dado que el valor de e siempre es positivo sin importar el valor del exponente. Además, si fX es
R∞
una función de densidad se debe satisfacer que
−∞ X
f (x)dx = 1, como se muestra en seguida:
Z ∞ Z 0 Z ∞
fX (x) dx = 0dx + e−x dx
−∞ −∞ 0
Z ∞
= e−x dx
0
∞
= −e−x 0
= lı́m −e−x − (−e−0 )

x→∞
= 0 − (−1)
=1
c. Si x≤0 entonces fX (x) = 0 y por consiguiente

Z x Z x
FX (x) = fX (t)dt = 0dt = 0.
−∞ −∞
Ahora, si x>0 entonces la función de distribución de X está dada por:
Z x
FX (x) = fX (t) dt
−∞
Z x
= e−t dt
0
x
= −e−t 0
= −e−x − (−e−0 )
= 1 − e−x
En consecuencia, se obtiene que la f.d.a. de X es:

(
1 − e−x , si x > 0;
FX (x) =
0, si x ≤ 0.
d. La derivada de la función de distribución es la función de densidad, en efecto, si x≤0 entonces

0
FX (x) = 0 y por lo tanto FX (x) = 0; y si x>0 entonces
0 d
1 − e−x

FX (x) =
dx
d d −x
= (1) − e
dx dx
−x

=0− e (−1)
= 0 + e−x
= e−x .
Así,
(
0 e−x , si x > 0;
FX (x) =
0, si x ≤ 0.
e. La probabilidad de que un empleado gaste hasta 5 minutos en realizar la tarea es
P(X ≤ 5) = FX (5) = 1 − e−5 = 1 − 0.00674 = 0.99326
f. A continuación se calculan las probabilidades requeridas:
1. La probabilidad de que un empleado gaste al menos 5 minutos en realizar la tarea es
P(X ≥ 5) = 1 − FX (5)
= 1 − (1 − e−5 )
= 1 − 1 + e−5
= e−5
= 0.00674.
2. La probabilidad de que un empleado gaste entre 2 y 5 minutos en realizar la tarea es
P(2 ≤ X ≤ 5) = FX (5) − FX (2)

= 1 − e−5 − 1 − e−2

= e−2 − e−5
= 0.12860.
3. La probabilidad de que un empleado gaste exactamente 5 minutos en realizar la tarea es
P(X = 5) = FX (5) − FX (5) = 0.
Queda como ejercicio para el lector justicar que lı́mx→∞ (e−x ) = 0.

Ejemplo 8.3.2. En un cultivo de células se coloca alimento en diferentes lugares de manera azarosa
para que las células puedan alimentarse. Las células en el cultivo no se comunican entre si, por lo que
si una célula encuentra alimento es indiferente a que las demás lo hagan. Para estudiar la variable
X dada por el tiempo (en minutos) en el que una célula encuentra el alimento se ha propuesto la
función de distribución
1 − e−x/5 ,

si x > 0;
FX (x) =
0, si x ≤ 0.
Con esta propuesta se quiere:
a. Hallar la probabilidad de que una célula se demore más de 5 minutos en encontrar el alimento.
b. Encontrar la función de densidad de X (esto permite analizar qué tiempos son los más ocurrentes).
c. Realizar una gráca de la función obtenida en el numeral anterior.
Solución:
a. Como se ha propuesto la f.d.a. de X entonces la probabilidad que se busca está dada por:

P(X > 5) = 1 − FX (5) = 1 − 1 − e−5/5 = 0 + e−1 = 0.3678,
y por lo tanto se entiende que es más probable que la próxima célula en encontrar el alimento se
demore menos de 5 minutos.
b. Para encontrar la f.d.p. de X fX como se muestra a continuación:

basta con encontrar la derivada de
0 d 1
FX (x) = 1 − e−x/5 = −e−x/5 (−1/5) = e−x/5 .
dx 5
0
Ahora, como la derivada de FX parax ≤ 0 es FX (x) = 0, entonces la f.d.p. de X está dada por:
1 −x/5
fX (x) = 5e , si x > 0;
0, si x ≤ 0.
c. Con fX es posible inspeccionar el comportamiento de la variable mediante el gráco que se muestra

en la gura 8.5.
Figura 8.5: Gráco de la f.d.p. de la variable del ejemplo 8.3.2.
A continuación se presenta la denición de percentil cuando se trata con variables continuas, del mismo
en que se generaliza el concepto de percentil para v.a.d.'s.
Denición 8.3.3. Sea X una v.a.c. con f.d.a. FX y p un número real

tal que 0 ≤ p ≤ 100. El percentil p de la distribución de X, denotado
con πp , es un valor de X tal que
p
= FX (πp ).
100
Nota. El percentil p de una variable continua X con 0 ≤ p ≤ 100, corresponde al valor del eje de
medición de X tal que el p% del área bajo la gráca de la f.d.p. de X está a la izquierda de πp y el
(100 − p) % está a la derecha. Como antes, el percentil 50 se denomina mediana y se simboliza con
µ̃X . Esto es, la mitad del área bajo la gráca de la f.d.p. de X está a la izquierda de µ̃X y la otra
mitad a la derecha de µ̃X . De otra parte, como
Z πp
FX (πp ) = fX (x)dx,
−∞
R πp
en la denición 8.3.3 se acostumbra intercambiar por
xmı́n
f (x)dx cuando xmı́n exista.
Ejemplo 8.3.3. Con la información del ejemplo 8.3.1, calcular e interpretar el percentil 95.
Solución:
Para calcular el percentil 95 (π95 ) se sigue la fórmula
95
= FX (π95 )
100 Z
π95
0.95 = e−x dx
0
0.95 = 1 − e−π95
0.95 − 1 = −e−π95
−0.05 = −e−π95
ln(0.05) = ln(e−π95 )
ln(0.05) = −π95 .
En consecuencia, el percentil 95 es π95 = − ln(0.05) = 2.995. Entonces, se dice que el 5 % de los

trabajadores se demoran más de 2.995 minutos realizando la tarea.
Ejemplo 8.3.4. En el caso del ejemplo 8.3.2, se quiere determinar un valor que separe las células
que tuvieron un lapso de tiempo menor en encontrar el alimento de las células que tuvieron un lapso
de tiempo mayor. Este valor debe ser tal que el 50 % de las células se encuentre en cada uno de los
grupos.
Solución:
Como se necesita un valor tal que el 50 % de las células se encuentre en cada uno de los grupos,
entonces se está buscando la mediana de la variable (µ̃X ). Este valor se obtiene mediante el siguiente
procedimiento:
50
FX (µ̃X ) =
100
1 − e−µ̃X /5 = 0.5
1 − 0.5 = e−µ̃X /5
ln(0.5) = −µ̃X /5
−5 ln(0.5) = −µ̃X .
Luego, el valor de interés es µ̃X = 3.4657 minutos, ya que el 50 % de las células encuentran alimento
antes de que transcurran 3.4657 minutos.
8.4. Valor esperado
Sobre la distribución de una variable se acostumbra registrar algunas características de interés tales
como la localización, la dispersión, el apuntamiento y la simetría, las cuales se estudian de manera
descriptiva en los capítulos de la Parte I de este libro. Aquí se generalizan estas características por
medio de ciertas cantidades denominadas parámetros , que son objeto de estudio cuando se investiga
el comportamiento de una variable. Enseguida se denen algunos parámetros de uso frecuente, empe-
zando por el valor esperado (esperanza o media), medida que formaliza el concepto de promedio que
se presenta en la sección 3.2.1.
Denición 8.4.1. Sea X una v.a. con f.m.p. fX para el caso discreto o
con f.d.p. fX para el caso continuo. El valor esperado de X , denotado
con E[X], se dene como
P
E[X] = R ∞k xk fX (xk ), si X es una v.a.d.;
−∞
xfX (x)dx, si X es una v.a.c..
En general, si g : R −→ R es una función entonces se tiene que el valor

esperado de g(X), denotado con E[g(X)], se dene como
P
E[g(X)] = R ∞k g(xk )fX (xk ), si X es una v.a.d.;
−∞
g(x)fX (x)dx, si X es una v.a.c..
Nota. El valor esperado de una v.a. X también se simboliza con µX . Además, se observa que la
denición de E[X] es equivalente a la denición de E[g(X)] cuando g(x) = x.
Nota. Es posible que el valor esperado de una v.a. no exista. Esto sucede cuando la sumatoria o la
integral correspondiente diverge.
Ejemplo 8.4.1. Se lanza un dado corriente una vez. Sea X la v.a. que denota el resultado obtenido
en el lanzamiento. Como X es una v.a.d. entonces es claro que:
X
E[X] = xk fX (xk )
k
6
X 1
= x
x=1
6

1 2 1
= 1· + 2· + ... + 6 ·
6 6 6
8.4. VALOR ESPERADO 209
21
= .
6
Entonces el valor esperado del resultado obtenido es 3.5.
Ejemplo 8.4.2. Sea X una variable con f.d.p. dada por:
(
e−3 3x
fX (x) = x! , si x = 0, 1, 2, . . .;
0, en otro caso.
Calcular el valor esperado de X.
Solución:
Como X es una v.a.d. entonces se tiene que
X
E[X] = xk fX (xk )
k
∞
X e−3 3x
= x
x=1
x!
∞
X 3x
= e−3 x
x=1
x!
∞
X 3x
= e−3
x=1
(x − 1)!
∞
X 3y+1
= e−3
y=0
y!
∞
−3
X 3y
= 3e
y=0
y!
= 3e−3 e3
= 3.
En consecuencia, el valor esperado de X es 3.
Nota. En la solución del ejemplo 8.4.2 se debe recordar que
∞
X xi
= ex .
i=0
i!
Ejemplo 8.4.3. Se dispone de un capital de $100,000 para una inversión de un año. El inversionista
está considerando dos opciones: colocar el dinero en el mercado de valores, lo que le garantiza un
ingreso anual jo del 15 %, o un plan de inversión cuya ganancia anual se puede considerar como una
v.a. cuyos valores dependen de las condiciones económicas que prevalezcan. Con base en la historia
pasada del segundo plan, un analista ha determinado los posibles valores de la ganancia (en miles) X
y calculado sus probabilidades, como se muestra a continuación:


 0.05, si x = 5;



 0.10, si x = 10;
0.35, si x = 15;

fX (x) =

 0.30, si x = 20;
0.20, si x = 25, 30;





0, en otro caso.
Con base en la ganancia esperada, ¾cuál de los dos planes se debe seleccionar?
Solución:
Si se escoge el primer plan, colocar el dinero en el mercado de valores, la ganancia anual que produce
$100,000 es de $15.000, dado que el ingreso anual es jo y su valor es del 15 %. Para el segundo plan,
sea X la v.a. que representa la ganancia anual (en miles) del inversionista. El valor medio de X es
X
E [X] = xk fX (xk )
k
= (5)(0.05) + (10)(0.10) + . . . + (30)(0.20)
= 23.5.
De acuerdo con lo anterior, el segundo plan es una elección mucho mejor puesto que ofrece una ganancia
esperada de $23,500. Sin embargo, se debe tener cautela en este punto, debido a que $23,500 es apenas
el valor esperado y el inversionista no tiene ninguna garantía de que variabilidad de la ganancia anual
sea mínima.
Ejemplo 8.4.4. La v.a. que representa la proporción de accidentes automovilísticos fatales en una
ciudad, tiene la siguiente f.d.p.:
42x(1 − x)5 ,

si 0 < x ≤ 1;
fX (x) =
0, en otro caso.
Calcular e interpretar el valor esperado de X.
Solución:
Como X es una v.a.c. entonces se sigue que
Z ∞
E[X] = xfX (x)dx
−∞
Z 1
= xfX (x)dx
0
Z 1
x 42x(1 − x)5 dx

=
0
Z 1
= 42 x2 (1 − x)5 dx
0
Z 1
= 42 x2 (−x5 + 5x4 − 10x3 + 10x2 − 5x + 1)dx
0
Z 1
= 42 (−x7 + 5x6 − 10x5 + 10x4 − 5x3 + x2 )dx
0

1 8 5 7 10 6 10 5 5 4 1 3 1
= 42 − x + x − x + x − x + x
8 7 6 5 4 3 0

1 5 10 10 5 1
= 42 − + − + − +
8 7 6 5 4 3
1
=
4
Por lo tanto, la proporción media de accidentes automovilísticos fatales es esta ciudad es 25 %.
Ejemplo 8.4.5. Una variable X tiene la siguiente f.d.p.:
2e−2x ,

si x>0;
fX (x) =
0, si x ≤ 0.
Calcular el valor esperado de X.
Solución:
Como X es una v.a.c. entonces se tiene que

Z ∞ Z ∞
E[X] = xfX (x)dx = 2xe−2x dx.
−∞ 0
Integrando por partes, haciendo u=x y dv = 2e−2x dx, se obtiene que v = −e−2x y du = dx. Por
consiguiente
Z
E[X] = µX = uv − vdu
Z ∞
∞
= x −e−2x − −e−2x dx
0 0
∞ Z ∞
−2x
= −xe + e−2x dx
0 0
e−2x ∞

lı́m −xe−2x − −0e−0 +

=
−2 0

x→∞
1
lı́m e−2x − e−0

= (0 − 0) −
2 n→∞
1
= − (0 − 1)
2
1
=
2
Esto es, el valor esperado de X es 0.5.
Nota. Queda como ejercicio para el lector justicar detalladamente que
lı́m xe−2x = 0 lı́m e−2x = 0.

y
x→∞ x→∞
Nota. Se puede demostrar que si X es una v.a.c. entonces una fórmula alternativa para calcular el
valor esperado de X es
Z ∞ Z ∞
E [X] = (1 − FX (x))dx − FX (−x)dx
0 0
donde FX es la f.d.a. de X.
A continuación se presentan las propiedades del valor esperado:
Proposición 8.4.1. Sea X una v.a. y a, b números reales. Entonces se tiene que:
i. E[a] = a.
ii. E [aX + b] = aE[X] + b.
iii. Si a1 , a2 . . . , an son n números reales y X1 , X2 , . . . , Xn son n v.a.'s conmensurables entonces
n
" # n
X X
E ai Xi = ai E[Xi ]
i=1 i=1
A continuación presenta la demostración para el caso continuo ya que la prueba es análoga para el
caso discreto.
Demostración:
Si fX denota la f.d.p. de una v.a.c. X entonces:
i. Empleando la denición del valor esperado se obtiene que
Z ∞ Z ∞
E [a] = afX (x)dx = a fX (x)dx = a(1) = a
−∞ −∞
y por lo tanto E [a] = a.
ii. Utilizando nuevamente la denición del valor esperado, la propiedad i. y desarrollando se tiene
que
Z ∞
E [aX + b] = (ax + b)fX (x)dx
−∞
Z ∞
= (axfX (x) + bfX (x))dx
−∞
Z ∞ Z ∞
= axfX (x)dx + bfX (x)dx
−∞ −∞
Z ∞
= axfX (x)dx + b
−∞
Z ∞
=a xfX (x)dx + E [b]
−∞
= aE [X] + b
de donde E [aX + b] = aE [X] + b.
iii. Aunque la demostración de esta propiedad requiere de conceptos más avanzados, se invita al lector
a ver la demostración de esta propiedad en Hogg, McKean & Craig (2005).
Se deja como ejercicio para el lector la demostración en el caso discreto.
Nota. Dadas las v.a. X, Y y los números reales a y b, de la proposición 8.4.1 se desprende la siguiente
identidad para el caso en que n = 2.
E [aX + bY ] = aE [X] + bE [Y ]
Ejemplo 8.4.6. Una empresa de productos bio-sintéticos está utilizando cierto tipo de reactivos
para aumentar o disminuir la cantidad de proteínas que tienen en un cultivo, de tal manera que
agregar q mililitros de reactivos implica que la población sea ahora de tamaño qP , donde P es el
tamaño de la población inicial. Además de la aplicación de estos reactivos, añaden una cantidad ja
de proteínas ligeramente diferentes para que el conjunto nal de proteínas tenga un balance adecuado
de las cualidades que proporcionan los grupos de proteínas. Si se sabe que la variable número de
individuos en el cultivo inicial de proteínas (X ) tiene una f.m.p. fX con media µX = 3 × 104 entonces
se quiere saber cual debería ser la cantidad en mililitros de reactivos que se deben aplicar para que
la razón esperada entre el número total de proteínas nal y el número agregado de proteínas sea
ligeramente diferente de 2.9, si se agregan 430, 000 de estas últimas proteínas.
Solución:
Lo primero que se debe notar es que la cantidad de interés es

qX + 430, 000
E [Y ] = E
430, 000
donde q es la cantidad en mililitros de los reactivos a incorporar en el primer cultivo de proteínas,

430,000 es la cantidad de las proteínas modicadas que se incorporan luego de que el reactivo se haya
consumido y Y es la razón entre el número total de proteínas nal y el número agregado de proteínas.
Ahora, como el interrogante se encuentra en la cantidad q en relación a la razón esperada entre los
dos grupos de proteínas, se plantea que E [Y ] = 2.9 de donde

qX + 430, 000
E = 2.9
430, 000

q
E X + 1 = 2.9
430, 000
q
E [X] + 1 = 2.9.
430, 000
Así, despejando para q se obtiene que
430000
q = (2.9 − 1)
E [X]
430000
q = 1.9
3 × 104
q = 27.23333.
Luego, es necesario aumentar la población inicial a aproximadamente 27 veces la población inicial, ya

que es necesario aplicar 27.23 mililitros de reactivo para que la razón esperada entre el número total
de proteínas nal y el numero agregado de las proteínas sea ligeramente diferente sea de 2.9.
Ejemplo 8.4.7. Un par de empresas de construcción tienen pensado realizar una fusión con el n de
aumentar sus ingresos medios, pensando en que la fusión creará un aumento de los ingresos de cada
una de ellas y por ende de los ingresos totales. Según el historial de cada una de las empresas sus
ingresos medios son 1.3 billones y 1.6 billones respectivamente. Los factores en los cuales se quiere que
aumenten los ingresos para cada una de las compañías son de 1.13 y 1.44 respectivamente. Al cabo
de un año las empresas se dieron cuenta que la ganancia media de la fusión fue de 2.84 billones, cifra
menor a lo que se tenía pensado previamente. A pesar de que efectivamente lograron aumentar las
ganancias según los factores que se propusieron, la primera empresa decide cancelar la fusión. ¾Por
qué?
Solución:
Según el planteamiento inicial que tenían las empresas, estas esperaban una ganancia media de la
fusión dada por:
E [1.13X + 1.44Y ]
donde X son las ganancias de la primera empresa y Y las ganancias de la segunda empresa. Por
lo que la ganancia esperada una vez establecida la fusión es de
E [1.13X + 1.44Y ] = 1.13E [X] + 1.44E [Y ] = 1.13 × 1.3 + 1.44 × 1.6 = 3.773.
Ahora, si la primera empresa al darse cuenta que la ganancia media de la fusión fue menor a lo que se
tenía pensado previamente, a pesar de que si se obtuvieron los factores de aumento, se podría pensar
que la segunda empresa mintió sobre su ganancia media dado que
E [1.13X + 1.44Y ] = 2.84

8.5. MOMENTOS 215
1.13E [X] + 1.44E [Y ] = 2.84

2.84 − (1.13)(1.3)
E [Y ] =
1.44
E [Y ] = 0.9521.
La primera canceló la fusión porque esta cantidad es mucho menor de la que la segunda empresa
reportó al momento de hacer la fusión de las compañías.
8.5. Momentos
Las siguientes dos deniciones son parte fundamental de otras medidas características de las v.a.'s;
por tal razón es esencial que se manejen de forma apropiada y ecaz.
Denición 8.5.1. Sea X una v.a. con f.m.p. fX para el caso discreto
o con f.d.p. fX para el caso continuo. El j -ésimo momento de X para
j = 1, 2, . . ., denotado con µ0j , está dado por
P j
µ0j = R ∞k xkjfX (xk ), si X es una v.a.d.;
−∞
x fX (x)dx, si X es una v.a.c..
Nota. La denición del j -ésimo momento de una v.a. X es un caso particular de E[g(X)] cuando
g(x) = x . Además, se observa que el segundo momento de una v.a. X se simboliza con µ02 y está dado
j
2
por E[X ], esto es:
P 2
0
µ2 = R ∞k xk2fX (xk ), si X es una v.a.d.;
−∞
x fX (x)dx, si X es una v.a.c..
El segundo momento es de uso frecuente en las medidas que describen de dispersión de una variable.
La importancia de los momentos de una distribución radica en la relación que tienen éstos con las
medidas básicas para describir v.a.'s, como la media, la varianza y las medidas de forma, entre otras.
En particular el segundo momento de una v.a. es de gran importancia en la teoría estadística básica
y avanzada.
Ejemplo 8.5.1. Sea X una v.a.c. con f.d.p. dada por:

2x, 0 < x < 1;
fX (x) =
0, en otro caso.
Calcular el segundo momento de X.
Solución:
Se pide calcular el segundo momento de X, es decir, µ02 = E[X 2 ]. Como X es una v.a.c. entonces se
obtiene que
Z ∞
E[X 2 ] = x2 fX (x)dx
−∞
Z 1
= x2 (2x)dx
0
Z 1
=2 x3 dx
0
x4 1
=

2 0

1 4
= (1 − 04 )
2
1
= .
2
Por lo tanto el segundo momento de X es 0.5.
Denición 8.5.2. Sea X una v.a. con f.m.p. fX para el caso discreto
o con f.d.p. fX para el caso continuo. El j -ésimo momento centrado
alrededor de la media de X para j = 1, 2, . . ., denotado con µj , está
dado por
j
P
µj = R ∞k (xk − µX )j fX (xk ), si X es una v.a.d.;
−∞
(x − µX ) fX (x)dx, si X es una v.a.c..
donde µX es el valor esperado de X.
Nota. Como antes, la denición del j -ésimo momento centrado alrededor de la media de una v.a. X
es un caso particular de E[g(x)] cuando g(x) = (x − µX )j .
Ejemplo 8.5.2. Un departamento de ciencias forenses se encuentra ante un caso en el cual los
individuos han muerto debido a diferentes concentraciones de cianuro. En el departamento se hacen
mediciones de estos niveles en cada cuerpo, lo que dene una v.a.c. que asumen tiene la f.d.p. dada
por:
1 3
fX (x) = 5,184 x , si 0 < x < 12;
0, en otro caso.
Si en las mediciones que se han realizado se han dado cuenta que los niveles entre 8 y 12 son los más
frecuentes, ¾la función de densidad propuesta es aceptable? Además, también se quiere determinar
si la concentración en los niveles se está agrupando de manera consistente. Por tal motivo se pide
calcular la medida
E (X − µX )4
ξX = −3
(E [(X − µX )2 ])2
que se espera de como resultado un valor mayor a 3, para así conrmar que los valores tienen una alta
densidad alrededor de la media. Discutir el resultado de esta medida.
8.5. MOMENTOS 217
Solución:
La f.d.p. para concentraciones entre 0 y 12 se puede observar en la gura 8.6, donde se aprecia la alta
frecuencia de los niveles de cianuro entre 8 y 12, luego bajo esta perspectiva, es una f.d.p. aceptable.
Para realizar el cálculo de la medida requerida, primero se obtienen las cantidades
µX = E [X]
Z ∞
= xfX (x)dx
−∞
Z 12
1
= x x3 dx
0 5, 184
Z 12
1
= x4 dx
5, 184 0
1 12
= x5

(5)(5, 184) 0
1
= (125 − 05 )
25, 920
= 9.6,
Z ∞
E (X − µX )2 = (x − µX )2 fX (x)dx

−∞
Z 12
1
= (x − 9.6)2 x3 dx
0 5, 184
Z 12
1
= (x − 9.6)2 x3 dx
5, 184 0
Z 12
1 2
= x2 − (2)(9.6)x + 9.62 x3 dx
5, 184 0
Z 12
1
x5 − 19.2x4 + 92.16x3 dx

=
5, 1840
12 !
1 x6 x5 x4
= − 19.2 + 92.16
5, 184 6 5 4 0
6 5
124

1 12 12
= − 19.2 + 92.16
5, 184 6 5 4
= 3.84
y
Z ∞
E (X − µX )4 = (x − µX )4 fX (x)dx

−∞
Z 12
1
= (x − µX )4 x3 dx
0 5, 184
Z 12
1
x4 − 4x3 µX + 6x2 µ2X − 4xµ3X + µ4X x3 dx

=
5, 184 0
Z 12
1
x7 − 4µX x6 + 6µ2X x5 − 4µ3X x4 + µ4X x3 dx

=
5, 184 0
!
4 12
1 x8 x7 2 x
6
3 x
5
4 x
= − 4µX + 6µX − 4µX + µX
5, 184 8 7 6 5 4 0
!
4 12
1 128 127 12 6
12 5
12
= − 4µX + 6µ2X − 4µ3X + µ4X
5, 184 8 7 6 5 4 0
= 54.51.
Luego, la cantidad por la que se indaga es:

E (X − µX )4 54.51
ξX = 2 2
−3= − 3 = 0.6964.
(E [(X − µX ) ]) 3.842
Por lo tanto, según lo sugerido en el ejercicio esta medida por ser mayor a 0 arma la alta densidad
de los niveles de cianuro alrededor del nivel promedio.
0.30
0.25
0.20
f(x)
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12

8.6. VARIANZA 219
8.6. Varianza
En el capitulo 4 se introducen algunas medidas descriptivas que dan cuenta de la dispersión de una
variable. En esta sección se dene de manera formal y se profundizan los conceptos de varianza,
desviación estándar y coeciente de variación de una v.a. a través de su distribución probabilística.
Denición 8.6.1. Sea X una v.a. con f.m.p. fX para el caso discreto o con f.d.p.
fX para el caso continuo. Se dene la varianza de X, denotada con Var[X], como
el segundo momento centrado alrededor de la medida de X, esto es:
2
P
VarX = R ∞k (xk − µX )2 fX (xk ), si X es una v.a.d.;
−∞
(x − µX ) fX (x)dx, si X es una v.a.c..
donde µX es el valor esperado de X.
2
Nota. El valor esperado de una v.a. X también se simboliza con σX . Además, se observa que la
denición de Var[X] es equivalente a la denición de E[g(X)] cuando g(x) = (x − µX )2 , es decir, a
µ2 .
La siguiente proposición establece una forma alternativa para calcular la varianza de una variable.
Esta nueva expresión de la varianza que utiliza el segundo momento de la variable puede resultar más
sencilla en muchos casos.
Proposición 8.6.1. 2

Si X es una v.a. entonces se satisface que Var [X] = E X 2 − (E [X]) .
A continuación presenta la demostración para el caso continuo ya que la prueba es análoga para el
caso discreto.
Demostración:
Asumiendo que X es una v.a.c. con f.d.p. fX , empleando la denición de varianza se sigue que
Z ∞
Var [X] = (x − µX )2 fX (x)dx
−∞
Z ∞
x2 − 2xµX + µ2X fX (x)dx

=
−∞
Z ∞
x2 fX (x) − 2xµX fX (x) + µ2X fX (x) dx

=
−∞
Z ∞ Z ∞ Z ∞
= x2 fX (x)dx − 2xµX fX (x)dx + µ2X fX (x)dx
−∞ −∞ −∞
Z ∞ Z ∞
= E X 2 − 2µX xfX (x)dx + µ2X

fX (x)dx
−∞ −∞
= E X 2 − 2µX µX + µ2x (1)

= E X 2 − 2µ2X + µ2x

= E X 2 − µ2X .

Se deja como ejercicio para el lector la demostración en el caso discreto. Sin embargo, a continuación
se una prueba general más simple empleando las propiedades del valor esperado:
Var [X] = E (X − µX )2

= E X 2 − 2XµX + µ2X

= E X 2 − E [2XµX ] + E µ2X

= E X 2 − 2µX E [X] + µ2X

= E X 2 − 2µX µX + µ2X

= E X 2 − µ2X .

Una vez se tienen denidas de manera formal la esperanza µX y la varianza σ2 de una v.a. X, varias
medidas descriptivas mencionadas en capítulos anteriores se formalizan también cuando se calculan
empleando los conceptos formales de media y varianza.
De esta forma, si X es una v.a. con media µX y varianza

2
σX entonces la desviación estándar o
desviación típica de X, denotada con σX se dene como
q
σX = 2 .
σX
Además, el coeciente de variación de Pearson (o simplemente coeciente de variación), deno-

tado con CVX , está dado por
σX
CVX = .
µX
Se recomienda al lector consultar el capítulo 4 para revisar los detalles relacionados con la interpreta-
ción de estas medidas de dispersión.
Ejemplo 8.6.1. Calcular e interpretar el coeciente de variación de la v.a. del ejemplo 8.4.5.
Solución:
Haciendo nuevamente integración por partes se obtiene que
Z ∞
E X2 = x2 fX (x)dx

−∞
Z ∞
x2 2e−2x dx

=
Z0 ∞
= 2x2 e−2x dx
0
8.6. VARIANZA 221
1
= .
2
Así, se sigue que
2
2 2 1 1 1
Var [X] = E X − µX = − =
2 2 4
√
y por lo tanto la desviación estándar de X es σX = 0.25 = 0.5. Luego, el coeciente de variación de
X es
σX 0.5
CVX = = = 100 %
µX 0.5
y en consecuencia la dispersión de la variable X es alta con respecto al valor medio.

Z ∞
2x2 e−2x dx = 1/2.
0
Solución:

Primero se calcula E X2 y se obtiene que
X 2
E X2 = xk fX (xk )
k
6
X 1
= x2
x=1
6
1 1 1
= (0 · ) + (12 · ) + . . . + (62 · )
6 6 6
91
= .
6
Por lo tanto, la varianza de X está dada por:
2
91 21 35
Var [X] = E X 2 − µ2X =

− = .
6 6 12
Luego, el coeciente de variación de X es
σX 35

CVX = = 12 = 83.3 %.
µX 21
6
Este coeciente indica que los valores del resultado obtenido en el lanzamiento tienen un alto grado
de heterogeneidad con respecto al valor esperado del lanzamiento. Este hecho se puede anticipar dado
que se tiene un experimento donde todos los resultados son equiprobables.
Solución:
X 2
E X2 = xk fX (xk )
k
∞
X e−3 3x
= x2
x=1
x!
∞
X 3x
= e−3 x2
x=1
x!
∞
X 3x
= e−3 x
x=1
(x − 1)!
∞
X 3y+1
= e−3 (y + 1)
y=0
y!
∞ ∞
( )
y+1 y+1
X 3 X 3
= e−3 y +
y=0
y! y=0
y!
(∞ ∞
)
X 3y+1 X 3y
−3
=e y +3
y=1
y! y=0
y!
( ∞ )
X 3y
= e−3 3 y + 3e3
y=1
y!
= e−3 3e3 E [X] + 3e3

= e−3 9e3 + 3e3

= 12.
Por lo tanto, se obtiene que
Var [X] = E X 2 − µ2X = 12 − 32 = 3

y por consiguiente el coeciente de variación de X es

√
σX 3
CVX = = = 57.7 %.
µX 3
Este valor del coeciente indica que la dispersión de la variable es alta con respecto al valor medio.

∞
X 3y
y = e3 E [X] .
y=1
y!
8.6. VARIANZA 223
Solución:
Var [X] = E X 2 − µ2X = 0.5 − 0.52 = 0.25

dado que
Z ∞
E X2 = x2 fX (x)dx

−∞
Z1
= x2 (2x)dx
0
Z 1
= 2x3 dx
0
4 1
x
=
2 0

1
= (1 − 0)
2
= 0.5.
En consecuencia, el coeciente de variación de X es

√
σX 0.25 0.5
CVX = = = = 100 %.
µX 0.5 0.5

Este valor del coeciente indica que la dispersión de la variable es alta con respecto al valor medio.
A continuación se presentan las propiedades de la varianza:
Proposición 8.6.2. Sea X una v.a. y a, b números reales. Entonces se tiene que:
i. Var [X] ≥ 0.
ii. Var [a] = 0.
iii. Var [aX + b] = a2 Var [X].
A continuación se presenta la demostración en el caso continuo ya que la prueba es análoga en el caso

discreto.
Demostración:
Si fX denota la f.d.p. de una v.a.c. X entonces:

i. Dado que fX (x) ≥ 0 y (x − µX )2 ≥ 0 entonces

Z ∞
Var [X] = (x − µX )2 fX (x)dx ≥ 0.
−∞
2
ii. Con facilidad se deduce que Var [a] = E a2 − (E [a]) = a2 − a2 = 0.
iii. Se ve ahora que

Z ∞
Var [aX + b] = ((aX + b) − µaX+b )2 fX (x)dx
−∞
Z ∞
= ((aX + b) − E [aX + b])2 fX (x)dx
−∞
Z ∞
= ((aX + b) − aE [X] − E [b])2 fX (x)dx
−∞
Z ∞
= (aX − aE [X] + b − E [b])2 fX (x)dx
−∞
Z ∞
= (a(X − E [X]) + b − b)2 fX (x)dx
−∞
Z ∞
= (a(X − E [X]))2 fX (x)dx
−∞
Z ∞
= a2 (X − E [X])2 fX (x)dx
−∞
Z ∞
2
=a (X − µX )2 fX (x)dx
−∞
= a2 Var [X] .
Ejemplo 8.6.5. Continuando con el ejemplo 8.4.6, dado que los productos bio-sintéticos de la com-
pañía requieren de altos niveles de precisión, es necesario observar constantemente la variación de sus
componentes, en particular de los componentes bióticos. Por esta razón se quiere comparar analizar
la dispersión del número de proteínas en el cultivo nal respecto al número de proteínas en el cultivo
inicial, teniendo en cuenta que la varianza del número de individuos en el cultivo inicial de proteínas
2
es σX = 19, 600, 000.
Solución:
Se dene la variable Z = 27.33X + 430, 000 correspondiente al número de proteínas en el cultivo

nal teniendo en cuenta la razón que debe haber entre el número de proteínas nal y el número de
2
proteínas modicadas (detalles en el ejemplo 8.4.6). Como σX = 19, 600, 000 y µX = 3 × 104 son el
valor esperado y varianza de la v.a. X =número de proteínas en el cultivo inicial, entonces la media
y la varianza de Z están dadas por
µZ = E [27.33X + 430, 000] = 27.33E [X] + 430, 000 = 27.33 × 3 × 104 + 430, 000 = 1, 249, 900
8.7. ALGUNAS DESIGUALDADES 225
2
= Var [27.33X + 430000] = 27.332 Var [X] = 27.332 (19, 600, 000) = 14, 639, 806, 440.

σZ
Luego, los coecientes de variación de X y Z son respectivamente

√
σX
CVX = = 19, 600, 000 = 14.76 %
µX 3 × 104
y √
σZ 14, 639, 806, 440
CVZ = = = 9.68 %.
µZ 1, 249, 900
Por lo tanto, la dispersión del número de proteínas en un cultivo nal es menos disperso respecto al
valor medio que el número de proteínas en un cultivo inicial. Así, ambos cultivos poseen una dispersión
intermedia respecto al número de proteínas esperado, por lo que el uso de estos cultivos de proteínas
en los productos bio-sintéticos no presenta grandes variaciones.
Ejemplo 8.6.6. Continuando con el ejemplo 8.4.7, ante la decisión tan drástica que toma la primera
empresa, la segunda empresa decide tomar una acción legal en la que da como pruebas documentos en
los cuales se encuentra la información sobre las ganancias de las dos empresas, los factores de aumento
(información dada en la primera parte del ejemplo), las desviaciones estándar de las variables X y Y
y además las pruebas de que las ganancias de una empresa son independientes de la otra. Teniendo
en cuenta que σX = 0.1324 y σY = 0.5800, ¾la primera empresa debería seguir con la fusión a la luz
de esta información?
Solución:
Entendiendo la pregunta desde un punto de vista económico y haciendo uso de los coecientes de
variación de las variables, se sigue que

σX 0.1324
CVX =
= = 10.2 %
µX 1.3
y
σY 0.5800
CVY = = = 36.2 %.
µY 1.6
Con esta evidencia, se concluye que la decisión que tomó la primera empresa cancelando la fusión es
correcta, ya que de continuar podría sacricar la regularidad de sus ganancias dada la volatilidad de
las ganancias de la segunda compañía.
8.7. Algunas desigualdades
Una vez introducido el concepto de probabilidad, media y varianza de manera formal, se puede for-
malizar también la idea presentada en la sección 4.9 sobre la desigualdad de Chebyshev, por medio
de los siguientes teoremas:
Teorema 8.7.1. Sea X una v.a. tal que el valor esperado y la varianza de X existen y g(X) una
función no negativa. Si E [g(X)] existe entonces para cualquier número real positivo c se tiene que
E [g(X)]
P(g(X) ≥ c) ≤
c
Demostración:
Sea Ac = {x ∈ R : g(x) ≥ c}. Si X es una v.a.c. con f.d.p. fX entonces

Z
E [g(X)] = g(x)fX (x)dx
R
Z
= g(x)fX (x)dx
Ac ∪AC
c
Z Z
= g(x)fX (x)dx + g(x)fX (x)dx
Ac AC
c
Z
≥ g(x)fX (x)dx
Ac
dado que g(X) es una función no negativa. Ahora, como g(x) ≥ c para todo número real x en Ac ,
entonces
Z Z Z
g(x)fX (x)dx ≥ cfX (x)dx = c fX (x)dx = cP(X ∈ Ac ) = cP(g(X) ≥ c)
Ac Ac Ac
y por lo tanto
E [g(X)]
≥ P(g(X) ≥ c).
c
De otra parte, si X es una v.a.d. con f.m.p. fX entonces

X
E [g(X)] = g(x)fX (x)
RX
X
= g(x)fX (x)
Ac ∪AC
c
X X
= g(x)fX (x) + g(x)fX (x)
Ac AC
c
X
≥ g(x)fX (x)
Ac
dado que g(X) es una función no negativa. Ahora, como g(x) ≥ c para todo número real x en Ac ,
entonces X X X
g(x)fX (x) ≥ cfX (x) = c fX (x) = cP(X ∈ Ac ) = cP(g(X) ≥ c)
Ac Ac Ac
y por lo tanto
E [g(X)]
≥ P(g(X) ≥ c).
c

8.7. ALGUNAS DESIGUALDADES 227
Nota. El teorema 8.7.1 se conoce como teorema de Markov .

Teorema 8.7.2. Sea X una v.a. tal que el valor esperado y la varianza de X existen. Entonces
1
P(|X − µX | < kσX ) ≥ 1 −
k2
o equivalentemente
1
P(|X − µX | ≥ kσX ) ≤
k2
donde k es un número real positivo.
Demostración:
Haciendo g(X) = (X − µX )2 y c = k 2 σX
2
en el teorema 8.7.1 se obtiene que

E (X − µX )2
P (X − µX )2 ≥ k 2 σX
2
≤ 2
k 2 σX

y dado que E (X − µX )2 = σX
2
entonces
1
P((X − µX )2 ≥ k 2 σX
2
)≤ .
k2
Como el evento (X − µX )2 ≥ k 2 σX
2
= |X − µX | < kσX y además k > 0, se concluye que
1
P(|X − µX | ≥ kσX ) ≤
k2
de donde
1
P(|X − µX | < kσX ) ≥ 1 − ,
k2

Nota. El teorema 8.7.2 se conoce como teorema de Chebyshev o desigualdad de Chebyshev.
Ejemplo 8.7.1. Dada una v.a. X con valor esperado µX y varianza
2
σX se quiere obtener un valor a
tal que
P(µX − a < X < µX + a) ≥ 0.75.
2
Además, si σX =1 y a = 3, se pide hallar una cota inferior para
P(µX − 3 < X < µX + 3).
Solución:
Usando la desigualdad de Chebyshev y tomando a = kσX se obtiene que
1
0.75 = 1 −
k2
1
= 0.25
k2
1
|k| = √
0.25
|k| = 2.
Como k>0 entonces k=2 y a = 2σX . De esta manera, se concluye que
P(µX − 2σX < X < µX + 2σX ) ≥ 0.75.

2
Por otro lado, si σX =1 y a=3 entonces k=3 se sigue que
P(µX − 3 < X < µX + 3) = P(|X − µX | < 3) ≥ 1 − 1/32 = 0.8889.
Ejemplo 8.7.2. Una compañía dedicada al mercado bursátil sabe que para cualquier día la variable
X que representa la ganancia (en miles de millones) del día sigue la f.d.p. dada por:
1 4
3,410 x , si −3 < x < 7;
fX (x) =
0, en otro caso.
Teniendo en cuenta que los valores negativos de la variable representan pérdidas, se quiere determinar:
a. La ganancia esperada y la varianza en un día cualquiera.
b. Una cota para la probabilidad de que las ganancias se encuentren a una distancia menor de la
media de tres veces la desviación estándar.
c. La probabilidad exacta sobre el numeral anterior y comparar los resultados obtenidos.
d. Un gráco de la función de densidad sobre el rango de la variable.
Solución:
a. El valor esperado de X es
Z ∞ Z 7 7
1 1 1
E [X] = xfX (x)dx = x x4 = x6 = (76 − (−3)6 ) = 5.7145

−∞ −3 3, 410 (6)(3, 410) −3 40, 460
y
Z ∞ Z 7 7
1 1 1
E X2 = 2
x2 x4 = x7 = (77 − (−3)7 ) = 34.5927

x fX (x)dx =

−∞ −3 3, 410 (7)(3, 410) −3 23, 870
de donde
Var [X] = 34.59279 − (5.714565)2 = 1.9365.
8.8. FUNCIÓN GENERADORA DE MOMENTOS 229
b. Por medio del teorema de Chebyshev y el ejemplo 8.7.1 se tiene que
P(|X − µX | < 3σX ) ≥ 0.8889.
Se observa que la distancia a la media puede ser por valores de menor o mayor magnitud, por lo
cual tiene sentido el valor absoluto de la diferencia para denotar la distancia.
c. Para calcular la probabilidad exacta basta con calcular la siguiente probabilidad:
P(|X − µX | < 3σX ) = P(µX − 3σX < X < µX + 3σX ) = P(5.714 − 4.174 < X < 5.714 + 4.174).
Como
Z 7 7
1 1
P(1.539 < X < 9.888) = P(1.539 < X < 7) = x4 = x5 = 0.9849

1.539 3, 410 (5)(3, 410) 1.539
entonces calculando la probabilidad de manera exacta se tiene que siempre será mayor o igual
que la cota obtenida mediante el teorema de Chebyshev y esta probabilidad puede estar alejada
signicativamente de la cota propuesta, por lo que es necesario ser prudentes con el uso de esta
cota.
d. Por último, la gráca de la f.d.p. de X sobre el rango de X se presenta en la gura. 8.7
8.8. Función generadora de momentos
Como se ha visto, el valor esperado es de uso frecuente, tanto para denir los momentos de una v.a.,
como para denir la varianza, entre otros parámetros. En esta sección se introduce una versión especial
del valor esperado que permite calcular con facilidad todos los momentos de una v.a. e identicar su
distribución probabilística.
Denición 8.8.1. Sea X una v.a. con f.m.p. fX para el caso discreto o
con f.d.p. fX para el caso continuo. La función generadora de mo-
mentos (abreviado con f.g.m.) de X , denotada con mX (t), se dene
como
mX (t) = E etX

donde t ∈ (−h, h) con h>0 un valor jo para el que E etX existe.
0.7
0.6
0.5
0.4
f(x)
0.3
0.2
0.1
0.0
−2 0 2 4 6
Nota. La denición de la f.g.m. de una v.a. X es equivalente a la denición de E [g(X)] cuando

tx
g(x) = e . Por consiguiente, si X es una v.a. con f.m.p. fX para el caso discreto o con f.d.p. fX para
el caso continuo, se tiene que
P txk
E etX = R ∞k e tx fX (xk ), si X es una v.a.d.;

−∞
e fX (x)dx, si X es una v.a.c..
La función generadora de momentos se vuelve una herramienta muy útil para calcular los momentos
de una v.a. al igual que para identicar su distribución probabilística, ya que hay una relación 1-1
entre la f.g.m. y la función de distribución. Sin embargo, se debe tener en cuenta que la f.g.m. no
siempre existe así como el valor esperado.
Teorema 8.8.1.
tX
existe para t ∈ (−h, h) con h > 0. Entonces
Xk una v.a. tal que E e
Sea el
k -ésimo momento E X de X para k = 1, 2, . . ., se puede calcular como la k -ésima derivada de la
f.g.m. evaluada en 0, esto es:
(k)
E X k = mX (0)

(k) dk
donde mX (t) = dtk
mX (t).
Demostración:
Si X es una v.a.d. con f.m.p. fX entonces la función generadora de momentos de X está dada por:
X tx
mX (t) = E etX =

e fX (x).
x
Luego, entendiendo a mX (t) como una función de valor real se tiene que
dk dk X tx X dk X
k
mX (t) = k e fX (x) = k
etx fX (x) = xk etx fX (x)
dt dt x dt
k k
Evaluando en t=0 se tiene que
dk X
k 0x
X
xk fX (x) = E X k .

m (t) = x e f (x) =

X X
dtk

t=0
RX x
Por último, si X es una v.a.c. con f.d.p. fX entonces la función generadora de momentos de X está
dada por:
Z ∞
mX (t) = E etX = etx fX (x)dx.

−∞
1
Luego, entendiendo mX (t) como una función de valor real y bajo un resultado del análisis real se
tiene que
∞ ∞
dk dk dk tx
Z Z
tx
mX (t) = e fX (x)dx = e fX (x)dx.
dtk dtk −∞ −∞ dtk
Evaluando en t=0 se tiene que
Z ∞ Z ∞
dk
k 0x
xk fX (x)dx = E xk .

m (t) = x e f (x)dx =

k X X
dt

t=0 −∞ −∞

Ejemplo 8.8.1. Una entidad bancaria está evaluando el servicio que presta en su página web. Uno
de los principales puntos de evaluación es la capacidad de la página para la ejecución de transacciones
virtuales. El número máximo de transacciones por minuto de la página web de esta entidad es 10. Una
variable de interés es el tiempo (en minutos) restante para la siguiente operación nanciera cuya
f.d.p. está dada por:
2e−2x ,

si x > 0;
fX (x) =
0, si x ≤ 0.
Se quiere encontrar la f.g.m. y los dos primeros momentos de la variable para calcular el coeciente
de variación y analizarlos respecto al número máximo de transacciones por minuto.
Solución:
1 El lector ávido puede encontrar en Rudin (1976, p. 236) las condiciones bajo las cuales se puede hacer el intercambio
entre integral y derivada.
Como
Z ∞
E etX = etX fX (x)dx

−∞
Z ∞
etx 2e−2x dx

=
Z0 ∞
= 2etx−2x dx
0
Z ∞
= 2e−x(2−t) dx
0
∞
2 − t −x(2−t)
Z
= 2 e dx
0 2 −t
Z ∞
2
= (2 − t)e−x(2−t) dx
2−t 0
2 −x(2−t) ∞
= −e
2−t

0
2
= (0 − (−1))
2−t
2
= .
2−t
2
Luego, mX (t) = 2−t para t < 2, en particular para −2 < t < 2. Ahora, como
(1) 2 (2) 4
mX (t) = y mX (t) =
(2 − t)2 (2 − t)3
entonces los primeros dos momentos de la v.a. X son
(1) 2 1 (2) 4 1
mX (0) = 2
= y mX (0) = 3
= .
(2 − 0) 2 (2 − 0) 2
En consecuencia, el coeciente de variación es
√
σX 0.5 − 0.52
CVX = = = 100 %.
µX 0.5
Así, se espera que la página web reciba una nueva transacción cada medio minuto, lo que está dentro
de las capacidades de la página. Sin embargo, dada la alta dispersión respecto al valor medio, se
aconseja optimizar los procesos informáticos para garantizar la eciencia del servicio.
(1) 2 4
mX (t) = y m(2)
x (t) = .
(2 − t)2 (2 − t)3
Proposición 8.8.2.

Sea X una v.a. tal que E etX existe para t ∈ (−h, h) con h > 0. Si a, b son
número reales y Y = aX + b entonces
mY (t) = ebt mX (at).

Demostración:
Empleando la denición de la f.g.m. se tiene que
mY (t) = E eyt

h i
= E e(aX+b)t
= E eaXt+bt

= E eaXt ebt

h i
= ebt E e(aX)t
= ebt mX (at).

Ejemplo 8.8.2. Continuando con el ejemplo 8.8.1, con el transcurrir de los meses la entidad se ha
dado cuenta que el tiempo para que se realice la siguiente transacción a disminuido al 10 % de lo
que era anteriormente. Se quiere determinar los cambios que hubo en la media y en la dispersión de
la variable.
Solución:
Como el tiempo para que se realice la siguiente transacción a disminuido al 10 % de lo que era
anteriormente, entonces la variable objeto de estudio es Y = 0.1X . Como ya se tiene la f.g.m. de X,
basta utilizar la proposición 8.8.2 para obtener mY (t). De esta forma se obtiene que
2
mY (t) = m0.1X (t) = mX (0.1t) = .
2 − 0.1t
2
Como mx (t) = 2−t existe para −2 < t < 2, entonces mY (t) existe para −2 < 0.1t < 2, es decir, para
−20 < t < 20. Ahora, calculando los momentos se sigue que
(1) 2(0.1) (2) 4(0.1)2

mY (t) = y mY (t) = .
(2 − 0.1t)2 (2 − 0.1t)3
Por lo tanto, los momentos de Y son
(1) 2(0.1) 1 (2) 4(0.1)2 1

mY (0) = = y mY (0) = = .
(2 − (0.1)(0))2 20 (2 − (0.1)(0))3 200
En consecuencia, el coeciente de variación de Y es
√
σY 0.005 − 0.052
CVY = = = 100 %.
µY 0.05
Luego, se espera que la página web ahora reciba una nueva transacción cada 0.05 minuto, lo cual
se encuentra dentro del valor que la entidad bancaria puede manejar. Sin embargo, el coeciente de
variación continúa reejando una alta dispersión respecto al valor medio, lo que indica que todavía
debe haber un control persistente sobre la eciencia de los procesos de la página.
Ejemplo 8.8.3. Un tejido producido sintéticamente necesita de ciertos niveles de precisión en la

cantidad de polietileno utilizado en su fabricación. En la producción hay desviaciones en la cantidad
de polietileno usado; estas desviaciones siguen el comportamiento de una v.a.d. con f.d.p. dada por:
2 1
fX (x) = I{−0.5,0.5} (x) + I{−0.1,0.1} (x)
5 10
donde
1, si x ∈ A;
IA (x) =
0, en otro caso.
para cualquier conjunto A. La función IA se denomina función indicadora del conjunto A.
Se quiere determinar si la frecuencia en los errores de la cantidad de polietileno se encuentra estable, o

por el contrario, es más frecuente encontrar errores en la cantidad de polietileno debido a aplicaciones
menores o mayores a la cantidad óptima. Para indagar por esta inquietud se sabe que la medida

E (X − µX )3
ψX =
(E [(X − µX )2 ])3/2
da una respuesta concreta respecto a la frecuencia de los errores de la cantidad de polietileno, ya que
si ψX = 0 entonces la frecuencia con la que se da un exceso en la cantidad de polietileno es igual a la
que se obtiene cuando hay un décit en la cantidad establecida, pero si ψX > 0 o ψX < 0 entonces
hay una mayor frecuencia en los excesos o en el décit según sea el caso.
Además, se estableció que una de las máquinas del proceso ha aumentado las desviaciones en la
cantidad de polietileno en 0.33 unidades. Si antes de tener este cambio esta máquina seguía el mismo
comportamiento de la variable X, ¾cuál es el desvío esperado en la cantidad de polietileno aplicado?
Solución:
Para calcular ψX primero se calculaµX = E [X] mediante la f.g.m. de X como sigue:

tX
mX (t) = E e

X 2 1
= etx I{−0.5,0.5} (x) + I{−0.1,0.1} (x)
x
5 10
X 2 X 1
= etx I{−0.5,0.5} (x) + etx I{−0.1,0.1} (x)
x
5 x
10
2 t(−0.5) 2 t(0.5) 1 1
= e + e + et(−0.1) + et(0.1)
5 5 10 10
2 −0.5t 0.5t
1 −0.1t 0.1t

= e +e + e +e
5 10
Ahora,
(1) 2 1
0.5e0.5t − 0.5e−0.5t + 0.1e0.1t − 0.1e−0.1t .

mX (t) =
5 10
Luego, µX está dada por:
(1) 2 1
µX = mX (0) = (0.5 − 0.5) + (0.1 − 0.1) = 0.
5 10
Por consiguiente, la fórmula de ψX para inspeccionar la tendencia de los niveles de polietileno se puede
reescribir como
E X3
ψX =
(E [X 2 ])3/2
y en consecuencia se puede obtener ψX por medio de la f.g.m. calculando el segundo y tercer momento,
como sigue:
(2) 2 1
0.52 e0.5t + 0.52 e−0.5t + 0.12 e0.1t + 0.12 e−0.1t

mX (t) =
5 10
de donde
(2) 2 1
E X 2 = mX (0) = 2 0.52 + 2 0.12 = 0.102,

5 10
y para el tercer momento
(3) 2 1
0.53 e0.5t − 0.53 e−0.5t + 0.13 e0.1t − 0.13 e−0.1t

mX (t) =
5 10
de donde
(3) 2 1
E X 3 = mX (0) = 0.53 − 0.53 + 0.13 − 0.13 = 0.

5 10
Por lo que,
0
ψX = = 0.
(0.102)3/2
Entonces, se puede decir que la frecuencia con la que se da un exceso en la cantidad de polietileno es
igual a la que se obtiene cuando hay un décit respecto a la cantidad óptima de polietileno.
Ahora, para saber la desviación esperada para la máquina con variaciones se considera la variable
Y = X +0.33. Utilizando la f.g.m. de X se obtiene este valor esperado como se muestra a continuación:
mY (t) = mX+0.33 (t)

= e0.33t mX (t)

2 −0.5t 1 −0.1t
= e0.33t + e0.5t + + e0.1t

e e
5 10
2 0.33t −0.5t 1
+ e0.5t + e0.33t e−0.1t + e0.1t

= e e
5 10
2 (0.33−0.5)t (0.33+0.5)t
1 (0.33−0.1)t
= e +e + e + e(0.33+0.1)t
5 10
y
(1) 2
mY (t) = (0.33 − 0.5)e(0.33−0.5)t + (0.33 + 0.5)e(0.33+0.5)t
5
1
+ (0.33 − 0.1)e(0.33−0.1)t + (0.33 + 0.1)e(0.33+0.1)t
10
de donde
(1) 2 1
µY = mY (0) = ((0.33 − 0.5) + (0.33 + 0.5)) + ((0.33 − 0.1) + (0.33 + 0.1)) = 0.33.
5 10
Así, se concluye que el cambio en la máquina implica que la media de la desviación en la cantidad de
polietileno aplicado por la máquina sea de 0.33, lo que quiere decir que la máquina está generando
productos con un valor esperado de polietileno mayor al óptimo.
A continuación se presenta sin demostración un teorema que facilita relacionar de forma directa la
f.g.m. de una v.a. con su distribución probabilística:
Teorema 8.8.3. Sean X y Y v.a.'s cuyas f.g.m.'s existen. Si para todo t se tiene que mX (t) = mY (t)
entonces X y Y tienen la misma distribución probabilística.
Nota. El teorema 8.8.3 permite identicar fácilmente la distribución de una v.a. dada por medio de su
f.g.m., lo que quiere decir que a través de esta función es posible precisar completamente la distribución
probabilística de una variable.
8.9. Funciones de variables aleatorias
8.9.1. Generalidades
A partir del concepto de v.a. (denición 8.1.1) se puede generar otro tipo de variables aleatorias
mediante la composición o la función de variables, lo cual es de gran utilidad para explorar diversas
características que únicamente se obtienen por medio de transformaciones.
Teorema 8.9.1. Sean X y Y dos v.a.'s tales que X:Ω→R y Y : R → R. Entonces se tiene que:
i. cX , 1/X y |X| son v.a.'s donde c es un número real.
ii. X +Y, X −Y y XY son v.a.'s.
iii. Y ◦X es una v.a. donde Y ◦ X : Ω → R : w 7−→ (Y ◦ X)(w) = Y (X(w)).
La demostración se puede consultar en Gut (2005, p. 28).
Ejemplo 8.9.1. Una empresa abrió licitaciones para un proyecto de renovación de laboratorios, la
cual emplea la siguiente ecuación para obtener los puntajes de las empresas que se presentan a la
licitación y de esta forma se pueda adjudicar el contrato:
X1 + 0.5X2 − 3X3
Y =
10
donde X1 , X2 y X3 son respectivamente las v.a.'s que representan los años cumplidos de experiencia,
la cantidad de personal en la empresa y los los años de retraso en la entrega de obras anteriores.
¾Se puede considerar a Y como una v.a.?
Solución:
Puesto que X1 , X2 y X3 son v.a.'s, en virtud del teorema 8.9.1 se tiene que Y1 = 0.5X , Y2 = 3X3 son
v.a.'s, y por lo tanto Y3 = Y1 − Y2 y Y4 = X1 + Y3 también son v.a.'s. Finalmente, Y = Y104 también
es una v.a..
8.9. FUNCIONES DE VARIABLES ALEATORIAS 237
Ejemplo 8.9.2. En la tabla 8.1 se presentan los puntajes de las empresas que se presentaron a la
licitación del ejemplo 8.9.1.
Empresa X1 X2 X3 Y Z ◦Y
Constructora A 10 24 1.2 18.4 0
Constructora B 9 19 0.5 17.0 0
Constructora C 11 20 0.3 20.1 1
Constructora D 15 34 3.7 20.9 1
Tabla 8.1: Datos asociados con el puntaje de las empresas constructoras participantes en la licitación.
Para determinar qué empresas pasan a la siguiente etapa se tiene un nivel de corte, el cual está dado
por la v.a. Z como sigue:
Z : R → R : z 7−→ Z(z) = I{x∈R:x>19.5} (z)
donde IA es la función indicadora del conjunto A.
¾Cuál es la v.a. que muestra que una constructora pasa a la siguiente etapa? ¾Cuáles empresas pasan
el corte?
Solución:
El espacio muestral de la variable Y es Ω = N × N × (R+ ∪ {0}), dado que las primeras dos variables
solamente asumen valores de los número enteros positivos, mientras que la última variable puede
asumir cualquier valor de los números reales positivos. Así, el puntaje de una empresa depende de los
valores que la compañía tome en las variables de estudio.
Una vez obtenido el valor de la variable Y para una empresa determinada, tiene sentido evaluar si
ésta pasa o no el corte con base en el valor registrado. Es decir, la v.a. (Z ◦ Y )(w) = Z(Y (w)) para
cada w ∈Ω es la v.a. de interés. Como se observa en la tabla 8.1, las empresas que pasan el corte
están representadas por el valor 1 en la v.a. Z ◦Y.
Teorema 8.9.2. Si X : Ω → R es una v.a. y f : R → R es una función continua de valor real
entonces f (X) también es una v.a..
La demostración se puede consultar Gut (2005, p. 28).
Ejemplo 8.9.3. Una de las transformaciones más conocidas y empleadas en la estadística se denomina
estandarización, proceso mediante el cual se obtiene una v.a. con esperado igual a 0 y varianza igual
2
a 1. De modo que si X es una v.a. tal que E [X] = µX y Var [X] = σX entonces
X − µX
Z=
σX
es una nueva v.a. tal que E [Z] = 0 y Var [Z] = 1. Justicar.
Solución:
Se sabe que la función

x − µX
g : R → R : x 7−→ g(x) =
σX
es una función continua. Luego, por el teorema 8.9.2, se tiene que g(X) también es una v.a., por lo
que hace sentido calcular el valor esperado y la varianza de g(X). Además, aplicando las propiedades
del valor esperado y de la varianza, se sigue que

X − µX 1
E [Z] = E = (E [X] − µX ) = 0
σX σX
y
2

X − µX 1 σX
Var [Z] = Var = 2 Var [X] = 2 = 1.
σX σX σX
Otra forma de comprobar que Z es una v.a. es empleando el teorema 8.9.1.
Ejemplo 8.9.4. Un laboratorio se encuentra realizando un experimento que tiene como objetivo
conocer sobre la expresión genética de un grupo de genes en un organismo al verse estimulado por
diferentes condiciones físicas y químicas, como luz, temperatura, humedad, pH y concentraciones
de otro tipo de sustancias. La forma en que analizan la expresión de cada gen se realiza mediante
un método indirecto que mide en realidad la cantidad de proteínas que produce el gen ante un
determinado estimulo.
Para un gen particular se han encontrado los resultados dados en la tabla 8.2. ¾Cuáles dicultades
puede tener la v.a. X dada por el número de proteínas para determinar bajo qué escenarios la
expresión génica es mayor? Dar una posible solución.
Estimulo X log(X)
pH 100 4.60517
Humedad 45,677 10.72935
Salinidad 137,893,332 18.74199
% de luz 1,245 7.12689
Tabla 8.2: Datos asociados con los valores obtenidos para el número de proteínas producidas por un determinado
gen ante diferentes estímulos.
Solución:
La dicultad para determinar bajo que escenarios la expresión génica es mayor se puede pensar como
la gran variación que tienen los valores de la variable, ya que, la diferencia entre pH y salinidad es de
más de 10 veces la cantidad obtenida en el pH, más sin embargo estas dos cantidades son más de 20
veces menores que los valores obtenidos en humedad y salinidad. Por lo tanto, directamente con estas
cantidades es complicado analizar bajo que estímulos hay una mayor expresión genética.
Una posible solución consiste en estandarizar las variables, sin embargo, como se observa en el ejemplo
8.9.3, puede que la estandarización elimine información relevante para el análisis o no logre resolver
8.9. FUNCIONES DE VARIABLES ALEATORIAS 239
el problema. Por lo tanto, otra posible alternativa es el uso de la función logaritmo, la cual reduce
la distancia entre las cantidades transformadas como se observa en la tabla 8.2, y además como la
función logaritmo es una función continua sobre los números reales positivos, entonces log(X) también
es una v.a., y por tal motivo es posible analizar estadísticamente la expresión genética a través de esta
transformación.
8.9.2. Distribuciones de funciones de v.a.
Asumiendo que se tiene una transformación g(X) de una v.a. X , la cantidad Y = g(X) también puede
ser una v.a. según sean las especicaciones de g(X). Por consiguiente, si Y es una v.a. entonces hace
sentido preguntarse por la distribución probabilística de Y . A continuación se presentan un par de
alternativas para deducir la distribución de una función de una v.a. X :
i. Si X es una v.a.d. con f.m.p. fX y Y = g(X) entonces RY = {g(x) : x ∈ RX } y por lo tanto la

f.m.p. de Y es
fY (y) = P(Y = y) = P(g(X) = y) = P(X ∈ g −1 (y))
donde g −1 (y) = {x ∈ RX : g(x) = y}. Se observa que si g es una función uno-a-uno (detalles en
la sección C.2) entonces
fY (y) = fX (g −1 (y)).
ii. Si X es una v.a.c. con f.d.p. fX y Y = g(X) entonces se utiliza el siguiente teorema:
Teorema 8.9.3. Sea X una v.a.c. con f.d.p. fX y Y = g(X) una función diferenciable de X
uno-a-uno sobre RX . Si X = g −1 (Y ) denota la función inversa de g(X) entonces la f.d.p. de Y
está dada por:
dx
fY (y) = fX (g −1 (y))

dy
dx d −1
donde dy = dy g (y) .
Demostración:
Como g(X) es invertible y continua, entonces g(X) es monótona
creciente o monótona decreciente.
Si g(X) que es monótona creciente entonces dx dy = dx y además
dy
FY (y) = P(Y ≤ y) = P(g(X) ≤ y) = P(X ≤ g −1 (y)) = FX (g −1 (y))
de donde
d d d dx
fY (y) = FY (y) = FX (g −1 (y)) = fX (g −1 (y)) g −1 (y) = fX (g −1 (y)) .

dy dy dy dy
dx
Ahora, si g(X) es monótona decreciente entonces − dx
dy = dy
y además
FY (y) = P(Y ≤ y) = P(g(X) ≤ y) = P(X > g −1 (y)) = 1 − FX (g −1 (y))

de donde
d d d dx
fY (y) = FY (y) = (1 − FX (g −1 (y))) = −fX (g −1 (y)) g −1 (y) = fX (g −1 (y)) .

dy dy dy dy
Así, se obtiene la igualdad en cualquiera de los dos casos.
Ejemplo 8.9.5. Con la información del ejemplo 8.2.2, se quiere una variable Y que divida en tres
escenarios el sostenimiento del laboratorio como sigue:
Y = 1 × I{0,1,...,7} (X) + 2 × I{8,9,10} (X) + 3 × I{11,12,...,15} (X).

De esta manera, 1 equivale a no auto-sostenimiento, 2 a equilibrio y 3 a éxito. Se pide encontrar la
f.m.p. de Y.
Solución:
Puesto que
P(Y = 1) = P(X ∈ {0, 1, . . . , 7})

= P(X = 0; X = 1; . . . ; X = 7)
7
X
= P(X = x)
x=0
= 0.0 + 0.01 + 0.03 + 0.02 + 0.03 + 0.05 + 0.06 + 0.07
= 0.27,
P(Y = 2) = P(X ∈ {8, 9, 10})
= P(X = 8; X = 9; X = 10)
10
X
= P(X = x)
x=8
= 0.06 + 0.09 + 0.10
= 0.25,
P(Y = 3) = P(X ∈ {11, 12, . . . , 15})
= P(X = 11; X = 12; . . . ; X = 15)
15
X
= P(X = x)
x=11
= 0.2 + 0.25 + 0.01 + 0.01 + 0.01
= 0.48,
entonces la f.m.p. de Y está dada por:


 0.27, si y = 0;
0.25, si y = 1;

fY (y) =
 0.48,
 si y = 2;
0,

en otro caso.
Ejemplo 8.9.6. Continuando con el ejemplo 8.5.2, el departamento de ciencias forenses tiene la
hipótesis de que este envenenamiento proviene del suministro de agua potable, lo cual los tiene un
tanto preocupados ya que últimamente las concentraciones que han encontrado son mucho mayores;
de hecho han planteado que en este momento la nueva variable que mide la concentración de esta
sustancia es Y = X 2. ¾Cuál es la probabilidad de que encuentren niveles de cianuro mayores a 2 en el
suministro de agua potable?
Solución:
Dado que se quiere establecer P(Y > 2), se necesita la f.d.p. de Y y dado que X es una v.a.c. y
Y = X2 es una transformación continua, uno-a-uno e invertible en RX entonces por el teorema 8.9.3
√
para valores de Y = X2 tales que 0< y < 12 se tiene que
√ d √
fY (y) = fX ( y) y
dy
√ 1

= fX ( y) 1/2
2y
1 √ 3 1
= ( y) 1/2
5, 184 2y
3/2
1 y
=
2 × 5, 184 y 1/2
1
= y 3/2−1/2
10, 368
1
= y
10, 368
de donde 1
fY (y) = 10,368 y si 0 < y < 144;
0, en otro caso.
Ahora, como el rango de X es RX = {x : 0 < x < 12} entonces el rango de Y es RY = {y : 0 < y <
144}, y por lo tanto
144
y2 1442 − 22
Z 144
1
P(Y > 2) = ydy = = = 0.999807.

10, 368 (2)(10, 368) 2 20, 736

2
8.10. Comentarios
El término modelamiento es uno de los más empleados en la disciplina estadística, porque hace
referencia a la asunción de que un fenómeno particular tiene un comportamiento descrito por algún
constructo matemático o estadístico determinado. Un ejemplo muy sencillo, pero a la vez muy ilus-
trativo es el modelamiento del resultado del lanzamiento de un dado, el cual es modelado mediante
una v.a. que sigue una distribución donde todos los resultados son igualmente probables (detalles
en la sección 9.2). Este capítulo introduce las primeras nociones involucradas con el modelamiento,
partiendo de los fundamentos de las variables aleatorias, hasta la formalización de los conceptos de
media y varianza, entre otros.
Así, en este capítulo se hace énfasis en el concepto de variables aleatoria, las diferencias entre las
variables discretas y continuas, las distribuciones probabilísticas (de masa, de densidad y acumuladas)
y la función generadora de momentos. Estos aspectos teóricos son de vital importancia para aquellos
que deseen hacer un buen uso de la estadística y comprender modelos más interesantes y sosticados.
8.11. Ejercicios
8.1 Identicar si las siguientes v.a.'s son discretas o continuas:
a. El número de transistores defectuosos en un lote de 1000 transistores.
b. El número de robos ocurridos en un almacén en un determinado período de tiempo.
c. El tiempo requerido por un bus de una ruta determinada para realizar un trayecto dado.
d. El número de pólizas de seguros vendidas en un determinado mes por un agente de seguros.
e. El tiempo de vida de un artículo.

2
f. El punto de fatiga (en kg por cm ), de un cable de acero de 1.5 cm de diámetro.
g. El tiempo que dura un semáforo, de una determinada esquina en la ciudad, en cambiar de rojo
a verde.
h. La cantidad de gasolina consumida por un vehículo en un trayecto dado.
i. El ingreso de las empresas de un sector económico determinado.
j. La proporción de individuos de una ciudad a favor de una medida económica.
8.2 Tres personas tienen entrevistas programadas para empleo durante vacaciones. En cada caso, el
resultado de la entrevista será que les ofrezcan empleo o no. Los resultados experimentales se
denen en función de los resultados de las tres entrevistas.
a. Hacer una lista de los resultados experimentales.
b. ¾La v.a. dada por la cantidad de ofertas hechas es una v.a. discreta o continua?
c. Indicar el valor de esta variable para cada uno de los puntos muestrales.
8.3 Justicar cada una de las igualdades de la demostración de la proposición 8.2.2.
8.4 ¾Por qué el porcentaje exacto de noches en el numeral c. del ejercicio 8.2.5 es igual a 82 %?
8.5 Demostrar que

lı́m e−x = 0

x→∞
.
8.6 Una empresa, que atiende pedidos por correo, tiene cinco líneas telefónicas. Sea X la v.a. que
representa el número de líneas en uso en un momento especíco. La f.d.p. de X está dada en la
siguiente tabla:
x 0 1 2 3 4 5
fX (x) 0.20 0.25 0.10 0.15 0.09 fX (x6 )
a. Calcular x6 .
b. Determinar y representar la f.d.a. de X y con esta calcular la probabilidad de cada uno de los
siguientes eventos:
1. A: a lo sumo 2 líneas están en uso.

2. B : menos de 4 líneas están en uso.
3. C : por lo menos 3 líneas están en uso.
4. D: entre 2 y 4 (ambos inclusive) líneas están en uso.
5. E : entre 2 y 5 (ambos inclusive) líneas no están en uso.
6. F : por lo menos 3 líneas no están en uso.
8.7 Una empresa de electrodomésticos ofrece a sus clientes diferentes opciones para el pago de sus
cuotas. Para un cliente seleccionado al azar, sea X la v.a. que representa el número de meses
entre pagos sucesivos. La f.d.a. de X es



 0.00, si x < 1;




 0.39, si 1 ≤ x < 4;

0.53, si 4 ≤ x < 6;
FX (x) =


 0.69, si 6≤x<8




 0.80, si 8 ≤ x < 12;

1.00, si 12 ≤ x.
a. Determinar la f.m.p. de X.
b. Calcular la probabilidad de que el número de meses entre pagos sucesivos:
1. sea estrictamente mayor que 4, pero menor o igual que 12.
2. sea estrictamente menor 4 ó mayor o igual que 8.
3. esté entre 4 y 8 meses (ambos inclusive).
4. sea mayor o igual que 8.
8.8 Determinar y justicar si las siguientes funciones son posibles ejemplos de funciones de densidad
de una v.a.c. X:
a. b.
( (
x
2, si 0 ≤ x ≤ 2; 5, si 0 ≤ x ≤ 2;
fX (x) = fX (x) =
0, en otro caso. 0, en otro caso.
c. ( d. (
e−x , si x > 0; −ex , si x > 0;
fX (x) = fX (x) =
8.9 Considerar la siguiente f.d.p. de una v.a.c. X:

( √
k x + 1, si 0 < x < 1;
fX (x) =
0, en otro caso.
Determinar el valor de k.
8.10 Considerar la v.a. X que representa las utilidades diarias (en millones de pesos) de una empresa
que pertenece a un sector económico determinado. La f.d.p. de X está dada por:
( 1 2
xe− 2 x , si x > 0;
fX (x) =
0, en otro caso.
a. Vericar que fX es una f.d.p. autentica.
b. Encontrar la f.d.a. de X.
c. ¾Cuál es la probabilidad de que las ganancias
1. sean de a lo sumo de 2 millones de pesos?
2. estén entre 1 y 2 millones de pesos?
3. no superen los 3 millones y medio de pesos?
8.11 La función de distribución de una v.a. X está dada por:
FX (x) = (1 − (1 + x)e−x )I(0,∞) (x)
a. ¾Cuál es el rango de X?
b. ¾La variable es discreta o continua?
c. Con la función de distribución calcular:
1. P(X < 2).

2. P(1 < X < 3).
3. P(X > 4).
d. Encontrar una expresión para la f.d.p. de X.
e. Calcular el valor esperado de X.
8.12 La duración en horas que un empleado tarda en hacer una tarea determinada es una v.a. X con
f.d.a. dada por:
( 1
1 − e− 20 x , si x > 0;
FX (x) =
0, en otro caso.
a. Hallar la f.d.p. de X.
b. Calcular la probabilidad de que la duración del empleado haciendo la tarea exceda las 50 horas.
c. Determinar una fórmula general para calcular un percentil p de esta distribución.
d. Calcular e interpretar el percentil 90.
8.13 Un distribuidor de computadores, vende tres modelos diferentes de computadores con capacidad
de 200 GB, 250 GB y 300 GB del disco duro. Sea X la v.a. que representa a la cantidad de
espacio del disco duro de un computador comprado por el siguiente cliente. La f.m.p. de X está
dada por:
x 200 250 300

fX (x) 0.29 0.31 x3
a. Calcular x3 .
b. Calcular e interpretar E[X] y CVX .
c. Si el precio de un computador con capacidad X GB de disco duro es Y = 15X − 3, calcular e
interpretar E[Y ] y CVY .
d. Mientras la capacidad nominal de un computador es X, la capacidad real es Z = X2 − X.
Calcular e interpretar E[Z] y CVZ .
8.14 Sea X es una v.a. y a es un número real. Demostrar que si:
a. Y = aX entonces CVX = CVY .

b. Y =X +a y a≥0 entonces CVX ≥ CVY .
c. Y =X +a y a≤0 entonces CVX ≤ CVY .
8.15 Una empresa compra varios computadores último modelo al nal de cada año. El número exacto
depende de la frecuencia de reparaciones en el año anterior. Sea X la v.a. que representa el número
de computadores último modelo que la empresa compra al nal cada año. La f.m.p. de X está
dada por:
x 0 1 2 3
fX (x) 1/4 3/16 1/4 x4
a. Calcular el x4 .
b. Calcular e interpretar E[X] y CVX .
c. Si el costo del modelo que se desea permanece jo a $2,830,451 a lo largo de este año y se
2
obtiene un descuento de $100,000X en cualquier compra, ¾cuánto espera gastar esta empresa
en nuevos computadores al nal de este año?
8.16 Una compañía fabrica paquetes de minas para portaminas. El número de minas por paquete
varía, como se indica en la tabla de abajo. El costo (en pesos) de fabricar un paquete de minas es
2X + 1, 000, donde X es el número de minas por paquete. El ingreso por la venta de un paquete,
independientemente del número de minas que contenga, es de $3,000. Si el benecio se dene como
la diferencia entre el ingreso y el costo, hallar e interpretar la media y el coeciente de variación
del benecio por paquete.
Número de minas 7 8 9 10 11 12 13
Porcentaje 0.21 0.29 0.03 0.20 0.10 0.04 0.13
2
8.17 Demostrar que si X es una v.a. entonces E X 2 ≥ (E [X]) .
8.18 Si la utilidad diaria (en millones de pesos) de un distribuidor de computadores se puede ver
como una v.a. X cuya f.d.p. está dada por:
(
2(3−x)
5 , si 0 < x < 1;
fX (x) =
0, en otro caso.
a. Hallar e interpretar el valor esperado y el coeciente de variación de la utilidad por computador.
b. ¾Cuál es la ganancia media por computador del distribuidor si la ganancia en cada uno está
dado por 2X 2 + 2X + 1?
8.19 Un vendedor recibe un salario anual de $12,000,000, más un 5 % del valor de las ventas que
realiza. Las ventas anuales pueden representarse mediante una v.a. con media $20,000,000 de
pesos y desviación típica de $2,000,000. Hallar la media y el coeciente de variación del ingreso
anual de este vendedor.
8.20 Sea X una v.a. denida por la f.d.a. dada por


 0, si x < −2;
0.4, si −2 ≤ x < 0.5;

FX (x) =

 0.8, si 0.5 ≤ x < 3;
1, x ≥ 3.

si
a. Hallar la f.m.p. de X.
b. Calcular E[X] y CVX .
8.21 Sea X una v.a. que representa las utilidades diarias (en millones de pesos) de una empresa. Esta
variable tiene f.d.p. dada por:

 0.1, si −1 ≤ x ≤ 0;
fX (x) = kx + 0.2, si 0 < x ≤ 1;
0,

en otro caso.
a. Determinar el valor de k.
b. Hallar la f.d.a. de X.
c. ¾Cuál es la probabilidad de que en un día determinado esta empresa tenga
1. ganancias?
2. pérdidas?
3. ganancias superiores a $500,000?
4. pérdidas superiores a un $1,000,000?
d. Calcular e interpretar P(0 ≤ X ≤ 0.5) y P(X > 0.5|X > 0.1).

e. Calcular e interpretar E[X] y CVX .

f. Si las utilidades aumentan 8.5 % calcular e interpretar nuevamente el valor esperado y el coe-
ciente de variación.
8.22 La cantidad aleatoria de dinero ahorrado por una persona en un mes tiene la siguiente f.d.a.:

 0, si x < 0;
x

 2,

 si 0 ≤ x < 1;
1
FX (x) = 2, si 1 ≤ x < 2;
x
 4, 2 ≤ x < 4;


 si
x ≥ 4.

1, si
donde la v.a. X está expresada en cientos de dólares.
a. Calcular la función de probabilidad de X.

b. Determinar la probabilidad de que, en un mes la cantidad de dinero ahorrado sea
1. superior a 200 dólares.
2. inferior a 450 dólares.
3. superior a 50 dólares y menor ó igual a 250 dólares.
c. Calcular el ahorro mensual medio y el coeciente de variación correspondiente.
d. Calcular nuevamente el ahorro mensual medio y el coeciente de variación si el ahorro mensual

aumenta 100 dólares.
8.23 La demanda X, expresada en toneladas, de un determinado producto es una v.a. cuya f.d.p. es:
x

k, si 2 ≤ x ≤ 4;
fX (x) =
0, en otro caso.
b. Calcular e interpretar la media y la mediana de X.
c. Calcular e interpretar el coeciente de variación de X.
d. El fabricante del producto sabe que cada kilo vendido reporta un benecio de 12 dólares, y
cada kilo que queda sin vender supone una pérdida de 6 dólares. Es por tanto, importante
para él establecer cuál es la cantidad a fabricar. Si el criterio para establecer dicha cantidad es
maximizar la ganancia esperada, determinar cuál es la fabricación óptima.
8.24 Una caja contiene 8 artículos, de los cuales 3 son defectuosos. Se selecciona un artículo de la caja
y se prueba. Si éste sale defectuoso se selecciona y se prueba otro artículo, hasta que se escoja
uno que no sea defectuoso. Hallar el número esperado de artículos seleccionados.
8.25 Sea X una v.a. cuya f.d.a. está dada por:


 0, si x ≤ 0;
FX (x) = x3 , si 0 < x < 1;
1, x ≥ 1.

si
Se pide:
a. La f.d.p. de X.
b. El valor esperado de X y el coeciente de variación de X.
c. La mediana de X.
d. El coeciente de variación de 1.2X + 1.
8.26 El tiempo (en días) que tarda un administrador en hacer una auditoría su puede modelar con la
f.d.p. dada por:
fX (x) = k(x + 1)I(2,4) (x)
a. Determinar el valor de la constante k.

c. Con la f.d.a. calcular la probabilidad de que el administrador tarde:
1. más de 3 días en hacer la auditoria.
2. a lo más 2.5 días en hacer la auditoria.
3. entre 3 y 3.5 días en hacer la auditoria.
d. Calcular e interpretar E [X] y CVX .

e. Teniendo en cuenta que si hay retrasos logísticos el tiempo que tarda un administrador en
hacer la auditoria aumenta en 1.5 días, calcular nuevamente el valor esperado y el coeciente
de variación. Comparar los resultados con los obtenidos en el numeral anterior.
8.27 Teniendo en cuenta que

E (X − µX )4
ξX = −3
(E [(X − µX )2 ])2
es una medida de apuntamiento de la distribución de X y que
h i
2
= E (X − E [X])3 /(E (X − E [X]) )3/2

ψX
es una medida de simetría de la distribución de X, se pide calcular e interpretar E [X], CVX , ξX

y ψ para cada una de las siguientes densidades
a. b. c.
k
fX (x) = kxex I(−100<x<0) (x). fX (x) = k log(x)I(1<x<17) (x). fX (x) = I(−51<x<−17) (x).
x
No olvidar calcular el valor de k en cada caso.
8.28 Sea X una v.a. que representa el tiempo (en horas) que tarda un empleado en ejecutar una labor
administrativa cuya f.d.p. está dada por:
k(x2 + 1),

si 0 < x < 3;
fX (x) =
0, en otro caso.
Se pide:
c. Calcular e interpretar E[X] y CVX .
d. Hallar e interpretar la probabilidad de que X esté comprendida entre 1 y 2.
e. Calcular e interpretar P(X < 1), P(X < 2|X > 1) y P(|X − µX | ≥ 2σX ).
8.29 Con objeto de establecer un plan de producción, una empresa ha estimado que la demanda alea-
toria de sus potenciales clientes se comportará semanalmente de acuerdo con la f.d.p.dada por:
3
− 2x2 ),

8 (4x si 0 ≤ x ≤ 2;
fX (x) =
0, en otro caso.
donde la v.a. X está expresada en millones de unidades. ¾Qué cantidad c deberá tener dispuesta
a la venta, al comienzo de cada semana, para poder satisfacer la demanda en dicho periodo con
una probabilidad de 0.5?
8.30 La duración en horas que un empleado tarda en hacer una tarea es una v.a.c. X cuya f.d.p. está
dada por:
100

fX (x) = x2 , x > 100;
0, en otro caso.
Se pide:
a. Calcular la f.d.a. de X.
b. Calcular e interpretar las siguientes probabilidades:
1. P(X > 110).

2. P(120 < X ≤ 150).
3. P(X ≤ 180).
c. Calcular e interpretar la probabilidad de que un empleado tarde menos de 200 horas si se sabe
que este trabajador durará haciendo la tarea más de 150 horas.
d. Hallar e interpretar E[X] y CVX .

e. Calcular e interpretar los cuartiles.
8.31 Con objeto de establecer un plan de producción, una empresa ha estimado que la demanda alea-
toria de sus potenciales clientes se comportará semanalmente con arreglo a la ley de probabilidad
denida por la función de densidad
3
− 2x2 ),

8 (4x si 0 ≤ x ≤ 2;
fX (x) =
0, en otro caso.
donde X viene expresada en millones de unidades. ¾Qué cantidad C deberá tener dispuesta a la
venta, al comienzo de cada semana, para poder satisfacer la demanda en dicho periodo con una
probabilidad de 0.5?
8.32 El tiempo de vida (en cientos de horas) de un artículo es una v.a. con f.d.a. dada por:

0, si x < 0;
FX (x) = 2
1 − e−x , si x ≥ 0.
Se pide:
a. Obtener la f.d.p. de X.
b. Calcular la probabilidad de que un determinado artículo dure más de 200 horas.
8.33 Sea una v.a. X, que tiene como f.d.p.:
x+6

k , si −6 ≤ x ≤ 4;
fX (x) =
0, en otro caso.
d. Hallar c si P(c < x < c + 1) = 0.09.
8.34 Sea X una v.a. que mide el precio de los productos vendidos en una tienda en decenas de miles
de pesos. La f.d.p. es
kxk−1 ,

si 0 < x < 1;
fX (x) =
0, en otro caso.
c. Calcular e interpretar P(0.3 < X < 0.8).
d. Calcular e interpretar E[X] y CVX .
e. Calcular la mediana de X.
8.35 Una v.a. X tiene la siguiente f.d.p.
1

 49 (7
+ x), si −7 ≤ x ≤ 0;
fX (x) = k(7 − x), si 0 < x ≤ 7;
0,

en otro caso.
Determinar el valor de k.
8.36 Una v.a. X tiene como f.d.p. la función

1 − mx, si 2 ≤ x ≤ 4;
fX (x) =
0, en otro caso.
Se pide:
a. Determinar el valor de m.
b. Calcular la f.d.a. de X.
d. Calcular e interpretar los cuartiles.
8.37 Se tiene una v.a. denida como en el ejemplo 8.2.5. Ahora el interés es la v.a. Y = 2X + 1. Se
pide:
a. La f.d.p. de Y.
b. Calcular E[Y ] con base en fY .
c. Calcular E[Y ] con base en E[X].
8.38 Teniendo en cuenta la v.a. X denida en el ejemplo 8.1.1, si se realizan apuestas alrededor de los
resultados de la variable X , obteniendo las siguientes ganancias: 5,000 si X toma el valor 1, 3,000
si toma el valor 2, 500 si toma el valor 3 y 0 si toma el valor 0. Determinar:
a. La f.m.p. de las ganancias.
b. La ganancia esperada y la varianza de las ganancias.
c. La f.g.m. de X.
d. La f.g.m. de las ganancias.
8.39 Para estudiar la variable X que representa el tiempo (en minutos) en el que una célula encuentra
el alimento (como en el ejemplo 8.3.2) se ha propuesto la siguiente f.d.a. dada por:
FX (x) = 1 − e−x/5 I(0,∞) (x).
Se tiene la hipótesis que el tiempo en el que una célula encuentra el alimento esta relacionado con
el tamaño de la célula mediante una relación directa denida por Y = 0.15X + 0.8.
a. Determinar la f.d.p. de Y.
b. Calcular e interpretar E [X] y CVX .
c. Encontrar la f.g.m. de X, si existe.
d. Calcular por medio de la f.g.m. el primer y segundo momento de X.

e. Comparar los resultados con los obtenidos en numerales anteriores.
f. Realizar una gráca de la f.g.m. de X y de su primera y segunda derivada.
8.40 La v.a. que representa la proporción de accidentes automovilísticos fatales en una ciudad (como
en el ejemplo ??), tiene la f.d.p. dada por:
42x(1 − x)5 ,

si 0 < x ≤ 1;
fX (x) =
0, en otro caso.
a. Calcular e interpretar E [X] y CVX .

b. Calcular e interpretar µ̃X y µ̆X .
c. Calcule P(|X − 0.25| ≤ 0.1).

d. Obtener una cota para la probabilidad de encontrar proporciones de accidentes que disten en
0.1 de la proporción de accidentes esperada, empleando la media y la varianza de la proporción
de accidentes.
8.41 Se está trabajando con la hipótesis de que el ritmo cardíaco (en latidos por minuto (lpm)) de las
personas sin problemas cardíacos sigue la f.d.p. dada por:
fX (x) = k(110 − X)2 I[0,200] (x).
Se cree que el ritmo cardíaco de las personas que sufren de taquicardia se relacionan con un nivel
estable en el ritmo cardíaco bajo la relación 2(X − 10). Se quiere determinar:
a. El valor de k.
b. La probabilidad de que una persona sin problemas cardíacos tenga su ritmo cardíaco:
1) entre 80 y 140 lpm.
2) abajo de 60 lpm.
3) arriba de 200 lpm.
4) La probabilidad de que una persona sin problemas cardíacos tenga su ritmo cardíaco a lo
más a 30 lpm del ritmo cardíaco esperado de una persona sin problemas cardíacos.
c. Una cota para la probabilidad de que una persona sin problemas cardíacos tenga su ritmo
cardíaco a lo mas a 30 lpm del ritmo cardíaco esperado de una persona sin problemas cardíacos.
8.42 Un laboratorio está tratando de replicar el ambiente de los bosques tropicales. Para esto deben
simular varias de las condiciones climáticas que allí se presentan como por ejemplo la pluviosidad.
En particular, para esta característica están manejando el siguiente sistema probabilístico:
fX (x) = k|30 − X|I[1,90] (x).
Con esta información se quiere:
a. El valor de k.
b. El valor esperado y el coeciente de variación de la pluviosidad.
2
c. La mediana y la moda de la pluviosidad.
d. La f.g.m. de la pluviosidad, si existe.
e. Una cota para la probabilidad de que la pluviosidad se encuentre máximo a 7 unidades de la

pluviosidad esperada.
f. La probabilidad exacta del numeral anterior.
Además, para simular la temperatura, utilizan la siguiente relación:
T = 50 − P/2.
donde T es la temperatura y P la pluviosidad. Calcular nuevamente lo numerales anteriores para

la temperatura.
2 Sea X una v.a. con f.m.p. fX si X es discreta o con f.d.p. fX si X es continua. Una moda de X (si existe), denotada
con µ̆X , es el número real que maximiza globalmente fX .
8.43 La concentración (en porcentaje) de endornas producidas por cierto organismo se rige por la
f.d.p. dada por:
1
fX (x) = (0.005120709)e 2,000 x I[15,200] (x)
Se quiere determinar:
a. La media y el coeciente de variación de la concentración de endornas.
b. La mediana y la moda de la concentración de endornas.
c. Una cota para la probabilidad de que la concentración de endornas sea mayor a 150. Suge-
rencia : emplear el teorema 8.7.1.
d. Una cota para la probabilidad de que la concentración de endornas se encuentre a una distancia
de la media no menor a 30.
e. La probabilidad exacta de los dos numerales anteriores.
8.44 Determinar la f.g.m. de la v.a. X con f.d.p. dada por:

1 − |x|, si −1 < x < 1;
fX (x) =
0, en otro caso.
8.45 Sea X una v.a.d. con f.m.p. dada por:
k

fX (x) = 4x , si x = 1, 2, 3, . . .;
0, en otro caso.
Hallar el valor de k.
8.46 Demostrar que si f y g son f.d.p. y λ es una número real tal que 0 < λ < 1 entonces λf + (1 − λ)g
también es una f.d.p..
8.47 Sea X una v.a. y a y b números reales. Establecer si cada expresión es falsa o verdadera y justicar.
a. Var[X] ≥ 0.
b. Var[aX] = a2 V ar[X].
c. Var[X + b] = V ar[X].
8.48 En una investigación se considera la variable X que representa el porcentaje de reactivo disuelto
en la tierra. Se desconoce la distribución probabilística de X , lo cual representa un inconveniente
para el aval comercial de la investigación, ya que se debe garantizar que los valores de X no van
a distar en más de 13.5 puntos porcentuales de la media, con una probabilidad de 0.975. Lo único
2
que se puede asegurar de la variable es que µX = 0.5 y que σX = 8.4. ¾Qué se puede decir acerca
del aval comercial de la investigación?
8.49 Calcular el valor de k para que la siguiente función sea una f.d.p.:
x2 , 0 < x2 < k ;

si
f (x) =
0, en otro caso.
¾Cuál es la media, la varianza y función generadora de momentos de una variable con esta distri-
bución?
Capı́tulo 9
Distribuciones discretas
9.1. Introducción
Se ha visto en el capítulo 8 el concepto de v.a. distinguiendo dos tipos: discretas y continuas. A

continuación se estudian algunas distribuciones probabilísticas de uso común que son de especial
importancia porque representan los modelos teóricos de los fenómenos aleatorios más frecuentes.
Como se sabe, la distribución probabilística de una v.a.d. X está denida si se conoce su f.m.p. fX (·)
o su f.d.a. FX (·). Además, cuando se tiene la distribución probabilística de X , es posible determinar el
valor esperado, la varianza y la f.g.m., que permiten obtener las medidas estadísticas que caracterizan
la variable de estudio.
9.2. Distribución uniforme discreta
La distribución uniforme discreta tiene lugar cuando el rango de una v.a. es un conjunto nito cuyos
valores son equiprobables.
254
9.2. DISTRIBUCIÓN UNIFORME DISCRETA 255
Denición 9.2.1. Se dice que una v.a.d. X que asume los valores
x1 , x2 , . . . , xn tiene una distribución uniforme discreta de paráme-
tro n si la f.m.p. de X está dada por:
1
fX (x; n) = n , si x = x1 , x2 , . . . , xn ;
0, en otro caso.
donde n es un número entero positivo.
Nota. Cuando una v.a. X tiene distribución uniforme discreta de parámetro n se escribe X ∼ U (n).
1
Es claro que caso todos los valores de del rango de X tienen la misma probabilidad, a saber,
n.
Proposición 9.2.1. Si X es una v.a. tal que X ∼ U (n) entonces:
n2 −1
n+1 1
Pn
i. E[X] = 2 . ii. Var[X] = 12 .
iii. mX (t) = n i=1 eit .
Demostración:
i.
n n n
X X 1 1X 1 n(n + 1) (n + 1)
E[X] = xi fX (xi ) = i· = i= = .
i=1 i=1
n n i=1 n 2 2
ii.
n 2 n
1 X 2 (n + 1)2

2
X n+1
Var[X] = E X 2 − (E[X]) = x2i fX (xi ) −

= i −
i=1
2 n i=1 4
1 n(n + 1)(2n + 1) (n + 1)2 4(n + 1)(2n + 1) − 6(n + 1)2
= − =
n 6 4 24
2(n + 1)(2(2n + 1) − 3(n + 1)) (n + 1)(4n + 2 − 3n − 3)
= =
24 12
(n + 1)(n − 1) n2 − 1
= = .
12 12
iii.
n n n
X X 1 1 X it
mX (t) = E eXt = exi t fX (xi ) = exi t =

e .
i=1 i=1
n n i=1

256 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
Figura 9.1: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución uniforme discreta de parámetro
n = 6.
Ejemplo 9.2.1. Se considera el experimento aleatorio en el que se lanza un dado corriente una vez.
Sea X la v.a. denida por el resultado obtenido en el lanzamiento. En este caso X es una v.a.d.
con distribución uniforme de parámetro n = 6, es decir, X ∼ U (6), dado que todos los resultados del
experimento son equiprobables. Así, se sigue que
1

fX (x; 6) = 6, si x = 1, 2, 3, 4, 5, 6;
0, en otro caso.
Además, se tiene que:
n+1 6+1 7
i. E[X] = 2 = 2 = 2 = 3.5.
n2 −1 62 −1
ii. Var[X] = 12 = = 2.971.
12
1
Pn it 1
P6 it
iii. mX (t) = n i=1 e = 6 i=1 e .
En la gura 9.1 se presenta el gráco de la f.m.p. y de la f.d.a. de una variable con distribución
uniforme discreta de parámetro n = 6.
Nota. La f.m.p. de una v.a. con distribución uniforme de parámetro n está constituida por n líneas
del mismo tamaño que se distribuyen a lo largo del eje de las abscisas sobre los valores que asume la
9.3. DISTRIBUCIÓN DE BERNOULLI Y BINOMIAL 257
variable. Por tal motivo, los saltos que se observan en la f.d.a. son constantes y equivalentes al tamaño
de cada línea de la f.m.p. en cada elemento del rango de la variable.
9.3. Distribución de Bernoulli y binomial
La distribución de Bernoulli es una distribución de probabilidad que consiste en la observación de

un experimento aleatorio con dos posibles resultados donde únicamente es posible obtener alguno de
ellos. Un experimento con estas características se conoce como experimento de Bernoulli . A uno
de los resultados del experimento se le denomina éxito, con probabilidad de ocurrencia π , y al otro se
le llama fracaso, con probabilidad de ocurrencia 1 − π , donde π es un número real tal que 0 < π < 1.
La distribución binomial está conformada por n repeticiones idénticas e independientes de un expe-

rimento de Bernoulli. Así, un experimento binomial consta de n experimentos de Bernoulli que
se realizan de forma independientemente, esto es, la realización de cualquier experimento no inuye
sobre el resultado de cualquier otro. La distribución binomial se usa comúnmente cuando el muestreo
se hace con reemplazo.
Denición 9.3.1. Se dice que una v.a.d. X que asume valores 0, 1, . . . , n

tiene una distribución binomial de parámetros n y π si la f.m.p. de
X está dada por:
n

π x (1 − π)n−x ,

x si x = 0, 1, . . . , n;
fX (x; n, π) =
0, en otro caso.
donde n es un entero positivo y π es un número real tal que 0 < π < 1.
Nota. Cuando una v.a. X tiene distribución binomial de parámetros n y π se escribe X ∼ Bin(n, π).
Además, cuando n = 1, la distribución binomial recibe el nombre de distribución de Bernoulli de
parámetro π, denominada así en honor a Jakob Bernoulli 1
, lo que se escribe X ∼ Ber(π).
La distribución de Bernoulli se usa frecuentemente en la descripción de aquellos experimentos en los

que incumbe la ocurrencia o no ocurrencia de un suceso. Si la v.a. X denota el número de éxitos en
n ensayos independientes de un experimento de Bernoulli entonces X tiene distribución binomial de
parámetros n y π, donde π denota la probabilidad de éxito, es decir, la probabilidad de que ocurra el
suceso de interés.
Proposición 9.3.1. Si X es una v.a. tal que X ∼ Bin(n, π) entonces:
1 Fotografía tomada de la página web http://www.mathematik.ch/mathematiker/jakob_bernoulli.php.

i. E[X] = nπ , ii. Var[X] = nπ(1 − π). iii. mX (t) = (πet + 1 − π)n .
Demostración:
Primero se demuestra a que corresponde la f.g.m. de la variable y luego utilizando las propiedades de
esta función se obtienen el valor esperado y la varianza como sigue:
iii.
mX (t) = E eXt

Xn
= eit fX (i; n, π)
i=0
n
X n i
= eit
π (1 − π)n−i
i=0
x
n
X n i
= πet (1 − π)n−i
i=0
x
= (πet + 1 − π)n .
i.
d
= n(πet + 1 − π)n−1 πet = n(π + 1 − π)n−1 π = nπ.

E[X] = mX (t)
dt t=0 t=0
ii.
2
Var[X] = E X 2 − (E[X])

d2

− (nπ)2

= 2 mX (t)
dt t=0

t n−2 t t t n−1 t
− n2 π 2

= nπ (n − 1)(πe + 1 − π) πe e + (πe + 1 − π) e
t=0
= nπ (n − 1)(π + 1 − π)n−2 π + (π + 1 − π)n−1 − n2 π 2

= nπ ((n − 1)π + 1) − n2 π 2
= n2 π 2 − nπ 2 + nπ − n2 π 2
= nπ(1 − π).

Figura 9.2: Jakob Bernoulli (1654-1705).
Ejemplo 9.3.1. Una empresa farmacéutica desarrolló un nuevo medicamento y lo suministró a 10

enfermos elegidos aleatoriamente. La experiencia ha demostrado que 30 % de las personas que padecen
la enfermedad se recupera al tomar dicho medicamento. ¾Cuál es la probabilidad de que por lo menos
nueve de las 10 personas que toman el medicamento se recuperen?
Solución:
En este caso se tiene que la v.a. de estudio es el número de personas en la muestra de 10 pacientes
que se recupera de la enfermedad. En este caso el éxito consiste en recuperarse de la enfermedad y
esto ocurre con una probabilidad de 0.3. En consecuencia, la f.m.p. de X es
10 x 10−x
fX (x; 10, 0.3) = x (0.3) (0.7) , si x = 0, 1, . . . , 10;
0, en otro caso.
Además, se pide calcular la probabilidad de que por lo menos nueve de las 10 personas que toman el
medicamento se recuperen, esto es, P(X ≥ 9). Así,
P(X ≥ 9) = P(X = 9; X = 10)

= P(X = 9) + P(X = 10)

10 9 10−9 10
= (0.3) (0.7) + (0.3)10 (0.7)10−10
9 10
= 0.000138 + 0.000006
= 0.000144.
Por lo tanto, la probabilidad de que por lo menos nueve de las 10 personas que toman el medicamento
se recuperen es de 0.0144 %.
De otra parte, se observa que:
i. E[X] = 10(0.3) = 3. Este valor indica que se espera la recuperación de 3 enfermos de una muestra
aleatoria de 10 pacientes.
ii. Var[X] = 10(0.3)(0.7) = 2.1.
iii. mX (t) = (0.3et + 1 − 0.3)1 0 = (0.3et + 0.7)10 .
binomial de parámetros n = 10 y π = 0.3.
Figura 9.3: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial de parámetros n = 10
y π = 0.3.
Ejemplo 9.3.2. Un vendedor de seguros sabe por experiencia que la oportunidad de vender un plan
es mayor mientras más contactos realice con los clientes potenciales. Empíricamente estableció que la
probabilidad de que una persona le compre un plan, luego de la visita, es constante e igual a 0.01.
Si el conjunto de visitas que realiza el vendedor es un conjunto independiente de ensayos, ¾cuántos
compradores potenciales debe visitar para que la probabilidad de vender por lo menos un plan sea
igual a 0.85?
Solución:
Se dene a la v.a. X como el número de clientes que compran el plan luego de la visita del vendedor.
Dadas las condiciones de la situación, se tiene que el éxito corresponde a la compra del plan, luego de
la visita y por lo tanto X tiene distribución binomial de parámetros n y π = 0.01. Así, la f.m.p. de X
es
n

(0.01)x (0.99)n−x ,

x si x = 0, 1, . . . , n;
f( x; n, 0.01) =
0, en otro caso.
Se busca determinar n de forma que

P(X ≥ 1) = 0.85
o equivalentemente
1 − P(X = 0) = 0.85.
Luego,
1 − 0.85 = P(X = 0)

n
0.15 = (0.01)0 (0.99)n−0
0
0.15 = (0.99)n
ln(0.15) = ln ((0.99)n )
ln(0.15) = n ln (0.99)
ln(0.15)
n=
ln (0.99)
n = 188.76.
En consecuencia el vendedor debe visitar por lo menos a 189 clientes para lograr su objetivo.
Ejemplo 9.3.3. Un agente de seguros vende pólizas a cinco individuos, todos de la misma edad. De
acuerdo con las tablas actuariales, la probabilidad de que un individuo con esa edad viva 30 años más
es de 3/5. Determinar la probabilidad de que dentro de 30 años vivan: a. Los cinco individuos. b. Al
menos tres. c. Sólo dos. d. Al menos uno.
Solución:
En este caso, es posible identicar una variable de Bernoulli, ya que dentro de 30 años se pueden
presentar dos situaciones: que la persona esté viva aún (con probabilidad π = 3/5) ó que haya muerto
(con probabilidad 1−π = 2/5). En consecuencia, se tiene una v.a. X dada por el número de individuos
que aún continúan vivos luego de 30 años de los cinco clientes a los que se les ha vendido la póliza,
con distribución binomial de parámetros n=5 y π = 0.6, esto es, X ∼ Bin(5, 0.6). Por lo tanto, la
f.m.p. de X es
5

(0.6)x (0.4)5−x ,

x si x = 0, 1, . . . , 5;
fX (x; 5, 0.6) =
0, en otro caso.
Se pide calcular:
a.
5
P(X = 5) = (0.6)5 (0.4)5−5 = (0.6)5 = 0.07776
5
.
b.
P(X ≥ 3) = P(X = 3; X = 4; X = 5)
= P(X = 3) + P(X = 4) + P(X = 5)

5 5 5
= (0.6)3 (0.4)5−3 + (0.6)4 (0.4)5−4 + (0.6)5 (0.4)5−5
3 4 5
= 0.68256.
c.
5
P(X = 2) = (0.6)2 (0.4)5−2 = 0.2304.
2
d.
5
P(X ≥ 1) = 1 − P(X = 0) = 1 (0.6)0 (0.4)5−0 = 1 − 0.01024 = 0.98976.
0
binomial de parámetros n=5 y π = 0.6.
Nota. El numeral b. del ejemplo 9.3.3 también se puede calcular como
P(X ≥ 3) = 1 − P(X < 3) = 1 − (P(X = 0) + P(X = 1) + P(X = 2))1 − FX (2).
El lector decidirá en aplicaciones futuras qué le puede resultar más fácil.
Nota. La distribución de probabilidad binomial es simétrica si π = 1 − π . Si π < 1 − π entonces la

distribución es sesgada positivamente, mientras que si π > 1 − π entonces la distribución es sesgada
negativamente. Este hecho se aprecia claramente en la gura 9.5.
9.4. DISTRIBUCIÓN HIPERGEOMÉTRICA 263
Figura 9.4: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial de parámetros n=5 y
π = 0.6.
Figura 9.5: Grácos de la f.m.p. de una distribución binomial de parámetros n = 10 y π = 0.25, n = 10 y π = 0.50, y
n = 10 y π = 0.75.
9.4. Distribución hipergeométrica
Ahora se consideran experimentos que obedezcan las propiedades de un experimento binomial, pero
debilitando la propiedad de independencia entre los experimentos de Bernoulli individuales. Este nuevo
tipo de experimento aleatorio se llama experimento hipergeométrico y se usa comúnmente cuando

el muestreo se hace sin reemplazo.
En general, un experimento hipergeométrico de parámetros n, M y N está basado en las siguientes

suposiciones:
i. La población o conjunto donde se deba hacer el muestreo es una población nita con N elementos.
ii. Cada elemento de la población se puede caracterizar como un éxito (tiene la característica de
interés) o como un fracaso (no tiene la característica de interés).
iii. Hay M elementos en la población que tienen la característica de interés.
iv. Se elige una muestra aleatoria sin reemplazo de n individuos, de tal forma que sea igualmente
probable seleccionar cualquier subconjunto de tamaño n.
Denición 9.4.1. Se dice que una v.a. X tiene una distribución hipergeo-
métrica de parámetros n, M y N si la f.m.p. de X esta dada por:
 M N −M
 ( x )( n−x )
, si x = máx{0, n + M − N }, . . . , mı́n{n, M };
fX (x; n, M, N ) = (Nn )
 0, en otro caso.
donde n, M y N son números enteros no negativos tales que n≤N y M ≤ N.
Nota. Cuando una v.a. X tiene distribución hipergeométrica de parámetros n, M y N se escribe

X ∼ Hg(n, M, N ). Así, cuando la variable objeto de estudio denota el número de éxitos en n ensayos
dependientes de un experimento de Bernoulli, es pertinente el uso de la distribución hipergeométrica.
Ejemplo 9.4.1. Considerando que se tiene un total de 10 objetos, tres de los cuales son defectuosos,
si se seleccionan cuatro objetos al azar y sin reemplazo, ¾cuál es la probabilidad de que dos sean
defectuosos?
Solución:
Se tiene que la v.a. de interés X es el número de objetos en la muestra seleccionada que son defec-
tuosos; dadas las condiciones, esta variable tiene distribución hipergeométrica de parámetros n = 4,
M =3 y N = 10, esto es, X ∼ Hg(4, 3, 10). Así, la f.m.p. de X está dada por:
 3 7
 (x)(4−x)
, si x = 0, 1, . . . , 3;
fX (x; 4, 3, 10) = (10
4)
En consecuencia, la probabilidad pedida es

3 7

2 4−2
P(X = 2) = 10
= 0.300.
4
hipergeométrica de parámetros n = 4, M = 3 y N = 10.
Figura 9.6: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución hipergeométrica de parámetros
n = 4, M = 3 y N = 10.
Ejemplo 9.4.2. Para evitar que lo descubran en la aduana, un viajero ha colocado seis tabletas de un
narcótico en una botella que contiene nueve píldoras de vitamina que son similares en apariencia. Si el
ocial de la aduana selecciona tres tabletas aleatoriamente para analizarlas, ¾cuál es la probabilidad
de que el viajero sea arrestado por posesión de narcóticos? ¾Cuál es la probabilidad de que no sea
arrestado por posesión de narcóticos?
Solución:
Se tiene que la variable de interés X es el número de narcóticos en la muestra seleccionada; es claro

que dadas las condiciones del problema se tiene que el mecanismo de selección es sin reemplazo, y en
consecuencia X tiene distribución hipergeométrica. Así, se obtiene que n = 3, M = 6 y N = 9+6 = 15.
De esta forma la f.m.p. de X es
 6 9
 (x)(3−x)
, si x=0,1,2,3;
fX (x; 3, 6, 15) = (15
3)
Por lo tanto, la probabilidad de que el viajero sea arrestado por posesión de narcóticos es
P(X ≥ 1) = P(X = 1; X = 2; X = 3)
= P(X = 1) + P(X = 2) + P(X = 3)

6
9 6
9 6
9
1 3−1 2 3−2 3 3−3
= 15
+ 15
+ 15

3 3 3
216 135 20
= + +
455 455 455
= 0.8153.
En consecuencia, la probabilidad de que el viajero no sea arrestado por posesión de narcóticos es

P(X = 0) = 1 − 0.8153 = 0.1846.
Nota. La primera probabilidad del ejemplo 9.4.2 también se puede calcular usando el complemento,
C

es decir, por medio de la propiedad P(A) = 1 − P A donde A es un evento. De esta forma
P(X ≥ 1) = 1 − P(X = 0)
6
9
0 3−0
=1− 15

3
84
=1−
455
= 0.8153.
Ejemplo 9.4.3. Un equipo de trabajo establecido por el Ministerio de Medio Ambiente, programó
visitas a dos fábricas para investigar posibles violaciones a los reglamentos para el control de conta-
minación ambiental. Sin embargo, los recortes presupuestales han reducido drásticamente el tamaño
del equipo de trabajo por lo que solamente se podrán investigar cinco de las 25 fábricas. Si se sabe
que 10 de las fábricas están operando sin cumplir los reglamentos, calcular la probabilidad de que al
menos una de las fábricas muestreadas esté operando en contra del reglamento.
Solución:
Se dene la v.a. X como el número de fábricas en la muestra seleccionada que operan sin cumplir los
reglamentos; de acuerdo con las características del problema se supone que el muestreo se hace sub
reemplazo y por lo tanto se sigue que X ∼ H(5, 10, 25). Así, la probabilidad pedida es
5
X
P(X ≥ 1) = P(X = i)
i=1
= 1 − P(X = 0)
10 15

0
=1− 25
5
5
= 0.9434.
En consecuencia, la probabilidad de que al menos una de las fábricas muestreadas esté operando en
contra al reglamento es 0.9434.
Ejemplo 9.4.4. Una compañía recibe un pedido de 20 artículos. Dado que la inspección de cada ar-
tículo es cara, se sigue la política de analizar una muestra sin reemplazo de seis artículos de cada envío,
aceptando la remesa si no hay más de un artículo defectuoso en la muestra. ¾Cuál es la probabilidad

de que sea aceptado un pedido con cinco artículos defectuosos?
Solución:
Sea X la v.a. dada por el número de artículos defectuosos en la muestra seleccionada. En este caso
se tiene que X ∼ H(6, 5, 20). Entonces, la probabilidad pedida es
P(X ≤ 1) = P(X = 0; X = 1)
= P(X = 0) + P(X = 1)
5 20−5 5 20−5

0 6−0 1 6−1
= 20
+ 20

6 6
= 0.516.
Así, la probabilidad de que sea aceptado un pedido con cinco artículos defectuosos es 0.516.
Una aplicación muy útil de la distribución hipergeométrica consiste en hallar un valor aproximado
del tamaño de una población sin necesidad de enumerar sus elementos uno por uno. Este método se
conoce como el método de captura-recaptura y consiste en capturar M individuos de la población,
marcarlos y luego devolverlos a la población. Una vez los individuos se mezclan homogéneamente, se
toma sin reemplazo una muestra de tamaño n. Si X denota la v.a. dada por el número de individuos
marcados en la muestra se sigue que X n, M y N .
tiene distribución hipergeométrica de parámetros
En un momento dado, se observa la variable X y se obtiene el valor x0 , por ejemplo. En Blanco (2004,
p. 107) se demuestra que un posible valor de N que maximiza la probabilidad de que X sea igual a
b , es un estimador2 de N . Tal estimador se conoce como estimador de máxima
x0 , denotado con N
verosimilitud y está dado por

nM
N=
b
x0
donde [a] denota la parte entera de a.
Proposición 9.4.1. Si X es una v.a. tal que X ∼ H(n, M, N ) entonces:
N −n
i. E[X] = n M
N. ii. Var[X] = n M
N 1−
M
N N −1 .
La demostración se puede consultar en Blanco (2004, p. 108).
Ejemplo 9.4.5. Con la información del ejemplo 9.4.2, calcular el valor esperado y la varianza del
número de narcóticos en la muestra seleccionada.
Solución:
2 Un estimador es una función de una muestra aleatoria que se utiliza para estimar un parámetro desconocido de
la población.
Como X ∼ H(3, 6, 15) entonces se tiene que el valor esperado del número de narcóticos en la muestra
seleccionada es
M 6
E[X] = n =3 = 1.2
N 15
con varianza

M M N −n 6 6 15 − 3
Var[X] = n 1− =3 1− = 0.6171.
N N N −1 15 15 15 − 1
Nota. La razón M/N corresponde a la proporción de éxitos de la población. Si se sustituye M/N por
π en las fórmulas de la proposición 9.4.1 se obtiene que:

i. E[X] = nπ . N −n
ii. Var[X] = nπ(1 − π) N −1 .
La expresión anterior evidencia que el valor esperado de la distribución binomial y de la distribución

hipergeométrica coinciden, mientras que la varianza de las dos distribuciones dieren por el factor
(N −n)/(N −1), a veces denominado factor de corrección por población nita. Este factor es menor
que 1, así que la distribución hipergeométrica tiene menor varianza que la distribución binomial. El
factor de corrección se puede escribir como
n
1− N
1
1− N
que es aproximadamente igual a 1 cuando el tamaño de la población es muy grande, esto es, cuando
N −→ ∞. Una regla de uso frecuente establece que el factor de corrección se puede pasar por alto
cuando n/N ≤ 5 %, es decir, cuando la muestra contiene menos del 5 % de los elementos de la población.
Si esto sucede entonces las distribuciones binomial e hipergeométrica coinciden como se muestra en la
proposición 9.4.2.
En cuanto a la toma de muestras se reere, la distribución hipergeométrica diere de la distribución

binomial en la forma en que se ejecuta el muestreo aleatorio: en la distribución hipergeométrica el
muestreo se hace sin reemplazo, mientras que en la distribución binomial se hace con reemplazo, pero
como se ha dicho, cuando n/N ≤ 5 %, este hecho no marca ninguna diferencia.
Proposición 9.4.2. Seann, M y N los parámetros de una distribución hipergeométrica y π un

M
número real tal que 0 < π < 1. Si N −→ π cuando N −→ ∞ y M → ∞, entonces
M N −M

x n−x n x
N
−→ π (1 − π)n−x
n
x
donde x es un elemento del rango de una v.a. con distribución binomial de parámetros n y π.
La demostración de esta proposición está fuera de los intereses de este libro. La demostración se puede
consultar en Blanco (2004, p. 110).
Ejemplo 9.4.6. En el ejemplo 9.4.2, ¾hubiera sido recomendable utilizar la distribución binomial en
lugar de la distribución geométrica?
Solución:
Dado que n/N = 3/15 = 0.20 > 5 % entonces no se recomienda utilizar la distribución binomial en la
lugar de la distribución geométrica para realizar los cálculos respectivos.
Ejemplo 9.4.7. El Ministerio de Salud de un país asegura que el porcentaje de individuos que padece
de una determinada enfermedad infecciosa de una ciudad con cuatro millones de habitantes es 10 %.
Una agencia no gubernamental quiere tomar una muestra aleatoria de 20 individuos de la ciudad.
¾Cuál es la probabilidad de que ningún ciudadano de la muestra esté enfermo?
Solución:
Sea X la variable dada por el número de personas en la muestra que están enfermas. Se observa que
X tiene distribución hipergeométrica de parámetros n = 20, M = 400, 000 y N = 4, 000, 000. Teniendo
en cuenta la proposición 9.4.2, se sigue la distribución probabilística de X se puede aproximar por
medio de una distribución binomial de parámetros n = 20 y π = 0.1. Por tal motivo la probabilidad
pedida es

100
(0.1)0 (1 − 0.1)20−0 = 0.121.
0

Ejemplo 9.4.8. En la tabla 9.1 se ejemplica la proposición 9.4.2 por medio de una v.a. X con
distribución hipergeométrica de parámetros n = 10, M = 500 y N = 1, 000. En la segunda columna
de la tabla se presentan las probabilidades asociadas con todos los valores del rango de X que se
obtienen por medio de la f.m.p. dada por:
500 500

x 10−x
1,000

10
donde x es cualquier número entero entre 0 y 10. De otra parte, utilizando la aproximación por medio
de la distribución binomial que sugiere la proposición 9.4.2, en la tercera columna de la tabla se
muestran las probabilidades calculadas a través de la función

10
(0.5)x (1 − 0.5)10−x
x
que corresponde a la f.m.p. de una variable con distribución binomial de parámetros n = 10 y π = 0.5.
Como se observa en la última columna de la tabla, la mayor disimilitud se obtiene cuando x = 5,
donde la diferencia con la probabilidad exacta se empieza a notar en el lugar de las milésimas. En
todos los demás casos la diferencia es casi nula y únicamente se percibe a partir de la cuarta cifra
después del punto decimal. Esto evidencia que la aproximación que establece la proposición 9.4.2 para
este caso es bastante acertada.
x Hg(10, 500, 1, 000) Bin(10, 0.5) Diferencia

0 0.00093 0.00098 −0.00004
1 0.00950 0.00977 −0.00026
2 0.04337 0.04395 −0.00057
3 0.11683 0.11719 −0.00036
4 0.20570 0.20508 0.00062
5 0.24733 0.24609 0.00124
6 0.20570 0.20508 0.00062
7 0.11683 0.11719 −0.00036
8 0.04337 0.04395 −0.00057
9 0.00950 0.00977 −0.00026
10 0.00093 0.00098 −0.00004
Tabla 9.1: Probabilidades asociadas con los valores de una v.a. con distribución hipergeométrica de parámetros n = 10,
M = 500 y N = 1, 000, su respectiva aproximación por medio de la distribución binomial de parámetros n = 10 y π = 0.5,
y la diferencia correspondiente.
9.5. Distribución geométrica y binomial negativa
Se considera un experimento que satisface las mismas condiciones de un experimento binomial, a

excepción de que ahora los experimentos aleatorios se repiten hasta que ocurra un número determinado
de éxitos. En consecuencia, en lugar de encontrar la probabilidad de x éxitos en n experimentos
independientes, donde n es jo, ahora interesa la probabilidad de que ocurran r éxitos, donde r es jo,
en x repeticiones del experimento.
Esto es, un experimento binomial negativo de parámetros r y π está caracterizado por las sigui-
entes condiciones:
i. El experimento consta de una serie de experimentos de Bernoulli que son independientes entre sí.
ii. La probabilidad de éxito π de cada experimento de Bernoulli es constante.
iii. El experimento continúa hasta que un total de r éxitos se haya observado, siendo r un entero
positivo dado.
De esta forma el interés reside en calcular la probabilidad de tener que repetir el experimento de
Bernoulli x veces para obtener de manera exacta r éxitos. Ahora, el número de éxitos permanece
constante en tanto que el número de repeticiones X es una v.a..
9.5. DISTRIBUCIÓN GEOMÉTRICA Y BINOMIAL NEGATIVA 271
Denición 9.5.1. X tiene distribución binomial

Se dice que una v.a.
negativa r y π si la f.m.p. de X está dada por:
de parámetros
x−1 r x−r
fX (x; r, π) = r−1 π (1 − π) , si x = r, r + 1, r + 2, . . .;
0, en otro caso.
donde r es un número entero positivo y π es un número real tal que

0 < π < 1.
Nota. Cuando una v.a. X tiene distribución binomial negativa de parámetros r y π se escribe X ∼
BN (r, π). Además, similar a la distribución binomial, se dice que una v.a. X tiene distribución
geométrica cuando r = 1, lo que se denota con X ∼ G(π), esto es, una distribución geométrica de
parámetro π.
Suponga que no interesa conocer el número de ensayos necesarios hasta obtener de manera exacta r
éxitos (X ) sino el número de fracasos ocurridos antes de obtener de manera exacta r éxitos (Y ).
En consecuencia, se sigue que X = Y + r y por lo tanto
r+y−1 r y
fY (y; r, π) = r−1 π (1 − π) , si y = 0, 1, 2, . . .;
a
0, en otro caso.
Algunos autores llaman a esta última distribución binomial negativa, mientras que a la distribución
de probabilidad dada inicialmente la llaman distribución de Pascal .
Ejemplo 9.5.1. En una auditoría se investigan los estados nancieros con inconformidades. Un
estudio precedente señaló que la proporción de estados nancieros con defectos es 3 %. ¾Cuál es la
probabilidad de que el vigésimo estado nanciero investigado sea el tercero que tenga algún error?
Solución:
Sea X la v.a. que representa el número de estados nancieros que es necesario inspeccionar hasta
obtener exactamente tres con algún error. En consecuencia la variable X tiene distribución binomial
negativa de parámetros r = 3 y π = 0.03, esto es, X ∼ BN (3, 0.03). Así, la f.m.p. de X está dada por:
x−1 3 x−3
fX (x; 3, 0.03) = 2 (0.03) (0.97) , x = 3, 4, 5, . . .;
0, en otro caso.
En consecuencia, la probabilidad pedida es

20 − 1
P(X = 20) = (0.03)3 (0.97)20−3 ≈ 0.003.
2
binomial negativa de parámetros r=3 y π = 0.03.
Nota. En el ejemplo anterior, dado que la proporción de éxitos es menor a 5 %, el reemplazamiento
en el mecanismo de muestreo es indiferente.
Figura 9.7: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial negativa de parámetros
r=3 y π = 0.03.
Ejemplo 9.5.2. El gerente del departamento de control de calidad de una compañía está investigando
una medida que se ha implementado para mejorar las cualidades de sus productos. Esta medida indica
que la probabilidad de encontrar algún producto defectuoso es apenas del 1 %. ¾Cuál es la probabilidad
de que se tenga que revisar más de diez artículos hasta encontrar dos con alguna imperfección?
Solución:
Aquí interesa la v.a. X dada por el número de unidades que es necesario inspeccionar hasta encon-
trar dos defectuosas. De acuerdo con la situación se tiene que la probabilidad de encontrar alguna
imperfección en algún artículo es constate e igual a 0.01 y por lo tanto se sigue X tiene distribución
binomial negativa de parámetros r=2 y π = 0.01. Así, la f.m.p. de X está dada por:
x−1
2 x−2
fX (x; 2, 0.01) = 1 (0.01) (0.99) , x = 2, 3, 4, . . .;
0, en otro caso.
Entonces, la probabilidad de que se tenga que revisar más de diez artículos hasta encontrar dos con
alguna imperfección es
P(X ≤ 10) = 1 − P(X < 10)

9
X
=1− P(X = i)
i=2
9.5. DISTRIBUCIÓN GEOMÉTRICA Y BINOMIAL NEGATIVA 273
= 1 − P(X = 2) − . . . − P(x = 9)

2−1 2 2−2 9−1
=1− (0.01) (0.99) − ... − (0.01)2 (0.99)9−2
1 1
= 1 − 0.0042662
= 0.9957.
Proposición 9.5.1. Si X es una v.a. tal que X ∼ BN (r, π) entonces:
r(1−π)
r
r πet
i. E[X] = π, ii. Var[X] = π2 . iii. mX (t) = .
1−(1−π)et
La demostración está fuera de los intereses de este libro. La demostración se puede consultar en Ross
(1998, p. 166).
Ejemplo 9.5.3. Encontrar el valor esperado, la varianza y la f.g.m. de la variable que estudia en el
ejemplo 9.5.2.
Solución:
Dado que la variable X tiene distribución binomial negativa de parámetros r=2 y π = 0.01, esto es,
X ∼ BN (2, 0.01), entonces se sigue que:
2
i. E[X] = 0.01 = 200. Este valor indica que se espera inspeccionar alrededor de 200 artículos hasta
completar dos unidades defectuosas.
2(1−0.01)
ii. Var[X] = (0.01)2 = 19, 800.
2 2
0.01et 0.01et
iii. mX (t) = 1−(1−0.01)et = 1−0.99et .
A continuación se presenta el método de captura-recaptura que se estudió en la sección 9.4 con la

distribución hipergeométrica pero ahora enmarcado en el contexto de la distribución binomial negativa.
Como antes, se supone que el tamaño de una población es desconocido y se quiere determinarlo sin
tener que contar los individuos uno por uno. El método consiste en capturar M individuos de la
población, marcarlos y luego retornarlos a la población. Una vez los individuos marcados y los no
marcados se mezclan homogéneamente, se extraen individuos de la población hasta que un número
predeterminado de individuos marcados se obtiene, por ejemplo k . Si X es la v.a. que denota el número
de extracciones necesarias hasta obtener k individuos marcados, es claro que X tiene distribución
binomial negativa de parámetros k y π donde π = M/N . X es igual a
Suponiendo que se observa que
x0 , siguiendo a Blanco (2004, p. 120), se obtiene que un estimador de N , denotado con N
b , es aquel que
maximiza la probabilidad de que X sea igual a x0 . Tal estimador, también se conoce como estimador
de máxima verosimilitud y es igual a

b = M x0
N
k
donde [a] es la parte entera de a.
9.6. Distribución de Poisson
Esta distribución probabilística fue introducida en 1837 por el matemático francés Siméon Denis
Poisson 3
y se utiliza para describir la ocurrencia de un fenómeno aleatorio en una unidad de tiempo
o espacio. Esta distribución también sirve como modelo del número de defectos o disconformidades
que ocurren en una unidad de un producto. Las siguientes son las características correspondientes a
una variable con distribución de Poisson:
• El experimento aleatorio consiste en contar el número de veces que ocurre un evento particular
durante una unidad de tiempo, área, volumen, peso, distancia, o cualquier otra unidad de medida
dada bien denida.
• La probabilidad de que el evento ocurra en una unidad de medida dada es la misma para todas
las unidades.
• El número de eventos que ocurren en una unidad de medida es independiente del número de
eventos que ocurren en otras unidades.
Denición 9.6.1. Se dice que una v.a. X tiene distribución de Poi-

sson de parámetro λ si la f.m.p. de X está dada por:
(
e−λ λx
fX (x; λ) = x! , si x = 0, 1, 2, . . .;
0, en otro caso.
donde λ es un número real positivo.
Nota. Cuando una v.a. X tiene distribución de Poisson de parámetro λ se escribe X ∼ ¶(λ).
Proposición 9.6.1. Si X es una v.a. tal que X ∼ P (λ) entonces:
t
−1)
i. E[X] = λ. ii. Var[X] = λ. iii. mX (t) = eλ(e .
3 Fotografía tomada de la página web http://en.wikipedia.org/wiki/File:Simeon_Poisson.jpg.

9.6. DISTRIBUCIÓN DE POISSON 275
Demostración:
Como en la demostración de la proposición 9.3.1, primero se demuestra a que corresponde la f.g.m.

de la variable y luego utilizando las propiedades de esta función se obtienen el valor esperado y la
varianza como sigue:
iii.
mX (t) = E eXt

∞
X
= eit fX (i; λ)
i=0
∞
X e−λ λi
= eit
i=0
i!
∞
X λi eit
= e−λ
i=0
i!
∞ i
−λ
X (λet )
=e
i=0
i!
−λ λet
=e e
t
= eλ(e −1)
.
i.
d λ(et −1) t
= eλ(1−1) λ = λ.

E[X] = mX (t)
=e λe
dt t=0 t=0
ii.
2
Var[X] = E X 2 − (E[X])

d2

− λ2

= 2 mX (t)
dt t=0

t λ(et −1) t
+ λet eλ(e −1)
λet − λ2

= λe e
t=0
= λeλ(1−1) + λeλ(1−1) λ − λ2
= λ.

Nota. En la primera parte de la demostración de la proposición 9.6.1 se aplica la identidad
∞
X xn
ex =
n=0
n!
donde x es un número real.

Figura 9.8: Siméon Denis Poisson (1781-1840).
Ejemplo 9.6.1. Los sábados por la mañana, los clientes entran en una tienda de un centro comercial
a una tasa esperada de 0.50 clientes por minuto. Hallar la probabilidad de que el número de clientes
que entran en un intervalo especíco de 10 minutos sea a lo más 3.
Solución:
Las hipótesis del proceso de Poisson parecen ser razonables en este contexto. Se da por sentado que
los clientes no llegan en grupos (o es posible contar al grupo entero como un solo cliente) y que la
entrada de un cliente no aumenta ni disminuye la probabilidad de que llegue otro. Para obtener λ,
se observa que a una tasa media de 0.50 por minuto durante un periodo de 10 minutos, se sigue que
λ = (0.50)(10) = 5 entradas. SeaX la v.a. dada por el número de clientes que entran en un intervalo
de 10 minutos. Así, se tiene que X ∼ P (5), por lo que la f.m.p de X es
( −5 x
e 5
fX (x; 5) = x! , si x = 0, 1, 2, . . .;
0, en otro caso.
Se pide calcular
P(X ≤ 3) = P(X = 0; X = 1; X = 2; X = 3)
= P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)
e−5 50 e−5 51 e−5 52 e−5 53
= + + +
0! 1! 2! 3!
= 0.2650.
Se observa además que
P(X > 3) = 1 − P(X ≤ 3) = 1 − 0.2650 = 0.7350.

En la gura 9.9 se presenta el gráco de la f.m.p. y la f.d.a. de una variable con distribución de poisson
de parámetro λ = 5.
Figura 9.9: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución de Poisson de parámetro λ = 5.
Ejemplo 9.6.2. Si un banco recibe en promedio seis cheques sin fondo por día, ¾cuáles son las
probabilidades de que reciba: a. cuatro cheques sin fondo en un día dado y b. 10 cheques sin fondos
en cualquier par de días consecutivos?
Solución:
Dado que se cumplen los requerimientos de un proceso de Poisson (¾por qué?), se tiene que la v.a.
de interés X es el número de cheques sin fondo que llegan al banco en un día cualquiera, de donde
λ=6 cheques sin fondo por día. Así, una de las probabilidades pedidas es
e−6 64
P(X = 4) = = 0.1392.
4!
De otra parte, cuando interesan dos días consecutivos, se dene la v.a. X como el número de cheques
sin fondo que llegan al banco en dos días consecutivos, por lo que ahora λ = 6 × 2 = 12. En
consecuencia, la segunda probabilidad pedida es
e−12 1210
P(X = 10) = = 0.1049.
10!

Nota. En la gura 9.10 se presentan los grácos de la f.m.p. de una distribución de Poisson para
algunos valores de λ. En esta gura se observa como se modica la agudeza del sesgo de la distribución
a medida que aumenta el valor de λ.
Figura 9.10: Grácos de la f.m.p. de una distribución de Poisson de parámetros λ = 2, λ = 5 y λ = 10.
Proposición 9.6.2. Si X es una v.a. tal que X ∼ P (λ) entonces:
λ
fX (x; λ) = fX (x − 1; λ).
x
donde x es un número entero positivo.
Demostración:
Como x es un número entero positivo entonces se tiene que
λ λ e−λ λx−1 e−λ λλx−1 e−λ λx

fX (x − 1; λ) = = = = fX (x; λ)
x x (x − 1)! x(x − 1)! x!
y en consecuencia fX (x; λ) = λx fX (x − 1; λ).

Nota. La proposición 9.6.2 permite calcular de forma recurrente los valores de la f.m.p. de una variable
con distribución de poisson de parámetro λ.
Ejemplo 9.6.3. Sea X una v.a. con distribución de Poisson de parámetro λ=5 como en el ejemplo
9.6.1. A continuación se generan algunos valores de esta distribución utilizando la fórmula recursiva
de la proposición 9.6.2 utilizando λ = 5:
fX (0; 5) = e−5 = 0.00673794

fX (1; 5) = (5/1)(0.00673794) = 0.03368973

fX (2; 5) = (5/2)(0.03368973) = 0.08422433
fX (3; 5) = (5/3)(0.08422433) = 0.14037389
fX (4; 5) = (5/4)(0.14037389) = 0.17546737.
Esta iteración se puede prolongar hasta obtener todos las probabilidades que sean requeridas.
Empíricamente se ha establecido que si n > 100, π < 0.01 y nπ < 20 entonces es posible aproximar
la distribución binomial de parámetros n y π por una distribución de Poisson de parámetro nπ , esto
es, Bin(nπ) ≈ P (nπ). Esto quiere decir que la distinción de Poison ofrece un modelo probabilístico
adecuado para todos los experimentos aleatorios en los que las repeticiones son independientes unas de
otras y en los que solo hay dos posibles resultados denominados éxito y fracaso, con probabilidad
de éxito pequeña, y en los que el interés se centra en describir el número de éxitos obtenidos al realizar
el experimento un numero sucientemente grande de veces (Blanco 2004). Este hecho se especica
propiamente en la siguiente proposición:
Proposición 9.6.3. Si πn es una sucesión tal que 0 < πn < 1 y nπn −→ λ cuando n −→ ∞, entonces
e−λ λx

n x
πn (1 − πn )n−x −→
x x!
donde x es un elemento del rango de una v.a. con distribución de Poisson de parámetro λ.
La demostración de esta proposición está fuera de los intereses de este libro. La demostración se puede
consultar en Ross (1998, p. 154).
Ejemplo 9.6.4. En la tabla 9.2 se ejemplica la proposición 9.6.3 por medio de una v.a. X con
distribución binomial de parámetros n = 400 y π = 0.005. En la segunda columna de la tabla se
presentan las probabilidades asociadas con algunos valores del rango de X que se obtienen por medio
de la f.m.p. dada por:

400
(0.005)x (1 − 0.005)400−x
x
donde x es cualquier número entero entre 0 y 400. De otra parte, utilizando la aproximación por medio
de la distribución de Poisson que sugiere la proposición 9.6.3, en la tercera columna de la tabla se
muestran las probabilidades calculadas a través de la función
e−2 2x
x!
que corresponde a la f.m.p. de una variable con distribución de Poisson de parámetro λ = 2. Como se
observa en la última columna de la tabla, la diferencia entre el cálculo exacto de las probabilidades y
la aproximación que establece la proposición 9.6.3 es casi nula (de hecho en algunos casos lo es) y por
lo tanto se sigue que en escenarios como este la aproximación es bastante acertada.
x Bin(150, 0.005) P (2) Diferencia

0 0.13466 0.13534 −0.00068
1 0.27067 0.27067 0.00000
2 0.27135 0.27067 0.00068
3 0.18090 0.18045 0.00045
4 0.09022 0.09022 0.00000
5 0.03591 0.03609 −0.00018
6 0.01188 0.01203 −0.00015
7 0.00336 0.00344 −0.00008
8 0.00083 0.00086 −0.00003
9 0.00018 0.00019 −0.00001
10 0.00004 0.00004 0.00000
Tabla 9.2: Probabilidades asociadas con los valores de una v.a. con distribución binomial de parámetros n = 400 y
π = 0.005, su respectiva aproximación por medio de la distribución de Poisson de parámetros λ = 2, y la diferencia
correspondiente.
Ejemplo 9.6.5. La probabilidad de que un artículo sea defectuoso es igual a 0.001. Un cliente mayo-
ritario acepta un embarque de producción siempre y cuando al tomar una muestra aleatoria de 10,000
unidades del embarque no resulten más de diez unidades defectuosas. ¾Cuál es la probabilidad de que
un cliente acepte el embarque?
Solución:
Sea X la v.a. dada por el número de unidades en la muestra que tienen algún defecto. En este
caso se tiene que X tiene distribución binomial de parámetros n = 10, 000 y π = 0.001, esto es,
X ∼ Bin(10, 000, 0.001). Dadas las condiciones de la situación es posible aproximar esta distribución
binomial por medio de una distribución de Poisson de parámetro nπ = 10. Así, la probabilidad de que
el cliente acepte el embarque es
10 10
X X e−10 10i e−10 100 e−10 1010
P(X ≤ 10) = P(X = i) = = + ... + = 0.583.
i=0 i=0
i! 0! 10!
9.7. Comentarios
En este capítulo se presentan las distribuciones discretas de uso común en estadística. Estas distri-
buciones son de especial interés porque los supuestos bajo los cuales se fundamentan, les permiten
ajustarse a variados fenómenos de la vida real relacionados con procesos discretos.
Para todas las distribuciones se presentan el valor esperado, la varianza y la f.g.m., con el propósito de
9.8. EJERCICIOS 281
describir a mayor profundidad los fenómenos que describen por medio de tales medidas características.
Además, se presentan un par de resultados asintóticos, que permiten aproximar bajo ciertas condiciones
algunas de estas distribuciones.
El manejo apropiado de estas distribuciones permite construir herramientas estadísticas sosticadas

que se utilizan en la práctica para investigar fenómenos que requieren de modelos más complejos que
a su vez se basan en supuestos más fuertes.
9.8. Ejercicios
9.1 Se lanza un dado corriente 12 veces seguidas. Calcular la probabilidad de obtener por lo menos
cinco veces el número uno.
9.2 Sea X una v.a. con distribución de Poisson de parámetro λ tal que P(X = 0) = 0.02. Calcular la
media y la varianza de X.
9.3 Sea X una variable aleatoria con distribución de Bernoulli de parámetro π . Hallar el valor esperado,
la varianza y la f.g.m. de X.
9.4 Sea X una variable aleatoria con distribución Geométrica de parámetro π . Hallar el valor esperado,
la varianza y la f.g.m. de X.
9.5 Se supone que la probabilidad de obtener una unidad defectuosa es de 5 %. El conjunto de unidades
terminadas constituye un conjunto de ensayos independientes. Si se toma una muestra aleatoria
de 10 unidades, calcular la probabilidad de que:
a. Exactamente dos se encuentren defectuosas.
b. A lo sumo dos se encuentren defectuosas.
c. Por lo menos una se encuentre defectuosa.
9.6 El gerente de un restaurante que solo da servicio mediante reservas sabe, por experiencia, que
el 20 % de las personas que reservan una mesa no asistirán. Si el restaurante acepta 25 reservas
pero solo dispone de 20 mesas, ¾cuál es la probabilidad de que a todas las personas que asistan al
restaurante se les asigne una mesa?
9.7 Una empresa de electrónica observa que el número de componentes que fallan antes de cumplir
100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de estos
fallos es ocho, calcular la probabilidad de que:
a. Falle exactamente un componente en 25 horas.
b. Fallen no más de dos componentes en 50 horas.
c. Fallen por lo menos 10 componentes en 125 horas.
9.8 Un lote contiene 100 artículos de un proveedor local y 200 unidades de un proveedor vecino. Si se
seleccionan cuatro piezas al azar y sin reemplazo, calcular la probabilidad de que:
a. Todas las piezas sean del proveedor local.
b. A lo más dos piezas sean del proveedor local.
c. Al menos una pieza sea del proveedor local.
9.9 Una prueba consta de 200 preguntas de verdadero o falso. Para una persona que responda al azar,
calcular la probabilidad de que responda acertadamente:
a. La mitad de las preguntas o menos.
b. Más de 50 y menos de 100 preguntas.
c. Más de 120 preguntas.
9.10 En un centro turístico, para averiguar el tamaño N de una población de lagartos se utiliza el
siguiente método de captura-marcaje-recaptura. Se capturan k lagartos, se les marca y se les
reincorpora a su población. Un tiempo después se realizan n avistamientos independientes y se
dene X como el número de lagartos marcados en los n avistamientos independientes.
a. ¾Cuál es la distribución probabilística de X?

b. Obtener una expresión para la probabilidad de que X = m.
c. Si k=4 y m = 1, demostrar que la probabilidad es máxima cuando N = 4n.
d. Si N = 12, k = 4 y n = 3, ¾cuál es la probabilidad de que los tres lagartos observados estén
marcados si se sabe que al menos uno de ellos lo está?
9.11 En un proceso de fabricación de cierto artículo se sabe que 2 % resultan defectuosos. Los artículos
se empaquetan en cajas de 50 artículos. Calcular la probabilidad de que en una caja haya el
siguiente número de artículos con defectos:
a. Ninguno.
b. Uno.
c. Más de dos.
d. ¾Cuántos artículos defectuosos habrá, por término medio, en cada caja?
9.12 Los mensajes que llegan a una computadora utilizada como servidor lo hacen de acuerdo con una
distribución de Poisson con una tasa promedio de 0.1 mensajes por minuto.
a. ¾Cuál es la probabilidad de que lleguen a lo más dos mensajes en una hora?
b. Determinar el intervalo de tiempo necesario para que la probabilidad de que no llegue ningún
mensaje durante ese lapso de tiempo sea 0.8.
9.13 Se sabe que de un lote de 40 semillas no está en buenas condiciones la cuarta parte. Se toman
al azar ocho semillas y se analizan en el laboratorio. ¾Cuál es la probabilidad de que tres de las
semillas analizadas estén en malas condiciones?
9.14 Un banco recibe en promedio 6 cheques falsos al día acorde a un proceso de Poisson. Hallar la
probabilidad de que se reciban:
a. Cuatro cheques falsos en un día.

9.8. EJERCICIOS 283
b. Más de 30 cheques falsos en una semana.
9.15 Una rma de pedidos por correo envía una carta a sus clientes. La probabilidad de que un cliente
elegido al azar conteste a esa carta es de 0.1. Sean X el número de cartas que debe enviar la
rma hasta obtener exactamente 1 respuesta y Y el número de cartas que debe enviar la rma
para obtener exactamente 3 respuestas. Calcular e interpretar P(X > 2) y P(Y ≤ 5). ¾Cuál es el
valor esperado de estas variables?
9.16 Una caja con 12 artículos tiene cuatro defectuosos. Si se toma una muestra de tres, en un caso con
reemplazamiento y en otro sin reemplazamiento, ¾cuál será la probabilidad de no incluir artículos
defectuosos en la muestra?
9.17 De estudios anteriores se conoce que el tipo de grupo sanguíneo de una población se distribuye
de acuerdo a las siguientes categorías: A (43.2 %), B (14.2 %), AB (6.0 %) y O (36.6 %). En una
situación de emergencia se necesitan realizar cinco transfusiones de tipo A. Se solicitan voluntarios
a la población y se realizan extracciones sucesivas. ¾Cuál es la probabilidad de cubrir la emergencia
con el décimo donante?
9.18 La central telefónica de un hotel recibe en promedio 0.5 llamadas por minuto de acuerdo a un
proceso de Poisson. Determinar la probabilidad de que en una hora al determinada:
a. Se reciba 60 llamadas.
b. Se reciban un máximo de 120 llamadas.
c. La central quede bloqueada, sabiendo que no puede realizar más de 3 conexiones por minuto.
9.19 El 4 % de las reservas de un vuelo no son utilizadas. Según esta observación, una compañía de
aviación vende 75 billetes para 73 plazas. ¾Cuál es la probabilidad de que todos los pasajeros
consigan viajar?
9.20 El Departamento de Matemáticas de una universidad propone un examen de selección múltiple

conformado por 25 preguntas. Cada pregunta tiene cinco opciones de respuesta. Si un estudiante
no conoce la respuesta correcta de ninguna pregunta y prueba suerte, responder:
a. ¾Cuál es el número esperado de respuestas correctas y su desviación típica?
b. Suponiendo que cada respuesta acertada vale 1 punto, ¾cuánto debe valer cada respuesta fallada
para que la nota esperada del estudiante que prueba suerte sea nula?
c. Si se pasa el examen cuando se responden correctamente 13 preguntas, ¾cuál es la probabilidad

de que pase el alumno que ha probado suerte?
9.21 Una caja contiene 100 artículos de los que cuatro son defectuosos. Sea X el número de artículos
defectuosos encontrados en una muestra de nueve artículos sin reemplazado.
a. Hallar e interpretar P(X = 2).

b. Aproximar la probabilidad del numeral a. por medio de la distribución binomial.
c. Aproximar la probabilidad del numeral a. por medio de la distribución de Poisson.
9.22 El número de llamadas telefónicas que recibe una operadora desde las 9:00 horas hasta las 9:05
horas sigue una distribución de Poisson de parámetro 4. Hallar la probabilidad de que:
a. La operadora no reciba ninguna llamada al día siguiente en ese intervalo de tiempo.
b. En los dos próximos días la operadora reciba un total de tres llamadas en ese intervalo de
tiempo.
9.23 Una agencia inmobiliaria dedicada a la venta de apartamentos en la Costa ha realizado un estudio
de ventas, comprobando que solo el 5 % de las personas que acuden a visitar el piso piloto compran
un apartamento. Se pide:
a. Calcular la probabilidad de que tenga que recibir 10 visitas hasta vender un apartamento.
b. Calcular la probabilidad de que tenga que recibir 10 visitas hasta vender dos apartamentos.

9.24 Sea X una v.a. con distribución de Poisson de parámetro λ. Demostrar que E X 2 = λE[X + 1].
9.25 Se lanza una moneda tantas veces como sea necesario hasta obtener por primera vez cara. Sea X
la v.a. que denota el número de lanzamientos requeridos. Calcular E[X]
9.26 El promedio de homicidios mensuales en un país es de 1 por cada 100,000 habitantes.
a. Calcular la probabilidad de que en una ciudad de dicho país, de 400,000 habitantes, haya ocho
o más homicidios en un mes dado.
b. Calcular la probabilidad de que haya, por lo menos, dos meses durante el año en los que, en
dicha ciudad ocurran ocho o más homicidios.
9.27 La policía sospecha que en un camión cargado con 40 bultos de arroz se han camuado paquetes
de cocaína. Para conrmar su sospecha, la policía escoge al azar cinco bultos para inspeccionarlos.
Si en efecto, de los 40 bultos de arroz que contiene el camión, diez tienen camuada cocaína, ¾cuál
es la probabilidad de que por lo menos uno de los bultos de la muestra contenga cocaína?
9.28 Un procedimiento de laboratorio requiere de 12 etapas independientes para realizarse. Sin embargo,
la probabilidad de completar satisfactoriamente una etapa es de 0.5, por lo que se puede repetir
un máximo de 6 etapas de manera independiente. Se quiere determinar cuál es la probabilidad de
que la proporción de etapas completadas satisfactoriamente sea mayor o igual 72.22 %.
Capı́tulo 10
Distribuciones continuas
10.1. Introducción
En la sección 9 se estudian las distribuciones discretas de uso común, haciendo énfasis en los escenarios
que describen y sus aplicaciones, junto con los parámetros asociados, con el propósito de describir
probabilísticamente un fenómeno discreto dado. A diferencia de las v.a.d.'s, que describen variables
con valores nitos o innitos numerables, las v.a.c.'s hacen referencia a variables que asumen un
conjunto innito no numerable de valores.
En este capítulo se presentan las distribuciones continuas de uso frecuente en estadística, por medio
de las funciones relacionadas, esto es, la f.d.p. y la f.d.a., y los parámetros asociados para describir las
variables de interés. El estudio de las distribuciones continuas de probabilidad es fundamental porque
varios métodos de la inferencia estadística se apoyan en este tipo de distribuciones.
10.2. Distribución uniforme continua
La distribución uniforme continua es aquella distribución que puede tomar cualquier valor dentro de
un intervalo dado, siempre con la misma densidad; por ende, todos los subintervalos de la misma
longitud son equiprobables. Es una distribución continua porque puede tomar cualquier valor y no
únicamente un número determinado de ellos, como ocurre en la distribución uniforme discreta.
285
286 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
Denición 10.2.1. Se dice que una v.a.c. X tiene una distribución

uniforme continua sobre el intervalo [a, b], si la f.d.p. de X está dada
por:
1

b−a , si a ≤ x ≤ b;
fX (x; a, b) =
0, en otro caso.
donde a y b son números reales tales que a < b.
Nota. Cuando una v.a. X tiene distribución uniforme continua sobre el intervalo [a, b] se escribe
X ∼ U [a, b]. Esta distribución probabilística también se puede denir sobre el intervalo abierto (a, b),
lo que se escribe X ∼ U (a, b). En este caso la f.d.p. de X es
1

fX (x; a, b) = b−a , si a < x < b;
0, en otro caso.
Proposición 10.2.1. Si X es una v.a. tal que X ∼ U [a, b] entonces
a+b
i. E[X] = 2 . iv.

ii. Var[X] = (b−a)2  0, si x < a;
12 . x−a
FX (x; a, b) = b−a , si a ≤ x ≤ b;
etb −eta 1, si x > b.

iii. mX (t) = t(b−a) .
Demostración:
i.
Z ∞
E[X] = xfX (x)dx
∞
Z b
x
= dx
a b − a
Z b
1
= xdx
b−a a
1 x2 b
=
b−a 2 a

2
b − a2

1
=
b−a 2
1 (b − a)(b + a)
=
b−a 2
(a + b)
= .
2
ii. Como
Z ∞
E X2 = x2 fX (x)dx

∞
10.2. DISTRIBUCIÓN UNIFORME CONTINUA 287
b
x2
Z
= dx
a b−a
Z b
1
= x2 dx
b−a a
1 x3 b
=
b−a 3 a

3
b − a3

1
=
b−a 3
1 (b − a)(a2 + ab + b2 )
=
b−a 3
a2 + ab + b2
=
3
entonces
2
Var [X] = E X 2 − (E [X])

2
a2 + ab + b2

(a + b)
= −
3 2
2 2
a + ab + b (a + 2ab + b2 )
2
= −
3 4
4a2 + 4ab + 4b2 − 3a2 − 6ab − 3b2
=
12
a2 − 2ab + b2
=
12
(a − b)2
= .
12
iii.
mX (t) = E eXt

Z ∞
= ext fX (x)dx
∞
b
ext
Z
= dx
a b−a
Z b
1
= ext dx
b−a a
1 ext b
=
b−a t a

1 ebt − eat
=
b−a t
ebt − eat
= .
t(b − a)

Ejemplo 10.2.1. La tesorería de una empresa indica que la utilidad diaria (en millones de pesos) de
la compañía tiene distribución uniforme entre −3 y 2. Calcular la probabilidad que en un día dado la
empresa tenga
a. ganancias.
b. ganancias superiores a un millón de pesos.
c. pérdidas.
Solución:
Se tiene que la v.a. de interés X corresponde a la utilidad diaria (en millones de pesos) de la empresa.
De acuerdo con la tesorería de la compañía X tiene distribución uniforme sobre el intervalo a = −3 y
b = 2, es decir, X ∼ U [−3, 2]. Por consiguiente, la f.d.p. de X es
1

5, si −3 ≤ x ≤ 2;
fX (x; −3, 2) =
0, en otro caso.
Por lo tanto, la probabilidad de que en un día dado la empresa tenga
a. ganancias es:
Z ∞
P(X ≥ 0) = fX (x)dx
0
Z 2
1
= dx
0 5
1 2
= x
5 0
1
= (2 − 0)
5
= 0.4.
b. ganancias superiores a un millón de pesos es:

Z ∞
P(X > 1) = fX (x)dx
1
Z 2
1
= dx
1 5
1 2
= x
5 1
1
= (2 − 1)
5
= 0.2.
10.2. DISTRIBUCIÓN UNIFORME CONTINUA 289
c. pérdidas es:
P(X < 0) = 1 − P(X ≥ 0)

2
=1−
5
= 0.6.
En la gura 10.1 se presenta el gráco de la f.d.p. y de la f.d.a. de una variable con distribución
uniforme continua sobre sobre el intervalo a = −3 y b = 2.
Nota. Las probabilidades calculadas en el ejemplo 10.2.1 también se pueden obtener utilizando la
f.d.a. de la variable, esto es, con la función:

 0, si x < −3;
x+3
FX (x; −3, 2) = 5 , si −3 ≤ x ≤ 2;
1, x > 2.

si
Así, la probabilidad de que en un día dado la empresa tenga
a. ganancias es:
P(X ≥ 0) = 1 − P(X < 0)

= 1 − P(X ≤ 0)
= 1 − FX (0)
0+3
=1−
5
= 0.4.
b. ganancias superiores a un millón de pesos es:
P(X > 1) = 1 − P(X ≤ 1)

= 1 − FX (1)
1+3
=1−
5
= 0.2.
c. pérdidas es:
P(X < 0) = P(X ≤ 0)

= FX (0)
0+3
=
5
= 0.6.
Figura 10.1: Gráco de la f.d.p. (a) y de la f.d.a. (b) de una variable con distribución uniforme continua sobre el
intervalo a = −3 y b = 2.
Ejemplo 10.2.2. Con la información del ejemplo 10.2.1, calcular el valor esperado y la varianza de
la utilidad diaria de esta empresa.
Solución:
Como la utilidad diaria de la empresa tiene distribución uniforme continua sobre el intervalo a = −3
y b = 2, entonces el valor esperado y la varianza son respectivamente
a+b −3 + 2 −1
E[X] = = =
2 2 2
(b − a)2 (b − a)2 (2 − (−3))2 25

Var[X] = = = = .
12 12 12 12
En consecuencia, se espera que en un día dado, la compañía tenga pérdidas por un valor de $500,000
y por tal motivo debería considerar seriamente declararse en banca rota.
Nota. La variabilidad respecto al valor esperado calculado en el ejemplo 10.2.2 es notable. ¾Por qué?
10.3. DISTRIBUCIÓN NORMAL 291
10.3. Distribución normal
10.3.1. Generalidades
La distribución de probabilidad conocida como la distribución normal es una de las distribuciones

probabilísticas más importantes, porque se ajusta a una gran variedad de fenómenos y además porque
constituye la base para el desarrollo de muchos métodos de inferencia estadística. La distribución
normal también se denomina distribución gaussiana o campana de Gauss, denominada así en honor
a Johann Carl Friedrich Gauss 1
, pues al representar su f.d.p., ésta tiene forma de campana (ver
la gura 10.2).
Figura 10.2: Gráco de la f.d.p.de una variable con distribución normal.
Muchas v.a.c.'s de carácter económico, morfológico y sociológico siguen una distribución normal,
o por lo menos aproximadamente normal. Una de sus características más importantes es que, bajo
ciertas condiciones, casi cualquier distribución de probabilidad, tanto discreta como continua, se puede
aproximar por una distribución normal.
1 Fotografía tomada de la página web http://www.rare-earth-magnets.com/t-johann-carl-friedrich-gauss.aspx.

Figura 10.3: Johann Carl Friedrich Gauss (1777-1855).
Denición 10.3.1. Se dice que una v.a.c. X tiene distribución nor-

mal de parámetros µ y σ2 si la f.d.p. de X , denotada con φX , está dada
por:
1 x−µ 2
e− 2 ( )
1
φX (x; µ, σ 2 ) = √ σ
2πσ 2
donde µ es un número real y σ2 es un número real positivo.
Nota. Cuando una v.a. X tiene distribución normal de parámetros µ y σ2 se escribe X ∼ N (µ, σ 2 ).
Se acostumbra denominar a µ parámetro de localización
2
y a σ2 parámetro de escala .
3
De otra parte, la f.d.a. de una v.a. X con distribución normal de parámetros µ y σ2 , denotada con
ΦX , está dada por:
Z x
1 t−µ 2
e− 2 ( )
1
2
ΦX (x; µ, σ ) = √ σ para todo x ∈ R.
−∞ 2πσ 2
Por lo general, el cálculo de esta función en un valor dado se hace por medio de una tabla (detalles
ver la sección 10.3.3). En la gura 10.4 se presentan algunos ejemplos al respecto.
Proposición 10.3.1. Si X es una v.a. tal que X ∼ N (µ, σ 2 ) entonces

2 Sea X una v.a. con una distribución de parámetro θ y c un número real. Se dice que θ es un parámetro de
localización si la distribución de la v.a. Y =X +c es de parámetro θ + c.
3 Sea X una v.a. con una distribución de parámetro θ y c un número real. Se dice que θ es un parámetro de escala
si θ>0 y la distribución de la v.a. Y = cX es de parámetro |c|θ.
1 2 2
i. E[X] = µ. ii. Var[X] = σ 2 . iii. mX (t) = eµt+ 2 σ t
.
La demostración se puede consultar en Ross (1998, p. 206 y p. 357).
Nota. Hay toda una familia de distribuciones normales. Cada distribución normal especíca, es decir,
2
cada miembro de esta familia, se distingue por su valor esperado µ y su varianza σ .
4
Como se observa en las grácas de la gura 10.4, la gráca de la f.d.p. de una variable X con
distribución normal tiene forma de campana y un máximo global en el centro de la misma. De esta
manera, la media aritmética (µX ), la mediana (µ̃X ) y la moda (µ̆X ) de X coinciden y se localizan en
la abscisa correspondiente al máximo de la gráca. En consecuencia, la distribución de probabilidad
normal es simétrica respecto al valor esperado. Además, la curva desciende suavemente en ambas
direcciones a partir del valor medio de forma asintótica, lo que quiere decir que la curva se acerca cada
vez más al eje x pero jamás llega a tocarlo.
Figura 10.4: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución normal para diferentes
valores de los parámetros µ y σ2 .
10.3.2. La distribución normal estándar
Se observó que no existe una sola distribución de probabilidad normal, sino una familia de ellas,
cuyos miembros se identican por el valor de la media y de la varianza. Por lo tanto, el número de
integrantes de esta familia es ilimitado y es imposible proporcionar una sola tabla de probabilidades
para cada combinación de la media y la varianza. Para resolver este problema, se utiliza un solo
miembro de la familia de distribuciones normales: aquel con media igual a 0 y varianza igual a 1. La
importancia de esta distribución, conocida como distribución normal estándar, radica en que todas
las distribuciones normales se pueden referenciar a ella mediante una transformación denominada
estandarización (detalles en la sección 10.3.4).
4 Fotografía tomada de la página web http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal.

Denición 10.3.2. Una v.a. con distribución normal de parámetros

µ y σ2 tiene distribución normal estándar (o es estandarizada o
tipicada) si y solo si la v.a. tiene distribución normal de parámetros
µ=0 y σ 2 = 1.
Nota. Una v.a. con distribución normal estándar se denota con Z y de acuerdo con la denición 10.3.2
es tal que Z ∼ N (0, 1). Además, se tiene que
1 1 2
φ(z) = φZ (z; 0, 1) = √ e− 2 z
2π
y
Z z
1 1 2
Φ(z) = ΦZ (z; 0, 1) = √ e− 2 t dt.
−∞ 2π
Proposición 10.3.2. Si Z es una v.a. con distribución normal estándar entonces para todo número
real Z se tiene que:
i. φ(−z) = φ(z). ii. Φ(−z) = 1 − Φ(z).
Demostración:
i.
1 1 2 1 1 2
φ(−z) = √ e− 2 (−z) = √ e− 2 z = φ(z).
2π 2π
ii. Como
Φ(−z) = P(Z ≤ −z) = 1 − P(Z > −z)
y haciendo la sustitución u = −t se tiene que
Z ∞
1 1 2
P(Z > −z) = √ e− 2 t dt
−z 2π
Z −∞
1 1 2
=− √ e− 2 (−u) du
2π
Z zz
1 1 2
= √ e− 2 u du
−∞ 2π
= Φ(z)
entonces Φ(−z) = 1 − Φ(z).

10.3.3. Uso de la tabla de la distribución normal estándar
Las probabilidades dadas en la tabla de la sección D.4 corresponden a algunas áreas bajo la curva
de la distribución normal estándar. Esta tabla muestra la función de distribución acumulada Φ(z) =
P(Z ≤ z) para diferentes valores de z donde Z ∼ N (0, 1).
Ejemplo 10.3.1. Se quiere calcular Φ(2.91) = P(Z ≤ 2.91). Para ello, primero se localiza 2.9 en
la columna izquierda de la tabla, y después a 0.01 en la la superior. Buscando en el interior de la
tabla, se observa que el renglón de 2.9 y la columna de 0.01 se intersectan en el valor 0.9982. Por
consiguiente, la probabilidad requerida es Φ(2.91) = P(Z ≤ 2.91) = 0.9982. Similarmente, se tiene que
Φ(−1.33) = P(Z ≤ −1.33) = 0.0918.
Nota. También es posible determinar Φ(−1.33) de otra forma. Primero, se encuentra el renglón
correspondiente a 1.3 y después se avanza por éste hasta la columna de 0.03. Allí se observa que
Φ(1.33) = 0.9082, sin embargo esta no es la probabilidad requerida, pero sí es su complemento. Este
hecho se puede deducir mediante el gráco de la gura 10.5. Por lo tanto, Φ(−1.33) = 1 − Φ(1.33) =
1 − 0.9082 = 0.0918.
Figura 10.5: Ilustración gráca del cálculo de probabilidades bajo la distribución normal.
Hay valores de Z que no aparecen en la tabla. En este caso, se debe aproximar a 0 las probabilida-
des correspondientes a los valores negativos y a 1, las probabilidades correspondientes a los valores
positivos. Así, Φ(3.5) ≈ 1 y Φ(−4.2) ≈ 0, por ejemplo.
Ejemplo 10.3.2. Sea Z una v.a. con distribución normal estándar. Calcular:
a. P(Z ≤ 1.52). c. P(0 ≤ Z ≤ 1.52). e. P(−1.34 < Z < 1.68).

b. P(Z ≥ 1.52). d. P(−2.1 ≤ Z ≤ 0).
Solución:
a. P(Z ≤ 1.52) = Φ(1.52) = 0.9357.
b. P(Z ≥ 1.52) = 1 − Φ(1.52) = 1 − 0.9357 = 0.0643.
c. P(0 ≤ Z ≤ 1.52) = Φ(1.52) − Φ(0) = 0.9357 − 0.5 = 0.4357.
d. P(−2.1 ≤ Z ≤ 0) = Φ(0) − Φ(−2.1) = 0.5 − 0.0179 = 0.4821.
e. P(−1.34 < Z < 1.68) = Φ(1.68) − Φ(−1.34) = 0.9535 − 0.0901 = 0.8634.
Denición 10.3.3. Sea Z una v.a. con distribución normal estándar y

α un número real tal que 0 < α < 100. El percentil α de la distribución
normal estándar, denotado con zα , es un valor de Z tal que
α
Φ(zα ) = .
100
α
Nota. De la denición 10.3.3 se observa que 100 corresponde a una probabilidad y que P(Z > zα ) =
α
P(Z ≥ zα ) = 1 − 100 .
Ejemplo 10.3.3. Hallar el valor de z4.65 .
Solución:
α
En este caso
100 = 0.0465 y se debe encontrar un valor x tal que Φ(x) = 0.0465. Observando los
valores dentro de la tabla de la distribución normal estándar se tiene que Φ(−1.68) = 0.0465 y por lo
tanto x = z4.65 = 1.68.
10.3.4. Estandarización
Cuando una v.a. X tiene distribución normal de parámetros µ y σ2 , entonces, las probabilidades
asociadas con X se calculan estandarizando la variable X, esto es, por medio de la transformación
X −µ
.
σ
Proposición 10.3.3. Si X es una v.a. tal que X ∼ N (µ, σ 2 ) entonces se satisfacen las siguientes
propiedades:
X−µ
i. La v.a. Z dada por Z= σ tiene distribución normal estándar.
ii. Si a es un número real entonces

a−µ a−µ
P(X ≤ a) = Φ y P(X ≥ a) = 1 − Φ .
σ σ
iii. Si a y b son número reales entonces

b−µ a−µ
P(a ≤ X ≤ b) = Φ −Φ .
σ σ
Demostración:
i. Como FZ (z) = Φ(z) entonces Z tiene distribución normal estándar, en efecto:
FZ (z) = P(Z ≤ z)

X −µ
=P ≤z
σ
= P(X ≤ σz + µ)
= FX (σz + µ)
Z σz+µ
= fX (t)dt
−∞
Z σz+µ
1 1 t−µ 2
= √ e− 2 ( σ ) dt.
−∞ 2πσ
t−µ
Haciendo la sustitución u= σ se obtiene que
Z z
1 1 2
FZ (z) = √ e− 2 u du = Φ(z)
−∞ 2π
t−µ
−∞, (σz+µ)−µ

dado que lı́mt→−∞ σ = σ =z y du = σdt.
ii.

X −µ a−µ
P(X ≤ a) = P ≤
σ σ

a−µ
=P Z≤
σ

a−µ
=Φ .
σ
iii.

a−µ X −µ b−µ
P(a ≤ X ≤ b) = P ≤ ≤
σ σ σ

a−µ b−µ
=P ≤Z≤
σ σ

b−µ a−µ
=Φ −Φ .
σ σ

Ejemplo 10.3.4. Sea X una v.a. tal que X ∼ N (100, 162 ). Calcular la probabilidad de que X tome
un valor entre 100 y 115, y que tome un valor mayor que 90.
Solución:
La probabilidad de que X tome un valor entre 100 y 115 es
P(100 < X < 115) = P(100 ≤ X ≤ 115)

115 − 100 100 − 100
=Φ −Φ
16 16
= Φ(0.94) − Φ(0)
= 0.8264 − 0.5000
= 0.3264.
De otra parte, la probabilidad de que X tome un valor mayor que 90 es
P(X > 90) = 1 − P(X ≤ 90)

90 − 100
=1−Φ
16
= 1 − Φ(−0.63)
= 1 − 0.2643
= 0.7357.

Proposición 10.3.4. α un número real tal que 0 < α < 100 y X una v.a. con distribución normal
Sea
de parámetros µ y σ . Entonces el percentil α de X , denotado con xα , está dado por
xα = σzα + µ
donde zα es el percentil α de la distribución normal estándar.
Demostración:
Como xα es el percentil α de X, entones se tiene que
FX (xα ) = P(X ≤ xα )

xα − µ
=Φ
σ
α
= .
100
Por lo tanto
xα − µ
= zα
σ
y despejando xα se obtiene que xα = σzα + µ.
Ejemplo 10.3.5. El coeciente de inteligencia de 550 aspirantes a una beca escolar en una universidad
extranjera tiene distribución normal con media 115 y desviación estándar 10. Se pide:
a. Si la universidad requiere un coeciente de inteligencia de al menos 95, ¾cuántos de estos aspirantes

serán rechazados?
b. El puntaje que, según la prueba, separa el 10 % de los aspirantes más inteligentes del resto, es decir,
el percentil 90 de X.
c. ¾Cuál debe ser el valor de la media si se quiere que la probabilidad de que un aspirante tenga un
coeciente de al menos 230 sea igual a 0.05?
Solución:
La variable de interés X que representa el coeciente de inteligencia de los aspirantes a la beca

escolar tiene distribución normal de parámetros µ = 115 y σ 2 = 100.
a. La probabilidad de que el coeciente de un aspirante sea de al menos 95 es

95 − 115
P(X ≥ 95) = 1 − Φ = 1 − Φ (−2) = 1 − 0.0228 = 0.9772.
10
Así, la cantidad de aspirantes que serán rechazados es (1 − 0.9772)(550) ≈ 13.
b. Como de la tabla de la distribución normal estándar se obtiene que z90 = 1.28, entonces, de acuerdo
con la proposición 10.3.4, el percentil 90 de X es
x90 = (10)(1.28) + 115 = 127.8.
Por consiguiente, el puntaje que, según la prueba, separa el 10 % de los aspirantes más inteligentes
del resto es 127.8.
c. La probabilidad de que un aspirante tenga un coeciente de al menos 230 sea igual a 0.05 se traduce
en P(X ≥ 230) = 0.05, expresión que a su vez es equivalente a P(X ≤ 230) = 0.95. Esto quiere
decir que, bajo esta condición, el percentil 95 de X debe ser igual a 230. Por lo tanto, se sigue que
230 = (10)(1.64) + µ de donde µ = 213.6.
Proposición 10.3.5. Sea X una variable aleatoria con distribución normal de parámetros µ y σ2 y
a y b números reales. Si Y = aX + b entonces Y tiene distribución normal de parámetros aµ + b y
(aσ)2 .
Demostración:
En virtud de la proposición 8.8.2 se tiene que la f.g.m. de Y es
mY (t) = ebt mX (at)

2
1
(at)2
= ebt eµ(at)+ 2 σ
2
1
σ 2 t2
= eaµt+bt+ 2 a
1 2 2
= e(aµ+b)t+ 2 (aσ) t
que corresponde a la f.g.m. de una v.a. con distribución normal de parámetros aµ + b y (aσ)2 . Por lo
tanto, siguiendo el teorema 8.8.3 se obtiene el resultado.
Ejemplo 10.3.6. Rehacer el numeral a. del ejemplo 10.3.5, suponiendo que, debido a errores en el
sistema, todos los aspirantes aumentaron su coeciente de inteligencia 8.7 % y obtuvieron un descuento
de 3 puntos.
Solución:
Como la variable de interés X representa el coeciente de inteligencia de los aspirantes a la beca

escolar tiene distribución normal de parámetros µ = 115 y σ 2 = 100, entonces, teniendo en cuenta los
errores del sistema, interesa calcular P(Y ≥ 95) donde Y = 1.087X − 3. De acuerdo con la proposición
2

10.3.5, se tiene que Y ∼ N (1.087)(115) − 3, 1.087 (100) de donde

95 − ((1.087)(115) − 3)
P(Y ≥ 95) = 1 − Φ = 1 − Φ (−2.48) = 1 − 0.00649 = 0.99351.
(1.087)(10)
Así, teniendo en cuenta los errores del sistema, la cantidad de aspirantes que serán rechazados es
(1 − 0.99351)(550) ≈ 4.
10.3.5. Aproximación de la distribución binomial
La distribución binomial (detalles en la sección 9.3) se puede aproximar por medio de la distribución
normal bajo ciertas condiciones. En el siguiente teorema se establece este hecho:
Teorema 10.3.6. Sea X una v.a. con distribución binomial de parámetros n y π . Si a y b son números
reales tales que a<b entonces cuando n −→ ∞ se tiene que
!
X − nπ
P a≤ p ≤b −→ Φ(b) − Φ(a)
nπ(1 − π)
donde Φ(z) es la f.d.a. de la distribución normal estándar.
La demostración se puede consultar en Freund et al. (2000, p. 223).
Nota. El teorema 10.3.6, conocido como teorema de Moivre-Laplace , establece que si n es lo

sucientemente grande entonces Bin(n, π) ≈ N (nπ, nπ(1 − π)). En la práctica, la aproximación es
aceptable cuando las cantidades nπ y n(1 − π) son ambas mayores que cinco.
Cuando se aproxima una distribución de probabilidad discreta distribución binomial mediante una
distribución de probabilidad continua distribución normal se debe hacer una corrección por con-
tinuidad en el cálculo de las respectivas probabilidades, como sigue:

a−0.5−nπ
• Si interesa aproximar P(X = a), se debe calcular P √ ≤ √X−nπ a+0.5−nπ
≤√ .
nπ(1−π) nπ(1−π) nπ(1−π)

a+0.5−nπ
• Si interesa aproximar P(X ≤ a), se debe calcular P Z≤ nπ(1−π) .

a−0.5−nπ
√
• Si interesa aproximar P(X ≥ a), se debe calcular P Z≥ .
nπ(1−π)

a−0.5−nπ
√ b+0.5−nπ
• Si interesa aproximar P(a ≤ X ≤ b) , se debe calcular P ≤Z≤ √ .
nπ(1−π) nπ(1−π)
donde Z es una v.a. con distribución normal estándar.
Ejemplo 10.3.7. Sea X una v.a. con distribución binomial de parámetros n = 100 y π = 0.4.
Calcular P(X ≤ 45) de forma exacta y de forma aproximada utilizando el teorema de Moivre-Laplace.
Comparar los resultados obtenidos.
Solución:
Primero, calculando la probabilidad de forma exacta se sigue que
P(X ≤ 45) = FX (45)

45
X
= fX (x)
x=1
45
X 100
= 0.4x 0.6100−x
x=1
x
= 0.86891.
De otra parte, calculando la probabilidad de forma aproximada por medio del teorema de Moivre-
Laplace se tiene que
!
X − (100)(0.4) 45.5 − (100)(0.4)
P(X ≤ 45) ≈ P p ≤p
(100)(0.4)(1 − 0.4) (100)(0.4)(1 − 0.4)
= P(Z ≤ 1.12)
= Φ(1.12)
= 0.86921.
Se observa que la diferencia en la aproximación es de apenas 0.86891 − 0.86921 = 0.00030.

10.3.6. Distribuciones relacionadas con la distribución normal
En las secciones D.5, D.6 y D.7 se presentan respectivamente la f.d.p. y la tabla de probabilidades de
las distribuciones t de Student, Ji-cuadrado de Pearson y F de Snedecor, que se obtienen a partir de
la distribución normal y se utilizan frecuentemente en la inferencia estadística.
10.4. Distribución exponencial
La distribución exponencial es el equivalente continuo de la distribución geométrica discreta. Esta

distribución describe procesos en los que interesa describir el tiempo hasta que ocurre un determinado
evento, sabiendo que, el tiempo que pueda transcurrir desde cualquier instante dado, hasta que el
evento ocurra en un instante posterior, no depende del tiempo transcurrido anteriormente en el que
no ha pasado nada. Ejemplos de variables con esta distribución son el tiempo que puede transcurrir en
un servicio de algún tipo, o el tiempo que transcurre entre la ocurrencia de dos sucesos consecutivos
en un proceso donde se repite sucesivamente un experimento en intervalos de tiempo con la misma
longitud. Este modelo probabilístico también se utiliza para describir la duración de artículos que no
se deterioran ni mejoran con el tiempo, es decir, aquellos para los cuales la duración es independiente
de la edad.
Denición 10.4.1. Se dice que una v.a. X tiene distribución expo-

nencial de parámetro λ, si la f.d.p. de X está dada por:
λe−λx ,

si x > 0;
fX (x; λ) =
0, en otro caso.
donde λ es un número real positivo.
Nota. Cuando una v.a. X tiene distribución exponencial de parámetro λ se escribe X ∼ Exp(λ). En
5
las grácas de la gura 10.6 se presentan algunos ejemplos de la f.d.p. y la f.d.a. de la distribución
exponencial para diferentes valores de λ.
Proposición 10.4.1. Si X es una v.a. tal que X ∼ Exp(λ) entonces
1
i. E[X] = λ. iv.
1
ii. Var[X] = λ2 . 1 − e−λx ,

si x > 0;
FX (x; λ) =
iii. mX (t) = λ 0, en otro caso.
λ−t .
Demostración:
5 Fotografía tomada de la página web http://es.wikipedia.org/wiki/Distribuci%C3%B3n_exponencial.
10.4. DISTRIBUCIÓN EXPONENCIAL 303
Figura 10.6: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución exponencial para
diferentes valores del parámetro λ.
iii. Primero se demuestra a que corresponde la f.g.m. de la variable y luego utilizando las propiedades
de esta función se obtienen el valor esperado y la varianza como sigue:
mX (t) = E eXt

Z ∞
= ext fX (x)dx
−∞
Z ∞
= ext λe−λx dx
0
Z ∞
=λ e(t−λ)x dx
0
∞
e(t−λ)x
=λ
t − λ 0
λ
= lı́m e(t−λ)x − e(t−λ)0
t − λ x→∞
λ
= (0 − 1)
t−λ
λ
=
λ−t
para |t| < λ.
i.
d λ λ 1
E[X] = mX (t)
=− 2
(−1) = 2
= .
dt t=0 (λ − t) t=0 (λ − 0) λ
ii.
2
Var[X] = E X 2 − (E[X])

2
d2

1
= 2 mX (t) −
dt t=0 λ
λ 1
=− 2(λ − t)(−1) − 2
(λ − t)4 λ
2λ 1
= (λ − 0) − 2
(λ − 0)4 λ
2 1
= 2− 2
λ λ
1
= 2.
λ


lı́m e(t−λ)x = 0.
x→∞
Ejemplo 10.4.1. Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una
distribución exponencial con media de 16 años. ¾Cuál es la probabilidad de que a una persona a la
que se le ha implantado este marcapasos se le deba reimplantar otro antes de 20 años?
Solución:
Aquí la v.a. de interés X es la duración de un marcapasos en una persona. Como E[X] = 16 entonces
1
λ= 16 de donde 1
1 − 16 x
fX (x; 1/16) = 16 e , si x > 0;
0, en otro caso.
En consecuencia, se sigue que

Z 20
P(X ≤ 20) = fX (x)dx
0
Z 20
1 −1x
= e 16 dx
0 16
20
1
− 16 x

= −e
0
1
1

− 16 20
= −e − −e− 16 0
= 0.7135.
Luego, la probabilidad de que a una persona a la que se le haya implantado este marcapasos se le
debe reimplantar otro antes de 20 años es 71.35 %. En la gura 10.7 se presenta el gráco de la f.d.p.
1
y de la f.d.a. de una variable con distribución exponencial de parámetro λ= 16 .
10.4. DISTRIBUCIÓN EXPONENCIAL 305
Figura 10.7: Gráco de la f.d.p. (a) y de la f.d.a. (b) de una variable con distribución exponencial de parámetro
1
λ= 16
.
Nota. En el ejemplo 10.4.1 también se puede utilizar la f.d.a. para efectuar los cálculos. ¾Cómo?
Ejemplo 10.4.2. Calcular e interpretar el percentil 90 de la variable del ejemplo 10.4.1.
Solución:
La mediana, denotada con µ̃X es un valor tal que
FX (µ̃X ) = 0.5
1
donde FX es la f.d.a. de X. Como X tiene distribución exponencial de parámetro λ= 16 , siguiendo
la proposición 10.6, se tiene que
1
1 − e− 16 x ,

si x > 0;
FX (x; 1/16) =
0, en otro caso.
de donde
1
1 − e− 16 µ̃X = 0.5
1
−e− 16 µ̃X = 0.5 − 1
1
e− 16 µ̃X = 0.5
1
ln e− 16 µ̃X = ln(0.5)
1
− µ̃X = ln(0.5)
16
µ̃X = −16 ln(0.5)
µ̃X = 11.0903.
Entonces, la mitad de los marcapasos tiene una vida útil menor a 11 años.
10.5. Distribución gamma
La distribución gamma es una distribución más general que la distribución exponencial y que otras
distribuciones probabilísticas. Bajo ciertas condiciones, esta distribución es de utilidad para describir
el tiempo transcurrido desde que inicia la observación de la llegada de los individuos a una línea de
espera hasta el momento en que llega un sujeto determinado, por ejemplo.
Denición 10.5.1. Se dice que una v.a. X tiene distribución gamma

de parámetros α y β, si la f.d.p. de X está dada por:
(
β α−1 −βx
fX (x; α, β) = Γ(α) (βx) e , si x > 0;
0, en otro caso.
donde α>0 y β>0 son números reales positivos y
Z ∞
Γ(x) = tx−1 e−t dt
0
es la función gamma.
Nota. Cuando una v.a. X tiene distribución gamma de parámetros α y β se escribe X ∼ G(α, β). En
6
las grácas de la gura 10.8 se presentan algunos ejemplos de f.d.p. de la distribución gamma para
diferentes valores de los parámetros α y β. En esta gura se observa por que es común denominar a
7
α parámetro de escala y a β parámetro de forma .
Nota. La distribución exponencial de parámetro λ es un caso especial de la distribución gamma de

parámetros α=1 y β = λ, esto es, Exp(λ) ≡ G(1, λ). ¾Por qué?
Bajo las condiciones de un experimento de Poisson (detalles en la sección 9.6), el número de individuos
que llegan a una línea de espera en el intervalo de tiempo (0, t] tiene distribución de Poisson de
parámetro λt. Si X denota la v.a. que representa el tiempo transcurrido desde el momento que se
6 Fotografía tomada de la página web http://es.wikipedia.org/wiki/Distribuci%C3%B3n_gamma.

7 Un parámetro de forma es cualquier parámetro de una familia de distribuciones de probabilidad que no es un
parámetro de localización ni de escala (o una función de ellos). Dicho parámetro afecta la forma de la distribución más
allá de correrla o escalarla.
10.5. DISTRIBUCIÓN GAMMA 307
Figura 10.8: Algunas grácas de la f.d.p. de la distribución gamma para diferentes valores de los parámetros α y β.
inicia la llegada de los individuos hasta el momento en que llega el n-ésimo sujeto entonces X tiene
distribución gamma de parámetros n y λ, es decir, X ∼ G(n, λ).
Proposición 10.5.1. Si X es una v.a. tal que X ∼ G(α, β) entonces
α
i. E[X] = β.
ii. Var[X] = βα2 .

α
β
iii. mX (t) = β−t .
iv. (
0, si x ≤ 0;
FX (x; α, β) = 1
R βx α−1 −t
Γ(α) 0
t e dt, si x > 0.
Demostración:
Primero se demuestra a que corresponde la f.g.m. de la variable y luego utilizando las propiedades de
esta función se obtienen el valor esperado y la varianza como sigue:
iii.
mX (t) = E eXt

Z ∞
= ext fX (x; α, β)
−∞
Z ∞
β
= (βx)α−1 e−βx dx
ext
0 Γ(α)
Z ∞
1 α−1 −(β−t)x
= βα x e dx
0 Γ(α)
∞
βα (β − t)α α−1 −(β−t)x
Z
= x e dx
(β − t)α 0 Γ(α)
α Z ∞
β (β − t)
= ((β − t)x)α−1 e−(β−t)x dx
β−t 0 Γ(α)
α
β
= (1)
β−t
α
β
=
β−t
siempre que t < β.
i.
βα βα

d α
E[X] = mX (t)
= (−α)(−1)
α+1
= α α+1
= .
dt t=0 (β − t) t=0 β β
ii.
2
Var[X] = E X 2 − (E[X])

2
d2

α
= 2 mX (t)
−
dt t=0 β
βα α2

= α(−(α + 1))(−1) α+2
− 2
(β − t)
t=0 β
βα α2
= (α2 + α) α+2
− 2
β β
α
= .
β2
iv. Se tiene que FX (x; α, β) = 0 siempre que x≤0 porque fX (x; α, β) = 0. De otra parte, si x>0
entonces
Z x
FX (x; α, β) = fX (u; α, β)du
−∞
Z x
β
= (βu)α−1 e−βu dt
0 Γ(α)
Z x
β
= (βu)α−1 e−βu dt
Γ(α) 0
Z xβ
β 1 α−1 −t
= t e dt
Γ(α) 0 β
10.6. DISTRIBUCIÓN BETA 309
Z xβ
1
= tα−1 e−t dt
Γ(α) 0
dado que t = βu de donde dt = βdu.

Ejemplo 10.5.1. La gerencia de servicio al cliente de una cadena de supermercados le indica a la
junta directiva que el valor esperado del tiempo transcurrido desde la apertura de un punto de pago
hasta el momento en que llega el cuarto cliente es 2 minutos con una desviación estándar de 1 minuto.
La junta directiva ha decidido hacer una inversión considerable en infraestructura para disminuir el
tiempo de espera de los clientes siempre y cuando el tiempo transcurrido desde la apertura de un
punto de pago hasta el momento en que llega el cuarto cliente sea de al menos 5 minutos ocurra con
una probabilidad superior a 0.9. Suponiendo que la distribución del tiempo transcurrido es de tipo
gamma, ¾la gerencia de servicio al cliente debe recomendar la inversión?
Solución:
Sea X la v.a. que representaba el tiempo transcurrido desde la apertura de un punto de pago hasta
el momento en que llega el cuarto cliente que se supone tiene distribución gamma de parámetros α
2β
y β. Como µX = α
β = 2 y σX = α
β2 = 1, entonces α = 2β y
β2 =1 de donde β=2 y α = 4. Así, se
tiene que X ∼ G(4, 2).
La gerencia de servicio al cliente debe recomendar la inversión si P(X ≥ 5) > 0.9. Calculando se
obtiene que:
P(X ≥ 5) = 1 − P(X < 5)

= 1 − FX (5; 4, 2)
Z (2)(5)
1
=1− t4−1 e−t dt
Γ(4) 0
1 10 3 −t
Z
=1− t e dt
6 0
1
= 1 − (5.937984)
6
= 0.01033605.
En consecuencia, la gerencia no debe recomendar la inversión en infraestructura.
R 10 3 −t
Nota. Queda como ejercicio para el lector justicar que Γ(4) = 6 y que
0
t e dt = 5.937984.
10.6. Distribución beta
La distribución beta se utiliza frecuentemente para modelar v.a.'s que mesuren una proporción, ya que
está distribución solamente toma valores entre 0 y 1. Ejemplos de variables que sigan esta distribución
son el porcentaje de impurezas de un producto, la proporción de individuos con una preferencia

determinada y la fracción de tiempo que dura la ejecución de cierta tarea.
Denición 10.6.1. Se dice que una v.a. X tiene distribución beta de

parámetros α y β, si la f.d.p. de X está dada por:
1 α−1
− x)β−1 ,

B(α,β) x (1 si 0 < x < 1;
fX (x; α, β) =
0, en otro caso.
donde α>0 y β>0 son números reales positivos
Z 1
B(x) = tα−1 (1 − x)β−1 dt
0
es la función beta.
Nota. Cuando una v.a. X tiene distribución beta de parámetros α y β se escribe X ∼ B(α, β). En las
8
grácas de la gura 10.9 se presentan algunos ejemplos de la f.d.p. y la f.d.a. de la distribución beta
para diferentes valores de los parámetros α y β.
Figura 10.9: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución beta para diferentes
valores de los parámetros α y β.
Nota. La distribución uniforme continua de parámetro sobre el intervalo (0,1) es un caso especial de
la distribución beta de parámetros α=1 y β = 1, esto es, U (0, 1) ≡ B(1, 1). ¾Por qué?
Proposición 10.6.1. Si X es una v.a. tal que X ∼ B(α, β) entonces
α
i. E[X] = α+β .
αβ
ii. Var[X] = (α+β+1)(α+β)2 .
8 Fotografía tomada de la página web http://es.wikipedia.org/wiki/Distribuci%C3%B3n_beta.
10.6. DISTRIBUCIÓN BETA 311
iii.
∞ k−1
!
X Y α+r tk
mX (t) = 1 +
r=0
α+β+r k!
k=1
.
iv. 
 0, Rx si x ≤ 0;
1
FX (x; α, β) = B(α,β) 0
tα−1 (1 − t)β−1 dt, si 0 < x < 1;
x ≥ 1.

1, si
La demostración se puede consultar en Sarabia et al. (2007, p. 124).
Nota. En Blanco (2004, p. 151) se estipula que las funciones gamma y beta se relacionan mediante la
identidad
Γ(x)Γ(y)
B(x, y) =
Γ(x + y)
donde x y x son números reales positivos.
Ejemplo 10.6.1. El asesor nanciero de una empresa de electrodomésticos le asegura al gerente ge-
neral que semanalmente no se están cumpliendo las metas en relación a las ventas de los productos y
que por tal motivo éste debe intervenir. Anteriormente, una empresa de consultoría le había suminis-
trado al gerente un informe en el que se precisa que el porcentaje de artículos que se venden durante
una semana dada tiene distribución beta de parámetros α=2 y β = 4. Con base en este modelo, el
gerente cree que, si la proporción de artículos que se venden semanalmente no supera el 0.8 con una
probabilidad mayor a 0.5 entonces debe ejecutar urgentemente un plan de acción. ¾Qué decisión debe
tomar el gerente?
Solución:
Sea X la v.a. que denota el porcentaje de artículos que se vende durante una semana dada que según
el informe sigue una distribución beta de parámetros α = 2 y β = 4, esto es, X ∼ B(2, 4). El gerente
ha decidido ejecutar un plan de acción siempre que P(X ≤ 0.8) ≥ 05. Calculando se obtiene que:
P(X ≤ 0.8) = FX (0.8; 2, 4)
Z 0.8
1
= t2−1 (1 − t)4−1 dt
B(2, 4) 0
Z 0.8
1
= t(1 − t)3 dt
B(2, 4) 0
Z 0.8
1
= t(1 − t)3 dt
1/20 0
= (20)(0.049664)
= 0.99328.
En consecuencia, el gerente no debe ejecutar el plan de acción.
R 0.8 3
Nota. Queda como ejercicio para el lector justicar que B(2, 4) = 1/20 y que
0
t(1 − t) dt =
0.049664.
10.7. Otras distribuciones probabilísticas
Con el propósito de ofrecer un panorama más amplio y a su vez menos restrictivo para describir
variables aleatorias, en esta se sección se presentan sin demostración las generalidades de otras distri-
buciones probabilísticas de uso común en estadística.
Denición 10.7.1. Se dice que una v.a. X tiene distribución de Wei-

bull de parámetros α y β, si la f.d.p. de X está dada por:
(
x β
β x β−1 −( α ) ,

fX (x; α, β) = α α e si x ≥ 0;
0, en otro caso.
donde α y β son números reales positivos.
9
Nota. En las grácas de la gura 10.10 se presentan algunos ejemplos de la f.d.p. y la f.d.a. de la
distribución de Weibull para diferentes valores de los parámetros α y β. En esta gura se observa por
que es común denominar a α parámetro de escala y a β parámetro de forma.
Figura 10.10: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución de Weibull para
diferentes valores de los parámetros α y β.
Proposición 10.7.1. Si X es una v.a. con distribución de Weibull de parámetros α y β entonces
9 Fotografía tomada de la página web http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Weibull.

10.7. OTRAS DISTRIBUCIONES PROBABILÍSTICAS 313

i. E[X] = αΓ 1 + β1 . iv.

2
ii. Var[X] = α2 Γ 1 + β2 − (E[X]) . (
0, si x < 0;
P∞ k k FX (x; α, β) = −( α
x
)
β
iii. mX (t) = k=0 t k!α Γ 1 + βk para β > 1. 1−e , si ≥ 0.
Denición 10.7.2. Se dice que una v.a. X tiene distribución de

Cauchy de parámetros α y β, si la f.d.p. de X está dada por:
1
fX (x; α, β) = 2
x−α
πβ 1 + β
donde α es un número real y β es un número real positivo.
Nota. Si X tiene distribución de Cauchy de parámetros α = 0 y β = 1 entonces se obtienen la

denominada distribución de Cauchy estandarizada cuya f.d.p. está dada por:
1
fX (x; 0, 1) = .
π (1 + x2 )
10
En las grácas de la gura 10.11 se presentan algunos ejemplos de la f.d.p. y la f.d.a. de la distribución
de Cauchy para diferentes valores de los parámetros α y β . En esta gura se observa por que es común
denominar a α parámetro de localización y a β parámetro de escala.
Figura 10.11: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución de Cauchy para
Proposición 10.7.2. Si X es una v.a. con distribución de Cauchy de parámetros α y β entonces
10 Fotografía tomada de la página web http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Cauchy.

i. E[X] no existe. iv.
ii. no existe.

Var[X] 1 x−α
FX (x; α, β) = arctan .
iii. mX (t) no existe. π β
Denición 10.7.3. Se dice que una v.a. X tiene distribución de La-

place de parámetros α y β, si la f.d.p. de X está dada por:
1 − |x−α|
fX (x; α, β) = e β
2β
donde α es un número real y β es un número real positivo.
11
distribución de Laplace para diferentes valores de los parámetros α y β. En esta gura se observa por
que es común denominar a α parámetro de localización y a β parámetro de escala.
Figura 10.12: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución de Laplace para
Proposición 10.7.3. Si X es una v.a. con distribución de Laplace de parámetros α y β entonces
i. E[X] = α.
ii. Var[X] = 2β 2 .
eαt
iii. mX (t) = 1−β 2 t2 .
iv.
1 |x−α|

FX (x; α, β) = 1 + sgn(x − α) 1 − e− β .
2
11 Fotografía tomada de la página web http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Laplace.
Denición 10.7.4. Se dice que una v.a. X tiene distribución lognor-

mal de parámetros µ y σ, si la f.d.p. de X está dada por:
( 2
ln(x)−µ
− √
√ 1 e 2σ , si x > 0;
fX (x; µ, σ) = 2πσx
0, en otro caso.
donde µ es un número real y σ es un número real positivo.
12
distribución de lognormal cuando el parámetro µ = 0 para diferentes valores del parámetro σ . En esta
gura se observa por que es común denominar a σ parámetro de forma.
Figura 10.13: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución lognormal cuando el
parámetro µ=0 para diferentes valores del parámetro σ.
Proposición 10.7.4. Si X es una v.a. con distribución lognormal de parámetros α y β entonces
1 2
i. E[X] = eµ+ 2 σ .
2 2
ii. Var[X] = eσ − 1 e2µ+σ .
10.8. Comentarios
En esta sección se presentan con cierto grado de profundidad los aspectos más relevantes de las
distribuciones continuas de uso frecuente en la estadística. Se abordan el valor esperado, la varianza,
la f.g.m. y la f.d.a. de las distribuciones uniforme continua, normal y exponencial, entre otras. El
12 Fotografía tomada de la página web http://en.wikipedia.org/wiki/Log-normal_distribution.

manejo adecuado de estas distribuciones probabilísticas da al lector una herramienta poderosa para
entender y aplicar varias técnicas relevantes de la inferencia estadística. Se enfatiza el uso pertinente
de la distribución normal, pues ésta es parte importante de la mayoría de las prácticas probabilísticas
porque, como lo indica el teorema del límite central, bajo ciertas condiciones, la distribución del
promedio muestral converge a la distribución normal a medida que aumenta el tamaño de la muestra,
sin que importe la distribución original de la variable de interés. Finalmente, también se abordan los
tópicos relacionados con otras distribuciones continuas de uso común, promoviendo su uso por medio
de ejemplos y ejercicios, donde se estudian sus posibles aplicaciones.
10.9. Ejercicios
10.1 Si X es una v.a. tal que X ∼ N (10, 4), calcular las siguientes probabilidades:
a. P(X ≤ 10.23). f. P(10.12 ≤ X ≤ 10.87).

b. P(X < 23.82). g. P(9.24 < X < 9.55).
c. P(X ≤ 9.30).
d. P(9.30 < X < 10.41). h. P(|X| > 11.32).
e. P(2.65 < X). i. P(X 2 > 9).
10.2 Calcular los percentiles 90, 95 y 99 para la v.a. del ejercicio 10.1.
10.3 Una empresa estatal puede comprar materia prima a dos proveedores diferentes y está interesada
en el contenido de impurezas del producto. Una revisión de los registros de cada proveedor indi-
ca que los niveles de impurezas contenidos en sendas remesas de producto siguen distribuciones
normales con media y desviación típica contenidas en la tabla de abajo. La empresa está especial-
mente preocupada porque el contenido de impurezas no exceda el 4 %, y comprará al proveedor
que con más probabilidad cumpla con este requisito. ¾Qué proveedor habrá que elegir?
Proveedor µ σ
Proveedor A 3.3 0.3
Proveedor B 3.1 0.5
10.4 Estudiando los productos de una compañía fabricante de una maquinaria especíca, se identicó
que la vida promedio de dicha maquinaria es dos años con una desviación estándar de un mes.
La empresa reemplaza gratis todas las maquinarias que fallen dentro del tiempo de garantía y
ha decidido reemplazar solo el 1 % de las maquinarias que fallen. Si la duración de la maquinaria
sigue una distribución normal, ¾de qué duración debe ser la garantía que ofrezca la compañía?
10.5 Calcular el coeciente de variación de X teniendo en cuenta que X ∼ N (µ, σ 2 ), P(X ≤ 7) =

0.9772 y P(X ≤ 6.5) = 0.8413.
10.6 Las calicaciones de los 675 aspirantes presentados a un examen para contratación laboral, se
distribuye normalmente con media 6.5 y varianza 4.
a. Calcular la probabilidad de que un aspirante obtenga al menos 8 puntos.
b. ¾Cuántos aspirantes obtuvieron calicaciones comprendidas entre 5 y 7.5 puntos?.
c. Calcular e interpretar el percentil 80.
d. ¾Cuál es el puntaje que separa el 5 % de los estudiantes más calicados del resto?
10.7 La estatura media de los alumnos de un centro educativo es de 164 cm y solo 24 de los 200
alumnos miden menos de 150 cm. Suponiendo que la estatura de los alumnos tiene distribución
normal, ¾cuál es la desviación estándar de la estatura?
10.8 El percentil 70 de una distribución normal es igual a 88, siendo 0.27 la probabilidad de que
la variable tenga un valor inferior a 60. Calcular la media y la desviación estándar de esta
distribución.
10.9 Las puntuaciones de un examen se distribuyen normalmente con media 15 puntos. La puntuación
a ha sido superada por el 23 % de los alumnos. La puntuación b está situada a 5 puntos por debajo
de la media. Entre b y la media se encuentra el 30 % de los alumnos. Calcular la desviación típica
de las calicaciones y el porcentaje de alumnos entre a y b.
10.10 En un estudio realizado sobre los ingresos familiares en los que los dos cónyuges trabajan, se ha
observado que el salario mensual, en miles de pesos, de las mujeres (X ) se distribuye normalmente
con media 100, en tanto que el de los hombres (Y ) está dado por la siguiente transformación
Y = X + 20. Además, el 15 % de los hombres no superan el percentil 75 de las mujeres.
a. Calcular el salario medio de los hombres.
b. Calcular la desviación típica del salario de los hombres y de las mujeres.
c. Calcular e interpretar el coeciente de variación del salario de los hombres y de las mujeres.
d. Calcular e interpretar el percentil 5 del salario de los hombres.
10.11 El tiempo de reparación de cierta maquinaria tiene una distribución exponencial con media 22
minutos.
a. Hallar la probabilidad de que el tiempo de reparación sea menor que diez minutos.
b. El costo de reparación es de 2,000 USD por cada media hora o fracción. ¾Cuál es la probabi-
lidad de que una reparación cueste 4,000 USD o más?
c. Para efectuar una programación, ¾cuánto tiempo se debe asignar a cada reparación para que
la probabilidad de que cualquier tiempo de reparación mayor que el tiempo asignado sea solo
de 0.1?
10.12 Ejercicio tomado de Blanco (2004, p. 138). Un instructor asume que las calicaciones nales de
los estudiantes son los valores de una v.a. X con distribución normal de parámetros µ y σ 2 . El
instructor decide asignar la calicación A a aquellos estudiantes cuyo puntaje exceda a µ + σ,
la calicación B a aquellos estudiantes cuyo puntaje estén entre µ y µ + σ , la calicación C a
aquellos estudiantes cuyos puntajes estén entre µ−σ y µ, la calicación D a aquellos estudiantes
cuyos puntajes estén entre µ − 2σ y µ − σ, y la calican F a aquellos estudiantes cuyos puntajes
sean inferiores a µ − 2σ . Encontrar el porcentaje de estudiantes que obtienen como calicación
A, B, C, D o F.
10.13 Los pesos (en kilogramos) de 2,000 estudiantes presentan una distribución normal de media 65
y desviación típica 8. Calcular la probabilidad de que un estudiante elegido al azar pese:
a. más de 61.
b. entre 63 y 69.
c. menos de 70.
d. más de 75.
10.14 Sea X una v.a. tal que X ∼ U (a, b). Determinar el valor de los parámetros a y b teniendo en
cuenta que E [X] = 6 y P(X ≤ 6) = 0.5.
10.15 Sea X una v.a. tal que X ∼ U (0, 1). Hallar la f.d.p. de la v.a. Y = X 2 + 1.
10.16 La concentración de un contaminante se distribuye de manera uniforme sobre el intervalo de 0 a

20 partes por millón. Si se considera tóxica una concentración de 8 o más, ¾cuál es la probabilidad
de que al tomarse una muestra la concentración de esta sea tóxica? ¾Cuál es la concentración
media y la varianza?
10.17 El personal de una compañía usa una terminal para realizar sus pedidos internacionales. El
tiempo que emplea un comercial en la terminal tiene distribución exponencial con una media de
36 minutos.
a. Calcular la probabilidad de que un comercial utilice la terminal durante 30 minutos o menos.
b. Si un comercial ha estado más de 30 minutos en la terminal, ¾cuál es la probabilidad de que

pase al menos una hora en la terminal?.
c. El 90 % de las sesiones terminan en menos de a minutos. ¾Cuál es el valor de a?
10.18 Con la información del ejemplo 10.4.1 Si el marcapasos lleva funcionando correctamente 5 años
en un paciente, ¾cuál es la probabilidad de que haya que cambiarlo antes de 25 años?
10.19 Un punto aleatorio X tiene distribución uniforme en el intervalo [0, 1] y otro punto aleatorio Y
tiene distribución uniforme en el intervalo [2, 3]. Se dene la v.a. D como la distancia entre X y
Y dada por D = |Y − X|. Calcular el valor esperado de D.
10.20 Se sabe que la cantidad aleatoria demandada durante un periodo de tiempo por parte de una
empresa textil tiene distribución uniforme y no supera una tonelada. Determinar para dicho
periodo de tiempo:
a. La probabilidad de que la cantidad demandada no supere los 900 kilogramos.
b. La probabilidad de que la cantidad demandada no esté comprendida entre 800 y 900 kilogra-
mos.
c. La demanda esperada y la varianza.
10.21 Una empresa tiene una función de costos que viene dada por C = 2X + 100, 000. En el mercado
vende cada unidad a 5 euros y la demanda X del artículo tiene distribución uniforme entre 25,000
y 30,000 unidades. ¾Cuál es el benecio esperado y la varianza?
10.22 La duración de la vida de una bombilla tiene distribución exponencial de parámetro λ y la

probabilidad de que sobrepase las 100 horas de uso es 0.9.
a. ¾Cuál es la probabilidad de que sobrepase 200 horas de uso?
b. ¾Cuántas horas se mantiene funcionando con una probabilidad de 0.95?
10.23 Demostrar que si X es una v.a. con distribución exponencial de parámetro λ entonces la mediana
ln(2)
de X es
λ .
10.24 Demostrar que si X es una v.a. con distribución normal de parámetros µ y σ2 entonces la media,
la mediana y la moda de X coinciden y son iguales a µ.
10.25 Demostrar que si X es una v.a. con distribución normal de parámetros µ y σ 2 y a y b son número
reales entonces Y = aX + b es una v.a. con distribución normal de parámetros aµ + b y a2 σ 2 .
10.26 Con la información del ejemplo 10.3.5, rehacer el numeral a. suponiendo que, debido a errores
en el sistema, todos los aspirantes aumentaron su coeciente de inteligencia 8.7 % y obtuvieron
un descuento de 3 puntos.
10.27 Demostrar que si n es un número entero positivo entonces Γ(n) = (n − 1)!.
10.28 Demostrar que si X ∼ G(α, β) y α es un entero positivo entonces
α−1
X (βx)k
FX (x) = 1 − e−βx .
k!
k=0
10.29 Demostrar que la distribución exponencial de parámetro λ es un caso especial de la distribución

gamma de parámetros α=1 y β = λ.
10.30 Demostrar que la distribución uniforme continua de parámetro sobre el intervalo (0,1) es un caso
especial de la distribución beta de parámetros α=1 y β = 1.
10.31 Demostrar que si X ∼ B(α, β) y α y β son números enteros positivos entonces
(
(α+β+1)! α−1
(α−1)!(β−1)! x (1 − x)β−1 , si 0 < x < 1;
fX (x) =
0, en otro caso.
10.32 Demostrar que si X es una v.a. con distribución de Cauchy de parámetros α y β entonces el
valor esperado de X no existe.
Capı́tulo 11
Distribuciones de probabilidad
multivariadas
(Emilio Pablo Berdugo Camacho)
11.1. Introducción
En los capítulos 2 a 5 se introducen técnicas descriptivas y exploratorias para el análisis de individual

de cada una de las variables objeto de estudio. En seguida, en el capítulo 6, se hace la extensión al
caso donde se investigan las relaciones de asociación entre pares de variables. Luego, en los capítulos
8 a 10 se introduce el concepto de distribución de probabilidad de una variable aleatoria de manera
univariada, es decir, sin considerar las posibles asociaciones con otras variables observadas. En este
1
capítulo se hace una extensión análoga a la citada en el capítulo 6, que consiste en la introducción de
los vectores aleatorios y sus distribuciones de probabilidad, elementos centrales dentro de los estudios
2
multivariados (que tienen como caso particular los de nivel relacional).
Como ejemplo de motivación, se retoma el ejemplo 6.4.2 donde se consideran las variables peso y edad.
Como la edad no se ha jado antes de extraer la muestra, se sigue que estas variables son aleatorias
y de manera a priori se puede suponer cierta relación probabilística entre ellas (el valor signicativo
del coeciente de correlación de Pearson calculado en el ejemplo 6.5.3 así lo sugiere). Por ejemplo,
3
se quiere construir un modelo probabilístico para estimar la probabilidad de observar un niño de la
población de interés con un peso superior a 40 kilogramos y una edad inferior a 12.5 años. En este caso,
1 Este capítulo fue en su totalidad escrito por M.Sc. Emilio Pablo Berdugo Camacho y revisado por los autores.
2 Un estudio multivariado e aquel donde se observa más de una variable respuesta que se analizan conjuntamente.
3 Los procedimientos de estimación pertenecen a la estadística inferencial que se presenta en la denición 1.4.2.
320
11.2. VECTORES ALEATORIOS 321
es claro que no parece adecuado construir separadamente modelos individuales para cada variable; en
lugar de ello, se debe pensar en un modelo conjunto que tenga en cuenta el grado de asociación entre
estas dos características.
Un requisito fundamental para la comprensión y uso de los conceptos desarrollados en el presente

4
capítulo son los conocimientos básicos en cálculo para funciones de múltiples variables grácos,
5
límites, derivadas parciales e integrales múltiples .
11.2. Vectores aleatorios
Los vectores aleatorios son los objetos de interés de los estudios multivariados. A continuación se
presentan las generalidades de este tipo de objetos.
Denición 11.2.1. Sean X1 , X2 , . . . , Xp v.a.'s. Un vector aleatorio

X de dimensión p es un arreglo ordenado de la forma:

X1
 X2 
T
X =  .  = [X1 , X2 , . . . , Xp ] .
 
 .. 
Xp
Las v.a.'s del arreglo se denominan componentes del vector aleatorio.
Nota. Siguiendo con la convención introducida en el capítulo 8, la realización de un vector aleatorio

T
X se denota mediante x = [x1 , x2 , . . . , xp ] .
6
En principio, todas las componentes deben estar denidas sobre el mismo espacio de probabilidad ,
7
lo cual obliga, entre otras cosas, a que todas las variables sean discretas o continuas . De esta forma,
se dice que un vector aleatorio es discreto si todas sus componentes lo son v.a.d.'s, y análogamente,
se dice que un vector aleatorio es continuo si todas sus componentes son v.a.c.'s.
A continuación se presenta un ejemplo de un vector aleatorio conocido como vector aleatorio mul-
tinomial :
Ejemplo 11.2.1. Se consideran las condiciones bajo las cuales se dene una v.a. binomial en la sección
9.3, pero ahora el experimento admite p posibles resultados excluyentes entre sí, representados con
4 También conocido como cálculo vectorial.

5 La página web http://www.wolframalpha.com/examples/Math.html ofrece herramientas en línea para la implemen-
tación operativa de estos tópicos.
6 La denición formal de un espacio de probabilidad se puede consultar en Blanco (2004, p. 17).
7 Aunque es posible trabajar con vectores aleatorios que combinen componentes continuas y discretas, este tema está
fuera de los alcances de este libro.
322CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
R1 , R2 , . . . , Rp . Si el experimento se ejecuta n veces y X1 , X2 , . . . , Xp son las v.a.'s que representan

el número de ocasiones que ocurre cada uno de los posibles resultados, entonces el vector aleatorio
X = [X1 , X2 , . . . , Xp ]
T
recibe la denominación de multinomial. Se observa que las componentes de
este vector deben ser tales que X1 + X2 + . . . + Xp = n.
Una ilustración de un vector aleatorio multinomial consiste en un proceso de control de calidad en una
8
industria donde se toma una muestra aleatoria de 25 artículos producidos en una semana determinada.
Después de una inspección, los artículos se clasican según su estado de calidad como aceptable,
inferior o intolerable. Se denen las v.a.'s X1 , X2 y X3 como número de artículos clasicados como
aceptables, número de artículos clasicados como inferiores y número de artículos clasicados como
intolerables respectivamente. Es claro que estas variables solo pueden tomar valores enteros positivos
y además satisfacen la restricción X1 + X2 + X3 = 25. De esta forma, si en la muestra se observan 20
artículos aceptables, 2 en con calidad inferior y 3 intolerables, entonces el vector aleatorio observado
T
es x = [20, 2, 3] .
En el siguiente ejemplo considera un vector aleatorio que consiste en una generalización multivariada
de la distribución normal (detalles en la sección 10.3). Este vector se llama vector aleatorio normal
multivariado :
Ejemplo 11.2.2. X = [X1 , X2 , . . . , Xp ] es normal multivariado

T
Se dice que el vector aleatorio
si para cualquier conjunto de números reales c1 , c2 , . . . , cp no todos iguales a 0, se cumple que la
Pp
variable Y = i=1 ci Xi tiene distribución normal. Una consecuencia directa de esta denición es que
si X es un vector normal multivariado, entonces cada una de sus componentes está normalmente
distribuida; lo contrario no es cierto necesariamente, esto es, las componentes de manera individual
pueden tener distribución normal, y el vector aleatorio conformado por ellas no ser un vector aleatorio
normal multivariado. El caso particular en el que p = 2 recibe el nombre de vector aleatorio normal
bivariado y se tratará mas adelante detalladamente.
11.3. Distribuciones conjuntas de probabilidad
Como se indicó en la introducción, en situaciones donde se estudia más una variable asociada al mismo
fenómeno aleatorio, puede ser inadecuado construir modelos probabilísticos individuales debido a que
esta estrategia no tiene en cuenta las posibles relaciones de asociación. En lugar de ello, se construyen
modelos o distribuciones de probabilidad conjuntas que permitan calcular probabilidades de eventos
asociados con más de una variable. Estas distribuciones conjuntas se abordan separadamente para
vectores de componentes discretas y luego continuas.
8 Para que el supuesto de independencia sea válido, el tamaño de muestra debe ser muy pequeño en comparación
con la producción semanal.
11.3. DISTRIBUCIONES CONJUNTAS DE PROBABILIDAD 323
11.3.1. Vector de componentes discretas
El caso en el que un vector aleatorio posea dos componentes, además de ser el más simple, es uno de
los más comunes en las aplicaciones, y por esta razón es el caso que se considera inicialmente. Una
vez se desarrolla la teoría para el escenario bivariado (dos variables), su extensión resulta inmediata
para más de dos componentes.
Se considera el caso en el que un vector aleatorio X contiene dos componentes discretas X y Y . La idea
es hacer una extensión del concepto de f.m.p. presentando en la sección 8.2 para una v.a. discreta y

que permita calcular probabilidades conjuntas de la forma P X = (x, y)T , denotadas frecuentemente
mediante P(X = x, Y = y).
Denición 11.3.1. Sea X = [X, Y ]T un vector aleatorio conformado

por las v.a.d.'s X y Y que toman los valores x1 , x2 , . . . y y1 , y2 , . . . res-
pectivamente. Una función fXY : R2 → [0, 1] es una función másica
de probabilidad conjunta de X si y solo si

P(X = x, Y = y), si x = x1 , x2 , . . . y y = y1 , y2 , . . .;
fXY (x, y) =
0, en otro caso.
donde (X = x, Y = y) es el evento constituido por todos los elementos

en el espacio muestral cuyo valor a través de X es igual a x y a través
de Y es igual a y, es decir:
(X = x, Y = y) = {w ∈ Ω : (X(w), Y (w)) = (x, y)}.
Nota. El subíndice de la función másica de probabilidad conjunta, o simplemente distribución de

probabilidad conjunta, puede ser el símbolo que representa el vector aleatorio de interés o una secuencia
de sus componentes.
Ejemplo 11.3.1. Se lanzan dos dados balanceados y distinguibles

9
de seis caras y se considera
el vector aleatorio bidimensional conformado por los resultados de cada dado. Como los dados son
balanceados y los resultados son independientes (detalles en la sección 7.12) unos de otros, entonces
la probabilidad de obtener cualquiera de las 36 posibles parejas contenidas en el espacio muestral es
igual a ( 61 )( 16 ) = 1
36 . Así, la función másica de probabilidad conjunta para estas dos variables discretas
está dada por:
(
1
36 , si (x, y)T ∈ {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6},
fXY (x, y) =
0, en otro caso.
donde X es la v.a.d. que corresponde al primer resultado obtenido, Y la v.a.d. asociado con el
9 Los dados se llaman distinguibles si es posible diferenciarlos por alguna característica como tamaño, color o textura.
segundo resultado obtenido y A × B denota el producto cartesiano10 entre los conjuntos A y B . En

este caso, {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6} es una manera de abreviada de denotar el conjunto de las
36 parejas del espacio muestral correspondiente y la distribución de probabilidad conjunta resulta ser
11
una distribución de tipo uniforme o constante . La gura 11.1 muestra la gráca de la función másica
de probabilidad conjunta de las variables X y Y . Esta gráca es una nube de puntos en 3 dimensiones,
a la que se le agregan líneas verticales para facilitar la asociación entre las parejas ordenadas y su
correspondientes probabilidades.
● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
0.04
● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
0.03
y
6
fXY(x, y)
5
0.02
4
3
0.01
2
1
0.00
0
0 1 2 3 4 5 6 7
Figura 11.1: Función másica de probabilidad conjunta de las variables asociadas con los resultados de dos dados
distinguibles y balanceados.
En seguida se presenta un ejemplo relacionado con la distribución empírica de un vector aleatorio

bivariado de componentes discretas a partir de una tabla de contingencia:
Ejemplo 11.3.2. En la tabla 6.3 se muestra la distribución porcentual conjunta de las variables
género y nivel educativo de una muestra conformada por 46 empleados de una empresa. Las frecuencias
10 El producto cartesiano entre los conjuntos A y B es el conjunto conformado por todas las parejas ordenadas
cuya primera componente es un elemento del conjunto A y cuya segunda componente es un elemento del conjunto B ,
esto es, A × B = {(x, y) : x ∈ A y y ∈ B}.
11 Si los dados no fuesen balanceados algunos resultados serían más probables que otros y en consecuencia la distri-
bución de probabilidad conjunta no sería constante.
12
relativas asociadas a cada una de las celdas centrales de la tabla se pueden considerar estimaciones
puntuales de los valores de la función de probabilidad conjunta de las variables en cuestión. Se observa
que las componentes del vector aleatorio de estudio son ambas de naturaleza categórica. Así, con base
en los valores de la tabla es posible estimar probabilidades como:
P [X = Mujer, Y = Posgrado] = 0.043 y P [X = Hombre, Y = Bachillerato] = 0.087−

La gura 11.2 muestra la representación gráca de la función másica de probabilidad conjunta para
las variables género y nivel educativo, estimada a partir de la información muestral contenida en la
tabla 6.3.
0.35
0.30
Distr. de probabilidad conjunta
0.25
0.20
0.15
0.10
0.05
Preg.
0.00
Bach.
Hombre Mujer
Figura 11.2: Función másica de probabilidad conjunta estimada para las variables género y nivel educativo .
Ahora se extiende el concepto de función de distribución acumulada, que se presenta en la denición

8.3.2, al escenario bivariado.
12 En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de
un parámetro de una población a partir de los datos proporcionados por una muestra (Wikipedia 2012d).
Denición 11.3.2. Sea X = [X, Y ]T un vector aleatorio conforma-

do por las v.a.d.'s X y Y que toman los valores x1 , x2 , . . . y y1 , y2 , . . .
respectivamente, con función másica de probabilidad conjunta fXY . La
función de distribución acumulada conjunta de X es la función
FXY : R2 −→ [0, 1] denida por
XX
FXY (x, y) = P(X ≤ x, Y ≤ y) = fXY (u, v)
u≤x v≤y
para cuales quiera números reales x y y.
13
Un gráco típico de una función de distribución acumulada conjunta de un vector aleatorio bivariado
se muestra en la gura 11.3. Esta es una función escalonada que se mantiene constante dentro de un
grupo de regiones rectangulares del plano xy .
Figura 11.3: Función de distribución acumulada conjunta para dos variables discretas.
Ejemplo 11.3.3. Construir la función de distribución acumulada conjunta para las v.a.'s X y Y del
ejemplo 11.3.1.
13 Imagen tomada de Soong (2004, p. 51).

Solución:
Para construir FXY (x, y) en este escenario se deben considerar los siguientes casos:
• Caso 1: x < 1 o y < 1. En este caso se tienen probabilidades de la forma P[(X < 1) ∩ (Y < y)]
o P[(X < x) ∩ (Y < 1)], para los cuales se cumple que:
FXY (x, y) = P[(X < 1) ∩ (Y < y)] = P[φ ∩ (Y < y)] = P(φ) = 0
o
FXY (x, y) = P[(X < x) ∩ (Y < 1)] = P[(X < x) ∩ φ] = P(φ) = 0.
• Caso 2: (x, y)T ∈ [1, 6] × [1, 6]. En este caso se tiene que:
[x] [y] [x] [y]

X X 1 1 XX 1 [x] · [y]
FXY (x, y) = = 1= ([x] · [y]) =
u=1 v=1
36 36 u=1 v=1 36 36
donde [a] denota la parte entera de a.

• Caso 3: x>6 y y > 6. En este caso se tiene que:
6 X 6
X 1 1
FXY (x, y) = = · 36 = 1.
u=1 v=1
36 36
Los anteriores casos se pueden resumir en la siguiente expresión:


 0, si x < 1 o y < 1;
[x]·[y]
FXY (x, y) = 36 , si (x, y)T ∈ [1, 6] × [1, 6];

1, si x > 6 y y > 6.
La tabla 11.1 muestra todos los valores de FXY (x, y). Aunque no es necesario elaborar esta tabla,
ya que se puede construir una expresión cerrada para la función de distribución acumulada conjunta,
no en todos lo casos es posible contar con dicha expresión y la única forma de expresar FXY (x, y)
es tabular. La gura 11.4 muestra la gráca de la función de distribución acumulada conjunta de las
variables asociadas con los resultados de dos dados distinguibles y balanceados.
La siguiente proposición enseña algunas propiedades de la función de distribución acumulada conjunta,

análogas a las que se citan en el caso unidimensional en el capítulo 8. Las dos primeras propiedades
tratan el comportamiento de FXY (x, y) en el innito, mientras que la tercera se puede interpretar
armando que la gráca de FXY (x, y) es no decreciente.
Proposición 11.3.1. Si X y Y son v.a.'s discretas con función de distribución acumulada conjunta
FXY (x, y) entonces se satisface que:
i. lı́m lı́m FXY (x, y) = lı́m FXY (x, y) = lı́m FXY (x, y) = 0.
x→−∞ y→−∞ x→−∞ y→−∞
X \Y Y <1 1≤Y <2 2≤Y <3 3≤Y <4 4≤Y <5 5≤Y <6 6≤Y
X<1 0 0 0 0 0 0 0
1≤X<2 0 1/36 1/18 1/12 1/9 5/36 1/6
2≤X<3 0 1/18 1/9 1/6 2/9 5/18 1/3
3≤X<4 0 1/12 1/6 1/4 1/3 5/12 1/2
4≤X<5 0 1/9 2/9 1/3 4/9 5/9 2/3
5≤X<6 0 5/36 5/18 5/12 5/9 25/36 5/6
6≤X 0 1/6 1/3 1/2 2/3 5/6 1
Tabla 11.1: Valores de la función de distribución acumulada conjunta de las variables asociadas con los resultados de
dos dados distinguibles y balanceados.
1.0
0.8
F(x,y)
0.6
0.4
0.2
0.0
8
6
8
4
y
6
2 4
x
2
0 0
Figura 11.4: Función de distribución acumulada conjunta de las variables asociadas con los resultados de dos dados
distinguibles y balanceados.
ii. lı́m lı́m FXY (x, y) = 1.

x→∞ y→∞
iii. Si y2 > y1 y x2 > x1 entonces FXY (x2 , y2 ) + FXY (x1 , y1 ) − FXY (y2 , x1 ) − FXY (y2 , x2 ) > 0.
La demostración se puede consultar en Blanco (2004, p. 176).

11.3.2. Distribución multinomial
Como se evidencia en el ejemplo 11.2.1, un vector aleatorio multinomial es una generalización de

una v.a. con distribución binomial (detalles en la sección 9.3) en la que los p posibles resultados
Pp
son excluyentes con probabilidad de ocurrencia πi para i = 1, 2, . . . , p, tales que i=1 πi = 1. A
continuación se aborda la función de probabilidad de un vector aleatorio multinomial.
Proposición 11.3.2. La función de probabilidad de un vector aleatorio multinomial de dimensión p

asociado con las probabilidades de ocurrencia π1 , π2 , . . . , πp está dada por:
Yp
n
fX (x1 , x2 , . . . , xp ) = π xi
x1 x2 · · · xp i=1 i
Pp
donde n es el número de ensayos y (x1 , x2 , . . . , xp )T es un elemento de Np tal que i=1 xi = n.
Demostración:
Siguiendo la denición de eventos independientes, la probabilidad de que aparezca la secuencia de

resultados
R1 . . . R1 R2 . . . R2 . . .Rp . . . Rp
| {z }| {z } ... | {z }
x1 veces x2 veces xp veces
x1 x2 xp
está dada por π1 π2 · · · πp . Es posible reorganizar esta secuencia de resultados por medio de per-
mutaciones en donde los elementos pertenecientes a la misma serie de resultados son indistinguibles.
De acuerdo con la técnica implementada en los ejemplos 7.7.25 y 7.7.26, existen
n!
x1 !x2 ! · · · xp !
formas de reorganizar la serie completa. En consecuencia, la probabilidad de observar los valores

(x1 , x2 , . . . , xp )T es igual a el producto de estas dos cantidades. En síntesis:
fX (x1 , x2 , . . . , xp ) = P(X1 = x1 , X2 = x2 , . . . , Xp = xp )

n!
· π1x1 π2x2 · · · πpxp

=
x1 !x2 ! · · · xp !
Y p
n
= π xi
x1 x2 · · · xp i=1 i

Nota. Cuando un vector aleatorio X tiene distribución multinomial de parámetros n, p, π1 , π2 , . . . , πp
se escribe X ∼ M N (n, π1 , π2 , . . . , πp ).
El rango de un vector con distribución multinomial aunque es nito puede llegar a tener un cardinal
n+p−1

considerable. Se puede demostrar (ejercicio 11.2) que tal rango tiene un cardinal dado por .
n
25+3−1

Como ilustración, el cardinal para el rango del vector multinomial en el ejemplo 11.2.1 es
25 =
27

25 = 351. Es decir, el vector que clasica a los artículos según su estado de calidad puede asumir
351 diferentes realizaciones.
Como ya se dijo, la distribución binomial es un caso particular de la multinomial obtenido al tomar

p = 2. El siguiente resultado conrma esta relación.
Proposición 11.3.3. X = [X1 , X2 . . . , Xp ]T es un vector aleatorio tal que X ∼ M N (n, π1 , π2 , . . . , πp )

Si
entonces cada componente Xi de X tiene distribución binomial de parámetros n y πi para i =
1, 2, . . . , p.
Ejemplo 11.3.4. Si en el ejemplo 11.2.1 se asume que las proporciones de artículos clasicados
con calidad aceptable, inferior e intolerable son 0.97, 0.02 y 0.01 respectivamente, calcular la
probabilidad para los valores observados en el ejemplo a partir de una muestra de 25 artículos.
Solución:
Los valores observados incluyen 20 artículos aceptables, 2 en con calidad inferior y 3 intolerables.
Según la información suministrada X ∼ M N (25, 0.97, 0.02, 0.01). Se examinan que tan probables son
los valores observados como sigue:
(0.9720 )(0.022 )(0.013 )

P(X1 = 20, X2 = 2, X3 = 3) = 25! = 0.0001155672.
20!2!3!
El valor 0.0001155672 indica que es muy poco probable (bajo el supuesto de que el modelo asumido
14
es correcto ) obtener una muestra como la observada. Esto puede ser un indicio de que tal vez una
o más de las probabilidades dadas (0.97, 0.02, 0.01) no son adecuadas para describir este fenómeno.
Si el problema se centra solamente en los artículos de calidad intolerable, es interesante determinar

cual es la probabilidad (bajo el supuesto de que π3 = 0.01) de observar 3 o más artículos defectuosos.
Según la proposición 11.3.3, X3 ∼ Bin(25, 0.01) y en consecuencia se tiene que:
P[X3 ≥ 3] = 1 − P[X3 ≤ 2] = 1 − 0.9980493 = 0.001950677.

Si la proporción de artículos con calidad intolerable (π3 ) fuese de 0.01, observar 3 o más artículos
defectuosos sería poco probable. Este puede ser un indicio de que la proporción real para este tipo de
artículos es mayor a la asumida.
11.3.3. Vector de componentes continuas
La distribución conjunta de probabilidad para dos v.a.c.'s X e Y puede ser especicada al proporcionar
un método que permita calcular la probabilidad de que estas dos variables asuman valores en una región
14 Esta es la base de la inferencia estadística: si bajo un modelo probabilístico asumido se obtiene información muestral
poco probable, entonces dicho modelo no es apropiado de manera parcial o total.
R del espacio bidimensional R2 . Como una extensión directa del caso unidimensional tratado en la
denición 8.3.1, la idea es introducir una función de densidad cuya integral doble sobre la región R
proporcione la probabilidad de interés.
Denición 11.3.3. Una función fXY : R −→ [0, ∞) se dice que es una función de
densidad conjunta del vector aleatorio X = [X, Y ]T conformado por las v.a.c.'s X
y Y si satisface las siguientes condiciones:
i. fXY (x, y) > 0 para cada (x, y)T ∈ R2
P[(x, y)T ∈ R] = R2
RR
ii. fXY (x, y)dxdy , para cualquier región R contenida en
R
RR R∞ R∞
iii. fXY (x, y)dxdy = fXY (x, y)dxdy = 1
R2 −∞ −∞
Nota. Aunque la integral en iii. se calcula por denición sobre todo R2 , en la práctica ésta se considera
T 2
sobre la región S := {(x, y) ∈ R : fXY (x, y) 6= 0} llamada el soporte de fXY .
La gráca de fXY (x, y) es una supercie en el espacio tridimensional R3 tal como se muestra en la
15 T
gura 11.5, donde también se puede observar queP[(x, y) ∈ R] es el volumen del sólido acotado
inferiormente por la región R, superiormente por la supercie fXY (x, y) y lateralmente por la supercie
cilíndrica obtenida al proyectar R sobre fXY (x, y).
Ejemplo 11.3.5. Sea X la v.a. que representa el tiempo en milésimas de segundo que demora un
servidor de computadora en conectar un equipo, y Y la v.a. que representa el tiempo en milésimas de
segundo que demora dicho servidor en autorizar el equipo como un usuario válido. Es evidente que
X <Y, ya que primero se necesita tener conexión antes de iniciar sesión como usuario. Se asume que
la función de densidad conjunta de (X, Y )T viene dada por
16
:
(x+2y)
(
ke− 1,000 si 0 < x < y,
fXY (x, y) =
0 en otro caso.
a. Determinar el valor de k de tal forma que fXY (x, y) sea una función de densidad válida.
b. Calcular P(X < 1, 000, Y < 2, 000).
Solución:
a. El soporte de fXY (x, y) es el región del primer cuadrante ubicada encima de la recta y = x, como
se muestra en la gura 11.6. La constante desconocida k debe ser tal que se satisfaga la propiedad
15 Imagen tomada de Soong (2004, p. 56)

16 Es posible utilizar supuestos razonables para justicar el uso de esta expresión, pero por el momento no se hará
énfasis en ello.
Figura 11.5: Ejemplo de una función de densidad conjunta de un vector aleatorio bidimensional.
iii. de la denición 11.3.3, esto es:
Z∞ Z∞ Z∞ Z∞ Z∞ Z∞
(x+2y) (x+2y)
−
fXY (x, y)dxdy = ke 1,000 dydx = k e− 1,000 dy dx
−∞ −∞ 0 x 0 x
Z∞ Z∞ Z∞
y x x x
− 1,000
=k e − 500
dy e dx = k 500 e− 500 e− 1,000 dx
0 x 0
Z∞
3x
− 1,000 1, 000 500, 000
= 500k e dx = 500k =k
3 3
0
= 1.
3
En consecuencia k= 500,000 . La gráca de fXY (x, y) se muestra en la gura 11.7.
b. La región de interés puede expresarse como R := {(x, y)| 0 < x < y, 0 < x < 1000, 0 < y < 2000}
y aparece descrita en la gura ??. La probabilidad pedida está dada por:
1,000
Z 2,000
Z
P(X < 1, 000, Y < 2, 000) = fXY (x, y)dxdy
0 x
1,000
Z 2,000
Z
3 (x+2y)
= e− 1,000 dydx
500, 000
0 x
1,000
Z 2,000
Z
3 y
x
= e− 500 dy e− 1,000 dx
500, 000
0 x
1,000
Z
3 x x
e− 500 − e−4 e− 1,000 dx

= 500
500, 000
0
1,000
Z
3 3x x

= e− 1,000 − e−4 e− 1,000 dx
1, 000
0

3 1, 000
1 − e−3 − 1, 000e−4 1 − e−1

=
1, 000 3
= 1 − e−3 − 3e−4 + 3e−5
Por lo tanto, se sigue que P(X < 1, 000, Y < 2, 000) = 0.9155.
1e+10
3000
2000
R
5e+09
soporte de f(XfXY
Y ((x,
x, yy)))
y
1000
0e+00
0e+00 5e+09 1e+10 0 1000 2000 3000
x x
Figura 11.6: Soporte de la función de densidad conjunta y región de integración de la probabilidad pedida del del
ejemplo 11.3.5.
A continuación se extiende el concepto de función de distribución acumulada conjunta para vectores

aleatorios de componentes continuas.
4e−06
3e−06
f(x,y)
2e−06 2000
1e−06
1500
0e+00
0
1000
y
500
1000 500
x
1500
2000 0
Figura 11.7: Función de densidad conjunta de las variables asociadas a los tiempos de respuesta en un servidor de
computadoras.
Denición 11.3.4. La función de distribución acumulada con-

junta del vector aleatorio X = [X, Y ]T conformado por las v.a.c.'s X
2
y Y con función de densidad conjunta fXY , es la función FXY : R −→
[0, 1] denida por:
Z x Z y
FXY (x, y) = P(X ≤ x, Y ≤ y) = fXY (u, v)dudv
−∞ −∞
En el escenario continuo FXY (x, y) cumple las mismas propiedades señaladas en la proposición 11.3.1
y además, en los puntos donde fXY es continua, se cumple que:
∂ 2 FXY (x, y) ∂ 2 FXY (x, y)
fXY (x, y) = = .
∂x∂y ∂y∂x
Esta propiedad permite reconstruir la función de densidad a partir de la función de distribución, de

la misma forma que el apartado iv. de la proposición 8.3.1.
Ejemplo 11.3.6. Obtener la función de distribución acumulada conjunta FXY (x, y) de las variables
X y Y del ejemplo 11.3.5 y comprobar a partir de ésta que se puede obtener la función de densidad
conjunta fXY (x, y).
Solución:
En este caso se tiene que:
FXY (x, y) = P (X ≤ x, Y ≤ y)
Z xZ y
3 (u+2v)
= e− 1,000 dvdu
0 u 500, 000
Z x Z y
3 v u
= e− 500 dv e− 1,000 du
500, 000 0 u
Z x
3 3u
− 1,000 y u

= e − e− 500 e− 1,000 du
1, 000 0
3u x
y u

= 3e− 500 e− 1,000 − e− 1,000
0
y x 3x x
− 500 − 1,000 − 1,000
= 3e e −e − 3e− 500 + 1
x
y

= e− 1,000 − 1 3e− 500 − 1 .
Y en consecuencia:
x y
e− 1000 − 1 3e− 500 − 1 ,

si 0 < x < y;
FXY (x, y) =
0, en otro caso.
La gráca de FXY (x, y) se muestra en la gura 11.8.
Ahora se observa que:
∂ 2 FXY (x, y)

∂ ∂ − 1,000x
y
= e − 1 3e− 500 − 1
∂x∂y ∂x ∂y

∂ 3 − y − 1,000 x
= − e 500 e −1
∂x 500
3 − y ∂ − 1,000 x

=− e 500 e −1
500 ∂x

3 − y 1 x
= − e 500 − e− 1,000
500 1, 000
3 (x+2y)
= e− 1,000
500, 000
= fXY (x, y)

0.8
0.6
F(x,y)
0.4
0.2
0.0
10000
8000
6000 10000
8000
y
4000
6000
2000 4000 x
2000
0 0
Figura 11.8: Función de distribución acumulada conjunta para las variables asociadas a los tiempos de respuesta en
un servidor de computadoras.
11.3.4. Distribución normal bivariada
En el ejemplo 11.2.2 se describe de manera simple un vector normal multivariado. En esta sección se
hace énfasis particular en el escenario p = 2, conocido como vector normal bivariado.
Denición 11.3.5. La función de densidad conjunta de un vector aleatorio nor-

mal bivariado de componentes X y Y está dada por:
( 2 2 )
x−µX x−µX y−µY y−µY
σX −2ρXY σX σY + σY
exp 2(ρ2XY −1)
fXY (x, y; µX , µY , σX , σY , ρXY ) = p
2πσX σY 1 − ρ2XY
Nota. Los parámetros µX , µY y σX , σY son respectivamente los valores esperados y las desviaciones
típicas de las variables X e Y . El parámetro ρXY es tal que
R∞ R∞
(x − µX )(y − µY )fXY (x, y)dxdy
−∞ −∞
ρXY =
σX σY
y se conoce como coeciente de correlación de Pearson poblacional (detalles en las secciones

6.5.2 y 11.5.1).
Nota. Cuando un vector aleatorio X tiene distribución normal bivariada de parámetros µX , µY , σX ,

σY , ρXY se escribe X ∼ N B(µX , µY , σX , σY , ρXY ).
La gura 11.9 muestra la gráca de la supercie asociada a la función de densidad conjunta de la

distribución normal bivariada con µX = µY = ρXY = 0 y σ X = σ Y = 1. Se observa que se mantiene
la forma acampanada similar al caso unidimensional. En esta gura también se muestra la gráca
de la supercie asociada a la función de distribución acumulada conjunta con los mismos parámetros
anteriores.
0.15
f(x,y)
0.10
3
0.05 3 0.8 2
2 1
1 0.6 0
y
−3
F(x,y
−2 0 −1
0.4
y
−1
)
−1 −2
0 0.2
x 1 −2
−3
2 −3 −2 −1 0 1 2 3
3 −3 x
Figura 11.9: Función de densidad conjunta y función de distribución acumulada conjunta de la distribución normal
bivariada de parámetros µX = µY = ρXY = 0 y σX = σY = 1.
Para la distribución normal bivariada al igual que en el escenario univariado la función de distri-
bución acumulada FXY (x, y) está expresada mediante una integral que no tiene forma cerrada y por
tanto sus valores deben ser aproximados mediante métodos numéricos ya implementados en algunos
paquetes computacionales.
Ejemplo 11.3.7. Se supone que X y Y representan las ganancias trimestrales en millones de dólares
de dos divisiones pertenecientes a una misma corporación nanciera. Los analistas de la corporación
han modelado el comportamiento conjunto de estas variables por medio de la distribución normal
bivariada [X, Y ]T ∼ N B(µX = 3, µY = 7.7, σX = 0.04, σY = 0.08, ρXY = 0.8). Se espera que para el
próximo trimestre las ganancias de la división X se muevan entre los 2.95 millones y los 3.05 millones;
mientras que para la división Y estén entre los 7.6 millones y los 7.8 millones. Calcular la probabilidad
de que las ganancias del próximo trimestre se encuentren dentro de los rangos esperados.
Solución:
Se pide calcular P(2.95 ≤ X ≤ 3.05, 7.6 ≤ Y ≤ 7.8). Como se señaló anteriormente, no existen
tablas ni fórmulas explícitas que permitan obtener los valores de la función conjunta de distribución
acumulada y en este caso se hace uso de la función pmvnorm incluida en la librería mvtnorm (Genz
et al. 2012, Genz & Bretz 2009) del paquete computacional R (R Core Team 2012), obteniendo el
siguiente resultado:
P(2.95 ≤ X ≤ 3.05, 7.6 ≤ Y ≤ 7.8) = 0.6974968.
Por lo tanto, existe casi un 70 % de probabilidad de que las ganancias del próximo trimestre estén
dentro de los rangos esperados.
11.4. Distribuciones marginales, condicionales y variables alea-

torias independientes
En esta sección se extienden por medio de las v.a.'s multivariadas algunos conceptos de los capítulos 6
y 7, como las frecuencias relativas marginales (sección 6.2), los perles o distribuciones condicionadas
(sección 6.3) y la independencia de eventos (sección 7.12).
11.4.1. Distribuciones de probabilidad marginales
Si más de una variable es denida dentro de un mismo experimento aleatorio, es importante distinguir
entre la distribución conjunta del vector aleatorio y la distribución de probabilidad de cada componente
denominada distribución de probabilidad marginal.
Denición 11.4.1. Si X y Y son v.a.'s con función másica o de densidad de proba-

bilidad conjunta fXY , entonces la función de probabilidad marginal de X y de
Y están determinadas:
i. en el escenario discreto por:

X X
fX (x) = fXY (x, y) y fY (y) = fXY (x, y).
C(x) C(y)
ii. y en el escenario continuo por:

Z Z
fX (x) = fXY (x, y)dy y fY (y) = fXY (x, y)dx.
C(x) C(y)
donde C(x) denota el conjunto de todos los puntos (x, y) para los cuales X = x y
C(y) denota el conjunto de todos los puntos (x, y) para los cuales Y = y.
11.4. OTRAS DISTRIBUCIONES RELACIONADAS 339
Las expresiones anteriores proporcionan un método para recuperar la distribución de cada compo-
nente del vector aleatorio a partir de la distribución conjunta; lo contrario (construir la distribución
conjunta a partir de las marginales) es más difícil, salvo en algunos casos particulares.
Ejemplo 11.4.1. Continuando con el ejemplo 11.3.1, donde se denen las variables X e Y para
representar los resultados obtenidos al lanzar cada uno de dos dados balanceados y distinguibles.
Obtener la función de probabilidad marginal de X y de Y.
Solución:
Como se establece en el ejemplo 11.3.1, la distribución conjunta de X y Y es uniforme con valor

1
constante
36 . En este caso se tiene que C(x) = C(y) = {0, 1, 2, · · · , 6} y por lo tanto:
6
X X 1 1
fX (x) = fXY (x, y) = =
y=1
36 6
C(y)
para todo x ∈ {0, 1, 2, · · · , 6}. Puesto que ambos dados tienen la misma composición, la función de
probabilidad marginal para la variable Y es idéntica a la de X. El resultado no sorprende, ya que si
cada uno de los dados está balanceado, la distribución marginal de la variable que cuenta el número
1
de puntos en su cara superior debe ser uniforme con valor
6 . En esta situación no es estrictamente
necesario conocer fXY (x, y) para obtener las distribuciones marginales.
Ejemplo 11.4.2. Para las variables X y Y que representan los tiempos de conexión y autorización
de un servidor de computadoras descritos en el ejemplo 11.3.5, obtener las funciones de densidad
marginal de X y de Y.
Solución:
En este escenario se tiene que C(x) = [x, ∞) y C(y) = (0, y), lo cual es fácilmente vericable si se
trazan líneas paralelas a los ejes coordenados en la gura 11.6, de forma que para un x jo, y sólo
puede tomar valores superiores a x, y para un y jo, x sólo puede tomar valores menores que y.
Para la variable X se tiene que:

Z
fX (x) = fXY (x, y)dy
C(x)
Z∞
3 x+2y
= e− 1,000 dy
500, 000
x
Z∞
3 x
− 1,000 y
= e e− 500 dy
500, 000
x
∞
3 x
y
= e− 1,000 (−500) e− 500

500, 000 x
3 x x
= e− 1,000 e− 500 .
1, 000
Por lo tanto:
( 3x
3 − 1,000
fX (x) = 1,000 e , si x > 0;
0, en otro caso.
Para la variable Y se tiene que:
Z
fY (y) = fXY (x, y)dy
C(y)
Zy
3 x+2y
= e− 1,000 dy
500, 000
0
Zy
3 y x
= e − 500
e− 1,000 dx
500, 000
0
y
3 y
x
= e− 500 (−1, 000) e− 1,000

500, 000 0
3 − y y

= e 500 1 − e− 1,000 .
500
Por lo tanto:
( y
y

3 − 500
500 e 1 − e− 1,000 , si y > 0;
fY (y) =
0, en otro caso.
En este ejemplo es difícil obtener la distribución conjunta fXY (x, y) a partir de las distribuciones
marginales sin contar con información adicional.
Como se establece en la proposición 11.3.3, las distribuciones marginales de cada componente en un

vector aleatorio multinomial resultan ser binomiales. Este resultado es mucho mas difícil de probar a
través de la denición 11.4.1. En el caso de un vector aleatorio normal multivariado, como se establece
17
en el ejemplo 11.2.2, las componentes tienen distribuciones marginales de tipo normal univariado .
11.4.2. Distribuciones de probabilidad condicionales
Similar al concepto de probabilidad condicional que se presentan en la denición 7.8.1, se establece el

de distribución condicional de una variable aleatoria. Este tipo de distribución se usa para calcular la
probabilidad de eventos asociados a una variable en presencia de información relacionada con otra(s)
variable(s) aleatoria(s).
17 En la sección 11.5 se presenta una proposición que ilustra este resultado.

Denición 11.4.2. Si X y Y son v.a.'s con función másica o de densidad de pro-

babilidad conjunta fXY , entonces la función de probabilidad condicional de X
dado que Y = y , denotada con fX|Y (x|y), está determinada por:
fXY (x, y)
fX|Y (x|y) =
fY (y)
siempre que fY (y) > 0.
Nota. La función de probabilidad condicional de Y dado que X = x, denotada como fY |X (y|x), se

obtiene de manera similar.
Ejemplo 11.4.3. Continuando con el ejemplo 11.3.1, donde se denen las variables X y Y para
representar los resultados obtenidos al lanzar cada uno de dos dados balanceados y distinguibles.
Obtener las funciones de probabilidad fX|Y (x|y) y fY |X (y|x).
Solución:
Como se establece en el ejemplo 11.3.1, la distribución conjunta de X y Y es uniforme con valor

1 1
constante
36 , al igual que las marginales con valor uniforme 6 . Así, para y ∈ {0, 1, 2, · · · , 6} se sigue
que:
1
(
36
1 = 16 , si x ∈ {0, 1, 2, · · · , 6};
fX|Y (x|y) = 6
0, en otro caso.
Puesto que ambos dados tienen la misma composición, fY |X (y|x) tiene una estructura idéntica a
fX|Y (x|y). También es interesante observar que fX|Y (x|y) = fX (x) (un resultado análogo se tiene
para fY |X (y|x)) y aunque en general esto no siempre se cumple, en la sección 11.4.3 se proporcionan
argumentos para entender cuando se da esta igualdad.
Ejemplo 11.4.4. Para las variables X y Y que representan los tiempos de conexión y autorización
de un servidor de computadoras descritos en el ejemplo 11.3.5, obtener las funciones de densidad
condicional fX|Y (x|y) y fY |X (y|x).
Solución:
En el ejemplo 11.4.2 se obtuvieron las distribuciones marginales de X e Y. En consecuencia, dada

y>0 se tiene que:
y x
3 − 500
e− 1,000
x
fXY (x, y) 500,000 e e− 1,000
fX|Y (x|y) = = y
= y

fY (y) y
3 − 500
1 − e− 1,000 1, 000 1 − e− 1,000
500 e
siempre que x < y.

De otro lado, dada x>0 se tiene que:

y x
fXY (x, y)
3
500,000 e
− 500
e− 1,000 y
e− 500
fY |X (y|x) = = 3 x
− 1,000
=
fX (x) 1,000 e
500
siempre que x < y.
En este caso las distribuciones condicionales no coinciden con las marginales.
11.4.3. Variables aleatorias independientes
Continuando con la extensión natural de las ideas que se desarrollan en el capítulo 7, ahora se trata
el concepto de independencia aplicado a un conjunto de v.a.'s.
Denición 11.4.3. Dos v.a.'s X y Y se llaman independientes independientes si:
fX|Y (x|y) = fX (x) o fY |X (y|x) = fY (y).
Nota. Las igualdades de la denición 11.4.3 no se deben comprobar de manera simultánea ya que el
cumplimiento de una implica el cumplimiento de la otra.
La siguiente proposición suministra un resultado equivalente al de la denición 11.4.3, pero con mayor
valor desde el punto de vista práctico.
Proposición 11.4.1. Dos v.a.'s X y Y son independientes si y solo si
fXY (x, y) = fX (x)fY (y).
Demostración:
La demostración se debe hacer en dos direcciones.
Primero, se supone que las variables X y Y son independientes, entonces por la denición 11.4.2 se
tiene que fXY (x, y) = fY (y)fX|Y (x|y). Como X y Y son independientes, por la denición 11.4.3 se
cumple que fX|Y (x|y) = fX (x) y sustituyendo en la anterior igualdad se obtiene que:
fXY (x, y) = fY (y)fX (x).
Ahora, se supone que fXY (x, y) = fX (x)fY (y). Aplicando la denición 11.4.2 se tiene que:
fXY (x, y) fX (x)fY (y)

fX|Y (x) = = = fX (x)
fY (y) fY (y)
siempre que fY (y) > 0. Por lo tanto, en virtud de la denición 11.4.3, se obtiene que X e Y son v.a.'s
independientes.
Nota. La proposición 11.4.1 establece que dos v.a.'s son independientes si y solo si su función másica
o de densidad de probabilidad conjunta se puede expresar como el producto de las distribuciones
marginales correspondientes.
El resultado anterior se generaliza en seguida a un conjunto nito de más de dos v.a.'s mediante la
siguiente denición:
Denición 11.4.4. Sean X1 , X2 , . . . , Xn para n≥2 un conjunto nito de v.a.'s. Se

dice que las variables son independientes si y solo si para cualquier conjunto de índices
I ⊆ {1, 2, . . . , n} se cumple que:
Y
fX I (xI ) = fXi (xi )
i∈I
donde XI es el vector aleatorio conformado por las variables Xi tales que i ∈ I.
Nota. La denición 11.4.4 se puede sintetizar al armar que un grupo nito de n v.a.'s son inde-
pendientes si y solo si la distribución conjunta de probabilidad para cualquier subconjunto de estas
variables se puede expresar como el producto de las respectivas distribuciones marginales.
Ejemplo 11.4.5. Como se hace notar en el ejemplo 11.4.3, las distribuciones condicionales de las
variables X y Y que representan los resultados obtenidos al lanzar cada uno de dos dados balanceados
y distinguibles, coinciden con las respectivas distribuciones marginales de X e Y. Es decir, dado
y ∈ {1, 2, 3, 4, 5, 6} se tiene que:
fX|Y (x|y) = fX (x)
lo que implica la independencia de X y Y. Esta relación de independencia no sorprende y se puede
explicar empíricamente debido a que el resultado de uno de los dados no afecta al del otro.
Ejemplo 11.4.6. En el ejemplo 11.4.2 se obtienen las distribuciones marginales de las variables X y Y
que representan los tiempos de conexión y autorización para un servidor de computadoras. Determinar
si las variables son independientes o no.
Solución:
Multiplicando las expresiones de las distribuciones marginales se obtiene que:
3 3x 3 − y y
9e− 3x+2y
1,000 y

fX (x)fY (y) = e− 1,000 e 500 1 − e− 1,000 = 1 − e− 1,000
1, 000 500 500, 000
que es una expresión que no coincide con la función de densidad conjunta de X y Y . Con lo anterior se
muestra que fXY (x, y) 6= fX (x)fY (y) y en virtud de la proposición 11.4.1 se concluye que las variables
X y Y no son independientes.
En los dos ejemplos anteriores se pide probar independencia. En el siguiente ejemplo la independencia
se garantiza inicialmente y se utiliza para calcular una probabilidad conjunta:
Ejemplo 11.4.7. Una inversionista y un corredor de bolsa suscriben el siguiente acuerdo: el día de
mañana entre las 10:00 a.m. y las 11:00 a.m. el corredor hará disponible la opción de compra para
un grupo de acciones bastante apetecidas, y en este mismo intervalo de tiempo el inversionista aspira
haber vendido unos bonos y con el dinero de la venta adquirir acciones. Si el inversionista vende los
bonos antes de que el corredor haga pública la opción de compra, este sólo esperará máximo diez
minutos o de lo contrario queda libre de comprarle a otro corredor; si el corredor publica la opción de
venta antes de que el inversionista cuente con le dinero de los bonos, este sólo esperará máximo diez
minutos o de lo contrario queda libre de negociar las acciones con otro inversionista. Si los instantes
en los que cada uno vende los bonos y es autorizado para hacer pública la venta de las acciones son
independientes e uniformemente distribuidos, calcular la probabilidad de que el inversionista le compre
al corredor.
Solución:
Si X representa el tiempo (en minutos) después de las 10:00 a.m. en el que el inversionista cuenta con
el dinero de sus bonos y Y tiene el mismo signicado para el tiempo (en minutos) en que el corredor
hace pública la oferta de venta, entonces las distribuciones marginales de X e Y son respectivamente:

1/60, si 0 ≤ x ≤ 60; 1/60, si 0 ≤ y ≤ 60;
fX (x) = y fY (y) =
Debido a la condición de independencia de estas variables, su distribución conjunta de probabilidad

está dada por:

1/3600, para 0 ≤ x ≤ 60 y 0 ≤ y ≤ 60;
fXY (x, y) = fX (x)fY (y) =
0, en otro caso.
La condición de compra se traduce matemáticamente mediante el evento
R = {ω ∈ Ω : |X(ω) − Y (ω)| ≤ 10}.

18
La región del plano xy que representa este evento se muestra en la gura 11.10.
Como la función de densidad conjunta es constante, la probabilidad pedida se puede expresar como
el producto del área sombreada y dicho valor constante (1/3600). Como se muestra en la gura, el
área de esta región se puede expresa como la suma de los dos triángulos en los extremos y el área del
rectángulo central, es decir:
10 · 10 √ √
Área(R) =2 + 10 2 · 50 2 = 100 + 1, 000 = 1, 100.
2
En consecuencia, se obtiene que
1 1 11
P(|X − Y | ≤ 10) = Área(R) = 1, 100 =
3600 3, 600 36
es la probabilidad de que el inversionista le compre al corredor.
18 Imagen tomada de Soong (2004, p. 59).
11.5. COMBINACIONES LINEALES DE VARIABLES ALEATORIAS 345
Figura 11.10: Región de integración asociada con el evento |X − Y | ≤ 10 del ejemplo 11.4.7.
11.5. Combinaciones lineales de variables aleatorias

Pp
En el ejemplo 11.2.2 se dene la v.a. Y = j=1 cj Xj como función de X1 , X2 , . . . , Xp . Este es un
ejemplo de una combinación lineal de las variables X1 , X2 , . . . , Xp . A continuación se dene de manera
formal este concepto.
Denición 11.5.1. Sean X1 , X2 , . . . , Xp v.a.'s y c1 , c2 , . . . , cp números reales no todos

nulos. La v.a. Y dada por
p
X
Y = cj Xj = c1 X1 + c2 X2 + · · · + cp Xp
j=1
se denomina combinación lineal de las variables X1 , X2 , . . . , Xp
Las combinaciones lineales de v.a.'s son de mucho interés en situaciones prácticas y teóricas dentro de
la estadística. Los siguientes ejemplos lo ilustran.
Ejemplo 11.5.1. Una empresa fabrica cinta adhesiva de 4 calibres diferentes y vende las unidades
(rollos) a $3, $5, $8 y $12. Sean X1 , X2 , X3 y X4 las v.a.'s que representan el número de unidades
vendidas en un día para cada calibre de cinta. Obtener una expresión general para el ingreso total por
las ventas.
Solución:
El ingreso total es la suma de los ingresos parciales por cada calibre de cinta. El ingreso parcial se
obtiene al multiplicar el número de unidades vendidas por el precio de venta. El ingreso total por
ventas I se puede expresar como:
4
X
I = 3X1 + 5X2 + 8X3 + 12X4 = cj Xj
j=1
donde c1 = 3, c2 = 5, c3 = 8 y c4 = 12. En esta situación el ingreso total es una combinación lineal

del número de unidades vendidas para cada calibre de cinta..
El siguiente ejemplo se reere a dos medidas descriptivas tratadas en los capítulos 3 y 4.
Ejemplo 11.5.2. Sean X1 , X2 , . . . , Xn las variables que conforman una muestra aleatoria19 de tamaño
n. Se ha visto que la media muestral es otra v.a. dada por:
n
1X 1 1 1
X= Xi = X1 + X2 + . . . + Xn .
n i=1 n n n
Así, la media muestral resulta ser una combinación lineal de las variables X1 , X2 , . . . , Xn donde c1 =
1
c2 = · · · = cn = n.
De otra parte, haciendo Zi = (Xi − X)2 , la varianza muestral se puede expresar mediante:
n n
2 1 X 2 1 X 1 1 1
SX := Xi − X = Zi = Z1 + Z2 + . . . + Zn .
n − 1 i=1 n − 1 i=1 n−1 n−1 n−1
Por lo tanto, la varianza muestral resulta ser una combinación lineal de las variables Z1 , Z2 , . . . , Zn
1
donde c1 = c2 = · · · = cn = n−1 .
11.5.1. Matriz de covarianzas y matriz de correlaciones
En esta sección se generalizan para v.a.'s las ideas sobre medidas de asociación que se tratan en el
capítulo 6. A continuación, se denen la covarianza y correlación entre una pareja de v.a.'s.
19 En el ámbito de la inferencia estadística, una muestra aleatoria se reere a una familia de v.a.'s independientes
e idénticamente distribuidas.
Denición 11.5.2. SeanX y Y v.a.'s con función másica o de densidad de proba-

bilidad conjunta fXY y seag : R2 −→ R una función bivariada de valor real. El valor
esperado de g(X, Y ), denotado con E [g(X, Y )], está dado:
i. en el escenario discreto por:

XX
E [g(X, Y )] = g(x, y)fXY (x, y)
S
ii. y en el escenario continuo por:

Z Z
E [g(X, Y )] = g(x, y)fXY (x, y)dxdy
S
donde S es el soporte de fXY (x, y).
En la denición 11.5.2, cuando g(x, y) = (x − µX )(y − µY ), el valor esperado de g(x, y) recibe el

nombre de covarianza poblacional entre X y Y:
Denición 11.5.3. La covarianza entre las v.a.'s X y Y , denotada con Cov[X, Y ],

está dada por:
Cov[X, Y ] = E [(X − µX )(Y − µY )]
donde µX y µY son respectivamente el valor esperado de X y Y.
Nota. La covarianza entre las v.a.'s X y Y también se simboliza con σXY .
La siguiente proposición suministra una expresión alterna para el cálculo de la covarianza ente X y
Y.
Proposición 11.5.1. La covarianza entre las v.a's X y Y se puede expresar mediante:
Cov(X, Y ) = E[XY ] − µX µY .
Ejemplo 11.5.3. Calcular la covarianza de las variables X y Y que representan los tiempos de
conexión y autorización para un servidor de computadoras del ejemplo 11.3.5.
Solución:
Primero se deben calcular los valores esperados de X y Y. Para ello se utilizan las distribuciones
marginales obtenidas en el ejemplo 11.4.2, de forma que:
Z ∞ Z ∞
3 3x
E[X] = xfX (x)dx = x e− 1,000 dx ≈ 333.3
−∞ 0 1, 000
Z ∞ Z ∞
3 − y y

E[Y ] = yfY (y)dy = y e 500 1 − e− 1,000 dy ≈ 833.3.
−∞ 0 500
Ahora, se debe calcular E[XY ] como sigue:
Z Z
E[XY ] = xyfXY (x, y)dxdy
S
Z∞ Z∞ (x+2y)
= 6 × 10 −6
xy e− 1,000 dy dx
0 x
Z∞ Z∞
 
y x
= 6 × 10−6  ye− 500 dy  xe− 1000 dx
0 x
Z∞
x x
= 6 × 10−6 500e− 500 (x + 500)xe− 1,000 dx
0
Z∞
3x
= 0.003 xe− 1,000 (x + 500)dx = 388, 889.
0
Finalmente, se obtiene que:Cov[X, Y ] = 388, 889 − (333.3)(833.3) = 111, 150.1.
Como se indica en la sección 6.5.1, el signo de la covarianza mide la dirección de la relación lineal entre
el par de variables. En este caso Cov[X, Y ] > 0, lo que indica una relación directa entre las variables,
las cuales crecen o decrecen de manera simultánea. Por lo tanto, el tiempo hasta recibir la autorización
(Y ) siempre es mayor que el tiempo de conexión (X ) ya que el computador debe esperar a que haya
conexión con el servidor para posteriormente solicitar la autorización como usuario registrado. Y Si
los equipos tienden a conectarse más rápido (X decrece) se esperaría una tendencia a que reciba la
autorización más rápido (Y decrece) y viceversa.
Como se especica en la sección 6.5.2, para establecer que tan fuerte es la relación lineal entre las
variables se usa el coeciente de correlación de Pearson dado por
σXY
ρXY = ,
σX σY
el cual siempre está acotado en el intervalo [−1, 1].

Ejemplo 11.5.4. Calcular el coeciente de correlación de Pearson para las variables X y Y que
representan los tiempos de conexión y autorización para un servidor de computadoras del ejemplo
11.3.5.
Solución:
Primero se deben calcular las varianzas de X y Y. Para ello se utilizan las distribuciones marginales
obtenidas en el ejemplo 11.4.2, de forma que:
Z ∞ Z∞
3 3x
2
σX = 2
x fX (x)dx − µ2X = x2 e− 1,000 dx − (333.3)2 = 11, 1133.1
−∞ 1, 000
0
Z ∞ Z∞
3 − y y

σY2 = 2
y fY (y)dy − µ2Y = y2 e 500 1 − e− 1,000 dy − (833.3)2 = 361, 167.1.
−∞ 500
0
Tomando el valor de σXY calculado en el ejemplo 11.5.3, se obtiene que:
σXY 111, 150.1

ρXY = =√ √ = 0.5547969
σX σY 111, 133.1 361, 167.1
Este valor de ρXY indica la existencia de una relación lineal aceptable entre los tiempos de interés.
La siguiente proposición establece una relación entre la condición de independencia y el coeciente de

correlación de Pearson.
Proposición 11.5.2. Si X y Y son v.a.'s independientes entonces ρXY = σXY = 0.
Nota. El resultado de la proposición 11.5.2 no debe confundirse: la independencia implica la nulidad

de la covarianza (y por tanto del coeciente de correlación); lo contrario no siempre es cierto, es decir,
si ρXY = σXY = 0 entonces no necesariamente signica que X y Y sean v.a's independientes. En
resumen, el resultado 11.5.2 sólo sirve para probar que las variables no son independientes (lo cual se
da cuando ρXY 6= 0). Más adelante se muestra que la distribución normal multivariada satisface este
resultado en ambas direcciones.
Ejemplo 11.5.5. En el ejemplo 11.4.5 se muestra que las variables X y Y, las cuales representan los
resultados obtenidos al lanzar cada uno de dos dados balanceados y distinguibles, son independientes.
Se demuestra de manera sencilla (ejercicio 11.8) que ρXY = 0.
Ejemplo 11.5.6. En el ejemplo 11.5.4 se obtiene que el valor de ρXY es diferente de cero; esto implica
que X y Y no son v.a.'s independientes.
11.5.2. Valor esperado varianza para una combinación lineal de variables

aleatorias
En esta sección se muestran algunos resultados concernientes a las combinaciones lineales de v.a.'s
que después se utilizan en situaciones prácticas. A continuación se presenta sin demostración una
proposición relacionada con los parámetros de una combinación lineal de v.a.'s:
Proposición 11.5.3.
Pp
Sea j=1 cj Xj una combinación lineal de las v.a.'s X1 , X2 , . . . , Xp con
Y =
2
valores esperados, varianzas y covarianzas nitas µi , σi y σij respectivamente para i = 1, 2, . . . , p.
Entonces:
i. ii.
p
X p
X p−1 X
X p
E[Y ] = cj µj . Var[Y ] = c2j σj2 +2 ci cj σij .
j=1 j=1 j=1 i=j+1
Nota. En la proposición 11.5.3, la identidad i. se cumple sin importar si las variables sean indepen-
dientes o no y se interpreta armando que el valor esperado de una combinación lineal de variables
aleatorias es la combinación lineal de los valores esperados individuales. Además, si las v.a.'s son
independientes entonces se tiene que:
p
X
Var[Y ] = c2j σj2 = c21 σ12 + c22 σ22 + . . . + c2p σp2 .
j=1
¾Por qué?
Ejemplo 11.5.7. Suponiendo que en el ejemplo 11.5.2 las n v.a.'s son independientes e igualmente
distribuidas
20
, es decir, ρXi Xj = 0 para todo i 6= j , y además E[Xi ] = µ y Var[Xi ] = σ 2 para
i = 1, . . . , n. Calcular el valor esperado y la varianza de la media muestral X .
Solución:
En el ejemplo 11.5.2 se concluye que X es una combinación lineal de X1 , X2 , . . . , Xn donde c1 = c2 =

1
· · · = cn = n . Aplicando las identidades de la proposición 11.5.3, se obtiene que:
n
X 1 1 1 1 1
E X = µj = µ + µ + · · · + µ = n µ =µ
j=1
n n n n n
n 2
σ2

X 1 1 1 1 1 2
Var X = σj2 = 2 σ 2 + 2 σ 2 + · · · + 2 σ 2 = n 2
σ = .
j=1
n n n n n n
20 Igualmente distribuidas signica que comparten el mismo modelo probabilístico y por lo tanto poseen la misma
media y varianza por lo que no se necesitan los subíndices para identicarlas.
El hecho interesante de estos resultados consiste en que al tomar mediciones independientes de una
misma variable aleatoria, resulta mas ventajoso trabajar con la media aritmética de las mediciones
ya que esta comparte el mismo valor esperado y además presenta menos variabilidad ya que Var[X]
decrece cuando se aumenta el tamaño muestral n.
Ejemplo 11.5.8. Se supone que en el ejemplo 11.5.1 se tiene que µ1 = 8, 000, µ2 = 10, 500, µ3 =
9, 100, µ4 = 12, 250, σ12 = 1, 600, σ22 = 1, 200, σ32 = 900 y σ42 = 2, 050. Además, si las demandas para
cada calibre de cinta se consideran independientes, calcular el valor esperado y la desviación estándar
del ingreso total por ventas.
Solución:
p P4
Se pide calcular E[I] y Var[I] donde I = i=1 ci Xi . Siguiendo las identidades de la proposición
11.5.3 se sigue que:
4
X
µI = cj µj = 3(8, 000) + 5(10, 500) + 8(9, 100) + 12(12, 250) = 296, 300
j=1
v
u 4
uX p
σI = t c2j σj2 = (3)2 (1, 600) + (5)2 (1, 200) + (8)2 (900) + (12)2 (2, 050) = 41, 572.9.
j=1
El siguiente ejemplo ilustra como se obtiene una distribución de probabilidad de una combinación
lineal de variables normales:
Ejemplo 11.5.9. Considere las variables X y Y que representan las ganancias trimestrales de dos
divisiones pertenecientes a una misma corporación de tecnología como en el ejemplo 11.3.7. Sea G :=
X + Y la ganancia total trimestral de la corporación. Obtener la función de densidad de probabilidad
de G y calcular la probabilidad de de que las ganancias trimestrales totales de la corporación estén
por encima de los 11 millones de dólares.
Solución:
Se nota que G es una combinación lineal de las ganancias de cada división donde c1 = c2 = 1. En
consecuencia:
E[G] = E[X] + E[Y ] = 3 + 7.7 = 10.7
Var[G] = Var[X] + Var[Y ] + 2Cov[X, Y ] = (0.04)2 + (0.08)2 + 2(0.8)(0.04)(0.08) = 0.01312.

Por denición, toda combinación lineal de componentes normales multivariadas tiene una distribución
G ∼ N (10.7, 0.01312). Ahora se calcula P(G > 11) como sigue:
normal univariada, y por lo tanto

11 − 10.7
P(G > 11) = 1 − P(G ≤ 11) = 1 − Φ √ = 1 − Φ(2.62) = 1 − 0.9956 = 0.0044.
0.01312

11.6. Comentarios
En este capítulo se exponen de manera resumida algunos conceptos relacionados con las distribu-
ciones de probabilidad multivariadas, con especial atención en el caso bivariado. El lector que por
sus necesidades académicas o profesionales requiera profundizar en la metodología multivariada, debe
tener claro que los conceptos expuestos no son sino la antesala para poder abordar una literatura más
especializada.
Se debe tener presente que a diferencia de capítulos anteriores, donde la mayoría de situaciones invo-
lucran operaciones aritméticas sencillas, las cuales se pueden ejecutar con una calculadora cientíca
común y en algunas ocasiones utilizando tablas, la aritmética detrás de los métodos multivariados es
en muchas ocasiones demasiado compleja para ejecutarse manualmente. Un caso de esta complejidad
computacional se presenta en el ejemplo 11.3.7, donde la probabilidad pedida se calcula con la ayuda
de un paquete estadístico especializado.
11.7. Ejercicios
11.1 En una empresa hay nueve ejecutivos, de los cuales tres son solteros y dos son divorciados. Tres
de ellos serán seleccionados al azar para un ascenso. Sea X1 la variable que representa el número
de ejecutivos casados de los funcionarios seleccionados y X2 la variable asociada con el número
de ejecutivos solteros de los funcionarios seleccionados.
a. ¾Se puede utilizar la distribución multinomial como modelo probabilístico para estudiar este
caso? ¾Por qué?.
b. Encontrar la función másica de probabilidad conjunta de X1 y X2 .

c. Utilizar la distribución hallada en el numeral b. para calcular P(X1 = 2, X2 = 1).
11.2 Demostrar que si X es un vector aleatorio tal que X ∼ M N (n, π1 , π2 , . . . , πp ) entonces el cardinal
n+p−1

del rango de X viene dado por
n .
11.3 Demostrar que si ρXY = 0 en el ejemplo 11.5.5.
11.4 Cierto informe de inspección de aviones comerciales clasica las suras en las alas en tres cate-
gorías: inexistentes, detectables y serias. Los registros históricos indican que el 70 % de los
aviones no tenía suras en las alas; 25 % tenía suras perceptibles y 5% tenía suras críticas. Se
eligen aleatoriamente 5 aviones. Calcular la probabilidad de que:
a. Uno de ellos tenga suras críticas, dos tengan suras detectables y dos no tengan suras.
b. Por lo menos un avión tenga suras críticas.
11.5 La función de densidad conjunta de las variables X1 y X2 está dada por:
kx21 x2 ,

si 0 ≤ x1 ≤ x2 y x1 + x2 ≤ 2 ;
fX1 X2 (x1 , x2 ) =
0, en otro caso.
a. Dibujar el gráco del soporte de esta función.
b. Determinar el valor de k.
c. Calcular e interpretar P[X1 + X2 < 1].
11.6 Para la situación del ejemplo 11.3.7, determinar la distribución de las ganancias trimestrales
promedio y usarla para calcular la probabilidad de que la ganancia trimestral promedio no
supere los 5.2 millones de dólares.
11.7 Para las variables de ejercicio 11.1, calcular:
a. Las distribuciones marginales de X1 y X2 .

b. Las distribuciones condicionales de X1 y X2 .
c. Las matrices de covarianzas y correlaciones.
11.8 Mostrar que ρXY = 0 para las variables aleatorias X y Y, del ejemplo 11.5.5.
11.9 Para las variables de ejercicio 11.5, calcular:
a. Las distribuciones marginales de X1 y X2 .

b. Las distribuciones condicionales de X1 y X2 .
c. Las matrices de covarianzas y correlaciones.
d. ¾Son independientes estas variables?
11.10 Mostrar que el número de covarianzas (o correlaciones) entre las parejas de componentes de un
p(p−1)
vector aleatorio de p componentes es
2 .
Apéndice A
Elementos básicos de matemáticas
A.1. Introducción
En este apéndice se presentan las nociones básicas de matemáticas que se usan frecuentemente en la
disciplina estadística y que son fundamentales para llevar a buen término las prácticas cuantitativas
desarrolladas a lo largo de este libro. Aquí se destacan variadas secciones donde se estudian en cierto
detalle los fundamentos de matemáticas, desde los conceptos primordiales de la aritmética y el álgebra,
pasando por las razones, la factorización de polinomios, las ecuaciones y los logaritmos, hasta el manejo
de las sumatorias y las productorias. Se enfatiza el hecho de que el manejo pleno de estos temas
garantiza en cierta medida el éxito del desarrollo de los métodos estadísticos objeto de estudio y dará
al lector una base sólida para abordar sin dicultades cualquier técnica aplicada fundamentada en
cualquier metodología cuantitativa.
A.2. Operaciones aritméticas
Para llevar a cabo las operaciones aritméticas, es necesario seguir algunas reglas y una metodología
apropiada. Las siguientes son las propiedades básicas de estas operaciones:
• Propiedad conmutativa de la suma: a + b = b + a.
• Propiedad asociativa de la suma: a + (b + c) = (a + b) + c = a + b + c.
• Propiedad conmutativa del producto: a · b = b · a.
354
A.2. OPERACIONES ARITMÉTICAS 355
• Propiedad asociativa del producto: a · (b · c) = (a · b) · c = a · b · c.
• Propiedad distributiva: a · (b + c) = (a · b) + (a · c).
Nota. Las cantidades x·y y (x · y) + z se pueden abreviar con xy y xy + z respectivamente, y además

x
x÷y se puede expresar como
y.
Proposición A.2.1. Sean a, b, c y d números reales tales que hacen sentido las siguientes operaciones
algebraicas. Entonces se cumplen las siguientes propiedades:
i. iii.
a b a±b a c a·c
± = . · = .
c c c b d b·d
ii. iv.
a c (a · d) ± (b · c) a c a·d
± = . ÷ = .
b d b·d b d b·c
Nota. Se observa que

−a a a
= =− .
b −b b
Ejemplo A.2.1. Simplicar lo máximo posible:
a. c.
5 3

6 + 2 +2 1 2 2 1
1 4 . ÷ · ÷ .
+ +4 3 5 3 4
3 9
b. d.

2 3

1 4
(0.02) · (0.0003)
· ÷ · . .
5 4 3 7 0.002
Solución:
a.
5 3 5 9 12
6 + 2 +2 6 + 6 + 6
1 4 = 3 4 36
3 + 9 +4 9 + 9 + 9
5+9+12
6
= 3+4+36
9
26
6
= 43
9
26 · 9
=
6 · 43
356 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
13 · 3
=
1 · 43
39
= .
43
b.

2 3 1 4 2·3 1·4
· ÷ · = ÷
5 4 3 7 5·4 3·7
6 4
= ÷
20 21
3 4
= ÷
10 21
3 · 21
=
10 · 4
63
= .
40
c.

1 2 2 1 1·5 2·4
÷ · ÷ = ·
3 5 3 4 3·2 3·1
5 8
= ·
6 3
5·8
=
6·3
5·4
=
3·3
20
= .
9
d.
2 3
(0.02) · (0.0003) 100 ·10,000
= 2
0.002
1,000
2·3
100·10,000
= 2
1,000
2 · 3 · 1, 000
=
100 · 10, 000 · 2
3
=
1, 000
= 0.003.

A.3. EXPONENTES Y RADICALES 357
A.3. Exponentes y radicales
A continuación se presenta un resumen de algunas de las reglas básicas que se deben tener en cuenta
al trabajar con exponentes y radicales:
Proposición A.3.1. Sean m, n, x y y números reales tales que hacen sentido las siguientes opera-
ciones algebraicas. Entonces se cumplen las siguientes propiedades:
√
i. xm · xn = xm+n . iv. x0 = 1 y x1 = x. vii. xm/n = n xm .
√ √ √
m x · y = m x · m y.
ii. xm ÷ xn = xm−n . v. 0x = 0 y 1x = 1. viii.
q √
m x
m x =
x−m = ix. m y.
1 √
iii. (xm )n = xm·n . vi. xm . y
Nota. Se observa que la expresión 00 no hace sentido.
Ejemplo A.3.1. Simplicar los máximo posible:
a. d.
−[5x − (3y − 5x) − (2x − 5y)]. (xm + 5y n )(3xm − 4y n ).
b.
4 3
2 6 3−2m
− xm−2 · x . e.
3 4 v√
u 3 p √
c.
u 2 3 x4 x
4 q · √ .
x−1 y −2 + x2 y −1
t
1
4
x
. 8
y −2 − x−2
Solución:
a.
−[5x − (3y − 5x) − (2x − 5y)] = −[5x − 3y + 5x − 2x + 5y]

= −5x + 3y − 5x + 2x − 5y
= −10x + 0y
= −10x.
b.
4 3 4 3
2 6 3−2m 2 4 6 3
− xm−2 · x = − · xm−2 · · x3−2m
3 4 3 4
24 63 4·(m−2) 3·(3−2m)
= (−1)4 · · ·x ·x
34 43
24 · 23 · 33
= 1 · 4 3 3 · x4m−8+9−6m
3 ·2 ·2
2 1−2m
= x .
3
c.
1 1
x−1 y −2 + x2 y −1 x y2 + x2 y1
= 1 1
y −2 − x−2 y2 − x2
1 x2
xy 2 + y
= 1·x2 −1·y 2
x2 y 2
1 x3 y
xy 2 + xy 2
= x2 −y 2
x2 y 2
1+x3 y
xy 2
= x2 −y 2
x2 y 2
(1 + x3 y) · x2 y 2
=
(x2 − y 2 ) · xy 2
x(1 + x3 y)
= .
(x2 − y 2 )
d.
(xm + 5y n )(3xm − 4y n ) = (xm + 5y n )(3xm ) − (xm + 5y n )(4y n )

= (xm )(3xm ) + (5y n )(3xm ) − (xm )(4y n ) − (5y n )(4y n )
= 3x2m + 15xm y n − 4xm y n − 20y 2n
= 3x2m + 11xm y n − 20y 2n .
e.
v√  14 13
√
 1
4
1
x · x
u 3 p 2
u 2 3 4
x x  23 
4 q
t · √ = 1 · 1
1
4
x 1 2 x4
8 8
1 1 1 1 1
2 3·4 x4· 3 · x 2 · 3
= 1 · 1
1 1 x4
82·4
1 1 4 1
2 12 · 8 8 x 3 + 6
= · 1
1 x4
1 1 3 1
= 2 12 · 23 8 · x 2 − 4
1 3 6 1
= 2 12 · 2 8 · x 4 − 4
A.4. FACTORIAL 359
2+9 5
=2 24 · x4
11 4 1
= 2 24 · x 4 · x 4
√
24
√4
= 211 · x1 · x1
p √
= 24 2, 048 x 4 x.
A.4. Factorial
El factorial es una expresión de uso frecuente en las técnicas combinatorias. En seguida algunas
generalidades al respecto:
Denición A.4.1. La expresión ! se denomina factorial y n! se reere

al producto de todos los enteros desde 1 hasta n. Esto es:
n! = n · (n − 1) · (n − 2) · . . . · 3 · 2 · 1.
Además, se dene 0! = 1.
Ejemplo A.4.1. Calcular:
52!
a. 5!. b.
(52−5)! . c. 3! + 6!. d. 3! · 6!.
Solución:
a.
5! = 5 · 4 · 3 · 2 · 1
= 120.
b.
52! 52!
=
(52 − 5)! 47!
52 · 51 · 50 · 49 · 48 · 47!
=
47!
= 52 · 51 · 50 · 49 · 48
= 311, 875, 200.
c.
3! + 6! = (3 · 2 · 1) + (6 · 5 · 4 · 3 · 2 · 1)
= 6 + 720
= 726.
d.
3! · 6! = (3 · 2 · 1) · (6 · 5 · 4 · 3 · 2 · 1)
= 6 · 720
= 4, 320.
Nota. Los factoriales no se trabajan utilizando las reglas aritméticas. El factorial es una forma de
presentar de modo conveniente productos crecientes de enteros. Por lo tanto, no se pueden sumar
(restar) o multiplicar (dividir). Por lo tanto:
(m + n)! 6= m! + n! y (m · n)! 6= m! · n!
¾El lector puede dar un ejemplo que rectique estos hechos?
A.5. Razones, fracciones y porcentajes
Las razones, las fracciones y los porcentajes son relaciones primordiales en cualquier ámbito donde se
quiera expresar una proporcionalidad de forma sencilla e informativa.
Denición A.5.1. Una razón es la relación entre dos cantidades. Es

decir, es la comparación en términos relativos de esas cantidades.
Ejemplo A.5.1. El número de estudiantes en un colegio es 5,000 de los cuales 1,000 son niñas.
Calcular la razón de niñas a niños en el colegio.
Solución:
La razón de niñas a niños es 1, 000/4, 000 = 1/4 o 1 : 4. Lo que quiere decir que hay 1 niña por cada
4 niños.
A.5. RAZONES, FRACCIONES Y PORCENTAJES 361
La razón de una parte a un todo se llama fracción . Por ejemplo, la expresión ¾qué fracción de los
trabajadores son mujeres? se entiende como ¾cuál es la razón del número de trabajadores mujeres al
total de trabajadores?. Una fracción se representa como la razón de una parte al todo; en símbolos:
Parte
Todo
o
Parte : Todo.
Ejemplo A.5.2. Hay 15 hombres y 20 mujeres en una clase. ¾Qué fracción de los estudiantes son
mujeres?
Solución:
Parte
Fracción =
Todo
20
=
15 + 20
20
=
35
4
= .
7
4
Esto signica que
7 de los estudiantes son mujeres, o 4 de cada 7 estudiantes es mujer, o que la razón
de estudiantes mujeres al total de estudiantes es 4:7.
Ejemplo A.5.3. En una clase de 30 estudiantes, la razón de niños al total de estudiantes es 2:5.
¾Cuántos niños hay en la clase?
Solución:
Parte
Fracción =
Todo
2 Niños
=
5 30
2
Lo que quiere decir que el número de niños en la clase es
5 · 30 = 12.
Un porcentaje , al igual que una fracción, constituye otra manera de expresar una parte determinada
de una unidad. El porcentaje es la parte de un todo que se ha divido en 100 porciones iguales; de ahí
la palabra porcentaje o la expresión tanto por ciento. Así, se obtiene que
Parte x
=
Todo 100
y por lo tanto, cuando una fracción se multiplica por 100 y se agrega el símbolo % se convierte en un
porcentaje, esto es,
Parte
x= · 100 %.
Todo
Nota. El símbolo % es un indicador de que la cifra en cuestión es un porcentaje.
Ejemplo A.5.4. ¾Qué porcentaje es 18 con respecto a 72? ¾Qué parte corresponde al 35 % de 72?
Solución:
El porcentaje es 18 con respecto a 72 es:
Parte 18
· 100 % = · 100 % = 25 %.
Todo 72
Además, la parte que corresponde al 35 % de 72 es:
35
35 % · 72 = · 72 = 0.35 · 72 = 25.2.
100

A.6. Desigualdades
A continuación se enumeran algunas propiedades asociadas con desigualdades que involucran números
reales: si a, b y c son números reales entonces se satisfacen las siguientes propiedades:
i. Si a −b.

1 1
ii. Si a b.
1 1
iii. Si a ab entonces
a < b.
iv. Si a0 entonces ac < bc. ix. Si |a| bc. x. Si |a| > b si y solo si a < −b ∨ a > b.
Nota. Las propiedades del mayor estricto son análogas a las que se presentaron anteriormente. Ade-
más, las estas propiedades también se cumplen si se reemplazan las desigualadades estrictas por
desigualdades no estrictas.
Ejemplo A.6.1. Resolver la desigualdad 2x − 7 < 4x − 2.
Solución:
2x − 7 < 4x − 2
2x − 7 + 7 < 4x − 2 + 7
2x < 4x + 5
A.7. FACTORIZACIÓN DE POLINOMIOS 363
2x − 4x < 4x + 5 − 4x
−2x < 5
1 1
− · (−2x) > − · 5
2 2
5
x>− .
2
Ejemplo A.6.2. Resolver la desigualdad −5 ≤ 2x + 6 ≤ 4.
Solución:
−5 ≤ 2x + 6 ≤ 4
−5 − 6 ≤ 2x + 6 − 6 ≤ 4 − 6
−11 ≤ 2x ≤ −2
1 1 1
· (−11) ≤ · 2x ≤ · (−2)
2 2 2
11
− ≤ x ≤ −1.
2
A.7. Factorización de polinomios
La factorización de polinomios permite la resolución de variados problemas con cierta facilidad. Do-
minar las técnicas que se presentan en seguida es importante para adquirir destreza en el cálculo y
sus anes.
Denición A.7.1. Sean a0 , a1 , . . . , an−1 , an números reales con n un

entero no negativo. Un polinomio de grado n en la variable x es una
expresión de la forma
an xn + an−1 xn−1 + . . . + a1 x + a0
donde an 6= 0.
Nota. En la denición A.7.1, los números a0 , a1 , . . . , an−1 , an se denominan coecientes del polino-
mio. En particular, a0 se llama término independiente .
Ejemplo A.7.1. Los siguientes son algunos polinomios:
a. −4 es un polinomio de grado 0 donde a0 = −4.

1 1
b. 3x + 5 es un polinomio de grado 1 en la variable x donde a0 = 5 y a1 = 3.
1 2 1
c.
2 y es un polinomio de grado 2 en la variable y donde a0 = 0, a1 = 0 y a2 = 2.
d. 36x2 − 12x3 + 18x es un polinomio de grado 3 en la variable x donde a0 = 0, a1 = 18, a2 = 36 y

a3 = −12.
e. y − 85 y 2 − 12 y 4 − 1 es un polinomio de grado 4 en la variable y donde a0 = −1, a1 = 1, a2 = − 85 ,
a3 = 0 y a4 = − 12 .
Denición A.7.2. La factorización de un polinomio consiste en re-

escribir este objeto como un producto de otras expresiones denominadas
factores .
A continuación se presentan algunos casos especiales de factorización de eso frecuente:
Factor común
Los polinomios ax + bx y ax − bx tienen factor común x, y se factorizan como x(a + b) y x(a − b)

respectivamente. Para factorizar un polinomio por medio del factor común se debe:
i. Identicar el factor común.
ii. Dividir cada término del polinomio por el factor común.
iii. Escribir el factor común, y a continuación, los cocientes hallados en el numeral anterior, cada uno
precedido por su respectivo signo.
Ejemplo A.7.2. Factorizar los siguientes polinomios:
a. b.
27a3 x2 − 18ax3 . 12a2 b3 x − 6ab + 12a62b4 .
Solución:
a.
27a3 x2 − 18ax3 = 9ax2 (3a2 − 2x).
b.
12a2 b3 x − 6a3 b4 + 18a2 b4 = 6a2 b3 (2x − ab + 3b).
Factor común por agrupación de términos
Para factorizar un polinomio con el factor común por agrupación de términos se debe:
i. Agrupar los términos convenientemente.
ii. Obtener el factor común de cada uno de los agrupamientos.
iii. Realizar una segunda factorización por medio del factor común de los agrupamientos.
a. c.
an + 2a + n + 2. a2 x2 − 3bx2 + a2 y 2 − 3by 2 .
b. d.
am − bn − bm + an. 4a3 − 1 − a2 + 4a.
Solución:
a.
an + 2a + n + 2 = (an + 2a) + (n + 2)
= a(n + 2) + 1(n + 2)
= (a + 1)(n + 2).
b.
am − bn − bm + an = (am + an) + (−bm − bn)

= a(m + n) − b(m + n)
= (a − b)(m + n).
c.
a2 x2 − 3bx2 + a2 y 2 − 3by 2 = a2 x2 − 3bx2 + a2 y 2 − 3by 2

= x2 (a2 − 3b) + y 2 (a2 − 3b)

= x2 + y 2 a2 − 3b .

d.
4a3 − 1 − a2 + 4a = 4a3 + 4a + −a2 − 1

= 4a a2 + 1 − 1 a2 + 1

= (4a − 1) a2 + 1 .

Trinomio cuadrado perfecto
Un trinomio cuadrado perfecto es un polinomio de la forma a2 + 2ab + b2 o a2 − 2ab + b2 , y se

2 2 2
factorizan como a + 2ab + b = (a + b) o a − 2ab + b = (a − b)2 . Para factorizar un trinomio
2 2
cuadrado perfecto se debe:
i. Ordenar el trinomio apropiadamente.
ii. Extraer la raíz cuadrada del primer y tercer término, y comprobar que el doble del producto de
estas raíces coincide con el segundo término del trinomio.
iii. Factorizar el polinomio como un trinomio cuadrado perfecto.
a. b. c.
a2 + 25 − 10a. 40x2 + 16 + 25x4 . 9x2 y 4 + 4a6 − 12a3 xy 2 .
Solución:
a.
a2 + 25 − 10a = a2 − 10a + 25
= a2 − (2 · 5 · a) + 52
= (a − 5)2 .
b.
40x2 + 16 + 25x4 = 16 + 40x2 + 25x4

2
= 42 + 2 · 4 · 5x2 + 5x2

2
= 4 + 5x2 .
c.
9x2 y 4 + 4a6 − 12a3 xy 2 = 9x2 y 4 − 12a3 xy 2 + 4a6

2 2
= 3xy 2 − 2 · 3xy 2 · 2a3 + 2a3

2
= 3xy 2 − 2a3 .
Diferencia de cuadrados
Una diferencia de cuadrados es un polinomio de la forma a2 − b2 , y se factoriza como a2 − b2 =

(a − b)(a + b). Para factorizar una diferencia de cuadrados se debe:
i. Extraer la raíz cuadrada del minuendo y del sustraendo.
ii. Factorizar el polinomio como una diferencia de cuadrados.
iii. Reducir cada factor si es el caso.
a. c.
a2 − 25. 9a6 − 64x2 y 4 .
b. d.
1 − 4m2 . 4 − (a + 1)2 .
Solución:
a.
a2 − 25 = a2 − 52
= (a − 5)(a + 5).
b.
1 − 4m2 = 12 − (2m)2
= (1 − 2m)(1 + 2m).
c.
2 2
9a6 − 64x2 y 4 = 3a3 − 8xy 2
= 3a3 − 8xy 2 3a3 + 8xy 2 .

d.
4 − (a + 1)2 = 22 − (a + 1)2
= (2 − (a + 1))(2 + (a + 1))
= (1 − a)(3 + a).
Trinomio de la forma x2 + bx + c
Un trinomio de la forma x2 + bx + c se factoriza como (x + m)(x + n) donde m+n=b y m · n = c.

Para factorizar un trinomio de esta forma se debe:
i. Ordenar el trinomio apropiadamente.
ii. Encontrar m y n tales que m+n=b y m · n = c.

iii. Factorizar el polinomio como un trinomio de la forma x2 + bx + c.
iv. Reducir cada factor si es el caso.
a. c.
m2 + 5m − 14. x8 y 8 − 100a2 − 15ax4 y 4 .
b. d.
20 − 9y 2 + y 4 . 3(a − 1) − 108 + (a − 1)2 .
Solución:
a.
m2 + 5m − 14 = m2 + (7 + (−2))m + (7 · (−2))
= (m + 7)(m − 2).
b.
20 − 9y 2 + y 4 = y 4 − 9y 2 + 20
2
= y 2 + ((−5) + (−4))y 2 + ((−5) · (−4))
= y2 − 5 y2 − 4 .

c.
x8 y 8 − 100a2 − 15ax4 y 4 = x8 y 8 − 15ax4 y 4 − 100a2

2
= x4 y 4 + (5a + (−20a))x4 y 4 + (5a · (−20a))
= x4 y 4 + 5a x4 y 4 − 20a .

d.
3(a − 1) − 108 + (a − 1)2 = (a − 1)2 + 3(a − 1) − 108

= (a − 1)2 + (12 + (−9))(a − 1) + (12 · (−9))
= ((a − 1) + 12)((a − 1) + (−9))
= (a + 11)(a − 10).
Otros casos
Los siguientes son otros casos relevantes de factorización:
• Tetranomio cubo perfecto:
a3 + 3a2 b + 3ab2 + b3 = (a + b)3 y a3 − 3a2 b + 3ab2 − b3 = (a − b)3 .
• Suma o diferencia de cubos:
a3 + b3 = (a + b) a2 − ab + b2 a3 − b3 = (a − b) a2 + ab + b2 .

y
• Trinomio cuadrado perfecto por adición y sustracción.
• Trinomio de la forma ax2 + bx + c.
a. b.
125x3 + 1 + 75x2 + 15x. 54ab2 + 8a3 − 36a2 b − 27b3 .

c. e.
a3 b3 + x6 . 4x8 + y 8 .
d. f.
64a3 − 729. 2x2 + 3x − 2.
Solución:
a.
125x3 + 1 + 75x2 + 15x = 1 + 15x + 75x2 + 125x3

= 13 + 3 · 12 · 5x + 3 · 1 · (5x)2 + (5x)3

= (1 + 5x)3 .
b.
54ab2 + 8a3 − 36a2 b − 27b3 = 8a3 − 36a2 b + 54ab2 − 27b3

= (2a)3 − 3 · (2a)2 · 3b + 3 · 2a · (3b)2 − (3b)3

= (2a − 3b)3 .
c.
3
a3 b3 + x6 = (ab)3 + x2
2
= ab + x2 (ab)2 − ab · x2 + x2
= ab + x2 a2 b2 − abx2 + x4 .

d.
64a3 − 729 = (4a)3 − 93

= (4a − 9) (4a)2 + 4a · 9 + 92

= (4a − 9) 16a2 + 36a + 81 .

e.
2 2
4x8 + y 8 = 2x4 + y4
2 2
= 2x4 + y4 + 2 · 2x4 · y 4 − 2 · 2x4 · y 4

2 2
2x4 + 2 · 2x4 · y 4 + y 4 − 4x4 y 4

=
2 2
= 2x4 + y 4 − 2x2 y 2
2x4 + y 4 − 2x2 y 2 2x4 + y 4 + 2x2 y 2

=
2x4 − 2x2 y 2 + y 4 2x4 + 2x2 y 2 + y 4 .

=
A.8. ECUACIONES 371
f.

2 2x2 + 3x − 2
2x2 + 3x − 2 =
2
(2x)2 + 3(2x) − 4
=
2
(2x)2 + (4 + (−1))(2x) − (4 · (−1))
=
2
(2x + 4)(2x − 1)
=
2
2(x + 2)(2x − 1)
=
2
= (x + 2)(2x − 1).

Nota. Los casos de factorización expuestos son apenas unos cuantos de uso común; algunos otros
resultan como una combinación de éstos o como una modicación del caso inicial mediante un proce-
dimiento algebraico previo. Así, los demás casos de factorización son una consecuencia inmediata de
un dominio completo de los casos presentados anteriormente.
A.8. Ecuaciones
A continuación se presentan las generalidades de algunas técnicas asociadas con la resolución de

ecuaciones primer grado y de segundo grado. Tales métodos son parte integral del desarrollo en mayor
o menor medida de cualquier técnica cuantitativa.
Denición A.8.1. Una ecuación de primer grado con una incóg-

nita es una igualdad algebraica en la que gura un único valor desco-
nocido sin exponente.
En una ecuación se pueden distinguir varios elementos:
• Incógnita : valor desconocido de la ecuación que interesa conocer; usualmente se denota con x
o y, aunque es posible utilizar cualquier símbolo.
• Grado : mayor exponente de la incógnita. En este apéndice se tratan ecuaciones de primer grado
(lineales) y de segundo grado (cuadráticas).
• Coeciente : cualquier número que multiplica la incógnita.

• Término independiente : cualquier número que no acompaña a la incógnita.

• Primer miembro : expresión a la izquierda del signo igual.
• Segundo miembro : expresión a la derecha del signo igual.
Nota. La solución de una ecuación de primer grado es única.
Las siguientes son las propiedades fundamentales para resolver ecuaciones:
i. Sumar en los dos miembros de la ecuación una misma expresión.
Ejemplo A.8.1. Sumar en los dos miembros de la ecuación 5x+2 = 8x−19 la expresión −5x+19.
Solución:
5x + 2 = 8x − 19
5x + 2 + (−5x + 19) = 8x − 19 + (−5x + 19)
5x + 2 − 5x + 19 = 8x − 19 − 5x + 19
21 = 3x
3x = 21.

ii. Multiplicar en los dos miembros de la ecuación por una expresión diferente de 0.
Ejemplo A.8.2. Multiplicar en los dos miembros de la ecuación 3x = 21 por

1
3.
Solución:
3x = 21
1 1
· 3x = · 21
3 3
x = 7.

Ejemplo A.8.3. Resolver la ecuación 5(2x + 3) − 5x = −5 + 3(x − 4).
Solución:
5(2x + 3) − 5x = −5 + 3(x − 4)
10x + 15 − 5x = −5 + 3x − 12
10x − 5x − 3x = −15 − 5 − 12
2x = −32
−32
x=
2
x = −16.

A.8. ECUACIONES 373
Ejemplo A.8.4. Resolver la ecuación

x
2 + 2x
3 = 2(x − 5).
Solución:
x 2x
+ = 2(x − 5)
2 3
3x 4x
+ = 2x − 10
6 6
7x
= 2x − 10
6
7x = 6(2x − 10)
7x = 12x − 60
7x − 12x = −60
−5x = −60
−60
x=
−5
x = 12.
Ejemplo A.8.5. Resolver la ecuación

2x−3
x+4 −2= 11
x2 −16 .
Solución:
2x − 3 11
−2=
x+4 x2 − 16
(2x − 3) · 1 − (x + 4) · 2 11
= 2
x+4 x − 16
2x − 3 − 2x − 8 11
=
x+4 (x − 4)(x + 4)
−11 11
=
x+4 (x − 4)(x + 4)
−11 x + 4 11 x+4
· = ·
x+4 11 (x − 4)(x + 4) 11
1
−1 =
x−4
−1(x − 4) = 1
−x + 4 = 1
−x = 1 − 4
x = 3.

Denición A.8.2. Se llama sistema de ecuaciones de primer gra-

do con dos incógnitas al conjunto de dos ecuaciones de primer grado
que presentan soluciones comunes.
Este conjunto de ecuaciones frecuentemente se representa mediante el par de expresiones

a1 x + b1 y = c1
a2 x + b2 y = c2
donde a1 , a2 , b1 y b2 son los coecientes, x y y son las incógnitas y c1 y c2 son los términos indepen-
dientes.
Para resolver uno de estos sistemas hay disponibles varias técnicas, entre ellos se distinguen el método
de sustitución y el método de igualación .
Ejemplo A.8.6. Resolver el sistema de ecuaciones

3x + y = 11
5x − y = 13
utilizando el método de sustitución.
Solución:
Primero, en alguna de las ecuaciones se halla el valor de alguna de las incógnitas. Por ejemplo, se
puede despejar y en la primera ecuación suponiendo conocido el valor de x. Así, se obtiene que
y = 11 − 3x.
Luego, se sustituye en la segunda ecuación el valor de y, de donde
5x − (11 − 3x) = 13,
que corresponde a una sola ecuación de primer grado con una sola incógnita. Resolviendo:
5x − (11 − 3x) = 13
5x − 11 + 3y = 13
5x + 3x = 13 + 11
8x = 24
x = 3.
Ya conocido el valor de x, se sustituye en la expresión del valor de y que se obtuvo a partir de la

primera ecuación del sistema, obteniéndose que
y = 11 − 3x
A.8. ECUACIONES 375
y = 11 − 3 · 3
y = 11 − 9
y = 2.
Así, la solución al sistema de ecuaciones es x=3 y y = 2.

Ejemplo A.8.7. Resolver el sistema de ecuaciones

3x + y = 11
5x − y = 13.
utilizando el método de igualación.
Solución:
Primero, se despeja en las dos ecuaciones la misma incógnita, y por ejemplo. Así,

y = 11 − 3x
y = 5x − 13
Luego, igualando las dos ecuaciones se obtiene una sola ecuación de primer grado con una sola incóg-
nita. Resolviendo:
11 − 3x = 5x − 13
3x + 5x = 11 + 13
8x = 24
x = 3.
Este valor de x se sustituye en cualquiera de las ecuaciones iniciales de y, la primera por ejemplo, y
se obtiene que
y = 11 − 3x
y = 11 − 3 · 3
y = 11 − 9
y = 2.
Así, la solución al sistema de ecuaciones es x=3 y y = 2.

Nota. La igualación y la sustitución son apenas un par de métodos para resolver ecuaciones simulta-
neas. Entre otros métodos se encuentran el método de reducción , el método de Gauss y la regla
de Cramer . De otro lado, también son comunes los sistemas de ecuaciones de primer grado con tres
o más incógnitas. Así, el conjunto de ecuaciones


 a11 x1 + a12 x2 + . . . + a1n xn = b1
 a21 x1 + a22 x2 + . . . + a2n xn = b2

.
.


 .

an1 x1 + an2 x2 + . . . + ann xn = bn
donde a11 , a12 , . . . , ann son los coecientes, x1 , x2 , . . . , xn son las incógnitas y b1 , b2 , . . . , bn son los
términos independientes, corresponde a un sistema de ecuaciones de primer grado con n in-
cógnitas , n ≥ 2, que se puede resolver con los métodos mencionados anteriormente.
Denición A.8.3. Una ecuación de segundo grado con una in-

cógnita es una ecuación de la forma
ax2 + bx + c = 0
donde a y b son los coecientes, a 6= 0, x es la incógnita y c es el término

independiente.
Para resolver una ecuación de este tipo se puede factorizar el primer miembro de la igualdad y despejar
para x, o se puede aplicar la siguiente fórmula general:
√
−b ± b2 − 4ac
x=
2a
donde ± indica que la ecuación tiene dos soluciones que se obtienen aplicando la fórmula con el signo
+ y con el signo − por separado. La fórmula anterior se conoce como fórmula cuadrática y las
soluciones se llaman raíces de la ecuación.
Nota. Las raíces de una ecuación de segundo grado pueden coincidir, o incluso pueden ser números
√
complejos, esto es, un número de la forma a + bi donde a y b son número reales e i = −1 es la unidad
imaginaria (detalles en la sección B.4).
Ejemplo A.8.8. Resolver la ecuación x2 + 11x = −24 por medio de la factorización de un miembro
de la igualdad.
Solución:
x2 + 11x = −24
x2 + 11x + 24 = 0
x2 + (8 + 3)x + (8 · 3) = 0
(x + 8)(x + 3) = 0.
Luego, x+8 =0 o x + 3 = 0, puesto que un producto es igual a 0 si y solo si alguno de sus factores
lo es, en consecuencia se obtiene que las raíces de la ecuación son -8 y-3.
Ejemplo A.8.9. Resolver la ecuación x2 + x + 1 = 0 por medio de la fórmula cuadrática.
Solución:
Los coecientes correspondientes son a = 1, b = −16 y c = 63 dado que x2 = 16x − 63 es equivalente

a la ecuación
x2 − 16x + 63 = 0.
A.8. ECUACIONES 377
Por lo tanto,
√
−b ± b2 − 4ac
x=
2a p
−(−16) ± (−16)2 − 4 · 1 · 63
=
√ 2·1
16 ± 256 − 243
=
√2
16 ± 4
=
2
16 ± 2
= .
2
16+2 18 16−2 14
De donde x= 2 = 2 =9 o x= 2 = 2 = 7.
Ejemplo A.8.10. Resolver la ecuación 4x2 + 16x + 16 = 0 por medio de la factorización de un

miembro de la igualdad.
Solución:
4x2 + 16x + 16 = 0
2
(2x) + (2 · 4 · 2x) + 42 = 0
(2x + 4)2 = 0.
Por lo tanto las dos soluciones de la ecuación son iguales a −2 dado que la única opción es 2x + 4 = 0.
Ejemplo A.8.11. Resolver la ecuación x2 + 2x + 2 = 0 por medio de la fórmula cuadrática.
Solución:
Los coecientes correspondientes son a = 1, b = 2 y c = 2. Luego, aplicando la fórmula cuadrática, se

obtiene que las soluciones de la ecuación están dadas por:
√
−b ± b2 − 4ac
x=
√2a
−2 ± 22 − 4 · 1 · 2
=
√2 · 2
−2 ± 4 − 8
=
4
√
−2 ± −4
=
2
√ √
−2 ± −1 4
=
2
−2 ± 2i
=
2
2 · (−1 ± i)
=
2
= −1 ± i.
De donde x = −1 + i o x = −1 − i.
A.9. Logaritmos
De la misma manera que la operación opuesta a la suma es la resta, la logaritmación es la operación

contraria a la potenciación. El logaritmo de un número en una base determinada es el exponente al
cual hay que elevar la base para obtener dicho número.
Denición A.9.1. Dados b, x y y números reales tal que b > 0, b 6= 1

y x > 0, el logaritmo en base b de x es igual a y si y solo si b elevado
a la y es igual a x; en símbolo:
logb (x) = y ⇔ x = by
Nota. Como cualquier número real positivo diferente de uno puede tomarse como base, existe una
innidad de sistemas de logaritmos, pero tradicionalmente, solo se utilizan los siguientes sistemas:
• El logaritmo en base 2 de xlogaritmo binario de x; éste se escribe log2 (x).

o
• El logaritmo en base 10 de x o logaritmo común de x; éste se escribe log(x).
• El logaritmo en base e de x o logaritmo natural de x, donde e es el número de Euler, en honor

a Leonhard Euler ; éste se escribe ln(x).
1
Ejemplo A.9.1. Son ejemplos de logaritmos:
• log2 (32) = 5 dado que 25 = 32.

• log(1, 000) = 3 dado que 103 = 1, 000.
• ln(7.38906) ≈ 2 dado que e2 ≈ 7.38906.
En el último numeral, ¾por qué se utilizó el signo ≈ en lugar del signo =?
Las siguientes son algunas propiedades del los logaritmos:
1 Fotografía tomada de la página web http://www.cienciayreligion.org/biografias/bio_19.html.

A.9. LOGARITMOS 379
Figura A.1: Leonhard Euler (1707-1783).
Proposición A.9.1. Sean a, b, x1 y x2 números reales tal que b > 0, b 6= 1, x1 > 0 y x2 > 0 .
Entonces se tiene que:
i. El logaritmo en base b de b es igual a 1:
logb (b) = 1.
ii. El logaritmo en base b de 1 es igual a 0:
logb (1) = 0.
iii. La potenciación y la logaritmación son operaciones opuestas:
blogb (x1 ) = x1 y logb (bx1 ) = x1 .
iv. El logaritmo de un producto es igual a la suma de los logaritmos de los factores:
logb (x1 · x2 ) = logb (x1 ) + logb (x2 ).
v. El logaritmo de un cociente es igual al logaritmo del dividendo menos el logaritmo del divisor:

x1
logb = logb (x1 ) − logb (x2 ).
x2
vi. El logaritmo de una potencia es igual al producto entre exponente y el logaritmo de la base:
logb (xa1 ) = a logb (x1 ).

La demostración se deja como ejercicio para el lector, al igual que escribir las propiedades correspon-
dientes trabajando con logaritmos binarios, comunes y naturales.
a. √ b. c.
log 10 . 1
ln . log2 (0.125).
e5
Solución:
a. b. c.
√ 1
log 10 = log 10 2
1

= ln e−5

ln
1 e5 log2 (0.125) = log2 (1/8)
= log (10)
2 = log2 8−1

= −5 ln (e)
1
= ·1 = −5 · 1 = − log2 (8)
2
= 0.5. = −5. = −3.

r !
5 1
log√3 .
81
Solución:
q
1
Sea y = log√3 5
81 . Entonces se tiene que:
√
r
y1 5
3 =
81
1 y 1 51
32 =
34
y 4
3 2 = 3− 5
y 4
log3 3 2 = log3 3− 5
y 4
=−
2 5
8
y=− .
5

A.9. LOGARITMOS 381
Ejemplo A.9.4. Escribir la siguiente expresión por medio de un solo logaritmo:

x x+1
− ln x2 − 1 .

ln + ln
x−1 x
Solución:

x x+1 2 x x+1
− ln x2 − 1

ln + ln − ln x − 1 = ln
x−1 x x−1 x

x+1
= ln − ln ((x + 1)(x − 1))
x−1
x+1
!
x−1
= ln
(x + 1)(x − 1)

x+1
= ln
(x + 1)(x − 1)2

1
= ln
(x − 1)2
= ln (x − 1)−2

= −2 ln (x − 1) .
Ejemplo A.9.5. Resolver las siguientes ecuaciones:
a. b.
log(x) + log(x + 3) = 2 log(x + 1). e2x − ex − 6 = 0.
Solución:
a.
log(x) + log(x + 3) = 2 log(x + 1)

log(x(x + 3)) = log (x + 1)2

2
10log(x(x+3)) = 10log((x+1) )
x(x + 3) = (x + 1)2
x2 + 3x = x2 + 2x + 1
3x − 2x = x2 − x2 + 1
x = 1.
b.
e2x − ex − 6 = 0
2
(ex ) − ex − 6 = 0
(ex + 2) (ex − 3) = 0.
Luego, ex + 2 = 0 o ex − 3 = 0 . Por lo tanto ex = −2, lo que no puede ser, porque ex > 0 para
todo número real x, o también
ex = 3
ln (ex ) = ln(3)
x = ln(3)
x ≈ 1.09861.
En ocasiones se hace necesario calcular logaritmos por medio de bases diferentes. Cuando esta situación
se presenta se hace necesario realizar un cambio de base para transformar la expresión de una base
desconocida a una base conocida.
Proposición A.9.2. Sean b, k y x números reales tal que b y k son bases de logaritmos y x > 0.
Entonces se tiene que:
logk (x)
logb (x) = .
logk (b)
Demostración:
Sea y un número real dado por y = logb (x), de donde by = x . Luego, tomando logaritmo en base k en
ambos términos de esta igualdad y en virtud de la propiedad vi. de la proposición A.9.1 se tiene que:
logk (by ) = logk (x)

y logk (b) = logk (x)
logb (x) · logk (b) = logk (x)
puesto que y = logb (x). Como b es la base de un logaritmo entonces b 6= 1 y en consecuencia logk (b) 6= 0.
Entonces, dividiendo ambos miembros de la última igualdad por logk (b) se obtiene que:
logk (x)
logb (x) = .
logk (b)

A.10. SUMATORIAS Y PRODUCTORIAS 383
Ejemplo A.9.6. Calcular log16 (8) y log9 (27).
Solución:
Dado que 8 y 16 son potencias de 2, y que 9 y 27 son potencias de 3, entonces conviene transformar
los logaritmos como sigue:
log2 (8) 3 log3 (27) 3

log16 (8) = = = 0.75 y log9 (27) = = = 1.5.
log2 (16) 4 log3 (9) 2
Ejemplo A.9.7. Resolver la ecuación 63x+2 = 200.
Solución:
63x+2 = 200
63x+2 = log6 (200)

log6
3x + 2 = log6 (200)
3x = log6 (200) − 2
log6 (200) − 2
x=
3
ln(200)
ln(6) − 2
x=
3
x ≈ 0.31901.
Nota. El cambio de base en el ejemplo anterior se realiza con el propósito de hacer los cálculos
directamente en una calculadora cientíca corriente que tiene a disposición el logaritmo común y el
logaritmo natural; así, el cambio de base en este ejemplo también se puede hacer a base 10. Queda
como ejercicio para el lector comprobar que los resultados coinciden.
A.10. Sumatorias y productorias
Al darse la suma o el producto de una secuencia numérica, en donde se destaque un orden, es posible
abreviar tal secuencia bajo una expresión. De esta forma,
n
X n
Y
ak y ak
k=m k=m
corresponden a una forma de expresar la sumatoria y la productoria de los términos de una secuen-
cia numérica respectivamente, que se obtienen dando a la variable k los valores enteros comprendidos
entre los límites escritos en la parte inferior y superior (inclusive) de los símbolos asociados. Por lo
tanto:
n
X
ak = am + am+1 + am+2 + . . . + an−2 + an−1 + an
k=m
y
n
Y
ak = am · am+1 · am+2 · . . . · an−2 · an−1 · an .
k=m
n
X n
X n
X n
Y n
Y n
Y
ai = aj = ak y que ai = aj = ak
i=m j=m k=m i=m j=m k=m
y en consecuencia utilizar i, j, k o cualquier otra letra no marca ninguna diferencia. Es común utilizar
la letra i.
Ejemplo A.10.1. Escribir las siguientes secuencias utilizando el símbolo de sumatoria o de produc-
toria según corresponda:
√
4
√
5
√
6 29
√
a. a1 + a2 + a3 + . . . + a64 . d. 6· 8· 10 · . . . · 56.
b. x21 · x22 · x23 · . . . · x251 . e. (y1 − k)2 + (y2 − k)2 + (y3 − k)2 + . . . + (yn − k)2 .
c. 152 + 172 + 192 + . . . + 1172 . f. x5 y6 · x6 y7 · x7 y8 · . . . · x47 y48 .
Solución:
a.
64
X
a1 + a2 + a3 + . . . + a64 = ai .
i=1
b.
51
Y
x21 · x22 · x23 · . . . · x251 = x2i .
i=1
c.
58
X
152 + 172 + 192 + . . . + 1172 = (2i + 1)2 .
i=7
d.
28
√
4
√
5
√
6
√
29
Y i+1
√
6· 8· 10 · . . . · 56 = 2i.
i=3
e.
n
X
(y1 − k)2 + (y2 − k)2 + (y3 − k)2 + . . . + (yn − k)2 = (yi − k)2 .
i=1
f.
47
Y
x5 y6 · x6 y7 · x7 y8 · . . . · x47 y48 = xi yi+1 .
i=5

Nota. La forma de escribir una sumatoria (o una productoria) no es única. Por ejemplo,
58
X 59
X
(2i + 1)2 = (2i − 1)2 .
i=7 i=8
Queda como ejercicio para el lector encontrar otra forma de escribir esta sumatoria.
Ejemplo A.10.2. Se tienen las siguientes seis observaciones: x1 = 2, x2 = 5, x3 = 0, x4 = −1, x5 = 6

y x6 = 4. Calcular:
a. c. e.
6
X 6
X 6
X
xi . x2i . (xi − 3).
i=1 i=1 i=1
b. d.
6
Y 6
Y
xi . (xi + 1)2 .
i=1 i=1
Solución:
a.
6
X
xi = x1 + x2 + . . . + x6
i=1
= 2 + 5 + 0 + (−1) + 6 + 4
= 16.
b.
6
Y
xi = x1 · x2 · . . . · x6
i=1
= 2 · 5 · 0 · (−1) · 6 · 4
= 0.
c.
6
X
x2i = x21 + x22 + . . . + x26
i=1
= 22 + 52 + 02 + (−1)2 + 62 + 42
= 4 + 25 + 0 + 1 + 36 + 16
= 82.
d.
6
Y
(xi + 2)2 = (x1 + 2)2 · (x2 + 2)· . . . · (x6 + 2)2
i=1
= (2 + 2)2 · (5 + 2)2 · (0 + 2)2 · ((−1) + 2)2 · (6 + 2)2 · (4 + 2)2
= 4 · 49 · 4 · 1 · 64 · 36
= 1, 806, 336.
e.
6
X
(xi − 3) = (x1 − 3) + (x2 − 3) + . . . + (x6 − 3)
i=1
= (2 − 3) + (5 − 3) + (0 − 3) + ((−1) − 3) + (6 − 3) + (4 − 3)
= (−1) + 2 + (−3) + (−4) + 3 + 1
= −2.

n n
! n
!
X X X
ai bi 6= ai bi
i=m i=m i=m
y en particular que
n n
!2
X X
a2i 6= ai .
i=m i=m
Análogamente, también se observa que
n n
! n
!
Y Y Y
(ai + bi ) 6= ai + bi .
i=m i=m i=m
¾El lector puede dar un ejemplo que rectique estos hechos?
A continuación se presentan algunas propiedades de las sumatorias:
Proposición A.10.1. Sean am , am+1 , . . . , an−1 , an y bm , bm+1 , . . . , bn−1 , bn dos sucesiones de núme-
ros reales donde m ≤ n, y c un número real constante. Entonces se cumple que:
i. La sumatoria de la suma de dos (o más) términos es igual a la suma de las sumatorias separadas
de los términos:
n
X n
X n
X
(ai + bi ) = ai + bi .
i=m i=m i=m
La productoria del producto de dos (o más) términos es igual al producto de las productorias
separadas de los términos:
n
Y n
Y n
Y
a i bi = ai · bi .
i=m i=m i=m
ii. La sumatoria de la diferencia de dos (o más) términos es igual a la diferencia de las sumatorias
n
X n
X n
X
(ai − bi ) = ai − bi .
i=m i=m i=m
La productoria del cociente de dos (o más) términos es igual al cociente de las productorias
n Qn
Y ai ai
= Qi=m
n .
b
i=m i i=m bi
iii. La sumatoria de una constante multiplicada por un término es igual a la constante multiplicada
por la sumatoria del término:
n
X n
X
c ai = c ai .
i=m i=m
La productoria de un término elevando a una constante es igual a la productoria del término

elevado a la constante: !c
n
Y n
Y
aci = ai .
i=m i=m
iv. La sumatoria de un término más una constante es igual a la sumatoria del término más la
constante multiplicada por el número que indiquen los límites de la sumatoria:
n
X n
X
(ai + c) = ai + c (n − m + 1).
i=m i=m
La productoria de una constante multiplicada por un término es igual a la constante a la potencia

que indiquen los límites de la productoria multiplicada por la productoria del término:
n
Y n
Y
c ai = cn−m+1 ai .
i=m i=m
v. La sumatoria de una constante es igual a la constante multiplicada por el número que indiquen
los límites de la sumatoria:
n
X
c = c (n − m + 1).
i=m
La productoria de una constante es igual a la constante a la potencia que indiquen los límites de
la productoria:
n
Y
c = cn−m+1 .
i=m
Ejemplo A.10.3. Se tienen las siguientes observaciones: x1 = 2, x2 = 5, x3 = 1, x4 = 2, y1 = 1,

y2 = 3, y3 = 1 y y4 = 5. Comprobar que se cumplen las propiedades mencionadas anteriormente. Para
c = 2.
vericar las propiedades iii., iv. y v. utilizar
Solución:
i.
4
X
(xi + yi ) = x1 + y1 + x2 + y2 + x3 + y3 + x4 + y4
i=1
=2+1+5+3+1+1+2+5
=3+8+2+7
= 20.
4
X 4
X
xi + yi = x1 + x2 + x3 + x4 + y1 + y2 + y3 + y4
i=1 i=1
=2+5+1+2+1+3+1+5
= 10 + 10
= 20.
4
Y
xi yi = x1 · y1 · x2 · y2 · x3 · y3 · x4 · y4
i=1
=2·1·5·3·1·1·2·5
= 2 · 15 · 1 · 10
= 300.
4
Y 4
Y
xi · yi = x1 · x2 · x3 · x4 · y1 · y2 · y3 · y4
i=1 i=1
=2·5·1·2·1·3·1·5
= 20 · 15
= 300.
ii.
4
X
(xi − yi ) = x1 − y1 + x2 − y2 + x3 − y3 + x4 − y4
i=1
=2−1+5−3+1−1+2−5
= 1 + 2 + 0 + (−3)
= 0.
4
X 4
X
xi − yi = x1 + x2 + x3 + x4 − (y1 + y2 + y3 + y4 )
i=1 i=1
= 2 + 5 + 1 + 2 − (1 + 3 + 1 + 5)
= 10 − 10
= 0.
4
Y xi x1 x2 x3 x4
= · · ·
i=1
yi y1 y2 y3 y4
2 5 1 2
= · · ·
1 3 1 5
20
=
15
4
= .
3
Q4
xi x1 · x2 · x3 · x4
Qi=1
4 =
i=1 yi
y1 · y2 · y3 · y4
2·5·1·2
=
1·3·1·5
20
=
15
4
= .
3
iii.
4
X
2 xi = 2 x1 + 2 x2 + 2 x3 + 2 x4
i=1
=2·2+2·5+2·1+2·2
= 4 + 10 + 2 + 4
= 20.
4
X
2 xi = 2 (x1 + x2 + x3 + x4 )
i=1
= 2 (2 + 5 + 1 + 2)
= 2 · 10
= 20.
4
Y
x2i = x21 · x22 · x23 · x24
i=1
= 22 · 52 · 12 · 22
= 4 · 25 · 1 · 4
= 400.
4
!2
Y
xi = (x1 · x2 · x3 · x4 )2
i=1
= (2 · 5 · 1 · 2)2
= 202
= 400.
iv.
4
X
(xi + 2) = x1 + 2 + x2 + 2 + x3 + 2 + x4 + 2
i=1
=2+2+5+2+1+2+2+2
=4+7+3+4
= 18.
4
X
xi + 2 (n − m + 1) = x1 + x2 + x3 + x4 + 2 (4 − 1 + 1)
i=1
=2+5+1+2+2·4
= 10 + 8
= 18.
4
Y
2 xi = 2 x1 · 2 x2 · 2 x3 · 2 x4
i=1
=2·2·2·5·2·1·2·2
= 4 · 10 · 2 · 4
= 320.
A.11. EJERCICIOS 391
4
Y
2n−m+1 xi = 24−1+1 · x1 · x2 · x3 · x4
i=1
= 24 · 2 · 5 · 1 · 2
= 16 · 20
= 320.
v.
4
X
2 = 2 + 2 + 2 + 2 = 8.
i=1
2 (n − m + 1) = 2 (4 − 1 + 1)
=2·4
= 8.
4
Y
2 = 2 · 2 · 2 · 2 = 16.
i=1
2n−m+1 = 24−1+1
= 24
= 16.
A.11. Ejercicios
A.1. Calcular:
a. d.
2 −2

1 7

1 5 1
· ÷ ÷ . % .
4 3 7 2 4
e.
1 1 1
b. 5 − 4+ 20
2 3 2 .
− 17

0.25 · (0.1) 3
.
0.5 · 40 f.
√ √ √ √
(3 2 − 5 3)(2 2 + 3 3).
c.
vq
u 3 125 g.
1
u
27
tq .
u
1 .
4 32 1+ 1+ 1
81 1+ 1 1
1+
2
h. l.
1 1 1 r !
− 2−2 −3 −3 − . 1
2 3 2 log2 .
8
i.
log(0.00001). m.

j.
√ 1
log 31 .
log2
4
64 . 9
k. n.
1
ln (e) + ln e2 + ln e3 .

log0.01 .
10
A.2. Simplicar las siguientes expresiones lo máximo posible:
a. h.
(3xm + 4y n )(3xm − 4y n ).
−3x − (4x + 3y − (2x − y)
− (4x + 2y) − 3x) − 2y. i.
v !8n
b. u m 2m
−2m (y 2 )
t − 124 n x
u
2m
−4m m .
−(5x − (3y − 5x) − (2x − 5y)) y 1 n
x−6m
16
− ((2x − 7y) − (2y − z)).
j.
c. 31
m 2n 3−2n −2m 125x6 y 3m · 8x9 y −12m .
5x2m+1 y −3x3n y

.
d. k.
2x2 −y 2
v
u (−7x−2 )2 (5y)−4
u
x −y
t 1 . 4x2 +y 2
.
1 −4 2
x (−2y 2 )4 4xy +1
9
e. l.
x−y y y2
(x + 2y)(3x − 5y) − (x − y)(x + 2y). − − .
x x + y x(x + y)
f. m.
2x2 + 3x(2x − 3y(x + 2y) − y 2 ). √
3
√
logx x + logy ( 4 y) .
g.
n.

1 x y
xyz xy − yz + xz

x
. logx + logx (xy) .
x−3 yz 2 y
A.3. Resolver los siguientes problemas:
a. Sea a = 2b, 21 b = c y 4c = 3d. ¾Cuál es la razón de d a a?

b. La razón de niños a niñas en un colegio es 2:5. Si 12 niños entraran al colegio entonces la
razón de niños a niñas sería 4:9. ¾Cuántos estudiantes tiene este colegio?
c. Una tienda deportiva ordenó una misma cantidad de bolas de tenis blancas y amarillas.
El almacén solicitó 30 bolas blancas adicionales, haciendo que la razón de bolas blancas a
amarillas sea 6:5. ¾Cuántas bolas de tenis se ordenaron inicialmente?
d. El precio de un artículo disminuye 20 por ciento. ¾Por cuál porcentaje se debe incrementar
el precio del artículo para que vuelva al precio inicial?
e. La cantidad de habitantes de una ciudad se incrementa en 50 por ciento cada 50 años. Si la

cantidad de habitantes en 1950 era 810, ¾en qué año la población era 160?
f. Un hombre compra 10 cajas de naranjas por un total de $80,000. Si este hombre pierde dos
cajas, ¾cuál es el precio al que debe vender el resto de las cajas para obtener una ganancia
del 25 % sobre el costo inicial?
g. El 10 % de las niñas de una clase tienen ojos azules. La razón de niños a niñas en esta clase
es 3:4. ¾Cuál es la fracción de estudiantes en la clase que tienen ojos azules?
A.4. Considerar las siguientes observaciones:
i 1 2 3 4 5 6 7 8 9 10
xi 3 -4 5 6 -1 -4 3 1 0 2
yi 5 1 -2 -1 3 2 7 -2 -12 -7
Por medio de las propiedades correspondientes, calcular las siguientes sumatorias y productorias:
a. e. i.
10 10
!2 10
X Y
3x2i + 1 . x2i · 2yi .
X
2xi − 9 .
i=1 i=1 i=1
b. j.
10 f.
X 2 10 10 2 3
(xi − 2yi ) . X
2
Y xi
(2xi − 9) . −1 .
i=1
i=1 i=1
y i
c.
g. k.
10
X 10 10 2
(5xi − 2yi + 1) . Y Y 1
3x2i − 5. xi yi .
i=1
i=1 i=1
3
d.
h. l.
38
X 10
Y 10
Y yi −1
3x2i 2

(3xi − yi )(2yi + xi ). −5 . .
i=1 i=1 i=1
x−2
i
P38 P38 P38

A.5. Sabiendo que i=1 xi = 7, i=1 yi = −3 y i=1 xi yi = 5, calcular las siguientes sumatorias:
a. b. c.
38
X 38
X 38
X
(8xi − 3). (2xi + 5yi ). (3xi − 3)(2yi + 1).
i=1 i=1 i=1
A.6. Resolver las siguientes ecuaciones:
a. m.
2x 3(1 − 2x) 
3(x − 5) = + . x1 + x2 + x3 = 1

4 6
2x1 + 3x2 + 4x3 = 3
b. 
4x − 1 3x − 1 4x1 + 9x2 + 16x3 = 11.

+2= .
6 8
n.
c. 
2(x + 1) x 2x1 + 3x2 − x3 = 5

+ 4(x − 2) = + 5.
3 2 −x1 + 2x2 + 3x3 = 0

d. 4x1 − x2 + x3 = −1.

(x + 3)(x − 3) = (x + 6)2 .
ñ.
e.
2 4 −10 2x2 − 7x = −3.
− = 2 .
x+3 x−2 x +x−6
o.
f. 1 1
x−2 x−3 x2 − x + = 870 + .
− = 0. 4 4
x+8 x+2
p.
g.
1 1 5 x2 + 2x − 15.
+ = 2 .
x−3 x+2 x −x−6
q.
h.
2 − 2(x − 3) x + 4 2 ln(x) = ln(2) + ln(3x − 4).
− = 3.
2 4
r.
i. √
( x 324
2x = y − 7 2= √
x
.
32
y = 5x + 16.
s.
j.
( 52+3x = 84x−1 .
x+3
y =5
x − y = 9. t.
log8 (x − 6) + log8 (x + 6) = 2.
k. (
5x+3
2y+1 =5 u.
2x − 5y = −5x + 7y. ln x3 − 1 = 1 + ln x2 + x + 1 .

l.
v.
(
x+1
y−2 =6 6
x−3
= 14 . log(x) + = 5.
y+5 log(x)
A.7. Factorizar completamente los siguientes polinomios:
a. b. c.
2a − 1 − x − 2ax. 25x2 y 4 − 121. x2 − 5x − 36.

d. i. ñ.
−3x2 + 6x + 4y − 2xy. x8 + 3x4 + 4.

8a3 − 36a2 b
+ 54ab2 − 27b3 . j. o.
27m6 + 343n9 .
e.
a2 + 4 − 4a − 9b2 .
k.
−35m2 n3 − 70m3 n2 . a2 + 4ab + 4b2 − 1.

p.
12x2 − x − 6.
f. l.
n2 + 28n − 29. b4m
49a10n − . q.
81
g. m.
1 1 + 3a2 − 3a − a3 .
− 4x2m . 3x2 − 5x − 2.
9
n. r.
h.
2 2 3
a − 2a − 35. 27 − 27x + 9x − x . 216 − x12 .
A.8. Demostrar que:
i. ii. iii.
n n n 2
X n(n + 1) X n(n + 1)(2n + 1) X n(n + 1)
i= . i2 = . i3 = .
i=1
2 i=1
6 i=1
2
A.9. El valor absoluto de un número real x, denotado con |x|, se dene como:

x, x ≥ 0;
|x| =
−x, x < 0.
Sean x y y números reales tales que hacen sentido las siguientes operaciones algebraicas. De-
mostrar que se cumplen las siguientes propiedades:
i. iv.
√
|x| = x2 . |x + y| ≤ |x| + |y|.
ii. v.
|x · y| = |x| · |y|. |x| ≤ y ⇔ −y ≤ x ≤ y.
iii. vi.
|x/y| = |x|/|y|. |x| ≥ y ⇔ x ≤ −y ∨ x ≥ y.
A.10. Encontrar el conjunto de valores de x que satisfacen las siguientes desigualdades:

a. g.
4x − 7 < 3x + 5. 3x + 7 > 1 y 2x + 1 < 3.
b. h.
x+5 3x + 7 > 1 o 2x + 1 < −5.
≤ 0.
2x − 1
c. i.
7 |3x − 5| ≥ 1.
> 3.
2x
j.
d. x
1 | − 2| ≤ 6.
≤ 4. 3
3x − 2
k.
e. 1
x2 − x − 12 < 0. | − 3| > 6.
x
f. l.
−3 < 4x − 9 > 11. |3x + 1| < 2|x − 6|.
Referencias electrónicas
Las siguientes son las páginas web de las que se han tomado algunos ejemplos o ejercicios:
http://recursostic.educacion.es/secundaria/edad/4esomatematicasB/radicales/impresos/quincena2.pdf.
http://www.vitutor.com/di/re/r_e.html.
http://es.wikipedia.org/wiki/Factorizaci%C3%B3n.
http://es.wikipedia.org/wiki/Polinomio.
http://www.galeon.com/damasorojas8/BALDOR.pdf.
http://algebrabaldor.webcindario.com/id181.htm.
http://algebrabaldor.webcindario.com/id303.htm.
http://es.wikipedia.org/wiki/Logaritmo.
http://www.mat.uson.mx/~jldiaz/Documents/Derivadas/Repaso_Logaritmos.pdf.
http://www.vitutor.com/al/log/log.html.
http://www.vitutor.com/al/log/ecu1_Contenidos.html.
http://www.x.edu.uy/liceo26/libro/logaritmos.pdf.
http://recursostic.educacion.es/secundaria/edad/3esomatematicas/3quincena3/3eso_quincena3.pdf.
http://www.vitutor.com/ecuaciones/2/ecu_Contenidos.html.
http://huitoto.udea.edu.co/Matematicas/3.4.html.
http://recursostic.educacion.es/secundaria/edad/3esomatematicas/3quincena3/3eso_quincena3.pdf.
http://facultad.bayamon.inter.edu/edavila/PRECALCULO%20%20ARCHIVOS/ECUACIONES%20Y%20FUNCIONES%20LOGARITMICAS.
htm.
Apéndice B
Elementos básicos de conjuntos
B.1. Introducción
En este apéndice se presentan las nociones fundamentales de conjuntos que se usan frecuentemente
en la disciplina estadística. Tales conceptos son esenciales para abordar cualquier teoría y práctica
cuantitativa en la ciencia y sus anes, en especial la estadística, en la que estas ideas son parte
primordial de la teoría de las probabilidades. Aquí se muestran las nociones relacionadas con las
deniciones fundamentales de conjuntos, algunas propiedades asociadas con las operaciones entre
ellos, ciertas observaciones sobre conjuntos numéricos y algunas relaciones entre las funciones y los
conjuntos. La estructura general y parte del contenido de este apéndice ha sido tomado del libro de
probabilidad de Blanco (2004), que ha servido como una excelente guía para ilustrar los conceptos
dados.
B.2. Conceptos generales
A continuación se presentan las generalidades relacionadas con los conjuntos:
Denición B.2.1. Un conjunto es una colección de objetos que a su

vez es considerado como un objeto en sí mismo.
Nota. Aunque no es una norma, es costumbre denotar los conjuntos con las letras mayúsculas del
alfabeto, como A, B , C , y sus elementos con las letras minúsculas, como a, b, c, por ejemplo.
398
B.2. CONCEPTOS GENERALES 399
Los objetos de la colección pueden ser cualquier cosa. Cada uno de ellos es un elemento o miembro
del conjunto que a su vez es denido únicamente por éstos y por nada más. En particular, el orden
en el que se representen los elementos de un conjunto es irrelevante. Además, cada elemento puede
aparecer de manera idéntica una sola vez, esto es, no puede haber elementos totalmente idénticos
repetidos.
Nota. Si A es un conjunto entonces se escribe a ∈ A para indicar que a es un miembro del conjunto
A. Si por el contrario a no es un elemento de A se escribe x ∈
/ A.
Denición B.2.2. Los conjuntos A y B son iguales, lo que se escribe

A = B, si y solo si A y B tienen exactamente los mismos elementos.
Los conjuntos se pueden escribir enumerando todos sus elementos uno por uno o por medio de una
propiedad que todos posean. En el primer caso se dice que el conjunto está dado por extensión y en
el segundo por comprensión .
Ejemplo B.2.1. El conjunto
A = {N, , F, }
está escrito extensivamente, mientras que el conjunto
B = {x : x es un número primo}
está escrito comprensivamente. Además, se observa que
F∈A y H∈
/ A,
mientras que
2∈B y 1∈
/ B,
por ejemplo.
De otra parte, los conjuntos se pueden clasicar como nitos o innitos:
Denición B.2.3. Un conjunto cuyo número de elementos es un número

entero no negativo se llama conjunto nito . En caso contrario se llama
conjunto innito .
Nota. La cantidad de elementos de un conjunto simbolizada con #A, se denomina cardinal de A.

A,
conjunto vacío y se denota con Φ. Además, cuando
El conjunto que no tiene elementos se denomina
#A = 1 se dice que el conjunto A es un conjunto unitario , es decir, A está constituido por un solo
elemento.
400 APÉNDICE B. ELEMENTOS BÁSICOS DE CONJUNTOS
Ejemplo B.2.2. Teniendo en cuenta los conjuntos del ejemplo B.2.1 se observa que A es un conjunto
nito ya que #A = 4, mientras que B es un conjunto innito porque el conjunto de números primos
no es un conjunto nito.
Denición B.2.4. Si todos los elementos del conjunto A son elementos

del conjunto B se dice que A está contenido en B o que A es un
subconjunto de B.
Nota. Cuando el conjunto A está contenido en el conjunto B se escribe A ⊆ B, y en caso contrario,

cuando existe por lo menos un elemento de A que no pertenece a B, se escribe A * B. Además, se
observa que todo conjunto es un subconjunto de si mismo y que el conjunto vacío es un subconjunto
1
de todos los conjuntos. En la gura B.1 se muestra un diagrama de Venn que ilustra la contenencia
entre conjuntos.
Figura B.1: Diagrama de Venn que ilustra un caso en el que A ⊆ B.
Si A y B son conjuntos tales que A⊆B y existe por lo menos un elemento de B que no está en A,
se dice que A es un subconjunto propio de B . Cuando el conjunto A es un subconjunto propio del
conjunto B se escribe A ⊂ B. Por lo tanto, si A ⊂ B entonces A ⊆ B , pero la implicación contraria
no es cierta. ¾El lector puede dar un ejemplo que rectique este hecho?
Nota. Para demostrar que dos conjuntos A y B son iguales es usual demostrar primero que A⊆B y
luego que B ⊆ A.
Ejemplo B.2.3. Sea A un conjunto como en el ejemplo B.2.1. Entonces se tiene que
{, F} ⊆ A pero {♠, N} * A,
por ejemplo.
Nota. En seguida se expresan simbólicamente los aspectos ya mencionados relacionados con la conte-
nencia de conjuntos. Si A y B son dos conjuntos entonces:
1 Los diagramas de Venn son ilustraciones usadas en la teoría de conjuntos. Estos diagramas se usan para mostrar
grácamente la disposición de los conjuntos, representando cada conjunto mediante un círculo, un óvalo o cualquier otra
gura. La posición relativa de tales círculos muestra la relación entre los conjuntos involucrados (Wikipedia 2012c).
B.2. CONCEPTOS GENERALES 401
i. iii.
A ⊆ B ⇔ ∀x ∈ A : x ∈ B. A ⊂ B ⇔ A ⊆ B ∧ ∃x ∈ B : x ∈
/ A.
ii. iv.
A * B ⇔ ∃x ∈ A : x ∈
/ B. A = B ⇔ A ⊆ B ∧ B ⊆ A.
El símbolo ⇔ se lee si y solo si y representa una equivalencia entre dos expresiones lógicas. Los
símbolos ∀ y∃ se leen respectivamente para todo y existe. Y los símbolos ∧ y ∨ son conectores
lógicos y se leen respectivamente y y o.
Denición B.2.5. Se denen las partes de un conjunto A como el

conjunto conformado por todos los subconjuntos de A.
2
Nota. Las partes del conjunto A es un conjunto de conjuntos denotado con PA dado por
PA = {X : X ⊆ A}.
A partir de la denición B.2.5 es claro que para cualquier conjunto A se tiene que Φ ∈ PA y A ∈ PA .
Ejemplo B.2.4. Las partes del conjunto A = {a, b, c} son:
PA = {Φ; {a}; {b}; {c}; {a, b}; {a, c}; {b, c}; A}.
Se observa que los elementos de PA son conjuntos.
Proposición B.2.1. Sea A un conjunto con n elementos. Entonces la cantidad de subconjuntos de
A es
#PA = 2n ,
y además el número de subconjuntos de A con r elementos, con r ≤ n, es
n!
r!(n − r)!
donde n! corresponde al producto de todos los enteros desde 1 hasta n.
Nota. La expresión ! se llama factorial y se estudia con cierto detalle en la sección A.4.
Ejemplo B.2.5. En el ejemplo B.2.4 se observa que la cantidad de subconjuntos del conjunto A es
#PA = 23 = 8,
y además el número de subconjuntos de A con dos elementos es
3! 3·2·1
= = 3,
2!(3 − 2)! (2 · 1)(1)
por ejemplo.
2 Conjunto cuyos elementos son a su vez conjuntos.
En las aplicaciones de teoría de conjuntos es usual que todos los conjuntos de interés sean subconjuntos
de un conjunto mayor a todos. A este gran conjunto se le llama conjunto universo y se denota con
U.
B.3. Operaciones entre conjuntos
En esta sección se presentan las operaciones básicas entre conjuntos, a saber, la unión, la intersección,
la diferencia, la diferencia simétrica y el complemento.
Denición B.3.1. La unión de dos conjuntos A y B , denotada con

A ∪ B, es el conjunto conformado por los elementos de A, o de B o de
ambos. Es decir:
A ∪ B = {x : x ∈ A ∨ x ∈ B}.
Nota. De la misma forma, si A1 , A2 , . . . , An son n conjuntos entonces la unión de todos ellos está
dada por:
n
[
Ai = A1 ∪ A2 ∪ . . . ∪ An = {x : x ∈ Ai para algún i = 1, 2, . . . , n}.
i=1
Denición B.3.2. La intersección de dos conjuntos A y B , denotada

con A ∩ B , es el conjunto conformado únicamente por los elementos de
A y de B . Es decir:
A ∩ B = {x : x ∈ A ∧ x ∈ B}.
Nota. De la misma forma, si A1 , A2 , . . . , An son n conjuntos entonces la intersección de todos ellos

está dada por:
n
\
Ai = A1 ∩ A2 ∩ . . . ∩ An = {x : x ∈ Ai para todo i = 1, 2, . . . , n}.
i=1
De otra parte, si A y B son dos conjuntos tales que A∩B = Φ entonces se dice que A y B son
excluyentes o disjuntos . En la gura B.2 se muestra un ejemplo de un par de conjuntos con esta
característica.
B.3. OPERACIONES ENTRE CONJUNTOS 403
Figura B.2: Diagrama de Venn asociado con un par de conjuntos disjuntos.
Denición B.3.3. La diferencia de dos conjuntos A y B, denotada

con A − B, es el conjunto conformado por los elementos de A que no
pertenecen a B. Es decir:
A − B = {x : x ∈ A ∧ x ∈
/ B}.
Nota. Se observa que la diferencia de conjuntos no es conmutativa, esto es, A − B 6= B − A. ¾El lector
puede dar un ejemplo que rectique este hecho?
Denición B.3.4. La diferencia simétrica de dos conjuntos A y B,

denotada con A4B , es el conjunto conformado por los elementos de A
o de B, pero no de ambos. Es decir:
A4B = {x : (x ∈ A ∧ x ∈
/ B) ∨ (x ∈
/ A ∧ x ∈ B)}.
Denición B.3.5. El complemento de un conjunto A respecto al con-

junto universo U , denotado con AC , es el conjunto conformado por todos
los elementos que pertenecen a U pero que no están en A. Es decir:
AC = {x : x ∈ U ∧ x ∈
/ A}.
Proposición B.3.1. Sean A, B y C subconjuntos de un conjunto universo U. Entonces se cumplen

las siguientes leyes:
i. Leyes conmutativas: a. A ∪ (B ∪ C) = (A ∪ B) ∪ C = A ∪ B ∪ C .
a. A ∪ B = B ∪ A. b. A ∩ (B ∩ C) = (A ∩ B) ∩ C = A ∩ B ∩ C .
b. A ∩ B = B ∩ A. iii. Leyes distributivas:

ii. Leyes asociativas: a. A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
b. A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C). d. A − (B − C) = (A − B) ∪ (A − C).
c. (A ∪ B) − C = (A − C) ∪ (B − C). e. A − (B ∪ C) = (A − B) ∩ (A − C).
iv. Leyes complementarias: f. (A − B) ∪ (A ∩ B) = A.
a. A ∪ AC = U . g. (A − B) ∩ (A ∩ B) = Φ.
b. A ∩ AC = Φ. vi. Leyes de De-Morgan:

c. A ∪ U = U.
a. (A ∪ B)C = AC ∩ B C .
d. A ∩ U = A.
b. (A ∩ B)C = AC ∪ B C .
e. A ∪ Φ = A.
f. A ∩ Φ = Φ. vii. Leyes de idempotencia:
v. Leyes de la diferencia: a. A ∪ A = A.
a. A − B = A ∩ BC . b. A ∩ A = A.
b. A − B = A − (A ∩ B). viii. Ley involutiva:
C
c. A − B = (A ∪ B) − B . AC = A.
En la gura B.3 se muestran los diagramas de Venn para las operaciones entre conjuntos.
Ejemplo B.3.1. Sean A = {1, 2, 3, 4, 5, 6, 7} y B = {2, 4, 6, 8} dos subconjuntos del conjunto universo
U = {1, 2, 3, 4, 5, 6, 7, 8, 9}. Escribir extensivamente:
a. c. e.
A ∪ B. A − B. A M B.
b. d. f.
A ∩ B. B − A. AC .
Solución:
a. d.
A ∪ B = {1, 2, 3, 4, 5, 6, 7, 8}. B − A = {8}.
b. e.
A ∩ B = {2, 4, 6}. A M B = {1, 3, 5, 7, 8}.
c. f.
A − B = {1, 3, 5, 7}. AC = {8, 9}.
Se observa que B−A es un subconjunto unitario de U.

B.3. OPERACIONES ENTRE CONJUNTOS 405
Ejemplo B.3.2. Sean A y B subconjuntos de un conjunto universo U. Utilizando las leyes de la

proposición B.3.1, reducir lo máximo posible:
C C
A ∩ BC ∪B .
Solución:
C C C C
A ∩ BC ∪B = AC ∪ B C ∪ B
C
= AC ∪ B ∪ B
C
= AC ∪ (B ∪ B)
C
= AC ∪ B
C
= AC ∩ B C
= A ∩ BC .
Figura B.3: Diagramas de Venn para las operaciones entre conjuntos. De izquierda a derecha y de arriba a abajo:
A ∪ B , A ∩ B , A − B , B − A, A4B y AC .
Denición B.3.6. Sea A = {A1 , A2 , . . . , An } una colección de subcon-

juntos de un conjunto universo U . Se dice que A es una partición de
U si se satisface que:
i. ∀i = 1, 2, . . . , n : Ai 6= Φ.
ii. ∀i, j = 1, 2, . . . , n, i 6= j : Ai ∩ Aj = Φ.
Sn
iii. i=1 Ai = U .
Nota. De otra forma, la denición B.3.6 establece que los subconjuntos de una partición de un conjunto
universo U deben ser tales que: i. ninguno de ellos sea vacío, ii. todos sean disjuntos dos a dos y iii. la
unión de todos ellos debe ser igual a U.
Ejemplo B.3.3. Sea U como en el ejemplo B.3.1. La colección de subconjuntos
A = {{5, 7, 9}, {2, 4, 6, 8}, {1, 3}}

es una partición de U dado que:
i. {5, 7, 9} =
6 Φ, {2, 4, 6, 8} =
6 Φ y {1, 3} =
6 Φ.
ii. {5, 7, 9} ∩ {2, 4, 6, 8} = Φ, {5, 7, 9} ∩ {1, 3} = Φ y {2, 4, 6, 8} ∩ {1, 3} = Φ.
iii. {5, 7, 9} ∪ {2, 4, 6, 8} ∪ {1, 3} = U .
B.4. Conjuntos numéricos
A continuación se muestran algunas generalidades sobre conjuntos numéricos, desde los números na-
turales hasta los números complejos.
Denición B.4.1. El conjunto de los números naturales , denotado

con N, es el conjunto conformado por los números para contar. Esto es:
N = {1, 2, 3, 4, . . .}.
Nota. Puesto que los números naturales se utilizan para contar objetos, el 0 puede considerarse el
número que corresponde a la ausencia de los mismos. Dependiendo del autor y de la tradición, el
conjunto de los números naturales puede presentarse con o sin el 0. Además, se dice que el conjunto
3
de los números naturales es un conjunto innito numerable .
Denición B.4.2. El conjunto de los números enteros , denotado con

Z, es el conjunto conformado por los números naturales, los opuestos
aritméticos de éstos y el 0. Esto es:
Z = {. . . , −4, −3, −2 − 1, 0, 1, 2, 3, 4, . . .}.
3 Un conjunto se llama numerable cuando existe una función biyectiva (detalles en la sección C.2) entre dicho
conjunto y el conjunto de los números naturales o un subconjunto nito del mismo. En caso contrario se dice que el
conjunto es no numerable . Se observa que todo conjunto no numerable es un conjunto innito.
B.4. CONJUNTOS NUMÉRICOS 407
Nota. Al igual que el conjunto de los números naturales, el conjunto de los números enteros también
4
es un conjunto innito numerable . Además, se observa que N ⊂ Z, es decir, todo número natural es
un número entero.
Denición B.4.3. El conjunto de los números racionales , denotado

con Q, es el conjunto conformado por todos los números dados por el
cociente entre un número entero y un numero natural. Esto es:
na o
Q= :a∈Z∧b∈N .
b
Nota. Al igual que el conjunto de los números enteros, el conjunto de los números racionales también
es un conjunto innito numerable. Además, se observa que Z ⊂ Q, es decir, todo número entero es un
número racional.
Todo número racional admite una representación decimal, obtenida al dividir el numerador entre el
denominador. Esto da lugar a dos tipos de expresiones decimales, a saber, las exactas y las periódicas.
1 1
Por ejemplo,
2 = 0.5 es una expansión decimal exacta y
3 = 0.33333 . . . es una expansión decimal
periódica.
Denición B.4.4. El conjunto de los números irracionales , deno-

tado con I, es el conjunto conformado por todos los números que no
son racionales, es decir, aquellos que no pueden ser expresados como el
cociente entre un número entero y un número natural.
Nota. El conjunto de los números irracionales es un conjunto innito no numerable. Además, se observa
que Q ∩ I = Φ.
De esta forma, los números irracionales no admiten una representación decimal exacta o periódica
y por lo tanto tales números tienen una expansión decimal innita no periódica. En general, toda
expresión decimal de los números irracionales es solo una aproximación en números racionales al
número irracional referido. Por ejemplo, el número racional 1.4142135 es una aproximación a siete cifras
√
decimales del número irracional
√ 2, el cual posee innitas cifras decimales no periódicas. Entonces,
√
se dice que 2 es aproximadamente igual a 1.4142135, lo que se escribe 2 ≈ 1.4142135. Debido a
4 Se puede demostrar que la función f : Z → N dada por:


 2n, si n ∈ N;
f (n) = 1, si n = 0;
2(−n) + 1, si n ∈ Z − (N ∪ {0}) .

es una función biyectiva entre Z y N.

5
ello, los números irracionales más conocidos son identicados mediante símbolos especiales . Además,
los números irracionales se clasican en dos tipos, a saber, los algebraicos y los trascendentes. Por
√
ejemplo, 2 es un número irracional algebraico y π es un número racional trascendente. Queda como
ejercicio para el lector profundizar más sobre esta clasicación.
Denición B.4.5. El conjunto de los números reales , denotado con

R, es el conjunto conformado por los números racionales y los números
irracionales. Esto es:
R = {x : x ∈ Q ∨ x ∈ I}.
Nota. El conjunto de los números reales es un conjunto innito no numerable. Además, se observa
que Q ⊂ R, I ⊂ R y R = Q ∪ I.
El conjunto de los números reales incluye a todos los conjuntos numéricos descritos hasta el momento
y a su vez hace parte de un conjunto de números más general denominado conjunto de los números
complejos . Este conjunto se denota con
√ C y está conformado por los números de la forma a + bi
donde a y b son números reales e i = −1 es la unidad imaginaria . De esta forma, el conjunto
de los números complejos está conformado por los números reales (números de la forma a + 0i), los
números imaginarios puros (números de la forma 0 + bi con b 6= 0) y los números complejos mixtos
(números de la forma a + bi con a 6= 0 y b 6= 0).
A continuación se denen algunos conjuntos de uso frecuente en el cálculo y la estadística:
Denición B.4.6. Sean a y b números reales tales de a ≤ b. Se denen

los intervalos :
(a, b) = {x ∈ R : a < x < b}, [a, b] = {x ∈ R : a ≤ x ≤ b},
(a, b] = {x ∈ R : a < x ≤ b}, [a, b) = {x ∈ R : a ≤ x < b},

(a, ∞) = {x ∈ R : x > a}, [a, ∞) = {x ∈ R : x ≥ a},
(−∞, b) = {x ∈ R : x < b}, (−∞, b] = {x ∈ R : x ≤ b}.
Nota. Los símbolos −∞ y ∞ se leen respectivamente menos innito y más innito y no son números
reales. Además, el intervalo (−∞, ∞) coincide con R.
5 Tres números irracionales muy conocidos son: el número π ≈ 3.1415 que corresponde a la razón entre la longitud
1 n

de una circunferencia y su diámetro; el número e ≈ 2.7182 que corresponde a lı́mn→∞ 1 + (detalles en la sección
√ n
C.3); y el número φ ≈ 1.6180 que corresponde a la proporción áurea dada por (1 + 5)/2.
B.5. FUNCIONES Y CONJUNTOS 409
B.5. Funciones y conjuntos
En esta sección se presentan algunos conceptos asociados con las funciones y los conjuntos.
Denición B.5.1. f : A → B una función denida entre el conjunto

Sea
A y el conjunto B. C
es un subconjunto de B entonces el conjunto de
Si
elementos de A cuyas imagines son elementos de C , se denomina imagen
inversa de C por f y se denota con f −1 (C). Esto es:
f −1 (C) = {x ∈ A : f (x) ∈ C}.
Análogamente, si D es un subconjunto de A entonces al subconjunto de

B cuyos elementos son las imágenes de los elementos de D por f se llama
imagen directa de D por f y se denota con f (D). Esto es:
f (D) = {f (x) : x ∈ D}.
Nota. No se debe confundir la notación de la imagen inversa de un subconjunto C por una función f
−1
simbolizada con f (C), con la inversa de una función evaluada en x denotada con f −1 (x) (detalles
en la sección C.2).
Ejemplo B.5.1. Sea f :R→R una función dada por f (x) = x2 + 1. Hallar:
a. b.
f −1 ([17, ∞)) . f ((0, 1]) .
Solución:
a.
f −1 ([17, ∞)) = {x ∈ R : f (x) ∈ [17, ∞)}

= {x ∈ R : f (x) ≥ 17}
= {x ∈ R : x2 + 1 ≥ 17}
= {x ∈ R : x2 ≥ 16}
= {x ∈ R : x ≤ −4 ∨ x ≥ 4}
= (−∞, −4] ∪ [4, ∞).
b.
f ((0, 1]) = {f (x) : x ∈ (0, 1]}

= {x2 + 1 : x ∈ (0, 1]}

= (f (0), f (1)]
= (02 + 1, 12 + 1]
= (1, 2].
Algunas de las propiedades más importantes de las imagen inversa de conjuntos por una función están
resumida a continuación:
Proposición B.5.1. Sea f : A → B una función denida entre el conjunto A y el conjunto B. Si N,

N1 y N2 son subconjuntos de B entonces:
i. iii.
−1

f f (N ) ⊆ N.
f −1 (N1 ∩ N2 ) = f −1 (N1 ) ∩ f −1 (N2 ).
ii. iv. Si N1 ⊆ N2 se sigue que
f −1 (N1 ∪ N2 ) = f −1 (N1 ) ∪ f −1 (N2 ). f −1 (N1 ) ⊆ f −1 (N2 ).
B.6. Ejercicios
B.1. Demostrar que si A y B son dos conjuntos tales que A⊆B entonces:
a. A ∪ B = B. b. A ∩ B = A. c. A − B = Φ. d. A4B = B − A.
B.2. Sean A, B y C subconjuntos de un conjunto universo U. Reducir lo máximo posible:
a. b.
C
C C 4 A − BC ∪ C . AC ∪ B 4 C C − B .

B.3. Demostrar que si A1 , A2 , . . . , An son n subconjuntos de un conjunto universo U entonces se

satisface que:
B.6. EJERCICIOS 411
a. b.
n
!C n n
!C n
[ \ \ [
Ai = AC
i . Ai = AC
i .
i=1 i=1 i=1 i=1
B.4. Demostrar que si A1 y A2 son colecciones de subconjuntos de un conjunto universo U tales que
A1 ⊆ A2 entonces
∩A2 ⊆ ∩A1 ⊆ ∪A1 ⊆ ∪A2
donde
∩Ai = {x : x ∈ X para todo X ∈ Ai } y ∪ Ai = {x : x ∈ X para algún X ∈ Ai }
para i = 1, 2.
B.5. Demostrar que si A es una partición de un conjunto universo U y P ⊆ U, entonces
AP = {X ∩ P : X ∈ A}
es una partición de P.
B.6. Realizar un diagrama de Venn de N, Z, Q, I, R y C.

Apéndice C
Elementos básicos de cálculo
C.1. Introducción
En este apéndice se presentan las nociones fundamentales del cálculo usadas frecuentemente en la
disciplina estadística. Tales ideas se presentan con el propósito de facilitar la aproximación del lector a
las probabilidades desde la perspectiva de las variables aleatorias continuas. En este apéndice, basado
principalmente en el libro de cálculo de una variable de Thomas (2006) de donde se han tomado
textualmente variados conceptos y ejemplos se muestran los aspectos teóricos del cálculo univariado
relacionados con las funciones, los límites las derivadas y las integrales. Se deja como ejercicio para el
lector que consulte todas las demostraciones de las proposiciones dadas en este apéndice.
C.2. Funciones
Las funciones representan el principal objeto de análisis en el cálculo y la estadística, ya que constituyen
la clave para describir los fenómenos del mundo real en términos matemáticos. Cuando el valor de una
cantidad variable y depende y está totalmente determinado por el valor de otra cantidad variable x de
un conjunto (detalles en el apéndice B), se dice que y es una función de la variable x. Frecuentemente
el valor de y está dado por una fórmula que indica como calcularlo a partir del valor de x. Una manera
simbólica de expresar y es una función de la variable x consiste en escribir
y = f (x)
donde f representa la función. Aquí, la variable x se denomina variable independiente y la variable

y se llama variable dependiente .
412
C.2. FUNCIONES 413
Denición C.2.1. Una función f denida entre un conjunto A y un

conjunto B, denotada con f : A −→ B , es una regla que asigna un
elemento único y∈B a cada elemento x ∈ A.
Nota. En la denición C.2.1, el conjunto A se llama dominio de la función y el conjunto de todos

los valores de y a medida que x varia en A se denomina rango , esto es, el conjunto dado por {y ∈ B :
y = f (x)}, de la función, que puede o no coincidir con todos los elementos del conjunto A. Además,
cuando el rango de una función es un subconjunto de los números reales, se dice que la función es una
función de valor real 1
.
Ejemplo C.2.1. En la tabla C.1 se muestran el dominio y el rango de algunas funciones y en la gura
2
C.1 se presenta la gráca de cada una de ellas.
Función Dominio Rango Tipo

f1 (x) = x2 (−∞, ∞) [0, ∞) Polinomial
f2 (x) = 1/x (−∞, ∞) − {0} (−∞, ∞) − {0} Racional
√
f3 (x) = x [0, ∞) [0, ∞) Exponencial
f4 (x) = sin(x) (−∞, ∞) [0, 1] Trigonométrica
f5 (x) = ex (−∞, ∞) (0, ∞) Exponencial
f6 (x) = ln(x) (0, ∞) (−∞, ∞) Logarítmica
Tabla C.1: Dominio, rango y clasicación de algunas funciones.
Los siguientes son algunos tipos de funciones:
• Una función polinomial es una función de la forma
f (x) = an xn + an−1 xn−1 + . . . + a1 x + a0
donde a0 , a1 , . . . , an−1 , an son números reales con an 6= 0 y n es un entero no negativo que

se denomina grado del polinomio (detalles en la sección A.7). Las funciones lineales son
funciones polinomiales de grado 1, las funciones cuadráticas son funciones polinomiales de
grado 2, etc. El dominio de todas las funciones polinomiales es el conjunto de los números reales.
• Una función racional es una función de la forma
p(x)
f (x) =
q(x)
donde p(x) y q(x) son funciones polinomiales. El dominio de una función racional es {x ∈ R :
q(x) 6= 0}, es decir, el conjunto de todos lo números reales tales que q(x) 6= 0.
1 En este apéndice todas las funciones los son.
2 La gráca de una función y = f (x) consiste en el conjunto de todos los puntos en el plano cartesiano cuyas
coordenadas son (x, f (x)) donde x es cualquier valor del dominio de la función.
414 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
Figura C.1: Grácas de las funciones de la tabla C.1.
• Una función algebraica es una función constituida a partir de polinomios usando las operacio-
3
nes algebraicas . Las funciones polinomiales y racionales son un caso particular de las funciones
algebraicas.
• Lasfunciones trigonométricas , a saber, sin(x), cos(x), tan(x), cot(x), sec(x) y csc(x).

• Una función exponencial es una función de la forma
f (x) = bx
donde b es un número real positivo tal que b 6= 1 denominado base . El dominio y el rango de
todas las funcione exponenciales es (−∞, ∞) y (0, ∞) respectivamente.
• Una función logarítmica es una función de la forma
f (x) = logb (x)
donde b es una base (detalles en la sección A.9). Las funciones logarítmicas son las funciones
inversas de las funciones exponenciales. El dominio y el rango de todas las funciones logarítmicas
es (0, ∞) y (−∞, ∞) respectivamente.
3 Suma, resta, multiplicación, división y potenciación.

C.2. FUNCIONES 415
• Una función trascendente es una función no algebraica. Entre ellas se encuentran las funciones
trigonométricas, las exponenciales y las logarítmicas.
En la tabla C.1 se presenta la clasicación de algunas funciones.
Denición C.2.2. Una función y = f (x) es una función par si y solo

si f (−x) = f (x). De otra parte, una función y = f (x) es una función
impar si y solo si f (−x) = −f (x).
Ejemplo C.2.2. La función f1 (x) = x2 es una función par dado que f1 (−x) = (−x)2 = x2 , mientras
3
que la función f2 (x) = x es una función impar puesto que f2 (−x) = (−x)3 = −x3 . En la gura C.2
se presenta la gráca de ambas funciones.
Nota. La gráca de una función par es simétrica respecto al eje y y la gráca de una función impar
4
es simétrica respecto al origen .
Figura C.2: Grácas de las funciones del ejemplo C.2.2.
A continuación se denen algunos tipos de funciones que satisfacen ciertas propiedades especiales en
relación con el dominio y el rango:
4 Punto en el plano cartesiano de coordenadas (0,0).

Denición C.2.3. Sea f : A → B una función denida entre el conjunto

A y el conjunto B. Entonces:
i. Se dice que f es una función inyectiva o uno-a-uno si para cada

par de elementos a1 y a2 de A tales que f (a1 ) = f (a2 ) se sigue que
a1 = a2 .
ii. Se dice que f es una función sobreyectiva si para cada elemento b

de B, existe un elemento a de A tal que f (a) = b.
iii. Se dice que f es biyectiva si para cada elemento b de B, existe un

único elemento a de A tal que f (a) = b.
Nota. Usando la notación de la denición C.2.3, las funciones inyectivas también se pueden denir
como sigue: se dice que f es una función inyectiva si para cada par de elementos a1 y a2 de A tales que
a1 6= a2 se sigue que f (a1 ) 6= f (a2 ). ¾Por qué estas dos deniciones de función inyectiva coinciden?
Además, toda función biyectiva es tanto inyectiva como sobreyectiva.
Ejemplo C.2.3. Demostrar que la función f : (0, ∞) → R denida por f (x) = ln(x) es biyectiva.
Solución:
Esta función es inyectiva puesto que si x1 y x2 son un par de elementos de (0, ∞) tales que f (x1 ) =
f (x2 ) entonces:
ln(x1 ) = ln(x2 )
eln(x1 ) = eln(x2 )
x1 = x2 .
Además, esta función también es sobreyectiva porque para cualquier número real y , existe un número
real positivo x tal que ln(x) = y , a saber, x = ey . En consecuencia, se sigue que f es biyectiva dado
que f es tanto inyectiva como sobreyectiva.
Ejemplo C.2.4. La función f : R → R dada por f (x) = x2 no es inyectiva ya que para todo número
real x se tiene que f (x) = f (−x). Además, esta función tampoco es sobreyectiva porque no existe
ningún número real que tenga como imagen un número real negativo dado. No obstante, si la función
f (x) = x2 se redene de forma tal que f : [0, ∞) → [0, ∞) entonces se sigue que f es biyectiva. Queda
como ejercicio para el lector demostrar este hecho.
Proposición C.2.1. Sea f :A→B una función denida entre el conjunto A y el conjunto B.
i. Si f es inyectiva entonces #A ≤ #B .
ii. Si f es sobreyectiva entonces #A ≥ #B .
iii. Si f es biyectiva entonces #A = #B .

C.2. FUNCIONES 417
Como cada valor de una función uno-a-uno proviene de una y solo una entrada, el efecto de la función
se pude invertir, enviando la salida de regreso a la entrada de la que vino bajo la función.
Denición C.2.4. Sea y = f (x) una función inyectiva con dominio A y

rango R. Se dene la función inversa de f , denotada con f −1 , como
la función dada por:
f −1 (b) = a siempre que f (a) = b,
donde a y b son elementos de A y R respectivamente.
Nota. Es claro que el dominio y el rango de la función f −1 de la denición C.2.4 son respectivamente
el rango y el dominio de f. Además, no se debe confundir la notación de la imagen inversa de un
subconjunto C por una función f simbolizada con f −1 (C) (detalles en la sección B.5), con la inversa
−1
de una función evaluada en x denotada con f (x).
Ejemplo C.2.5. Determinar la función inversa de f (x) = e2x + 1.
Solución:
Haciendo y = f (x) se sigue que:
y = e2x + 1
y − 1 = e2x
ln(y − 1) = ln e2x

ln(y − 1) = 2x
ln(y − 1)
=x
2
y por lo tanto
ln(x − 1)
f −1 (x) =
2
−1
para x > 1. En la gura C.3 se muestra la gráca de f y f . En la parte superior de la recta se
−1
observa la gráca de f y en la pare inferior la gráca de f . Se observa que cada curva es el reejo
de la otra respecto a la recta y = x.
Nota. Si f es una función inyectiva y x es un punto del dominio de f entonces se sigue que
f −1 ◦ f (x) = x.

Como los números, las funciones también se pueden sumar, restar, multiplicar y dividir excepto
cuando el denominador es 0 para obtener nuevas funciones. Si f (x) y g(x) son funciones entonces
Figura C.3: Grácas de las funciones del ejemplo C.2.5.
para toda x que pertenezca al dominio de ambas funciones y siempre que g(x) 6= 0 en el caso del
cociente se denen las funciones f + g, f − g, f g y f /g como sigue:
(f + g)(x) = f (x) + g(x),

(f − g)(x) = f (x) − g(x),
(f g)(x) = f (x)g(x),
f (x)
(f /g) (x) = .
g(x)
Las funciones también se pueden multiplicar por un número real. Si f (x) es una función y c es un
número real entonces para toda x en el dominio de f se dene:
(cf )(x) = cf (x).
La composición es otra forma de combinar funciones:

C.2. FUNCIONES 419
Denición C.2.5. Sean f (x) y g(x) funciones tales que el rango de g(x)
es un subconjunto del dominio de f (x). Se dene la composición entre
f (x) y g(x), denotada con f ◦ g , como
(f ◦ g)(x) = f (g(x)).
Nota. El dominio de la función f ◦g está conformado por todos los números reales x del dominio
de g para los que g(x) está denida en el dominio de f. Además, la composición de funciones no es
conmutativa, es decir,
f ◦ g 6= g ◦ f.
¾El lector puede dar un ejemplo que rectique este hecho?
Las operaciones aritméticas y la composición entre funciones se puede extender a un caso más general
en el que se operen tres o más funciones. Por ejemplo:
n
! n
X X
fi (x) = fi (x)
i=1 i=1
donde f1 (x), f2 (x), . . . , fn (x) son n funciones.
Ejemplo C.2.6. Sean f (x) = x2 , g(x) = 2x + 1 y c= 2

3 . Hallar:
a. d.
(cf )(x). (f g)(x).
b. e.
(f + g)(x). (f /g) (x).
c. f.
(f − g)(x). (f ◦ g)(x).
Solución:
a. = x2 + 2x + 1.
(cf )(x) = cf (x) c.
2 (f − g)(x) = f (x) − g(x)

= x2 .
3
= x2 − (2x + 1)
b. = x2 − 2x − 1.
d.
(f + g)(x) = f (x) + g(x)
2
= x + (2x + 1) (f g)(x) = f (x)g(x)
= x2 (2x + 1) f.
3 2
= 2x + x .
(f ◦ g)(x) = f (g(x))
e. = f (2x + 1)
f (x) = (2x + 1)2 .
(f /g)(x) =
g(x)
x2
= .
2x + 1
C.3. Límites
El concepto de límite es fundamental en cálculo y la estadística dado que no son pocos los operado-
res matemáticos y los fenómenos naturales que se fundamentan en este concepto. Intuitivamente, si
y = f (x) es una función denida en un intervalo abierto alrededor de un número real x0 , excepto,
posiblemente, en el mismo punto x0 , cuando f (x) se acerca tanto como se quiera al número real L
para toda x lo sucientemente cerca de x0 , se dice que f (x) se aproxima a L cuando x se acerca a x0 .
Denición C.3.1. Sea y = f (x) una función denida en un intervalo

abierto alrededor de un número real x0 , excepto, posiblemente, en el
mismo punto x0 . Se dice que el límite de f (x) cuando x tiende a x0 es
el número real L, lo que se escribe
lı́m f (x) = L,
x→x0
si, para cada número > 0, existe un número δ>0 tal que, para toda
x, se tiene que
0 < |x − x0 | < δ ⇒ |f (x) − L| < .
Nota. En la denición C.3.1, el valor de δ no es único y depende del valor de . Además, cualquier
valor menor a un δ que cumpla la condición dada satisface la implicación requerida.
Ejemplo C.3.1. Demostrar que
lı́m (2x + 1) = 3.
x→1
Solución:
C.3. LÍMITES 421
Siguiendo la denición C.3.1 se tiene que x0 = 1, f (x) = 2x + 1 y L = 3. Así, para cualquier >0
dado, se debe encontrar un número δ>0 tal que, para todax, se siga que
0 < |x − 1| < δ ⇒ |f (x) − 3| < .
Para determinar δ , se trabaja hacia atrás a partir de la última desigualdad de tal forma que sea posible
identicar un posible valor de δ . De esta forma:
|f (x) − 3| < ⇔ |(2x + 1) − 3| <

⇔ |2x − 2| <
⇔ |2(x − 1)| <
⇔ |2||x − 1| <

⇔ |x − 1| < .
2
Por lo tanto, es posible seleccionar δ = /2, o cualquier otra cantidad menor que /2. Luego, dado
> 0, se tiene que:

0 < |x − 1| < ⇒ 0 < 2|x − 1| <
2
⇒ 0 < |2(x − 1)| <
⇒ 0 < |2x − 2| <
⇒ 0 < |2x + 1 − 3| <
⇒ 0 < |f (x) − 3| < .
Esto prueba que lı́mx→1 (2x + 1) = 3.
Proposición C.3.1. Sic es un número real y f (x) = an xn +an−1 xn−1 +. . .+a1 x+a0 es una función
polinomial de grado n donde a0 , a1 , . . . , an son números reales con an 6= 0 y n es un número entero
no negativo, entonces
lı́m f (x) = an cn + an−1 cn−1 + . . . + a1 c + a0 .
x→c
Ejemplo C.3.2. Calcular:
x2 − 3x + 1 .

lı́m
x→−1
Solución:
Como f (x) = x2 − 3x + 1 es una función polinomial de grado de 2, entonces el límite se obtiene

evaluando directamente en la función como sigue:
lı́m (x2 − 3x + 1) = (−1)2 − 3(−1) + 1 = 5.

x→−1

Proposición C.3.2. Si p(x) y q(x) son funciones polinomiales y c es un número real tal que q(c) 6= 0,
entonces
p(x) p(c)
lı́m = .
x→c q(x) q(c)
x2 − 3x + 5
lı́m .
x→2 x−1
Solución:
x2 −3x+5 p(x) 2
Como f (x) = x−1 es una función de la forma
q(x) donde p(x) = x − 3x + 5 y q(x) = x − 1
son funciones polinomiales con q(2) 6= 0, entonces el límite se obtiene evaluando directamente en la
función como sigue:
x2 − 3x + 5 22 − 3(2) + 5
lı́m = = 3.
x→2 x−1 2−1

A continuación se introducen algunas reglas que permiten calcular límites de funciones que son com-
binaciones aritméticas de otras funciones cuyos límites ya se conocen:
Proposición C.3.3. Sean c y k números reales, y f (x) y g(x) dos funciones cuyos límites existen.
Entonces, donde las funciones correspondientes hagan sentido, se cumplen las siguientes reglas de los
límites:
i) Regla del límite de una función constante:

lı́m (k) = k.
x→c
ii) Regla del límite del múltiplo constante:

lı́m (kf (x)) = k lı́m f (x).
x→c x→c
iii) Regla del límite de una suma:

lı́m (f (x) + g(x)) = lı́m f (x) + lı́m g(x).
x→c x→c x→c
iv) Regla del límite de un producto:

lı́m (f (x)g(x)) = lı́m f (x) · lı́m g(x) .
x→c x→c x→c
v) Regla del límite de un cociente:

f (x) lı́mx→c f (x)
lı́m =
x→c g(x) lı́mx→c g(x)
siempre que lı́mx→c g(x) 6= 0.
C.3. LÍMITES 423
vi) Regla del límite de la potencia:

r
rs
lı́m (f (x)) s = lı́m f (x)
x→c x→c
siempre que las operaciones asociadas hagan sentido, donde r y s son números enteros sin factores
comunes con s 6= 0.
Nota. Al combinar las reglas de la suma y del múltiplo constante, se obtiene la regla del límite de
una diferencia :
lı́m (f (x) − g(x)) = lı́m f (x) − lı́m g(x).
x→c x→c x→c
a. p d.
lı́m 4x2 − 3. lı́m 3(2x − 1)2 .
x→−2 x→−2
e. √
b. 3

p
lı́m 3 x(3x − 1)2 . lı́m x2 − x + 1 .
x→0
x→1
c. f.
x+2
lı́m (x − 5)(x − 7). lı́m √ .
x→6 x→−3 x2+7−3
Solución:
a.
p q
lı́m 4x2 − 3 = lı́m (4x2 − 3)
x→−2 x→−2
p
= 4(−2)2 − 3
√
= 13.
b.
p q
3
lı́m x(3x − 1)2 = 3 lı́m (x(3x − 1)2 )
x→1 x→1
r
= 3 lı́m (x) · lı́m (3x − 1)2
x→1 x→1
r 2
3
= (1) lı́m (3x − 1)
x→1
q
3 2
= (3(1) − 1)
√
3
= 4.
c.

lı́m (x − 5)(x − 7) = lı́m (x − 5) · lı́m (x − 7)
x→6 x→6 x→6
= (6 − 5) (6 − 7)
= −1.
d.

lı́m 3(2x − 1)2 = lı́m (3) · lı́m (2x − 1)2
x→−2 x→−2 x→−2
2
= (3) lı́m (2x − 1)
x→−2
= 3(2(−2) − 1)2
= 75.
e.
√ √
3 3
lı́m x2 − x + 1 = lı́m x2 + lı́m (−x + 1)
x→0 x→0 x→0
23
= lı́m x + (−0 + 1)
x→0
2
= 03 + 1
= 1.
f.
x+2 lı́mx→−3 (x + 2)
lı́m √ = √
x→−3 x2 + 7 − 3 lı́mx→−3 x2 + 7 − 3
−3 + 2
= √
lı́mx→−3 x2 + 7 − lı́mx→−3 (3)
−1
= 1
(lı́mx→−3 (x2 + 7)) 2 − 3
−1
=p
(−3)2 + 7 − 3
= −1.
Se debe tener presente que los símbolos −∞ y ∞ no representan números reales. Se usan para des-
cribir el comportamiento de una función cuando los valores sobrepasan cualesquiera cotas nitas. Por
ejemplo, la función f (x) = 1/x está denida para todo número real diferente de 0; cuando x es positiva
y se hace cada vez más grande, se tiene que el cociente 1/x se hace cada vez más pequeño. Se dice
entonces que el límite cuando x tiende a innito de f (x) = 1/x es igual a 0.
C.3. LÍMITES 425
Denición C.3.2. Se dice que y = f (x) tiene límite el número real L

cuando x tiende a innito, lo que se escribe
lı́m f (x) = L,
x→∞
si, para cada número > 0, existe un número δ tal que, para toda x, se
tiene que
x > δ ⇒ |f (x) − L| < .
Se dice que y = f (x) tiene límite el número real L cuando x tiende a
menos innito, lo que se escribe
lı́m f (x) = L,
x→−∞
si, para cada número > 0, existe un número δ tal que, para toda x, se
tiene que
x < δ ⇒ |f (x) − L| < .
Intuitivamente, siguiendo la notación de la denición C.3.2, lı́mx→∞ f (x) = L si cuando x se aleja

cada vez más del origen en dirección positiva, f (x) se acerca cada vez más a L. De la misma manera,
lı́mx→−∞ f (x) = L si cuando x se aleja cada vez más del origen en dirección negativa, f (x) se acerca
cada vez más a L.
Ejemplo C.3.5. Demostrar que:

1
lı́m = 0.
x→∞ x
Solución:
Siguiendo la denición C.3.2 se tiene que f (x) = 1/x y L = 0. Para cualquier >0 dado, se debe
encontrar un número δ tal que, para toda x, se siga que
x > δ ⇒ |f (x) − 0| = |f (x)| < .
Esta implicación se satisface si δ = 1/ porque

1 1 1
x > ⇒ > ⇒ < ,
x x
1
puesto que >0 y x > 0. Esto prueba que lı́mx→∞ x = 0.
Nota. Se deja como ejercicio para el lector demostrar que lı́mx→±∞ (1/xn ) = 0 donde n es un entero
positivo.
Las propiedades de los límites al innito son análogas a las de la proposición C.3.3 y se utilizan de la
misma manera.
3x2 − 5x + 2
lı́m .
x→∞ 6x2 + 2x − 1
Solución:

3x2 − 5x + 2 3x2 /x2 − 5x/x2 + 2/x2
lı́m = lı́m
x→∞ 6x2 + 2x − 1 x→∞ (6x2 /x2 ) + (2x/x2 ) − (1/x2 )

3 − (5/x) + 2/x2
= lı́m
x→∞ 6 + (2/x) − (1/x2 )

lı́mx→∞ 3 − (5/x) + 2/x2
=
lı́mx→∞ (6 + (2/x) − (1/x2 ))

lı́mx→∞ (3) − lı́mx→∞ (5/x) + lı́mx→∞ 2/x2
=
lı́mx→∞ (6) + lı́mx→∞ (2/x) − lı́mx→∞ (1/x2 )

3 − 5 lı́mx→∞ (1/x) + 2 lı́mx→∞ 1/x2
=
6 + 2 lı́mx→∞ (1/x) − lı́mx→∞ (1/x2 )
3 − 5(0) + 2(0)
=
6 + 2(0) − (0)
1
= .
2

Nota. Los siguientes son un par de límites al innito de uso común asociados con la función exponen-
cial:
n
x n X xi
ex = lı́m 1+ y ex = lı́m .
n→∞ n n→∞
i=1
i!
Nota. Se deja como ejercicio para el lector consultar los detalles de los límites innitos 5
y los
límites laterales .
Cuando se dibujan los valores de una función, ya sea generados en un laboratorio o recopilados en
campo es frecuente que los puntos se unan mediante una curva continua para mostrar los valores de
la función en los tiempos que no se midieron. Al hacerlo, se supone que se está trabajando con una
función continua, de manera que los resultados varían de forma continua de acuerdo con los datos en
lugar de saltar de un valor a otro sin tomar en cuenta los valores intermedios.
5 Las siguientes son las deniciones asociadas con innito y menos innito como límites:
Se dice que y = f (x) tiende a ∞ cuando se aproxima a x0 , lo que se escribe lı́mx→x0 f (x) = ∞, si, para todo número
, existe un númeroδ > 0 tal que, para toda x, se tiene que 0 < |x − x0 | < δ ⇒ f (x) > .
Se dice que y = f (x) tiende a −∞ cuando se aproxima a x0 , lo que se escribe lı́mx→x0 f (x) = −∞, si, para todo número
, existe un número δ > 0 tal que, para toda x, se tiene que 0 < |x − x0 | < δ ⇒ f (x) < .
C.4. DERIVADAS 427
Denición C.3.3. Se dice que una función y = f (x) es una función

continua en un punto c de su dominio si
lı́m f (x) = f (c).

x→c
Nota. Una función es continua en un intervalo si y solo si es continua en todos los puntos del mismo.
Del mismo modo, una función continua es aquella función continua en todos los puntos de su dominio,
aunque no es necesario que lo sea en todos los intervalos. ¾El lector puede dar un ejemplo que rectique
este hecho?
De otra parte, las combinaciones algebraicas y la composición de funciones continuas son funciones
continuas. Además, también son continuas en su dominio las funciones polinomiales, las funciones
racionales, las funciones trigonométricas, las funciones exponenciales y las funciones logarítmicas.
C.4. Derivadas
El concepto de derivada está estrechamente relacionado con el de límite. Una forma usual de abordar
el concepto de derivada de una función y = f (x) evaluada en un punto a es como la pendiente de la
recta tangente a la gráca de la función en el punto (a, f (a)).
Denición C.4.1. La derivada

de una función y = f (x) evaluada en
0
un número real a, denotada con f (a), es
f (a + h) − f (a)
f 0 (a) = lı́m
h→0 h
siempre que este límite exista.
Nota. La derivada de una función y = f (x) evaluada en el número real a también se puede denir
como
f (z) − f (a)
f 0 (a) = lı́m
z→a z−a
siempre que este límite exista. ¾Por qué estas dos deniciones de derivada coinciden?
El dominio de f0 es el subconjunto de puntos del dominio de f para los que existe el límite asociado
con la derivada, y puede ser el mismo o menor que el dominio de f . Si f 0 existe en un punto x entonces
se dice que f es diferenciable o derivable en x. Además, si f 0 existe en todos los puntos del dominio
de f entonces se dice que f es diferenciable o derivable.
Ejemplo C.4.1. Encontrar la derivada de la función f (x) = x

x−1 para x 6= 1.
Solución:
Aplicando la denición C.4.1 se obtiene que:
f (x + h) − f (x)
f 0 (x) = lı́m
h→0 h
x+h x
x+h−1 − x−1
= lı́m
h→0 h
1 (x + h)(x − 1) − x(x + h − 1)
= lı́m
h→0 h (x + h − 1)(x − 1)
1 x − x + hx − h − x2 − hx + x
2
= lı́m
h→0 h (x + h − 1)(x − 1)
1 −h
= lı́m
h→0 h (x + h − 1)(x − 1)
−1
= lı́m
h→0 (x + h − 1)(x − 1)
1
=− .
(x − 1)2
Por lo tanto f 0 (x) = − (x−1)
1
2 para x 6= 1.
√
Ejemplo C.4.2. Encontrar la derivada de la función f (x) = x para x > 0.
Solución:
Usando la denición equivalente de derivada se tiene que:
f (z) − f (x)
f 0 (x) = lı́m
z→x z−x
√ √
z− x
= lı́m
z→x z−x
√ √
z− x
= lı́m √ √ √ √
z→x ( z − x)( z + x)
1
= lı́m √ √
z→x z+ x
1
= √ .
2 x
En consecuencia f 0 (x) = 1
√
2 x
para x > 0.
Nota. Hay muchas formas de simbolizar la derivada de una función. Algunas de las notaciones alter-
nativas de uso común para la derivada de una función y = f (x) en el punto x son:
d df dy
f 0 (x) = y 0 = f (x) = (x) = .
dx dx dx
C.4. DERIVADAS 429
Además, para indicar el valor de f0 evaluada en un número especíco a, se acostumbra emplear la

siguiente simbología:
0 d df dy
f (a) = f (x)
= (x) = .
dx x=a dx x=a dx x=a
Denición C.4.2. Sea y = f (x) una función diferenciable. La dife-

rencial y = f (x) correspondiente al incremento dx de la variable
de
independiente x, simbolizada con dy , se dene como el producto
dy = f 0 (x)dx.
Nota. La diferencial dy depende de la variable independiente x y del incremento dx. Si x es un número

particular del dominio de la función f y además se da un valor especíco a dx, el valor numérico de
dy está determinado.
Ejemplo C.4.3. Encontrar la diferencial de la función del ejemplo C.4.2.
Solución:
√
Si y= x entonces
1 dx
dy = f 0 (x)dx = √ dx = √
2 x 2 x
para x > 0.
A continuación se introducen algunas reglas que permiten derivar una gran variedad de funciones sin
tener que aplicar la denición de derivada directamente:
Proposición C.4.1. Sean f (x) y g(x) dos funciones diferenciables y k un número real. Entonces,
donde las funciones correspondientes hagan sentido y sean diferenciables, se cumplen las siguientes
reglas de derivación:
i) Regla de la derivada de una función constante:

d
(k) = 0.
dx
ii) Regla de la derivada de potencias:

d
xk = kxk−1 .

dx
iii) Regla de la derivada del múltiplo constante:

d
(kf (x)) = kf 0 (x).
dx
iv) Regla de la derivada de una suma:

d
(f (x) + g(x)) = f 0 (x) + g 0 (x).
dx
v) Regla de la derivada de un producto:

d
(f (x) · g(x)) (x) = f 0 (x)g(x) + f (x)g 0 (x).
dx
vi) Regla de la derivada de un cociente:

f 0 (x)g(x) − f (x)g 0 (x)

d f (x)
= .
dx g(x) (g(x))2
Nota. Al combinar las reglas de la suma y del múltiplo constante, se obtiene la regla de la derivada
de una diferencia :
d
(f (x) − g(x)) = f 0 (x) − g 0 (x).
dx
a. d.
d d 33
(π) . πx + 5 .
dx dx 5x
b. e.
d √
3
d
(3x2 − 5)(2x4 − x) .

x2 . dx
dx
c. f.
d √ 3 d x−1
2x . .
dx dx x+1
Solución:
a.
d
(π) = 0.
dx
b.
d √
3
d 2
x2 = x3
dx dx
2 2
= x 3 −1
3
2 −1
= x 3
3
2
= √ .
33x
C.4. DERIVADAS 431
c.
d √ 3 d √ √ 3
2x = 2 x
dx dx
√ d 3

= 2 x2
dx
√

3 3
= 2 x 2 −1
2
√
3 2√
= x.
2
d.

d 3 d d 3
πx3 + 5 = πx3 +

dx 5x dx dx 5x5
d 3 d
x3 + x−5

=π
dx 5 dx
3
= (3)πx 3−1
+ (−5)x−5−1
5
2 3
= 3πx − 6 .
x
e.
d d d
(3x2 − 5)(2x4 − x) = (3x2 − 5) (2x4 − x) + (3x2 − 5) (2x4 − x)

dx dx dx
= (3(2)x2−1 )(2x4 − x) + (3x2 − 5)(2(4)x4−1 − (1)x1−1 )
= 6x(2x4 − x) + (3x2 − 5)(8x3 − 1)
= 12x5 − 6x2 + 24x5 − 3x2 − 40x3 + 5
= 36x5 − 40x3 − 9x2 + 5.
f.
d d
(x − 1) (x + 1) − (x − 1) dx

d x−1 dx (x + 1)
= 2
dx x+1 (x + 1)
((1)x1−1 − 0)(x + 1) − (x − 1)((1)x1−1 + 0)
=
(x + 1)2
(x + 1) − (x − 1)
=
(x + 1)2
2
= .
(x + 1)2
La derivada de una función se puede lograr de distintas formas dependiendo de como se enfoque la
función a derivar y de como se apliquen las reglas de derivación. Por ejemplo, la derivada de la función
f (x) = 1/x se puede realizar por medio de la regla de la derivada de un cociente, tomando la función
del numerador como 1 y la función del denominador como x, o se puede hacer utilizando la regla de
la derivada de potencias, teniendo en cuenta que f (x) = x−1 .
La regla de la suma se extiende a sumas de más de dos funciones, siempre y cuando la suma conste
de un número nito de funciones:
Proposición C.4.2. Si f1 (x), f2 (x), . . . , fn (x) son n funciones diferenciables entonces también lo es
P n
i=1 fi (x) y además
!
n n
d X X
fi (x) = fi0 (x).
dx i=1 i=1
a. b.
x4

d 3 2 d 12 4 1
+ x +x . + 3+ 4 .
dx 2 2 dx x x x
Solución:
a.
x4 d x4

d 3 d 3 2 d
+ x2 + x = + x + (x)
dx 2 2 dx 2 dx 2 dx
1 3
= (4)x4−1 + (2)x2−1 + (1)x1−1
2 2
= 2x3 + 3x + 1.
b.

d 12 4 1 d 12 d 4 d 1
+ 3+ 4 = + 3
+
dx x x x dx x dx x dx x4
d d d
12x−1 + 4x−3 + x−4

=
dx dx dx
= 12(−1)x−1−1 + 4(−3)x−3−1 + (−4)x−4−1
12 12 4
= − 2 − 4 − 5.
x x x

Proposición C.4.3. Si f (u) es una función diferenciable en u = g(x), y a su vez g(x) es una función
diferenciable en x, entonces la función compuesta (f ◦ g)(x) = f (g(x)) es diferenciable en x, y además
d
((f ◦ g)(x)) = f 0 (g(x)) · g 0 (x).
dx
C.4. DERIVADAS 433
Nota. La proposición C.4.3 se conoce como regla de la cadena y se puede extender a un caso en el
que se tenga la compuesta de tres o más funciones.
a. b.
d 7 d 1
5x3 − x4 . .
dx dx 3x − 2
Solución:
a.
d 7 7−1 d
5x3 − x4 = 7 5x3 − x4 5x3 − x4

dx dx
6
= 7 5x3 − x4 5(3)x3−1 − (4)x4−1

6
= 7 5x3 − x4 15x2 − 4x3 .

b.

d 1 d
(3x − 2)−1

=
dx 3x − 2 dx
d
= (−1)(3x − 2)−1−1 (3x − 2)
dx
−2 1−1
= −(3x − 2) (3(1)x − 0)
= −3(3x − 2)−2
−3
= .
(3x − 2)2
Proposición C.4.4. Se satisfacen las siguientes reglas de derivación:
i. iv.
d x d 1
(e ) = ex . (logb (x)) =
dx dx x ln(b)
ii. siempre que b > 0 y b 6= 1.
d x
(a ) = ax ln(a) v.
dx d
siempre que a > 0. (sin(x)) = cos(x).
dx
iii. vi.
d 1 d
(ln(x)) = . (cos(x)) = − sin(x).
dx x dx
a. d.
d d
sin3 (2x) . ln πx4 .

dx dx
b. e.
d x2 d
cos 23x .

e . dx
dx
c. f.
d d log(x)
cos −e2x .

2 .
dx dx
Solución:
a.
d d
sin3 (2x) = 3 sin3−1 (2x) (2x)

dx dx
= 3 sin2 (2x) 2(1)x1−1

= 6 sin2 (2x).
b.
d x2 2 d
= ex x2

e
dx dx
2
= ex 2x2−1
2
= 2xex .
c.
d d
cos −e2x = − sin −e2x −e2x

dx dx
d
= − sin −e2x (−1)e2x

(2x)
dx
= e2x sin −e2x 2(1)x1−1

= 2e2x sin −e2x .

d.
d 1 d
ln πx4 = πx4

dx πx4 dx
1
= π(4)x4−1
πx4
1
= 4πx3
πx4
4
= .
x
C.4. DERIVADAS 435
e.
d d
cos 23x = − sin 23x 23x

dx dx
3x
3x d
= − sin 2 2 ln(2) (3x)
dx
= −23x ln(2) sin 23x 3(1)x1−1

= (−3) ln(2) 23x sin 23x .

f.
d log(x) d
2 = 2log(x) ln(2) (log(x)])
dx dx
log(x) 1
=2 ln(2)
x ln(10)
2log(x) ln(2)
= .
x ln(10)
Proposición C.4.5. Si y = f (x) 0

es una función denida sobre un intervalo tal que f (x) existe y
−1
nunca se anula en este dominio entonces f (x) es derivable en cada punto de su dominio y además
0 1
f −1 (x) = .
f0 (f −1 (x))
Ejemplo C.4.8. Calcular la derivada de la función inversa de f (x) = x2 para x ≥ 0.
Solución:
√
Si f (x) = x2 entonces f 0 (x) = 2x y f −1 (x) = x para x ≥ 0. Por lo tanto se sigue que:
0 1
f −1 (x) =
f0 (f −1 (x))
1
= √
f 0 ( x)
1
= √ .
2 x
Nota. El resultado del ejemplo C.4.8 también se puede obtener aplicando la regla de la derivada de
una potencia sobre la función inversa.
Si y = f (x) es una función diferenciable entonces su derivada f 0 (x) también es una función de x. Si
f (x) también es una función diferenciable entonces es posible derivar f 0 (x)
0
y se obtiene una nueva
función de x denotada con f 00 (x) tal que f 00 (x) = (f 0 )0 (x). La función f 00 se llama segunda derivada
de f respecto a x puesto que es la derivada de la primera derivada. Por lo tanto se escribe:
d2 d2 f d2 y
f 00 (x) = y 00 = f (x) = (x) = .
dx2 dx2 dx2
Del mismo modo, si y 00 = f 00 (x) es una función diferenciable entonces su derivada f 000 (x) también es
una función de x y se denomina tercera derivada de f respecto a x. Como se puede imaginar, el
proceso continúa y
dn dn f dn y
f (n) (x) = y (n) = f (x) = (x) =
dxn dxn dxn
denota la n-ésima derivada de f respecto a x donde n es cualquier entero positivo. Luego, f
(0)
= f,
f (1) = f 0 , f (2) = f 00 , etc.
a. b.
d2 d2
(xex ) . cos(x2 ) .

dx2 dx 2
Solución:
a.
d2

x d d x
(xe ) = (xe )
dx2 dx dx
d
= ((1)ex + xex )
dx
= ex + (1)ex + xex
= ex (2 + x).
b.
d2

2
d d 2

cos(x ) = (cos(x )
dx2 dx dx
d
−2x sin(x2 )

=
dx
= (−2) sin x2 − 2x(2x) cos x2

= −2 sin x2 − 4x4 cos x2 .

Si se tiene un límite de la forma

f (x)
lı́m
x→c g(x)
C.4. DERIVADAS 437
donde tanto f (x) como g(x) tienden a 0 cuando x tiende a c, entonces este límite puede existir o no
y se conoce como forma indeterminada del tipo 0/0. De igual manera se constituyen las formas
indeterminadas del tipo ∞/∞ y del tipo −∞/ − ∞. La siguiente regla permite calcular límites para
estas formas indeterminadas:
Proposición C.4.6. Si f (x) y g(x) son funciones diferenciables en un intervalo abierto que contiene
al número real c tales que f (c) = g(c) = 0, y además g(x) 6= 0 en este intervalo si x 6= c, entonces
f (x) f 0 (x)
lı́m = lı́m 0
x→c g(x) x→c g (x)
siempre que el límite del lado derecho de la igualdad exista.
Nota. La regla de la proposición C.4.6 se conoce como regla de L'Hôpital , en honor a Guillaume
François de L'Hôpital 6
, y aplica cuando las funciones satisfacen los requerimientos dados en la
proposición. Esta regla también es válida para límites laterales y para límites al innito.
Figura C.4: Guillaume François de L'Hôpital (1661-1704).
a. b.
ln(x) ln(x)
lı́m . √ .
lı́m
x→1 x − 1 x→∞ 3 x
Solución:
6 Fotografía tomada de la página web http://www.educared.org/global/premiointernacional/finalistas/710/
biograf/Blhopit.html.
a. Como
lı́m (ln(x)) = 0 y lı́m (x − 1) = 0
x→1 x→1
entonces es posible aplicar la regla de L'Hôpital, de forma que:
d
ln(x) dx (ln(x))
lı́m = lı́m d
x→1 x − 1 x→1 (x − 1)
dx
1
x
= lı́m
x→11
1
= lı́m
x→1 x
= 1.
b. Como
√
lı́m (ln(x)) = ∞ y lı́m 3
x=∞
x→∞ x→∞
entonces es posible aplicar la regla de L'Hôpital, de forma que:
d
ln(x) dx (ln(x))
√ = lı́m
lı́m d √
x→∞ 3 x
dx ( x)
x→∞ 3
1
= lı́m 1 x− 2
x→∞ x 3
3
3
= lı́m √
x→∞ 3
x
1
= 3 lı́m √
x→∞ 3 x
= 0.
C.5. Integrales
La integración es una técnica para calcular mucho más que áreas y volúmenes. Como los límites, las
integrales tienen una gran variedad de aplicaciones en el cálculo y la estadística. La integración permite
calcular muchas cantidades, dividiéndolas en partes más pequeñas y sumando después la contribución
de cada una de ellas.
La denición de la integral denida se basa en la idea de que, para ciertas funciones, los valores de las
sumas de Riemann, en honor a Bernhard Riemann 7 8
, tienden a un valor límite I, siempre que las
7 Fotografía tomada de la página web http://www.claymath.org/millennium/Riemann_Hypothesis/.

8 Sea y = f (x) una función denida en un intervalo cerrado [a,b]. Subdividiendo este intervalo en n subintervalos
C.5. INTEGRALES 439
normas de las particiones de [a, b] tienden a 0. Es decir, una suma de Riemann estará cerca del valor
límite I cuando la norma de la partición correspondiente sea lo sucientemente pequeña.
Denición C.5.1. Sea y = f (x) una función denida en un intervalo

cerrado [a, b]. Se dice que un número I es la integral denida de f en
Pn
[a, b] y que I es el límite de las sumas de Riemann i=1 f (ck )∆k si, para
cada número > 0, existe un número δ > 0 tal que, para toda partición
P = {x0 , x1 , x2 , . . . , xn−1 , xn } de [a, b] con kP k < δ y cualquier elección
de los ck en [xk−1 xk ] para k = 1, 2 . . . , n, se tiene que

X n
f (ck )∆k − I < .

i=1
Nota. Cuando se satisface la denición C.5.1 se dice que las sumas de Riemann de f en [a, b] convergen
a la integral denida
n
!
Z b X
I= f (x)dx = lı́m f (ck )∆k
a kP k→0
i=1
y que f es integrable en [a, b].
Proposición C.5.1.
Rb
Si y = f (x) es una función continua denida en el intervalo [a, b] entonces
a
f (x)dx existe.
La proposición C.5.1 establece la existencia de la integral denida cuando se trata con funciones
continuas denidas en un intervalo cerrado, mas no indica como calcular tales integrales. La siguiente
proposición señala como realizar los cálculos correspondientes:
Proposición C.5.2. Si f es una función continua en el intervalo [a, b] entonces
Z x
F (x) = f (t)dt
a
es una función continua y diferenciable en el intervalo (a, b), y además

Z x
0 d
F (x) = f (t)dt = f (x).
dx a
cerrados, se eligen n − 1 puntos x1 , x2 , . . . , xn−1 entre a y b tales que a = x0 < x1 < x2 < . . . < xn−1 < xn = b. El
conjunto P = {x0 , x1 , x2 , . . . , xn−1 , xn } se llama partición de [a, b]. El k-ésimo subintervalo de P es [xk−1 , xk ] y su
longitud, denotada con ∆k , está dada por ∆k = xk − xk−1 para k = 1, . . . , n. La norma de una partición P , denotada
con kP k, es la longitud del intervalo más grande de la partición, esto es, kP k = máx{∆k : k = 1, 2, . . . , n}. En cada
intervalo se elige algún número; el punto seleccionado en el k -ésimo intervalo se simboliza con ck para k = 1, . . . , n. La
i=1 f (ck )∆k se conoce como suma de Riemann para f en el intervalo [a, b]. Cualquier suma de Riemann
Pn
suma
dene rectángulos que aproximan la región entre la gráca de f y el eje x.
Figura C.5: Bernhard Riemann (1826-1866).
teorema fundamental del cálculo . En esta proposición

Nota. La proposición C.5.2 se conoce como
9
la función F (x) se llama antiderivada o primitiva de la función f y es aquella función tal que
10
F 0 (x) = f (x) en el intervalo [a, b]. Además, si F (x) es una antiderivada de f (x) entonces se sigue que
Z b b

f (x)dx = F (x) = F (b) − F (a).
a a
Esta expresión se conoce como la regla de Barrow .

a. b. π
2
Z Z 2
2 cos(x)dx.
x dx.
−1 −π
4
Solución:
9 Una versión más sosticada de este teorema establece que si a(x) y b(x) son funciones diferenciables de x y f (t) es
una función continua en el intervalo [a(x), b(x)] entonces
"Z #
d b(x)
f (t)dt = f (b(x))b0 (x) − f (a(x))a0 (x).
dx a(x)
10 Si F (x) es una antiderivada de f y c es un número real entonces F (x) + c también es una antiderivada de f y por
lo tanto si una función tiene una antiderivada entonces ésta tiene innitas antiderivadas.
C.5. INTEGRALES 441
a.
2 2
x3
Z
2
x dx =
−1 3 −1
23 (−1)3
= −
3 3
8 1
= +
3 3
= 3.
b.
Z π/2 π/2

cos(x)dx = sin(x)
−π/4 −π/4
= sin (π/2) − sin (−π/4)

√ !
2
=1− −
2
√
2
=1+ .
2
Proposición C.5.3. Sean f (x) y g(x) dos funciones integrables en el intervalo [a, b] y k un número
real. Entonces se cumplen las siguientes reglas de integración:
i) Regla de la integral sobre un punto:

Z a
f (x)dx = 0.
a
ii) Regla de la integral del múltiplo constante:

Z b Z b
kf (x)dx = k f (x)dx.
a a
iii) Regla de la integral de una suma:

Z b Z b Z b
(f (x) + g(x)) dx = f (x)dx + g(x)dx.
a a a
iv) Regla del orden de la integración:

Z b Z a
f (x)dx = − f (x)dx.
a b
v) Regla de la aditividad de la integración:

Z b Z c Z b
f (x)dx = f (x)dx + f (x)dx,
a a c
donde c es un número real en el intervalo [a, b].

vi) Regla de la dominación de la integración:
Z b Z b
f (x)dx ≥ g(x)dx,
a a
siempre que f (x) ≥ g(x) para toda x en el intervalo [a, b].

Nota. Al combinar las reglas de la suma y del múltiplo constante, se obtiene la regla de la integral
de una diferencia : Z b Z b Z b
(f (x) − g(x)) dx = f (x)dx − g(x)dx.
a a a
La regla de la suma se extiende a sumas de más de dos funciones, siempre y cuando la suma conste
de un número nito de funciones:
Proposición C.5.4.PSi f1 (x), f2 (x), . . . , fn (x) son n funciones integrables en el intervalo [a,b] en-
n
tonces también lo es i=1fi (x) y
Z b X n
! n Z b
X
fi (x) dx = fi (x).
a i=1 i=1 a

Z 1
2x3 − 3x + 1 dx.

−2
Solución:
Z 1 Z 1 Z 1 Z 1
2x3 − 3x + 1 dx = 2x3 dx −

3xdx + 1dx
−2 −2 −2 −2
Z 1 Z 1 Z 1
3
=2 x dx − 3 xdx + 1dx
−2 −2 −2
4 1
1 1
x2

x
=2 − 3 + x
4 −2
2 −2
−2
1 1 1
1 3
= x4 − x2 + x

2 −2 2 −2 −2
1 4 4
3 2
1 − (−2)2 + (1 − (−2))

= 1 − (−2) −
2 2
= 0.

C.5. INTEGRALES 443
Una integral denida es un número denido al tomar el límite de sumas de Riemann asociadas a
particiones de un intervalo cerrado nito cuyas normas tienden a 0. Además, si
Rb f es una función
positiva denida en el intervalo [a, b] entonces
a
f (x)dx representa el área entre la curva y la porción
del eje x entre a y b. De otra parte, la integral indenida de una función y = f (x) respecto de x,
denotada con Z
f (x)dx,
es el conjunto de todas las antiderivadas de la función f. Por lo tanto, si F (x) es una antiderivada de
f (x) entonces
Z
f (x)dx = F (x) + c
donde c es un número real.
Nota. Cuando se encuentre la integral indenida de una función, no se debe olvidar incluir una
Rb
Rconstante arbitraria. Además, tampoco se debe olvidar que a f (x)dx es un número real, mientras que
f (x)dx es una función más una constante arbitraria.
Proposición C.5.5. Sea c un número real. Se satisfacen las siguientes reglas de integración:
i. iv.
xa+1
Z Z
a
x dx = +c 1
a+1 dx = ln (|x|) + c.
x
siempre que a 6= −1.
v.
ii. Z
bx
Z
bx dx = +c sin(x)dx = − cos(x) + c.
ln(b)
siempre que b > 0 y b 6= 1.
vi.
iii.
Z
Z
x
e dx = e + c. x cos(x)dx = sin(x) + c.
a. c.
Z r Z √
2 2 sin(x) +
3
x2 dx.
dx.
x
b. d. Z
2
Z
x x
(x − 3e ) dx. − 2 dx.
x
Solución:
a.
Z r Z √
2 1
dx = 2 √ dx
x x
√ Z −1
= 2 x 2 dx
√ x− 21 +1
= 2 1 +c
−2 + 1
√ x 12
= 2 1 +c
2
√ √
= 2 2 x + c.
b.
Z Z Z
x
(x − 3e ) dx = xdx − 3 ex dx
x2
= + c1 − 3ex + c2
2
x2
= − 3ex + c.
2
c.
Z √
3
Z Z √
3
2 sin(x) + x2 dx = 2 sin(x)dx + x2 dx
2
x 3 +1
= −2 cos(x) + c1 + 2 + c2
3 +1
3 √
3
= −2 cos(x) + x x2 + c.
5
d.
Z Z Z
2 x 1
− 2 dx = 2 dx − 2x dx
x x
2x
= 2 ln (|x|) + c1 − + c2
ln(2)
2x
= 2 ln (|x|) − + c.
ln(2)

Proposición C.5.6. Sea u = g(x) una función diferenciable en el intervalo [a, b] y f (x) una función
continua en el rango de g(x). Entonces se tiene que:
Z b Z g(b)
f (g(x)) g 0 (x)dx = f (u)du.
a g(a)
Nota. La técnica de integración que se presenta en a proposición C.5.6 se conoce como integración
por sustitución .
C.5. INTEGRALES 445
a. Z d. Z
2
sin(x) cos(x)dx. xex dx.
b. e. Z
Z
e −3x
dx. cos(7x + 5)dx.
c. f. Z
2x
Z
x x 2 √ dx.
e (e − 1) dx. 3
x2 + 1
Solución:
a. Haciendo u = sin(x) se obtiene que du = cos(x)dx y por lo tanto:
Z Z
sin(x) cos(x)dx = udu
u2
= +c
2
sin2 (x)
= + c.
2
b. Haciendo u = −3x se obtiene que du = −3dx y por lo tanto:

Z Z
−3x 1 u
e dx = − e du
3
Z
1
=− eu du
3
1
= − eu + c
3
1
= − eu + c
3
1
= − e−3x + c.
3
c. Haciendo u = ex − 1 se obtiene que du = ex dx y por lo tanto:

Z Z
x x 2 2
e (e − 1) dx = (eu ) du
Z
= e2u du
Z
1 u∗ ∗
= e du
2
Z
1 ∗
= eu du∗
2
1 u∗
= e +c
2
1 ∗
= eu + c
2
1
= e2u + c
2
1 x
= e2(e −1) + c
2
donde u∗ = 2u y du∗ = 2du.
d. Haciendo u = x2 se obtiene que du = 2xdx y por lo tanto:

Z Z
2 1 u
xex dx = e du
2
Z
1
= eu du
2
1
= eu + c
2
1 2
= ex + c.
2
e. Haciendo u = 7x + 5 se obtiene que du = 7dx y por lo tanto:
Z Z
1
cos(7x + 5)dx = cos(u)du
7
Z
1
= cos(u)du
7
1
= sin(u) + c
7
1
= sin(7x + 5) + c.
7
f. Haciendo u = x2 + 1 se obtiene que du = 2xdx y por lo tanto
Z Z
2x 1
√
3
dx = √ du
x2 + 1 3
u
Z
1
= u− 3 du
1
u− 3 +1
= 1 +c
−3 + 1
3 2
= u3 + c
2q
33 2 2
= (x + 1) + c.
2

C.5. INTEGRALES 447
Proposición C.5.7. Sean f (x) y g(x) un par de funciones diferenciables. Entonces se tiene que:
Z b b Z b
0
f 0 (x)g(x)dx.

f (x)g (x)dx = f (x)g(x) −
a a a
Nota. La técnica de integración que se presenta en a proposición C.5.7 se conoce como integración
por partes . En ocasiones es más fácil recordar la fórmula si se escribe en forma diferencial: si u = f (x)
y v = g(x) entonces la fórmula de integración por partes se transforma en
Z b b Z b

udv = uv − vdu.
a a a
a. Z b. Z c. Z
x
xe dx. ln(x)dx. ex cos(x)dx.
Solución:
a. Haciendo u=x y dv = ex dx se obtiene que du = dx y v = ex , y por lo tanto:

Z Z
xex dx = udv
Z
= uv − vdu
Z
= xe − ex dx
x
= xex − ex + c
= ex (x − 1) + c.
b. Haciendo u = ln(x) y dv = dx se obtiene que du = x1 dx y v = x, y por lo tanto:
Z Z
ln(x)dx = udv
Z
= uv − vdu
Z
1
= x ln(x) − x dx
x
Z
= x ln(x) − 1dx
= x ln(x) − x + c
= x(ln(x) − 1) + c.
c. Haciendo u = ex y dv = cos(x)dx se obtiene que du = ex dx y v = sin(x), y por lo tanto:

Z Z
ex cos(x)dx = udv
Z
= uv − vdu
Z
= ex sin(x) − ex sin(x).
La segunda integral en el lado derecho de la igualdad es similar a la primera, salvo que se tiene
sin(x) en lugar de cos(x). Para evaluarla, nuevamente se utiliza la integración por partes haciendo
u = ex y dv = sin(x)dx de donde du = ex dx y v = − cos(x), y por lo tanto:
Z Z
x x x x
e cos(x)dx = e sin(x) − −e cos(x) − (− cos(x))e dx
Z
= ex sin(x) + ex cos(x) − ex cos(x)dx.
Ahora la integral desconocida aparece en ambos lados de la ecuación. Sumando esta integral a
ambos lados se obtiene que:
Z
2 ex cos(x)dx = ex sin(x) + ex cos(x)
y en consecuencia
ex sin(x) + ex cos(x)
Z
ex cos(x)dx = +c
2
1
= ex (sin(x) + cos(x)) + c.
2

Nota. La integración por sustitución y la integración por partes son apenas un par de métodos de
integración, pero no son los únicos. Así que se deja como ejercicio consultar los detalles de otras
técnicas de integración, como la integración por fracciones parciales y la integración por el método
de Heaviside . Además, cuando no sea posible determinar una antiderivada 11
para una función dada
o cuando requiera mucho trabajo, se recomienda trabajar con la integración numérica, que consiste
en aproximar una integral denida por medio de métodos numéricos como la regla del trapecio y la
regla de Simpson .
A continuación se presenta un ejemplo donde se ilustra la integración por fracciones parciales:

5x − 3
Z
dx.
x2 − 2x − 3
11 Las integrales de funciones que no tienen antiderivadas elementales se denominan integrales no elementales .
C.5. INTEGRALES 449
Solución:
El método consiste en expresar la función racional del integrando como una suma de fracciones más
sencillas, denominadas fracciones parciales, más fáciles de integrar. De esta forma y teniendo en cuenta
que x2 − 2x − 3 = (x + 1)(x − 3), se deben determinar las constantes A y B tales que:
5x − 3 A B
= + .
(x + 1)(x − 3) x+1 x+3
Luego, multiplicando ambos lados de la igualdad por (x + 1)(x − 3) se obtiene que:
5x − 3 = A(x − 3) + B(x + 1)
= Ax − 3A + Bx + B
= Ax + Bx − 3A + B
= (A + B)x + (−3A + B)
de donde
A+B =5 y − 3a + B = −3
y por lo tanto A=2 y B = 3. Así, la integral pedida es:
Z
5x − 3
Z
2 3
dx = + dx
x2 − 2x − 3 x+1 x−3
Z Z
2 3
= dx + dx
x+1 x−3
= 2 ln (|x + 1|) + 3 ln (|x − 3|) + c.
Hasta el momento, a las integrales se les ha exigido que tengan dos propiedades: primera, que el
dominio de la integración sea un intervalo nito; y segunda, que el rango del integrando sea nito en
este dominio. En la práctica, es posible encontrar problemas que no cumplen una o ambas condiciones.
En cualquier caso se dice que las integrales son impropias y se calculan como límites.
Denición C.5.2. Las integrales con límites de integración innitos son

integrales impropias del tipo I . Tales integrales están dadas por:
i. Si f (x) es continua en [a, ∞) entonces
Z ∞ Z b
f (x)dx = lı́m f (x)dx.
a b→∞ a
ii. Si f (x) es continua en (−∞, b] entonces
Z b Z b
f (x)dx = lı́m f (x)dx.
−∞ a→−∞ a
iii. Si f (x) es continua en (−∞, ∞) entonces

Z ∞ Z c Z ∞
f (x)dx = f (x)dx + f (x)dx.
−∞ −∞ c
donde a, b y c son número reales. En cada caso, si el límite es nito se

dice que la integral impropia converge y que el límite es el valor de la
integral impropia. Si el límite no existe, la integral impropia diverge.
a. b.
Z ∞ Z ∞
−x ln(x)
e dx. dx.
0 1 x
Solución:
a.
Z ∞ Z b
e−x dx = lı́m e−x dx
0 b→∞ 0
b !
−x

= lı́m −e
b→∞ 0
−b
− −e0

= lı́m −e
b→∞
= − lı́m e−b + lı́m e0
b→∞ b→∞
= −0 + 1
= 1.
C.5. INTEGRALES 451
b. Integrando por partes haciendo u = ln(x) y dv = 1/x2 dx se obtiene que du = 1/xdx y v = −1/x ,
y por lo tanto:
b Z b !
Z ∞
ln(x)
dx = lı́m uv − vdu
1 x b→∞ 1 1
b Z b !
1 1 1
= lı́m ln(x) − − − dx
b→∞ x 1
1 x x
b Z b !
ln(x) 1
= lı́m − + 2
dx
b→∞ x 1 1 x
b b !
ln(x) 1
= lı́m − −
b→∞ x 1 x 1

ln(b) ln(1) 1 1
= lı́m − − − + − − −
b→∞ b 1 b 1

ln(b) 1
= lı́m − +0− +1
b→∞ b b

ln(b) 1
= − lı́m − lı́m + lı́m (1)
b→∞ b b→∞ b b→∞
!
d
(ln(b))
= − lı́m db d −0+1
db (b)
b→∞

1/b
= − lı́m +1
b→∞ 1

1
= − lı́m +1
b→∞ b
= −0 + 1
= 1.
Nota. Se deja como ejercicio consultar los detalles de las integrales impropias tipo II 12
y los
criterios de convergencia asociados con la evaluación de las integrales impropias, como el criterio
de la comparación directa y el criterio de la comparación de límite .
12 Se reeren a las integrales de funciones que se vuelven innitas en un punto dentro del intervalo de integración.
C.6. Ejercicios
Los ejercicios que se presentan a continuación son tomados principalmente de Thomas (2006) y Purcell
& Varberg (1993):
C.1. Realizar las operaciones indicadas y simplicar:
a. d.
−2
2x − 2x2

1 5
√ − √ . .
2 2 2 x3 − 2x2 + x
e.
b.
x2 − x − 6 18 4 6
. − + .
x−3 x2 + 3x x x + 3
c. f.
3 x3 − 8
2+ . .
1 + 25 2x − 4
C.2. Gracar las siguientes funciones:
a. g.
f (x) = |x|. f (x) = e−x .
b. h.
f (x) = [x]. f (x) = |2x − 1|.
c.
i.
f (x) = |[x]| . f (x) = ln(x + 2).
d.
j.
f (x) = x − [x]. |x|
f (x) = .
e. x
f (x) = x2 − 2. k.  2
 x , si x ≤ 0;
f.
1 f (x) = x, 0 < x < 1;
f (x) = .  2
x + 1, x ≥ 1.
x−1
Recordar que [x] = mayor número entero menor o igual a x y se denomina parte entera de x.
2
C.3. Sean f (x) = x3 + 2 y g(x) =
x−1 . Encontrar una fórmula para cada una de las siguientes
expresiones y establecer su dominio:
a. b.
(3f )(x). (f + g)(x).

C.6. EJERCICIOS 453
c. f.
(f − g)(x). (f ◦ g)(x).
d. g.
(f · g)(x). (g ◦ f )(x).
e. h.
(f /g)(x). (f ◦ f )(x).
C.4. Generalizar la fórmula de la composición de dos funciones a n funciones.
x−3
C.5. Sea f (x) = x+1 . Encontrar la fórmula de (f ◦ f ◦ f )(x).
C.6. Calcular los siguientes límites:
a. i.
lı́m (x − 2) (2x + 3) . x2 + 7x + 6
x→−1 lı́m .
x→−1 x2 − 4x − 5
b. j.
√ √
lı́m 3x + 1. 5x + 4 − 2
x→0 lı́m .
x→0 x
c.
2 k. √
lı́m +1 . x2 + 8 − 3
x→3 x lı́m .
x→−1 x+1
d. √
x2 + 9 l. √
lı́m . x−3
x→4 x−3 lı́m .
x→9 x−9
e.
x2 − 5x + 6 m.
lı́m 2 . x+3
x→2 x − x − 2 lı́m .
x→−3 x2 + 4x + 3
f.
n.
2x3 + 3x2 − 2x − 3 4−x
lı́m . lı́m √ .
x→1 x2 − 1 x→4 5− x2 + 9
g.
r ñ.
3 4x3 + 8x 1
− 1
lı́m . lı́m x+2 2
.
x→2 x+4 x→0 x
h. o.
3x4 − 8

sin x2
lı́m 3 . lı́m .
x→−2 x + 24 x→0 x
C.7. Calcular los siguientes límites:
a. b.
5 − 5 cos(x) 3x − 1
lı́m . lı́m .
x→0 ex − x − 1 x→0 x
c. j.
4 − 4ex
2

lı́m . lı́m π− .
x→0 xex x→−∞ x2
d.
k.
2x 2x + 3
lı́m √ . lı́m .
x→0 x + 7 x x→∞ 5x + 7
e.
l.
10x − 1 7x3
lı́m . lı́m .
x→0 x x→−∞ x3 − 3x2 + 6x
f. m.
2x √
lı́m . 2 x + x1
x→∞ 2ex lı́m .
x→∞ 3x − 7
g. n. √
3x − 5 2+ x
lı́m 2
. lı́m √ .
x→∞ 2x − x + 2 x→∞ 2 − x
h. ñ.
x −x4
lı́m . lı́m .
x→∞ ex
x→−∞ x4 − 7x3 + 7x2 + 9
i. o.
2 x2 − 1
lı́m −3 . lı́m .
x→∞ x x→−∞ ex
C.8. Calcular las siguientes derivadas:
a. h.
d p 2

d 5y + 1

x +4 . √ .
dx dy 2 y
b. i.
d x d

x5

. .
dx x−5 dx 120
c.
j.

d cos(x)
.

d 3y + 1
dx x (3 − y) .
dy 3y
d.
d k.
(sin(y) cos(y)) . d
sin2 (πy − 2) .

dy
dy
e.
d l.
sin3 (x) .

dx d
3e−2x .

f.
dx

d 3y − 1 m.
sin . d
2ye−3y .

dy 2y + 5
dy
g.
n.
(x + 1)2

d d
. 2ye−3y .

dx 3x − 4 dx
C.6. EJERCICIOS 455
ñ. p.
d d
3(y 2 − 2)−2 .

(2x2 + 2x − 1)3 .

dy dx
o. q.

d p 3 d y+x
y + 2y . .
dy dx y−x
C.9. Calcular las siguientes derivadas:
a. j.
x3

d d
ln x2 y .

.
dx y + x2 dy
b. k.
d p 2 d x
e 1 − x2 .

x + y2 .
dy dx
c. l.
√ ex − 1

d d
(y + x) y − x . .
dx dx ey − 1
d. m.
ex − 1
r
d y+x d
. .
dy y−x dy ey − 1
e. n.
d √ d sin(x)
(y + 3 x)3 . e .
dx dx
f. ñ.
d p d2 √
y cos(xy) . 2
9−x .
dy dx
g. o.
d

1
d3
cos y 2 .

tan2 (x) . dy 3
dx 2
p.
h. d2
d (sin(3y)) .
(ln(cos(xy))) . dy 2
dx
q.
i.
d3

d 1
ln x2 y . .

dx dx3 x−3
C.10. Calcular las siguientes integrales:
a. Z c. Z
2
(4x − x + 1)dx. (2x − 1)1/2 dx.
b. Z d. Z
(2y −3 − y −2 )dy. 3e−2x dx.
e. Z m. Z
−y 1
2ye dy. sin(xy) − dy .
y
f. Z n. Z
xy cos(x)dx. (x2 − 3x + 3)dx.
g. Z ñ. √
2x2 + x − 1
Z
xy cos(x)dy. dx.
x2
h. Z o. Z
x2 ex dx. y(2 − 3xy)dx.
i. Z p. Z
xe2x dx. y(2 − 3xy)dy.
j. Z q. Z
ey cos (ey ) dy. 2e−2x dx.
k. Z r.
2
Z
x3x +5
dx. 2xe−2x dx.
l. Z s.
1
Z
sin(xy) − dx. 2x2 e−2x dx.
y
C.11. Calcular las siguientes integrales:
a. g.
Z 1
16x Z π/2
√ dx. y 3 cos(2y)dy.
0 8x2 + 1 0
b. h.
0 ∞
y3
Z Z
1
dy. √ dy.
−1 y2 − 2y + 1 0 y(y + 1)
c. i.
Z 1/6 2
1 Z
√ dx. x ln(x)dx.
0 1 − 9x2 1
d. j.
Z ∞ Z ∞
−x2
2xe dx. e−2y dy.
−∞ 0
e. Z 3 k.
1 Z e
√ dy. x3 ln(x)dx.
−2 e2y −1 1
f. l.
Z −2 ∞
2
Z
1
2
dy. √ dx.
−∞ y −1 2 x−1
C.6. EJERCICIOS 457
m. p.
Z 1
3 y Z π/3
y e dy.
−1 y tan2 (y)dy.
0
n. Z ∞
1
dx. q.
2 ln(x) Z 1
1
ñ. dx.
Z 1 p 0 (x + 1)(x2 − 1)
y 1 − ydy.
0 r.
o. √ 1
x3
Z
3
3y 2 + y + 4
Z
dy. dx.
y3 + y 0 x2 + 2x + 1
1
Referencias electrónicas
Las siguientes son las páginas web de las que se han tomado algunos ejemplos o ejercicios de este
apéndice:
http://www.vaxasoftware.com/doc_edu/mat/derivada.pdf.
Apéndice D
Tablas estadísticas
D.1. Introducción
Las tablas que se muestran a continuación están asociadas con las funciones de distribución acumulada
de algunas distribuciones de probabilidad de uso frecuente. Estas tablas se crean con el n de facilitar
los cálculos cuando no se disponga de un software especializado para realizarlos y para facilitar el
desarrollo de los ejercicios y ejemplos de este texto. Las probabilidades se redondean y se expresan
con cuatro (4) cifras decimales a lo sumo.
D.2. Distribución binomial
[x]
X n k
P (X ≤ x) = π (1 − π)n−k
k
k=0
n [x] π =0.05 π =0.10 π =0.15 π =0.20 π =0.25 π =0.30 π =0.35 π =0.40 π =0.45 π =0.50
2 1 0.9975 0.9900 0.9775 0.9600 0.9375 0.9100 0.8775 0.8400 0.7975 0.7500
2 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
3 1 0.9928 0.9720 0.9393 0.8960 0.8438 0.7840 0.7182 0.6480 0.5747 0.5000
2 0.9999 0.9990 0.9966 0.9920 0.9844 0.9730 0.9571 0.9360 0.9089 0.8750
3 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
4 1 0.9860 0.9477 0.8905 0.8192 0.7383 0.6517 0.5630 0.4752 0.3910 0.3125
2 0.9995 0.9963 0.9880 0.9728 0.9492 0.9163 0.8735 0.8208 0.7585 0.6875
3 1.0000 0.9999 0.9995 0.9984 0.9961 0.9919 0.9850 0.9744 0.9590 0.9375
4 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
5 1 0.9774 0.9185 0.8352 0.7373 0.6328 0.5282 0.4284 0.3370 0.2562 0.1875
2 0.9988 0.9914 0.9734 0.9421 0.8965 0.8369 0.7648 0.6826 0.5931 0.5000
458
D.2. DISTRIBUCIÓN BINOMIAL 459
3 1.0000 0.9995 0.9978 0.9933 0.9844 0.9692 0.9460 0.9130 0.8688 0.8125
4 1.0000 1.0000 0.9999 0.9997 0.9990 0.9976 0.9947 0.9898 0.9815 0.9688
5 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
6 1 0.9672 0.8857 0.7765 0.6554 0.5339 0.4202 0.3191 0.2333 0.1636 0.1094
2 0.9978 0.9841 0.9527 0.9011 0.8306 0.7443 0.6471 0.5443 0.4415 0.3437
3 0.9999 0.9987 0.9941 0.9830 0.9624 0.9295 0.8826 0.8208 0.7447 0.6563
4 1.0000 0.9999 0.9996 0.9984 0.9954 0.9891 0.9777 0.9590 0.9308 0.8906
5 1.0000 1.0000 1.0000 0.9999 0.9998 0.9993 0.9982 0.9959 0.9917 0.9844
6 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
7 1 0.9556 0.8503 0.7166 0.5767 0.4449 0.3294 0.2338 0.1586 0.1024 0.0625
2 0.9962 0.9743 0.9262 0.8520 0.7564 0.6471 0.5323 0.4199 0.3164 0.2266
3 0.9998 0.9973 0.9879 0.9667 0.9294 0.8740 0.8002 0.7102 0.6083 0.5000
4 1.0000 0.9998 0.9988 0.9953 0.9871 0.9712 0.9444 0.9037 0.8471 0.7734
5 1.0000 1.0000 0.9999 0.9996 0.9987 0.9962 0.9910 0.9812 0.9643 0.9375
6 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9994 0.9984 0.9963 0.9922
7 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
8 1 0.9428 0.8131 0.6572 0.5033 0.3671 0.2553 0.1691 0.1064 0.0632 0.0352
2 0.9942 0.9619 0.8948 0.7969 0.6785 0.5518 0.4278 0.3154 0.2201 0.1445
3 0.9996 0.9950 0.9786 0.9437 0.8862 0.8059 0.7064 0.5941 0.4770 0.3633
4 1.0000 0.9996 0.9971 0.9896 0.9727 0.9420 0.8939 0.8263 0.7396 0.6367
5 1.0000 1.0000 0.9998 0.9988 0.9958 0.9887 0.9747 0.9502 0.9115 0.8555
6 1.0000 1.0000 1.0000 0.9999 0.9996 0.9987 0.9964 0.9915 0.9819 0.9648
7 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9993 0.9983 0.9961
8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
9 1 0.9288 0.7748 0.5995 0.4362 0.3003 0.1960 0.1211 0.0705 0.0385 0.0195
2 0.9916 0.9470 0.8591 0.7382 0.6007 0.4628 0.3373 0.2318 0.1495 0.0898
3 0.9994 0.9917 0.9661 0.9144 0.8343 0.7297 0.6089 0.4826 0.3614 0.2539
4 1.0000 0.9991 0.9944 0.9804 0.9511 0.9012 0.8283 0.7334 0.6214 0.5000
5 1.0000 0.9999 0.9994 0.9969 0.9900 0.9747 0.9464 0.9006 0.8342 0.7461
6 1.0000 1.0000 1.0000 0.9997 0.9987 0.9957 0.9888 0.9750 0.9502 0.9102
7 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9986 0.9962 0.9909 0.9805
8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9992 0.9980
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
10 1 0.9139 0.7361 0.5443 0.3758 0.2440 0.1493 0.0860 0.0464 0.0233 0.0107
2 0.9885 0.9298 0.8202 0.6778 0.5256 0.3828 0.2616 0.1673 0.0996 0.0547
3 0.9990 0.9872 0.9500 0.8791 0.7759 0.6496 0.5138 0.3823 0.2660 0.1719
4 0.9999 0.9984 0.9901 0.9672 0.9219 0.8497 0.7515 0.6331 0.5044 0.3770
5 1.0000 0.9999 0.9986 0.9936 0.9803 0.9527 0.9051 0.8338 0.7384 0.6230
6 1.0000 1.0000 0.9999 0.9991 0.9965 0.9894 0.9740 0.9452 0.8980 0.8281
7 1.0000 1.0000 1.0000 0.9999 0.9996 0.9984 0.9952 0.9877 0.9726 0.9453
8 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9983 0.9955 0.9893
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
12 1 0.8816 0.6590 0.4435 0.2749 0.1584 0.0850 0.0424 0.0196 0.0083 0.0032
2 0.9804 0.8891 0.7358 0.5583 0.3907 0.2528 0.1513 0.0834 0.0421 0.0193
3 0.9978 0.9744 0.9078 0.7946 0.6488 0.4925 0.3467 0.2253 0.1345 0.0730
4 0.9998 0.9957 0.9761 0.9274 0.8424 0.7237 0.5833 0.4382 0.3044 0.1938
5 1.0000 0.9995 0.9954 0.9806 0.9456 0.8822 0.7873 0.6652 0.5269 0.3872
6 1.0000 0.9999 0.9993 0.9961 0.9857 0.9614 0.9154 0.8418 0.7393 0.6128
7 1.0000 1.0000 0.9999 0.9994 0.9972 0.9905 0.9745 0.9427 0.8883 0.8062
8 1.0000 1.0000 1.0000 0.9999 0.9996 0.9983 0.9944 0.9847 0.9644 0.9270
9 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9992 0.9972 0.9921 0.9807
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9989 0.9968
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
14 1 0.8470 0.5846 0.3567 0.1979 0.1010 0.0475 0.0205 0.0081 0.0029 0.0009
2 0.9699 0.8416 0.6479 0.4481 0.2811 0.1608 0.0839 0.0398 0.0170 0.0065
3 0.9958 0.9559 0.8535 0.6982 0.5213 0.3552 0.2205 0.1243 0.0632 0.0287
4 0.9996 0.9908 0.9533 0.8702 0.7415 0.5842 0.4227 0.2793 0.1672 0.0898
5 1.0000 0.9985 0.9885 0.9561 0.8883 0.7805 0.6405 0.4859 0.3373 0.2120
6 1.0000 0.9998 0.9978 0.9884 0.9617 0.9067 0.8164 0.6925 0.5461 0.3953
7 1.0000 1.0000 0.9997 0.9976 0.9897 0.9685 0.9247 0.8499 0.7414 0.6047
8 1.0000 1.0000 1.0000 0.9996 0.9978 0.9917 0.9757 0.9417 0.8811 0.7880
9 1.0000 1.0000 1.0000 1.0000 0.9997 0.9983 0.9940 0.9825 0.9574 0.9102
10 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9989 0.9961 0.9886 0.9713
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9978 0.9935
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9991
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
16 1 0.8108 0.5147 0.2839 0.1407 0.0635 0.0261 0.0098 0.0033 0.0010 0.0003
2 0.9571 0.7892 0.5614 0.3518 0.1971 0.0994 0.0451 0.0183 0.0066 0.0021
3 0.9930 0.9316 0.7899 0.5981 0.4050 0.2459 0.1339 0.0651 0.0281 0.0106
4 0.9991 0.9830 0.9209 0.7982 0.6302 0.4499 0.2892 0.1666 0.0853 0.0384
5 0.9999 0.9967 0.9765 0.9183 0.8103 0.6598 0.4900 0.3288 0.1976 0.1051
6 1.0000 0.9995 0.9944 0.9733 0.9204 0.8247 0.6881 0.5272 0.3660 0.2272
7 1.0000 0.9999 0.9989 0.9930 0.9729 0.9256 0.8406 0.7161 0.5629 0.4018
8 1.0000 1.0000 0.9998 0.9985 0.9925 0.9743 0.9329 0.8577 0.7441 0.5982
9 1.0000 1.0000 1.0000 0.9998 0.9984 0.9929 0.9771 0.9417 0.8759 0.7728
10 1.0000 1.0000 1.0000 1.0000 0.9997 0.9984 0.9938 0.9809 0.9514 0.8949
11 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987 0.9951 0.9851 0.9616
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9991 0.9965 0.9894
460 APÉNDICE D. TABLAS ESTADÍSTICAS
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9979
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
18 1 0.7735 0.4503 0.2241 0.0991 0.0395 0.0142 0.0046 0.0013 0.0003 0.0001
2 0.9419 0.7338 0.4797 0.2713 0.1353 0.0600 0.0236 0.0082 0.0025 0.0007
3 0.9891 0.9018 0.7202 0.5010 0.3057 0.1646 0.0783 0.0328 0.0120 0.0038
4 0.9985 0.9718 0.8794 0.7164 0.5187 0.3327 0.1886 0.0942 0.0411 0.0154
5 0.9998 0.9936 0.9581 0.8671 0.7175 0.5344 0.3550 0.2088 0.1077 0.0481
6 1.0000 0.9988 0.9882 0.9487 0.8610 0.7217 0.5491 0.3743 0.2258 0.1189
7 1.0000 0.9998 0.9973 0.9837 0.9431 0.8593 0.7283 0.5634 0.3915 0.2403
8 1.0000 1.0000 0.9995 0.9957 0.9807 0.9404 0.8609 0.7368 0.5778 0.4073
9 1.0000 1.0000 0.9999 0.9991 0.9946 0.9790 0.9403 0.8653 0.7473 0.5927
10 1.0000 1.0000 1.0000 0.9998 0.9988 0.9939 0.9788 0.9424 0.8720 0.7597
11 1.0000 1.0000 1.0000 1.0000 0.9998 0.9986 0.9938 0.9797 0.9463 0.8811
12 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9986 0.9942 0.9817 0.9519
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987 0.9951 0.9846
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9990 0.9962
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
20 1 0.7358 0.3917 0.1756 0.0692 0.0243 0.0076 0.0021 0.0005 0.0001 0.0000
2 0.9245 0.6769 0.4049 0.2061 0.0913 0.0355 0.0121 0.0036 0.0009 0.0002
3 0.9841 0.8670 0.6477 0.4114 0.2252 0.1071 0.0444 0.0160 0.0049 0.0013
4 0.9974 0.9568 0.8298 0.6296 0.4148 0.2375 0.1182 0.0510 0.0189 0.0059
5 0.9997 0.9887 0.9327 0.8042 0.6172 0.4164 0.2454 0.1256 0.0553 0.0207
6 1.0000 0.9976 0.9781 0.9133 0.7858 0.6080 0.4166 0.2500 0.1299 0.0577
7 1.0000 0.9996 0.9941 0.9679 0.8982 0.7723 0.6010 0.4159 0.2520 0.1316
8 1.0000 0.9999 0.9987 0.9900 0.9591 0.8867 0.7624 0.5956 0.4143 0.2517
9 1.0000 1.0000 0.9998 0.9974 0.9861 0.9520 0.8782 0.7553 0.5914 0.4119
10 1.0000 1.0000 1.0000 0.9994 0.9961 0.9829 0.9468 0.8725 0.7507 0.5881
11 1.0000 1.0000 1.0000 0.9999 0.9991 0.9949 0.9804 0.9435 0.8692 0.7483
12 1.0000 1.0000 1.0000 1.0000 0.9998 0.9987 0.9940 0.9790 0.9420 0.8684
13 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9985 0.9935 0.9786 0.9423
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9984 0.9936 0.9793
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9985 0.9941
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
19 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
20 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
D.3. DISTRIBUCIÓN DE POISSON 461
D.3. Distribución de Poisson
[x] −λ k
X e λ
P (X ≤ x) =
k!
k=0
x λ =0.1 λ =0.3 λ =0.5 λ =0.7 λ =0.9 λ =1.1 λ =1.3 λ =1.5 λ =1.7 λ =1.9
0 0.9048 0.7408 0.6065 0.4966 0.4066 0.3329 0.2725 0.2231 0.1827 0.1496
1 0.9953 0.9631 0.9098 0.8442 0.7725 0.6990 0.6268 0.5578 0.4932 0.4337
2 0.9998 0.9964 0.9856 0.9659 0.9371 0.9004 0.8571 0.8088 0.7572 0.7037
3 1.0000 0.9997 0.9982 0.9942 0.9865 0.9743 0.9569 0.9344 0.9068 0.8747
4 1.0000 1.0000 0.9998 0.9992 0.9977 0.9946 0.9893 0.9814 0.9704 0.9559
5 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990 0.9978 0.9955 0.9920 0.9868
6 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9991 0.9981 0.9966
7 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9996 0.9992
x λ =2 λ =3 λ =4 λ =5 λ =6 λ =7 λ =8 λ =9 λ =10 λ =11
0 0.1353 0.0498 0.0183 0.0067 0.0025 0.0009 0.0003 0.0001 0.0000 0.0000
1 0.4060 0.1991 0.0916 0.0404 0.0174 0.0073 0.0030 0.0012 0.0005 0.0002
2 0.6767 0.4232 0.2381 0.1247 0.0620 0.0296 0.0138 0.0062 0.0028 0.0012
3 0.8571 0.6472 0.4335 0.2650 0.1512 0.0818 0.0424 0.0212 0.0103 0.0049
4 0.9473 0.8153 0.6288 0.4405 0.2851 0.1730 0.0996 0.0550 0.0293 0.0151
5 0.9834 0.9161 0.7851 0.6160 0.4457 0.3007 0.1912 0.1157 0.0671 0.0375
6 0.9955 0.9665 0.8893 0.7622 0.6063 0.4497 0.3134 0.2068 0.1301 0.0786
7 0.9989 0.9881 0.9489 0.8666 0.7440 0.5987 0.4530 0.3239 0.2202 0.1432
8 0.9998 0.9962 0.9786 0.9319 0.8472 0.7291 0.5925 0.4557 0.3328 0.2320
9 1.0000 0.9989 0.9919 0.9682 0.9161 0.8305 0.7166 0.5874 0.4579 0.3405
10 1.0000 0.9997 0.9972 0.9863 0.9574 0.9015 0.8159 0.7060 0.5830 0.4599
11 1.0000 0.9999 0.9991 0.9945 0.9799 0.9467 0.8881 0.8030 0.6968 0.5793
12 1.0000 1.0000 0.9997 0.9980 0.9912 0.9730 0.9362 0.8758 0.7916 0.6887
13 1.0000 1.0000 0.9999 0.9993 0.9964 0.9872 0.9658 0.9261 0.8645 0.7813
14 1.0000 1.0000 1.0000 0.9998 0.9986 0.9943 0.9827 0.9585 0.9165 0.8540
15 1.0000 1.0000 1.0000 0.9999 0.9995 0.9976 0.9918 0.9780 0.9513 0.9074
16 1.0000 1.0000 1.0000 1.0000 0.9998 0.9990 0.9963 0.9889 0.9730 0.9441
17 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9984 0.9947 0.9857 0.9678
18 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9976 0.9928 0.9823
19 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9989 0.9965 0.9907
20 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9984 0.9953
21 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9993 0.9977
22 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990
x λ =12 λ =13 λ =14 λ =15 λ =16 λ =17 λ =18 λ =19 λ =20 λ =21
0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.0005 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.0023 0.0011 0.0005 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
4 0.0076 0.0037 0.0018 0.0009 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000
5 0.0203 0.0107 0.0055 0.0028 0.0014 0.0007 0.0003 0.0002 0.0001 0.0000
6 0.0458 0.0259 0.0142 0.0076 0.0040 0.0021 0.0010 0.0005 0.0003 0.0001
7 0.0895 0.0540 0.0316 0.0180 0.0100 0.0054 0.0029 0.0015 0.0008 0.0004
8 0.1550 0.0998 0.0621 0.0374 0.0220 0.0126 0.0071 0.0039 0.0021 0.0011
9 0.2424 0.1658 0.1094 0.0699 0.0433 0.0261 0.0154 0.0089 0.0050 0.0028
10 0.3472 0.2517 0.1757 0.1185 0.0774 0.0491 0.0304 0.0183 0.0108 0.0063
11 0.4616 0.3532 0.2600 0.1848 0.1270 0.0847 0.0549 0.0347 0.0214 0.0129
12 0.5760 0.4631 0.3585 0.2676 0.1931 0.1350 0.0917 0.0606 0.0390 0.0245
13 0.6815 0.5730 0.4644 0.3632 0.2745 0.2009 0.1426 0.0984 0.0661 0.0434
14 0.7720 0.6751 0.5704 0.4657 0.3675 0.2808 0.2081 0.1497 0.1049 0.0716
15 0.8444 0.7636 0.6694 0.5681 0.4667 0.3715 0.2867 0.2148 0.1565 0.1111
16 0.8987 0.8355 0.7559 0.6641 0.5660 0.4677 0.3751 0.2920 0.2211 0.1629
17 0.9370 0.8905 0.8272 0.7489 0.6593 0.5640 0.4686 0.3784 0.2970 0.2270
18 0.9626 0.9302 0.8826 0.8195 0.7423 0.6550 0.5622 0.4695 0.3814 0.3017
19 0.9787 0.9573 0.9235 0.8752 0.8122 0.7363 0.6509 0.5606 0.4703 0.3843
20 0.9884 0.9750 0.9521 0.9170 0.8682 0.8055 0.7307 0.6472 0.5591 0.4710
21 0.9939 0.9859 0.9712 0.9469 0.9108 0.8615 0.7991 0.7255 0.6437 0.5577
22 0.9970 0.9924 0.9833 0.9673 0.9418 0.9047 0.8551 0.7931 0.7206 0.6405
23 0.9985 0.9960 0.9907 0.9805 0.9633 0.9367 0.8989 0.8490 0.7875 0.7160
24 0.9993 0.9980 0.9950 0.9888 0.9777 0.9594 0.9317 0.8933 0.8432 0.7822
25 0.9997 0.9990 0.9974 0.9938 0.9869 0.9748 0.9554 0.9269 0.8878 0.8377
26 0.9999 0.9995 0.9987 0.9967 0.9925 0.9848 0.9718 0.9514 0.9221 0.8826
27 0.9999 0.9998 0.9994 0.9983 0.9959 0.9912 0.9827 0.9687 0.9475 0.9175
28 1.0000 0.9999 0.9997 0.9991 0.9978 0.9950 0.9897 0.9805 0.9657 0.9436
29 1.0000 1.0000 0.9999 0.9996 0.9989 0.9973 0.9941 0.9882 0.9782 0.9626
30 1.0000 1.0000 0.9999 0.9998 0.9994 0.9986 0.9967 0.9930 0.9865 0.9758
31 1.0000 1.0000 1.0000 0.9999 0.9997 0.9993 0.9982 0.9960 0.9919 0.9848
32 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9990 0.9978 0.9953 0.9907
33 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9995 0.9988 0.9973 0.9945
34 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9994 0.9985 0.9968
D.4. Distribución normal estándar

Z x
1 t2
Φ(x) = P (Z ≤ x) = √ e− 2 dt
−∞ 2π
x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
D.5. DISTRIBUCIÓN T DE STUDENT 463
D.5. Distribución t de Student
x
Γ n+1
Z
2 2 − n+1
Ftn (x) = P (tn ≤ x) = √ n (1 − t )
2 dt = t
n,1−α
−∞ nπ Γ 2
1−α n =1 n =2 n =3 n =4 n =5 n =6 n =7 n =8 n =9 n =10
0.500 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.550 0.1584 0.1421 0.1366 0.1338 0.1322 0.1311 0.1303 0.1297 0.1293 0.1289
0.600 0.3249 0.2887 0.2767 0.2707 0.2672 0.2648 0.2632 0.2619 0.2610 0.2602
0.650 0.5095 0.4447 0.4242 0.4142 0.4082 0.4043 0.4015 0.3995 0.3979 0.3966
0.700 0.7265 0.6172 0.5844 0.5686 0.5594 0.5534 0.5491 0.5459 0.5435 0.5415
0.750 1.0000 0.8165 0.7649 0.7407 0.7267 0.7176 0.7111 0.7064 0.7027 0.6998
0.800 1.3764 1.0607 0.9785 0.9410 0.9195 0.9057 0.8960 0.8889 0.8834 0.8791
0.850 1.9626 1.3862 1.2498 1.1896 1.1558 1.1342 1.1192 1.1081 1.0997 1.0931
0.900 3.0777 1.8856 1.6377 1.5332 1.4759 1.4398 1.4149 1.3968 1.3830 1.3722
0.905 3.2506 1.9534 1.6880 1.5767 1.5158 1.4775 1.4513 1.4321 1.4175 1.4061
0.910 3.4420 2.0261 1.7413 1.6226 1.5579 1.5172 1.4894 1.4691 1.4537 1.4416
0.915 3.6554 2.1045 1.7981 1.6712 1.6023 1.5590 1.5295 1.5079 1.4916 1.4788
0.920 3.8947 2.1894 1.8589 1.7229 1.6493 1.6033 1.5718 1.5489 1.5315 1.5179
0.925 4.1653 2.2819 1.9243 1.7782 1.6994 1.6502 1.6166 1.5922 1.5737 1.5592
0.930 4.4737 2.3834 1.9950 1.8375 1.7529 1.7002 1.6643 1.6383 1.6185 1.6031
0.935 4.8288 2.4954 2.0719 1.9016 1.8104 1.7538 1.7153 1.6874 1.6663 1.6498
0.940 5.2422 2.6202 2.1562 1.9712 1.8727 1.8117 1.7702 1.7402 1.7176 1.6998
0.945 5.7297 2.7604 2.2494 2.0475 1.9405 1.8744 1.8297 1.7973 1.7729 1.7538
0.950 6.3138 2.9200 2.3534 2.1318 2.0150 1.9432 1.8946 1.8595 1.8331 1.8125
0.955 7.0264 3.1040 2.4708 2.2261 2.0978 2.0192 1.9662 1.9280 1.8992 1.8768
0.960 7.9158 3.3198 2.6054 2.3329 2.1910 2.1043 2.0460 2.0042 1.9727 1.9481
0.965 9.0579 3.5782 2.7626 2.4559 2.2974 2.2011 2.1365 2.0902 2.0554 2.0283
0.970 10.5789 3.8964 2.9505 2.6008 2.4216 2.3133 2.2409 2.1892 2.1504 2.1202
0.975 12.7062 4.3027 3.1824 2.7764 2.5706 2.4469 2.3646 2.3060 2.2622 2.2281
0.980 15.8945 4.8487 3.4819 2.9985 2.7565 2.6122 2.5168 2.4490 2.3984 2.3593
0.985 21.2049 5.6428 3.8960 3.2976 3.0029 2.8289 2.7146 2.6338 2.5738 2.5275
0.990 31.8205 6.9646 4.5407 3.7469 3.3649 3.1427 2.9980 2.8965 2.8214 2.7638
0.995 63.6567 9.9248 5.8409 4.6041 4.0321 3.7074 3.4995 3.3554 3.2498 3.1693
0.999 318.3088 22.3271 10.2145 7.1732 5.8934 5.2076 4.7853 4.5008 4.2968 4.1437
1−α n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
0.500 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.550 0.1286 0.1283 0.1281 0.1280 0.1278 0.1277 0.1276 0.1274 0.1274 0.1273
0.600 0.2596 0.2590 0.2586 0.2582 0.2579 0.2576 0.2573 0.2571 0.2569 0.2567
0.650 0.3956 0.3947 0.3940 0.3933 0.3928 0.3923 0.3919 0.3915 0.3912 0.3909
0.700 0.5399 0.5386 0.5375 0.5366 0.5357 0.5350 0.5344 0.5338 0.5333 0.5329
0.750 0.6974 0.6955 0.6938 0.6924 0.6912 0.6901 0.6892 0.6884 0.6876 0.6870
0.800 0.8755 0.8726 0.8702 0.8681 0.8662 0.8647 0.8633 0.8620 0.8610 0.8600
0.850 1.0877 1.0832 1.0795 1.0763 1.0735 1.0711 1.0690 1.0672 1.0655 1.0640
0.900 1.3634 1.3562 1.3502 1.3450 1.3406 1.3368 1.3334 1.3304 1.3277 1.3253
0.905 1.3969 1.3892 1.3829 1.3774 1.3728 1.3687 1.3652 1.3620 1.3592 1.3567
0.910 1.4318 1.4237 1.4170 1.4113 1.4063 1.4021 1.3983 1.3950 1.3920 1.3894
0.915 1.4684 1.4599 1.4528 1.4467 1.4415 1.4369 1.4330 1.4295 1.4263 1.4235
0.920 1.5069 1.4979 1.4903 1.4839 1.4784 1.4736 1.4694 1.4656 1.4623 1.4593
0.925 1.5476 1.5380 1.5299 1.5231 1.5172 1.5121 1.5077 1.5037 1.5002 1.4970
0.930 1.5906 1.5804 1.5718 1.5646 1.5583 1.5529 1.5482 1.5439 1.5402 1.5369
0.935 1.6365 1.6256 1.6164 1.6087 1.6020 1.5962 1.5911 1.5867 1.5827 1.5791
0.940 1.6856 1.6739 1.6641 1.6558 1.6487 1.6425 1.6370 1.6322 1.6280 1.6242
0.945 1.7385 1.7259 1.7154 1.7064 1.6988 1.6921 1.6863 1.6812 1.6766 1.6725
0.950 1.7959 1.7823 1.7709 1.7613 1.7531 1.7459 1.7396 1.7341 1.7291 1.7247
0.955 1.8588 1.8440 1.8317 1.8213 1.8123 1.8046 1.7978 1.7918 1.7864 1.7816
0.960 1.9284 1.9123 1.8989 1.8875 1.8777 1.8693 1.8619 1.8553 1.8495 1.8443
0.965 2.0067 1.9889 1.9742 1.9617 1.9509 1.9417 1.9335 1.9264 1.9200 1.9143
0.970 2.0961 2.0764 2.0600 2.0462 2.0343 2.0240 2.0150 2.0071 2.0000 1.9937
0.975 2.2010 2.1788 2.1604 2.1448 2.1314 2.1199 2.1098 2.1009 2.0930 2.0860
0.980 2.3281 2.3027 2.2816 2.2638 2.2485 2.2354 2.2238 2.2137 2.2047 2.1967
0.985 2.4907 2.4607 2.4358 2.4149 2.3970 2.3815 2.3681 2.3562 2.3456 2.3362
0.990 2.7181 2.6810 2.6503 2.6245 2.6025 2.5835 2.5669 2.5524 2.5395 2.5280
0.995 3.1058 3.0545 3.0123 2.9768 2.9467 2.9208 2.8982 2.8784 2.8609 2.8453
0.999 4.0247 3.9296 3.8520 3.7874 3.7328 3.6862 3.6458 3.6105 3.5794 3.5518
1−α n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
0.500 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.550 0.1272 0.1271 0.1271 0.1270 0.1269 0.1269 0.1268 0.1268 0.1268 0.1267
0.600 0.2566 0.2564 0.2563 0.2562 0.2561 0.2560 0.2559 0.2558 0.2557 0.2556
0.650 0.3906 0.3904 0.3902 0.3900 0.3898 0.3896 0.3894 0.3893 0.3892 0.3890
0.700 0.5325 0.5321 0.5317 0.5314 0.5312 0.5309 0.5306 0.5304 0.5302 0.5300
0.750 0.6864 0.6858 0.6853 0.6848 0.6844 0.6840 0.6837 0.6834 0.6830 0.6828
0.800 0.8591 0.8583 0.8575 0.8569 0.8562 0.8557 0.8551 0.8546 0.8542 0.8538
0.850 1.0627 1.0614 1.0603 1.0593 1.0584 1.0575 1.0567 1.0560 1.0553 1.0547
0.900 1.3232 1.3212 1.3195 1.3178 1.3163 1.3150 1.3137 1.3125 1.3114 1.3104
0.905 1.3544 1.3524 1.3505 1.3488 1.3472 1.3458 1.3444 1.3432 1.3420 1.3410
0.910 1.3870 1.3848 1.3828 1.3810 1.3794 1.3778 1.3764 1.3751 1.3739 1.3728
0.915 1.4210 1.4187 1.4166 1.4147 1.4130 1.4113 1.4098 1.4085 1.4072 1.4060
0.920 1.4567 1.4542 1.4520 1.4500 1.4482 1.4464 1.4449 1.4434 1.4421 1.4408
0.925 1.4942 1.4916 1.4893 1.4871 1.4852 1.4834 1.4817 1.4801 1.4787 1.4774
0.930 1.5338 1.5311 1.5286 1.5263 1.5242 1.5223 1.5205 1.5189 1.5174 1.5159
0.935 1.5759 1.5730 1.5703 1.5679 1.5657 1.5636 1.5617 1.5600 1.5583 1.5568
0.940 1.6207 1.6176 1.6148 1.6122 1.6098 1.6076 1.6056 1.6037 1.6020 1.6004
0.945 1.6688 1.6655 1.6624 1.6596 1.6571 1.6547 1.6526 1.6506 1.6487 1.6470
0.950 1.7207 1.7171 1.7139 1.7109 1.7081 1.7056 1.7033 1.7011 1.6991 1.6973
0.955 1.7773 1.7734 1.7699 1.7667 1.7637 1.7610 1.7585 1.7561 1.7540 1.7520
0.960 1.8397 1.8354 1.8316 1.8281 1.8248 1.8219 1.8191 1.8166 1.8142 1.8120
0.965 1.9092 1.9045 1.9003 1.8965 1.8929 1.8897 1.8867 1.8839 1.8813 1.8789
0.970 1.9880 1.9829 1.9782 1.9740 1.9701 1.9665 1.9632 1.9601 1.9573 1.9546
0.975 2.0796 2.0739 2.0687 2.0639 2.0595 2.0555 2.0518 2.0484 2.0452 2.0423
0.980 2.1894 2.1829 2.1770 2.1715 2.1666 2.1620 2.1578 2.1539 2.1503 2.1470
0.985 2.3278 2.3202 2.3132 2.3069 2.3011 2.2958 2.2909 2.2864 2.2822 2.2783
0.990 2.5176 2.5083 2.4999 2.4922 2.4851 2.4786 2.4727 2.4671 2.4620 2.4573
0.995 2.8314 2.8188 2.8073 2.7969 2.7874 2.7787 2.7707 2.7633 2.7564 2.7500
0.999 3.5272 3.5050 3.4850 3.4668 3.4502 3.4350 3.4210 3.4082 3.3962 3.3852
D.5. DISTRIBUCIÓN T DE STUDENT 465
1−α n =40 n =50 n =60 n =70 n =80 n =90 n =100 n =150 n =500 n =1000
0.500 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.550 0.1265 0.1263 0.1262 0.1261 0.1261 0.1260 0.1260 0.1259 0.1257 0.1257
0.600 0.2550 0.2547 0.2545 0.2543 0.2542 0.2541 0.2540 0.2538 0.2535 0.2534
0.650 0.3881 0.3875 0.3872 0.3869 0.3867 0.3866 0.3864 0.3861 0.3855 0.3854
0.700 0.5286 0.5278 0.5272 0.5268 0.5265 0.5263 0.5261 0.5255 0.5247 0.5246
0.750 0.6807 0.6794 0.6786 0.6780 0.6776 0.6772 0.6770 0.6761 0.6750 0.6747
0.800 0.8507 0.8489 0.8477 0.8468 0.8461 0.8456 0.8452 0.8440 0.8423 0.8420
0.850 1.0500 1.0473 1.0455 1.0442 1.0432 1.0424 1.0418 1.0400 1.0375 1.0370
0.900 1.3031 1.2987 1.2958 1.2938 1.2922 1.2910 1.2901 1.2872 1.2832 1.2824
0.905 1.3332 1.3286 1.3256 1.3234 1.3218 1.3205 1.3195 1.3165 1.3124 1.3115
0.910 1.3646 1.3598 1.3566 1.3543 1.3526 1.3513 1.3502 1.3470 1.3426 1.3417
0.915 1.3974 1.3923 1.3889 1.3865 1.3847 1.3833 1.3822 1.3788 1.3742 1.3732
0.920 1.4317 1.4263 1.4227 1.4202 1.4183 1.4168 1.4156 1.4121 1.4072 1.4061
0.925 1.4677 1.4620 1.4582 1.4555 1.4535 1.4519 1.4507 1.4469 1.4417 1.4406
0.930 1.5057 1.4996 1.4956 1.4927 1.4906 1.4889 1.4876 1.4836 1.4781 1.4770
0.935 1.5459 1.5394 1.5352 1.5321 1.5298 1.5281 1.5267 1.5225 1.5166 1.5153
0.940 1.5887 1.5818 1.5772 1.5740 1.5716 1.5697 1.5682 1.5637 1.5574 1.5561
0.945 1.6345 1.6271 1.6222 1.6187 1.6161 1.6141 1.6125 1.6077 1.6010 1.5996
0.950 1.6839 1.6759 1.6706 1.6669 1.6641 1.6620 1.6602 1.6551 1.6479 1.6464
0.955 1.7375 1.7289 1.7232 1.7192 1.7162 1.7138 1.7120 1.7064 1.6987 1.6970
0.960 1.7963 1.7870 1.7808 1.7765 1.7732 1.7707 1.7687 1.7626 1.7543 1.7525
0.965 1.8617 1.8516 1.8448 1.8401 1.8365 1.8337 1.8315 1.8249 1.8158 1.8139
0.970 1.9357 1.9244 1.9170 1.9118 1.9078 1.9048 1.9024 1.8951 1.8851 1.8829
0.975 2.0211 2.0086 2.0003 1.9944 1.9901 1.9867 1.9840 1.9759 1.9647 1.9623
0.980 2.1229 2.1087 2.0994 2.0927 2.0878 2.0839 2.0809 2.0718 2.0591 2.0564
0.985 2.2503 2.2338 2.2229 2.2152 2.2095 2.2050 2.2015 2.1909 2.1763 2.1732
0.990 2.4233 2.4033 2.3901 2.3808 2.3739 2.3685 2.3642 2.3515 2.3338 2.3301
0.995 2.7045 2.6778 2.6603 2.6479 2.6387 2.6316 2.6259 2.6090 2.5857 2.5808
0.999 3.3069 3.2614 3.2317 3.2108 3.1953 3.1833 3.1737 3.1455 3.1066 3.0984
D.6. Distribución Ji-cuadrado de Pearson
Z x
1 n−2 t
Fχ2n (x) = P χ2n ≤ x = e− 2 dt = χ2n,1−α

n n
t 2
0 2 Γ
2
2
1−α n =1 n =2 n =3 n =4 n =5 n =6 n =7 n =8 n =9 n =10
0.005 0.0000 0.0100 0.0717 0.2070 0.4117 0.6757 0.9893 1.3444 1.7349 2.1559
0.010 0.0002 0.0201 0.1148 0.2971 0.5543 0.8721 1.2390 1.6465 2.0879 2.5582
0.015 0.0004 0.0302 0.1516 0.3682 0.6618 1.0160 1.4184 1.8603 2.3349 2.8372
0.020 0.0006 0.0404 0.1848 0.4294 0.7519 1.1344 1.5643 2.0325 2.5324 3.0591
0.025 0.0010 0.0506 0.2158 0.4844 0.8312 1.2373 1.6899 2.1797 2.7004 3.2470
0.030 0.0014 0.0609 0.2451 0.5351 0.9031 1.3296 1.8016 2.3101 2.8485 3.4121
0.035 0.0019 0.0713 0.2731 0.5824 0.9693 1.4140 1.9033 2.4281 2.9821 3.5606
0.040 0.0025 0.0816 0.3002 0.6271 1.0313 1.4924 1.9971 2.5366 3.1047 3.6965
0.045 0.0032 0.0921 0.3263 0.6698 1.0898 1.5659 2.0848 2.6377 3.2185 3.8225
0.050 0.0039 0.1026 0.3518 0.7107 1.1455 1.6354 2.1673 2.7326 3.3251 3.9403
0.055 0.0048 0.1131 0.3768 0.7502 1.1987 1.7016 2.2457 2.8225 3.4258 4.0514
0.060 0.0057 0.1238 0.4012 0.7884 1.2499 1.7649 2.3205 2.9080 3.5215 4.1567
0.065 0.0067 0.1344 0.4251 0.8255 1.2993 1.8258 2.3921 2.9897 3.6128 4.2572
0.070 0.0077 0.1451 0.4487 0.8616 1.3472 1.8846 2.4611 3.0683 3.7004 4.3534
0.075 0.0089 0.1559 0.4720 0.8969 1.3937 1.9415 2.5277 3.1440 3.7847 4.4459
0.080 0.0101 0.1668 0.4949 0.9315 1.4390 1.9967 2.5921 3.2172 3.8661 4.5350
0.085 0.0114 0.1777 0.5176 0.9654 1.4832 2.0505 2.6548 3.2881 3.9449 4.6213
0.090 0.0128 0.1886 0.5401 0.9987 1.5264 2.1029 2.7157 3.3570 4.0214 4.7049
0.095 0.0142 0.1996 0.5623 1.0314 1.5688 2.1540 2.7751 3.4241 4.0957 4.7861
0.100 0.0158 0.2107 0.5844 1.0636 1.6103 2.2041 2.8331 3.4895 4.1682 4.8652
0.900 2.7055 4.6052 6.2514 7.7794 9.2364 10.6446 12.0170 13.3616 14.6837 15.9872
0.905 2.7875 4.7078 6.3684 7.9082 9.3753 10.7927 12.1734 13.5256 14.8549 16.1652
0.910 2.8744 4.8159 6.4915 8.0434 9.5211 10.9479 12.3372 13.6975 15.0342 16.3516
0.915 2.9666 4.9302 6.6213 8.1859 9.6745 11.1112 12.5095 13.8780 15.2226 16.5473
0.920 3.0649 5.0515 6.7587 8.3365 9.8366 11.2835 12.6912 14.0684 15.4211 16.7535
0.925 3.1701 5.1805 6.9046 8.4963 10.0083 11.4659 12.8834 14.2697 15.6309 16.9714
0.930 3.2830 5.3185 7.0603 8.6664 10.1910 11.6599 13.0877 14.4836 15.8537 17.2026
0.935 3.4050 5.4667 7.2271 8.8485 10.3863 11.8671 13.3058 14.7117 16.0913 17.4490
0.940 3.5374 5.6268 7.4069 9.0444 10.5962 12.0896 13.5397 14.9563 16.3459 17.7131
0.945 3.6821 5.8008 7.6018 9.2564 10.8232 12.3300 13.7924 15.2203 16.6206 17.9978
0.950 3.8415 5.9915 7.8147 9.4877 11.0705 12.5916 14.0671 15.5073 16.9190 18.3070
0.955 4.0186 6.2022 8.0495 9.7423 11.3423 12.8789 14.3686 15.8220 17.2460 18.6457
0.960 4.2179 6.4378 8.3112 10.0255 11.6443 13.1978 14.7030 16.1708 17.6083 19.0207
0.965 4.4452 6.7048 8.6069 10.3450 11.9846 13.5567 15.0790 16.5626 18.0150 19.4415
0.970 4.7093 7.0131 8.9473 10.7119 12.3746 13.9676 15.5091 17.0105 18.4796 19.9219
0.975 5.0239 7.3778 9.3484 11.1433 12.8325 14.4494 16.0128 17.5345 19.0228 20.4832
0.980 5.4119 7.8240 9.8374 11.6678 13.3882 15.0332 16.6224 18.1682 19.6790 21.1608
0.985 5.9165 8.3994 10.4650 12.3391 14.0978 15.7774 17.3984 18.9739 20.5125 22.0206
0.990 6.6349 9.2103 11.3449 13.2767 15.0863 16.8119 18.4753 20.0902 21.6660 23.2093
0.995 7.8794 10.5966 12.8382 14.8603 16.7496 18.5476 20.2777 21.9550 23.5894 25.1882
D.6. DISTRIBUCIÓN JI-CUADRADO DE PEARSON 467
1−α n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
0.005 0.0000 0.0100 0.0717 0.2070 0.4117 0.6757 0.9893 1.3444 1.7349 7.4338
0.010 0.0002 0.0201 0.1148 0.2971 0.5543 0.8721 1.2390 1.6465 2.0879 8.2604
0.015 0.0004 0.0302 0.1516 0.3682 0.6618 1.0160 1.4184 1.8603 2.3349 8.8105
0.020 0.0006 0.0404 0.1848 0.4294 0.7519 1.1344 1.5643 2.0325 2.5324 9.2367
0.025 0.0010 0.0506 0.2158 0.4844 0.8312 1.2373 1.6899 2.1797 2.7004 9.5908
0.030 0.0014 0.0609 0.2451 0.5351 0.9031 1.3296 1.8016 2.3101 2.8485 9.8971
0.035 0.0019 0.0713 0.2731 0.5824 0.9693 1.4140 1.9033 2.4281 2.9821 10.1692
0.040 0.0025 0.0816 0.3002 0.6271 1.0313 1.4924 1.9971 2.5366 3.1047 10.4154
0.045 0.0032 0.0921 0.3263 0.6698 1.0898 1.5659 2.0848 2.6377 3.2185 10.6413
0.050 0.0039 0.1026 0.3518 0.7107 1.1455 1.6354 2.1673 2.7326 3.3251 10.8508
0.055 0.0048 0.1131 0.3768 0.7502 1.1987 1.7016 2.2457 2.8225 3.4258 11.0468
0.060 0.0057 0.1238 0.4012 0.7884 1.2499 1.7649 2.3205 2.9080 3.5215 11.2314
0.065 0.0067 0.1344 0.4251 0.8255 1.2993 1.8258 2.3921 2.9897 3.6128 11.4062
0.070 0.0077 0.1451 0.4487 0.8616 1.3472 1.8846 2.4611 3.0683 3.7004 11.5727
0.075 0.0089 0.1559 0.4720 0.8969 1.3937 1.9415 2.5277 3.1440 3.7847 11.7317
0.080 0.0101 0.1668 0.4949 0.9315 1.4390 1.9967 2.5921 3.2172 3.8661 11.8843
0.085 0.0114 0.1777 0.5176 0.9654 1.4832 2.0505 2.6548 3.2881 3.9449 12.0311
0.090 0.0128 0.1886 0.5401 0.9987 1.5264 2.1029 2.7157 3.3570 4.0214 12.1728
0.095 0.0142 0.1996 0.5623 1.0314 1.5688 2.1540 2.7751 3.4241 4.0957 12.3098
0.100 0.0158 0.2107 0.5844 1.0636 1.6103 2.2041 2.8331 3.4895 4.1682 12.4426
0.900 2.7055 4.6052 6.2514 7.7794 9.2364 10.6446 12.0170 13.3616 14.6837 28.4120
0.905 2.7875 4.7078 6.3684 7.9082 9.3753 10.7927 12.1734 13.5256 14.8549 28.6444
0.910 2.8744 4.8159 6.4915 8.0434 9.5211 10.9479 12.3372 13.6975 15.0342 28.8874
0.915 2.9666 4.9302 6.6213 8.1859 9.6745 11.1112 12.5095 13.8780 15.2226 29.1420
0.920 3.0649 5.0515 6.7587 8.3365 9.8366 11.2835 12.6912 14.0684 15.4211 29.4097
0.925 3.1701 5.1805 6.9046 8.4963 10.0083 11.4659 12.8834 14.2697 15.6309 29.6920
0.930 3.2830 5.3185 7.0603 8.6664 10.1910 11.6599 13.0877 14.4836 15.8537 29.9910
0.935 3.4050 5.4667 7.2271 8.8485 10.3863 11.8671 13.3058 14.7117 16.0913 30.3089
0.940 3.5374 5.6268 7.4069 9.0444 10.5962 12.0896 13.5397 14.9563 16.3459 30.6489
0.945 3.6821 5.8008 7.6018 9.2564 10.8232 12.3300 13.7924 15.2203 16.6206 31.0144
0.950 3.8415 5.9915 7.8147 9.4877 11.0705 12.5916 14.0671 15.5073 16.9190 31.4104
0.955 4.0186 6.2022 8.0495 9.7423 11.3423 12.8789 14.3686 15.8220 17.2460 31.8430
0.960 4.2179 6.4378 8.3112 10.0255 11.6443 13.1978 14.7030 16.1708 17.6083 32.3206
0.965 4.4452 6.7048 8.6069 10.3450 11.9846 13.5567 15.0790 16.5626 18.0150 32.8547
0.970 4.7093 7.0131 8.9473 10.7119 12.3746 13.9676 15.5091 17.0105 18.4796 33.4624
0.975 5.0239 7.3778 9.3484 11.1433 12.8325 14.4494 16.0128 17.5345 19.0228 34.1696
0.980 5.4119 7.8240 9.8374 11.6678 13.3882 15.0332 16.6224 18.1682 19.6790 35.0196
0.985 5.9165 8.3994 10.4650 12.3391 14.0978 15.7774 17.3984 18.9739 20.5125 36.0926
0.990 6.6349 9.2103 11.3449 13.2767 15.0863 16.8119 18.4753 20.0902 21.6660 37.5662
0.995 7.8794 10.5966 12.8382 14.8603 16.7496 18.5476 20.2777 21.9550 23.5894 39.9968
1−α n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
0.005 8.0337 8.6427 9.2604 9.8862 10.5197 11.1602 11.8076 12.4613 13.1211 13.7867
0.010 8.8972 9.5425 10.1957 10.8564 11.5240 12.1981 12.8785 13.5647 14.2565 14.9535
0.015 9.4708 10.1390 10.8147 11.4974 12.1867 12.8821 13.5833 14.2900 15.0019 15.7188
0.020 9.9146 10.6000 11.2926 11.9918 12.6973 13.4086 14.1254 14.8475 15.5745 16.3062
0.025 10.2829 10.9823 11.6886 12.4012 13.1197 13.8439 14.5734 15.3079 16.0471 16.7908
0.030 10.6013 11.3125 12.0303 12.7543 13.4840 14.2190 14.9592 15.7042 16.4538 17.2076
0.035 10.8839 11.6055 12.3334 13.0672 13.8066 14.5512 15.3007 16.0549 16.8134 17.5761
0.040 11.1395 11.8703 12.6072 13.3498 14.0978 14.8509 15.6087 16.3711 17.1377 17.9083
0.045 11.3740 12.1131 12.8581 13.6087 14.3645 15.1253 15.8906 16.6603 17.4342 18.2119
0.050 11.5913 12.3380 13.0905 13.8484 14.6114 15.3792 16.1514 16.9279 17.7084 18.4927
0.055 11.7945 12.5483 13.3077 14.0723 14.8419 15.6162 16.3948 17.1775 17.9641 18.7545
0.060 11.9858 12.7461 13.5120 14.2829 15.0587 15.8390 16.6235 17.4121 18.2044 19.0004
0.065 12.1670 12.9335 13.7053 14.4822 15.2637 16.0497 16.8398 17.6338 18.4315 19.2328
0.070 12.3394 13.1117 13.8892 14.6716 15.4586 16.2499 17.0453 17.8444 18.6472 19.4534
0.075 12.5041 13.2819 14.0648 14.8525 15.6447 16.4410 17.2414 18.0454 18.8530 19.6639
0.080 12.6620 13.4451 14.2331 15.0259 15.8229 16.6241 17.4291 18.2378 19.0500 19.8654
0.085 12.8140 13.6020 14.3950 15.1925 15.9942 16.8000 17.6096 18.4227 19.2392 20.0589
0.090 12.9605 13.7534 14.5510 15.3531 16.1594 16.9695 17.7834 18.6008 19.4214 20.2452
0.095 13.1023 13.8997 14.7019 15.5083 16.3189 17.1333 17.9513 18.7728 19.5974 20.4251
0.100 13.2396 14.0415 14.8480 15.6587 16.4734 17.2919 18.1139 18.9392 19.7677 20.5992
0.900 29.6151 30.8133 32.0069 33.1962 34.3816 35.5632 36.7412 37.9159 39.0875 40.2560
0.905 29.8521 31.0548 32.2528 33.4464 34.6359 35.8216 37.0036 38.1823 39.3577 40.5300
0.910 30.0998 31.3071 32.5096 33.7077 34.9015 36.0915 37.2777 38.4604 39.6398 40.8161
0.915 30.3594 31.5715 32.7788 33.9814 35.1798 36.3741 37.5647 38.7517 39.9353 41.1157
0.920 30.6322 31.8494 33.0616 34.2690 35.4721 36.6711 37.8662 39.0577 40.2456 41.4304
0.925 30.9200 32.1424 33.3597 34.5723 35.7803 36.9841 38.1840 39.3801 40.5727 41.7619
0.930 31.2246 32.4526 33.6754 34.8932 36.1065 37.3154 38.5202 39.7213 40.9187 42.1126
0.935 31.5486 32.7825 34.0110 35.2344 36.4531 37.6674 38.8776 40.0838 41.2863 42.4852
0.940 31.8949 33.1350 34.3696 35.5990 36.8235 38.0435 39.2593 40.4710 41.6789 42.8831
0.945 32.2673 33.5140 34.7551 35.9908 37.2216 38.4477 39.6694 40.8870 42.1006 43.3106
0.950 32.6706 33.9244 35.1725 36.4150 37.6525 38.8851 40.1133 41.3371 42.5570 43.7730
0.955 33.1111 34.3726 35.6282 36.8782 38.1228 39.3626 40.5977 41.8283 43.0549 44.2774
0.960 33.5972 34.8673 36.1311 37.3891 38.6416 39.8891 41.1318 42.3699 43.6038 44.8336
0.965 34.1409 35.4203 36.6932 37.9601 39.2214 40.4775 41.7285 42.9749 44.2169 45.4546
0.970 34.7593 36.0492 37.3323 38.6093 39.8804 41.1460 42.4066 43.6622 44.9132 46.1599
0.975 35.4789 36.7807 38.0756 39.3641 40.6465 41.9232 43.1945 44.4608 45.7223 46.9792
0.980 36.3434 37.6595 38.9683 40.2704 41.5661 42.8558 44.1400 45.4188 46.6927 47.9618
0.985 37.4345 38.7681 40.0941 41.4130 42.7252 44.0311 45.3311 46.6256 47.9147 49.1989
0.990 38.9322 40.2894 41.6384 42.9798 44.3141 45.6417 46.9629 48.2782 49.5879 50.8922
0.995 41.4011 42.7957 44.1813 45.5585 46.9279 48.2899 49.6449 50.9934 52.3356 53.6720
1−α n =40 n =50 n =60 n =70 n =80 n =90 n =100 n =150 n =500 n =1000
0.005 20.7065 27.9907 35.5345 43.2752 51.1719 59.1963 67.3276 109.1422 422.3034 888.5635
0.010 22.1643 29.7067 37.4849 45.4417 53.5401 61.7541 70.0649 112.6676 429.3875 898.9124
0.015 23.1130 30.8180 38.7435 46.8362 55.0612 63.3942 71.8177 114.9148 433.8652 905.4354
0.020 23.8376 31.6639 39.6994 47.8934 56.2128 64.6347 73.1422 116.6076 437.2194 910.3127
0.025 24.4330 32.3574 40.4817 48.7576 57.1532 65.6466 74.2219 117.9845 439.9360 914.2572
0.030 24.9437 32.9509 41.1504 49.4953 57.9553 66.5093 75.1419 119.1554 442.2381 917.5959
0.035 25.3940 33.4734 41.7383 50.1434 58.6595 67.2661 75.9486 120.1806 444.2476 920.5074
0.040 25.7989 33.9426 42.2656 50.7243 59.2902 67.9437 76.6705 121.0968 446.0389 923.1005
0.045 26.1684 34.3702 42.7458 51.2528 59.8638 68.5597 77.3265 121.9283 447.6607 925.4463
0.050 26.5093 34.7643 43.1880 51.7393 60.3915 69.1260 77.9295 122.6918 449.1468 927.5944
0.055 26.8268 35.1308 43.5990 52.1911 60.8814 69.6517 78.4890 123.3995 450.5216 929.5803
0.060 27.1245 35.4743 43.9838 52.6140 61.3397 70.1433 79.0121 124.0605 451.8035 931.4309
0.065 27.4055 35.7981 44.3464 53.0123 61.7712 70.6060 79.5042 124.6818 453.0064 933.1666
0.070 27.6720 36.1050 44.6898 53.3893 62.1795 71.0436 79.9697 125.2690 454.1416 934.8035
0.075 27.9258 36.3971 45.0165 53.7478 62.5676 71.4596 80.4119 125.8265 455.2177 936.3546
0.080 28.1686 36.6762 45.3285 54.0900 62.9380 71.8564 80.8338 126.3579 456.2419 937.8303
0.085 28.4014 36.9438 45.6274 54.4178 63.2926 72.2363 81.2375 126.8661 457.2203 939.2392
0.090 28.6255 37.2010 45.9147 54.7328 63.6333 72.6010 81.6251 127.3537 458.1578 940.5887
0.095 28.8416 37.4490 46.1915 55.0361 63.9612 72.9522 81.9982 127.8228 459.0585 941.8847
0.100 29.0505 37.6886 46.4589 55.3289 64.2778 73.2911 82.3581 128.2751 459.9261 943.1326
0.900 51.8051 63.1671 74.3970 85.5270 96.5782 107.5650 118.4980 172.5812 540.9303 1057.7239
0.905 52.1140 63.5068 74.7645 85.9200 96.9950 108.0041 118.9582 173.1337 541.8982 1059.0721
0.910 52.4364 63.8612 75.1477 86.3298 97.4295 108.4618 119.4378 173.7094 542.9056 1060.4748
0.915 52.7738 64.2319 75.5485 86.7583 97.8836 108.9401 119.9390 174.3106 543.9568 1061.9380
0.920 53.1280 64.6208 75.9689 87.2076 98.3598 109.4415 120.4643 174.9404 545.0568 1063.4686
0.925 53.5010 65.0303 76.4113 87.6802 98.8606 109.9688 121.0166 175.6024 546.2118 1065.0750
0.930 53.8952 65.4629 76.8786 88.1794 99.3894 110.5255 121.5996 176.3007 547.4288 1066.7669
0.935 54.3139 65.9220 77.3743 88.7088 99.9502 111.1156 122.2176 177.0405 548.7166 1068.5566
0.940 54.7606 66.4118 77.9029 89.2731 100.5477 111.7444 122.8759 177.8281 550.0859 1070.4587
0.945 55.2401 66.9372 78.4698 89.8781 101.1882 112.4182 123.5812 178.6714 551.5503 1072.4918
0.950 55.7585 67.5048 79.0819 90.5312 101.8795 113.1453 124.3421 179.5806 553.1268 1074.6794
0.955 56.3235 68.1232 79.7486 91.2422 102.6317 113.9363 125.1698 180.5690 554.8379 1077.0526
0.960 56.9459 68.8039 80.4820 92.0241 103.4588 114.8057 126.0794 181.6541 556.7136 1079.6524
0.965 57.6402 69.5627 81.2992 92.8950 104.3797 115.7736 127.0916 182.8608 558.7956 1082.5362
0.970 58.4278 70.4230 82.2251 93.8813 105.4221 116.8688 128.2367 184.2247 561.1442 1085.7868
0.975 59.3417 71.4202 83.2977 95.0232 106.6286 118.1359 129.5612 185.8004 563.8515 1089.5309
0.980 60.4361 72.6133 84.5799 96.3875 108.0693 119.6485 131.1417 187.6785 567.0698 1093.9772
0.985 61.8117 74.1111 86.1883 98.0976 109.8741 121.5423 133.1197 190.0254 571.0789 1099.5095
0.990 63.6907 76.1539 88.3794 100.4252 112.3288 124.1163 135.8067 193.2077 576.4928 1106.9690
0.995 66.7660 79.4900 91.9517 104.2149 116.3211 128.2989 140.1695 198.3602 585.2066 1118.9481
D.7. DISTRIBUCIÓN F DE SNEDECOR 469
D.7. Distribución F de Snedecor
x m+n
m
Γ t 2 −1
Z
m n
FFm,n (x) = P (Fm,n ≤ x) = m
2 n m n
2 2 m+n dt = Fm,n,1−α
0 Γ 2 Γ 2 (n + mt) 2
D.7.1. Tabla para 1 − α = 0.90

m n =1 n =2 n =3 n =4 n =5 n =6 n =7 n =8 n =9 n =10
1 39.8635 8.5263 5.5383 4.5448 4.0604 3.7759 3.5894 3.4579 3.3603 3.2850
2 49.5000 9.0000 5.4624 4.3246 3.7797 3.4633 3.2574 3.1131 3.0065 2.9245
3 53.5932 9.1618 5.3908 4.1909 3.6195 3.2888 3.0741 2.9238 2.8129 2.7277
4 55.8330 9.2434 5.3426 4.1072 3.5202 3.1808 2.9605 2.8064 2.6927 2.6053
5 57.2401 9.2926 5.3092 4.0506 3.4530 3.1075 2.8833 2.7264 2.6106 2.5216
6 58.2044 9.3255 5.2847 4.0097 3.4045 3.0546 2.8274 2.6683 2.5509 2.4606
7 58.9060 9.3491 5.2662 3.9790 3.3679 3.0145 2.7849 2.6241 2.5053 2.4140
8 59.4390 9.3668 5.2517 3.9549 3.3393 2.9830 2.7516 2.5893 2.4694 2.3772
9 59.8576 9.3805 5.2400 3.9357 3.3163 2.9577 2.7247 2.5612 2.4403 2.3473
10 60.1950 9.3916 5.2304 3.9199 3.2974 2.9369 2.7025 2.5380 2.4163 2.3226
11 60.4727 9.4006 5.2224 3.9067 3.2816 2.9195 2.6839 2.5186 2.3961 2.3018
12 60.7052 9.4081 5.2156 3.8955 3.2682 2.9047 2.6681 2.5020 2.3789 2.2841
13 60.9028 9.4145 5.2098 3.8859 3.2567 2.8920 2.6545 2.4876 2.3640 2.2687
14 61.0727 9.4200 5.2047 3.8776 3.2468 2.8809 2.6426 2.4752 2.3510 2.2553
15 61.2203 9.4247 5.2003 3.8704 3.2380 2.8712 2.6322 2.4642 2.3396 2.2435
16 61.3499 9.4289 5.1964 3.8639 3.2303 2.8626 2.6230 2.4545 2.3295 2.2330
17 61.4644 9.4325 5.1929 3.8582 3.2234 2.8550 2.6148 2.4458 2.3205 2.2237
18 61.5664 9.4358 5.1898 3.8531 3.2172 2.8481 2.6074 2.4380 2.3123 2.2153
19 61.6579 9.4387 5.1870 3.8485 3.2117 2.8419 2.6008 2.4310 2.3050 2.2077
20 61.7403 9.4413 5.1845 3.8443 3.2067 2.8363 2.5947 2.4246 2.2983 2.2007
21 61.8150 9.4437 5.1822 3.8405 3.2021 2.8312 2.5892 2.4188 2.2922 2.1944
22 61.8829 9.4458 5.1801 3.8371 3.1979 2.8266 2.5842 2.4135 2.2867 2.1887
23 61.9450 9.4478 5.1781 3.8339 3.1941 2.8223 2.5796 2.4086 2.2816 2.1833
24 62.0020 9.4496 5.1764 3.8310 3.1905 2.8183 2.5753 2.4041 2.2768 2.1784
25 62.0545 9.4513 5.1747 3.8283 3.1873 2.8147 2.5714 2.3999 2.2725 2.1739
26 62.1030 9.4528 5.1732 3.8258 3.1842 2.8113 2.5677 2.3961 2.2684 2.1697
27 62.1480 9.4542 5.1718 3.8235 3.1814 2.8082 2.5643 2.3925 2.2646 2.1657
28 62.1897 9.4556 5.1705 3.8213 3.1788 2.8053 2.5612 2.3891 2.2611 2.1621
29 62.2286 9.4568 5.1693 3.8193 3.1764 2.8025 2.5582 2.3860 2.2578 2.1586
30 62.2650 9.4579 5.1681 3.8174 3.1741 2.8000 2.5555 2.3830 2.2547 2.1554
m n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
1 3.2252 3.1765 3.1362 3.1022 3.0732 3.0481 3.0262 3.0070 2.9899 2.9747
2 2.8595 2.8068 2.7632 2.7265 2.6952 2.6682 2.6446 2.6239 2.6056 2.5893
3 2.6602 2.6055 2.5603 2.5222 2.4898 2.4618 2.4374 2.4160 2.3970 2.3801
4 2.5362 2.4801 2.4337 2.3947 2.3614 2.3327 2.3077 2.2858 2.2663 2.2489
5 2.4512 2.3940 2.3467 2.3069 2.2730 2.2438 2.2183 2.1958 2.1760 2.1582
6 2.3891 2.3310 2.2830 2.2426 2.2081 2.1783 2.1524 2.1296 2.1094 2.0913
7 2.3416 2.2828 2.2341 2.1931 2.1582 2.1280 2.1017 2.0785 2.0580 2.0397
8 2.3040 2.2446 2.1953 2.1539 2.1185 2.0880 2.0613 2.0379 2.0171 1.9985
9 2.2735 2.2135 2.1638 2.1220 2.0862 2.0553 2.0284 2.0047 1.9836 1.9649
10 2.2482 2.1878 2.1376 2.0954 2.0593 2.0281 2.0009 1.9770 1.9557 1.9367
11 2.2269 2.1660 2.1155 2.0729 2.0366 2.0051 1.9777 1.9535 1.9321 1.9129
12 2.2087 2.1474 2.0966 2.0537 2.0171 1.9854 1.9577 1.9333 1.9117 1.8924
13 2.1930 2.1313 2.0802 2.0370 2.0001 1.9682 1.9404 1.9158 1.8940 1.8745
14 2.1792 2.1173 2.0658 2.0224 1.9853 1.9532 1.9252 1.9004 1.8785 1.8588
15 2.1671 2.1049 2.0532 2.0095 1.9722 1.9399 1.9117 1.8868 1.8647 1.8449
16 2.1563 2.0938 2.0419 1.9981 1.9605 1.9281 1.8997 1.8747 1.8524 1.8325
17 2.1467 2.0839 2.0318 1.9878 1.9501 1.9175 1.8889 1.8638 1.8414 1.8214
18 2.1380 2.0750 2.0227 1.9785 1.9407 1.9079 1.8792 1.8539 1.8314 1.8113
19 2.1302 2.0670 2.0145 1.9701 1.9321 1.8992 1.8704 1.8450 1.8224 1.8022
20 2.1230 2.0597 2.0070 1.9625 1.9243 1.8913 1.8624 1.8368 1.8142 1.7938
21 2.1165 2.0530 2.0001 1.9555 1.9172 1.8840 1.8550 1.8294 1.8066 1.7862
22 2.1106 2.0469 1.9939 1.9490 1.9106 1.8774 1.8482 1.8225 1.7997 1.7792
23 2.1051 2.0412 1.9881 1.9431 1.9046 1.8712 1.8420 1.8162 1.7932 1.7727
24 2.1000 2.0360 1.9827 1.9377 1.8990 1.8656 1.8362 1.8103 1.7873 1.7667
25 2.0953 2.0312 1.9778 1.9326 1.8939 1.8603 1.8309 1.8049 1.7818 1.7611
26 2.0909 2.0267 1.9732 1.9279 1.8891 1.8554 1.8259 1.7999 1.7767 1.7559
27 2.0869 2.0225 1.9689 1.9235 1.8846 1.8508 1.8213 1.7951 1.7719 1.7510
28 2.0831 2.0186 1.9649 1.9194 1.8804 1.8466 1.8169 1.7907 1.7674 1.7465
29 2.0795 2.0149 1.9611 1.9155 1.8765 1.8426 1.8128 1.7866 1.7632 1.7422
30 2.0762 2.0115 1.9576 1.9119 1.8728 1.8388 1.8090 1.7827 1.7592 1.7382
m n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
1 2.9610 2.9486 2.9374 2.9271 2.9177 2.9091 2.9012 2.8938 2.8870 2.8807
2 2.5746 2.5613 2.5493 2.5383 2.5283 2.5191 2.5106 2.5028 2.4955 2.4887
3 2.3649 2.3512 2.3387 2.3274 2.3170 2.3075 2.2987 2.2906 2.2831 2.2761
4 2.2333 2.2193 2.2065 2.1949 2.1842 2.1745 2.1655 2.1571 2.1494 2.1422
5 2.1423 2.1279 2.1149 2.1030 2.0922 2.0822 2.0730 2.0645 2.0566 2.0492
6 2.0751 2.0605 2.0472 2.0351 2.0241 2.0139 2.0045 1.9959 1.9878 1.9803
7 2.0233 2.0084 1.9949 1.9826 1.9714 1.9610 1.9515 1.9427 1.9345 1.9269
8 1.9819 1.9668 1.9531 1.9407 1.9292 1.9188 1.9091 1.9001 1.8918 1.8841
9 1.9480 1.9327 1.9189 1.9063 1.8947 1.8841 1.8743 1.8652 1.8568 1.8490
10 1.9197 1.9043 1.8903 1.8775 1.8658 1.8550 1.8451 1.8359 1.8274 1.8195
11 1.8956 1.8801 1.8659 1.8530 1.8412 1.8303 1.8203 1.8110 1.8024 1.7944
12 1.8750 1.8593 1.8450 1.8319 1.8200 1.8090 1.7989 1.7895 1.7808 1.7727
13 1.8570 1.8411 1.8267 1.8136 1.8015 1.7904 1.7802 1.7708 1.7620 1.7538
14 1.8412 1.8252 1.8107 1.7974 1.7853 1.7741 1.7638 1.7542 1.7454 1.7371
15 1.8271 1.8111 1.7964 1.7831 1.7708 1.7596 1.7492 1.7395 1.7306 1.7223
16 1.8146 1.7984 1.7837 1.7703 1.7579 1.7466 1.7361 1.7264 1.7174 1.7090
17 1.8034 1.7871 1.7723 1.7587 1.7463 1.7349 1.7243 1.7146 1.7055 1.6970
18 1.7932 1.7768 1.7619 1.7483 1.7358 1.7243 1.7137 1.7039 1.6947 1.6862
19 1.7840 1.7675 1.7525 1.7388 1.7263 1.7147 1.7040 1.6941 1.6849 1.6763
20 1.7756 1.7590 1.7439 1.7302 1.7175 1.7059 1.6951 1.6852 1.6759 1.6673
21 1.7678 1.7512 1.7360 1.7222 1.7095 1.6978 1.6870 1.6770 1.6677 1.6590
22 1.7607 1.7440 1.7288 1.7149 1.7021 1.6904 1.6795 1.6695 1.6601 1.6514
23 1.7541 1.7374 1.7221 1.7081 1.6953 1.6835 1.6726 1.6625 1.6531 1.6443
24 1.7481 1.7312 1.7159 1.7019 1.6890 1.6771 1.6662 1.6560 1.6465 1.6377
25 1.7424 1.7255 1.7101 1.6960 1.6831 1.6712 1.6602 1.6500 1.6405 1.6316
26 1.7372 1.7202 1.7047 1.6906 1.6776 1.6657 1.6546 1.6444 1.6348 1.6259
27 1.7322 1.7152 1.6997 1.6855 1.6725 1.6605 1.6494 1.6391 1.6295 1.6206
28 1.7276 1.7106 1.6950 1.6808 1.6677 1.6556 1.6445 1.6342 1.6246 1.6156
29 1.7233 1.7062 1.6906 1.6763 1.6632 1.6511 1.6399 1.6295 1.6199 1.6109
30 1.7193 1.7021 1.6864 1.6721 1.6589 1.6468 1.6356 1.6252 1.6155 1.6065
D.7.2. Tabla para 1 − α = 0.95

m n =1 n =2 n =3 n =4 n =5 n =6 n =7 n =8 n =9 n =10
1 161.4476 18.5128 10.1280 7.7086 6.6079 5.9874 5.5914 5.3177 5.1174 4.9646
2 199.5000 19.0000 9.5521 6.9443 5.7861 5.1433 4.7374 4.4590 4.2565 4.1028
3 215.7073 19.1643 9.2766 6.5914 5.4095 4.7571 4.3468 4.0662 3.8625 3.7083
4 224.5832 19.2468 9.1172 6.3882 5.1922 4.5337 4.1203 3.8379 3.6331 3.4780
5 230.1619 19.2964 9.0135 6.2561 5.0503 4.3874 3.9715 3.6875 3.4817 3.3258
6 233.9860 19.3295 8.9406 6.1631 4.9503 4.2839 3.8660 3.5806 3.3738 3.2172
7 236.7684 19.3532 8.8867 6.0942 4.8759 4.2067 3.7870 3.5005 3.2927 3.1355
8 238.8827 19.3710 8.8452 6.0410 4.8183 4.1468 3.7257 3.4381 3.2296 3.0717
9 240.5433 19.3848 8.8123 5.9988 4.7725 4.0990 3.6767 3.3881 3.1789 3.0204
10 241.8817 19.3959 8.7855 5.9644 4.7351 4.0600 3.6365 3.3472 3.1373 2.9782
11 242.9835 19.4050 8.7633 5.9358 4.7040 4.0274 3.6030 3.3130 3.1025 2.9430
12 243.9060 19.4125 8.7446 5.9117 4.6777 3.9999 3.5747 3.2839 3.0729 2.9130
13 244.6898 19.4189 8.7287 5.8911 4.6552 3.9764 3.5503 3.2590 3.0475 2.8872
14 245.3640 19.4244 8.7149 5.8733 4.6358 3.9559 3.5292 3.2374 3.0255 2.8647
15 245.9499 19.4291 8.7029 5.8578 4.6188 3.9381 3.5107 3.2184 3.0061 2.8450
16 246.4639 19.4333 8.6923 5.8441 4.6038 3.9223 3.4944 3.2016 2.9890 2.8276
17 246.9184 19.4370 8.6829 5.8320 4.5904 3.9083 3.4799 3.1867 2.9737 2.8120
18 247.3232 19.4402 8.6745 5.8211 4.5785 3.8957 3.4669 3.1733 2.9600 2.7980
19 247.6861 19.4431 8.6670 5.8114 4.5678 3.8844 3.4551 3.1613 2.9477 2.7854
20 248.0131 19.4458 8.6602 5.8025 4.5581 3.8742 3.4445 3.1503 2.9365 2.7740
21 248.3094 19.4481 8.6540 5.7945 4.5493 3.8649 3.4349 3.1404 2.9263 2.7636
22 248.5791 19.4503 8.6484 5.7872 4.5413 3.8564 3.4260 3.1313 2.9169 2.7541
23 248.8256 19.4523 8.6432 5.7805 4.5339 3.8486 3.4179 3.1229 2.9084 2.7453
24 249.0518 19.4541 8.6385 5.7744 4.5272 3.8415 3.4105 3.1152 2.9005 2.7372
25 249.2601 19.4558 8.6341 5.7687 4.5209 3.8348 3.4036 3.1081 2.8932 2.7298
26 249.4525 19.4573 8.6301 5.7635 4.5151 3.8287 3.3972 3.1015 2.8864 2.7229
27 249.6309 19.4587 8.6263 5.7586 4.5097 3.8230 3.3913 3.0954 2.8801 2.7164
28 249.7966 19.4600 8.6229 5.7541 4.5047 3.8177 3.3858 3.0897 2.8743 2.7104
29 249.9510 19.4613 8.6196 5.7498 4.5001 3.8128 3.3806 3.0844 2.8688 2.7048
30 250.0951 19.4624 8.6166 5.7459 4.4957 3.8082 3.3758 3.0794 2.8637 2.6996
m n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
1 4.8443 4.7472 4.6672 4.6001 4.5431 4.4940 4.4513 4.4139 4.3807 4.3512
2 3.9823 3.8853 3.8056 3.7389 3.6823 3.6337 3.5915 3.5546 3.5219 3.4928
3 3.5874 3.4903 3.4105 3.3439 3.2874 3.2389 3.1968 3.1599 3.1274 3.0984
4 3.3567 3.2592 3.1791 3.1122 3.0556 3.0069 2.9647 2.9277 2.8951 2.8661
5 3.2039 3.1059 3.0254 2.9582 2.9013 2.8524 2.8100 2.7729 2.7401 2.7109
6 3.0946 2.9961 2.9153 2.8477 2.7905 2.7413 2.6987 2.6613 2.6283 2.5990
7 3.0123 2.9134 2.8321 2.7642 2.7066 2.6572 2.6143 2.5767 2.5435 2.5140
8 2.9480 2.8486 2.7669 2.6987 2.6408 2.5911 2.5480 2.5102 2.4768 2.4471
9 2.8962 2.7964 2.7144 2.6458 2.5876 2.5377 2.4943 2.4563 2.4227 2.3928
10 2.8536 2.7534 2.6710 2.6022 2.5437 2.4935 2.4499 2.4117 2.3779 2.3479
11 2.8179 2.7173 2.6347 2.5655 2.5068 2.4564 2.4126 2.3742 2.3402 2.3100
12 2.7876 2.6866 2.6037 2.5342 2.4753 2.4247 2.3807 2.3421 2.3080 2.2776
13 2.7614 2.6602 2.5769 2.5073 2.4481 2.3973 2.3531 2.3143 2.2800 2.2495
14 2.7386 2.6371 2.5536 2.4837 2.4244 2.3733 2.3290 2.2900 2.2556 2.2250
15 2.7186 2.6169 2.5331 2.4630 2.4034 2.3522 2.3077 2.2686 2.2341 2.2033
16 2.7009 2.5989 2.5149 2.4446 2.3849 2.3335 2.2888 2.2496 2.2149 2.1840
17 2.6851 2.5828 2.4987 2.4282 2.3683 2.3167 2.2719 2.2325 2.1977 2.1667
18 2.6709 2.5684 2.4841 2.4134 2.3533 2.3016 2.2567 2.2172 2.1823 2.1511
19 2.6581 2.5554 2.4709 2.4000 2.3398 2.2880 2.2429 2.2033 2.1683 2.1370
20 2.6464 2.5436 2.4589 2.3879 2.3275 2.2756 2.2304 2.1906 2.1555 2.1242
21 2.6358 2.5328 2.4479 2.3768 2.3163 2.2642 2.2189 2.1791 2.1438 2.1124
22 2.6261 2.5229 2.4379 2.3667 2.3060 2.2538 2.2084 2.1685 2.1331 2.1016
23 2.6172 2.5139 2.4287 2.3573 2.2966 2.2443 2.1987 2.1587 2.1233 2.0917
24 2.6090 2.5055 2.4202 2.3487 2.2878 2.2354 2.1898 2.1497 2.1141 2.0825
25 2.6014 2.4977 2.4123 2.3407 2.2797 2.2272 2.1815 2.1413 2.1057 2.0739
26 2.5943 2.4905 2.4050 2.3333 2.2722 2.2196 2.1738 2.1335 2.0978 2.0660
27 2.5877 2.4838 2.3982 2.3264 2.2652 2.2125 2.1666 2.1262 2.0905 2.0586
28 2.5816 2.4776 2.3918 2.3199 2.2587 2.2059 2.1599 2.1195 2.0836 2.0517
29 2.5759 2.4718 2.3859 2.3139 2.2525 2.1997 2.1536 2.1131 2.0772 2.0452
30 2.5705 2.4663 2.3803 2.3082 2.2468 2.1938 2.1477 2.1071 2.0712 2.0391
m n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
1 4.3248 4.3009 4.2793 4.2597 4.2417 4.2252 4.2100 4.1960 4.1830 4.1709
2 3.4668 3.4434 3.4221 3.4028 3.3852 3.3690 3.3541 3.3404 3.3277 3.3158
3 3.0725 3.0491 3.0280 3.0088 2.9912 2.9752 2.9604 2.9467 2.9340 2.9223
4 2.8401 2.8167 2.7955 2.7763 2.7587 2.7426 2.7278 2.7141 2.7014 2.6896
5 2.6848 2.6613 2.6400 2.6207 2.6030 2.5868 2.5719 2.5581 2.5454 2.5336
6 2.5727 2.5491 2.5277 2.5082 2.4904 2.4741 2.4591 2.4453 2.4324 2.4205
7 2.4876 2.4638 2.4422 2.4226 2.4047 2.3883 2.3732 2.3593 2.3463 2.3343
8 2.4205 2.3965 2.3748 2.3551 2.3371 2.3205 2.3053 2.2913 2.2783 2.2662
9 2.3660 2.3419 2.3201 2.3002 2.2821 2.2655 2.2501 2.2360 2.2229 2.2107
10 2.3210 2.2967 2.2747 2.2547 2.2365 2.2197 2.2043 2.1900 2.1768 2.1646
11 2.2829 2.2585 2.2364 2.2163 2.1979 2.1811 2.1655 2.1512 2.1379 2.1256
12 2.2504 2.2258 2.2036 2.1834 2.1649 2.1479 2.1323 2.1179 2.1045 2.0921
13 2.2222 2.1975 2.1752 2.1548 2.1362 2.1192 2.1035 2.0889 2.0755 2.0630
14 2.1975 2.1727 2.1502 2.1298 2.1111 2.0939 2.0781 2.0635 2.0500 2.0374
15 2.1757 2.1508 2.1282 2.1077 2.0889 2.0716 2.0558 2.0411 2.0275 2.0148
16 2.1563 2.1313 2.1086 2.0880 2.0691 2.0518 2.0358 2.0210 2.0073 1.9946
17 2.1389 2.1138 2.0910 2.0703 2.0513 2.0339 2.0179 2.0030 1.9893 1.9765
18 2.1232 2.0980 2.0751 2.0543 2.0353 2.0178 2.0017 1.9868 1.9730 1.9601
19 2.1090 2.0837 2.0608 2.0399 2.0207 2.0032 1.9870 1.9720 1.9581 1.9452
20 2.0960 2.0707 2.0476 2.0267 2.0075 1.9898 1.9736 1.9586 1.9446 1.9317
21 2.0842 2.0587 2.0356 2.0146 1.9953 1.9776 1.9613 1.9462 1.9322 1.9192
22 2.0733 2.0478 2.0246 2.0035 1.9842 1.9664 1.9500 1.9349 1.9208 1.9077
23 2.0633 2.0377 2.0144 1.9932 1.9738 1.9560 1.9396 1.9244 1.9103 1.8972
24 2.0540 2.0283 2.0050 1.9838 1.9643 1.9464 1.9299 1.9147 1.9005 1.8874
25 2.0454 2.0196 1.9963 1.9750 1.9554 1.9375 1.9210 1.9057 1.8915 1.8782
26 2.0374 2.0116 1.9881 1.9668 1.9472 1.9292 1.9126 1.8973 1.8830 1.8698
27 2.0299 2.0040 1.9805 1.9591 1.9395 1.9215 1.9048 1.8894 1.8751 1.8618
28 2.0229 1.9970 1.9734 1.9520 1.9323 1.9142 1.8975 1.8821 1.8677 1.8544
29 2.0164 1.9904 1.9668 1.9453 1.9255 1.9074 1.8907 1.8752 1.8608 1.8474
30 2.0102 1.9842 1.9605 1.9390 1.9192 1.9010 1.8842 1.8687 1.8543 1.8409
D.7.3. Tabla para 1 − α = 0.975

m n =1 n =2 n =3 n =4 n =5 n =6 n =7 n =8 n =9 n =10
1 647.7890 38.5063 17.4434 12.2179 10.0070 8.8131 8.0727 7.5709 7.2093 6.9367
2 799.5000 39.0000 16.0441 10.6491 8.4336 7.2599 6.5415 6.0595 5.7147 5.4564
3 864.1630 39.1655 15.4392 9.9792 7.7636 6.5988 5.8898 5.4160 5.0781 4.8256
4 899.5833 39.2484 15.1010 9.6045 7.3879 6.2272 5.5226 5.0526 4.7181 4.4683
5 921.8479 39.2982 14.8848 9.3645 7.1464 5.9876 5.2852 4.8173 4.4844 4.2361
6 937.1111 39.3315 14.7347 9.1973 6.9777 5.8198 5.1186 4.6517 4.3197 4.0721
7 948.2169 39.3552 14.6244 9.0741 6.8531 5.6955 4.9949 4.5286 4.1970 3.9498
8 956.6562 39.3730 14.5399 8.9796 6.7572 5.5996 4.8993 4.4333 4.1020 3.8549
9 963.2846 39.3869 14.4731 8.9047 6.6811 5.5234 4.8232 4.3572 4.0260 3.7790
10 968.6274 39.3980 14.4189 8.8439 6.6192 5.4613 4.7611 4.2951 3.9639 3.7168
11 973.0252 39.4071 14.3742 8.7935 6.5678 5.4098 4.7095 4.2434 3.9121 3.6649
12 976.7079 39.4146 14.3366 8.7512 6.5245 5.3662 4.6658 4.1997 3.8682 3.6209
13 979.8368 39.4210 14.3045 8.7150 6.4876 5.3290 4.6285 4.1622 3.8306 3.5832
14 982.5278 39.4265 14.2768 8.6838 6.4556 5.2968 4.5961 4.1297 3.7980 3.5504
15 984.8668 39.4313 14.2527 8.6565 6.4277 5.2687 4.5678 4.1012 3.7694 3.5217
16 986.9187 39.4354 14.2315 8.6326 6.4032 5.2439 4.5428 4.0761 3.7441 3.4963
17 988.7331 39.4391 14.2127 8.6113 6.3814 5.2218 4.5206 4.0538 3.7216 3.4737
18 990.3490 39.4424 14.1960 8.5924 6.3619 5.2021 4.5008 4.0338 3.7015 3.4534
19 991.7973 39.4453 14.1810 8.5753 6.3444 5.1844 4.4829 4.0158 3.6833 3.4351
20 993.1028 39.4479 14.1674 8.5599 6.3286 5.1684 4.4667 3.9995 3.6669 3.4185
21 994.2856 39.4503 14.1551 8.5460 6.3142 5.1538 4.4520 3.9846 3.6520 3.4035
22 995.3622 39.4525 14.1438 8.5332 6.3011 5.1406 4.4386 3.9711 3.6383 3.3897
23 996.3462 39.4544 14.1336 8.5216 6.2891 5.1284 4.4263 3.9587 3.6257 3.3770
24 997.2492 39.4562 14.1241 8.5109 6.2780 5.1172 4.4150 3.9472 3.6142 3.3654
25 998.0808 39.4579 14.1155 8.5010 6.2679 5.1069 4.4045 3.9367 3.6035 3.3546
26 998.8490 39.4594 14.1074 8.4919 6.2584 5.0973 4.3949 3.9269 3.5936 3.3446
27 999.5609 39.4609 14.1000 8.4834 6.2497 5.0884 4.3859 3.9178 3.5845 3.3353
28 1000.2225 39.4622 14.0930 8.4755 6.2416 5.0802 4.3775 3.9093 3.5759 3.3267
29 1000.8388 39.4634 14.0866 8.4681 6.2340 5.0724 4.3697 3.9014 3.5679 3.3186
30 1001.4144 39.4646 14.0805 8.4613 6.2269 5.0652 4.3624 3.8940 3.5604 3.3110
m n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
1 6.7241 6.5538 6.4143 6.2979 6.1995 6.1151 6.0420 5.9781 5.9216 5.8715
2 5.2559 5.0959 4.9653 4.8567 4.7650 4.6867 4.6189 4.5597 4.5075 4.4613
3 4.6300 4.4742 4.3472 4.2417 4.1528 4.0768 4.0112 3.9539 3.9034 3.8587
4 4.2751 4.1212 3.9959 3.8919 3.8043 3.7294 3.6648 3.6083 3.5587 3.5147
5 4.0440 3.8911 3.7667 3.6634 3.5764 3.5021 3.4379 3.3820 3.3327 3.2891
6 3.8807 3.7283 3.6043 3.5014 3.4147 3.3406 3.2767 3.2209 3.1718 3.1283
7 3.7586 3.6065 3.4827 3.3799 3.2934 3.2194 3.1556 3.0999 3.0509 3.0074
8 3.6638 3.5118 3.3880 3.2853 3.1987 3.1248 3.0610 3.0053 2.9563 2.9128
9 3.5879 3.4358 3.3120 3.2093 3.1227 3.0488 2.9849 2.9291 2.8801 2.8365
10 3.5257 3.3736 3.2497 3.1469 3.0602 2.9862 2.9222 2.8664 2.8172 2.7737
11 3.4737 3.3215 3.1975 3.0946 3.0078 2.9337 2.8696 2.8137 2.7645 2.7209
12 3.4296 3.2773 3.1532 3.0502 2.9633 2.8890 2.8249 2.7689 2.7196 2.6758
13 3.3917 3.2393 3.1150 3.0119 2.9249 2.8506 2.7863 2.7302 2.6808 2.6369
14 3.3588 3.2062 3.0819 2.9786 2.8915 2.8170 2.7526 2.6964 2.6469 2.6030
15 3.3299 3.1772 3.0527 2.9493 2.8621 2.7875 2.7230 2.6667 2.6171 2.5731
16 3.3044 3.1515 3.0269 2.9234 2.8360 2.7614 2.6968 2.6404 2.5907 2.5465
17 3.2816 3.1286 3.0039 2.9003 2.8128 2.7380 2.6733 2.6168 2.5670 2.5228
18 3.2612 3.1081 2.9832 2.8795 2.7919 2.7170 2.6522 2.5956 2.5457 2.5014
19 3.2428 3.0896 2.9646 2.8607 2.7730 2.6980 2.6331 2.5764 2.5265 2.4821
20 3.2261 3.0728 2.9477 2.8437 2.7559 2.6808 2.6158 2.5590 2.5089 2.4645
21 3.2109 3.0575 2.9322 2.8282 2.7403 2.6651 2.6000 2.5431 2.4930 2.4484
22 3.1970 3.0434 2.9181 2.8139 2.7260 2.6507 2.5855 2.5285 2.4783 2.4337
23 3.1843 3.0306 2.9052 2.8009 2.7128 2.6374 2.5721 2.5151 2.4648 2.4201
24 3.1725 3.0187 2.8932 2.7888 2.7006 2.6252 2.5598 2.5027 2.4523 2.4076
25 3.1616 3.0077 2.8821 2.7777 2.6894 2.6138 2.5484 2.4912 2.4408 2.3959
26 3.1516 2.9976 2.8719 2.7673 2.6790 2.6033 2.5378 2.4806 2.4300 2.3851
27 3.1422 2.9881 2.8623 2.7577 2.6692 2.5935 2.5280 2.4706 2.4200 2.3751
28 3.1334 2.9793 2.8534 2.7487 2.6602 2.5844 2.5187 2.4613 2.4107 2.3657
29 3.1253 2.9710 2.8451 2.7403 2.6517 2.5758 2.5101 2.4527 2.4019 2.3569
30 3.1176 2.9633 2.8372 2.7324 2.6437 2.5678 2.5020 2.4445 2.3937 2.3486
m n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
1 5.8266 5.7863 5.7498 5.7166 5.6864 5.6586 5.6331 5.6096 5.5878 5.5675
2 4.4199 4.3828 4.3492 4.3187 4.2909 4.2655 4.2421 4.2205 4.2006 4.1821
3 3.8188 3.7829 3.7505 3.7211 3.6943 3.6697 3.6472 3.6264 3.6072 3.5894
4 3.4754 3.4401 3.4083 3.3794 3.3530 3.3289 3.3067 3.2863 3.2674 3.2499
5 3.2501 3.2151 3.1835 3.1548 3.1287 3.1048 3.0828 3.0626 3.0438 3.0265
6 3.0895 3.0546 3.0232 2.9946 2.9685 2.9447 2.9228 2.9027 2.8840 2.8667
7 2.9686 2.9338 2.9023 2.8738 2.8478 2.8240 2.8021 2.7820 2.7633 2.7460
8 2.8740 2.8392 2.8077 2.7791 2.7531 2.7293 2.7074 2.6872 2.6686 2.6513
9 2.7977 2.7628 2.7313 2.7027 2.6766 2.6528 2.6309 2.6106 2.5919 2.5746
10 2.7348 2.6998 2.6682 2.6396 2.6135 2.5896 2.5676 2.5473 2.5286 2.5112
11 2.6819 2.6469 2.6152 2.5865 2.5603 2.5363 2.5143 2.4940 2.4752 2.4577
12 2.6368 2.6017 2.5699 2.5411 2.5149 2.4908 2.4688 2.4484 2.4295 2.4120
13 2.5978 2.5626 2.5308 2.5019 2.4756 2.4515 2.4293 2.4089 2.3900 2.3724
14 2.5638 2.5285 2.4966 2.4677 2.4413 2.4171 2.3949 2.3743 2.3554 2.3378
15 2.5338 2.4984 2.4665 2.4374 2.4110 2.3867 2.3644 2.3438 2.3248 2.3072
16 2.5071 2.4717 2.4396 2.4105 2.3840 2.3597 2.3373 2.3167 2.2976 2.2799
17 2.4833 2.4478 2.4157 2.3865 2.3599 2.3355 2.3131 2.2924 2.2732 2.2554
18 2.4618 2.4262 2.3940 2.3648 2.3381 2.3137 2.2912 2.2704 2.2512 2.2334
19 2.4424 2.4067 2.3745 2.3452 2.3184 2.2939 2.2713 2.2505 2.2313 2.2134
20 2.4247 2.3890 2.3567 2.3273 2.3005 2.2759 2.2533 2.2324 2.2131 2.1952
21 2.4086 2.3728 2.3404 2.3109 2.2840 2.2594 2.2367 2.2158 2.1965 2.1785
22 2.3938 2.3579 2.3254 2.2959 2.2690 2.2443 2.2216 2.2006 2.1812 2.1631
23 2.3801 2.3442 2.3116 2.2821 2.2551 2.2303 2.2076 2.1865 2.1671 2.1490
24 2.3675 2.3315 2.2989 2.2693 2.2422 2.2174 2.1946 2.1735 2.1540 2.1359
25 2.3558 2.3198 2.2871 2.2574 2.2303 2.2054 2.1826 2.1615 2.1419 2.1237
26 2.3450 2.3088 2.2761 2.2464 2.2192 2.1943 2.1714 2.1502 2.1306 2.1124
27 2.3348 2.2986 2.2659 2.2361 2.2089 2.1839 2.1609 2.1397 2.1201 2.1018
28 2.3254 2.2891 2.2563 2.2265 2.1992 2.1742 2.1512 2.1299 2.1102 2.0919
29 2.3165 2.2802 2.2473 2.2174 2.1901 2.1651 2.1420 2.1207 2.1010 2.0827
30 2.3082 2.2718 2.2389 2.2090 2.1816 2.1565 2.1334 2.1121 2.0923 2.0739
D.7.4. Tabla para 1 − α = 0.99

m n =1 n =2 n =3 n =4 n =5 n =6 n =7 n =8 n =9 n =10
1 4052.1807 98.5025 34.1162 21.1977 16.2582 13.7450 12.2464 11.2586 10.5614 10.0443
2 4999.5000 99.0000 30.8165 18.0000 13.2739 10.9248 9.5466 8.6491 8.0215 7.5594
3 5403.3520 99.1662 29.4567 16.6944 12.0600 9.7795 8.4513 7.5910 6.9919 6.5523
4 5624.5833 99.2494 28.7099 15.9770 11.3919 9.1483 7.8466 7.0061 6.4221 5.9943
5 5763.6496 99.2993 28.2371 15.5219 10.9670 8.7459 7.4604 6.6318 6.0569 5.6363
6 5858.9861 99.3326 27.9107 15.2069 10.6723 8.4661 7.1914 6.3707 5.8018 5.3858
7 5928.3557 99.3564 27.6717 14.9758 10.4555 8.2600 6.9928 6.1776 5.6129 5.2001
8 5981.0703 99.3742 27.4892 14.7989 10.2893 8.1017 6.8400 6.0289 5.4671 5.0567
9 6022.4732 99.3881 27.3452 14.6591 10.1578 7.9761 6.7188 5.9106 5.3511 4.9424
10 6055.8467 99.3992 27.2287 14.5459 10.0510 7.8741 6.6201 5.8143 5.2565 4.8491
11 6083.3168 99.4083 27.1326 14.4523 9.9626 7.7896 6.5382 5.7343 5.1779 4.7715
12 6106.3207 99.4159 27.0518 14.3736 9.8883 7.7183 6.4691 5.6667 5.1114 4.7059
13 6125.8647 99.4223 26.9831 14.3065 9.8248 7.6575 6.4100 5.6089 5.0545 4.6496
14 6142.6740 99.4278 26.9238 14.2486 9.7700 7.6049 6.3590 5.5589 5.0052 4.6008
15 6157.2846 99.4325 26.8722 14.1982 9.7222 7.5590 6.3143 5.5151 4.9621 4.5581
16 6170.1012 99.4367 26.8269 14.1539 9.6802 7.5186 6.2750 5.4766 4.9240 4.5204
17 6181.4348 99.4404 26.7867 14.1146 9.6429 7.4827 6.2401 5.4423 4.8902 4.4869
18 6191.5287 99.4436 26.7509 14.0795 9.6096 7.4507 6.2089 5.4116 4.8599 4.4569
19 6200.5756 99.4465 26.7188 14.0480 9.5797 7.4219 6.1808 5.3840 4.8327 4.4299
20 6208.7302 99.4492 26.6898 14.0196 9.5526 7.3958 6.1554 5.3591 4.8080 4.4054
21 6216.1184 99.4516 26.6635 13.9938 9.5281 7.3722 6.1324 5.3364 4.7856 4.3831
22 6222.8433 99.4537 26.6396 13.9703 9.5058 7.3506 6.1113 5.3157 4.7651 4.3628
23 6228.9903 99.4557 26.6176 13.9488 9.4853 7.3309 6.0921 5.2967 4.7463 4.3441
24 6234.6309 99.4575 26.5975 13.9291 9.4665 7.3127 6.0743 5.2793 4.7290 4.3269
25 6239.8251 99.4592 26.5790 13.9109 9.4491 7.2960 6.0580 5.2631 4.7130 4.3111
26 6244.6239 99.4607 26.5618 13.8940 9.4331 7.2805 6.0428 5.2482 4.6982 4.2963
27 6249.0708 99.4621 26.5460 13.8784 9.4182 7.2661 6.0287 5.2344 4.6845 4.2827
28 6253.2031 99.4635 26.5312 13.8639 9.4043 7.2527 6.0157 5.2214 4.6717 4.2700
29 6257.0530 99.4647 26.5174 13.8503 9.3914 7.2402 6.0034 5.2094 4.6598 4.2581
30 6260.6486 99.4658 26.5045 13.8377 9.3793 7.2285 5.9920 5.1981 4.6486 4.2469
m n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
1 9.6460 9.3302 9.0738 8.8616 8.6831 8.5310 8.3997 8.2854 8.1849 8.0960
2 7.2057 6.9266 6.7010 6.5149 6.3589 6.2262 6.1121 6.0129 5.9259 5.8489
3 6.2167 5.9525 5.7394 5.5639 5.4170 5.2922 5.1850 5.0919 5.0103 4.9382
4 5.6683 5.4120 5.2053 5.0354 4.8932 4.7726 4.6690 4.5790 4.5003 4.4307
5 5.3160 5.0643 4.8616 4.6950 4.5556 4.4374 4.3359 4.2479 4.1708 4.1027
6 5.0692 4.8206 4.6204 4.4558 4.3183 4.2016 4.1015 4.0146 3.9386 3.8714
7 4.8861 4.6395 4.4410 4.2779 4.1415 4.0259 3.9267 3.8406 3.7653 3.6987
8 4.7445 4.4994 4.3021 4.1399 4.0045 3.8896 3.7910 3.7054 3.6305 3.5644
9 4.6315 4.3875 4.1911 4.0297 3.8948 3.7804 3.6822 3.5971 3.5225 3.4567
10 4.5393 4.2961 4.1003 3.9394 3.8049 3.6909 3.5931 3.5082 3.4338 3.3682
11 4.4624 4.2198 4.0245 3.8640 3.7299 3.6162 3.5185 3.4338 3.3596 3.2941
12 4.3974 4.1553 3.9603 3.8001 3.6662 3.5527 3.4552 3.3706 3.2965 3.2311
13 4.3416 4.0999 3.9052 3.7452 3.6115 3.4981 3.4007 3.3162 3.2422 3.1769
14 4.2932 4.0518 3.8573 3.6975 3.5639 3.4506 3.3533 3.2689 3.1949 3.1296
15 4.2509 4.0096 3.8154 3.6557 3.5222 3.4089 3.3117 3.2273 3.1533 3.0880
16 4.2134 3.9724 3.7783 3.6187 3.4852 3.3720 3.2748 3.1904 3.1165 3.0512
17 4.1801 3.9392 3.7452 3.5857 3.4523 3.3391 3.2419 3.1575 3.0836 3.0183
18 4.1503 3.9095 3.7156 3.5561 3.4228 3.3096 3.2124 3.1280 3.0541 2.9887
19 4.1234 3.8827 3.6888 3.5294 3.3961 3.2829 3.1857 3.1013 3.0274 2.9620
20 4.0990 3.8584 3.6646 3.5052 3.3719 3.2587 3.1615 3.0771 3.0031 2.9377
21 4.0769 3.8363 3.6425 3.4832 3.3498 3.2367 3.1394 3.0550 2.9810 2.9156
22 4.0566 3.8161 3.6224 3.4630 3.3297 3.2165 3.1192 3.0348 2.9607 2.8953
23 4.0380 3.7976 3.6038 3.4445 3.3111 3.1979 3.1006 3.0161 2.9421 2.8766
24 4.0209 3.7805 3.5868 3.4274 3.2940 3.1808 3.0835 2.9990 2.9249 2.8594
25 4.0051 3.7647 3.5710 3.4116 3.2782 3.1650 3.0676 2.9831 2.9089 2.8434
26 3.9904 3.7500 3.5563 3.3969 3.2635 3.1503 3.0529 2.9683 2.8941 2.8286
27 3.9768 3.7364 3.5427 3.3833 3.2499 3.1366 3.0392 2.9546 2.8804 2.8148
28 3.9641 3.7237 3.5300 3.3706 3.2372 3.1238 3.0264 2.9418 2.8675 2.8019
29 3.9522 3.7119 3.5182 3.3587 3.2253 3.1119 3.0145 2.9298 2.8555 2.7898
30 3.9411 3.7008 3.5070 3.3476 3.2141 3.1007 3.0032 2.9185 2.8442 2.7785
m n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
1 8.0166 7.9454 7.8811 7.8229 7.7698 7.7213 7.6767 7.6356 7.5977 7.5625
2 5.7804 5.7190 5.6637 5.6136 5.5680 5.5263 5.4881 5.4529 5.4204 5.3903
3 4.8740 4.8166 4.7649 4.7181 4.6755 4.6366 4.6009 4.5681 4.5378 4.5097
4 4.3688 4.3134 4.2636 4.2184 4.1774 4.1400 4.1056 4.0740 4.0449 4.0179
5 4.0421 3.9880 3.9392 3.8951 3.8550 3.8183 3.7848 3.7539 3.7254 3.6990
6 3.8117 3.7583 3.7102 3.6667 3.6272 3.5911 3.5580 3.5276 3.4995 3.4735
7 3.6396 3.5867 3.5390 3.4959 3.4568 3.4210 3.3882 3.3581 3.3303 3.3045
8 3.5056 3.4530 3.4057 3.3629 3.3239 3.2884 3.2558 3.2259 3.1982 3.1726
9 3.3981 3.3458 3.2986 3.2560 3.2172 3.1818 3.1494 3.1195 3.0920 3.0665
10 3.3098 3.2576 3.2106 3.1681 3.1294 3.0941 3.0618 3.0320 3.0045 2.9791
11 3.2359 3.1837 3.1368 3.0944 3.0558 3.0205 2.9882 2.9585 2.9311 2.9057
12 3.1730 3.1209 3.0740 3.0316 2.9931 2.9578 2.9256 2.8959 2.8685 2.8431
13 3.1187 3.0667 3.0199 2.9775 2.9389 2.9038 2.8715 2.8418 2.8144 2.7890
14 3.0715 3.0195 2.9727 2.9303 2.8917 2.8566 2.8243 2.7946 2.7672 2.7418
15 3.0300 2.9779 2.9311 2.8887 2.8502 2.8150 2.7827 2.7530 2.7256 2.7002
16 2.9931 2.9411 2.8943 2.8519 2.8133 2.7781 2.7458 2.7160 2.6886 2.6632
17 2.9602 2.9082 2.8613 2.8189 2.7803 2.7451 2.7127 2.6830 2.6555 2.6301
18 2.9306 2.8786 2.8317 2.7892 2.7506 2.7153 2.6830 2.6532 2.6257 2.6003
19 2.9039 2.8518 2.8049 2.7624 2.7238 2.6885 2.6561 2.6263 2.5987 2.5732
20 2.8796 2.8274 2.7805 2.7380 2.6993 2.6640 2.6316 2.6017 2.5742 2.5487
21 2.8574 2.8052 2.7583 2.7157 2.6770 2.6416 2.6092 2.5793 2.5517 2.5262
22 2.8370 2.7849 2.7378 2.6953 2.6565 2.6211 2.5887 2.5587 2.5311 2.5055
23 2.8183 2.7661 2.7191 2.6765 2.6377 2.6022 2.5697 2.5398 2.5121 2.4865
24 2.8010 2.7488 2.7017 2.6591 2.6203 2.5848 2.5522 2.5223 2.4946 2.4689
25 2.7850 2.7328 2.6856 2.6430 2.6041 2.5686 2.5360 2.5060 2.4783 2.4526
26 2.7702 2.7179 2.6707 2.6280 2.5891 2.5536 2.5209 2.4909 2.4631 2.4374
27 2.7563 2.7040 2.6568 2.6140 2.5751 2.5395 2.5069 2.4768 2.4490 2.4233
28 2.7434 2.6910 2.6438 2.6010 2.5620 2.5264 2.4937 2.4636 2.4358 2.4100
29 2.7313 2.6789 2.6316 2.5888 2.5498 2.5141 2.4814 2.4513 2.4234 2.3976
30 2.7200 2.6675 2.6202 2.5773 2.5383 2.5026 2.4699 2.4397 2.4118 2.3860
Referencias
Blanco, L. (2004), Probabilidad, Unibiblos. 6.5.2, 24, 26, 9.4, 9.4, 9.4, 9.5, 9.6, 10.6, 12, 6, 11.3.1, B.1
Christensen, H. (2008), Estadística paso a paso, Trillas.
Freund, J., Miller, I. & Miller, M. (2000), Estadística matemática con aplicaciones, Prentice Hall.
10.3.5
Genz, A. & Bretz, F. (2009), Computation of Multivariate Normal and t Probabilities, Lecture Notes
in Statistics, Springer-Verlag, Heidelberg. 11.3.7
Genz, A., Bretz, F., Miwa, T., Mi, X., Leisch, F., Scheipl, F. & Hothorn, T. (2012), mvtnorm: Multi-
variate Normal and t Distributions. R package version 0.9-9992.
URL: http://CRAN.R-project.org/package=mvtnorm 11.3.7
Gut, A. (2005), Probability: A graduate Course, Springer. 8.1, 8.9.1, 8.9.1
Hogg, R., McKean, J. & Craig, A. (2005), Introduction to Mathematical Statistics, sixth edn, Prentice
Hall. 7.9, iii
Ibarra, . (2006), Estadística para la administración turística, Trillas.
Martínez, C. (2000), Estadística y muestreo, décima edición edn, Ecoe Ediciones.
Mendenhall, W., Beaver, R. & Beaver, B. (2008), Introducción a la probabilidad y estadística, décimo
segunda edición edn, Cengage Learning.
Pérez, G. (2004), Pedagogia social. Educación social, Narcea. 4
Purcell, E. & Varberg, D. (1993), Cálculo con geometría analítica, Pearson. C.6
R Core Team (2012), R: A Language and Environment for Statistical Computing, R Foundation for
Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.
URL: http://www.R-project.org/ 11.3.7
Real Academia Española (2012a), `Ciencia. Diccionario de la lengua española', http://lema.rae.es/

drae/?val=ciencia. 1
477
478 REFERENCIAS
Real Academia Española (2012b), `Complacencia. Diccionario de la lengua española', http://lema.

rae.es/drae/?val=complacencia. 3
Real Academia Española (2012c), `Determinismo. Diccionario de la lengua española', http://lema.

rae.es/drae/?val=determinismo. 2
Real Academia Española (2012d), `Tasa. Diccionario de la lengua española', http://lema.rae.es/

drae/?val=tasa. 9
Resnick, S. (1998), A probability path, Birkhäuser. 8.1
Ross, S. (1998), A First Course in Probability, Fifth Edition edn, Prentice Hall. 9.5, 9.6, 10.3.1
Rudin, W. (1976), Elements of Mathematical Analisys, third edn, McGraw Hill. 8.3, 1
Sarabia, J., Gómez, E. & Vázquez, F. (2007), Estadística actuarial. Teoría y aplicaciones, Pearson.
10.6
Soong, T. (2004), Fundamentals of Probability and Statistics for Engineers, John Wiley & Sons. 13,
15, 18
Soto, O. (2001), Fundamentos conceptuales de estadística, Technical report, Universidad Nacional de

Colombia. 1.5
Stevens, S. (1951), Handbook of Experimental Psychology, Vol. 1, Wiley. 1.7
Sturges, H. A. (1926), `The choice of a class interval', Journal of the American Statistical Association
21(153), 6566. 1iii
Thomas, G. B. (2006), Cálculo una variable, Pearson. C.1, C.6
Wikipedia (2012a), `Asimetría estadística', http://es.wikipedia.org/wiki/Asimetría_

estadística. 2
Wikipedia (2012b), `Ciencia', http://es.wikipedia.org/wiki/Ciencia. 1
Wikipedia (2012c), `Diagrama de venn', http://es.wikipedia.org/wiki/Diagrama_de_Venn. 1
Wikipedia (2012d), `Estimación estadística', http://es.wikipedia.org/wiki/Estimación. 12

Índice temático
índice de Gini, 125

de asimetría de sesgo, 92
de Yule-Bowley, 98 de variación, 82
de Pearson, 81, 220
aleatoriedad, 4 muestral, 82
amplitud, 23
poblacional, 82
antiderivada, 440
colectivo, 5
apuntamiento, 91
combinación, 165
asimetría, 92
combinación lineal, 345
atributo, 7
comparación
de límite, 451
base, 378, 414
directa, 451
bigotes, 67
complacencia, 124
boxplot, 67
concordancia, 124
cálculo, 408, 412, 438 conjunto, 398, 412
campana de Gauss, 291 cardinal de un, 399
cartograma, 31 complemento de un, 403
categoría, 7 de conjuntos, 401
categorías, 19 elemento de un, 399
censo, 6 nito, 399
cero absoluto, 10 innito, 399, 406
ciencia, 1, 398 no numerable, 406
clases, 19 numerable, 406
coeciente, 364, 371 partes de un, 401
de apuntamiento partición de un, 405
de Fisher, 100 por comprensión, 399
de asimetría por extensión, 399
de Fisher, 95, 96 unitario, 399
de Pearson, 94 universo, 402

de correlación vacío, 399
de Kendall, 123, 124 conjuntos
de Pearson, 119, 348 contenencia de, 400
de Spearman, 122 diferencia de, 403
479
480 ÍNDICE TEMÁTICO
diferencia simétrica de, 403 de caja, 58

disjuntos, 402 de caja y bigotes, 67
excluyentes, 402 de dispersión, 110
intersección de, 402 de líneas, 33
unión de, 402 de Pareto, 37
conmutativa, 419 de puntos, 39
contenido, 400 de sectores, 25
covarianza, 112, 347 de tallos y hojas, 31
muestral, 113 diferencial, 27
poblacional, 113 integral, 27
propiedades de, 115 diferencia de cuadrados, 367
crítica de la información, 14 diferenciable, 427
cuartil, 56, 58 diferencial, 429
cuasi-varianza, 71 discordancia, 124
curtosis, 100 diseño
curva muestral, 6
de Lorenz, 128 dispersograma, 110
distribución
dato normal
atípico, 68 bivariada, 336
extremo, 68 beta, 310
moderado, 68 binomial, 257
datos negativa, 271
atípicos, 33, 46 condicional, 107
bivariados, 109 de Bernoulli, 257
brutos, 47 de Cauchy, 313
depuración, 18 de frecuencias, 20
derivable, 427 campaniformes, 99
derivada, 427 leptocúrtica, 101
n-ésima, 436 mesocúrtica, 101
segunda, 436 platicúrtica, 101
tercera, 436 de Laplace, 314
desigualdad de Pascal, 271
de Chebyshev, 80 de Poisson, 274
desviación, 69 de probabilidad
absoluta, 84 marginal, 338
estándar, 77, 220 de Weibull, 312
muestral, 77 exponencial, 302
poblacional, 77 gamma, 306
media, 84 gaussiana, 291
mediana, 84 geométrica, 271
típica, 77 hipergeométrica, 264
diagrama lognormal, 315
de árbol, 157 multinomial, 329
de barras, 25 normal, 99, 291, 292
ÍNDICE TEMÁTICO 481
estándar, 293, 294 colectivamente exhaustivos, 144

uniforme disjuntos, 144
continua, 285, 286 independientes, 175
discreta, 255 mutuamente excluyentes, 144
univariada, 320 experimento, 139
dominio, 427 aleatorio, 140, 257
de una función, 413 binomial, 257
negativo, 270
ecuación clásico, 150
de primer grado con una incógnita, 371 de Bernoulli, 257
de segundo grado con una incógnita, 376 determinístico, 139
eje hipergeométrico, 264
de las abscisas, 25 laplaciano, 150
de las ordenadas, 25 exponente, 357
elementos, 5
empates, 55 fórmula cuadrática, 376
enumerar, 155 factor, 364
escala factor de corrección, 268
de intervalo, 10 factorial, 359, 401
de medición, 9 factorización, 364
de razón, 11 forma indeterminada, 437
nominal, 10 fracción, 361
ordinal, 10 frecuencia
espacio absoluta, 19
muestral, 141 acumulada, 19
esperanza, 208 conjunta, 105
estadística, 1, 3, 354, 398, 408, 412, 438 marginal, 105, 106
clasicación de, 4 relativa, 19, 148, 149
descriptiva, 4 acumulada, 19
inferencial, 4 conjunta, 105
estadístico, 6 función, 409, 412, 413
estandarización, 78, 237, 296 algebraica, 414
estimación, 324 beta, 310
estimador, 267 biyectiva, 406, 416
de máxima verosimilitud, 267, 274 continua, 426, 427
evento en un intervalo, 427
aleatorio, 141 en un punto, 427
complemento, 143 cuadrática, 413
diferencia, 143 de densidad, 198
elemental, 141 conjunta, 331
imposible, 142 de distribución acumulada, 191, 198
intersección, 143 conjunta, 326, 334
seguro, 142 de valor real, 413
unión, 143 exponencial, 414
eventos gamma, 306
generadora de momentos, 229 investigación

impar, 415 cientíca, 13
indicadora, 234 estadística, 11
intgrable, 439
inversa, 414, 417 límite, 420
inyectiva, 416 al innito, 425, 437
lineal, 413 innito, 426
logarítmica, 414 lateral, 426, 437
másica ley
de probabilidad conjunta, 323 involutiva, 146, 404
másica de probabilidad, 188 ley determinista, 2
par, 415 leyes
polinomial, 413 asociativas, 146, 403
racional, 413, 449 complementarias, 146, 404
sobreyectiva, 416 conmutativas, 146, 403
trascendente, 415 de De-Morgan, 146, 404
trigonométrica, 414 de idempotencia, 146, 404
uno-a-uno, 416 de la diferencia, 146, 404
distributivas, 146, 403
gráca, 413
logaritmo, 378
grado, 363, 371, 413
binario, 378
común, 378
hipótesis, 12
natural, 378
estadística, 12, 48
histograma, 28
máximo, 23
imagen método
directa, 409 cientíco, 3
inversa, 409 de captura-recaptura, 267, 273
incógnita, 371 de Gauss, 375
individuos, 5 de Heaviside, 448
inferencia de igualación, 374
estadística, 139 de reducción, 375
integración de sustitución, 374
por fracciones parciales, 448 mínimo, 23
por partes, 447 marca de clase, 29
por sustitución, 444 media
integral, 438 aritmética, 42, 43
denida, 438, 439, 443 ponderada, 46
impropia, 449 propiedades de, 44
tipo I, 450 armónica, 52, 53

tipo II, 451 propiedad de, 54
indenida, 443 geométrica, 50
no elemental, 448 propiedad de, 51
integrando, 449 pitagórica, 50
intervalo, 408 potencial, 60
recortada, 63 ojiva, 29
mediana, 47, 206 operaciones aritméticas, 354
medible, 7 origen, 415
medición, 9 outlier, 68
medida outliers, 46
relativa, 82
robusta, 49, 67 parámetro, 6, 208
medidas de forma, 306
de apuntamiento, 99 de localización, 292
de asimetría, 92 parte entera, 452
de asociación, 111 partición, 144, 439
de curtosis, 99 norma de una, 439
de desigualdad, 125 percentil, 56, 195, 296
de dispersión, 64 perles, 107
de forma, 91 columna, 108
de posición, 55 la, 108
de tendencia central, 41 permutación, 160
moda, 49 pictograma, 31
modelamiento, 241 población, 5
momento, 215 nita, 5
centrado alrededor de la media, 216 innita, 5
momentos, 215 polígono
muestra, 6 de frecuencias, 29
aleatoria, 346 acumulado, 29
no probabilística, 6 suavizado, 92
piloto, 14 polinomio, 363
probabilística, 6 ponderación, 46
muestreo, 6 porcentaje, 361
con reemplazo, 257 primer miembro, 372
no probabilístico, 6 primitiva, 440
probabilístico, 6 principio
sin reemplazo, 264 fundamental del conteo, 157

principio de la adición, 159
número de Euler, 378 probabilidad, 148
números a posteriori, 167
complejos, 408 a priori, 173
enteros, 406 clásica, 150
irracionales, 407 condicional, 167
naturales, 406 empírica, 149
racionales, 407 medida de, 152
reales, 408 subjetiva, 151
nube de puntos, 110 producto
cartesiano, 323
objetivos, 12 productoria, 383
observable, 7 promedio, 42
muestral, 6 de Sturges, 23
poblacional, 6 del límite
propiedad de la potencia, 423
asociativa de un cociente, 422
de la suma, 354 de un producto, 422
del producto, 355 de una diferencia, 423
conmutativa de una función constante, 422
de la suma, 354 de una suma, 422
del producto, 354 del múltiplo constante, 422
distributiva, 355 del trapecio, 448
punto empírica, 81
muestral, 141 regularidad
estadística, 148
radical, 357
rango, 23, 55, 65, 187 saber, 2
de una función, 413 cientíco, 2
intercuartílico, 66, 67 cotidiano, 2
razón, 360 segundo miembro, 372
realización de una variable, 42 sesgo, 91
recolección simetría, 92
de la información, 14 sistema de ecuaciones de primer grado
recorrido, 23 con n incógnitas, 376
regla con dos incógnitas, 374
de Barrow, 440 soporte, 331
de Cramer, 375 subconjunto, 400
de L'Hôpital, 437 propio, 400
de la cadena, 433 suceso
de la derivada aleatorio, 141
de potencias, 429 suma de
de un cociente, 430 Riemann, 438
de un producto, 430 sumatoria, 383
de una diferencia, 430
de una función constante, 429 término independiente, 364, 372
de una suma, 430 tabla
del múltiplo constante, 429 de clasicación, 21, 105
de la integración de contingencia, 105
de la aditividad, 442 de doble entrada, 104, 105
de la dominación, 442 tasa, 50
orden de, 441 teorema
de la integral de Bayes, 173
de una diferencia, 442 de Chebyshev, 79, 80, 227
de una suma, 441 de la multiplicación, 169
del múltiplo constante, 441 de la probabilidad total, 171
sobre un punto, 441 de Markov, 227
de Simpson, 448 de Moivre-Laplace, 300
fundamental del cálculo, 440 corregida, 71

tipicación, 78 muestral, 71
trinomio propiedades de, 73
cuadrado perfecto, 366 poblacional, 71
de la forma x2 + bx + c, 368 vector, 320
aleatorio, 321
unidad multinomial, 321
de medida, 13 Venn
de observación, 13 diagrama de, 400
compleja, 13
simple, 13
unidad imaginaria, 408
unidades
cuadráticas, 72
lineales, 77, 78
mixtas, 113
universo, 5
valor
esperado, 208
valor absoluto, 395
variabilidad, 72
variable, 7
adimensional, 78
aleatoria, 186
continua, 186
discreta, 186
auxiliar, 7
bidimensional, 109
cualitativa, 7
cuantitativa, 8
continua, 8
discreta, 8
dependiente, 109, 412
estandarizada, 78
independiente, 109, 412
latente, 7
longitudinal, 8
tipicada, 78
transversal, 8
variables
aleatoria, 185
conmensurables, 44
independientes, 342
varianza, 71, 72, 219

(2012) SOSA, J. C. Et Al. - Estadística Descriptiva y Probabilidades PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

(2012) SOSA, J. C. Et Al. - Estadística Descriptiva y Probabilidades PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Estadística descriptiva

Juan Camilo Sosa Martínez

Emilio Pablo Berdugo Camacho

Universidad Externado de Colombia

A mi querida familia: Elsi, Nani y Gonza.

A mi querida Yenny Paola y su hermoso Pollito.

A mis queridos Maestros.

Sin su Amor y su Apoyo este libro jamás hubiera sido posible.

A mis antiguos y futuros estudiantes.

© Luis Eduardo Ospina Forero

© Emilio Pablo Berdugo Camacho

Luis Eduardo Ospina Forero

Emilio Pablo Berdugo Camacho

Declaro mi profundo agradecimiento a la Universidad Externado de Colombia, por acogerme como

A todos Ustedes, ½innitas gracias!

Juan Camilo Sosa Martínez

1.2. Formas del saber . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3. ¾Qué es estadística? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.4. Clasicación de la estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.5. Algunos términos importantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.8. La investigación estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2. Tablas y grácas estadísticas 18

2.2. Tablas estadísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2.1. Tablas para variables cualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.2.2. Tablas para variables cuantitativas . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.3. Grácas estadísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.1. Grácos para variables cualitativas . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.2. Grácos para variables cuantitativas . . . . . . . . . . . . . . . . . . . . . . . . 27

2.3.3. Sobre los grácos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3. Medidas de tendencia central y de posición 41

3.2. Medidas estadísticas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.2.1. La media aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3.2.2. La media aritmética ponderada . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.2.5. La media geométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

3.2.6. La media armónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3.3. Medidas de posición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3.3.2. Los percentiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

3.3.3. Los cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.3. El rango intercuartílico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

4.4. Diagrama de caja y bigotes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.5. La desviación de un dato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

4.7. La desviación estándar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

4.9. Teorema de Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

4.10. El Coeciente de variación de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.11. Otras medidas de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

5.2. Medidas de asimetría . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

5.2.1. Inspección de las medidas de tendencia central . . . . . . . . . . . . . . . . . . 92

5.2.2. El coeciente de asimetría de Pearson . . . . . . . . . . . . . . . . . . . . . . . 94

5.2.3. El coeciente de asimetría de Fisher . . . . . . . . . . . . . . . . . . . . . . . . 95

5.2.4. El índice de asimetría de Yule-Bowley . . . . . . . . . . . . . . . . . . . . . . . 98

5.3. Medidas de apuntamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

5.4. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

5.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

6. Medidas descriptivas para dos variables 104

6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

6.2. Tablas de doble entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

6.3. Perles o distribuciones condicionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

6.4. Grácas para dos variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

6.5. Medidas de asociación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

6.5.1. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

6.5.2. Coeciente de correlación de Pearson . . . . . . . . . . . . . . . . . . . . . . . . 119

6.5.3. Coeciente de correlación de Spearman . . . . . . . . . . . . . . . . . . . . . . 122

6.5.4. Coeciente de correlación de Kendall . . . . . . . . . . . . . . . . . . . . . . . . 123

A todos Ustedes, ½innitas gracias!

1.4. Clasicación de la estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2. Tablas y grácas estadísticas 18

2.3. Grácas estadísticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.1. Grácos para variables cualitativas . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.3.2. Grácos para variables cuantitativas . . . . . . . . . . . . . . . . . . . . . . . . 27

2.3.3. Sobre los grácos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4.10. El Coeciente de variación de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5.2.2. El coeciente de asimetría de Pearson . . . . . . . . . . . . . . . . . . . . . . . 94

5.2.3. El coeciente de asimetría de Fisher . . . . . . . . . . . . . . . . . . . . . . . . 95

6.3. Perles o distribuciones condicionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

6.4. Grácas para dos variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

6.5.2. Coeciente de correlación de Pearson . . . . . . . . . . . . . . . . . . . . . . . . 119

6.5.3. Coeciente de correlación de Spearman . . . . . . . . . . . . . . . . . . . . . . 122

6.5.4. Coeciente de correlación de Kendall . . . . . . . . . . . . . . . . . . . . . . . . 123

6.5.5. Coeciente de Gini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125