y
probabilidades
Estadística descriptiva
y
probabilidades
Juan Camilo:
Luis Eduardo:
Con mucho amor para las mujeres mas importantes en mi vida: Lolita,
Leito, Marcela y Alejandra.
Emilio Pablo:
También resalto mi innita gratitud a mis maestros y mis colegas. Particularmente, al Profesor Luis
Guillermo Díaz Monroy y al Profesor Luis Alberto López Pérez, profesores de la Universidad Nacional
de Colombia, quienes sirvieron como evaluadores de este libro y lo enriquecieron en gran medida; y
a los co-autores de este libro, Luis Eduardo Ospina Forero y Emilio Pablo Berdugo Camacho, sin
quienes este libro no hubiera sido posible.
Finalmente, maniesto que este libro no hubiera sido posible sin la colaboración de todos los que
alguna vez fueron mis estudiantes, cuyas criticas hicieron de este libro lo que es hoy. Este libro es para
Ustedes y todos los que en algún momento quieran estudiar la Realidad.
6
Resumen
Este libro de texto es el resultado de dos años extensivos de investigación en la Universidad Externado
de Colombia, y no ha sido presentado previamente en esta Universidad u otras. Este libro contiene los
resultados obtenidos en investigaciones llevadas a cabo en el Departamento de Matemáticas, durante
el período comprendido entre julio de 2010 y diciembre de 2012, como resultado de la orientación
repetida de cursos de estadística en diversas facultades de la Universidad.
Este libro está dirigido a todos aquellos que se quieran adentrar en el estudio de la realidad tal
como es por medio de los métodos estadísticos clásicos. Este texto fue concebido primordial mente
para estudiantes de pregrado de Administración, Economía, Finanzas y otras carreras anes, que de
alguna forma necesiten apropiarse los conceptos indispensables para adquirir seguridad y destreza en
la aprehensión de los fundamentos que sustentan los métodos estadísticos y sus aplicaciones, que se
estudian en variados espacios académicos anes.
Así, se quiere dotar al lector de elementos que le permitan entender, analizar y hacer una evalua-
ción crítica de documentos y publicaciones especializados, relacionados con la toma de decisiones;
familiarizar al interesado con los conceptos básicos de probabilidad y las distribuciones probabilísti-
cas más comunes; y por último, presentar aplicaciones de la estadística descriptiva y de teoría de la
probabilidad en casos prácticos.
La primera parte del libro, está dedicada a todas las medidas y técnicas estadísticas relacionadas con
la descripción de la información, con el n de hacer un diagnostico de alguna realidad que se quiera
conocer para que pueda ser entendida y/o intervenida concienzudamente. Si este es el caso, el lector
deberá tener ciertos conceptos básicos de álgebra y aritmética, que se presentan con cierto detalle en
el apéndice A. En esta primera parte del texto, se ofrecen herramientas indispensables para describir
conjuntos de datos en los que se quiera precisar su tendencia (capítulos 2 y 3), su variabilidad (capítulo
4), su distribución (capítulo 5) y la relación que puedan tener con otras variables relacionadas (capitulo
6).
7
8
Una vez se tengan las herramientas descriptivas y se quiera profundizar en una realidad con mayor
detenimiento por medio de un modelo formal, en la segunda parte del libro se presentan todos los
métodos fundamentales para tratar variables con ciertos diseños asumidos por el investigador. Para
esto es necesario que el lector tenga los conatos básicos del cálculo diferencial y del cálculo integral, que
en cualquier caso, de olvido o desconociendo, se presentan en el apéndice C. Por tal motivo, se presentan
todas las herramientas necesarias para abordar con precisión el estudio de las características de una
variable asociadas con la incertidumbre de ciertos eventos (capítulo 7), los parámetros de tendencia y
variabilidad (capítulo 8), los posibles modelos probabilísticos que enmarquen sus rasgos (capítulos 9
y 10) y las posibles relaciones con otras variables (capítulo 11).
Contenido
Figuras xvi
Tablas xx
I Estadística descriptiva 1
1. Elementos generales 1
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.6. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.7. Medición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
i
ii CONTENIDO
1.9. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.10. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2.3. La mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.4. La moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3.1. El rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.4. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.5. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4. Medidas de dispersión 64
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2. El rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.6. La varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.8. Estandarización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.12. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.13. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
iv CONTENIDO
5. Medidas de forma 91
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
II Probabilidades 138
11.5.2. Valor esperado varianza para una combinación lineal de variables aleatorias . . 350
A.11.Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391
Referencias 478
Figuras
2.3. Grácos diferencial (a) e integral (b) de los datos de la tabla 2.10. . . . . . . . . . . . . . . . . . 29
xi
xii FIGURAS
5.2. Histograma (a) y diagrama de caja y bigotes (b) asociados con los datos de la tabla 2.9. . . . . . . 94
5.5. Ejemplos de algunas distribuciones simétricas con distintos grados de apuntamiento. . . . . . . . . 101
6.1. Gráco de barras tridimensional de las frecuencias relativas del ejemplo 6.2.2. . . . . . . . . . . . 110
6.2. Gráco de barras de las frecuencias relativas del ejemplo 6.2.2. . . . . . . . . . . . . . . . . . . . 111
6.4. Ejemplos de diagramas de dispersión en los que se evidencia una relación cuadrática (a), cúbica (b),
6.5. Ejemplos de diagramas de dispersión en los que no se evidencia directamente una relación entre a las
variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
6.6. Ejemplos de nubes de puntos de un par de variables con relación directa (a), relación inversa (b) y
6.9. Cartograma cartograma donde se evidencian los valores del coeciente de Gini a nivel mundial . . . . 127
6.11. Curva de Lorenz asociada con la repartición de las cuentas del ejemplo 6.5.6. . . . . . . . . . . . . 130
8.1. Gráco de la f.m.p. (a) y de la f.d.a. (b) de la variable del ejemplo 8.1.1. . . . . . . . . . . . . . . 188
9.1. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución uniforme discreta de parámetro
n = 6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
9.3. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial de parámetros
n = 10 y π = 0.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
9.4. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial de parámetros n=5
y π = 0.6. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
9.6. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución hipergeométrica de parámetros
n = 4, M = 3 y N = 10. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
xiv FIGURAS
9.7. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial negativa de pará-
9.9. Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución de Poisson de parámetro λ = 5. 277
10.1. Gráco de la f.d.p. (a) y de la f.d.a. (b) de una variable con distribución uniforme continua sobre el
intervalo a = −3 y b = 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290
10.4. Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución normal para diferentes
valores de los parámetros µ y σ2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
10.5. Ilustración gráca del cálculo de probabilidades bajo la distribución normal. . . . . . . . . . . . . 295
10.6. Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución exponencial para
diferentes valores del parámetro λ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
10.7. Gráco de la f.d.p. (a) y de la f.d.a. (b) de una variable con distribución exponencial de parámetro
1
λ= 16
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305
10.8. Algunas grácas de la f.d.p. de la distribución gamma para diferentes valores de los parámetros α y β . 307
10.9. Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución beta para diferentes
valores de los parámetros α y β. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
11.1. Función másica de probabilidad conjunta de las variables asociadas con los resultados de dos dados
distinguibles y balanceados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324
11.2. Función másica de probabilidad conjunta estimada para las variables género y nivel educativo . . . . 325
11.3. Función de distribución acumulada conjunta para dos variables discretas. . . . . . . . . . . . . . . 326
11.4. Función de distribución acumulada conjunta de las variables asociadas con los resultados de dos dados
distinguibles y balanceados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
11.5. Ejemplo de una función de densidad conjunta de un vector aleatorio bidimensional. . . . . . . . . . 332
11.6. Soporte de la función de densidad conjunta y región de integración de la probabilidad pedida del del
ejemplo 11.3.5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
11.7. Función de densidad conjunta de las variables asociadas a los tiempos de respuesta en un servidor de
computadoras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
11.8. Función de distribución acumulada conjunta para las variables asociadas a los tiempos de respuesta en
un servidor de computadoras. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
11.9. Función de densidad conjunta y función de distribución acumulada conjunta de la distribución normal
bivariada de parámetros µX = µY = ρXY = 0 y σX = σY = 1. . . . . . . . . . . . . . . . . . . 337
B.3. Diagramas de Venn para las operaciones entre conjuntos. De izquierda a derecha y de arriba a abajo:
A ∪ B , A ∩ B , A − B , B − A, A4B y AC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 405
2.2. Datos asociados con una encuesta de opinión acerca de una medida económica. 1=A favor; 0=En
2.4. Datos asociados con el nivel educativo de algunos empleados de una empresa. B= Bachillerato; P=
2.6. Datos asociados con la clasicación con respecto al tamaño y a la afectividad de un grupo de perros.
2.8. Datos asociados con las ganancias en un día determinado de una muestra de empresas de una ciudad. 24
2.12. Datos asociados con el número de clientes de un almacén atendidos en los últimos 20 días. . . . . . 32
xvii
xviii TABLAS
3.3. Datos asociados con el número de hijos de una muestra de empleados de una empresa. . . . . . . . 48
3.5. Datos asociados con los puntajes de una muestra de 20 empresas en relación a la calidad de sus servicios. 55
4.1. Datos asociados con los salarios anuales de una muestra de supervisores de ventas de dos empresas. . 64
4.4. Datos asociados con una muestra de ventas diarias (en millones de pesos) de una empresa. . . . . . 85
6.2. Tabla de contingencia asociado con el género (X ) y el nivel educativo (Y ) de una muestra de personas
6.6. Tabla de observaciones de una muestra correspondiente a un conjunto de datos bivariado. . . . . . . 110
6.8. Datos asociados con la posición y el puntaje de los competidores del ejemplo 6.5.4. . . . . . . . . . 123
6.9. Datos asociados con las concordancias y discordancias del estudio de mercadeo del ejemplo 6.5.5. . . 125
6.10. Datos asociados con el número de contratos que un gerente reparte entre sus empleados. . . . . . . 127
6.12. Datos asociados con los ingresos de una muestra de empresas de un sector económico particular. . . 128
6.13. Frecuencias acumuladas asociadas con la curva de Lorenz del ejemplo 6.5.6. . . . . . . . . . 130
6.14. Datos asociados con una muestra de utilidades de las acciones X y Y. . . . . . . . . . . . . . . . 132
6.15. Datos asociados con los salarios de una muestra de empleados de una empresa. . . . . . . . . . . . 133
6.16. Datos asociados con las ventas y gastos de una empresa determinada. . . . . . . . . . . . . . . . 133
6.17. Datos asociados con las calicaciones de las asignaturas A y B de una muestra de alumnos. . . . . . 134
6.18. Datos asociados con la tasa media de crecimiento del PIB y del empleo para 25 países de la OCDE
para el periodo 1988-1997. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
6.19. Datos asociados con los ingresos, el género y la preferencia de una medida económica del Gobierno
Nacional de una muestra de empleados de una compañía. . . . . . . . . . . . . . . . . . . . . . 137
7.1. Datos asociados con la clasicación de los empleados de una corporación según el género y el ingreso. 167
7.2. Datos asociados con la clasicación con respecto al asenso y al modo de trabado de un grupo de
8.1. Datos asociados con el puntaje de las empresas constructoras participantes en la licitación. . . . . . 237
8.2. Datos asociados con los valores obtenidos para el número de proteínas producidaspor un determinado
9.1. Probabilidades asociadas con los valores de una v.a. con distribución hipergeométrica de parámetros
9.2. Probabilidades asociadas con los valores de una v.a. con distribución binomial de parámetros n = 400
y π = 0.005, su respectiva aproximación por medio de la distribución de Poisson de parámetros λ = 2,
y la diferencia correspondiente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280
11.1. Valores de la función de distribución acumulada conjunta de las variables asociadas con los resultados
de dos dados distinguibles y balanceados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
X Vector aleatorio.
x Valor observado de X.
+∞ Más innito.
− Diferencia.
−∞ Menos innito.
= Igual a.
xxi
xxii TABLAS
≈ Aproximadamente igual a.
X̄ Media muestral de X.
R Matriz de correlaciones.
∩ Intersección.
◦ Compuesta de funciones.
cos(x) Coseno de x.
cot(x) Cotangente de x.
csc(x) Cosecante de x.
∪ Unión.
≡ Equivalente a.
∃ Existe.
∀ Para todo.
d
dx Derivada respecto a x.
∈ Pertenece a.
R
Integral.
⇔ Si y solo si.
P(A) Probabilidad de A.
Var[X] Varianza de X.
µX Media poblacional de X.
6= No es igual a.
@ No existe.
∈
/ No pertenece a.
Ω Espacio muestral.
ω Punto muestral.
Φ Conjunto vacío.
Φ(x; µ, σ 2 ) Función de distribución acumulada de una variable aleatoria con distribución normal de
parámetros µ y σ2 .
xxiv TABLAS
φ(x; µ, σ 2 ) Función de densidad de probabilidad de una variable aleatoria con distribución normal de
parámetros µ y σ2 .
Φ(z) Función de distribución acumulada de una variable aleatoria con distribución normal estándar.
φ(z) Función de densidad de probabilidad de una variable aleatoria con distribución normal están-
dar.
± Más o menos
Q
Productoria.
⇒ Entonces.
→ Tiende a.
sec(x) Secante de x.
Σ Matriz de covarianzas.
2
σX Varianza poblacional de X.
sin(x) Seno de x.
√n
x Raíz n-ésima de x.
√
x Raíz cuadrada de x.
Final de un ejemplo.
⊆ Contenido en.
tan(x) Tangente de x.
sgn(x) Signo de x.
4 Diferencia simétrica.
AF
dX Valor observado del coeciente de asimetría de Fisher muestral de X.
AG
dX Valor observado del coeciente de apuntamiento de Fisher de X.
AP
dX Valor observado del coeciente de asimetría de Pearson muestral de X.
AS
cX Valor observado del índice de asimetría de Yule-Bowley muestral de X.
CV
dx Coeciente de variación muestral observado de X.
dx Diferencial de x.
e Número de Euler.
f 0 (x) Derivada de f de x.
f (x) Función de x.
IA Función indicadora de A.
P Partición.
RX Rango de X.
Rx Rango observado de X.
TABLAS xxvii
X Variable aleatoria X.
X(i) Estadístico de orden asociado con la i-ésima posición de una muestra aleatoria.
Estadística descriptiva
1
Capı́tulo 1
Elementos generales
1.1. Introducción
En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de
1
involucrarse en la mayoría de las áreas del conocimiento. La estadística es una ciencia auxiliar para
todas las ramas del saber, y su utilidad es evidente teniendo en cuenta que la mayoría de los quehaceres
y las decisiones en cualquier disciplina involucran cierto grado de incertidumbre o incerteza.
Los críticos de la estadística arman que a través de la estadística es posible mostrar o comprobar casi
cualquier cosa; esta es una concepción ligera y profana que se deriva de la ignorancia de la disciplina
estadística, dado que en estos casos se desconoce la teoría subyacente y la forma adecuada de interpre-
tar los resultados que permiten obtener conclusiones acertadas y precisas. Así, algunos investigadores
tendenciosos han abusado de la estadística, elaborando investigaciones de intención, teniendo previa-
mente los resultados que les interesa mostrar a personas ingenuas y no conocedoras de las técnicas
estadísticas. Otros, por ignorancia o negligencia, también abusan de la estadística utilizando métodos
no apropiados o razonamientos erróneos que conducen al fracaso de sus investigaciones.
Sólo adentrándose en un mundo especíco como en las ciencias sociales, la economía y la adminis-
tración, por ejemplo, es posible percibir que la estadística es una herramienta que permite dar luz y
obtener resultados, y por tanto benecios, en cualquier tipo de estudio teórico o aplicado, cuyos mo-
vimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordados desde la perspectiva
1
2 CAPÍTULO 1. ELEMENTOS GENERALES
Los seres humanos poseen mayores o menores conocimientos, según el modo y el grado de participa-
ción en la cultura; pero de cualquier forma las formas y tipos de conocimientos generan dos modos
principales del saber que son el saber cotidiano y el saber cientíco . Se sabe de manera natural
por el solo hecho de vivir, y se sabe cientícamente cuando existe una disposición de conocer y de
indagar en lo desconocido con los procedimientos pertinentes.
2 Teoría que supone que la evolución de los fenómenos naturales está completamente determinada por las condiciones
iniciales (Real Academia Española 2012c).
3 Fotografía tomada de la página web http://www.educared.org/global/premiointernacional/finalistas/710/
biograf/Blaplace.html.
1.3. ¾QUÉ ES ESTADÍSTICA? 3
inmediata de lo que pasa, por lo que únicamente percibe la supercie de una realidad. Además, este
saber cotidiano no es sistemático, tanto en el proceso de adquisición y vinculación de la información,
como en el modo de establecer cánones de validación de la información; se limita a percibir lo inmedia-
to a través de experiencias, vivencias, estados de ánimo y emociones de la vida diaria, permaneciendo
en el nivel de la certeza sensorial.
De otra parte, se entiende por conocimiento cientíco, al conjunto de conocimientos racionales, ciertos
o probables, que obtenidos de manera metódica y vericados empíricamente, se sistematizan orgáni-
camente, cuyos contenidos son susceptibles de ser transmitidos.
El saber cientíco es racional, puesto que exige el uso de la razón y de una serie de elementos fun-
damentales como deniciones, proposiciones e hipótesis. Es cierto o probable, porque se trata con
verdades parciales, sujetas a corrección cuando nuevas experiencias demuestran la necesidad de recti-
cación. En la ciencia no existe la certeza absoluta . El conocimiento cientíco es metódico, ya
que no se obtiene al azar, sino mediante reglas lógicas, que acompañadas de procedimientos técnicos
se organizan según convenciones establecidas. También requiere la confrontación con la realidad y la
sistematización orgánica, porque no se trata de conocimientos inconexos sino de un saber ordenado
lógicamente, constituyendo un sistema de generalizaciones y principios que relacionan los hechos entre
si, deduciendo leyes y teorías. Además, los conocimientos de una ciencia deben ser transmisibles por
medio de un lenguaje que le sea propio y que debe responder a todas las exigencias de claridad y
precisión.
Para denir la estadística se debe precisar cada una de las técnicas que se emplean en los diferentes
campos en los que interviene. La denición dada en seguida permite apreciar la relación entre la
4
estadística y el método cientíco .
Nota. Los datos asociados con una realidad determinada pueden provenir de muchas fuentes como
registros históricos, diseños experimentales o muestras.
4 El método cientíco es el camino a seguir mediante una serie de operaciones, reglas y procedimientos jados
de antemano de manera voluntaria y reexiva, para alcanzar un determinado n que puede ser material o conceptual
(Pérez 2004, p. 188).
4 CAPÍTULO 1. ELEMENTOS GENERALES
La estadística se divide en dos grandes ramas de estudio que son la estadística descriptiva, cuando
los resultados del análisis no pretenden ir más allá del conjunto de datos observado, y la estadística
inferencial, cuando el objetivo del estudio es obtener conclusiones para un conjunto de datos más
amplio a partir de uno de menor tamaño. Estas dos ramas no son independientes, por el contrario,
son complementarias, y juntas proporcionan suciente información sobre la realidad, para que, quien
tenga poder de decisión, pueda tomar las medidas necesarias con el mayor grado de certeza posible.
La estadística descriptiva evidencia tal cual es una situación y muestra lo que hay ; permite explicar
las observaciones que se hagan sobre un evento, fenómeno o problema de investigación, evidenciando
propiamente la forma en que los hechos ocurrieron o se manifestaron.
La estadística inferencial toma lugar cuando a partir de los resultados obtenidos de un conjunto
de datos dado se obtienen conclusiones acerca de un conjunto de datos más amplio. Es decir, las
conclusiones que se obtienen de los datos en estudio, rebasan los límites de los mismos. Generalmente,
el análisis estadístico inferencial se lleva a cabo para mostrar relaciones de causa y efecto, y para
probar hipótesis y teorías.
5 También se puede tratar de un fenómeno individual repetido a través del tiempo (detalles en la sección 1.6). Éste
se puede entender como un fenómeno colectivo al considerar las ocasiones de medición como los elementos unitarios.
6 La aleatoriedad es una característica asociada a todo proceso cuyo resultado no es previsible, mas que en razón
de la intervención del azar, y por ende no se puede determinar en ningún caso antes de que éste se produzca.
1.5. ALGUNOS TÉRMINOS IMPORTANTES 5
Nota. La denición 1.5.1 no se reere únicamente a los seres vivos; una población puede estar consti-
tuida por los habitantes de un país o por los peces de un estanque, así como por los establecimientos
comerciales de un barrio o las viviendas de una ciudad.
Llevando a cabo una investigación se deben tener en cuenta algunas características esenciales al deli-
mitar la población en estudio, a saber, la homogeneidad, el tiempo, la cantidad y el espacio.
La homogeneidad se reere a que todos los miembros de la población tengan en común las caracte-
rísticas que se vayan a considerar en la investigación. Por ejemplo, si se investiga la incidencia de la
drogadicción en mujeres adolescentes, hay que denir precisamente el rango de edad de las jóvenes de
interés, de forma tal que todas las mujeres consideradas sean de la edad requerida.
La cantidad se reere al tamaño de la población. La falta de recursos como tiempo, dinero, espacio y
materiales puede limitar la extensión de la población que se quiere investigar. Por ejemplo, si se quiere
estudiar la preferencia de los colombianos frente a un producto determinado, no es necesario tener
en cuenta todas las personas económicamente activas del país, sino aquellos individuos que tengan
participación en el mercado del producto en cuestión.
El espacio se reere al lugar donde se localiza la población de interés. También, la falta de recursos
puede obligar al investigador a limitar el estudio a un conjunto de elementos más especíco. Siguiendo
el ejemplo anterior, puede que dicho producto se ofrezca principalmente en zonas particulares de las
ciudades intermedias.
Una población puede ser, según su tamaño, de dos tipos, a saber, nita o innita. Una población
nita es aquella donde el número de elementos que la conforma es nito. De otra parte, una población
innita es aquella donde el número de elementos que la forma es innito, o es tan grande que se puede
considerar innito. Por ejemplo, si se realiza un estudio sobre los productos que hay en el mercado,
hay tantos y de tantas calidades que esta población se puede considerar como innita.
6 CAPÍTULO 1. ELEMENTOS GENERALES
Nota. La cantidad de individuos de una muestra se simboliza con n, mientras que la cantidad de
elementos que constituyen una población nita se representa con N.
Se distinguen dos tipos de muestras. La clasicación de una muestra depende de cuán representativa
sea de la población, lo que se identica por el método de obtención de la misma. Se tienen las
muestras obtenidas a partir de procesos de muestreo no probabilístico y de muestreo probabilístico.
Las muestras no probabilísticas se caracterizan porque el diseño muestral
7
correspondiente se
realiza en forma subjetiva, arbitraria, según el criterio del investigador o del entrevistador de campo.
En el muestreo no probabilístico no existe una oportunidad real de que un elemento en particular de
la población sea seleccionado y por lo tanto no es posible calcular la conabilidad de las inferencias
asociadas. De otra parte, las muestras probabilísticas se fundamentan en el chance que tiene cada
elemento de la población en hacer parte de la muestra. En estas muestras, dadas ciertas condiciones de
conabilidad, error máximo admisible y tamaño poblacional, se deja al azar el diseño de la muestra.
El muestreo probabilístico permite medir la conabilidad de los procesos de inferencia y el error
de muestreo que está asociado intrínsecamente en el proceso (Soto 2001, p.31-33). El muestreo es
indispensable para el investigador ya que en la mayoría de aplicaciones no es conveniente o posible
medir a todos los miembros de una población, esto es, realizar un censo . En tales casos, se requiere
una muestra representativa de la población con el propósito de obtener conclusiones válidas acerca de
todo el colectivo en estudio.
El tamaño de la muestra depende de la precisión con que el investigador desee llevar a cabo el estudio; se
debe usar una muestra tan grande como sea posible teniendo en cuenta los recursos disponibles. Cuanto
más grande sea el tamaño de muestra, mayor será la posibilidad de que la muestra sea representativa
de la población.
Nota. El concepto de parámetro y estadístico son casi idénticos. La única diferencia radica en el
conjunto de datos donde cada cual es calculado; mientras un estadístico se calcula utilizando los datos
de una muestra, un parámetro se calcula utilizando los datos de una población.
Ejemplo 1.5.1. El promedio muestral y el promedio poblacional de una población nita son ejemplos
de un estadístico y de un parámetro respectivamente. Suponga que X representa una característica
7 El diseño muestral comprende todos los aspectos relacionados con la obtención de una muestra respecto a la
características objeto de estudio, como los objetivos de la investigación, la estructura de la población y los recursos
disponibles (humanos, nancieros, materiales, de disponibilidad de tiempo, etc.).
1.6. VARIABLES 7
medible de interés (detalles en la sección 1.6 y 3.2) y que xi representa el valor de X asociado con el
i-ésimo individuo; así, el promedio muestral observado de X, denotado con x̄, se dene como:
n
x1 + x2 + . . . + xn 1X
x̄ = = xi
n n i=1
N
x1 + x2 + . . . + xN 1 X
µX = = xi
N N i=1
Nota. Las expresiones dadas el ejemplo 1.5.1 son casi idénticas, pero la diferencia salta a la vista: en
la primera fórmula, se tiene la información de una muestra; mientras que en la segunda expresión, se
tiene la información de una población.
1.6. Variables
Las variables constituyen la materia prima de toda investigación estadística. En una investigación lo
primero que se debe hacer es delimitar la cuestión a investigar, lo que permite evidenciar las variables
preponderantes del estudio.
Algunos ejemplos de variables son la edad, el género, la raza, la nacionalidad, la estatura, el peso, el
ingreso, el número de nacimientos, la tasa de suicidios, el producto interno bruto, entre otras.
Nota. Las variables como la inteligencia, el gusto, el miedo y la vocación, por ejemplo, no son variables
observables. Tales características se denominan variables latentes . ¾Cómo realizar estudios que
involucren este tipo de variables? Generalmente se emplean variables auxiliares que reejen el atributo
que se quiere investigar, como los coecientes de inteligencia y las escalas de valores o anidad, por
ejemplo.
Las variables se pueden clasicar según su naturaleza como variables cualitativas o cuantitativas.
Las variables cualitativas son aquellas que se expresan en forma verbal como categorías o atributos.
El género, la raza, la aliación política, la nacionalidad y la profesión son ejemplos de variables
cualitativas.
8 CAPÍTULO 1. ELEMENTOS GENERALES
Las variables cuantitativas son aquellas que varían en términos de cantidad y se registran o expresan
en forma numérica. La edad, el peso, la estatura, la temperatura y el salario son ejemplos de variables
cuantitativas. A su vez, estas variables se clasican como sigue:
• Variables discretas : no admiten siempre un valor intermedio entre dos valores cualesquiera de
la variable. Por ejemplo, el número de hijos de una persona es una variable cuantitativa discreta.
• Variables continuas : siempre admiten un valor intermedio entre dos valores cualesquiera de
la variable. Por ejemplo, el salario de un empleado medido en millones de pesos es una variable
cuantitativa continua.
En ocasiones, por simplicidad, conviene expresar las variables cuantitativas como variables cualitativas.
Por ejemplo, las calicaciones de los estudiantes pueden ser categorizadas y expresadas como una
variable cualitativa. Así, el investigador puede utilizar una escala numérica de 0 a 5 para observar las
calicaciones de los estudiantes, y por comodidad expresar las observaciones por medio de categorías
acorde a un rango especíco de valores en el que la calicación del estudiante se encuentre, como por
ejemplo deciente, regular, bueno y excelente.
De otra parte, las variables tanto cualitativas como cuantitativas, también pueden ser clasicadas
como variables transversales o longitudinales . Las primeras son aquellas en las que el momento
de recolección de la información es el mismo para todos los individuos, o simplemente no es objeto de
estudio; mientras que las variables longitudinales son observadas repetidamente a través del tiempo.
Ejemplo 1.6.1. Una empresa de consultoría está creando un par de formularios para dos clientes
que necesitan información sobre un grupo particular de compañías que les son de interés. El primer
formulario indaga sobre el estado actual de las empresas de exportación respecto al año pasado, y
necesita establecer de éstas: el porcentaje de aumento de sus ventas respecto al año pasado, la cantidad
de clientes nuevos que tiene este año, el número de empleados que maneja y los grupos industriales
a los que exporta. De otro lado, el segundo formulario busca conocer los sectores industriales que se
encuentran en crecimiento constante y su posible horizonte nanciero. Para esto requiere establecer de
las industrias: el sector en el que se encuentra, el porcentaje de aumento en la producción y la cantidad
de clientes nuevos respecto al mes anterior. Clasicar las variables de interés. ¾Cuál formulario es
necesario diligenciar más de una vez?
Solución:
Para el primer formulario, el porcentaje de aumento de sus ventas respecto al año pasado es una
variable cuantitativa continua, ya que este valor puede ser cualquier número real. La cantidad de
clientes nuevos que tiene este año es una variable cuantitativa discreta, dado que si se tienen 10 u 11
clientes nuevos no es posible tener 10.5, por ejemplo. El número de empleados que maneja también
es una variable cuantitativa discreta, siguiendo el mismo razonamiento de la variable anterior. Por
último, los grupos industriales a los que exporta es una variable cualitativa, puesto que está asociada
con un número nito de valores cualitativos, a saber, industrial, comercial y de servicios.
En relación con el segundo formulario, el sector en el que se encuentra es una variable cualitativa como
1.7. MEDICIÓN 9
De otra parte, lo que se debe determinar en cuanto al diligenciamiento de los formularios es el objetivo
de cada uno, es decir, la razón de ser de cada cual. El primer formulario pretende responder a una
cuestión puntual referida a una comparación entre la actualidad y un tiempo pasado, mientras que el
segundo está diseñado para conocer una tendencia con el propósito de conjeturar sobre una situación
futura. Luego, lo más adecuado es que el primer formulario sea diligenciado una sola vez en el tiempo
para realizar dicha comparación (estudio transversal), mientras que el segundo formulario requiere
que sea diligenciado varias veces para establecer la tendencia del crecimiento en el tiempo (estudio
longitudinal). Por ende las variables del primer formulario son variables transversales y las del segundo
son variables longitudinales.
Nota. Un mismo formulario puede contener variables transversales y longitudinales.
1.7. Medición
Cuando se trata de objetos físicos el proceso de medición es directo, porque es cuestión de seguir
cuidadosamente unas reglas acordadas de antemano expresadas mediante una escala determinada.
Por ejemplo, es fácil tomar la estatura de una persona, dado que no hay dicultades en asignar un
número a la distancia que hay desde la planta de los pies hasta la coronilla del individuo de acuerdo
con la escala de una cinta métrica.
La taxonomía más conocida sobre las escalas de medición la presenta Stevens (1951) quien las clasica
en nominales, ordinales, de intervalos y de razón:
La escala nominal es aquella donde se clasican los individuos en categorías distintas. Consiste en
agrupar los individuos de acuerdo a alguna cualidad que los hagan propios de una categoría determi-
nada.
Es posible utilizar números en las escalas nominales, pero éstos no representan magnitudes absolutas.
Los números solo se utilizan con el propósito de etiquetar una determinada categoría. Por ejemplo, en
algunas encuestas se asigna el número 1 al género masculino y el número 2 al género femenino, con el
propósito de facilitar el almacenamiento y manejo de la información, pero ello no quiere decir que el
género masculino tenga mayor o menor valor que el género femenino.
Los números utilizados para efectos de identicación en una escala nominal, nunca se utilizan para
llevar a cabo procedimientos aritméticos. Su única función es identicar. De hecho, la medición en
una escala nominal es limitada porque solo permite efectuar una clasicación, mas no establecer la
magnitud de lo que se clasica.
La escala ordinal es aquella donde se clasican las unidades de observación en una posición con
relación a cierto atributo, pero sin indicar la distancia que hay entre las posiciones. Cuando se asignan
números es solo para indicar el orden de las posiciones de lo que se está identicando. Por ejemplo,
una junta directiva se encuentra analizando tres diferentes alternativas A, B y C para una campaña
de mercadeo, y deciden que la alternativa A es la mejor y que la B es la peor; así, se han ordenado
las alternativas de acuerdo a la conveniencia para la campaña, pero no es posible evidenciar que tan
conveniente es la alternativa A respecto a las otras dos alternativas.
Con una escala ordinal tampoco se deben llevar a cabo las operaciones aritméticas. La diferencia
que pueda haber entre los elementos observados, no está constituida por unidades absolutas que se
puedan utilizar para determinar la distancia entre los objetos medidos. Por ejemplo, en una carrera
en la que no ha sido tomado el tiempo de los competidores, es posible establecer quién llegó primero,
y quién llegó segundo, pero no es posible establecer la diferencia entre los tiempos de llagada de los
competidores.
La escala de intervalo es aquella donde se ordenan los elementos según la magnitud del atributo que
representan y se proveen intervalos iguales entre las unidades de medida. No posee un cero absoluto,
dado que es establecido por convención de forma arbitraria por los expertos en el área de estudio; el 0
no implica la ausencia del atributo. Por ejemplo, la escala de medida de la inteligencia posee un valor
0, pero éste no indica que un ser humano no tenga inteligencia. Análogamente, si la temperatura de
un objeto es 0 grados centígrados, no es cierto que dicho elemento carezca de temperatura, ya que la
designación del valor 0 es arbitraria y convencional.
Una diferencia de cierta magnitud en una escala de intervalo signica lo mismo para todas las posibles
diferencias con esa misma magnitud. Por ejemplo, la diferencia en la temperatura entre 1 y 2 es
equivalente a la diferencia entre 101 y 102 .
1.8. LA INVESTIGACIÓN ESTADÍSTICA 11
Por último, la escala de razón es aquella donde el punto 0 no es arbitrario y corresponde a una
total ausencia de la característica observada. Por ejemplo, la escala de medición de una regla de 10
centímetros es de razón, la cual está dividida en 10 unidades cada una de igual magnitud a partir de
un punto 0 absoluto y verdadero.
Algunas variables con las que se utiliza este tipo de escala se reeren a la ejecución de tareas motoras
y a los de aspectos siológicos. Dos ejemplos clásicos de la escala de razón son las medidas empleadas
para cuanticar la estatura y el peso de una persona. Además, dado el carácter absoluto del 0, la
razón entre los valores involucrados en esta escala de medida hace sentido.
En esta sección se señala el esquema de una investigación estadística, de la cual se hará énfasis en los
tópicos que se consideran de mayor relevancia e interés para el lector. El esquema de una investigación
estadística es el siguiente:
iv. Objetivos.
x. Bibliografía.
En una investigación es absolutamente necesario establecer qué y por qué se quiere estudiar algo.
Para ello, se debe lograr una delimitación clara, concreta e inteligible del problema que se quiere
12 CAPÍTULO 1. ELEMENTOS GENERALES
abordar, con el propósito de evidenciar su accesibilidad y solubilidad, de forma tal que por medio de
una revisión bibliográca responsable sea posible conocer el estado del arte, los resultados obtenidos
en investigaciones similares y corroborar las proposiciones básicas concebidas inicialmente.
Introducción y justicación
¾Qué se sabe de la realidad que interesa investigar? ¾Por qué interesa investigar esta realidad?
Antes de realizar cualquier investigación es obligatorio identicar qué se sabe acerca de la realizad
que se quiere examinar, con el propósito de establecer un punto de partida propio y real para el
estudio. Esto permite contextualizar e involucrar a todos los agentes de quienes pueda depender en
alguna medida la investigación. Por lo mismo es muy importante justicar apropiadamente por qué
es menester investigar tal realizad. De aquí depende que sea interesante y conveniente para todos los
actores involucrados, pues de ello depende muchas veces la consecución de los recursos.
Una hipótesis es una explicación provisional de los hechos objeto de estudio y su formulación depende
del conocimiento que el investigador posea sobre la población investigada. Una hipótesis estadística
debe ser susceptible de prueba, esto es, se debe poder docimar o juzgar para su aceptación ó rechazo.
Objetivos
¾Qué se quiere encontrar en el fenómeno objeto de estudio? ¾Qué se espera que suceda con la inter-
vención?
Luego de establecer los hechos objeto de estudio, se debe presupuestar hasta dónde se quiere llegar
con la investigación; en otras palabras, se debe jar cuáles son los objetivos de la investigación.
Éstos se deben plantear de tal forma que no haya lugar a confusiones o ambigüedades. Además, es
recomendable diferenciar los objetivos a corto, mediano y largo plazo, así como los objetivos generales
y los especícos.
Se debe evidenciar todo el bagaje teórico que dirige la investigación, describiendo completamente el
sustento teórico del problema y las evidencias de todo tipo que se encuentren alrededor del mismo.
En la fundamentación también se denen los términos más relevantes del estudio, ilustrando sus
principales rasgos y características.
¾Quiénes forman parte de la realidad que se estudia? ¾De ellos, quiénes serán los informantes? ¾Qué
y cómo se quiere medir?
La unidad de observación , entendida como cada elemento de la población estudiada, debe ser
denida previamente, de tal forma que se destaquen todas sus características; pues, al n de cuentas,
es sobre las unidades de observación que se hace la medición. Una unidad de observación puede
estar constituida por un elemento (unidad de observación simple) o por varios elementos (unidad de
observación compleja).
De otra parte, el criterio sobre el proceso de medición debe ser previamente denido y unicado. Por
ejemplo, si se trata de medidas de longitud, volumen o peso, se debe establecer bajo qué unidad de
medida se tomarán las observaciones, ya sea en metros, pulgadas, libras, kilogramos, etc. Así mismo,
se deben detallar las condiciones bajo las cuales se ha de efectuar la toma de la información.
En variadas circunstancias, estudiar todos y cada uno de los elementos que conforman la población no
es aconsejable, ya sea porque los recursos económicos y humanos son limitados, la homogeneidad de sus
elementos no justica un censo, o tal vez porque puede ser necesario destruir la unidad de observación.
Por tales motivos se recurre al análisis de los elementos de una muestra con el n de hacer inferencias
respecto a la población. La muestra en cuestión debe ser representativa de la población, esto es, sus
elementos deben ser escogidos de manera aleatoria de tal forma que reejen las características propias
de todos los individuos que conforman el colectivo en estudio.
Diseño de la investigación
En esta etapa se presenta el panorama metodológico completo que evidencia la forma en que se
organiza todo el proceso de investigación y los aspectos metodológicos esenciales que guían el trabajo
del investigador. En esta fase es de suma importancia la claridad y la precisión para dar cuenta del
posicionamiento del investigador en el mapa metodológico de la investigación cientíca. Dentro del
panorama metodológico se deben contemplar de manera particular los siguientes aspectos: recolección,
crítica, clasicación y ordenación, y análisis de la información.
14 CAPÍTULO 1. ELEMENTOS GENERALES
Establecer las fuentes de información, así como la complejidad del instrumento de medición, son
decisiones que se han de tomar teniendo en cuenta todos los factores involucrados en la observación
de los elementos objeto de estudio. Se debe, entonces, descubrir dónde está la información, cómo y a
qué costo se puede conseguir.
Después de reunir la información pertinente, se necesita la depuración de los datos recogidos. Para
hacer la crítica de la información, es fundamental el conocimiento de la población por parte de quien
depura, para que sea posible detectar, por ejemplo, falsedades en las respuestas, incomprensión a las
preguntas, o respuestas al margen de todas las posibles causas de nulidad de una pregunta. Una vez
separado el material de desecho de la información debidamente depurada se procede a establecer las
clasicaciones respectivas, y con la ayuda de hojas de trabajo, se ordenan las respuestas y se preparan
los modelos de tabulación de las variables que intervienen en la investigación. Los avances tecnológicos
hacen que estas tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo.
La estadística ofrece métodos y procedimientos objetivos que convierten las especulaciones de primera
mano en aseveraciones cuya conabilidad puede ser evaluada en la toma de decisiones. Esta es la fase
de cálculo de los estadísticos, el ajuste de los modelos y la prueba de las hipótesis estadísticas, con el
n de establecer y redactar las conclusiones denitivas.
Presentación y publicación
La información adquiere más claridad cuando se presenta en una forma adecuada. Los cuadros, las
tablas y los grácos facilitan el análisis, pero se debe tener especial cuidado con las variables que se
van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y grácos
redundantes que, antes que claridad, creen confusión. Además, la elección de los medios para mostrar
los resultados, se debe hacer no solo en función de las variables de interés, sino del lector a quien va
dirigido el informe.
8 Una muestra piloto es un subconjunto de objetos de estudio que no son necesariamente seleccionados bajo el rigor
teórico de una muestra probabilística. Una muestra piloto permite realizar una descripción preliminar del fenómeno
de estudio y probar varios pasos metodológicos de la investigación, con el n de realizar correcciones y examinar los
supuestos teóricos de las etapas posteriores.
1.9. COMENTARIOS 15
1.9. Comentarios
En este capítulo se presentan algunos conceptos básicos de estadística, con el propósito de alentar su
estudio y esclarecer las concepciones falsas que se tengan al respecto; como creer que la estadística
únicamente trata con los porcentajes y las frecuencias que aparecen continuamente en los periódicos.
Así, en este capítulo y en los siguientes, se muestra una concepción real de la estadística descriptiva
por medio de sus aplicaciones, dado que es una herramienta de gran utilidad, que requiere un uso
adecuado e inteligente.
Es indispensable tener claras las premisas y los fundamentos de la estadística, para que posteriormente
se entiendan los conceptos que se presentan, se apliquen los métodos de manera correcta, y se analicen
los resultados obtenidos objetivamente, con el n de no cometer errores astronómicos como, por
ejemplo, establecer que tomar café produce cáncer, conclusión que eventualmente podría surgir de
un estudio cuyos pacientes son en su mayoría fumadores.
Por último, se resalta la importancia de una investigación cientíca como herramienta de estudio, dado
que a través de las hipótesis, los protocolos y/o las metodologías desarrolladas en una investigación de
tales características, es posible obtener conclusiones válidas sobre un tema de interés, con el propósito
de tomar decisiones conscientes en situaciones que impliquen incertidumbre.
1.10. Ejercicios
1.1 Clasicar se según su naturaleza y establecer la escala de medición de las siguientes variables:
c. Número de errores.
l. Opinión.
d. Filiación política.
m. Profesión.
e. Calicación de una prueba.
n. Número de hermanos.
f. Nivel educativo.
ñ. Ingresos mensuales.
g. Estatura.
1.2 Proponer una posible unidad de observación para cada variable del numeral anterior.
1.3 Un investigador educativo quiere evaluar la efectividad de un nuevo método para enseñar a leer a
estudiantes sordos. El aprovechamiento al nal del periodo de enseñanza se mide con la puntuación
del estudiante en una prueba de lectura.
a. ¾Cuál es la variable de estudio? ¾Qué tipo de variable de es? ¾Cuál es la escala de medición?
16 CAPÍTULO 1. ELEMENTOS GENERALES
1.4 Una empresa tuvo el año pasado algunas ventas de gran importancia. Los datos correspondientes
(en millones de pesos) se muestran en la siguiente tabla:
b. Calcular la media muestral de cada una de las muestras conformadas por las siguientes obser-
vaciones: {10; 15}, {1; 2; 5; 10; 13} y {1; 4; 7; 9; 12; 15; 19; 20}. Las observaciones están ordenadas
por las.
1.5 Haciendo un estudio sobre la intención de voto en una población conformada por 5 millones de
votantes, de los cuales 2,900,000 son mujeres, se elige una muestra formada por 3,000 personas.
¾Cuántas mujeres y cuántos hombres deberá haber en la muestra elegida guardando las propor-
ciones dadas en la población?
1.6 ¾Cuáles son las principales diferencias entre la estadística descriptiva y la estadística inferencial?
1.8 Dada las motivaciones actuales que se tienen sobre el estudio del ser humano y sus interacciones
con el sexo opuesto, un centro de investigación decidió estudiar a tres grupos de personas de
manera independiente. El primero está conformado por 15 hombres y 15 mujeres, el segundo por
20 hombres y 10 mujeres, y el tercero por 10 hombres y 20 mujeres. El objetivo del estudio es
detectar los comportamientos que se encuentran solamente en uno de los grupos, es decir, aquellos
comportamientos que no se tengan en más de uno de ellos. ¾Este estudio haría uso de la estadística
descriptiva o de la estadística inferencial? ¾Por qué?
1.9 En los siguientes casos identicar la población, la muestra, la unidad de observación, la variable
de interés y si la medición es cuantitativa o cualitativa:
1.10. EJERCICIOS 17
a. Varias veces durante el día un ingeniero de control de calidad de una fábrica, seleccionada
aleatoriamente algunos artículos producidos, los examina y registra el número de imperfecciones
que encuentra en cada artículo.
b. Durante una auditoria, cierta cantidad de cuentas de una rma fueron seleccionadas aleatoria-
mente y examinadas en busca del número de errores.
d. Un gerente desea conocer si aquellos empleados que reciben 25 días de vacaciones son más
productivos durante el año que aquellos que reciben solo 15 días. El gerente selecciona una
muestra de 40 trabajadores y registra su rendimiento.
1.10 En los siguientes casos distinguir las muestras aleatorias de las que no lo son:
a. Un fabricante necesita tener la certeza de que menos del 2 % de los artículos de un embarque
son defectuosos, de modo que prueba cierta cantidad de ellos tomados de los que vienen arriba
de un cargamento.
b. El Ministerio de Salud desea saber si una tienda particular reúne los requisitos del código
sanitario. Para ello decide visitar la tienda el quinto día de cada mes.
c. La rectoría de una universidad desea establecer la proporción de estudiantes activos que están de
acuerdo con una reforma del reglamento estudiantil, por lo que contrata a un grupo de personas
para indagar sobre tal cuestión a los estudiantes que logren contactar un día determinado en
la plaza central de la institución.
a. Parámetro y estadístico.
b. Población y muestra.
1.12 Enumerar los siguientes términos en el orden adecuado: conocimiento, datos e información. Jus-
ticar.
1.13 Identicar tres tópicos actuales relacionados con la política, la economía y las ciencias sociales,
de los cuales se requiera algún tipo de información. Describir la información que se necesita para
investigar cada tópico.
1.15 Realizar el esqueleto de una investigación cientíca para un tema que le sea de particular interés,
en el cual haga mención de los puntos más importantes de una investigación estadística.
Capı́tulo 2
Tablas y grácas estadísticas
2.1. Introducción
Una de las primeras etapas en el análisis estadístico es la exploración de los datos, en la cual se resume
la información de las variables de manera compacta y precisa. Con este n se generan tablas y grácas
que evidencien claramente el comportamiento de las variables de manera individual y conjunta. Sin
1
embargo, una de las aplicaciones que mayor relevancia tiene este tipo de análisis es la depuración de
la información, puesto que la mayoría de anomalías se reejan de manera particular dentro del análisis
exploratorio de los datos. Por ello es que la mayoría de tales análisis enfatizan el estudio univariado
de los datos, es decir, de una sola variable a la vez.
Nota. Algunas anomalías de los datos pueden ser: datos faltantes, pérdidas de formato, errores de
digitación, valores no probables y no respuesta, por ejemplo.
1 La depuración es el proceso mediante el cual se realiza una inspección en busca de anomalías dentro de la estructura
de datos que posteriormente son eliminadas y/o corregidas.
18
2.2. TABLAS ESTADÍSTICAS 19
Considere un conjunto de n individuos asociado con una variable cuyas modalidades o valores han
sido agrupados en k clases o categorías denotadas con C1 , C2 , . . . , Ck . Para cada una de las k clases
se denen las siguientes magnitudes:
Nota. Multiplicado por 100 % la fórmula de la denición 2.2.2, fi representa el porcentaje de individuos
comprendidos en la clase correspondiente.
para i = 1, . . . , k .
Ni
Fi =
n
para i = 1, . . . , k .
20 CAPÍTULO 2. TABLAS Y GRÁFICAS ESTADÍSTICAS
Nota. Las frecuencias acumuladas se calculan para variables medidas en una escala al menos de tipo
ordinal; aunque también se pueden calcular para variables nominales, su interpretación es de cuidado,
de acuerdo al orden arbitrario de las clases establecido previamente.
Se llama distribución de frecuencias a la tabla que contiene las categorías junto con las frecuen-
cias correspondientes. Una tabla con tales características sirve para presentar de forma ordenada la
distribución de los datos. Su forma general se presenta en la tabla 2.1.
Proposición 2.2.1. En una distribución de frecuencias de una categoría con k clases se cumplen las
siguientes propiedades:
i. iii.
k
X i
X
fi = 1 Fi = fk
i=1 k=1
ii. iv.
Nk = n Fk = 1
Ci ni fi Ni Fi
C1 n1 f1 N1 F1
C2 n2 f2 N2 F2
. . . . .
. . . . .
. . . . .
Ck nk fk n 1
Total n 1 N.A. N.A.
Ejemplo 2.2.1. Considerar el conjunto de datos de la tabla 2.2 asociados con una encuesta de opinión
acerca de una medida económica. Elaborar la tabla de frecuencias correspondiente.
Solución:
La variable opinión, es una variable cualitativa nominal que toma los valores A favor, En contra
y NS/NR, de tal forma que el número de clases es k = 3. La tabla 2.3 corresponde a la distribución
de frecuencias requerida.
2.2. TABLAS ESTADÍSTICAS 21
1 0 0 1 1 3 1 3 1 3
0 0 0 3 0 0 0 1 1 0
1 0 0 0 0 0 1 1
Tabla 2.2: Datos asociados con una encuesta de opinión acerca de una medida económica. 1=A favor; 0=En contra;
3=No Sabe/No Responde (NS/NR).
Ci ni fi
A favor 10 35.7 %
En contra 14 50.0 %
NS/NR 4 14.3 %
Total 28 100 %
Como la escala de medición de la variable opinión es nominal entonces no hacen sentido las frecuen-
cias acumuladas.
Ejemplo 2.2.2. Considerar el conjunto de datos de la tabla 2.4 asociados con el nivel educativo de
algunos empleados de una empresa. Elaborar la tabla de frecuencias correspondiente.
B D M B B P B M B B
B P B M B B M B M B
B B B B B B P B B B
B M B P B B M B B B
D B M B P B B B P P
Tabla 2.4: Datos asociados con el nivel educativo de algunos empleados de una empresa. B= Bachillerato; P= Pregrado;
M= Maestría; D= Doctorado.
Solución:
La variable nivel educativo, es una variable cualitativa ordinal que toma los valores Bachillerato,
Pregrado, Maestría y Doctorado, por lo que el número de categorías es k = 4. La tabla 2.5
corresponde a la distribución de frecuencias requerida.
Como la escala de medición de la variable nivel educativo es ordinal entonces hacen sentido las
frecuencias acumuladas.
Otro tipo de tablas para variables cualitativas son generadas a partir de dos o más variables cualita-
tivas, denominadas tablas de clasicación a p vías, donde p es el número de variables cualitativas que
se estén considerando. En el ejemplo 2.2.3 se presenta una tabla a dos vías de clasicación.
22 CAPÍTULO 2. TABLAS Y GRÁFICAS ESTADÍSTICAS
Ci ni fi Ni Fi
Bachillerato 33 66.0 % 33 66.0 %
Pregrado 7 14.0 % 40 80.0 %
Maestría 8 16.0 % 48 96.0 %
Doctorado 2 4.0 % 50 100 %
Total 50 100 % N.A. N.A.
Ejemplo 2.2.3. Un estudio sobre el comportamiento de diferentes razas de perros generó la clasi-
cación que se presenta en la tabla 2.6 respecto a su tamaño (T ) y su afectividad (A).
Raza T A Raza T A
bass Peq Baja galg Gra Baja
beau Gra Alta gasc Gra Baja
boxe Med Alta labr Med Alta
buld Peq Alta masa Gra Alta
bulm Gra Baja mast Gra Baja
cani Peq Alta peki Peq Alta
chih Peq Alta podb Med Alta
cock Med Alta podf Gra Baja
coll Gra Alta poin Gra Baja
dalm Med Alta sett Gra Baja
dobe Gra Baja stbe Gra Baja
dogo Gra Baja teck Peq Alta
foxh Gra Baja tern Gra Baja
foxt Peq Alta
Tabla 2.6: Datos asociados con la clasicación con respecto al tamaño y a la afectividad de un grupo de perros. Peq=
Pequeño; Med= Mediano; Gra= Grande.
Con el propósito de empezar una campaña de mercadeo con esta clasicación, interesa conocer el
porcentaje de razas que son grandes y afectivas, y también el porcentaje de razas que son pequeñas y
afectivas. Para tal n se genera la tabla 2.7 a dos vías de clasicación con las variables en cuestión.
De esta tabla se concluye que las razas de perros cuyos tamaños son grandes, en su mayoría son poco
afectivas, mientras que las razas de perros cuyo tamaño es pequeño frecuentemente son muy afectivas,
por lo que en la campaña se considerará un enfoque publicitario en las razas de perros pequeños.
2.2. TABLAS ESTADÍSTICAS 23
Tabla 2.7: Tabla a dos vías de clasicación de los datos de la tabla 2.6.
Nota. Los resultados de estas fórmulas generalmente no coinciden, así que el usuario decidirá a
conveniencia cuantas clases utilizar.
RX = xmáx − xmı́n
4. Calcular la amplitud de las categorías. La amplitud se denota con a y por facilidad conviene
que sea igual para todas las clases. La fórmula de la amplitud es:
RX
a= (2.1)
k
.
.
.
Ejemplo 2.2.4. Considerar el conjunto de datos de la tabla 2.8 asociados con las ganancias (en
millones de pesos) en un día determinado de una muestra de empresas de una ciudad. Elaborar la
distribución de frecuencias correspondiente.
Tabla 2.8: Datos asociados con las ganancias en un día determinado de una muestra de empresas de una ciudad.
Solución:
La variable ganancias es una variable cuantitativa de razón. Es claro que esta variable no está dada
en categorías, por lo que es necesario elaborar las clases pertinentes como sigue:
√
1. Se opta por trabajar con k = 6 clases dado que 35 = 5.916 ≈ 6 y 1 + 3.3 log10 (35) = 6.095 ≈ 6.
4. a = 81.8/6 = 13.63.
Lo que sigue es enumerar la cantidad de datos en cada categoría, y así obtener la distribución de
frecuencias requerida (tabla 2.9).
Dado que las ganancias están medidas en una escala de razón hacen sentido las frecuencias acumuladas.
2.3. GRÁFICAS ESTADÍSTICAS 25
Ci ni fi Ni Fi
[60.40; 74.03) 5 14.3 % 5 14.3 %
[74.03; 87.67) 9 25.7 % 14 40.0 %
[87.67; 101.30) 10 28.6 % 24 68.6 %
[101.30; 114.93) 6 17.1 % 30 85.7 %
[114.93; 128.57) 3 8.6 % 33 94.3 %
[128.57; 142.20] 2 5.7 % 35 100 %
Total 35 100 % N.A N.A
Diagrama de barras
Un diagrama de barras es una representación gráca en la que cada una de las modalidades de la
variable de interés se representa mediante una barra. En este gráco se disponen los datos en el
primer cuadrante de unos ejes coordenados, levantando sobre el eje de las abscisas (eje x) una barra
para cada modalidad de la variable. La altura de la barra debe ser proporcional a la frecuencia absoluta
o relativa que se representa en el eje de las ordenadas (eje y ).
Nota. Estos diagramas se utilizan tanto para variables cualitativas como cuantitativas discretas cuando
la cantidad de categorías lo permite.
Ejemplo 2.3.1. En la gura 2.1 se muestra un diagrama de barras en el que se representa el estado
civil de una muestra de personas de una localidad.
Diagrama de sectores
En el diagrama de sectores se divide un círculo en tantas porciones como categorías tenga la variable,
de modo que a cada clase le corresponda un sector del círculo proporcional a su frecuencia absoluta o
26 CAPÍTULO 2. TABLAS Y GRÁFICAS ESTADÍSTICAS
relativa. El arco de cada porción se puede calcular usando la siguiente regla de tres:
n −→ 360o
ni −→ vi
Ejemplo 2.3.2. En la gura 2.2 se presenta un diagrama de sectores relacionado con la clasicación
de una muestra de empresas de una ciudad.
Nota. En algunas situaciones es de interés comparar dos conjuntos de datos. En tales casos es acon-
sejable el uso de las frecuencias relativas en los grácos para efectuar directamente la comparación.
Además, si los grácos usan los ejes coordenados, se debe procurar que éstos tengan la misma escala
de medida.
2.3. GRÁFICAS ESTADÍSTICAS 27
Para las variables cuantitativas, se consideran dos tipos de grácos en función del uso de las frecuencias
absolutas o relativas, a saber, diagramas diferenciales y diagramas integrales.
Nota. Dado que los diagramas integrales se construyen a partir de las frecuencias acumuladas, éstos
dan lugar a grácos crecientes.
Como se ha visto, hay dos tipos de variables cuantitativas: discretas y continúas. A continuación se
muestran algunas representaciones grácas para cada una de ellas.
28 CAPÍTULO 2. TABLAS Y GRÁFICAS ESTADÍSTICAS
Cuando se trabaja con una variable cuantitativa discreta, se utiliza como diagrama diferencial un
diagrama de barras. Se recomienda que las barras sean estrechas para evidenciar que los valores que
toma la variable son discretos. El diagrama integral tiene, dada la naturaleza de la variable, forma de
escalera.
Ejemplo 2.3.3. Para la información dada en la tabla 2.10 elaborar los diagramas diferencial e integral
correspondientes.
Número de hijos 1 2 3 4
Frecuencia 1 3 5 3
Solución:
En primer lugar, se debe obtener la distribución de frecuencias del número de hijos. Tal distribución
se presenta en la tabla 2.11. Con las frecuencias relativas se realizan los diagramas requeridos. Los
grácos utilizando las frecuencias absolutas son idénticos salvo por un cambio de escala en el eje de
las ordenadas.
Se observa que el gráco integral es creciente y que los saltos corresponden a la magnitud de las
barras del gráco diferencial. En la gura 2.3 se presentan estos grácos.
Ci ni fi Ni Fi
1 1 0.083 1 0.083
2 3 0.250 4 0.333
3 5 0.416 9 0.750
4 3 0.250 12 1
Total 12 1 N.A. N.A.
Cuando las variables son cuantitativas continuas se utilizan los histogramas y los polígonos de fre-
cuencias. Un histograma se construye a partir de la distribución de la frecuencias asociando a cada
categoría un rectángulo que tiene a cada intervalo como base. El criterio para calcular la altura de
2.3. GRÁFICAS ESTADÍSTICAS 29
Figura 2.3: Grácos diferencial (a) e integral (b) de los datos de la tabla 2.10.
cada rectángulo es mantener la proporcionalidad entre la frecuencia de cada intervalo y el área del
mismo.
Una vez se ha elaborado el histograma, el polígono de frecuencias consiste en unir mediante líneas
rectas los puntos superiores de cada rectángulo localizados en los puntos medios de cada intervalo.
Tales cantidades se denominan marcas de clase y están dadas por
li−1 + li
xi =
2
donde xi denota la marca de clase, y li−1 y li son el límite inferior y superior respectivamente de
i-ésimo intervalo para i = 1, . . . , k .
Un polígono de frecuencias acumulado u ojiva es un diagrama integral para una variable cuan-
titativa continua, y se obtiene de la misma forma que un polígono de frecuencias corriente, pero en
lugar de dibujar el polígono sobre el histograma, se representa sobre el diagrama de barras de las
frecuencias acumuladas.
Nota. Con el propósito de facilitar la lectura de los histogramas y de representar la información con
mayor precisión, es costumbre suavizar los polígonos de frecuencias como se ilustra en la gura 2.5.
30 CAPÍTULO 2. TABLAS Y GRÁFICAS ESTADÍSTICAS
Figura 2.4: Ejemplo de un polígono de frecuencias (a) y de un polígono de frecuencias acumulado (b).
Pictogramas
Un pictograma expresa con dibujos alusivos al tema de estudio las frecuencias de las modalidades de
la variable. Estos grácos se hacen representando a diferentes escalas un mismo dibujo. El escalamiento
de los dibujos debe ser de tal forma que el tamaño de cada uno de ellos sea proporcional a la frecuencia
absoluta o relativa de la modalidad que representa. Este tipo de grácos suele usarse en los medios de
comunicación, para que sean comprendidos por el público no especializado, sin que sea necesaria una
explicación compleja.
Cartogramas
Los cartogramas se utilizan cuando los datos disponibles hacen referencia a diferentes zonas geográ-
cas, de forma tal que los diferentes valores de la variable se indican con diferentes colores y tramas
sobre la zona correspondiente de acuerdo con el carácter que representan.
de los datos y cada hoja como el último dígito; de tal forma que si el dato es 42 entonces el tallo es
4 y la hoja es 2. El diagrama usa una representación en dos columnas; en la primera se ordenan los
valores de los tallos, y en la segunda, separada por una línea vertical de la primera, se colocan dentro
los valores de cada hoja ordenados ascendentemente sin importar que haya valores repetidos.
Nota. Cuando los datos son números muy grandes es necesario aproximarlos a cantidades cercanas a
cientos, dependiendo de las diferencias que se presenten.
44 45 50 62 45 51 44 50 58 44
49 62 61 53 56 56 60 54 55 47
Tabla 2.12: Datos asociados con el número de clientes de un almacén atendidos en los últimos 20 días.
Ejemplo 2.3.7. Un almacén reconocido con una capacidad máxima de atención de 60 clientes está
considerando contratar más personal, puesto que en los últimos días se ha visto corta de empleados
para atender a la clientela. Para vericar esto se realiza un diagrama de tallos y hojas con la información
de la tabla 2.12 correspondiente al número de clientes atendidos en los últimos 20 días.
Una vez realizado este diagrama de tallo y hojas (tabla 2.13), el almacén decide no contratar más
personal, puesto que la capacidad de atención a sido superada únicamente en 3 ocasiones.
Diagramas de líneas
2.4. COMENTARIOS 33
Tallo | hojas
4 | 4445579
5 | 001345668
6 | 0122
Los diagramas de líneas son grácos diseñados especialmente para representar una estructura
especial de datos longitudinales (detalles en la sección 1.6) denominada serie de tiempo. Este tipo
de datos surge cuando un mismo individuo es observado en diferentes ocasiones momentos con el
propósito de analizar la evolución de la variable de estudio a través del tiempo y de realizar pronósticos
con base en la tendencia observada. En estos diagramas la variable de estudio se presenta en el eje
y, mientras que los tiempos de medición correspondientes se muestran en el eje x, de tal forma que
se unen mediante líneas rectas las observaciones registradas. Ejemplos clásicos de las series de tiempo
son las series económicas.
Ejemplo 2.3.8. En la gura 2.8 se presenta un ejemplo de una serie de tiempo correspondiente al
4
precio nal (en miles de pesos) del galón de gasolina corriente en Bogotá .
Cuando se elabora un gráco hay que tener en mente su objetivo primordial: dar a entender de
manera clara y sencilla el comportamiento de una o varias variables e identicar fácilmente cualquier
fenómeno de interés, como la concentración de los valores de una variable en alguna clase, la existencia
categorías sin propósito, la presencia de datos atípicos, etc. Por tal motivo, se debe tener especial
atención en las partes que conforman los grácos, como el título principal, el título de los ejes, el
color, el tamaño y la escala, ya que se puede desviar la atención del gráco cuando éste es muy
estrambótico o colorido, o dicultar la lectura cuando se desconoce el signicado de los ejes, por
ejemplo.
2.4. Comentarios
En este capítulo se abordan las formas básicas de resumir variables cualitativas y cuantitativas por
medio de tablas y grácas. Las tablas permiten evidenciar cómo se comportan las variables respecto a
los grupos o categorías que ellas mismas denen con relación a la información que se tiene, dependiendo
de las especicaciones del problema y de las necesidades del investigador.
2.5. Ejercicios
2.1. Los datos que aparecen a continuación corresponden a los porcentajes de rentabilidad de las
acciones de una muestra de 25 empresas.
2.5. EJERCICIOS 35
b. Responder:
iii. ¾Qué porcentaje de acciones tienen el porcentaje de rentabilidad entre 43.38 % y 50.90 %?
iv. ¾Cuántas acciones tienen el porcentaje de rentabilidad menor que 28.34 % o mayor que
43.38 %?
2.2. Los datos que se presentan a continuación corresponden a las cuentas telefónicas mensuales (en
miles de pesos) de una muestra de residentes de un sector de una ciudad:
b. ¾Cuáles son las categorías o clases de cuentas que ocurrieron con menor frecuencia?
c. Realizar un gráco con el cual se pueda discutir la siguiente armación: hay concentración de
los montos de las cuentas telefónicas.
2.3. Se ha realizado una encuesta a 600 personas que se encuentran en un centro comercial sobre
el tipo de almacén que más frecuentan dándoles a escoger algunas opciones que guran en un
formulario. Se han obtenido los siguientes porcentajes: calzado, 10 %; vestimenta, 18 %; artículos
deportivos, 12 %; artículos decorativos, 4 % y alimentación, 26 %. Hacer la tabla de las frecuencias
y el gráco correspondiente. ¾Como podría utilizar esta información el administrador del centro
comercial?
2.4. Para decidir sobre el número de mostradores de servicio necesarios para las tiendas que se construi-
rán en el futuro, una cadena de supermercados desea obtener información acerca de la duración
(en minutos) requerida para atender a sus clientes. Para encontrar la distribución de tiempos de
servicios a clientes se registró la siguiente información correspondiente a 70 clientes:
4.6 1.3 0.2 0.7 0.7 1.3 0.7 0.2 2.3 3.7 6.6 2.5
0.6 2.1 0.7 0.6 1.6 1.3 0.4 0.6 3.2 3.1 4.4 0.6
0.5 1.2 0.9 1.9 1.6 1.3 3.0 0.1 0.7 0.0 0.8 0.1
1.2 3.0 3.5 2.2 0.1 0.1 5.8 1.7 0.8 1.7 1.3 2.5
7.0 4.0 1.0 2.6 0.2 0.3 0.1 0.2 0.9 7.8 2.9 0.1
1.9 4.9 2.1 2.1 0.9 0.2 6.8 0.4 6.3 2.2
c. Comparar los grácos de los incisos anteriores. ¾Muestran estos diagramas la misma informa-
ción?
d. ¾Qué fracciones de los tiempos de servicio son menores o iguales a un minuto? ¾Y entre uno
y dos minutos? ¾Cuáles son los tiempos de servicio mínimo y máximo?
2.5. La gerencia de una empresa mencionó en su informe anual las siguientes cifras en miles de millones
de pesos correspondientes a las ventas netas y el costo de producción desde 2000.
a. Calcular y representar anualmente la utilidad neta entendida como la diferencia entre las
ventas y el costo de producción.
c. ¾En que año se logró la utilidad máxima? ¾Y la utilidad mínima? ¾Cuáles fueron estas utili-
dades? ¾En qué periodo se presentó el mayor cambio en las utilidades? ¾Y el menor? ¾Cuál
fue la magnitud de estos cambios?
2.6. El valor de una variable cuantitativa se mide una vez al año durante un periodo de 10 años. A
continuación se presentan los resultados obtenidos:
Año 1 2 3 4 5 6 7 8 9 10
Medición 61.5 62.3 60.7 59.8 58.0 58.2 57.5 57.5 56.1 56.0
2.7. ¾Qué es un diagrama de Pareto? ¾Cuáles son sus características? ¾Cómo se utiliza? ¾Para que
sirve?
Utilizando un diagrama de Pareto, analizar las pérdidas por rechazos en una fábrica de papel,
teniendo en cuenta que se han detectado los conceptos que se muestran en la siguiente tabla, en
5
la que se indican los costes asociados (en miles de Euros) a cada concepto .
2.8. Calcular los datos que faltan en la siguiente tabla y elaborar el gráco diferencial e integral
correspondientes.
Ci ni fi Ni
[0; 10) 60 f1 60
[10; 20) n2 0.4 N2
[20; 30) 30 f3 170
[30; 100) n4 0.1 N4
[100; 200] n5 f5 200
Total n N.A.
2.9. En la siguiente tabla se muestran las cifras (en millones de USD) relacionadas con películas
6
más taquilleras de los últimos años . Los datos corresponden a la taquilla en Estados Unidos, la
recaudación mundial, el presupuesto y el año de estreno.
b. Calcular la taquilla fuera de los Estados Unidos y la utilidad neta entendida como la diferencia
entre la recaudación y el presupuesto.
c. Realizar un histograma de frecuencias relativas para la utilidad neta de las películas y con ésta
describir la distribución de las ganancias de los distribuidores.
2.10. A continuación se muestra la distribución del consumo anual (en puntos porcentuales) de un país
y de una de sus ciudades principales. Realizar un diagramas de sectores y de barras en cada caso y
2.5. EJERCICIOS 39
comentar los resultados obtenidos. ¾Cuáles grácos deben ser publicados? ¾Cuáles sectores tienen
mayor consumo? ¾Cuáles sectores tienen el menor consumo?
2.11. ¾Qué es un diagrama de puntos? ¾Cuáles son sus características? ¾Cómo se utiliza? ¾Para que
sirve? Mostrar una aplicación al respecto.
2.12. A continuación se presenta un conjunto de datos asociados con a la preferencia que tienen los
individuos en relación con la marca de vehículos según su punto de fabricación. En este formulario
se tuvieron en cuenta la zona de procedencia de los vehículos (1=Asia; 2=Europa; 3=Estados
Unidos), el género (0=Masculino; 1= Femenino) y la edad (en años cumplidos) de los individuos
que respondían el formulario.
c. Elaborar una tabla a tres vías de clasicación con las frecuencias relativas tomando como
clases para la edad los siguientes intervalos: 26-30 años, 31-35 años y 36-40 años.
3.1. Introducción
Cuando se realiza un análisis descriptivo de las variables de estudio que permita descubrir las anoma-
lías, estructuras, frecuencias y demás características relevantes de la información, se da un paso más
allá en el análisis pues se indaga ahora por las propiedades de la distribución de los datos. Con las
medidas estadísticas de tendencia central se quiere estudiar si los datos parecen estar agrupados en
uno o más grupos y que cantidades podrían ser representantes de tales grupos, o por el contrario, si
los datos se encuentran dispersos entre sí.
41
42 CAPÍTULO 3. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
medidas estadísticas de dispersión (capítulo 4), ya que la calidad de las medidas de tendencia central
está asociada intrínsecamente con el grado de concentración de la información.
1 Una realización de una variable se reere explícitamente al valor observado de esta variable obtenido a partir de
la medición concreta de un individuo particular objeto de estudio.
3.2. MEDIDAS ESTADÍSTICAS DE TENDENCIA CENTRAL 43
n
1X
x̄ = xi .
n i=1
Nota. Lamedia muestral observada de una variable X se simboliza con x̄, mientras que la media
2
poblacional se denota con µX . Así, cuando se dispone de una población nita, se tiene que
N
1 X
µX = xi
N i=1
donde N es el tamaño de la población. Además, la media se calcula para variables medidas en una
escala de intervalo o de razón.
Cuando los datos de una muestra están agrupados en una distribución de frecuencias, la media arit-
mética se calcula con la fórmula
Pk
ni xi
x̄ = Pi=1
k
i=1 ni
o con la fórmula
k
X
x̄ = fi xi
i=1
Solución:
Para calcular el promedio requerido primero se deben calcular las marcas de clase, es decir, calcular
para cada categoría
li−1 + li
xi =
2
donde li−1 y li son los límites inferior y superior de la i-ésima clase respectivamente para i = 1, . . . , 6.
Una vez calculadas las marcas de clase, se calcula el valor promedio de las ganancias aplicando la
fórmula del promedio para datos agrupados.
2 La media muestral X̄ = 1 Pn
Xi corresponde a la variable promedio de la muestra cuyos valores dependen
n i=1 Pn
1
de la muestra recogida; mientras que la media muestral observada x̄ = n i=1 xi compete a un valor especíco de la
variable X̄ calculada a partir de los datos de una muestra determinada.
44 CAPÍTULO 3. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
Clase xi ni ni xi
[60.40 ; 74.03) 67.22 5 336.08
[74.03 ; 87.67) 80.85 9 727.65
[87.67 ; 101.30) 94.48 10 944.83
[101.30 ; 114.93) 108.12 6 648.70
[114.93 ; 128.57) 121.75 3 365.25
[128.57 ; 142.20] 135.38 2 270.77
Total N.A. 35.0 3293.28
Como Pn
ni xi 3293.3
Pi=1
n = = 94.09
i=1 ni 35
entonces el valor promedio de las ganancias de las empresas es 94.09 millones.
Proposición 3.2.1. Sea X una variable y a, b números reales. Entonces se tiene que:
i. Si X=a entonces X̄ = a.
Ejemplo 3.2.2. Una compañía vende un promedio mensual de $47,700,000. La compañía paga men-
sualmente al Estado un impuesto igual al 17 % sobre las ventas. La utilidad de la compañía se calcula
teniendo en cuenta que quincenalmente paga $12,000,000 correspondientes a gastos jos de funciona-
miento además del impuesto sobre las ventas. Calcular la utilidad mensual promedio de la compañía.
Solución:
En esta situación x̄ = $47, 700, 000 donde X representa la venta mensual de la empresa. Como la
compañía paga mensualmente al Estado un impuesto igual al 17 % sobre las ventas y además gasta
3 Se dice que X y Y son variables conmensurables cuando existe una unidad común de medida en términos de la
cual tanto X como Y se pueden medir.
3.2. MEDIDAS ESTADÍSTICAS DE TENDENCIA CENTRAL 45
y por lo tanto ȳ = (0.83)(47, 700, 000) − 24, 000, 000 = 15, 591, 000 es la utilidad mensual promedio de
la empresa.
n
X n
X
xi = nx̄ y (xi − x̄) = 0.
i=1 i=1
Ejemplo 3.2.3. De 500 estudiantes cuya estatura promedio es 1.57 metros, 150 son mujeres. Si la
estatura promedio de las mujeres es 1.52 metros, ¾cuál es la estatura promedio de los hombres?
Solución:
P500
i=1 xi
x̄ =
500
n1 x̄1 + n2 x̄2
1.57 =
500
(150)(1.52) + 350(x̄2 )
1.57 =
500
y por lo tanto
(1.57)(500) − (150)(1.52)
x̄2 = = 1.59
350
De este modo el promedio de los hombres es 1.59 metros.
• Es de uso cotidiano.
46 CAPÍTULO 3. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
4
• Es sensible a datos atípicos .
• Corresponde a uno de los valores menos frecuentes del conjunto de datos cuando la distribución
de los datos tiene forma de U (distribución (a) de la gura 3.1).
Se ha visto que la media aritmética se calcula con base en la magnitud de los datos, otorgándoles
igual importancia ponderación o peso a cada uno de ellos: 1/n para un conjunto de datos con n
elementos. Sin embargo, en algunas ocasiones la importancia relativa de los valores de la variable no
es la misma en todos los casos, por lo que los datos son ponderados de tal forma que esta importancia
se vea reejada en las estadísticas asociadas.
Nota. El límite superior de las sumatorias de la fórmula anterior depende de si se dispone de datos
agrupados o no agrupados.
Solución:
4 Los datos atípicos (outliers en inglés) son datos muy grandes o muy pequeños comparados con el grueso del
conjunto de datos. Son observaciones con un comportamiento extraño porque toman valores que no se esperan (detalles
en la sección 4.4).
3.2. MEDIDAS ESTADÍSTICAS DE TENDENCIA CENTRAL 47
Se observa que las actividades académicas no tienen el mismo peso en la evaluación de la asignatura.
Por lo tanto, siguiendo la fórmula del promedio ponderado se obtiene que
3.2.3. La mediana
Otra medida de tendencia central es la mediana, la cual no se basa en la magnitud de los valores,
como la media aritmética, sino en la posición central que ocupa en el conjunto de datos ordenado
ascendentemente, dividiendo la información en dos partes iguales.
Nota. Lamediana muestral observada de una variable X se simboliza con x̃, mientras que la
5
mediana poblacional se denota con µ̃X . Además, la mediana se calcula para variables medidas en
al menos una escala ordinal.
6
Así, para determinar la mediana de un conjunto de n datos brutos , se realiza el siguiente procedi-
miento:
Ejemplo 3.2.5. Los datos de la tabla 3.3 corresponden al número de hijos de una muestra de em-
pleados de una empresa. Calcular e interpretar la mediana.
Solución:
El tamaño de la muestra es n=40. Ahora, debido a que el total de datos es par y que los datos de
la tabla están organizados ascendentemente, se tiene que la mediana es el valor ubicado entre las
n n
observaciones de las posiciones
2 = 20 y
2 + 1 = 21. Por lo tanto la mediana es
1+1
x̃ = = 1.
2
Este valor indica que la mitad de los empleados no tienen hijos o tienen uno solo.
Tabla 3.3: Datos asociados con el número de hijos de una muestra de empleados de una empresa.
Cuando los datos están agrupados en una tabla de frecuencias por intervalos, el cálculo de la mediana
es como sigue:
(0.5)n − Ni−1
x̃ = li−1 + (li − li−1 )
ni
donde i = mı́n{j : Nj > (0.5)n} es el número de la primera clase cuya frecuencia absoluta acumulada
es superior a (0.5)n.
Ejemplo 3.2.6. Calcular e interpretar la mediana de los datos del ejemplo 2.9.
Solución:
Se observa que las ganancias se encuentran organizadas en una tabla de frecuencias. En este caso i es
el número del primer intervalo cuya frecuencia absoluta acumulada es superior a (0.5)n = (0.5)(35) =
17.5; este intervalo es el número 3. Así, se obtiene que:
17.5 − (5 + 9)
x̃ = 87.67 + (101.30 − 87.67) = 92.44.
10
Entonces la mitad de las empresas tiene ganancias inferiores a 92.44 millones. Además, parece que
el valor de la ganancia mediana (92.44 millones) y el valor de la ganancia promedio (94.09 millones)
7
no dieren signicativamente . Esto sugiere que no hay ganancias atípicas que inuyan de manera
importante en la distribución de los datos. Es decir, la distribución de las ganancias de las empresas
parece ser simétrica con respecto a 94.09 millones.
7 Para comprobar este hecho formalmente es necesario docimar una hipótesis estadística.
3.2. MEDIDAS ESTADÍSTICAS DE TENDENCIA CENTRAL 49
8
• No se ve afectada por datos atípicos, es decir, es robusta frente a observaciones extremas, ya
que no depende de los valores que toma la variable, sino del orden de los mismos. Por ello, el
uso de la mediana es adecuado cuando la distribución de los datos no es simétrica.
3.2.4. La moda
La moda, como su nombre lo indica, es el valor más común (de mayor frecuencia) en un conjunto de
datos. Una distribución de datos puede tener una moda unimodal, dos modas bimodal o varias
modas multimodal. Asimismo, puede ocurrir que la distribución de los datos no tenga moda.
Nota. La moda muestral observada de una variable X se simboliza con x̆, mientras que la moda
poblacional se denota con µ̆X . Además, la moda se calcula para variables medidas en cualquier tipo
de escala.
Ejemplo 3.2.7. Calcular e interpretar la moda de los datos del ejemplo 3.2.5.
Solución:
Aquí se trata de un conjunto de datos bimodal debido a que hay dos valores de la variable que
maximizan la distribución de frecuencias. Estos valores de la variable son el valor 0 y el valor 1,
ambos con frecuencia absoluta igual a 12, lo que quiere decir que lo más frecuente para este grupo de
empleados es que no tengan hijos o tengan uno solo.
Cuando los datos están agrupados en una tabla de frecuencias por intervalos, el cálculo de la moda es
como sigue:
ni − ni−1
x̆ = li−1 + (li − li−1 )
(ni − ni−1 ) + (ni − ni+1 )
donde i ∈ {j : nj ≥ nl , ∀l = 1, . . . , k} es el número de un intervalo cuya frecuencia absoluta es la
mayor y k es el número de categorías.
8 Una medida se llama robusta si su magnitud no se altera notoriamente cuando hay cambios drásticos en la
estructura general del conjunto de datos donde es calculada.
50 CAPÍTULO 3. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
Ejemplo 3.2.8. Calcular e interpretar la moda de los datos del ejemplo 2.9.
Solución:
Se observa que las ganancias se encuentran organizadas en una tabla de frecuencia. En este caso i es
el número del intervalo cuya frecuencia absoluta es la mayor; este intervalo es el número 3. Así, se
obtiene que:
10 − 9
x̆ = 87.67 + (101.30 − 87.67) = 90.39.
(10 − 9) + (10 − 6)
La moda sugiere que las ganancias que aparecen con mayor frecuencia se encuentran alrededor de
93.39 millones y pertenecen al intervalo donde se encuentra tal ganancia modal.
Una medida originada a partir de la geometría es la media geométrica, la cual hace parte de las
medias pitagóricas : la media aritmética, la media geométrica y la media armónica.
v
u n
uY
n
Gx = t xi .
i=1
Nota. La media geométrica se calcula sobre un conjunto de datos cuyos valores sean números no
9
negativos, usualmente porcentajes y tasas .
Una forma de saber cómo y cuándo se debe usar la media geométrica es teniendo en cuenta lo siguiente:
si el total se obtiene de una productoria de valores, ¾cuál es el valor que al reemplazarlo en todas las
9 Una tasa se reere a la relación entre dos magnitudes asociada con la relación entre la cantidad y la frecuencia de
un fenómeno. Son ejemplos la tasa de inación, la tasa de desempleo y la tasas de natalidad (Real Academia Española
2012d).
3.2. MEDIDAS ESTADÍSTICAS DE TENDENCIA CENTRAL 51
observaciones daría como resultado el mismo total? Es decir, la media geométrica se usa cuando el
total corresponde al producto de diferentes observaciones, mientras que la media aritmética se utiliza
cuando el total es obtenido mediante la adición de las observaciones.
Ejemplo 3.2.9. Se tiene un activo en la banca que genera ganancias del 30 % en el primer año, 20 %
en el segundo y 60 % en el tercero. ¾Cuál es la ganancia promedio?
Solución:
Lo primero que se debe observar es que el promedio requerido no es el promedio aritmético, pues lo
que se tiene no es una adición de capital en cada año, sino una multiplicación del mismo. En el primer
año se multiplica por 1.3, en el segundo por 1.2 y en el tercero por 1.6; y así, la ganancia que se obtiene
al nal de los tres años está multiplicada por estas tres cantidades. Luego, la ganancia promedio se
obtiene mediante:
p
3
√
3
Gx = (1.3)(1.2)(1.6) = 2.496 = 1.356.
En consecuencia, la ganancia promedio del activo es 35.6 %.
Nota. En ejemplo 3.2.9 la media aritmética y la media geométrica dieren notablemente.
Ejemplo 3.2.10. Comprobar el resultado de la proposición 3.2.3 con la información del ejemplo 3.2.9.
Solución:
A continuación se presenta sin demostración una proposición que establece la relación entre la mag-
nitudes de la media geométrica y de la media aritmética de un conjunto de observaciones positivas.
Esta proposición fue presentada por Augustin Louis Cauchy 10
en el siglo XIX y es como sigue:
• En algunos casos no está denida para conjuntos de datos que tengan valores negativos.
La media armónica última de las medias pitagóricas se enfoca en el promedio de medidas de razón.
3.2. MEDIDAS ESTADÍSTICAS DE TENDENCIA CENTRAL 53
n
Hx = Pn 1 .
i=1 xi
En variadas ocasiones esta medida de tendencia central no ha sido bien implementada, ya que existe
una confusión generalizada a la hora de decidir si usar la media aritmética o la media armónica como
medida de resumen.
Ejemplo 3.2.11. Se dispone de la información dada en la tabla 3.4 acerca de tres autos y sus
velocidades. Calcular la razón promedio de las velocidades.
Solución:
La media aritmética se utiliza cuando los denominadores se mantienen constantes, esto es, cuando el
tiempo es constante; mientras que la media armónica se emplea cuando el tiempo no es constante.
Por ello, solo con esta información no es posible decidir cuál de las dos medias es la correcta, así que
se consideran los siguientes escenarios:
En otras palabras se puede decir que en el escenario 1, al mantenerse constante el tiempo de trabajo,
se mantiene jo el denominador de la razón y por tanto se debe usar la media aritmética:
10 + 20 + 30
x̄ = = 20
3
54 CAPÍTULO 3. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
3
Hx = 1 1 1 = 16.363
10 + 20 + 30
Se observa que son los mismos resultados obtenidos con el razonamiento inicial.
1 1
=
x Hx
esto es,
n
X 1 1
= .
x Pn n
i=1 i
1
i=1 xi
Ejemplo 3.2.12. Comprobar el resultado de la proposición 3.2.5 con la información del ejemplo
3.2.11.
Solución:
1 1 1
1 10 + 20 + 30 0.100 + 0.050 + 0.033
= = = 0.061
x 3 3
1 1
que es igual al inverso de la media armónica
Hx = 16.363 = 0.061.
• No está denida cuando en el conjunto de datos alguno de los valores es nulo o en el caso de que
la suma de sus inversos sea igual a 0.
• Se garantiza su existencia si todos los datos del conjunto son positivos ó negativos.
• Resulta poco afectada por la existencia de valores grandes en el conjunto de datos; mientras
que es sensible a los valores cercanos a 0.
3.3. MEDIDAS DE POSICIÓN 55
Las medidas de posición permiten conocer otros puntos característicos de la distribución de los datos
diferentes a las medidas de tendencia central, que permiten dividir la información a conveniencia.
A continuación se presentan las medidas de posición de uso frecuente en estadística: el rango y los
percentiles.
3.3.1. El rango
En este ámbito, el rango de un conjunto de observaciones corresponde a los valores que describen la
posición en la que se encuentra cada valor del conjunto de datos ordenado ascendentemente.
Nota. No se debe confundir el rango de un conjunto de datos denido en esta sección con el rango de-
11
nido en la sección 2.2.2 para elaborar histogramas. De otro lado, cuando haya empates la asignación
del rango varía según el objetivo de la misma. En unos casos se asigna la posición de manera aleato-
ria entre los individuos empatados y en otros se asigna el promedio de las posiciones que tomarían,
eventualmente.
52 56 50 41 50 62 55 46 62 48
46 62 53 55 43 42 47 50 42 65
Tabla 3.5: Datos asociados con los puntajes de una muestra de 20 empresas en relación a la calidad de sus servicios.
Ejemplo 3.3.1. Los datos de la tabla 3.5 corresponden a los puntajes de una muestra de 20 empresas
en relación a la calidad de sus servicios. Encontrar el rango del conjunto de datos.
Solución:
Lo primero que se debe hacer es ordenar los datos ascendentemente sin perder su identicación. Una
vez hecho esto, es claro que los valores 41 y 65 son el mínimo y el máximo de dicho conjunto de datos
y que hay solo una empresa con cada uno de estos valores, en este caso los individuos 7 y 20; por lo
tanto la posición que tendrán estos individuos en el rango es 1 y 20 respectivamente.
Para asignar la segunda posición se debe observar que hay dos individuos con el siguiente valor más
bajo (42), luego a estas empresas (individuos 12 y 18) se les puede asignar aleatoriamente las posiciones
2+3
= 2.5.
2
De esta manera el valor en el rango de los individuos 12 y 18 es 2.5 para ambos. Siguiendo con este
procedimiento se obtiene el rango que se presenta en la tabla 3.6.
12.0 16.0 10.0 1.0 10.0 18.0 14.5 5.5 18.0 8.0
5.5 18.0 13.0 14.5 4.0 2.5 7.0 10.0 2.5 20.0
Los percentiles son valores que se caracterizan por superar cierto porcentaje de observaciones del
conjunto de datos. Los percentiles son medidas de posición usadas constantemente para describir los
de datos en relación a una posición de interés.
Un percentil es un valor que acumula un porcentaje especíco de los datos. Se disponen principal-
mente de los percentiles como medidas de posición, y asociados a éstos como casos particulares se
tienen los cuartiles (percentiles 25, 50 y 75), por ejemplo.
Dependiendo de cómo estén dispuestos los datos (brutos o agrupados) el cálculo de los percentiles se
hará de una manera u otra. Si los datos no están agrupados, para calcular el p-ésimo percentil de un
conjunto de n datos se deben seguir los siguientes pasos:
i = np/100
Ejemplo 3.3.2. Calcular e interpretar el decil 6 (percentil 60) para los datos del ejemplo 3.3.
Solución:
Como se trata de un conjunto de datos discretos organizados en una tabla de frecuencias, el percentil
60 se calcula siguiendo los siguientes pasos:
3. Como i es entero, el percentil 60 es el promedio de los valores de los datos ubicados en las
1+2
posiciones 24 y 25. En consecuencia, el percentil 60 es p60 = 2 = 1.5.
Este valor indica que el 60 % de los empleados tienen dos hijos o menos. ¾De qué otra manera se puede
interpretar el percentil 60 en este caso?
Cuando los datos están agrupados en una tabla de frecuencias por intervalos, el cálculo del p-ésimo
percentil es como sigue:
(p %)n − Ni−1
pp = li−1 + (li − li−1 ) (3.1)
ni
donde i = mı́n{j : Nj > (p %)n} es el número de la primera clase cuya frecuencia absoluta acumulada
es superior a (p %)n.
Nota. La fórmula anterior es casi la misma fórmula para calcular la mediana, solamente que en lugar
de escribir (0.5)n se escribe (p %)n. De hecho, la mediana es un caso particular de un percentil: es el
percentil 50, es decir, el percentil calculado cuando p = 50.
Ejemplo 3.3.3. Calcular e interpretar el decil 8 (percentil 80) para los datos del ejemplo 3.2.1.
Solución:
Se observa que las ganancias se encuentran organizadas en una tabla de frecuencias. En este caso i es
número del primer intervalo cuya frecuencia absoluta acumulada es superior a (0.80)n = (0.80)(35) =
28.0; este intervalo es el número 4. Así, se obtiene que:
(0.80)(35) − 24
p80 = 101.3 + (13.6) = 110.4.
6
Entonces se tiene que el 80 % de las empresas tiene ganancias inferiores a 110.4 millones. ¾De qué otra
manera se puede interpretar el percentil 80 en este caso?
58 CAPÍTULO 3. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
Los tres cuartiles son un caso particular de percentiles. Éstos dividen el conjunto de datos en cuatro
partes con el mismo porcentaje de datos. Los cuartiles están dispuestos de la siguiente forma: el
primer cuartil, simbolizado con q1 , es el percentil 25; el segundo cuartil q2 , es el percentil 50, es decir,
la mediana; y el tercer cuartil q3 , es el percentil 75. Así,
q1 = p25 , q2 = p50 y q3 = p75 .
Una aplicación de los cuartiles en estadística consiste en realizar un gráco que describe adecuadamente
la forma de la distribución de un conjunto de datos; tal diagrama también sirve para detectar datos
atípicos. Este gráco es denominado diagrama de caja , boxplot en inglés, y es materia de estudio
en la sección 4.4.
Solución:
Aquí, los índices i, j y k corresponden a los números de los intervalos cuya frecuencia absoluta acu-
mulada es superior a (0.25)(35) = 8.75, (0.5)(35) = 17.50 y (0.75)(35) = 26.25 respectivamente. De
esta manera los cuartiles que se obtienen para este conjunto de datos son:
(0.25)(35) − 5
q1 = 74.03 + (13.63) = 79.71,
9
(0.50)(35) − 14
q2 = 87.67 + (13.63) = 92.44,
10
(0.75)(35) − 24
q3 = 101.30 + (13.63) = 106.41.
6
Con esto se puede decir que el 50 % de las ganancias se encuentra entre 79.71 y 106.41 millones, y que
el 25 % de las empresas con menores utilidades tienen ganancias inferiores a 79.6 millones, así como
el 25 % de las empresas con mayores utilidades tienen ganancias superiores a 106.41 millones.
3.4. Comentarios
Como parte de una revisión inicial de los datos, las medidas de tendencia central y de posición son
las primeras en proveer información sobre el comportamiento de los datos, como alrededor de cuáles
valores se concentran, cuáles valores son los más frecuentes y cómo se encuentran ordenados. A pesar
de que estas medidas son de cálculo e interpretación simple, tiende a haber un mal uso de las mismas,
ya sea a la hora de calcularlas o de interpretarlas, ya que fácilmente se puede utilizar el promedio
aritmético como medida de tendencia central cuando en realidad se debe usar la media geométrica, por
ejemplo; y aunque en algunos casos las diferencias no sean grandes numéricamente, éstas sí pueden
traer consecuencias graves dependiendo del contexto de las cifras. Errores tan simples como estos se
cometen día a día y por esto es que en este capítulo se enfatiza el uso adecuado de tales medidas.
3.5. EJERCICIOS 59
3.5. Ejercicios
3.1. Una compañía de mercadeo tiene dentro de su sta a 24 profesionales que realizan tareas por fuera
de la empresa con mucha frecuencia. A la gerente de esta empresa le tiene preocupada la falta
de puntualidad de sus trabajadores ya que ha recibido varias quejas en los últimos meses y cree
que esto puede dañar la reputación de la empresa. Los datos de la siguiente tabla corresponden
a la tardanza (en minutos) en llegar a las citas de trabajo de algunos empleados, clasicada por
el género:
Mujeres 6.3 10.0 9.2 7.3 4.1 6.4 9.8 8.4 5.2 0.4 5.0 0.6
Hombres 5.1 4.4 0.9 3.2 5.9 6.2 1.4 3.9 0.1 4.2 8.3 7.3
b. El gerente tiene la sospecha de que algún género es más incumplido que otro. ¾Qué es posible
sugerir con base en la media, la media y la moda?
3.3. El precio de una acción (Y ) se modica multiplicativamente según los cambios mensuales en la
tasa de cambio del Euro (T C ) según la siguiente regla:
(
y = 1.3 si T C ≥ 3, 000;
y = 0.9 si T C < 3, 000.
Acorde a las variaciones de la tasa de cambio para los 12 meses de la siguiente tabla, si el valor
inicial de una acción es 4, 250, calcular para ésta la valorización (o depreciación) promedio y el
valor al nal del periodo.
Si se tiene la misma inquietud anterior, ahora por semestre, ¾qué valores se obtendrían?
Mes 1 2 3 4 5 6
Semestre 1 3,148 3,087 3,210 2,956 3,215 3,053
Semestre 2 2,999 3,106 3,202 3,157 3,285 3,111
3.4. Calcular e interpretar la razón media del número de actividades por hora con la que los traba-
jadores de una fábrica realizan sus actividades (procesos de manufactura). En la siguiente tabla
se presentan los tiempos (en horas) en los que los trabajadores realizan 20 actividades, las cuales
conforman la cadena de producción.
60 CAPÍTULO 3. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN
42.20 45.70 34.60 40.20 48.90 43.80 46.00 39.50 57.80 37.20
56.40 40.30 46.90 41.70 27.20 51.70 37.90 39.60 59.00 39.00
3.5. Veintiuna personas en un salón de clase tienen una altura promedio de 168 centímetros. Si al
salón entra una persona adicional, entonces, ¾cuál es la altura que debe tener esta persona para
que la altura promedio se incremente un centímetro?
3.6. El siguiente conjunto de datos corresponde al origen y la estadía de los visitantes hospedados en
hoteles de categoría I a IV de un sector turístico determinado. Calcular la media aritmética del
número de visitantes por nacionalidad.
3.7. Una empresa de manufacturación de productos químicos tiene una producción diaria de smog
3 3 3
de 110 cm en el ala A, de 80 cm en el ala B y de 149 cm en el ala C. Por otra parte el
Gobierno, decide crear una política en la cual la producción promedio máxima admisible de smog
por una empresa de químicos sea de 112.1 cm3 por día. Si la compañía mantiene una actividad de
3
producción de smog que culmina en 80 mts en cada ala, entonces se puede decir que la empresa
cumple con el requerimiento. Calcular e interpretar el valor promedio de la producción de smog
por día.
n
! α1
1X α
x̄α = x
n i=1 i
3.10. Un grupo de 200 estudiantes, cuya estatura promedio es de 160.96 centímetros se divide en dos
grupos, uno con una estatura promedio de 163.4 centímetros y otro con una de 157.3 centímetros.
¾Cuántos estudiantes en cada grupo?
3.11. A continuación se presentan los salarios mensuales en miles de pesos, pagados por una empresa
estatal a su personal. En la empresa se presenta un conicto laboral. El gerente propone un
aumento del 2 % para cada uno de los empleados y la junta directiva propone un aumento de 5
mil pesos quincenales para cada empleado.
a. Con base en el promedio, ¾qué es más ventajoso para el Estado y qué para cada grupo de
empleados?
b. Para cada propuesta, calcular el salario a partir del cual se encuentra el 10 % de los empleados
mejor pagos de la compañía.
3.12. Una de las metas de toda administración pública o privada es ganar lo más posible en relación
con el capital invertido en la empresa. Una medida del éxito en alcanzarla es el retorno sobre
la aportación, que es la relación de la ganancia neta entre el valor de las acciones. Los datos
presentados a continuación corresponden a los porcentajes de ganancia sobre las acciones para
una muestra de empresas gubernamentales del país.
# Aportación Frecuencia
1 2.0 - 5.0 4
2 5.0 - 8.0 7
3 8.0 - 11.0 11
4 11.0 - 14.0 16
5 14.0 - 17.0 21
6 17.0 - 20.0 14
7 20.0 - 23.0 9
8 23.0 - 26.0 4
3.13. Demostrar que si el producto de dos números positivos es igual a 1 entonces la suma de los mismos
no es menor que 2. Generalizar esta proposición.
3.14. Escribir la fórmula de la media geométrica y de la media armónica cuando los datos están agru-
pados en una tabla de frecuencias.
3.15. La cantidad de viajeros por hora de cada estación de una empresa de transporte en un día
determinado es como sigue:
Estación 1 2 3 4 5
Viajeros por hora 13,050 8,545 10,453 12,093 9,448
3.16. La media aritmética de los salarios quincenales de los empleados de una empresa fue $360,000. El
promedio de los salarios de los hombres y de las mujeres fue respectivamente $370,000 y $340,000.
Determinar el porcentaje de hombres y mujeres de la compañía.
3.17. La siguiente tabla contiene los salarios quincenales (en miles de pesos) de una muestra de traba-
jadores:
d. Rehacer los numerales anteriores teniendo en cuenta que todos los empleados reciben un sub-
sidio mensual de transporte de $50, 000.
3.18. Para ocupar un puesto de trabajo vacante, la gerencia de una compañía realiza diferentes pruebas
a los aspirantes, cada una de ellas con una importancia determinada. Los resultados de las pruebas
de los dos mejores aspirantes son los siguientes:
b. Si un tercer aspirante obtiene las mismas notas del aspirante número 2 excepto en informática,
¾cuánto debe ser la calicación de este nuevo aspirante para obtener la misma calicación
promedio del aspirante 1?
3.19. Una entidad nanciera ha comprado dólares estadounidenses a diferentes precios (en pesos) du-
rante una semana de acuerdo a la siguiente tabla:
Pesos por dólar 1,851 1,840 1,841 1,847 1,842 1,856 1,843
Frecuencia 64 55 75 34 56 76 45
3.20. Una agencia ha asignado un grupo de cinco empleados para completar un servicio de excursión
para un grupo de turistas. Las razones de eciencia (en minutos por turista) se dan a continuación.
Empleado Efectividad
A 10
B 8
C 15
D 12
E 9
3.22. Demostrar que si X es una variable y a es un número real positivo entonces se tiene que:
i. Si X=a entonces GX = a y HX = a.
ii. Si Y = aX entonces GY = aGX y HY = aHX .
3.23. Un curso tiene 35 hombres con una edad media de 17.5 años y 15 mujeres que en promedio son
22 % más jóvenes que los hombres. ¾Cuál es la edad media del curso?
3.24. Se sabe que ninguna de las sucursales de una empresa comercial tiene más de 9 empleados o
menos de 7. La mayoría tiene 8 trabajadores, pero el 25 % tiene 9 funcionarios y una de cada 10
sucursales tiene 7 empleados. ¾Cuál es el promedio de empleados por sucursal?
3.25. ¾Qué es la media recortada? ¾Cuáles son sus características? ¾Cómo se utiliza? ¾Para que sirve?
Mostrar una aplicación al respecto.
Capı́tulo 4
Medidas de dispersión
4.1. Introducción
Si dos conjuntos de datos tienen la misma media aritmética, no implica que la distribución de las
observaciones en ambos casos sea exactamente la misma, puesto que el grado de homogeneidad de
la información puede ser diferente. Por ejemplo, considere los datos que se presentan en la tabla 4.1
asociados con los salarios anuales (en millones de pesos) de una muestra de supervisores de ventas de
dos empresas. Se observa que ambos conjuntos de datos tienen la misma media (33.5 millones de pesos)
y la misma mediana (34.0 millones de pesos), por lo que si se limita el estudio de las observaciones
únicamente a estas medidas de tendencia central no es posible diferenciar la distribución de los salarios
de las dos compañías. Mas sin embargo, estas dos distribuciones son diferentes: los salarios de los
supervisores de la segunda empresa son más heterogéneos que los de la primera.
Tabla 4.1: Datos asociados con los salarios anuales de una muestra de supervisores de ventas de dos empresas.
En consecuencia, una medida de tendencia central por sí sola no es suciente para describir comple-
tamente la tendencia de un conjunto de datos; siempre es necesaria una medida que cuantique la
64
4.2. EL RANGO 65
4.2. El rango
El rango es una medida de dispersión empleada en la sección 2.4 para construir histogramas. Es una
medida que está asociada con la amplitud del conjunto de datos.
Rx = xmáx − xmı́n
Nota. No se debe confundir el rango de un conjunto de datos denido en esta sección con el rango
denido en la sección 3.3.1 utilizado para describir la posición en la que se encuentra cada valor del
conjunto de datos ordenado ascendentemente.
Ejemplo 4.2.1. Teniendo en cuenta los datos de la tabla 4.1, calcular e interpretar el rango para
cada empresa.
Solución:
El rango de la empresa 1 es
Se observa que el recorrido de los salarios de la segunda empresa es mayor que el recorrido de los
salarios de la primera en 6.9 millones de pesos.
El rango intercuartílico es una medida de dispersión que no está inuenciada por los valores extremos
de los datos como sí lo está el rango. En el rango intercuartílico se concentran el 50 % de las observa-
ciones que no hacen parte del 25 % de los valores más bajos ni del 25 % de los valores más altos del
conjunto de datos.
RIx = q3 − q1
Ejemplo 4.3.1. Teniendo en cuenta los datos de la tabla 4.1, calcular e interpretar el rango inter-
cuartílico para cada empresa.
Solución:
Se observa que el recorrido del 50 % de los salarios intermedios de la segunda empresa es mayor que
el mismo recorrido de los salarios de la primera en 1.65 millones de pesos. Aunque todavía hay una
diferencia clara, no es tan notoria como sí lo es con el rango, lo que sugiere la presencia de sueldos
considerablemente superiores de la primera empresa comparados con los de la segunda.
El diagrama de caja y bigotes (boxplot en inglés) es una representación gráca que sirve para
identicar algunas características fundamentales de la distribución de un conjunto de datos, tales
como la localización, la dispersión, la simetría y la detección de datos atípicos. En este diagrama se
representan los tres cuartiles y los datos atípicos de los datos con base en un rectángulo alineado
vertical u horizontalmente. La construcción vertical de este gráco asociado con las observaciones de
una variable X es como sigue:
ii. Dibujar un rectángulo paralelo al eje y tal que su lado mayor inicie en q1 y termine q3 . El ancho
de la caja no es de relativa importancia pero debe ser menor que el largo del rectángulo.
iv. Señalar y resaltar los valores que se encuentran por fuera del intervalo [Li , Ls ].
En resumen, una gráca de este tipo está constituida por una caja rectangular cuyo lado mayor
representa el rango intercuartílico. Este rectángulo está dividido por un segmento transversal que
indica donde se localiza la mediana y por lo tanto evidencia su relación con los demás cuartiles. Las
líneas que sobresalen de la caja tienen un límite de prolongación, de modo que cualquier dato que
no se encuentre dentro de este rango es marcado e identicado individualmente. En la gura 4.1 se
presenta un ejemplo de un diagrama de caja.
68 CAPÍTULO 4. MEDIDAS DE DISPERSIÓN
Denición 4.4.1. Todo dato de una variable X que está más aleja-
do de (1.5)RIx del cuartil más cercano se dice que es un dato atípico
(outlier en inglés). Un dato atípico se denomina extremo si está ubica-
do a una distancia mayor de (3.0)RIx del cuartil más cercano y se llama
moderado en otro caso.
Ejemplo 4.4.1. Hacer un diagrama de caja y bigotes para los datos de la tabla 2.9. Describir la
distribución de las observaciones de acuerdo con el gráco obtenido.
Solución:
4.5. LA DESVIACIÓN DE UN DATO 69
ii. Dibujar un rectángulo paralelo al eje y tal que su lado mayor inicie en 81.85 y termine en el valor
104.25.
iii. Trazar los bigotes de la caja hasta Li = 60.40 y Ls = 137.85. Por ende estos segmentos se
extienden de 81.85 a 60.4 y de 104.25 a 137.85.
iv. Señalar y resaltar los valores que se encuentren por fuera del intervalo [60.40,137.85]. Estas ob-
servaciones son 138.1 y 142.2.
La distribución de las ganancias parece ser simétrica alrededor de la mediana, esto es, el reparto de las
utilidades aparenta ser equilibrado o semejante en torno a 93.1 millones de pesos diarios dado que la
caja esta divida en dos partes iguales por la ganancia mediana y los bigotes tienen aproximadamente
la misma extensión. Se presentan apenas un par de observaciones atípicas correspondientes a dos
empresas con ganancias diarias superiores a todas las demás con una diferencia notoria, pero según
parece no inuencian en gran medida la distribución de las utilidades puesto que la ganancia promedio
(94.09 millones de pesos) no diere marcadamente de la ganancia mediana.
di = xi − x̄
Nota. Una desviación positiva (di > 0) indica que el dato es mayor que el promedio, mientras que
una desviación negativa (di < 0) señala que el dato es menor que la media. Una desviación igual a 0
quiere decir que el dato es exactamente igual al promedio. Además, en la proposición 3.2.2 se muestra
Pn
que si x1 , x2 , . . . , xn es un conjunto de n realizaciones de una variable X entonces i=1 (xi − x̄) = 0,
Pn
esto es, i=1 di = 0.
70 CAPÍTULO 4. MEDIDAS DE DISPERSIÓN
4.6. La varianza
Aunque el rango es una medida asociada con la extensión de todo conjunto de datos y el rango inter-
cuartílico es una medida relacionada con la amplitud correspondiente al 50 % de los datos intermedios,
ninguna de estas medidas de dispersión tiene en cuenta cómo se distribuyen las observaciones de la
variable de estudio respecto a alguna medida de tendencia central, como el promedio, por ejemplo.
Una medida de uso común que sí toma en cuenta tal repartición de los datos respecto a la media
aritmética es la varianza. Esta medida evalúa la manera en que uctúan los valores de una variable
respecto al promedio.
Nota. La varianza muestral se dene como el promedio de los cuadrados de las desviaciones de
1 2 2
los datos de la muestra . La varianza muestral observada de una variable X se simboliza con Sx ,
mientras que la varianza poblacional 2
se denota con σX . Así, cuando se dispone de una población
nita, se tiene que
N
2 1 X
σX = (xi − µX )2
N i=1
donde N es el tamaño de la población. Esta denición únicamente hace sentido cuando se tiene una
población nita. Además, como con otros estadísticos, la notación de la varianza incluye un subíndice
para enfatizar la variable sobre la cual se calcula.
Cuando los datos de una muestra están agrupados en una distribución de frecuencias la varianza
muestral se calcula con la fórmula
k
1 X
Sx2 = ni (xi − x̄)2
n − 1 i=1
1 En este libro la varianza muestral, la cuasi-varianza y la varianza corregida son sinónimos.
2 Como con cualquier otro estadístico, la varianza muestral S 2 = 1 Pn (X − X̄)2 corresponde a la variable
X n−1 i=1 i
varianza de la muestra cuyos valores dependen de la muestra recogida; mientras que la varianza muestral observada
1 Pn
Sx2 = n−1
2
i=1 (xi − x̄) compete a un valor especíco de la variable
2
SX calculada a partir de los datos de una muestra
determinada.
72 CAPÍTULO 4. MEDIDAS DE DISPERSIÓN
Aunque la varianza está asociada directamente con la variación de un conjunto de datos, su interpre-
tación se puede complicar debido a que está dada en unidades cuadráticas (unidades de medición
elevadas al cuadrado). Tal aspecto se debe tener en cuenta en la interpretación para describir correc-
tamente la realidad estudiada.
Nota. El valor mínimo que puede asumir la varianza es el valor 0, caso en el que todos los datos son
iguales al promedio.
Ejemplo 4.6.1. Calcular e interpretar la varianza de los siguientes datos asumiendo que éstos cons-
tituyen una población.
i 1 2 3 4 5
xi 62 80 83 72 73
Solución:
N
1 X 62 + 80 + . . . + 73
µX = xi = = 74.
N i=1 5
N
2 1 X (62 − 74)2 + (80 − 74)2 + . . . + (73 − 74)2
σX = (xi − µX )2 = = 53.2.
N i=1 5
3
Este valor, 53.2, parece ser un valor grande, por lo que para este conjunto de datos se tiene una alta
dispersión con respecto al promedio, es decir, los datos parecen no estar agrupados respecto a 74.
Solución:
3 Se utiliza la expresión parece ser porque no hay un punto de comparación para establecer cuando una cantidad
es pequeña o grande. Por tal motivo se debe recurrir a medidas que den cuenta de cómo realizar esta calicación de
manera apropiada de acuerdo a ciertos estándares de precisión (detalles en la sección 4.10).
4.6. LA VARIANZA 73
Para calcular la varianza primero se deben calcular las respectivas marcas de clase como en el ejemplo
3.2.1. Una vez calculadas las marcas de clase, se calcula la varianza de las ganancias aplicando la
fórmula para datos agrupados. En la tabla 4.2 se presentan los cálculos pertinentes.
k
1 X 12, 076.65
Sx2 = ni (xi − x̄)2 = = 355.18.
n − 1 i=1 35 − 1
Considerando el valor 355.18 millones de pesos cuadrados como alto, se concluye que las ganancias
están muy dispersas respecto a la ganancia promedio que corresponde a 94.09 millones de pesos.
Nota. En el ejemplo 4.6.2 las unidades de la varianza son unidades cuadráticas y la interpretación de
la misma se hace sin tener en cuenta algún punto de referencia considerándola simplemente como un
valor grande.
Proposición 4.6.1. Sea X una variable y a, b números reales. Entonces se tiene que:
2
i. Si X=a entonces SX = 0.
Demostración:
n n
2 1 X 1 X
SX = (Xi − X̄)2 = (a − a)2 = 0.
n − 1 i=1 n − 1 i=1
74 CAPÍTULO 4. MEDIDAS DE DISPERSIÓN
n
1 X
SY2 = (Yi − Ȳ )2
n − 1 i=1
n
1 X
= ((aXi + b) − (aX̄ + b))2
n − 1 i=1
n
1 X
= (aXi + b − aX̄ − b)2
n − 1 i=1
n
1 X
= (aXi − aX̄)2
n − 1 i=1
n
1 X
= (a(Xi − X̄))2
n − 1 i=1
n
1 X 2
= a (Xi − X̄)2
n − 1 i=1
n
1 X
= a2 (Xi − X̄)2
n − 1 i=1
= a2 SX
2
.
Ejemplo 4.6.3. Los siguientes datos están asociados con los salarios quincenales (en miles de pesos)
de una muestra de empleados de una compañía. Los empleados piden un reajuste quincenal de 15 %
sobre su salario, pero el Estado ofrece un reajuste de 18 % más una bonicación mensual de cuarenta
mil pesos. Calcular el promedio y la varianza para las dos propuestas.
Solución:
Primero se debe calcular el promedio y la varianza de los salarios quincenales de los empleados (X ),
de donde
n n
1X 1 X
x̄ = xi = 246.66 y Sx2 = (xi − x̄)2 = 1, 400.
n i=1 n − 1 i=1
Sea Y1 el salario quincenal de los empleados (en miles de pesos) ajustado con la propuesta que ellos
mismos han dado. Este reajuste consiste en un aumento quincenal de 15 % y en consecuencia
Y1 = 1.15X,
4.6. LA VARIANZA 75
De otra parte, el Estado ofrece un reajuste de 18 % más una bonicación mensual de cuarenta mil
pesos, esto es, veinte mil pesos quincenales. Si Y2 denota el salario quincenal (en miles de pesos)
ajustado con la propuesta del Estado entonces se obtiene que
Y2 = 1.18X + 20
Por lo tanto la propuesta que aparentemente tiene más dispersión con respecto al salario quincenal
promedio es la propuesta del Estado.
Ejemplo 4.6.4. Calcular la varianza de la utilidad mensual de la compañía del ejemplo 3.2.2 teniendo
en cuenta que la varianza de la venta mensual es $2 273,500.
Solución:
n
X n
X
(xi − x̄)2 = x2i − nx̄2 .
i=1 i=1
Demostración:
n
X n
X
(xi − x̄)2 = (x2i − 2xi x̄ + x̄2 )
i=1 i=1
76 CAPÍTULO 4. MEDIDAS DE DISPERSIÓN
n
X n
X n
X
= x2i − 2xi x̄ + x̄2
i=1 i=1 i=1
n
X n
X
= x2i − 2x̄ xi + nx̄2
i=1 i=1
n
X
= x2i − 2x̄(nx̄) + nx̄2
i=1
n
X
= x2i − 2nx̄2 + nx̄2
i=1
n
X
= x2i − nx̄2 .
i=1
Nota. En virtud de la proposición 4.6.2 se tiene que una forma alternativa para calcular la varianza
muestral observada de una variable X es:
n
!
1 X
Sx2 = x2i − nx̄ 2
.
n−1 i=1
Ejemplo 4.6.5. El cálculo de Sx2 en el ejemplo 4.6.3 también se puede lograr como sigue:
n
!
1 X 1
Sx2 x2i 2
558, 800 − (9) 246, 662 = 1, 400.
= − nx̄ =
n−1 i=1
9−1
• Es un valor no negativo.
2
SW 6= a2 SX
2
+ b2 SY2 .
4
Se observa que Sx es la realización de un estadístico , mientas que σX es una parámetro.
Nota. Las unidades de la desviación estándar son las mismas unidades de la variable de estudio. Por
ello, la interpretación de esta medida es inmediata y comparable con los valores de la variable.
Ejemplo 4.7.1. Calcular la desviación estándar de la utilidad mensual de la compañía del ejemplo
4.6.4.
Solución:
Como Sy2 = 374, 394.15 se sigue que la desviación estándar de la utilidad mensual es $611,870 dado
que
q p
Sy = Sy2 = 374, 394.15 = 611.87.
4 Corresponde
q Pn
2 = 1
a un valor especíco de la variable SX n−1 i=1 (Xi − X̄)2 calculada a partir de los datos de
• Es un valor no negativo.
4.8. Estandarización
En seguida se presenta una metodología para comparar magnitudes que en principio no lo son, con el
propósito de investigar una variable de interés en escenarios disímiles.
X − µX
Z= .
σX
La variable Z se denomina variable estandarizada o variable tipicada .
5
Una variable estandarizada es una variable adimensional y permite hacer comparaciones entre magni-
tudes que en principio no son comparables. Esto se aplica al caso en que se quiera comparar individuos
semejantes de poblaciones diferentes. Por ejemplo, si se quiere comparar el nivel académico de dos
estudiantes de diferentes universidades para otorgar una beca de estudios, en principio será injusto
concederla directamente al que posea una nota media más elevada, ya que la dicultad para conse-
guir una buena calicación puede ser mucho mayor en un centro que en el otro, lo que limita las
posibilidades de uno de los estudiantes y favorece al otro. En este caso, se aconseja comparar las
calicaciones tipicadas de ambos estudiantes por medio del promedio y desviación típica de las notas
correspondientes de los alumnos de cada universidad.
xi − x̄
zi =
Sx
para i = 1, 2, . . . , n. Entonces se tiene que
z̄ = 0 y Sz2 = 1.
Ejemplo 4.8.1. Teniendo en cuenta los datos de la tabla 4.1, estandarizar las observaciones de cada
empresa. Comentar los resultados obtenidos.
Solución:
donde x̄i y Sxi son respectivamente la media muestral y la desviación estándar muestral de los salarios
de los supervisores de la i-ésima empresa para i = 1, 2. En la siguiente tabla se presentan los salarios
estandarizados de cada empresa:
Por ejemplo, se observa que el individuo 1 de la primera empresa es denitivamente mejor pago en
su contexto que el individuo 1 de la segunda compañía a pesar de que tienen salarios muy próximos,
dado que el puntaje estandarizado del primer individuo es superior que el mismo puntaje del otro
empleado. Tal comparación solo se puede realizar eliminando el efecto de la escala en las observaciones
asociadas. Además, se observa que la media y la desviación estándar de los salarios estandarizados de
cada empresa son 1 y 0 respectivamente.
Teorema 4.9.1. Para cualquier población con media µX y desviación estándar σX , por lo menos
el100(1 − 1/k 2 ) % de las observaciones de la variable X se encuentran a una distancia de la media
menor que kσX , para cualquier número k ≥ 1. De otra forma, dentro del intervalo que va de µX −kσX
2
a µX + kσX se encuentra por lo menos el 100(1 − 1/k ) % de los datos de la población.
teorema de Chebys-
La formulación matemática y la demostración del teorema 4.9.1 conocido como
hev o desigualdad de Chebyshev se presenta en la sección 8.7 con la noción de probabilidad.
Ejemplo 4.9.1. Determinar un intervalo que contenga al menos 95 % de las observaciones de una
población con media 26 y desviación estándar 3.
Solución:
100 1 − 1/k 2 % = 95 %
1
1 − 2 = 0.95
k
1
= 0.05
k2 r
1
k=
0.05
k = 4.472.
4.10. EL COEFICIENTE DE VARIACIÓN DE PEARSON 81
Por lo tanto un intervalo que contiene por lo menos el 95 % de las observaciones de esta población es
aquel que va de 26 − (4.472)(3) = 12.583 a 26 + (4.472)(3) = 39.416.
La tabla 4.3 proporciona algunos valores de k y los porcentajes correspondientes. Por ejemplo, de
acuerdo con el teorema de Chebyshev, al menos el 55.6 % de los datos de la población se encuentran a
una distancia de la media menor que 1.5 veces la desviación estándar. O, dicho de otra forma, dentro
del intervalo que va de µX − (1.5)σX hasta µX + (1.5)σX , sin importar el valor de µX y de σX , se
encuentra por lo menos el 55.6 % de los datos de la población.
Ejemplo 4.9.2. Considerar los datos de la primera empresa de la tabla 4.1. Estos datos tienen
una media de 33.500 con una desviación estándar de 1.708 ambas cantidades dadas en millones
de pesos. Asumiendo que estos datos conforman las observaciones de una población, el teorema de
Chebyshev asegura que al menos 55.6 % de los salarios se encuentran a una distancia de la media
menor que (1.5)(1.708)=2.561 millones de pesos. En otras palabras, dentro del intervalo que va de
30.938 a 36.062 millones de pesos están por lo menos el 55.6 % de los salarios. Análogamente, dentro
del intervalo que va de 27.523 a 39.477 millones de pesos se encuentra por lo menos el 75.0 % de los
salarios de los supervisores de la empresa.
La ventaja del teorema de Chebyshev es que se puede aplicar a cualquier población. Pero, en con-
trapartida, tiene un inconveniente importante. Para muchas poblaciones, el porcentaje de valores que
se encuentran en un intervalo determinado es mucho mayor que el mínimo asegurado por el teorema.
Para poblaciones con distribuciones que tengan forma acampanada (ver la distribución (d) de la gu-
ra 3.1), es posible establecer una regla empírica que proporcione valores ables, como sigue: para
poblaciones con una distribución de frecuencias que tenga forma de campana, aproximadamente el
68 % de los valores de la población se encuentran a una distancia de la media menor que una desvia-
ción estándar, y aproximadamente el 95 % están a una distancia de la media menor que dos veces la
desviación estándar.
De otra parte, para comparar la dispersión de dos o más conjuntos de datos no es adecuado confrontar
simplemente las varianzas o las desviaciones estándar, puesto que tales medidas están inuenciadas
por la escala de medida de los datos. Es necesario, por lo tanto, eliminar tal inuencia generada por
las unidades de medida. El coeciente de variación de Pearson, en honor al matemático británico Karl
Pearson 7
, es una medida relativa
8
de dispersión que permite solucionar estas inquietudes.
Nota. De acuerdo con la denición 4.10.1, si se dispone de la información de una muestra asociada con
una variable X entonces el valor observado del coeciente de variación muestral de X , denotado
con CV
d x, está dado por
Sx
CV x =
d
x̄
donde |a| es el valor absoluto de a. Similarmente, el coeciente de variación poblacional de una
variable X , denotado con CVX , está dado por
σX
CVX =
.
µX
7 Fotografía tomada de la página web http://www.apprendre-math.info/history/photos/Pearson.jpeg.
8 Una medida relativa es aquella medida que dene su valor en relación a otra cantidad.
4.10. EL COEFICIENTE DE VARIACIÓN DE PEARSON 83
Como se ha visto, para establecer el tamaño relativo de la desviación estándar se utiliza el promedio,
comparando la magnitud de la dispersión de la variable con la media del conjunto de datos, de tal
forma que la apreciación correspondiente es relativa al valor del promedio. Además, como se trata de
un cociente, las unidades del numerador y del denominador se cancelan y en consecuencia el coeciente
de variación es una medida adimensional, lo que quiere decir que carece de unidades de medición. Por
ello, se acostumbra expresar el coeciente en porcentaje y dependiendo del valor que tome se dice que
si el coeciente de correlación:
Ejemplo 4.10.1. Un inversionista potencial piensa adquirir acciones en una de dos compañías A o
B listadas en la bolsa de valores. Si ninguna de las compañías ofrece dividendos a sus clientes y ambas
tienen igual clasicación en términos de crecimiento potencial como lo aseguran varios servicios de
inversión el posible inversionista quizás considere la volatilidad (variabilidad) de ambas acciones para
tomar una decisión en cuanto a la inversión. En los últimos meses, el precio promedio de las acciones
en la compañía A fue de USD 50 con una desviación estándar de USD 10. Además, durante el mismo
periodo, el precio promedio de las acciones en la compañía B fue de USD 12 con una desviación
estándar de USD 4. ¾Cómo puede determinar el inversionista cuáles acciones son más variables?
Solución:
En términos de la desviación estándar, el precio de las acciones de la compañía A parece más volátil
que el de las acciones de la compañía B. Sin embargo, como los precios promedio por acción de las dos
compañías son tan diferentes, será conveniente que el inversionista potencial considere la variabilidad
del precio con respecto al promedio a n de examinar la volatilidadestabilidad de ambas acciones. Si
X denota el precio (en dólares) de las acciones en el periodo de tiempo examinado, para la compañía
A, el coeciente de variación es d x = |(10/50)100 %| = 20.0 %; mientras
CV que para la compañía B,
el coeciente de variación es d x = |(4/12)100 %| = 33.3 %. Entonces, en
CV relación con la media, el
precio de las acciones de la compañía B es mucho más variable que el de las acciones de la compañía
A.
Nota. El coeciente de variación sirve para comparar la variabilidad de dos conjuntos de datos respecto
a la media, mientras que si se quiere comparar a dos individuos de cada uno de estos conjuntos, es
necesario utilizar los valores estandarizados.
• Es un valor no negativo.
A continuación se presentan algunas medidas de dispersión basadas en el valor absoluto cuya magnitud
depende del posicionamiento de los datos respecto a la media y la mediana.
La desviación media es una medida que captura las desviaciones absolutas de los datos respecto a la
media. Esta medida también se denomina desviación absoluta.
n
1X
Dx = |xi − x̄|
n i=1
La desviación mediana es similar a la desviación media, pero ahora las desviaciones se calculan respecto
a la mediana del conjunto de datos.
n
1X
DMx = |xi − x̃|
n i=1
Nota. Las unidades en las que están dadas tanto la desviación media como desviación mediana son
unidades lineales. Además, de ser requeridos, los parámetros correspondientes se denen análogamente.
Ejemplo 4.11.1. Considerar los datos de la tabla 4.4 asociados con una muestra de ventas diarias
(en millones de pesos) de una empresa con 30 sucursales en el país. Si esta empresa tiene un contrato
con una compañía de contaduría que asegura que sus ingresos diarios no tienen una dispersión mayor
4.11. OTRAS MEDIDAS DE DISPERSIÓN 85
a $2,000,000, ¾qué se podría concluir al realizar una comparación de la desviación media, la desviación
mediana, la desviación estándar y el rango intercuartílico junto con un diagrama de caja y bigotes?
7.00 11.85 14.17 7.84 6.05 12.01 10.28 13.08 14.57 6.10
7.73 9.91 8.18 10.59 7.63 7.02 8.88 13.88 10.55 13.42
11.23 9.20 8.92 9.84 8.93 9.86 9.40 7.82 10.24 9.74
Tabla 4.4: Datos asociados con una muestra de ventas diarias (en millones de pesos) de una empresa.
Solución:
Teniendo en cuenta que la media y la mediana de las ventas diarias (X ) de las 30 sucursales de la
empresa son respectivamente 9.86 y 9.79 millones de pesos, se obtienen los resultados que se presentan
en seguida y el diagrama de caja y bigotes de la gura 4.5.
Teniendo en cuenta que las medidas toman posiciones opuestas respecto a la dispersión mencionada
en el contrato, la inspección del diagrama de caja toma un papel decisivo. Éste muestra que no
hay evidencia de datos atípicos, por lo que la desviación estándar no se encuentra inada por
observaciones extremas. Además, el rango intercuartílico, que es una medida robusta frente a los
observaciones atípicas, también muestra un fallo negativo respecto a la dispersión establecida en el
contrato. Así, se puede concluir que la dispersión encontrada en la muestra excede efectivamente lo
estipulado.
A continuación se presenta sin demostración una proposición que relaciona las magnitudes de algunas
medidas de dispersión:
Las siguientes son algunas observaciones acerca de la desviación media y la desviación mediana:
• La desviación media es sensible a datos atípicos, mientras que la desviación mediana es más
robusta frente a este tipo de observaciones.
4.12. Comentarios
Como es costumbre en el inicio de todo tipo de estudio, lo primero que se hace es la exploración
y la descripción de la información para conocer el material del cual se dispone y cómo se puede
emplear. En este capítulo se muestra cómo analizar más detalladamente la información disponible
para conocer un elemento fundamental de ésta: su dispersión. La variabilidad de un conjunto de datos
se explora a través de diferentes medidas que dan cuenta de la homogeneidad o heterogeneidad de
las observaciones respecto a las medidas de tendencia central.
Este paso descriptivo cobra especial importancia a medida que una investigación avanza puesto que
4.13. EJERCICIOS 87
las decisiones que se tomen posteriormente se verán inuenciadas por la dispersión de las variables
de estudio y la precisión de las medidas de los estadísticos calculados. Inclusive, en la vida cotidiana,
el conocimiento de la variabilidad es tenido en cuenta aún en los procesos más simples, como en la
planeación de cronogramas y la realización de reuniones.
También se enseña una de las mejores formas grácas de resumir toda la información proporcionada
por las medidas de localización y de dispersión, por medio de un solo gráco, denominado diagrama de
caja y bigotes. Éste permite describir y analizar a profundidad la posición y la forma de la distribución
de un conjunto de datos cuantitativos.
4.13. Ejercicios
4.1. Demostrar que si X es una variable y a, b son números reales entonces se tiene que:
i. Si X=a entonces SX = 0.
ii. Si Y = aX + b entonces SY = |a|SX .
4.2. Demostrar que si X es una variable y a es un número real entonces se tiene que:
i. Si X=a y a 6= 0 entonces CV
d X = 0.
ii. Si Y = aX entonces CV
dX = CV
dY .
iii. Si Y =X +a y a≥0 entonces d Y ≤ CV
CV dX .
4.3. Establecer la escala de medición requerida para cada medida de dispersión presentada en este
capítulo.
4.4. Con la información del ejercicio 3.11, calcular, interpretar y comparar el coeciente de variación
de cada propuesta. ¾Qué es más ventajoso para el Estado y qué para cada grupo de empleados?
10
X 10
X 10
X 10
X
xi = 110, yi = 60, x2i = 3156 y yi2 = 1138.
i=1 i=1 i=1 i=1
Para cada variable calcular el coeciente de variación. Interpretar y comparar los resultados
obtenidos.
4.6. Con la información del ejercicio 3.12, calcular e interpretar el coeciente de variación.
4.7. Una compañía evalúa la eciencia del transporte público y privado que utilizan sus empleados
para ir a trabajar diariamente. En la siguiente tabla se presenta un par de muestras asociadas
con el tiempo (en minutos) de cada modo de transporte. Calcular el promedio y la desviación
estándar en cada caso. Con base en los resultados obtenidos, ¾qué modo de transporte se debe
preferir?
88 CAPÍTULO 4. MEDIDAS DE DISPERSIÓN
Particular 14 15 17 14 10 16 17 16 13 15
Público 20 19 18 15 14 14 13 21 22 10
4.8. Con la información del ejercicio 3.17, calcular las medidas de dispersión y realizar un diagrama
de caja y bigotes. Con base en los resultados obtenidos, ¾qué se puede asegurar acerca de la
situación salarial de los empleados?
y
n n
1 XX
Sx2 = (xi − xj )2 .
n − 1 i=1 j=1
4.10. En un estudio de tiempos llevado a cabo en una planta manufacturera, el tiempo (en minutos)
requerido para completar cierta operación se mide para un grupo de trabajadores. Se encuentra
que la media y la desviación estándar son 12.8 y 1.7 minutos respectivamente. Describir los datos
de la muestra utilizando la regla empírica. ¾Qué es necesario suponer sobre la distribución de los
tiempos para que el uso de la regla empírica sea adecuado? ¾Esta descripción coincide con la que
sugiere la desigualdad de Chebyshev?
4.11. Los siguientes datos corresponden al tiempo (en horas) utilizado para preparar un examen de
conocimiento y las calicaciones correspondientes (en una escala de 0 a 5) de una muestra de
aspirantes a un cargo especíco de una compañía. El jefe de personal de la empresa asegura que
el tiempo requerido para tener buenos resultados en la prueba es cercano a 8 horas. Teniendo en
cuenta las medidas de dispersión y un diagrama de caja y bigotes, ¾qué se puede asegurar acerca
de lo que sugiere el funcionario?
4.12. Con el propósito de estudiar la relación entre la inteligencia y los ingresos se tomaron dos muestras,
una de ellas conformada por individuos de cociente intelectual (CI ) inferior a 95 y otra conformada
por los demás; de cada persona se observó el salario mensual familiar (en salarios mínimos). Para
cada grupo calcular las medidas de dispersión y realizar un diagrama de caja y bigotes. ¾Los
resultados sugieren que las personas más inteligentes tienen mayores ingresos?
4.13. EJERCICIOS 89
4.13. Demostrar que cuando los datos de una muestra están agrupados en una distribución de frecuen-
cias, la varianza se calcula con la fórmula
k
!
1 X
2
ni xi − nx̄
n−1 i=1
4.14. Con la información del ejemplo 4.6.3, calcular, interpretar y comparar el coeciente de variación
para cada propuesta.
4.15. Considerar una población que consta del número de profesores en cada una de las universidad
pequeñas de una ciudad. El número de profesores por universidad tiene un promedio de 175 y
una desviación de estándar de 15.
a. Usar le teorema de Chebyshev para describir el porcentaje de universidades que tienen entre
145 y 205 profesores.
b. Si la distribución del número de profesores tiene forma acampanada, ¾qué fracción de las
universidades tiene mas de 190 profesores?
4.16. Se analizaron en el primer semestre de 2006 los gastos de una empresa de construcción y se
obtuvo un promedio de 174 millones de dólares y una desviación típica de 9 millones de dólares.
Se determinó luego que los contadores de esta empresa habían prescindido de 3 millones de
dólares en los gastos por un error de apreciación. Corrigiendo las medidas enunciadas, obtenga el
coeciente de variación de los gastos de esta empresa.
4.17. Los siguientes datos representan las puntuaciones de ambivalencia social para un grupo de per-
sonas, según los resultados de una prueba psicológica. Se observa que cuanto más alta se la
puntuación, mas fuete es la ambivalencia.
9 13 12 14 15 11 10 4 10
8 19 13 11 17 9 11 14 12
d. ¾Qué fracción de las puntuaciones está efectivamente a dos desviaciones estándar del promedio
de la muestra? ¾Qué indican la desigualdad de Chebyshev y la regla empírica al respecto? Con
los resultados obtenidos, ¾cómo se puede describir la distribución de las puntuaciones?
4.18. En cierta región la distribución de predios por extensión tiene una media de 35.4 hectáreas y una
desviación típica de 19.33 hectáreas, mientras que la distribución por canon de arrendamiento
tiene una media de $245,750 y una desviación de $7,470. ¾Cual de las dos distribuciones tiene
mayor variabilidad? ¾Por qué?
4.19. Con la información del ejemplo 4.6.4, calcular e interpretar el coeciente de variación de las
utilidades.
Capı́tulo 5
Medidas de forma
5.1. Introducción
Una vez iniciada la síntesis y la descripción de la información, por medio de las medidas de tendencia
central, de posición y de dispersión, es necesario conocer más sobre la distribución de los datos, como la
1
forma y el sesgo . Para ello están concebidas las medidas de forma, las cuales proporcionan información
relacionada con la conguración y el arreglo de las observaciones de interés.
En primer lugar, se quiere saber si los datos se distribuyen de forma simétrica respecto al promedio
2
aritmético , o si bien la gráca que representa la distribución de frecuencias tiene una forma diferente.
Si la distribución de los datos es simétrica, se quiere investigar el grado de apuntamiento de la curva,
es decir, si la gráca es apuntada larga y estrecha o por el contrario aplanada corta y achatada,
y con ello estudiar la dispersión y las frecuencias de las observaciones alrededor del promedio. Este
apuntamiento se mide por medio de una comparación con una distribución de datos que se considera
normal (detalles en la sección 10.3).
1 En este contexto, el término sesgo hace referencia a la desviación de una forma respecto a una determinada de
antemano.
2 Como eje de simetría se considera una recta paralela al eje y que pasa por la media de la distribución de frecuencias.
Si una distribución es simétrica, existe el mismo número de valores a la derecha que a la izquierda del promedio
(Wikipedia 2012a).
91
92 CAPÍTULO 5. MEDIDAS DE FORMA
Para establecer si una distribución de frecuencias es simétrica, hay que precisar con respecto a qué
valor es simétrica. Un buen candidato para ello es el promedio aritmético del conjunto de datos.
Nota. En la denición 5.2.1, la asimetría puede ser a la derecha asimetría positiva o a la izquierda
asimetría negativa si la representación gráca está más estirada hacia la derecha o la izquierda
respectivamente.
En la gura 5.1 se presentan tres ejemplos de distribuciones de frecuencias representadas con histo-
3
gramas y polígonos de frecuencias suavizados simétricos y asimétricos (con sesgo). En lo que sigue
se consideran algunos factores y medidas que indican y cuantican el sesgo de una distribución de
datos con respecto al promedio. Las medidas de asimetría o coecientes de sesgo tienen como nalidad
establecer el grado de simetría (o asimetría) que presenta una distribución de forma objetiva y precisa.
Calculando las medidas de tendencia central (considerando conjuntos de datos unimodales) es posible
identicar la simetría o asimetría de una distribución mediante los siguientes casos:
• En una distribución simétrica (gráco (b) de la gura 5.1), la media, la media y la moda siempre
coinciden. Es decir, se cumple la relación:
En este tipo de distribuciones, los datos se encuentran repartidos a lo largo del recorrido de
forma que todas las medidas de tendencia central están justo en el centro del conjunto de datos.
Nota. La representación gráca de una distribución simétrica no tiene que se acampanada necesaria-
mente; una distribución simétrica puede tener forma de U como en la distribución (a) de la gura
3.1), aunque en este caso la distribución es bimodal.
Ejemplo 5.2.1. Inspeccionar las medidas de tendencia central de los datos de la tabla 2.9.
Solución:
Como se observa en los ejemplos 3.2.1, 3.2.6 y 3.2.8, en este caso se tiene que
donde X denota las ganancias diarias de una muestra de empresas. Como x̆ < x̄ < x̃, la inspección de
las medidas de tendencia central sugiere que la distribución de estas ganancias es sesgada positivamente
o a la derecha; esto indica que hay algunas compañías con utilidades considerablemente superiores a
las ganancias de las demás. Sin embargo, la magnitud de las medidas de tendencia central no diere
en gran medida, por lo que el sesgo de la distribución es ligero y apenas notorio (como se establece
objetivamente en los ejemplos 5.2.2, 5.2.3 y 5.2.4) y por lo tanto las utilidades aparentemente superiores
son poco inuyentes.
En la gura 5.2 se muestra un histograma y un diagrama de caja y bigotes asociados con las ganancias
de las compañías objeto de estudio. En el histograma se observa la simetría aproximada y el ligero
sesgo positivo de la distribución de las utilidades, como también la proximidad de las medidas de
tendencia central que están señaladas en la mitad de la gura (a) con líneas verticales punteadas
94 CAPÍTULO 5. MEDIDAS DE FORMA
que casi coinciden. De otra parte, en el diagrama de caja y bigotes se observa la simetría de la
distribución de las ganancias dado que la extensión de los bigotes es la misma y la caja esta partida
en dos partes iguales por la utilidad mediana; en este diagrama también se observa el ligero sesgo
positivo de la distribución de las ganancias debido a un par de observaciones señaladas a la derecha
correspondientes a las utilidades de dos empresas sobresalientes en relación con las utilidades de las
demás.
En consecuencia, la distribución de las ganancias diarias de las empresas se puede considerar aproxi-
madamente simétrica y así las utilidades diarias de las empresas están equilibradas razonablemente
alrededor de la ganancia promedio (94.09 millones).
Figura 5.2: Histograma (a) y diagrama de caja y bigotes (b) asociados con los datos de la tabla 2.9.
Cuando un conjunto de datos es unimodal, la siguiente medida es útil para establecer el sesgo de la
distribución de la variable de estudio:
Nota. De acuerdo con la denición 5.2.2, si se dispone de la información de una muestra asociada con
una variable X entonces el valor observado del coeciente de asimetría de Pearson muestral
de X, denotado con AP
dX , está dado por
d X = x̄ − x̆
AP
Sx
donde x̄, x̆ y Sx son respectivamente los valores observados del promedio, la moda y la desviación
estándar de la muestra. La denición del coeciente de asimetría de Pearson poblacional es análoga.
Nota. Como se ha visto, para calcular el coeciente de asimetría de Pearson se requiere que la dis-
tribución de los datos sea unimodal. Además, este coeciente se trata de una medida estadística
adimensional, es decir, que no tiene unidades de referencia.
Ejemplo 5.2.2. Calcular e interpretar el coeciente de asimetría de Pearson de los datos de la tabla
2.9.
Solución:
Como se evidencia en los ejemplos 5.2.1 y 4.6.2, en este caso se tiene que
√ x̄ = 94.09, x̆ = 90.39 y
Sx = 355.18 = 18.85. En consecuencia, el valor observado del coeciente de asimetría de Pearson es
Las siguientes son algunas observaciones acerca del coeciente de asimetría de Pearson:
n
1 X
AF
dX = (xi − x̄)3
nSx3 i=1
Nota. El coeciente de asimetría de la denición 5.2.3 corresponde al valor observado del coeciente
de asimetría de Fisher muestral . Este coeciente es una medida adimensional y por ende se
puede expresar en porcentaje al igual que el coeciente de asimetría de Pearson y su interpretación es
análoga. De otra parte, cuando se tiene una población nita, la denición del coeciente de asimetría
de Fisher poblacional es análoga.
Cuando los datos de una muestra están agrupados en una distribución de frecuencias el coeciente de
asimetría de Fisher muestral se calcula con la fórmula
k
1 X
AF
dX = ni (xi − x̄)3
nSx3 i=1
Solución:
Para calcular este coeciente primero se deben calcular las respectivas marcas de clase como en el
ejemplo 3.2.1. Una vez calculadas las marcas de clase, se calcula el coeciente de asimetría de Fisher
de las ganancias aplicando la fórmula para datos agrupados. En la tabla 5.1 se presentan los cálculos
pertinentes. Además, como en el ejemplo 5.2.2, se tiene que Sx = 18.85.
k
1 X 102, 803.76
AF
dX = ni (xi − x̄)3 = = 0.44.
nSx3 i=1 (35)(18.853 )
Aunque el valor de este coeciente no coincide con el del ejemplo 5.2.2, su interpretación es análoga
y la conclusión acerca de la distribución de las ganancias es idéntica.
4 Fotografía tomada de la página web http://trailblazing.royalsociety.org/?p=6&eventIdInfoTab=120.
5.2. MEDIDAS DE ASIMETRÍA 97
Las siguientes son algunas observaciones acerca del coeciente de asimetría de Fisher:
Si una distribución de frecuencias es simétrica, es claro que la distancia que hay entre el tercer cuartil
y la mediana debe ser la misma que la que hay entre la mediana y el primer cuartil, esto es
q3 − q2 = q2 − q1 .
Similarmente, una pista para saber si una distribución de frecuencias es sesgada positivamente es que
se cumpla que
q3 − q2 > q2 − q1 ,
y por analogía, si la distribución es sesgada negativamente entonces se sigue que
q3 − q2 < q2 − q1 .
Teniendo en cuenta las relaciones entre los cuartiles, con el propósito de obtener una medida adimen-
sional que cuantique el sesgo de una distribución de frecuencias, se dene el siguiente índice:
c X = (q3 − q2 ) − (q2 − q1 )
AS
q3 − q1
donde q1 , q2 y q3 son los cuartiles de las observaciones.
Nota. La interpretación del índice de asimetría de Yule-Bowley es análoga a la de los otros coecientes
de asimetría, pero en este caso se tiene que −1 ≤ AS
c X ≤ 1.
Solución:
Las siguientes son algunas observaciones acerca del coeciente de asimetría de Yule-Bowley:
Nota. Cuando se investiga la simetría de una distribución de frecuencias se recomienda utilizar las
tres medidas de asimetría con el propósito de contrastar la información que proporcionan y describir
precisamente la forma correspondiente.
Para investigar el apuntamiento de una distribución de frecuencias es necesario denir previamente una
distribución que se va a tomar como punto de referencia. Esta distribución se denomina distribución
normal.
2
1
x−µX
−1
fX (x) = √ e 2 σX
2πσX
donde π es el número pi y e es el número de Euler.
Nota. La denición 5.3.1 es apenas una denición preliminar de la distribución normal. En la gura 5.4
se presenta una ejemplo de la distribución normal. Esta distribución se estudia detalladamente en la
sección 10.3.2 y es el punto de referencia para decidir si una distribución de frecuencias es apuntada
o aplanada.
A continuación se presenta una medida para cuanticar el grado de apuntamiento de una distribución
de frecuencias dada:
100 CAPÍTULO 5. MEDIDAS DE FORMA
coeciente
Nota. La magnitud del coeciente de la denición 5.3.2 corresponde al valor observado del
de apuntamiento de Fisher muestral . Este coeciente también se llama curtosis y es una medida
adimensional al igual que los otros coecientes. Además, cuando se tiene una población nita, la
denición del coeciente de apuntamiento de Fisher poblacional es análoga.
Cuando los datos de una muestra están agrupados en una distribución de frecuencias el coeciente de
5.3. MEDIDAS DE APUNTAMIENTO 101
k
1 X
AG
dX = ni (xi − x̄)4 − 3
nSx4 i=1
De otra parte, para la distribución normal estándar se tiene que la curtosis es exactamente igual a 0.
De este modo, trabajando con datos muestrales de una variable X, se clasican las distribuciones de
frecuencias como:
• Leptocúrtica : cuando AG
d X > 0, es decir, cuando la distribución de frecuencias es más apuntada
que la normal.
• Mesocúrtica : cuando AG
d X = 0, es decir, cuando la distribución de frecuencias es tan apuntada
como la normal.
• Platicúrtica : cuando AG
d X < 0, es decir, cuando la distribución de frecuencias es menos apun-
tada que la normal.
En la gura 5.5 se muestra un ejemplo de algunas distribuciones simétricas con distintos grados de
apuntamiento. En la gura (a) las observaciones se encuentran altamente dispersas en torno a la
media y están asociadas con una distribución más aplanada que la normal, mientras que en la gura
(c) los valores de la variable están mucho más concentrados alrededor del promedio y conforman
una distribución mucho más apuntada que la normal. Por último, la gura (b) corresponde a una
distribución intermedia que sí corresponde a una distribución catalogada como normal.
Figura 5.5: Ejemplos de algunas distribuciones simétricas con distintos grados de apuntamiento.
102 CAPÍTULO 5. MEDIDAS DE FORMA
Solución:
En los ejemplos 5.2.2, 5.2.3 y 5.2.4 se establece que la distribución de las ganancias de las empresas
objeto de estudio es aproximadamente normal. Por lo tanto es de interés calcular el grado de apunta-
miento de esta distribución con el propósito de establecer si puede ser catalogada como normal.
Para calcular el coeciente requerido primero se deben calcular las respectivas marcas de clase como
en el ejemplo 3.2.1. Una vez calculadas las marcas de clase, se calcula la curtosis de las utilidades
aplicando la fórmula para datos agrupados. En la tabla 5.1 se presentan los cálculos pertinentes.
Además, como en el ejemplo 5.2.2, se tiene que Sx = 18.85.
k
1 X 10, 685, 966.89
AG
dX = ni (xi − x̄)4 − 3 = − 3 = −0.58.
nSx4 i=1 (35)(18.854 )
Dado que el valor de la curtosis es negativo se sigue que la distribución de las ganancias es platicúrtica,
esto es, más aplanada que la normal. Sin embargo, examinando el valor del coeciente a la luz de los
valores de la variable y de las medidas de tendencia central, se concluye que su magnitud no es
considerable y que la distribución de las utilidades de las empresas se puede catalogar como normal.
5.4. Comentarios
Tener conocimiento sobre la forma de una distribución permite realizar descripciones conables so-
bre el comportamiento de las observaciones de una variable de interés. Dependiendo de la forma de
la distribución de frecuencias de un conjunto de datos es posible establecer la acomodación de las
observaciones alrededor del promedio, precisar aún más su grado de homogeneidad y catalogar si se
pueden catalogar o no como normales. Estas características están relacionadas intrínsecamente con la
cantidad de información que una muestra puede aportar respecto al comportamiento de la población
de la cual proviene: cuando la distribución de la población es heterogénea y diere signicativamente
de la normal, las muestras de tamaño pequeño pueden no captar todos los aspectos relacionados
con la población. De otro lado, cuando una población es homogénea y clasicada como normal, una
muestra de tamaño pequeño puede ser suciente para obtener información conable acerca de los
rasgos objeto de estudio de la población.
Con lo que se ha estudiado hasta ahora, se ha mostrado cómo describir un conjunto de datos de
una variable a través de grácas y de medidas estadísticas. Las grácas evidencian de forma sencilla
el comportamiento de los datos, mientras que las medidas estadísticas evidencian de forma precisa y
objetiva las características de la distribución de las observaciones que se han intuido con los diagramas.
En el siguiente capítulo se extienden estas prácticas a casos donde se tenga en cuenta más de una
variable a la vez y se quiera investigar la relación entre éstas.
5.5. Ejercicios
5.1. Demostrar que si X es una variable y a, b son números reales entonces se tiene que:
i. Si X=a entonces AF
dX yAG
d X no están denidos.
ii. Si Y = aX + b entonces AF
d Y = sgn(a)AF
d X donde sgn(x) denota el signo de x.
iii. Si Y = aX + b entonces AG
d Y = AG
dX .
5.2. Escribir las versiones poblacionales de las medidas estadísticas presentadas en este capítulo.
5.3. Establecer la escala de medición requerida para cada medida de dispersión presentada en este
capítulo.
d. Con base en los resultados obtenidos en los incisos anteriores, ¾qué se puede establecer acerca
de la forma de la distribución de la variable de estudio?
5.5. Rehacer los incisos del ejercicio 5.4 con la información del ejercicio 3.17.
5.6. Rehacer los incisos del ejercicio 5.4 con la información del ejercicio 4.12.
Capı́tulo 6
Medidas descriptivas para dos variables
6.1. Introducción
Muchos estudios, prácticos y teóricos, indagan directa o indirectamente por el vínculo que tienen las
variables entre sí. Por ejemplo, puede ser de interés especicar la relación entre fumar y el cáncer de
pulmón, o la actividad física y el peso corporal, o el estrato socioeconómico y el patrimonio. Con el
propósito de investigar el nexo entre dos variables, se quiere describir el comportamiento del conjunto
de datos correspondiente mediante grácas que evidencien la interacción entre las características objeto
de estudio, y a través de medidas estadísticas que den cuenta de la asociación entre las variables de
interés.
En este escenario se dispone de un conjunto de n individuos, cada uno de ellos observado en dos
atributos que en adelante se representan mediante X y Y . Se supone que la variable X tiene k
categorías, es decir, X asume los valores x1 , x2 , . . . , xk , y que la variable Y tiene p categorías, es decir,
Y asume los valores y1 , y2 , . . . , yp . Las categorías de las variables están dadas naturalmente cuando
las variables son cualitativas, o se pueden construir por medio de intervalos cuando las variables son
cuantitativas.
Con el propósito de reunir en una sola estructura toda la información disponible, se elabora una tabla
de frecuencias conformada por k×p casillas o categorías, denotadas con Cij , para i = 1, . . . , k y
j = 1, . . . , p, organizadas de tal forma que se tengan k las y p columnas con las categorías de las
104
6.2. TABLAS DE DOBLE ENTRADA 105
Nota. La letra i se utiliza como elemento genérico de las categorías de la variable X de las las, es
decir, i es un valor que varía entre 1 y k, y j se utiliza como elemento genérico de las categorías de la
variable Y de las columnas, esto es, j es un valor que varía entre 1 y p.
Nota. Multiplicado por 100 % la fórmula de la denición 6.2.2, fij representa el porcentaje de indivi-
duos comprendidos en la categoría correspondiente.
p
X
ni• = ni1 + ni2 + . . . + nip = nij para i = 1, . . . , k ,
j=1
y además
k
X
n•j = n1j + n2j + . . . + nkj = nij para j = 1, . . . , p.
i=1
ni•
fi• = para i = 1, . . . , k ,
n
y además
n•j
f•j = para j = 1, . . . , p.
n
Ejemplo 6.2.1. En la tabla 6.1 se presenta un ejemplo en el que se tiene de una tabla de doble
entrada con las frecuencias absolutas y relativas de una variable X de las las con k niveles y una
variable Y p niveles. Por ejemplo, n23 representa la frecuencia absoluta conjunta
de las columnas con
de la categoría 2 de la variable X y de la categoría 3 de la variable Y , mientras que f•1 simboliza la
frecuencia relativa marginal de la categoría 1 de la variable Y .
X \Y y1 y2 ··· yp Total
x1 n11 \ f11 n12 \ f11 ··· n1p \ f1p n1• \ f1•
x2 n21 \ f21 n22 \ f22 ··· n2p \ f2p n2• \ f2•
. . . . . .
. . . . . .
. . . . . .
xk nk1 \ fk1 nk2 \ fk2 ··· nkp \ fkp nk• \ fk•
Total n•1 \ f•1 n•2 \ f•2 ... n•p \ f•p n\1
Proposición 6.2.1. En una tabla de doble entrada de k×p se cumplen las siguientes propiedades:
i. iii.
p
k X k p p
X
X X X
nij = ni• = n•j = n. fi• = fij para i = 1, . . . , k .
i=1 j=1 i=1 j=1 j=1
ii. iv.
X p
k X k
X p
X k
X
fij = fi• = f•j = 1. f•j = fij para j = 1, . . . , p.
i=1 j=1 i=1 j=1 i=1
Tabla 6.2: Tabla de contingencia asociado con el género (X ) y el nivel educativo (Y ) de una muestra de personas de
una empresa.
Ejemplo 6.2.2. La tabla 6.2 corresponde a una tabla de contingencia en la que se estudia la variable
género (X ) y nivel educativo (Y ) de una muestra de personas de una empresa. Obtener las frecuencias
relativas conjuntas y marginales correspondientes.
Solución:
k = 2, p = 3, n1• = 25, n2• = 21, n•1 = 16, n•2 = 16, n•3 = 14 y n = 46.
En la tabla 6.3 se presentan las frecuencias relativas correspondientes que han sido calculadas con
respecto al tamaño de la muestra, es decir, con respecto a n = 46, usando las fórmulas
Por ejemplo, se observa que el porcentaje de empleados que son hombres es 54.3 %, el porcentaje
de empleados que tienen estudios de posgrado es 30.4 % y que el porcentaje de empleados que son
hombres y tienen bachillerato es 48.7 %.
Los perles o distribuciones condicionadas corresponden a tablas bidimensionales en las que interesa
investigar el comportamiento de una variable dado un valor especíco de la otra. En el caso bidimen-
sional se destacan los perles la y los perles columna.
108 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
Denición 6.3.1. Los perles la están asociados con una tabla de
doble entrada en la que se calculan las frecuencias relativas conjuntas
respecto a los totales de las las correspondientes. Análogamente, los
perles columna están asociados con una tabla de doble entrada en la
que se calculan las frecuencias relativas conjuntas respecto a los totales
de las columnas correspondientes.
Nota. A partir de la denición 6.3.1, dada una tabla de contingencia de k ×p, se tiene que la frecuencia
relativa de la ij -ésima categoría de una tabla de perles la, denotada con fij|i• , está dada por:
nij
fij|i• = ,
ni•
mientras que la frecuencia relativa de la ij -ésima categoría de una tabla de perles columna, denotada
con fij|•j , se está dada por:
nij
fij|•j =
n•j
para i = 1, . . . , k y j = 1, . . . , p.
Proposición 6.3.1. En una tabla de perles la o columna de k×p se cumplen las siguientes
propiedades:
i. iii.
fij fij
fij|i• = para i = 1, . . . , k y j = 1, . . . , p. fij|i• = para i = 1, . . . , k y j = 1, . . . , p.
fi• fi•
ii. iv.
p
X k
X
fij|i• = 1 para i = 1, . . . , k . fij|•j = 1 para j = 1, . . . , p.
j=1 i=1
Ejemplo 6.3.1. Elaborar los perles la y los perles columna de la muestra para la tabla bidimen-
sional del ejemplo 6.2.2.
Solución:
Los perles la y los perles columna de la muestra se presentan respectivamente en las tablas 6.4 y
6.5. Las frecuencias relativas de estas tablas se calcularon con las fórmulas
nij nij
fij|i• = y fij|•j =
ni• n•j
para i = 1, 2 y j = 1, 2, 3.
Por ejemplo, se observa que de los hombres, tiene posgrado el 48.0 % (tabla 6.4), mientras que de los
individuos con posgrado, es hombre el 85.7 % (tabla 6.5).
6.4. GRÁFICAS PARA DOS VARIABLES 109
Nota. Al interpretar las frecuencias relativas de los perles es indispensable jarse cuál es el grupo de
individuos de referencia.
Es costumbre presentar al lado de cada tabla de contingencia una gráca que permita evidenciar
fácilmente el comportamiento de los valores presentados en la misma. A continuación se presentan
una serie de ejemplos en los que se ilustra la información contenida en tablas bidimensionales corrientes
y tablas de perles.
Ejemplo 6.4.1. En las guras 6.1 y 6.2 se presentan dos grácos de barras de las frecuencias relativas
del género frente al nivel educativo del ejemplo 6.2.2.
Cuando se trabaja con dos variables cuantitativas, es costumbre denominar a la variable X repre-
sentada en el eje x variable independiente y a la variable Y representada en el eje y variable
dependiente . Las observaciones que resultan de la medición de las variables X y Y sobre cada indivi-
duo de un grupo especíco se considera como un conjunto de realizaciones de la variable bidimensional
(X, Y ) y se denomina conjunto de datos bivariados . Así, la observación de las variables sobre el i-
ésimo individuo de una muestra de tamaño n se representa mediante la dupla (xi , yi ) para i = 1, . . . , n.
Por último, también es costumbre mostrar las observaciones de una muestra correspondiente a un con-
junto de datos bivariado mediante una tabla horizontal (o vertical) como se ilustra en la tabla 6.6.
Ejemplo 6.4.2. En un grupo de 25 niños se miden las cantidades antropométricas de peso (en
kilogramos) y edad (en años cumplidos), obteniéndose los resultados que se presentan en la tabla 6.7.
2
Elaborar una gráca cartesiana del peso (Y ) frente a la edad (X ) con este conjunto de datos.
2 Una gráca cartesiana donde las abscisas y las ordenadas corresponden respectivamente a los valores observados de
110 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
Figura 6.1: Gráco de barras tridimensional de las frecuencias relativas del ejemplo 6.2.2.
Variable X x1 x2 ··· xn
Variable Y y1 y2 ··· yn
Tabla 6.6: Tabla de observaciones de una muestra correspondiente a un conjunto de datos bivariado.
Edad 12.3 13.2 12.5 13.1 12.9 13.1 12.4 12.9 13.2 12.3 12.4 13.0 12.5
Peso 39.5 41.0 39.7 40.8 40.7 41.3 39.2 40.4 41.2 38.8 39.4 40.2 39.7
Edad 12.6 12.8 12.9 12.5 13.1 13.0 12.7 12.2 13.3 12.4 12.3 12.6
Peso 39.8 40.0 40.3 39.6 41.1 41.3 40.3 39.4 41.1 39.9 39.6 40.2
Solución:
En la gura 6.3 se muestra el diagrama de dispersión del peso frente a la edad de los ocho niños.
Se observa que la relación entre las variables es directa y aparentemente fuerte. En las secciones
posteriores se estudian algunas medidas para cuanticar este hecho.
un par de variables se denomina diagrama de dispersión , dispersograma o nube de puntos . Este tipo de grácas
se utiliza cuando las variables objeto de estudio son cuantitativas.
6.5. MEDIDAS DE ASOCIACIÓN 111
Figura 6.2: Gráco de barras de las frecuencias relativas del ejemplo 6.2.2.
Es importante resaltar que las nubes de puntos apenas sugieren cómo es la relación entre un par de
variables cuantitativas, mas no tienen la última palabra al respecto. En algunos escenarios esta señal
es lo sucientemente clara como se evidencia en la gura 6.3 donde la relación es lineal. En estos
casos es posible establecer sin problemas el tipo de relación funcional entre las variables de estudio,
ya sea lineal, cuadrática, cúbica, logarítmica o exponencial, por ejemplo (gura 6.4). Sin embargo,
algunas ocasiones no es posible determinar fácilmente esta relación de manera precisa. Un par de
ejemplos al respecto se ilustran en los diagramas de dispersión (a) y (b) de la gura 6.5, donde solo se
puede evidenciar una región en la cual la densidad de puntos es mayor, lo que señala la presencia de
combinaciones de valores de las variables que son más frecuentes que otros, pero no es claro identicar
una relación particular. Así mismo, se pueden dar situaciones en las que no sea posible evidenciar una
relación entre las variables de estadio, ya que hay diagramas de dispersión como el (c) de la gura 6.5,
donde no es posible establecer directamente un vinculo entre las variables, aunque esto no signica
necesariamente que tal relación no exista.
A continuación se mencionan algunas medidas de uso común para describir y cuanticar objetivamente
la posible relación existente entre dos variables cuantitativas. Entro otras medidas de asociación se
112 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
6.5.1. Covarianza
La covarianza es una medida de asociación entre dos variables cuantitativas que permite establecer
el modo de la relación lineal entre las características objeto de estudio. Esta medida mesura la
variabilidad conjunta de un par de variables y sirve como insumo para constituir otras medidas de
asociación.
n
1 X
Sxy = (xi − x̄)(yi − ȳ)
n − 1 i=1
6.5. MEDIDAS DE ASOCIACIÓN 113
Figura 6.4: Ejemplos de diagramas de dispersión en los que se evidencia una relación cuadrática (a), cúbica (b),
exponencial (c) y logarítmica (d).
Nota. La covarianza muestral observada de una variable bidimensional (X, Y ) se simboliza con
Sxy , mientras que lacovarianza poblacional se denota con σXY . Así, cuando se dispone de una
población nita, se tiene que
N
1 X
σxy = (xi − µX )(yi − µY )
N i=1
donde N es el tamaño de la población. Se resalta el hecho de que la covarianza es una medida expresada
con unidades mixtas (unidades de la variable independiente multiplicadas por las unidades de la
variable dependiente) de asociación que describe la variabilidad conjunta de dos variables cuantitativas.
Considerar una nube de puntos conformada por una muestra de n realizaciones de la variable bidi-
mensional (X, Y ) cuyo centro es el punto (x̄, ȳ). La representación de (xi − x̄, yi − ȳ) para i = 1, . . . , n
resulta en una traslación de la nube de puntos original al origen (0, 0). De esta forma, el diagrama de
dispersión queda dividido en cuatro cuadrantes como se observa en las nubes de puntos de la gura
6.6. Los datos bivariados que se encuentran en el primer y tercer cuadrante contribuyen positivamente
114 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
Figura 6.5: Ejemplos de diagramas de dispersión en los que no se evidencia directamente una relación entre a las
variables.
al valor de la covarianza, mientras que los datos bivariados que se encuentran en el segundo y cuarto
cuadrante lo hacen negativamente. De este modo:
• Si hay mayoría de puntos en el tercer y primer cuadrante entonces se tiene que Sxy > 0,
lo que quiere decir que la variable dependiente tiende a aumentar cuando lo hace la variable
independiente (relación directa).
• Si hay mayoría de puntos en el segundo y cuarto cuadrante entonces se tiene que Sxy < 0,
lo que quiere decir que la variable dependiente tiende a disminuir cuando lo hace la variable
independiente (relación inversa).
• Si los puntos se reparten equitativamente alrededor de (x̄, ȳ) entonces se tiene que Sxy = 0.
Nota. Cuando los puntos se reparten de modo más o menos homogéneo entre los cuadrantes primero
y tercero, y segundo y cuarto, se tiene que la covarianza de las variables es aproximadamente igual
a 0. Esto no quiere decir de ningún modo que no exista ninguna relación entre las dos variables; de
hecho este nexo puede existir como se aprecia en el diagrama de dispersión (d) de la gura 6.6.
Ejemplo 6.5.1. Calcular e interpretar la covarianza entre la edad y el peso con el conjunto de datos
bivariado del ejemplo 6.4.2.
Solución:
Para obtener la covarianza entre la edad y el peso primero se deben calcular los promedios de estas
variables. En este caso se tiene que x̄ = 12.728 y ȳ = 40.180. Luego de calcular los respectivos
promedios, se procede a calcular las diferencias y los productos, de tal forma que la covarianza entre
6.5. MEDIDAS DE ASOCIACIÓN 115
Figura 6.6: Ejemplos de nubes de puntos de un par de variables con relación directa (a), relación inversa (b) y
covarianza nula (c y d).
la edad y el peso es
n
1 X
Sxy = (xi − x̄)(yi − ȳ)
n − 1 i=1
1
= ((12.3 − 12.728)(39.5 − 40.180) + . . . + (12.6 − 12.728)(40.2 − 40.180))
25 − 1
= 0.226.
Dado que la covarianza entre la edad y el peso es positiva entonces la relación entre las dos variables
es directa como se aprecia en la gura 6.3. Las las unidades de la covarianza son unidades mixtas que
en este caso corresponden a años × kilogramo.
Proposición 6.5.1. Sea (X, Y ) una variable bidimensional y a, b, c y d números reales. Entonces se
tiene que:
i. SXY = SY X .
2
ii. SXX = SX .
Demostración:
i.
n n
1 X 1 X
SXY = (Xi − X̄)(Yi − Ȳ ) = (Yi − Ȳ )(Xi − X̄) = SY X .
n − 1 i=1 n − 1 i=1
ii.
n n
1 X 1 X
SXY = (Xi − X̄)(Xi − X̄) = (Xi − X̄)2 = SX
2
.
n − 1 i=1 n − 1 i=1
n
1 X
SV W = (Vi − V̄ )(Wi − W̄ )
n − 1 i=1
n
1 X
= ((aXi + b) − (aX̄ + b))((cYi + d) − (cȲ + d))
n − 1 i=1
n
1 X
= (aXi + b − aX̄ − b)(cYi + d − cȲ − d)
n − 1 i=1
n
1 X
= a(Xi − X̄)c(Yi − Ȳ )
n − 1 i=1
n
1 X
= ac(Xi − X̄)(Yi − Ȳ )
n − 1 i=1
n
1 X
= ac (Xi − X̄)(Yi − Ȳ )
n − 1 i=1
= acSXY .
Ejemplo 6.5.2. La covarianza entre los costos de producción (C ) y las utilidades (U ) de una compañía
es 5.61. El presidente de la empresa está implementando una política de calidad para que los costos
disminuyan 1 % y las utilidades aumenten 5 %. ¾Con esta política de calidad la covarianza entre
6.5. MEDIDAS DE ASOCIACIÓN 117
los costos de producción y las utilidades aumenta o disminuye? Si el incremento porcentual de las
utilidades es 10 %, ¾en cuántos puntos porcentuales deben disminuir los costos de producción bajo la
política de calidad para que la covarianza entre las variables alcance las 6 unidades mixtas?
Solución:
Si SV W denota la covarianza entre los costos de producción y las utilidades bajo la política de calidad
entonces
V = C − 0.01C = 0.99C y W = U + 0.05U = 1.05U.
En consecuencia,
SV W = (0.99)(1.05)SXY = (1.0395)(5.61) = 5.831
y por lo tanto con está política la covarianza entre las variables aumenta.
De otra parte, sea x el decremento porcentual de los costos de producción para que la covarianza bajo
la política de calidad sea igual a 6 unidades mixtas. Entonces se sigue que
(1 − x)(1.10)(5.61) = 6.
Despejando x de esta ecuación se obtiene que x = 0.0277 y por lo tanto la decremento porcentual de
los costos de producción debe ser de 2.77 %.
n
X n
X
(xi − x̄)(yi − ȳ) = xi yi − nx̄ȳ.
i=1 i=1
Demostración:
n
X n
X
(xi − x̄)(yi − ȳ) = (xi yi − ȳxi − x̄yi + x̄ȳ)
i=1 i=1
n
X n
X n
X n
X
= xi yi − ȳxi − x̄yi + x̄ȳ
i=1 i=1 i=1 i=1
Xn n
X n
X
= xi yi − ȳ xi − x̄ yi + nx̄ȳ
i=1 i=1 i=1
Xn
= xi yi − ȳ(nx̄) − x̄(nȳ) + nx̄ȳ
i=1
Xn
= xi yi − nx̄ȳ − nx̄ȳ + nx̄ȳ
i=1
118 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
n
X
= xi yi − nx̄ȳ.
i=1
En el sección ?? se señala que la varianza de una suma de dos variables no coincide con la suma de
las varianzas de las variables. En la siguiente proposición se establece a qué corresponde la varianza
de esta suma.
2 2
SW = SX + SY2 + 2SXY .
Demostración:
n
2 1 X
SW = (Wi − W̄ )2
n − 1 i=1
n
1 X
= (Xi + Yi − (X̄ + Ȳ ))2
n − 1 i=1
n
1 X
= (Xi + Yi − X̄ − Ȳ )2
n − 1 i=1
n
1 X
= ((Xi − X̄) + (Yi − Ȳ ))2
n − 1 i=1
n
1 X
(Xi − X̄)2 + 2(Xi − X̄)(Yi − Ȳ ) + (Yi − Ȳ )2
=
n − 1 i=1
n n n
!
1 X X X
= (Xi − X̄)2 + 2(Xi − X̄)(Yi − Ȳ ) + (Yi − Ȳ )2
n−1 i=1 i=1 i=1
n n n
!
1 X
2
X
2
X
= (Xi − X̄) + (Yi − Ȳ ) + 2 (Xi − X̄)(Yi − Ȳ )
n−1 i=1 i=1 i=1
n n n
1 X 1 X 1 X
= (Xi − X̄)2 + (Yi − Ȳ )2 + 2 (Xi − X̄)(Yi − Ȳ )
n−1 i=1
n−1 i=1
n − 1 i=1
2
= SX + SY2 + 2SXY .
Proposición 6.5.4.
Pm
Si X1 , . . . , Xm son m variables conmensurables y W = i=1 Xi entonces
m
X m X
X m
2 2
SW = SX i
+2 SXi Xj .
i=1 i=1 j=1
1≤i<j≤m
• Es de uso cotidiano.
La covarianza es una medida de variabilidad conjunta que indica la forma en la que dos variables
cuantitativas continuas están relacionadas linealmente. Una covarianza grande indica que hay una
relación de tipo lineal entre las dos variables. Pero, ¾qué signica que la covarianza sea grande?
¾Cómo se puede calicar la magnitud de la covarianza? De hecho, la magnitud de la covarianza
depende de la escala de medida que se utiliza. Por esta razón, es difícil, en casos concretos, establecer
a simple vista, si la covarianza es grande o no (Blanco 2004).
La covarianza está dada en unidades mixtas de medición, lo que motiva denir una medida de la
relación entre dos variables cuantitativas, que no se vea afectada por los cambios de unidad de
medida, es decir, que sea adimensional. Una forma de conseguir esto es dividir la covarianza por el
producto de las desviaciones estándar de cada variable.
Nota. De acuerdo con la denición 6.5.2, si se dispone de la información de una muestra asociada con
una variable bidimensional (X, Y ) entonces el valor observado del coeciente de correlación de
Pearson muestral entre X y Y , denotado con rxy , está dado por
Sxy
rxy = .
Sx Sy
120 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
El coeciente de correlación está ligado directamente con el grado de la asociación lineal de las
variables. De hecho, el coeciente de correlación únicamente mesura la fortaleza de la relación lineal
entre dos variables cuantitativas continuas. Además, al igual que la covarianza, con el coeciente de
correlación también es posible identicar si la relación entre las variables es directa o inversa, pues los
signos del coeciente y de la covarianza son iguales.
Al igual que el índice de Yule-Bowley, el coeciente de correlación siempre toma valores entre −1 y
1. De esta forma, a medida que el coeciente se acerca a 0, la relación lineal entre las variables se
debilita, y en caso contrario, a medida que el coeciente se acerca a −1 o 1, la relación lineal entre las
variables se fortalece de manera inversa o directa respectivamente. De este modo si el valor absoluto
del coeciente:
• Está entre 0.9 y 1 entonces la correlación entre las variables es alta o fuerte.
• Está entre 0.7 y 0.9 entonces la relación entre las variables es moderada.
• Está entre 0.5 y 0.7 entonces la relación lineal entre las variables aceptable.
• Está entre 0 y 0.5 entonces la relación lineal entre las variables reducida o mínima.
En la gura 6.7 se presentan algunos ejemplos de nubes de puntos con diferentes grados de correlación.
Ejemplo 6.5.3. Calcular el coeciente de correlación entre la edad y el peso de los datos del ejemplo
6.4.2.
Solución:
Para calcular el coeciente de correlación de Pearson entre la edad y el peso se necesita obtener
previamente las desviaciones estándar correspondientes. En este caso se tiene que Sx = 0.339 y
Sy = 0.724. Así, el coeciente de correlación es
Sxy 0.226
rxy = = = 0.920.
Sx Sy (0.339)(0.724)
Este coeciente indica que la relación lineal entre la edad y el peso de los niños es directa y además
fuerte.
6.5. MEDIDAS DE ASOCIACIÓN 121
Las siguientes son algunas observaciones acerca del coeciente de correlación de Pearson:
• Es de uso cotidiano.
Pn
¯ (ỹi − ỹ)
(x̃i − ỹ) ¯
rsxy = Pn i=1 ¯ Pn ¯
( i=1 (x̃i − x̃)) ( i=1 (ỹi − ỹ))
Ejemplo 6.5.4. Uno de los competidores se dio cuenta de que las posiciones en las que los individuos
se encontraban habían sido asignadas para favorecer a algunos, siendo los más favorecidos los que
se encontraban en las últimas posiciones. Mediante la asociación entre las posiciones y el puntaje
obtenido que se presentan en la tabla 6.8 colaborar la armación del competidor.
Solución:
−1.105
rsxy = = −0.032.
(5.916)(5.891)
Por lo tanto se concluye que las posiciones no se encontraban favorecidas, o en el caso de que lo
hubieran estado, no se vio reejado en el resultado del torneo.
Tabla 6.8: Datos asociados con la posición y el puntaje de los competidores del ejemplo 6.5.4.
De manera más general, a continuación se desarrolla una medida de asociación para variables mesu-
radas en una escala ordinal, la cual se basa en los rangos de las variables, al igual que el coeciente
de correlación de Spearman.
124 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
Nota. En la denición 6.5.4, se dice que hay una concordancia entre el par (xi , yi ) y (xj , yj ), si xi < xj
y yi < yj , o, si xi > xj y yi > yj ; además se dice que hay una discordancia si xi < xj y yi > yj , o,
xi > xj y yi < yj para i, j = 1, . . . , n con i 6= j .
Nota. El coeciente de correlación de Kendall así denido se debe usar en los casos donde no hay
empates para que sea posible denir las concordancias y las discordancias. Como los otros coecientes
de correlación, el valor de este coeciente se siempre se encuentra entre −1 y 1, y su interpretación es
análoga.
Ejemplo 6.5.5. En un estudio de mercadeo se quiere establecer si hay una asociación entre el por-
3
centaje de contenido de un insumo de un producto y una medida de complacencia escalada entre uno
y diez. En dicho estudio se obtuvo la información una muestra de consumidores que se presenta en la
tabla 6.9. Calcular e interpretar el coeciente de correlación de Kendall.
Solución:
18 − 10 8
τxy = 1 = = 0.286.
2 (8)(7)
28
Este valor del coeciente indica que las variables sí están correlacionadas positivamente pero no de una
forma contundente, y por lo tanto el porcentaje de contenido del insumo y la medida de complacencia
no están asociadas inequívocamente, y en consecuencia se deben tener en cuenta otras variables con
el propósito de investigar el nivel de complacencia del producto.
Las observaciones del coeciente de correlación de Kendall son análogas a las del coeciente de corre-
lación de Spearman.
3 Satisfacción, placer y contento que resulta de algo (Real Academia Española 2012b).
6.5. MEDIDAS DE ASOCIACIÓN 125
Tabla 6.9: Datos asociados con las concordancias y discordancias del estudio de mercadeo del ejemplo 6.5.5.
El coeciente de Gini mas que una medida de asociación es una medida de la desigualdad ideada por
el italiano Corrado Gini 4
. Normalmente se utiliza para medir la desigualdad de la repartición de la
riqueza, pero se puede utilizar para medir la distribución de cualquier variable.
k
X
Gx = 1 − fi (Ui−1 + Ui )
i=1
donde Pj
ni xi
Uj = Pki=1 para j = 1, . . . , k ,
i=1 ni xi
ni es la frecuencia absoluta, fi es la frecuencia relativa y xi es la clase o
la marca de clase de la i-ésima categoría para i = 1, . . . , k . Además, se
dene U0 = 0.
Nota. Cuando las observaciones de una variable X no están agrupados en una tabla de frecuencias
se tiene que ni = 1 y fi = 1/n para i = 1, . . . , n donde n es el numero de datos que se tienen a
disposición. En este caso es fundamental ordenar los datos ascendentemente para que la fórmula del
coeciente haga sentido.
hay perfecta igualdad en la distribución de la variable todos los individuos tienen la misma cantidad
de riqueza y el valor 1 corresponde a un caso donde hay perfecta discrepancia en la repartición un
individuo posee toda la riqueza y los demás nada.
En la práctica, tratándose de la riqueza de los países, los valores del coeciente varían desde aproxi-
madamente 0.2, para países históricamente igualitarios como Bulgaria, Hungría, la república Checa y
Eslovaca y Polonia, hasta 0.6 para países centro y suramericanos donde las elites poderosas dominan
la economía. La evolución del coeciente Gini es particularmente útil en la medida que revela tenden-
cias. Muestra la evolución hacia una igualdad mayor en Cuba desde 1953 hasta 1986 (0.55 a 0.22) y el
crecimiento de la desigualdad en los Estados Unidos en las últimas tres décadas durante las cuales el
coeciente de Gini pasó de 0.35 en los setenta a 0.40 actualmente (½y aún está subiendo!). La mayoría
de los países europeos y Canadá están ubicados alrededor de 0.30, Japón y algunos países asiáticos
llegan a 0.40, mientras que la mayoría de los países africanos exceden 0.45. En la gura 6.9 se presenta
5
un cartograma donde se evidencian los valores del coeciente de Gini a nivel mundial.
Ejemplo 6.5.6. Calcular el Coeciente de Gini para el conjunto de datos de la tabla 6.10 corres-
pondiente al número de cuentas que un gerente reparte entre sus empleados. Calcular e interpretar el
coeciente de Gini.
Solución:
A en la tabla 6.11 se presentan los cálculos necesarios para obtener el coeciente de Gini del número de
cuentas (X ). En este caso, debido a la ausencia de intervalos, las marcas de clase xi corresponden a las
mismas categorías del número de cuentas. Se calculan las frecuencias relativas como de costumbre y los
productos ni xi que corresponden al total de cuentas repartidas entre los empleados que recibieron un
Figura 6.9: Cartograma cartograma donde se evidencian los valores del coeciente de Gini a nivel mundial .
xi ni
1 2
2 2
4 1
Total 5
Tabla 6.10: Datos asociados con el número de contratos que un gerente reparte entre sus empleados.
P4
monto de cuentas determinado; además resulta que el total de cuentas repartidas es i=1 ni xi = 10.
También se calcula Ui para cada categoría como el acumulado de la columna precedente conformada
n x
por los P i i . Finalmente, en la última columna se presentan los términos involucrados en la fórmula
ni x i
del coeciente, obteniéndose que
k
X
Gx = 1 − fi (Ui−1 + Ui ) = 1 − 0.72 = 0.28.
i=1
Este valor del coeciente de Gini indica que la repartición de las cuentas aunque no fue absolutamente
igualitaria, no es desigual, situación que tiende a la equidad en la repartición de la carga laboral entre
los empleados.
Ejemplo 6.5.7. La Gobernación de una ciudad arma que las empresas de un determinado sector
128 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
ni xi
xi ni fi ni xi P
ni xi Ui fi (Ui−1 + Ui )
1 2 0.4 2 0.2 0.2 0.08
2 2 0.4 4 0.4 0.6 0.32
4 1 0.2 4 0.4 1 0.32
Total 5 1 10 1 N.A. 0.72
económico se encuentran equilibradas respecto a los ingresos que devengan. Por tal motivo los entes
de control del Estado aseguran que no es necesario ofrecer estímulos ni subsidios para las compañías
de dicho sector. Una de las empresas que no está de acuerdo con la posición del Gobierno obtiene una
muestra de los ingresos (en millones) de diez empresas del sector como se observa en la tabla 6.12.
Con base en el coeciente de Gini, ¾el Gobierno debe reconsiderar su posición?
1240 840 2000 1456 973 907 1490 789 1423 600
Tabla 6.12: Datos asociados con los ingresos de una muestra de empresas de un sector económico particular.
Solución:
Para calcular el coeciente de Gini de los ingresos (X ), primero se ordenan los datos ascendentemente
y en seguida calcular los valores de Ui para i = 1, . . . , 10 obteniéndose los siguientes resultados:
0.009 0.079 0.154 0.235 0.322 0.432 0.559 0.689 0.822 1.000
(2)(4.301) − 1
Gx = 1 − = 0.239.
10
Este valor del coeciente de Gini indica que no se trata de una situación de equidad perfecta, aunque
ciertamente no es una situación de desigualdad apremiante, por lo que la posición del Gobierno es
acertada y las objeciones de la empresa no tienen fundamento.
La curva de Lorenz es una representación gráca que se utiliza frecuentemente para plasmar la
distribución relativa de una variable en un dominio determinado. El dominio puede ser el conjunto
de hogares o personas de una región o país y la variable cuya distribución se estudia puede ser el
ingreso de los hogares o las personas, por ejemplo. La curva se traza considerando en el eje horizontal
el porcentaje acumulado de individuos del dominio en cuestión y en el eje vertical el porcentaje
acumulado de la variable de interés. Cada punto de la curva se lee como el porcentaje acumulado de
los individuos involucrados en la investigación. La curva parte del origen (0, 0) y termina en el punto
(1, 1) y de esta forma, si la variable estuviera distribuida de manera perfectamente equitativa, la curva
coincidiría con la línea de 45 grados que pasa por el origen; y si existiera desigualdad perfecta, la
curva coincidiría con el eje horizontal hasta el punto (1, 0) donde saltaría al punto (1, 1). En general,
la curva se encuentra en una situación intermedia entre estos dos extremos. En resumen, tratando
6.5. MEDIDAS DE ASOCIACIÓN 129
Si la curva de Lorenz se encuentra siempre por encima de otra y, por lo tanto, está más cerca de
la línea de 45 grados, se puede establecer sin ambigüedad que la primera distribución exhibe menor
grado desigualdad que la segunda. Esta comparación gráca entre distribuciones de distintos dominios
geográcos o temporales es la principal utilidad de la curva de Lorenz. En la gura 6.10 se presenta
un ejemplo de la curva de Lorenz.
Ejemplo 6.5.8. Representar la curva de Lorenz correspondiente para los datos del ejemplo 6.5.6.
Solución:
Para obtener la curva de Lorenz del ejemplo 6.5.6 donde el coeciente de Gini es de 0.28 revelando un
caso de aparente igualdad en la repartición de las cuentas, se deben gracar los valores de tabla 6.13
que se muestra a continuación:
Para gracar la curva de Lorenz se debe representar en el plano cartesiano la unión de los puntos
dados en la tabla 6.13, es decir, la unión de los puntos (0, 0), (0.4, 0.8), (0.8, 0.6) y (1, 1). En el eje x
130 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
Fi Ui Igualdad
0 0 0
0.4 0.2 0.4
0.8 0.6 0.8
1 1 1
Tabla 6.13: Frecuencias acumuladas asociadas con la curva de Lorenz del ejemplo 6.5.6.
Figura 6.11: Curva de Lorenz asociada con la repartición de las cuentas del ejemplo 6.5.6.
6.6. COMENTARIOS 131
6.6. Comentarios
En este capítulo se da hace introducción al análisis conjunto de dos variables, puesto que muchos
estudios prácticos y teóricos, indagan directa o indirectamente por la relación que tienen las variables
entre sí. La relación entre dos variables puede ser lineal o no lineal, algo que se olvida y menosprecia
frecuentemente, y por lo tanto las medidas que se utilicen deben corresponder apropiadamente al tipo
de relación que se investiga.
Además, uno de los elementos más importantes en este contexto es entender e interpretar las relaciones
de las variables a través de tablas cruzadas y de los coecientes de correlación, que se deben aplicar
prudentemente dependiendo del tipo escala de medida en que estén dadas las variables de estudio.
Por último, se estudian una medida y un gráco cuyo propósito es inspeccionar la forma en que
se distribuye o reparte una variable entre los individuos asociados. Esta medida es de gran utilidad
práctica y se emplea usualmente para estudiar la repartición de la riqueza entre las personas de una
población determinada.
6.7. Ejercicios
6.1 Considerar la siguiente información:
10
X 10
X 10
X 10
X 10
X
xi = 110, yi = 60, x2i = 3156, yi2 = 1, 138 y xi yi = 1, 868.
i=1 i=1 i=1 i=1 i=1
b. Calcular el promedio de X y Y.
c. Calcular la varianza de X y Y.
d. Calcular la desviación típica de X y Y.
e. Calcular e interpretar la covarianza entre X y Y.
f. Calcular e interpretar el coeciente de correlación de Pearson entre X y Y.
g. Calcular e interpretar nuevamente el coeciente de correlación de Pearson si para todos los
individuos de la muestra la variable X aumenta en 5 % y la variable Y aumenta en 3 %.
1
6.2 Sean X y Y dos variables tales que rxy = 2, Sx2 = 1 y Sy2 = 2. Calcular
2
Sw donde W = X − 2Y .
6.3 Sea (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) un conjunto de n realizaciones de una variable bidimensional
(X, Y ). Una fórmula alternativa para calcular el coeciente de correlación de Spearman es
n
6 X
rsxy = 1 − 2
(x̃i − ỹi )2i
n(n − 1) i=1
donde x̃i y ỹi son respectivamente los rangos de xi y yi del i-ésimo individuo para i = 1, . . . , n.
132 CAPÍTULO 6. MEDIDAS DESCRIPTIVAS PARA DOS VARIABLES
Corroborar que esta fórmula del coeciente de correlación de Spearman coincide con la fórmula
dada en la denición 6.5.3 utilizando los datos del ejemplo 6.5.4.
6.4 Calcular el coeciente de correlación de Spearman y de Kendall utilizando los datos del ejemplo
6.4.2. Interpretar y comparar los resultados obtenidos.
6.5 Se sabe que hay una relación entre la utilidad de las acciones X y Y. La tabla 6.14 corresponde
a una muestra de los benecios asociados con estas acciones. Realizar un gráco de dispersión y
calcular las medidas de asociación a que haya lugar entre las variables. ¾Qué se puede decir del
nexo entre las utilidades de las acciones?
# X Y # X Y
1 1253.81 91.73 21 2193.91 -66.97
2 2264.64 -18.00 22 1958.28 -125.78
3 1567.86 182.91 23 1994.85 -141.20
4 1299.00 145.70 24 2694.94 47.25
5 2389.47 48.43 25 1445.50 214.17
6 2592.27 60.64 26 2083.25 -122.08
7 2462.54 90.10 27 2642.54 55.99
8 2311.34 -14.58 28 1386.89 215.28
9 2128.80 -107.84 29 2143.09 -88.31
10 3312.81 -13.98 30 1814.38 -57.72
11 1939.12 -120.26 31 1770.48 -15.84
12 3136.20 -51.42 32 3278.51 -31.73
13 2329.68 19.92 33 2498.77 78.84
14 1883.61 -119.30 34 3196.21 -31.06
15 1277.64 96.02 35 2252.69 -36.40
16 2893.56 -15.71 36 2946.31 -37.71
17 3045.40 -49.74 37 1886.00 -88.03
18 2060.51 -124.28 38 1848.70 -59.02
19 2378.64 58.66 39 2499.54 74.20
20 2511.22 68.92 40 1960.95 -130.21
Tabla 6.14: Datos asociados con una muestra de utilidades de las acciones X y Y.
6.6 La junta directiva de una empresa dice tener una estructura horizontal, lo cual se podría ver
reejado mediante la equidad salarial. Con base en la información de la tabla 6.15, ¾qué indican
el coeciente de Gini y la curva de Lorenz acerca de la aseveración de la junta directiva?
6.7 Una empresa ha trabajado hasta ahora con la hipótesis de que las ventas de un período dependen
linealmente de los gastos de publicidad efectuados en el período anterior. En este momento, soli-
citan la realización de un análisis que ponga de maniesto si la hipótesis, hasta ahora mantenida,
se puede seguir sosteniendo con los datos que suministran. Las cifras se muestran en la tabla 6.16
y están dadas en miles de millones de pesos.
6.7. EJERCICIOS 133
Salario Frecuencia
1,485,000 1
1,689,000 1
1,714,000 1
1,751,000 1
1,916,000 1
1,942,000 1
1,943,000 1
1,966,000 1
1,990,000 1
2,047,000 1
2,115,000 1
2,191,000 1
2,242,000 1
2,661,000 1
2,727,000 1
Tabla 6.15: Datos asociados con los salarios de una muestra de empleados de una empresa.
Tabla 6.16: Datos asociados con las ventas y gastos de una empresa determinada.
a. ¾Se incrementarán las ventas del período siguiente al aumentar los gastos en publicidad del
período actual?
b. ¾Es adecuado suponer que el ajuste entre estas variables es efectivamente lineal teniendo en
cuenta los valores de las variables?
6.8 Las calicaciones que se presentan en la tabla 6.17 corresponden a las notas de 25 alumnos en las
asignaturas A y B.
b. ¾Qué proporción de alumnos obtienen más de cinco en ambas asignaturas? ¾Qué proporción
de alumnos obtienen más de un cinco en A? ¾Y en B?
# A B # A B
1 4 3 14 8 7
2 5 5 15 8 7
3 5 5 16 8 8
4 5 6 17 8 8
5 6 7 18 8 8
6 6 7 19 8 8
7 7 7 20 9 8
8 7 7 21 9 8
9 7 7 22 9 8
10 7 7 23 9 10
11 7 8 24 9 10
12 7 8 25 10 10
13 7 8
Tabla 6.17: Datos asociados con las calicaciones de las asignaturas A y B de una muestra de alumnos.
6.9 Demostrar que si (X, Y ) es una variable bidimensional y a, b, c y d son números reales entonces
se tiene que:
i. rXY = rY X .
ii. rXX = 1.
iii. Si V = aX + b y W = cY + d entonces rV W = sgn(a)sgn(c)rXY donde sgn(x) denota el signo
de x.
2 2
6.10 Si en una distribución bidimensional se tiene que Sx+y = 10.3 y Sx−y = 8.1, calcular la covarianza
entre 2X − 1 y 4Y + 2.
Pm
6.11 Demostrar que si X1 , . . . , Xm son m variables conmensurables y W = i=1 Xi entonces
m
X m X
X m
2 2
SW = SX i
+ SXi Xj .
i=1 i=1 j=1
i6=j
6.12 En la tabla 6.18 se presentan los datos correspondientes a la tasa media de crecimiento del PIB y
del empleo para 25 países de la OCDE para el periodo 1988-1997.
a. Hacer un diagrama de dispersión de la tasa media de crecimiento del PIB frente a la tasa media
de crecimiento del empleo.
b. Calcular e interpretar la covarianza entre la tasa media de crecimiento del PIB y la tasa media
de crecimiento del empleo.
Tabla 6.18: Datos asociados con la tasa media de crecimiento del PIB y del empleo para 25 países de la OCDE para
el periodo 1988-1997.
6.13 En la tabla 6.19 se presenta un conjunto de datos asociado con el ingreso (en millones de pesos),
el género y la preferencia de una medida económica del Gobierno Nacional de una muestra de
empleados de una compañía. Para hombres y mujeres separadamente:
e. Estandarizar la variable ingresos. ¾Hay observaciones atípicas? ¾Si las hay, cuáles son?
Tabla 6.19: Datos asociados con los ingresos, el género y la preferencia de una medida económica del Gobierno Nacional
de una muestra de empleados de una compañía.
Parte II
Probabilidades
138
Capı́tulo 7
Fundamentos de probabilidad
7.1. Introducción
Si el propósito central del investigador es describir los resultados de un experimento concreto, las
técnicas presentadas en las secciones anteriores se pueden considerar sucientes. No obstante, si se
quiere utilizar la información obtenida para extraer conclusiones generales sobre los objetos de un
conjunto de datos mayor que comparten las mismas propiedades de los datos iniciales, entonces estas
técnicas constituyen solo el principio del análisis y se debe recurrir a los métodos de la inferencia
estadística , los cuales implican el uso apropiado de la teoría de la probabilidad.
La teoría de la probabilidad se desenvuelve en medio de los diversos resultados y los posibles sucesos
(eventos) que se pueden obtener cuando se realiza un experimento (cualquier acción o proceso que
genera observaciones o datos directa o indirectamente). El término experimento se utiliza en la teoría
de la probabilidad para describir virtualmente cualquier acción o proceso que genera un conjunto de
datos.
139
140 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Sin embargo, hay experimentos cuyos resultados no son determinados si las condiciones se mantienen
constantes. Tales experimentos se denominan experimentos aleatorios.
Ejemplo 7.2.2. Ejemplos comunes de experimentos aleatorios, son los juegos de azar que están
relacionados con las cartas y los lanzamientos de dados o monedas. Sin embargo, hay otros tipos de
ejemplos de experimentos aleatorios como los siguientes:
1. Seleccionar aleatoriamente una ciudad de un país y registrar para ésta el número de empresas
de servicios.
2. Seleccionar aleatoriamente tres propuestas de ley del Congreso y registrar si fueron o no apro-
badas.
El primer paso para analizar un experimento aleatorio consiste en denir cuidadosamente los resultados
experimentales. Cuando se denen todos los posibles resultados de un experimento estocástico, se
identica el denominado espacio muestral del experimento.
7.3. ESPACIOS MUESTRALES Y EVENTOS 141
• Se instala una computadora nueva en un banco. La computadora controla todas las transfe-
rencias bancarias guardando el valor exacto de cada transacción, mas sin embargo no registra
transacciones menores a un millón ni mayores a cien millones. Se dene el experimento aleatorio
como los valores que registra la computadora.
• Una fábrica que elabora diferentes clases de un artículo determinado tiene un método para la
identicación de las unidades terminadas que fue concebido para diferenciarlas y clasicarlas
por categorías. Se dene el experimento aleatorio como la extracción y la clasicación de los
artículos entre todos los fabricados hasta el día de ayer.
¾Cuál es el espacio muestral en cada caso? ¾Cuál es la diferencia entre estos dos espacios muestrales?
Solución:
En la primera situación el espacio muestral es el conjunto de todos los valores que se encuentren entre
1 millón y 100 millones, ya que el resultado del experimento es el valor de la transacción que registra
la computadora.
Para el segundo experimento el espacio muestral es el conjunto de todas las identicaciones de los
artículos que se han producido hasta el día de ayer.
La diferencia más importante entre estos dos espacios muestrales radica en su tamaño, ya que el
primero tiene un número innito de posibles resultados mientras que el segundo tiene un número
nito de resultados.
Nota. Los eventos aleatorios usualmente se simbolizan con letras mayúsculas como A, B o C , por
ejemplo. Además, si A es un evento y el resultado observado del experimento aleatorio es un elemento
de A signica que el evento A ha sucedido. Cuando un evento tiene un solo elemento se denomina
evento elemental o simple .
142 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Ejemplo 7.3.2. Considerar el experimento aleatorio lanzar un dado corriente una vez. En este caso
se tiene que:
Ejemplo 7.3.3. Obtener el espacio muestral del experimento aleatorio que consiste en seleccionar
aleatoriamente tres leyes del Congreso y registrar si fueron o no aprobadas.
Solución:
Ω = {(s, s, s), (n, s, s), (s, n, s), (s, s, n), (n, n, s), (n, s, n), (s, n, n), (n, n, n)}.
donde s signica que sí ha sido aprobada la ley y n que no ha sido aprobada la ley.
Ejemplo 7.3.4. Obtener el espacio muestral de cada experimento del ejemplo 7.3.1.
Solución:
En la primera situación el espacio muestral es el conjunto de todos los valores que se encuentren entre
1 millón y 100 millones. Esto corresponde a
El cálculo de las probabilidades está relacionado intrínsecamente con el manejo de los eventos alea-
torios. Manejar apropiadamente las operaciones entre conjuntos es de fundamental importancia para
desarrollar y aplicar el cálculo de las probabilidades en los escenarios teóricos y de aplicación. En el
apéndice B se presentan algunos detalles al respecto.
A ∩ B = {ω ∈ Ω : ω ∈ A y ω ∈ B}.
A ∪ B = {ω ∈ Ω : ω ∈ A o ω ∈ B}.
A − B = {ω ∈ Ω : ω ∈ A y ω∈
/ B}.
Ejemplo 7.4.1. Se lanza un dado corriente una vez. Considerar A como al evento el resultado
obtenido es un número impar y B como al evento el resultado obtenido es al menos 3. Entonces, en
este caso se sigue que:
• Los eventos complementarios de los eventos A y B son respectivamente AC : el resultado obtenido
C C
es un número par y B : el resultado obtenido es a lo más 2, es decir, A = {2, 4, 6} y
B C = {1, 2}.
Nota. Sea A un evento aleatorio de un espacio muestral Ω. Se observa que los eventos A y AC son
C
mutuamente excluyentes, dado que A ∩ A = Φ, y además son colectivamente exhaustivos, puesto que
A ∪ AC = Ω. En otras palabras, A y AC conforman una partición de Ω.
Un instrumento útil para abordar las operaciones entre eventos aleatorios son los diagramas de Venn.
En la guras B.2 y B.3 se muestra una representación gráca de los conceptos presentados anterior-
mente.
Ejemplo 7.4.2. Sea Ω = {1, 2, 3, 4, 5, 6} el espacio muestral asociado con el experimento del ejemplo
7.4.1. Se consideran los eventos A = {2, 6}, B = {1, 4}, C = {3, 5} y D = {2, 3, 4, 5}. En este caso se
tiene que:
Ejemplo 7.4.3. La junta directiva de una empresa productora de alimentos quiere lanzar un nue-
vo producto en una ciudad. Para esto la empresa realiza un estudio de mercadeo en el cual se pide
establecer: ¾Cuál es la población de referencia (Ω)? ¾Cuáles son los posibles consumidores del pro-
ducto (A)? Si el producto fue diseñado para personas entre los 11 y 30 años, ¾cuál es la población
objetivo (B )? ¾Cuál es la población objetivo si se quiere que ésta tenga la posibilidad de comprar el
producto (C )? ¾Qué población hay que tener en cuenta para realizar las campañas publicitarias (D )?
Con los conjuntos de individuos establecidos anteriormente, ¾es posible obtener una partición de los
consumidores del producto?
Solución:
Es necesario tener en cuenta que el producto se va a distribuir por toda la ciudad, luego la población
de referencia es
Ω = {Los individuos que transitan por la ciudad}.
Sin embargo, no todos los individuos que transitan por la ciudad son consumidores potenciales del
producto, ya que los recién nacidos no pueden ingerir alimentos sólidos en sus primeros meses de vida.
Por lo tanto, el conjunto que reúne los posibles consumidores del producto es
De otra parte, si el producto fue diseñado para personas entre los 11 y 30 años, como se establece una
condición particular para la población objetivo entonces se tiene que ésta es igual a
B = {Las personas que transitan por la ciudad que tienen entre 11 y 30 años de edad}.
146 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Ahora, teniendo en cuenta que no todos los consumidores potenciales tienen la capacidad de comprar
el producto en primera instancia, se sigue que
C = {Las personas que tienen uso libre de capital para la adquisición de productos alimentarios}
y en consecuencia la población que se debe tener en cuenta para realizar las campañas publicitarias es
D = B ∩ C . Ahora, para establecer si los conjuntos B , C y D conforman una partición de A, basta ver
que no se cumple al menos una de las condiciones necesarias para tener una partición. Por ejemplo,
se observa que B ∩ C 6= Φ y por lo tanto B, C y D no conforman una partición de A.
A continuación se presentan algunas propiedades relacionadas con las operaciones entre eventos que
son de uso común en el cálculo de probabilidades. Estas propiedades también se estudian con cierto
detalle en el apéndice B.
d. A ∩ Ω = A. b. A ∩ A = A.
e. A ∪ Φ = A. viii. Ley involutiva:
C
f. A ∩ Φ = Φ. AC = A.
Ejemplo 7.4.4. Un laboratorio produce entre otros un bio-tejido para reforzar la piel del cuello,
patas y abdomen, de un conjunto particular de animales, entre los cuales se encuentran los porcinos,
7.4. OPERACIONES CON EVENTOS ALEATORIOS 147
ovinos y los bovinos. El laboratorio quiere recoger los tejidos producidos para bovinos o porcinos pero
que sean refuerzo únicamente para el cuello. Al nal del día se entregan al laboratorio los tejidos que
refuerzan los tejidos para porcinos, ovinos y bovinos en tres bolsas diferentes. ¾Es posible obtener los
productos que quiere el laboratorio de estas tres bolsas? De ser posible, ¾cómo se obtendrían?
Solución:
Ejemplo 7.4.5. Con la información del ejemplo 7.4.2, vericar que (A ∪ B)C = AC ∩ B C y que
C C C
(A ∩ B) = A ∪ B .
Solución:
En el primer caso, se observa que A ∪ B = {1, 2, 4, 6} y en consecuencia (A ∩ B)C = {3, 5}. Como
A = {1, 3, 4, 5} y B = {2, 3, 5, 6} entonces AC ∩ B C = {3, 5}, lo que comprueba la primera
C C
C C
igualdad. De otra parte, se tiene que A ∩ B = Φ y por lo tanto (A ∩ B) = Ω. Como A = {1, 3, 4, 5}
C C C
y B = {2, 3, 5, 6} entonces A ∪ B = Ω, lo que vericada la segunda igualdad.
Ejemplo 7.4.6. Considerar el espacio muestral del ejemplo 7.4.2. Se observa que:
• Sean los eventos A = {1, 3, 5} y B = {3, 4, 5, 6}. Entonces, los eventos A ∩ B = {3, 5} y
AC ∩ B = {4, 6} conforman una partición de B.
• Sean los eventosA1 = {1, 3}, A2 = {2, 4, 6}, A3 = {5} y B = {3, 4, 5, 6}. Los eventos A1 , A2 y
A3 conforman una partición de Ω. Ahora, se tiene que los eventos A1 ∩ B = {3}, A2 ∩ B = {4, 6}
y A3 ∩ B = {5} conforman una partición de B .
148 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Antes de señalar cómo se utilizan las probabilidades, es necesario conocer de donde provienen y cómo
se calculan. A continuación se presentan tres formas de calcular o estimar la probabilidad de un evento,
a saber, mediante los siguientes métodos: frecuentista, clásico y subjetivo. Estos métodos no son de
ninguna forma una denición de probabilidad, son apenas algunas formas de asignar probabilidades.
Este método se basa en el concepto de frecuencia relativa (detalles en la sección 2.2) asociada con
la ocurrencia de un evento cuando se repite un experimento aleatorio un gran número de veces. Este
método se utiliza cuando los eventos se observan empíricamente, estimando la probabilidad de que
un evento particular ocurra por medio la frecuencia relativa constituida con base en la información
histórica.
Nota. Si se calcula esta frecuencia relativa cada cierto número de ensayos, a medida que aumenta el
número de repeticiones del experimento aleatorio, las frecuencias relativas correspondientes son más
estables, es decir, tienden a ser casi las mismas. En este caso, se dice que el experimento muestra
regularidad estadística (estabilidad en las frecuencias relativas).
La mayoría de los experimentos aleatorios de importancia práctica tienen regularidad. Por esto es
posible establecer que la frecuencia relativa de un evento A correspondiente a un gran número de
7.5. ASIGNACIÓN DE PROBABILIDADES 149
Nota. Cuando se usa la denición empírica de probabilidad, es importante tener en cuenta los sigui-
entes aspectos:
• La probabilidad obtenida de esta manera es únicamente una estimación del valor real.
• Cuanto mayor sea el número de experimentos, tanto mejor será la estimación de la probabilidad.
• La validez de esta estimación depende de que las condiciones en que se realiza el experimento
sean idénticas.
a. Una máquina produce 100 tubos de ensayo cada 5 minutos. Esta máquina empieza su funciona-
miento a las 8:00 a.m. y termina a las 8:00 p.m., hora en la que se toma una muestra de tamaño
n del lote y se revisa el número de tubos de ensayo defectuosos. Si el número de tubos defectuosos
es mayor que una cantidad predeterminada por el departamento de control de calidad entonces
la producción del día se puede distribuir, de otra manera no es posible. Teniendo en cuenta que
no hay cambios en el programa de producción de un día a otro: ¾Cual es la probabilidad de que
la producción de un día no se pueda distribuir? ¾Es correcto estimar la probabilidad mediante la
frecuencia relativa?
b. Un complejo de ocinas se jacta de tener uno de los mejores controles de seguridad. Se quiere
corroborar lo anterior estimando la probabilidad de que una persona que no trabaje en la ocina
pueda pasar sin tener que anunciarse en recepción. ¾Cómo se calcula esta probabilidad? ¾Es correcto
estimar la probabilidad mediante la frecuencia relativa?
Solución:
En la situación a. si se toman los registros de producción durante cierto número de días entonces se
puede calcular la probabilidad de que la producción de un día no se pueda distribuir mediante:
Además, es correcto estimar esta probabilidad mediante el método frecuentista porque se considera
que no hay cambios en el programa de producción de un día a otro.
150 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
No. de personas que ingresaron al complejo sin tener que anunciarse y que no trabajan allí
.
No. de personas que entraron al complejo sin trabajar en él
En este caso, es correcto calcular esta probabilidad por medio de la frecuencia relativa siempre y
cuando las condiciones de seguridad no varíen drásticamente de un día a otro.
Es posible identicar diversos casos en los que se asocie la misma probabilidad a cada evento elemental
de un experimento aleatorio. En tales escenarios, se habla de experimentos laplacianos o clási-
cos , donde se tienen nitos resultados que suceden con la misma probabilidad (eventos elementales
equiprobables). Los juegos de azar hacen parte de este tipo de experimentos.
Nota. Es importante recalcar que este método para calcular probabilidades es útil siempre y cuando
todos los puntos muestrales sean equiprobables y el espacio muestral sea contable, de lo contrario,
las probabilidades obtenidas no son conables. En este caso no se realiza ninguna aproximación de la
probabilidad, ya que en este caso se emplea toda la información del espacio muestral.
Ejemplo 7.5.2. Un joven se vio obligado a cambiar de país por lo cual está buscando un colegio
en el cual pueda continuar con sus estudios, sin embargo el único criterio que tiene en cuenta para
seleccionar la institución educativa es que la proporción de mujeres sea por lo menos del 70 %. Este
joven realizó un pequeño cálculo de probabilidades para determinar la repuesta de sus padres frente
a su propuesta: si las posibles respuestas de los padres son sí y no (el espacio muestral -pensaba
el joven-) entonces la probabilidad de que aceptaran la propuesta empleando el método de asignación
clásico de probabilidades es 1/2. Para aumentar sus posibilidades el joven dio a sus padres varias
propuestas de colegios. La respuesta de los padres del joven fue negativa para cada una de ellas.
Discutir el motivo por el cual el joven no pudo obtener al menos un sí de sus padres para alguno de
los colegios que propuso.
Solución:
7.5. ASIGNACIÓN DE PROBABILIDADES 151
Lo primero que se debe tener en cuenta es que el joven no tomó en cuenta los criterios que tenían
sus padres frente al tipo de colegio al cual querían que su hijo ingresara. Ellos estaban considerando
que su hijo se distraería tanto con sus compañeras que decidieron que cualquier colegio que no fuera
masculino no sería la primera ni la segunda opción. Es decir, los eventos simples en este caso no eran
equiprobables.
Ejemplo 7.5.3. Un laboratorio obtiene muestras de sangre de sus pacientes para realizar una variedad
de pruebas, dentro de las cuales se encuentra una que emplea el conteo de células CD4. El laboratorio
quiere determinar la probabilidad de que al seleccionar una célula de la muestra corresponda a una
tipo CD4. ¾Cómo se calcula esta probabilidad mediante el método clásico? Asumir que el método de
selección de la célula no marca la diferencia.
Solución:
En este caso primero se dene el espacio muestral, que corresponde a cada una de las células que se
encuentran dentro de la muestra de sangre (no los tipos de célula). Luego, la probabilidad deseada
viene dada por:
No. de células tipo CD4 en la muestra de sangre
.
No. de células en la muestra de sangre
Se observa que este método sugiere que todas las células en la muestra tienen la misma posibilidad de
ser escogidas.
Existen algunos eventos cuyas probabilidades no se deben calcular por medio del método frecuentista
o clásico, sino que se estiman mediante el grado de credibilidad basándose en experiencias pasadas.
Aquel mecanismo que permite asignar probabilidades de esta forma se denomina método subjetivo.
Ejemplo 7.5.4. Un par de amigos que siempre se han cubierto la espalda cuando sus novias no
sabían donde andaban, se vieron perjudicados por el conocimiento subjetivo de la probabilidad de que
su amigo les cubriera la espalda aun cuando no alcanzara a avisarle, que estimaban como del 100 %.
152 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
La novia de uno de ellos, sospechando del apoyo mutuo que tenían decidió llamar al amigo de su novio
a preguntarle si sabía en donde se encontraba y con quién; el amigo respondió que se encontraba con
él, lo cual conrmó la sospecha que ya tenía la novia porque tenía a su novio muy callado al lado de
ella. Comentar cómo se involucró la asignación subjetiva de probabilidades en la situación anterior.
Solución:
Sólo hay que notar que para este par de amigos esta clase de situaciones eran muy comunes, por
lo que cuando alguna de estas situaciones ocurría (novia llamando a preguntar por su novio) ellos
asumían con probabilidad 1 que se trataba de una situación real, en la que su amigo necesitaba que
lo cubrieran. Luego, el método subjetivo se ve reejado en el grado de credibilidad que los amigos le
dan a una situación basados en lo que han hecho en el pasado, esto es, su experiencia cubriéndose la
espalda.
Cuando se trabaja con probabilidades, sin importar cual sea la forma en que se asignen, siempre se
deben satisfacer las condiciones que se presentan a continuación, pues formalmente son ellas las que
denen propiamente una medida de probabilidad.
ii. P(Ω) = 1.
La proposición que se presenta a continuación resume las propiedades más importantes de una medida
de probabilidad que son de uso frecuente en el cálculo de probabilidades:
i. P(Φ) = 0.
iv. Si A1 , A2 . . . , An son eventos mutuamente excluyentes dos a dos (Ai ∩ Aj = Φ para todo i 6= j )
Sn Pn
entonces P ( i=1 Ai ) = i=1 P(Ai ).
v. P AC = 1 − P(A).
Demostración:
i. P(Ω) = P(Ω ∪ Φ ∪ Φ . . .) = P(Ω) + P(Φ) + P(Φ) + . . .=1. Como P(Φ) ≥ 0 entonces P(Φ) = 0.
vi. P(A) = P((A − B) ∪ (A ∩ B)) = P(A − B) + P(A ∩ B). Como P(A) = P(A − B) + P(A ∩ B) entonces
P(A − B) = P(A) − P(A ∩ B).
vii. P(B) = P(B ∩ Ω) = P B ∩ A ∪ AC = P (B ∩ A) ∪ B ∩ AC = P(B ∩ A) + P B ∩ AC .
Como P(B) = P(A) + P(B − A) entonces P(A) ≤ P(B) y P(B − A) = P(B) − P(A).
ii. P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C).
Demostración:
154 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
i.
ii.
P(A ∪ B ∪ C) = P((A ∪ B) ∪ C)
= P(A ∪ B) + P(C) − P((A ∪ B) ∩ C)
= P(A) + P(B) − P(A ∩ B) + P(C) − P((A ∩ C) ∪ (B ∩ C))
= P(A) + P(B) + P(C) − P(A ∩ B)
− [P(A ∩ C) + P(B ∩ C) − P((A ∩ C) ∩ (B ∩ C))]
= P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C).
Ejemplo 7.6.1. Sean A, B y C eventos tales que P(A) = 0.50, P(B) = 0.26, P(C) = 0.55, P(A ∪ B) =
0.61, P(A ∩ C) = 0.25, P(B ∩ C) = 0.15 y P(A ∩ B ∩C) = 0.05. Con
base en esta información, calcular
C C
las siguientes probabilidades: P(A ∪ B), P A ∩ C , P A ∪ C y P(A ∪ B ∪ C).
Solución:
C
P AC ∪ C = 1 − P AC ∪ C = 1 − P A ∩ C C = 1 − 0.25 = 0.75.
Estas probabilidades se pueden recticar con el diagrama de Venn que se ilustra en la gura 7.1.
7.7. MÉTODOS DE CONTEO 155
7.7.1. Enumeración
La primera regla se basa en tratar de enumerar todos los elementos de un espacio muestral y luego
contar los elementos pertenecientes a un evento de interés. Esta técnica es adecuada cuando el número
de resultados posibles no es muy grande.
La forma en que pueden resultar todos los elementos de un espacio muestral depende de si se consideran
o no el orden y el reemplazamiento entre las competentes que conforman los puntos muestrales. A
continuación se presentan algunos ejemplos para ilustrar estas características.
Ejemplo 7.7.1. (Selección con reemplazo y con orden) Una empresa tiene cuatro propuestas de
inversión en la Bolsa de Valores aviación (A), ganado (G), redes sociales (R) y nutrición (N ) y
quiere entregar un par de estas propuestas a cada asociado. Se debe tener en cuenta que existe la
posibilidad de entregar una misma propuesta varias veces y que la forma de ejecutar las propuestas
es en serie una tras otra, esto es, primero se debe ejecutar una propuesta y una vez terminada la
siguiente. La empresa quiere determinar cuántos asociados necesita para analizar todas las posibles
alternativas de inversión.
156 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Solución:
Se quiere determinar cuántas son las distintas maneras de seleccionar las dos propuestas teniendo en
cuenta que cada asociado tendrá a su cargo el análisis de solo un par de estas propuestas. En este
caso la selección de las propuestas se hace con reemplazo y con orden, ya que se puede examinar una
misma propuesta varias veces y el análisis de un par de propuestas diferentes varía dependiendo de
cual se ejecute primero. Como la selección es con reemplazo, entonces, se selecciona una propuesta y
se vuelve a introducir en el folder de posibilidades antes de seleccionar la segunda. Por lo tanto, el
espacio muestral es:
Ω = {(A, A), (A, V ), (A, R), (A, N ), (V, V ), (V, A), (V, R), (V, N ),
(R, R), (R, A), (R, V ), (R, N ), (N, N ), (N, A), (N, R), (N, V )}.
Por lo tanto, se necesitan 16 asociados para analizar todas las posibles alternativas de inversión.
Ejemplo 7.7.2. (Selección con reemplazo y sin orden) Si en el ejemplo 7.7.1 el orden en el que se
ejecutan las propuestas no marca la diferencia, ¾cuántos asociados son necesarios para analizar todas
las posibles alternativas de inversión?
Solución:
Esta situación solo diere de la anterior en cuanto a que ahora evaluar el par las propuestas {A; V } y
{V ; A} es equivalente. Por tanto el espacio muestral correspondiente se ve reducido a:
Ω = {{A, A}, {A, V }, {A, R}, {A, N }, {V, V }, {V, R}, {V, N }, {R, R}, {R, N }, {N, N }}.
Ejemplo 7.7.3. (Selección sin reemplazo y con orden) Un grupo de congresistas necesita aprobar
cuatro proyectos de ley denotados con P1 , P2 , P3 y P4 . En un día los congresistas pueden votar dos
proyectos, pero saben que dependiendo de cuáles sean y el orden en el que se presenten, tienen una
mayor o menor posibilidad de que sean aprobados. A este grupo de congresistas les interesa saber de
cuántas formas se pueden presentar los dos proyectos de ley en un día y cuáles son las posibilidades.
Solución:
En esta situación el orden sí es importante dado que el primer proyecto en evaluarse puede interferir
con la aprobación del segundo, pero el reemplazamiento no tiene lugar porque una vez un proyecto
sea votado no tiene sentido volverlo a votar el mismo día, así que el espacio muestral está dado por:
Ejemplo 7.7.4. (Selección sin reemplazo y sin orden) Si en el ejemplo 7.7.3 el orden en el que se
votan los proyectos de ley en realidad no interere con la evaluación de los mismos, ¾de cuántas formas
se pueden presentar los dos proyectos de ley en un día?
Solución:
En comparación con el caso anterior, aquí se deja de tener en cuenta el orden en el que se presenten
las propuestas, por lo que las posibles parejas de proyectos de ley son:
Por consiguiente, si el orden en el que se votan los proyectos no interere con la evaluación de los
mismos entonces solo hay 6 posibilidades para presentar proyectos de ley.
Cuando el número de posibles formas de ejecutar un proceso no es muy grande, se recomienda utilizar
una representación gráca conocida como diagrama de árbol para evidenciar todas las posibilidades
asociadas. Un diagrama de árbol consta de una serie de ramas que corresponden a cada una de las
formas en que se puede realizar las operaciones de un proceso determinado.
Ejemplo 7.7.5. La unidad administrativa de una empresa tiene dos instancias de clasicación de
documentos que al parecer le están generando retrasos ya que alguna de las instancias es más eciente
que la otra. La empresa ha decidido determinar donde está el problema y para ello quiere listar todas
las variantes del proceso de clasicación. En la primera etapa los documentos llegan a la ocina y se
clasican en tres temas (bancarrota, fusiones y pleitos). Una vez clasicados por tema se envían a
las dependencias correspondientes donde se vuelven a clasicar pero esta vez por valor (alto, medio y
bajo). ¾De cuántas formas distintas puede procesar un documento esta unidad administrativa?
Solución:
El diagrama de árbol correspondiente a esta situación se presenta en la gura 7.2. Como se observa en
este diagrama, las diferentes posibilidades se pueden enumerar teniendo en cuenta las últimas ramas
del gráco. Se nota que hay en total nueve maneras diferentes de procesar los documentos.
El principip fundamental del conteo asegura que si una colección de k experimentos pueden
ocurrir de n1 , n2 , . . . , nk maneras distintas, entonces el número de posibles resultados de los k experi-
Qk
mentos realizados en el orden indicado es i=1 ni = n1 × n2 × . . . × nk .
158 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Bajo
Pleitos Medio
Alto
Bajo
Fusiones Medio
Alto
Bajo
Bancarrota Medio
Alto
Ejemplo 7.7.6. Una empresa de modistería está a punto de sacar al mercado su nueva colección:
Siempre perfecta, siempre distinta. La idea característica de esta colección es que cualquier empresaria
que se encuentre corta de tiempo pueda escoger cualquier prenda blusa, falda, zapatos, bolso y
pañoleta de su vestier sin tener que pensar en que las prendas combinen, ya que todas las prendas de
la colección combinan entre sí. Esta empresa está interesada en saber si con tres modelos de blusas,
dos modelos de faldas, cuatro modelos de zapatos, tres modelos de bolso y un solo modelo de pañoleta,
es posible obtener más de 100 conjuntos.
Solución:
3 × 2 × 4 × 3 × 1 = 72
posibles conjuntos y por consiguiente no es posible obtener más de 100 conjuntos como quería la
empresa.
Ejemplo 7.7.7. Un dado corriente se lanza dos veces. Determinar el número de formas en que se
pueden obtener los posibles resultados en los dos lanzamientos.
7.7. MÉTODOS DE CONTEO 159
Solución:
Como los dos lanzamientos no están relacionados de forma alguna cuando se ejecutan y como el
dado puede caer de seis formas distintas, entonces el número total de posibles resultados en los dos
lanzamientos es 6 × 6 = 36.
Ejemplo 7.7.8. Considerar el ejemplo 7.7.5 donde se clasican los documentos que arriban a la unidad
administrativa de una empresa. Calcular nuevamente el número de formas en la que un documento
puede ser procesado, teniendo en cuenta que también hay una instancia en la que el proceso puede
terminar de cuatro formas posibles: victoria, conciliación, derrota y suspendido.
Solución:
Los experimentos que se consideran corresponden a las tres etapas del proceso de clasicación de los
documentos, que pueden ocurrir respectivamente de 3, 3 y 4 formas diferentes. Entonces el número
total de formas en las que se puede procesar un documento es 3 × 3 × 4 = 36.
Ejemplo 7.7.9. Una fábrica de zapatos se caracteriza por la variedad de productos que tiene. Esto se
debe principalmente a que al diseñar una nueva forma para sus zapatos siempre se obtienen al menos
30 variantes respecto al diseño nal aunque todos tengan la misma forma. Uno de los directores se
pregunta si aún con dos máquinas en reparación se pueden cumplir con el mínimo de 30 variantes
por diseño. Las máquinas con las que se dispone para trabajar en serie son: pintura con 7 variantes,
supercie con 2 variantes, guras 1 variante y accesorios con 2 variantes. ¾Qué respuesta se le daría
al director respecto al mínimo de variantes que se debe cumplir?
Solución:
Teniendo en cuenta que cada uno de los objetivos de las máquinas son los experimentos de interés, se
sigue que los posibles resultados de las respectivas variantes son 7, 2, 1 y 2. Por ende, la cantidad de
variantes por diseño que se pueden obtener en el producto nal es 7 × 2 × 1 × 2 = 28, cifra que no
cubre la cantidad mínima de variantes deseada.
Solución:
Sean A1 y A2 los eventos la suma de los números obtenidos es siete y la suma de los números
160 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
A1 = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)} y A2 = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}.
Como A1 y A2 son mutuamente excluyentes entonces el evento A1 ∪ A2 que corresponde a la suma
de los números obtenidos es siete u ocho puede ocurrir de 6 + 5 = 11 maneras distintas.
Ejemplo 7.7.11. Se considera el experimento que consiste en lanzar una moneda corriente al aire
tres veces. ¾De cuántas formas se pueden obtener una, dos o tres caras?
Solución:
Sean A1 , A2 y A2 los eventos se obtiene una cara en los tres lanzamientos, se obtienen dos caras
en los tres lanzamientos y se obtienen tres caras en los tres lanzamientos respectivamente. En esta
situación se tiene que A1 , A2 y A3 ocurren de 3, 3 y 1 formas posibles respectivamente dado que
A = {(c, s, s), (s, c, s), (s, s, c)}, B = {(s, c, c), (c, s, c), (c, c, s)} y D = {(c, c, c)}
donde c y s denotan cara A1 , A2 y A3 son mutuamente excluyentes
y sello respectivamente. Como
dos a dos entonces el evento A1 ∪ A2 ∪ A3 que corresponde a se obtienen una, dos o tres caras en los
tres lanzamientos puede ocurrir de 3 + 3 + 1 = 7 maneras diferentes.
7.7.5. Permutaciones
Nota. Es importante tener en cuenta que toda permutación se puede identicar como una muestra
seleccionada con o sin reemplazo, pero siempre teniendo en cuenta el orden de los elementos que la
componen.
Ejemplo 7.7.12. Un experimento donde prima el orden en el que se ejecutan los procesos que lo
componen es aquel que se realiza cuando una persona se viste. Allí se evidencia claramente la diferencia
en el resultado del experimento cuando se cambia el orden de ejecución de los procesos, ya que no es
lo mismo ponerse primero la ropa interior y luego los pantalones, a ponerse primero los pantalones y
luego la ropa interior, por ejemplo.
Ejemplo 7.7.13. El arreglo (a, c) es un ejemplo de una permutación de las letras a, b, c y d, pero
tomando solamente dos de ellas a la vez. Hay un total de 12 permutaciones de estas cuatro letras
tomándolas de 2 en 2. Estas permutaciones son (a, b), (a, c), (a, d), (b, a), (b, c), (b, d), (c, a), (c, b),
(c, d), (d, a), (d, b) y (d, c).
7.7. MÉTODOS DE CONTEO 161
El número total de permutaciones de un conjunto de objetos se puede calcular a través del teorema
fundamental del conteo. Pero para algunas situaciones especiales hay fórmulas que permiten calcular
la cantidad de permutaciones sin tener que aplicar directamente este teorema.
Ejemplo 7.7.14. Un joven prepara café con leche todas las mañanas llenando el 80 % de la tasa con
café, el 18 % con leche y el 2 % restante con azúcar. Si el muchacho en una de sus parrandas acaba
con el suministro de alcohol del lugar, a la mañana siguiente o cuando se logre levantar intenta
hacer un café con leche. Teniendo en cuenta su estado, ¾de cuántas formas puede prepararse el café
utilizando cada ingrediente una sola vez y manteniendo constantes los porcentajes de preparación?
¾Cuál es la probabilidad de que se prepare el café con leche como de costumbre asumiendo que todos
los ingredientes se utilizan una sola vez y que tienen la misma posibilidad de ser seleccionados?
Solución:
Como solo hay tres ingredientes entonces el número de formas diferentes en las que se puede prepa-
rar el café con leche manteniendo la proporción de los ingredientes es 3! = 6 y por consiguiente la
probabilidad de que se prepare el café con leche como de costumbre es de 0.16667.
Ejemplo 7.7.15. Se le pide a un consumidor que ordene, por orden de preferencia, el sabor de cinco
cosechas de vino. Si al consumidor le es indiferente cualquiera de estas cinco cosechas entonces el
número de arreglos diferentes que resultan es 5! = 120.
Ejemplo 7.7.16. Siguiendo con el ejemplo 7.7.13, el número de permutaciones de las letras a, b, c y
4!
d, tomadas de dos en dos, es igual a P24 = (4−2)! = 12.
162 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Ejemplo 7.7.17. ¾Cuántos números de tres cifras sin repetir dígitos se pueden formar con los números
2, 4, 5, 7 y 8?
Solución:
Como interesan los números de tres cifras sin repetir dígitos formados con los números 2, 4, 5, 7 y 8,
5!
entonces se pueden obtener P35 = (5−3)! = 60 números diferentes.
Ejemplo 7.7.18. Una sección de maquinaria determinada que consta de cuatro piezas puede ser
ensamblada poniendo las competentes en cualquier orden. Se quiere estudiar el tiempo de armado
para esta sección de maquinaria midiendo el tiempo que requiere cada una de las acomodaciones
resultantes al tomar las piezas en distinto orden. ¾Cuántas de estas mediciones habrá que hacer?
Solución:
Como hay cuatro piezas diferentes y se requiere el armado de todas ellas, entonces el número total de
4!
mediciones es P44 = (4−4)! = 24.
Ejemplo 7.7.19. Una rma consultora cobra 700 USD por cada caso que atiende. Esta empresa suele
adquirir siete casos por temporada. Una vez se tienen los siete casos, la compañía examina todas las
posibles permutaciones de cuatro casos con repetición para revisarlas cuantas veces sea necesario y así
determinar cual de todas ellas es la más rentable. Recientemente ha llegado una cantidad nunca antes
vista de consultas, 11 en total, y emplearon el personal de costumbre para estudiar las permutaciones
de cuatro casos. En la tarde, el grupo encargado de inspeccionar las permutaciones se quejó diciendo
que ellos no tenían la capacidad para realizar el trabajo con la misma cantidad de miembros y en los
lapsos de tiempo en que deben entregar sus resultados. ¾Se justica la posición de los trabajadores?
Solución:
Lo primero que se debe tener en cuenta es que usualmente los trabajadores están a acostumbrados
74 = 2, 401 posibilidades de casos, pero con los 11 asesorías los empleados deben estudiar
a analizar
4
11 = 14, 641 posibilidades, que corresponde aproximadamente a seis veces más de lo que están
acostumbrados a analizar, luego, a pesar de que la diferencia entre 7 y 11 no es muy grande, sí lo es
la diferencia en el trabajo que esto representa, por lo cual los trabajadores sí tienen razón en hacer la
queja.
7.7. MÉTODOS DE CONTEO 163
Ejemplo 7.7.20. ¾Cuántos números de dos cifras se pueden formar usando los dígitos 2, 3 y 5 si se
permiten dígitos repetidos?
Solución:
Como hay tres elementos disponibles para formar los números de dos cifras y además se permite la
repetición de dígitos, entonces se tienen 32 = 9 posibilidades, a saber, 55, 52, 53, 25, 22, 23, 35, 32 y
33.
Ejemplo 7.7.21. ¾De cuántas formas es posible contestar un examen con diez preguntas de selección
múltiple donde cada pregunta tiene cuatro alternativas de respuesta?
Solución:
Como se tienen cuatro opciones de respuesta para cada una de las diez preguntas, se sigue que hay
410 = 1, 048, 576 formas de responder el examen.
Ejemplo 7.7.22. Un ladrón quiere abrir una caja fuerte. Observa que para abrirla debe manipular
un dispositivo de seguridad formado por cinco anillos que están marcados con los dígitos 1, 2, 3, 4
y 5, pero no sabe la combinación correcta. ¾Cuál es la mayor cantidad de intentos incorrectos que el
ladrón puede realizar antes de encontrar la combinación correcta?
Solución:
En cada uno de los cinco anillos se pueden utilizar los 5 dígitos. Por lo tanto, hay 55 = 3, 125
posibilidades de escoger una clave. Pero como una de estas 3,125 es la correcta, entonces la mayor
cantidad de intentos incorrectos que el ladrón puede realizar antes de encontrar la combinación correcta
es 3,124.
Permutaciones circulares
Ejemplo 7.7.23. Si interesa ubicar a cuatro personas una al lado de la otra en una la, el número
total de arreglos es 4! = 60. Ahora bien, si se deben sentar alrededor de una mesa redonda, ¾de cuántas
maneras es posible hacerlo?
Solución:
En una mesa redonda no se tiene un comienzo o un nal a diferencia del escenario en el que las
164 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
personas se sientan en una la. Este hecho hace que se pierda un nivel en el número de arreglos.
Como se acomoda a una persona en un lugar jo y luego se ubican a las otras tres personas, entonces
se obtienen (4 − 1)! = 6 arreglos diferentes en los que se pueden sentar las cuatro personas en una
mesa redonda.
Ejemplo 7.7.24. ¾De cuántas formas se pueden sentar cuatro personas alrededor de una mesa redonda
si dos de ellas no deben estar una al lado de la otra?
Solución:
Hay 3! = 6 formas de acomodar a cuatro personas en una mesa redonda. Ahora, hay 2! maneras en las
(3 − 1)!2! es la cantidad total de
que dos personas se pueden sentar una al lado de la otra, por lo que
formas en las que estas dos personas se pueden ubicar juntas en una mesa redonda. En consecuencia,
se tiene que
3! − (3 − 1)!2! = 3! − 2!2! = 2
es el número de arreglos requerido.
Ejemplo 7.7.25. ¾Cuántas palabras distintas con o sin sentido se pueden formar con las letras de
la palabra estadística?
Solución:
En la palabra estadística hay n = 11 letras, distribuidas así: 1 e, 2 s, 2 t, 2 a, 1 d, 2 i y 1
c. Por lo tanto, se concluye que es posible formar
11 11!
= = 2, 494, 800
1, 2, 2, 2, 1, 2, 1 1! × 2! × 2! × 2! × 1! × 2! × 1!
Ejemplo 7.7.26. En una clase de biología molecular tienen la siguiente secuencia de ADN:
7.7. MÉTODOS DE CONTEO 165
ATGCAAATCCATCCCG
Para que los alumnos de la clase comprendan porque es necesario el uso de métodos computacionales
intensivos se les pregunta: ¾cuántas posibles secuencias del mismo tamaño que la anterior es posible
encontrar usando las mismas bases nitrogenadas que se tienen en el ejemplo?
Solución:
En este caso la cantidad de tipos o categorías es 4, a saber A, T, G y C, de las cuales se tienen 5 A,
3 T, 2 G y 6 C bases nitrogenadas. Por lo tanto, la cantidad total de posibles secuencias está
dada por:
16!
= 20, 180, 160.
5!3!2!6!
Solución:
Como es necesario tener en consideración el orden en el cual se esparcen las sustancias en el suelo y
cada sustancia se puede considerar como una categoría diferente entonces la cantidad de parcelas que
se necesitan es
9!
= 5, 040.
2!1!3!3!
7.7.6. Combinaciones
Ejemplo 7.7.28. Todas las posibles combinaciones de las letras a, b, c, d y e, tomadas de dos en dos
son {a, b}, {a, c}, {a, d}, {a, e}, {b, c}, {b, d}, {b, e}, {c, d}, {c, e} y {d, e}. Es decir, en total hay 10
posibles formas de escoger dos letras de un total de cinco, cuando el orden no importa y la selección
se hace sin reemplazamiento. Se observa que las combinaciones {a, b} y {b, a} coinciden dado que el
orden de los elementos no marca la diferencia.
donde k es un número entero positivo tal que k ≤ n. Esta fórmula se obtiene considerando que el
número total de permutaciones de un conjunto de n elementos distintos sin repetición tomados de k
n!
en k es igual a
(n−k)! y que en las combinaciones el orden de los elementos no es de interés, por lo que
solo interesa tener 1 sola de las k! posibles permutaciones de los k objetos.
Ejemplo 7.7.29. Un abogado se encuentra en aprietos para defender a su cliente, ya que a pesar
de tener siete posibles argumentos, todos carecen de carácter probatorio y además solo puede utilizar
tres de ellos en el juicio. Si, de todas las posibles combinaciones únicamente hay ocho que lo pueden
llevar a ganar el caso, ¾cuál es la probabilidad de que escogiera una de estas posibilidades de manera
aleatoria?
Solución:
Como el total de combinaciones de tres argumentos de siete posibles viene dado por
7 7!
= = 35,
3 (7 − 3)!3!
entonces la probabilidad de que se escoja una de las posibilidades que lo pueden llevar a la victoria es
8/35 = 0.22857. ¾Cuál es el método de asignación de probabilidades se utilizó en este caso? ¾Qué es
necesario suponer para emplearlo?
Hay situaciones en las que interesa la probabilidad de un evento A, teniendo en cuenta que otro
evento B ha ocurrido. Así, la cuestión principal es cuanticar el chance de ocurrencia de un evento
dependiendo de la ocurrencia de otro(s) suceso(s). Tales probabilidades se denominan probabilidades
condicionales.
7.8. PROBABILIDAD CONDICIONAL 167
P(A ∩ B)
P(A|B) =
P(B)
Ejemplo 7.8.1. Los 700 empleados de una corporación, se clasican por género y por el monto de su
salario dependiendo de si ganan menos de o más de $20,000 diarios, como se muestra en la tabla 7.1.
Tabla 7.1: Datos asociados con la clasicación de los empleados de una corporación según el género y el ingreso.
Solución:
a. La probabilidad de que un empleado gane al menos $20,000, dado que es hombre es igual a:
305
P(G ∩ H) 700 305
P(G|H) = = 410 = = 74.39 %.
P(H) 700
410
b. La probabilidad de que el empleado sea hombre, dado que gana $20,000 ó más es igual a:
305
P(H ∩ G) 700 305
P(H|G) = = 385 = = 79.22 %.
P(G) 700
385
i. P(B|A) > 0.
168 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
iii. P(A1 ∪ A2 ∪ . . . |A) = P(A1 |A) + P(A2 |A) + . . . siempre que A1 , A2 , . . . sean eventos mutuamente
excluyentes.
Nota. Las propiedades i., ii. y iii. de la proposición 7.8.1 indican que P(·|A1 ) es una medida de
probabilidad sobre Ω. Además, la propiedad iii. se puede escribir como
∞
[
! ∞
X
P Ai A = P(Ai |A)
i=1 i=1
Ejemplo 7.8.2. Calcular P(A ∪ B|C) utilizando la información de la gura 7.1 del ejemplo 7.6.1.
Solución:
Como los eventos A y B no son excluyentes, entonces se hace necesario reescribir esta unión como
A ∪ B = (A − B) ∪ B . Teniendo en cuenta que P(·|C) es una medida de probabilidad, se sigue que
De los resultados de la proposición 7.8.1 e incluso de la denición 7.8.1, surge la necesidad de establecer
cómo se puede expresar la probabilidad de la intersección de dos eventos o más eventos a través de la
probabilidad a posteriori.
7.9. TEOREMA DE LA MULTIPLICACIÓN 169
Teorema 7.9.1. Sea Ω un espacio muestral no vacío y A y B dos eventos aleatorios incluidos en Ω.
Entonces se satisface que
P(A ∩ B) = P(A|B)P(B)
Nota. El teorema 7.9.1 se conoce como teorema de la multiplicación . La fórmula que este teorema
sostiene es equivalente a P(A ∩ B) = P(B|A)P(A) donde P(B) > 0. Este hecho se sigue fácilmente
intercambiando A por B y B por A en la fórmula del teorema.
Ejemplo 7.9.1. Una caja tiene diez artículos, de los cuales tres son defectuosos. Se extraen dos
elementos, uno tras otro y sin reemplazo. ¾Cuál es la probabilidad de extraer un artículo defectuoso
seguido de otro defectuoso?
Solución:
Sea A el evento el primer artículo extraído es defectuoso y B el evento el segundo artículo extraído
es defectuoso. Se pide calcular P(A ∩ B).
Debido a que tres de los diez artículos son defectuosos, se tiene que P(A) = 3/10. Como ya se ha
extraído un artículo defectuoso de la caja, entonces quedan en total nueve objetos disponibles, entre
los cuales, hay ahora dos defectuosos. Por lo tanto, P(B|A) = 2/9 y también
3 2
P(A ∩ B) = P(A)P(B|A) = × = 0.06666.
10 9
En consecuencia, la probabilidad de extraer un artículo defectuoso seguido de otro defectuoso es
0.06666.
En seguida se presenta un ejemplo tomado de Hogg, McKean & Craig (2005, p. 26) en el que se
ilustran varios aspectos de la probabilidad condicional:
Ejemplo 7.9.2. Se quiere investigar el porcentaje de niños abusados en cierta población. Los eventos
de interés son: el niño fue abusado (A), y su complemento, el niño no fue abusado (N = AC ). Para los
propósitos de este ejemplo, se asume que P(A) = 0.01 y, por lo tanto, P(N ) = 0.99. La clasicación
sobre si el niño fue o no abusado está basada en el dictamen médico de un doctor. Algunas veces
los doctores clasican un niño que sí fue abusado como si éste no hubiera sido abusado (ND ), y
otras veces los doctores clasican un niño que no fue abusado como si éste sí hubiera sido abusado
(AD ). Las probabilidades de estos errores de clasicación son P(ND |A) = 0.04 y P(AD |N ) = 0.05; y
además, las probabilidades de que los doctores tomen las decisiones acertadas son P(AD |A) = 0.96 y
P(ND |N ) = 0.95. Se quiere determinar la probabilidad de que un niño tomado al azar sea clasicado
por un doctor como abusado.
Solución:
170 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Como un niño puede ser clasicado por un doctor como abusado en dos eventualidades, a saber,
A ∩ AD o N ∩ AD , entonces se tiene que
P(AD ) = P((A ∩ AD ) ∪ (N ∩ AD ))
= P(A ∩ AD ) + P(N ∩ AD )
= P(AD |A)P(A) + P(AD |N )P(N )
= (0.96)(0.01) + (0.05)(0.99)
= 0.0591
que corresponde a una cifra considerable comparada con la probabilidad de que un niño haya sido
abusado. Además, la probabilidad de que un niño haya sido abusado dado que el doctor lo clasico
como abusado es
P(A ∩ AD ) (0.96)(0.01)
P(A|AD ) = = = 0.1624
P(AD ) 0.0591
que es baja. De la misma manera, la probabilidad de que un niño no haya sido abusado dado que
el doctor lo clasico como abusado es 0.8376. La razón por la cual se tiene estas probabilidades tan
desconcertantes, es porque la probabilidad de los errores de los doctores son muy altos en comparación
con la fracción de la población que fue abusada. Una investigación como esta puede resultar en un
mejor entrenamiento de los doctores para clasicar niños que han sido abusados.
Proposición 7.9.2. Sea Ω un espacio muestral no vacío y A1 , A2 , . . . , An eventos aleatorios incluidos
en Ω. Entonces se satisface que
Ejemplo 7.9.3. Un corredor de bolsa está seguro de tener la fórmula para obtener grandes dividendos
basado en los siguientes eventos: inversiones de alto riesgo (R), inversiones con un capital inicial
de dos millones de dólares (C ) y inversiones con ganancias mayores al 184 % (G). El inversionista
cree que la probabilidad de obtener ganancias mayores al 184 % es mayor a 0.7 si previamente se hace
una inversión de dos millones de dólares y se intenta una inversión de alto riesgo. Esta premisa la
obtuvo basándose en las siguientes probabilidades: P(R) = 0.25, P(C|R) = 0.05 y P(R ∩ C ∩ G) = 0.01.
Comprobar lo que asegura el corredor de bolsa.
Solución:
Se debe comprobar si efectivamente se cumple que P(G|R ∩ C) > 0.7. Siguiendo la proposición 7.9.2
se obtiene que P(R ∩ C ∩ G) = P(R)P(C|R)P(G|R ∩ C) de donde
P(R ∩ C ∩ G) 0.01
P(G|R ∩ C) = = = 0.8.
P(R)P(C|R) (0.25)(0.05)
Por lo tanto, la propuesta del inversionista es correcta.
7.10. TEOREMA DE LA PROBABILIDAD TOTAL 171
n
X
P(A) = P(Ei )P(A|Ei ).
i=1
Demostración:
A = (A ∩ E1 ) ∪ (A ∩ E2 ) ∪ . . . ∪ (A ∩ En ).
P(A) = P((A ∩ E1 ) ∪ (A ∩ E2 ) ∪ . . . ∪ (A ∩ En ))
= P(A ∩ E1 ) + P(A ∩ E2 ) + . . . + P(A ∩ En )
= P(E1 )P(A|E1 ) + P(E2 )P(A|E2 ) + . . . + P(En )P(A|En )
Xn
= P(Ei )P(A|Ei )
i=1
Ejemplo 7.10.1. Una compañía dedicada al transporte público emplea tres líneas de una ciudad, de
forma que el 60 % de los autobuses cubre el servicio de la primera línea, el 30 % cubre la segunda y el
10 % cubre el servicio de la tercera línea. Se sabe que la probabilidad de que, diariamente, un autobús
se averíe en cada línea es del 2 %, 4 % y 1 % respectivamente. Determinar la probabilidad de que, en
un día, un autobús sufra una avería.
Solución:
Sea Ei el evento el autobús cubre el servicio de la línea i con i = 1, 2, 3, del tal forma que, E1 es el
evento el autobús cubre el servicio de la línea 1, por ejemplo. Sea A el evento el autobús sufre una
avería. De acuerdo con el teorema de la probabilidad total y teniendo en cuenta las probabilidades
dadas se tiene que
3
X
P(A) = P(Ei )P(A|Ei )
i=1
172 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Por consiguiente, la probabilidad de que, en un día, un autobús sufra una avería es 0.025.
Ejemplo 7.10.2. Una empresa elabora sus productos en cuatro fábricas, a saber, fábrica 1, fábrica
2, fábrica 3 y fábrica 4. El porcentaje de producción total que se elabora en cada fábrica es del 40 %,
30 %, 20 % y 10 % respectivamente, y además el porcentaje de envasado incorrecto en cada fábrica es
del 1 %, 2 %, 7 % y 4 %. Tomando un producto de la empresa al azar, ¾cuál es la probabilidad de que
se encuentre envasado de forma incorrecta?
Solución:
Sea A el evento el producto está envasado defectuosamente y Fi el evento el envase proviene de la
fábrica i con i = 1, 2, 3, 4. Cada producto puede provenir de cada una de las cuatro fábricas. Según
el teorema de la probabilidad total y teniendo en cuenta las probabilidades dadas se obtiene que
4
X
P(A) = P(Fi )P(A|Fi )
i=1
= P(F1 )P(A|F1 ) + P(F2 )P(A|F2 ) + P(F3 )P(A|F3 ) + P(F4 )P(A|F4 )
= (0.4)(0.01) + (0.3)(0.02) + (0.2)(0.07) + (0.1)(0.04)
= 0.028.
Ejemplo 7.10.3. Un grupo de investigadores tienen cinco estanques en los que mantienen a diferentes
grupos de tortugas de la misma especie con las mismas características pero que provienen de diferente
madre. El grupo está interesado en conocer el comportamiento de las tortugas cuando cambia su
ambiente inicial (estanque y tortugas compañeras) al transferirlas a otro ambiente diferente; las
probabilidades de que una tortuga fuera colocada en un estanque particular eran P(E1 ) = 0.3, P(E2 ) =
0.2, P(E3 ) = 0.15, P(E4 ) = 0.15 y P(E5 ) = 0.2 donde Ei es el evento una tortuga es colocada en
el estanque i con i = 1, 2, 3, 4, 5. Cuando empezaron a realizar el experimento se dieron cuenta que
las tortugas se estaban muriendo en unos estanques más que en otros y mediante registros históricos
determinaron que la proporción de muertes de tortugas, de similares condiciones a las de la actual
investigación, eran de 4 %, 3 %, 5 % ,1 % y 7 % respectivamente. Los investigadores quieren conocer cuál
es la probabilidad de que una tortuga de su investigación muera, para comparar si el comportamiento
evidenciado por sus colegas es anormal.
Solución:
Como los estanques crean una partición de la población se pude encontrar la probabilidad de que una
tortuga de la investigación muera (F ) con base en la proporción de las muertes que se tienen en cada
7.11. TEOREMA DE BAYES 173
5
X
P(F ) = P(Ei )P(F |Ei )
i=1
= P(E1 )P(F |E1 ) + P(E2 )P(F |E2 ) + P(E3 )P(F |E3 ) + P(E4 )P(F |E4 ) + P(E5 )P(F |E5 )
= (0.3)(0.04) + (0.2)(0.03) + (0.15)(0.05) + (0.15)(0.01) + (0.2)(0.07)
= 0.041.
Luego, la probabilidad de que una tortuga de la investigación muera es de 0.041 que en realidad no
es una situación que esté fuera de lo normal.
El teorema de Bayes 1
es una técnica muy popular para calcular probabilidades condicionales y
es la base de la teoría estadística bayesiana en donde a partir de un conjunto de probabilidades
llamadas a priori o sin corregir, se calcula un conjunto de probabilidades a posteriori o corregida, que
corresponden a una modicación de las primeras ante la evidencia de que un determinado suceso ha
ocurrido.
Teorema 7.11.1. Sea E1 , E2 , . . . , En una partición de espacio muestral Ω vacío tal que la proba-
bilidad de cada uno de los eventos asociados es distinta de 0 y conocida. También sea A un evento
aleatorio del que se conocen las probabilidades condicionales P(A|E1 ), P(A|E2 ), . . . , P(A|En ). Entonces
la probabilidad del suceso Ej dado el evento A está dada por:
P(Ej )P(A|Ej )
P(Ej |A) = Pn
i=1 P(Ei )P(A|Ei )
1 Fotografía tomada de la página web http://www.ugr.es/~eaznar/fotos_bayes.htm.
174 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
para cada j = 1, . . . , n.
Demostración:
Haciendo uso de la probabilidad condicional y del teorema de la probabilidad total se tiene que para
un j dado se satisface que
P(Ej ∩ A)
P(Ej |A) =
P(A)
P(Ej ∩ A)
= Pn
i=1 P(Ei )P(A|Ei )
P(Ej )P(A|Ej )
= Pn
i=1 P(Ei )P(A|Ei )
para cada j = 1, . . . , n.
Ejemplo 7.11.1. Con la información del ejemplo 7.10.1, calcular la probabilidad de que un autobús
que sufrió una avería haya recorrido la primera línea.
Solución:
Según el teorema de Bayes y teniendo en cuenta las probabilidades dadas se tiene que:
P(E1 )P(A|E1 )
P(E1 |A) = P3
i=1 P(Ei )P(A|Ei )
P(E1 )P(A|E1 )
=
P(E1 )P(A|E1 ) + P(E2 )P(A|E2 ) + P(E3 )P(A|E3 )
(0.6)(0.02)
=
(0.6)(0.02) + (0.3)(0.04) + (0.1)(0.01)
= 0.08955.
En consecuencia, la probabilidad de que un autobús que sufrió una avería haya recorrido la primera
línea es 0.08955..
Ejemplo 7.11.2. Con la información del ejemplo 7.10.2, calcular la probabilidad de que un producto
envasado de forma incorrecta provenga de la primera fábrica.
Solución:
Según el teorema de Bayes y teniendo en cuenta las probabilidades dadas se tiene que:
P(F1 )P(A|F1 )
P(F1 |A) = P4
i=1 P(Fi )P(A|Fi )
P(F1 )P(A|F1 )
=
P(F1 )P(A|F1 ) + P(F2 )P(A|F2 ) + P(F3 )P(A|F3 ) + P(F4 )P(A|F4 )
7.12. INDEPENDENCIA ESTADÍSTICA DE EVENTOS 175
(0.4)(0.01)
=
(0.4)(0.01) + (0.3)(0.02) + (0.2)(0.07) + (0.1)(0.04)
= 0.14285.
Por lo tanto, la probabilidad de que un producto envasado de forma incorrecta provenga de la primera
fábrica es 0.14285.
Ejemplo 7.11.3. Continuando con el ejemplo 7.10.3, cierta mañana los investigadores encuentran
una tortuga muerta fuera de los estanques pero necesitan saber de cual estanque es más probable que
haya provenido para mantener el registro de las muertes de la investigación. ¾Cómo se puede resolver
este problema?
Solución:
Se busca el estanque j tal que P(Ej |F ) sea máxima paraj = 1, 2, 3, 4, 5. Por consiguiente, se deben
encontrar primero todas las probabilidades de la forma P(Ej |F ) con j = 1, 2, . . . , 5. Así, se tiene que
P(E1 )P(F |E1 )
P(E1 |F ) = P5
i=1 P(Ei )P(F |Ei )
(0.3)(0.04)
=
(0.3)(0.04) + (0.2)(0.03) + (0.15)(0.05) + (0.15)(0.01) + (0.2)(0.07)
= 0.2926829.
De acuerdo con el teorema 7.9.1, es posible expresar la probabilidad conjunta de dos eventos de
probabilidad no nula como el producto entre la probabilidad de uno de ellos y la probabilidad del otro
sabiendo que ha ocurrido el primero. Si entre dos sucesos no existe ninguna relación cabe esperar que
la expresión sabiendo que no aporte ninguna información.
Nota. A partir de la denición 7.12.1 se observa que el evento A es independiente del evento B si la
probabilidad de A no se ve modicada por la ocurrencia o no ocurrencia de B.
176 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
Ejemplo 7.12.1. Se extrae una carta de una baraja de naipe inglés y luego se devuelve. ¾Son inde-
pendientes los eventos la carta es As (A) y la carta es trébol (B )?
Solución:
Como
4 1
P(A) = =
52 13
y
1
P(A ∩ B) 52 1
P(A|B) = = 13 = .
P(B) 52
13
entonces los eventos A y B son independientes.
i. P(B|A) = P(B).
Ejemplo 7.12.2. Dado que en el ejemplo 7.12.1 se obtuvo que los eventos A y B son independientes
C
entonces en virtud de la proposición 7.12.1 se tiene que la carta no es As (A ) y la carta es
trébol (B ) son eventos independientes, la carta es As (A) y la carta no es trébol (B ) son eventos
C C
independientes y la carta no es As (A ) y la carta no es trébol (B ) son eventos independientes.
Además, se satisface que P(B) = P(B|A) y que P(A ∩ B) = P(A)P(B).
Ejemplo 7.12.3. Un hospital tiene dos ambulancias que trabajan de forma independiente. La pro-
babilidad de que una ambulancia especíca esté disponible cuando se le necesite es 0.94. ¾Cuál es la
probabilidad de que ninguna esté disponible cuando se les necesite? ¾Cuál es la probabilidad de que
por lo menos una ambulancia esté disponible cuando se le necesite?
Solución:
Se dene el evento A como la ambulancia 1 trabaja correctamente y el evento B como la ambulancia
2 trabaja correctamente. Así, el evento ninguna de las dos ambulancias están disponibles está dado
7.13. COMENTARIOS 177
A∪B
De otro lado, el evento por lo menos una ambulancia está disponible está dado por y además
Por lo tanto, la probabilidad de que ninguna esté disponible cuando se les necesite es 0.0036 y la
probabilidad de que por lo menos una ambulancia esté disponible cuando se le necesite es 0.9964.
Ejemplo 7.12.4. En una empresa nanciera un par de empleados discutían sobre los méritos que
se deben realizar para obtener un ascenso. Uno de ellos armaba que había que tener un trabajo
sobresaliente para que lo ascendieran mientras que el otro argumentaba que solo era necesario ser
condescendiente con su jefe para lograr el ascenso y que por tal motivo él no lo había logrado. ¾A
cuál de los empleados se le daría la razón teniendo en cuenta la información de la tabla 7.2?
Solución:
Como la discusión entre los empleados se puede resolver estableciendo si un empleado es ascendido
(A) es independiente de un empleado tiene un trabajo sobresaliente (S ) o de un empleado es
condescendiente con su jefe (C ), entonces para los empleados que tienen un trabajo sobresaliente
10 15 5
P(S)P(A) = 6= P(A ∩ D) =
40 40 40
y en consecuencia ser ascendido no es independiente de ser un trabajador sobresaliente; mientras que
para los empleados que son condescendientes
30 15 10
P(C)P(A) = 6= P(A ∩ C) =
40 40 40
y por lo tanto ser condescendiente no es independiente de ser ascendido. Entonces el primer empleado
es quien tiene la razón.
Tabla 7.2: Datos asociados con la clasicación con respecto al asenso y al modo de trabado de un grupo de empleados
de una empresa.
7.13. Comentarios
Uno de los conceptos más importantes en la estadística es la probabilidad, que a su vez se fundamenta
en la teoría de conjuntos, aquella que permite el estudio de un todo (abstracto) por medio de sus
178 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
partes y sus elementos. Una vez se avanza en esta teoría, es posible construir sobre ésta una medida
de incertidumbre respecto al chance de ocurrencia de un evento o suceso, denominada probabilidad.
Además, en este capítulo se muestran algunas de las reglas más usuales para el cálculo de probabilida-
des como el teorema de la probabilidad total y el teorema de Bayes. Por último, se presentan algunas
aplicaciones de la probabilidad cuando dos eventos se relacionan entre sí y cuando son independientes.
7.14. Ejercicios
7.1 Una entidad educativa ha propuesto tres proyectos para la mejora de la educación en cierta región
del país. Parai = 1, 2, 3, se dene Ai como el evento que representa el proyecto i fue aceptado.
Se sabe que P(A1 ) = 0.30, P(A2 ) = 0.22, P(A3 ) = 0.35, P(A1 ∩ A2 ) = 0.08, P(A1 ∩ A3 ) = 0.09,
P(A2 ∩ A3 ) = 0.06, P(A1 ∩ A2 ∩ A3 ) = 0.02. Expresar verbalmente y determinar la probabilidad
de que ocurra cada uno de los siguientes eventos:
a. A1 ∪ A2 .
b. AC C
1 ∩ A2 .
c. A1 ∪ A2 ∪ A3 .
d. AC C C
1 ∩ A2 ∩ A3 .
e. AC C
1 ∩ A2 ∩ A3 .
f. AC C
1 ∩ A2 ∪ A3 .
7.2 La tabla que se muestra a continuación muestra la proporción de adultos de áreas no metropoli-
tanas, clasicados como lectores o no lectores de un periódico y si votaron o no en las elecciones
pasadas.
2. Lea el periódico.
7.3 Se selecciona una muestra de 570 encuestados en una ciudad para obtener información acerca del
comportamiento de los consumidores frecuentes de prendas de vestir. Entre las preguntas estaba:
¾Disfruta usted comprando ropa? De 270 hombres, 165 respondieron que sí, y de 300 mujeres, 224
también respondieron armativamente.
a. (AC ∪ D)C .
b. B ∩ CC .
c. (DC ∩ A)C ∪ C .
d. (ΩC ∩ B)C .
e. B ∩ C ∩ DC .
7.5 Señalar la región del diagrama de Venn que representa cada uno de los siguientes eventos:
C
a. AC ∩ B ∩ C C .
C
b. AC ∩ B C − C C .
c. ((A ∪ B)C ∩ C)C .
d. A − (B ∩ C)C .
e. (A ∪ B ∪ C)C .
7.6 Los estudiantes de un curso de estadística se clasican como estudiantes de administración, eco-
nomía o ingeniería; como repitente o no repitente y también como hombre o mujer. Encuentre el
número total de clasicaciones posibles para los estudiantes de este curso.
b. ¾De cuántas maneras diferentes pueden hacerlo si una de ellas no debe estar al comienzo de la
la?
180 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
7.8 ¾De cuántas maneras se pueden sentar seis magistrados en una mesa redonda si:
7.9 Una caja contiene siete chas rojas, seis blancas y cuatro azules. ¾Cuántas selecciones de tres
chas se pueden formar si:
7.10 Un director de personal tiene ocho candidatos para cubrir cuatro puestos. De éstos, cinco son
hombres y tres mujeres. Si, de hecho, toda combinación de candidatos tiene la misma probabilidad
de ser elegido que cualquier otra, ¾cuál es la probabilidad de que ninguna mujer sea contratada?
7.11 En una bodega, una caja contiene ocho clavos de 1 pulgada, seis de 1 pulgada y media y cinco de
2 pulgadas. Suponga que se seleccionan cuatro clavos al azar, sin reemplazo y sin orden. ¾Cuál es
la probabilidad de que
7.12 ¾Cuántos números de tres cifras se pueden formar con los dígitos 0, 1, 2, 3, 4, 5 y 6 si pueden
haber repeticiones? ¾Cuántos son pares? ¾Cuántos son mayores que 330?
7.13 Un comité de doce personas será elegido entre diez hombres y diez mujeres. ¾De cuántas formas
se puede hacer la selección si:
a. no hay restricciones?
7.14 ¾De cuántas formas diferentes pueden contestarse nueve preguntas de verdadero o falso?
7.15 Un estudiante debe responder siete de diez preguntas de un examen. ¾De cuántas formas puede
hacer su selección si
a. no hay restricciones?
7.16 ¾De cuántas formas es posible distribuir 12 libros diferentes entre cuatro niños de modo que
b. los dos niños mayores reciban cuatro libros cada uno y los dos menores reciban dos libros cada
uno?
7.20 Calcular P(A ∪ B|C) con la información del ejemplo 7.8.2 utilizando la denición de probabilidad
condicional y la información de la gura 7.1.
7.21 Se ha realizado un estudio para un hipermercado donde se clasican los clientes en aquellos
que visitan el establecimiento de una manera frecuente u ocasional y en aquellos que adquieren
regularmente, ocasionalmente o nunca productos alimenticios. La siguiente tabla presenta las
proporciones correspondientes:
c. ¾Son independientes los sucesos nunca compra productos alimenticios y visita el hipermer-
cado frecuentemente?
d. ¾Los eventos clientes no ocasionales, clientes que no compran regularmente productos alimen-
ticios y clientes frecuentes y que compran regularmente productos alimenticios conforman
una partición del espacio muestral? ¾Por qué?
7.22 De un estudio realizado en una universidad, se sabe que el 35 % de los estudiantes hacen deporte
por lo menos una vez a la semana y que el 40 % de los estudiantes tienen una nota media superior
a 4.0. Además, el 30 % de los que hacen deporte por lo menos una vez a la semana tienen una
nota media superior a 4.0.
a. ¾Cuál es la probabilidad de que un estudiante elegido al azar haga deporte por lo menos una
vez a la semana y tenga una nota media superior a 4.0?
b. ¾Cuál es la probabilidad de que un estudiante elegido al azar, que tiene una nota media superior
a 4.0, haga deporte por lo menos una vez a la semana?
c. ¾Cuál es la probabilidad de que un estudiante elegido al azar haga deporte por lo menos una
vez a la semana o tenga una nota media superior a 4.0?
d. ¾Cuál es la probabilidad de que un estudiante elegido al azar, que no tiene una nota media
superior a 4.0, no haga deporte por lo menos una vez a la semana?
182 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
e. ¾Son independientes los eventos hace deporte por lo menos una vez a la semana y tiene una
nota media superior a 4.0? ¾Son mutuamente excluyentes?
7.23 Un analista de bolsa examina las perspectivas de las acciones de un gran número de compañías.
Cuando se investigó el comportamiento de estas acciones un año antes, se descubrió que el 15 %
experimentaron un crecimiento superior al de la media, el 40 % inferior y el 45 % restante se
mantuvieron alrededor de la media. El 30 % de los valores que crecieron por encima de la media
fueron clasicados como buenas adquisiciones por el analista, al igual que el 15 % de las que
crecieron alrededor de la media y el 20 % de las que tuvieron un crecimiento inferior. ¾Cuál es la
probabilidad de que un valor clasicado como buena adquisición por el analista crezca por encima
de la media del mercado?
7.24 Ejercicio tomado de Blanco (2004, p. 42). Se tiene una población que se desarrolla de la siguiente
manera: una partícula inicial, que constituye la 0-ésima generación, tiene 0, 1 o 2 hijas con pro-
babilidades 1/6, 2/3 y 1/6 respectivamente. Luego de reproducirse la partícula muere. Las hijas
se reproducen independientemente unas de otras e independientemente de la historia familiar, de
la misma manera que la partícula original. La primera generación está compuesta por las hijas
de la partícula inicial, la segunda por las nietas y así sucesivamente. Dado que en la segunda
generación hay una partícula, ¾a qué es igual la probabilidad de que en la primera haya habido
dos partículas? ¾Cuál es la probabilidad de que en la segunda generación haya por lo menos una
partícula?
7.25 Los clientes acostumbran evaluar en forma preliminar el diseño de los productos. En el pasado,
95 % de los productos de gran éxito recibieron críticas favorables, 60 % de los productos con un
éxito moderado recibieron críticas favorables y 10 % de los productos sin mucho éxito recibieron
críticas favorables. Además, 40 % de los productos han sido de gran éxito, 35 % han sido de éxito
moderado y 25 % han sido productos sin mucho éxito.
b. Si un producto nuevo obtiene una crítica favorable, ¾cuál es la probabilidad de que será un
producto de gran éxito?
c. Si un producto no consigue una crítica favorable, ¾cuál es la probabilidad de que sea un producto
de gran éxito?
7.26 Ejercicio tomado de Blanco (2004, p. 43). La probabilidad de que en un parto gemelar ambos
bebés sean de género masculino es de 0.32, en tanto que la probabilidad de que sean ambos de
género femenino es de 0.28. ¾A qué es igual la probabilidad de que en un parto gemelar, el segundo
niño en nacer sea de género masculino dado que el primero en nacer es de género masculino? Se
supone que es tan probable que el primer niño en nacer sea de género femenino como de género
masculino.
7.27 Una empresa de venta por correos considera tres posibles errores al enviarse un pedido: el artículo
enviado no es el solicitado (A), el artículo se extravía (B ) y el artículo sufre desperfectos en el
transporte (C ). Se sabe que el suceso
A es independiente de los sucesos B y C y que los sucesos B
y C son mutuamente excluyentes. Las probabilidades de los sucesos son P(A) = 3 %, P(B) = 2 %
y P(C) = 5 %. Para un pedido escogido al azar, calcular la probabilidad de que por lo menos uno
de estos errores ocurra.
7.14. EJERCICIOS 183
7.28 Una editorial quiere decidir si va a publicar un libro de estadística para administración. El análisis
de los libros que se publicaron anteriormente indica que 10 % fueron grandes éxitos, 20 % tuvieron
éxito modesto, 40 % lograron recuperar los gastos de inversión y 30 % fueron un fracaso. Sin em-
bargo, antes de tomar una decisión, se va a realizar un dictamen del libro. En el pasado, 99 % de
los grandes éxitos obtuvieron dictámenes favorables, 70 % de los éxitos modesto obtuvieron dic-
támenes favorables, 40 % de los títulos que alcanzaron a recuperar gastos de inversión obtuvieron
dictámenes favorables y 20 % de los fracasos fueron sometidos a esta clase de dictámenes. ¾Qué
proporción de libros de texto reciben dictámenes favorables?
7.30 Sean AyB dos sucesos tales que la probabilidad de B es el doble que la de A; que la probabilidad
de su unión es el doble que la de su intersección; y que la probabilidad de su intersección es de
0.1. Se pide calcular la probabilidad de A. ¾Qué suceso es más probable que ocurra sabiendo que
ya ha ocurrido el otro?
7.31 Una empresa que debe decidir si adquiere un determinado paquete de acciones, solicita un informe
a tres asesores nancieros para que se pronuncien de forma favorable o desfavorable a la compra.
Por experiencias anteriores en operaciones similares, se sabe que los tres asesores tienen actitudes
ante el riesgo diferente e independiente. Esta situación se reeja en las probabilidades de aconsejar
la compra de este tipo de operaciones que son respectivamente 0.8, 0.5 y 0.3. Con esta información
se pide calcular la probabilidad de que
7.32 Una empresa de trabajo temporal ha realizado un amplio estudio sobre los tipos de empleo solici-
tados por los estudiantes de bachillerato, de formación técnica y universitarios. El informe clasica
estos solicitantes de empleo como calicados o no para los trabajos que solicitan, y de los datos
se desprende que solo el 25 % estaban calicados para el trabajo que solicitaban, de los cuales, un
20 % eran estudiantes universitarios, un 30 % tenían formación técnica y un 50 % eran bachilleres.
La situación entre los no calicados es diferente: un 40 % de ellos era estudiante universitario, otro
40 % estudiaban técnica y solo un 20 % se encontraba en bachillerato.
b. ¾Cuál es la probabilidad de que uno de estos estudiantes que solicitaba empleo estudiara for-
mación técnica?
c. Entre los estudiantes universitarios que solicitaron empleo, ¾qué porcentaje no estaba calicado
para los puestos de trabajo que solicitaban?
184 CAPÍTULO 7. FUNDAMENTOS DE PROBABILIDAD
7.33 Sean A y B dos eventos independientes tales que P(A) = P(B) = 0.05. Calcular:
a. P(A ∩ B).
b. P(A ∪ B).
c. P AC ∩ B C .
d. P AC ∪ B C
.
e. P(A|B).
f. P AC |B C .
8.1. Introducción
Para el desarrollo de técnicas estadísticas más avanzadas, es conveniente relacionar directamente los
resultados de un experimento aleatorio con números reales, ya que con tal asociación el análisis de las
características de interés es más profundo y productivo.
Las variables aleatorias y sus distribuciones de probabilidad se pueden considerar como una generali-
zación del concepto frecuentista de probabilidad. Se introducen como el modelo matemático ideal al
que se aproximan las distribuciones de frecuencias que se obtendrían como resultado de una repetición
indenida de ensayos de un experimento aleatorio.
Las variables aleatorias se clasican de acuerdo a la numerabilidad de los valores que pueden asumir.
Se estudian las variables aleatorias discretas, que solo pueden adoptar un número nito o una innidad
enumerable de valores, y las variables aleatorias continuas, que surgen cuando se investigan variables
cuyos valores están asociados con una escala continua de medición.
Normalmente, los posibles resultados de un experimento aleatorio (Ω) no son valores numéricos. Por
ejemplo, considere el experimento aleatorio que consiste en lanzar de forma ordenada tres monedas al
aire, con el propósito de estudiar el número de caras (c) y sellos (s) que se obtienen. De esta forma,
el espacio muestral asociado a este experimento es:
Ω = {(c, c, c), (c, c, s), (c, s, c), (c, s, s), (s, c, c), (s, c, s), (s, s, c), (s, s, s)}.
Puede resultar más sencillo utilizar valores numéricos en lugar de trabajar directamente con los ele-
mentos de un espacio muestral como el anterior. Así, es preferible identicar los puntos muestrales
185
186 CAPÍTULO 8. VARIABLES ALEATORIAS
{(c, s, s), (s, c, s), (s, s, c)} con el valor numérico 1, pues éste representa el número de caras obtenidas
cuando se ejecuta el experimento.
X : Ω −→ R : ω 7−→ X(ω)
Nota. Las v.a.'s se simbolizan, generalmente, con las letras mayúsculas X, Y y Z. Se utiliza su
correspondiente letra minúscula (x, y, z en este caso) para designar sus posibles valores. Así, por
ejemplo, si X representa la v.a. número de caras obtenido que pueden resultar al lanzar una moneda
tres veces consecutivas, entonces, sus valores son x = 0, 1, 2, 3.
Nota. Como se presenta en Resnick (1998, p. 74) y Gut (2005, p. 25), en la denición formal de una
v.a. se habla de funciones medibles . Este concepto no se presenta en este libro ya que hace parte de
tópicos más avanzados fuera de su alcance.
Ejemplo 8.1.1. Teniendo en cuenta el experimento aleatorio que consiste en lanzar de modo ordenado
tres monedas al aire, se dene la v. a. X como el número de caras obtenido al nal de los tres
lanzamientos. Se obtiene que la v.a. X es una función del espacio muestral
Ω = {(c, c, c), (c, c, s), (c, s, c), (c, s, s), (s, c, c), (s, c, s), (s, s, c), (s, s, s)}
con valores en el subconjunto de números reales {0, 1, 2, 3}. Estos valores se obtienen evaluando X
en cada uno de los puntos muestrales como sigue: X((c, c, c)) = 3, X((c, c, s)) = 2, X((c, s, c)) = 2,
X((s, c, c)) = 2, X((s, s, c)) = 1, X((s, c, s)) = 1, X((c, s, s)) = 1 y X((s, s, s)) = 0.
Anteriormente se ha hecho la distinción entre dos tipos datos numéricos: los discretos y los continuos;
esta misma distinción también se hace con las v.a.'s. Así, en función de los valores que tome la variable,
ésta se puede clasicar como discreta o continua del siguiente modo:
Nota. De la denición 8.1.2 se sigue que el conjunto de valores de una v.a.c. es un conjunto innito
no numerable.
8.1. INTRODUCCIÓN 187
Denición 8.1.3. Sea X una v.a. bien sea discreta o continua. Se dene
el rango de X , denotado con RX , como el conjunto de todos los posibles
valores que puede asumir X. Esto es:
a. Algunos estudiantes de ingeniería ambiental están interesados en conocer la anidad que tienen
las personas hacia la ora y fauna que se encuentra dentro y a los alrededores de la ciudad. Para
esto realizaron una muestra piloto con un cuestionario en el cual se preguntaba: ¾le molestaría
tener que clasicar las basuras de su casa?. Registrando la información en una base de datos,
los estudiantes solo guardan los números del 10 al 13, haciendo alusión a las respuestas mucho,
poco, nada y me es indiferente respectivamente.
b. Una empresa minera está empleando una máquina que permite conocer la densidad del suelo (en
kg/m3 ) a un kilómetro de profundidad. Con esta información, algunos especialistas establecen una
medida continua de riesgo que se encuentra entre 0 (riesgo nulo) y 10 (riesgo total), la cual emplean
para decidir si es segura la extracción del material.
En cada caso, ¾cuál es el experimento aleatorio y cómo está denida la v.a. X de interés?
Solución:
En el primer escenario, el experimento es la respuesta a la pregunta ¾le molestaría tener que clasicar
las basuras en su casa?; por consiguiente el espacio muestral es
En las secciones siguientes se estudian los conceptos más importantes relacionados con las v.a.'s,
diferenciando entre v.a.d.'s y v.a.c.'s.
188 CAPÍTULO 8. VARIABLES ALEATORIAS
Para una v.a.d. X, la probabilidad de que X tome cualquiera de sus valores, se modela a través de
una función denominada función másica de probabilidad (o simplemente función de probabilidad o de
masa). Esta función establece la probabilidad de cada valor que toma la v.a. X.
X = x = {w ∈ Ω : X(w) = x}.
Nota. Si x no es uno de los valores que toma la v.a. X entonces fX (x) = 0. Así, la representación gráca
de la función de probabilidad se realiza mediante un diagrama de barras análogo al de distribución de
frecuencias relativas para variables discretas (detalles en la sección 2.3.2).
Figura 8.1: Gráco de la f.m.p. (a) y de la f.d.a. (b) de la variable del ejemplo 8.1.1.
8.2. VARIABLES ALEATORIAS DISCRETAS 189
Ejemplo 8.2.1. Continuando con el ejemplo 8.1.1 se tiene que la f.m.p. de la variable número de
caras abstenido es:
1
fX (0) = P(X = 0) = P((s, s, s)) = = 0.125,
8
3
fX (1) = P(X = 1) = P({(c, s, s), (s, c, s), (s, s, c)}) = = 0.375,
8
3
fX (2) = P(X = 2) = P({(s, c, c), (c, c, s), (c, s, c)}) = = 0.375, y
8
1
fX (3) = P(X = 3) = P((c, c, c)) = = 0.125.
8
i. fX (0) = 0.125 > 0, fX (1) = 0.375 > 0, fX (2) = 0.375 > 0 y fX (3) = 0.125 > 0, y que
P4
ii. k=1 fX (xk ) = fX (0) + fX (1) + fX (2) + fX (3) = 0.125 + 0.375 + 0.375 + 0.125 = 1 donde x1 = 0,
x2 = 1, x3 = 2 y x4 = 3.
Demostración:
i. Como toda medida de probabilidad es mayor o igual a 0, se sigue que P(X = x) ≥ 0 y por lo
tanto fX (x) ≥ 0 para todo x ∈ R.
ii. Sea RX el rango de X, es decir, RX = {x ∈ R : x = X(w) para algún w ∈ Ω} = {x1 , x2 , . . .}. En
consecuencia, se tiene que
X X
f (xk ) = P(X = xk )
k k
190 CAPÍTULO 8. VARIABLES ALEATORIAS
X
= P({w ∈ Ω : X(w) = xk })
k
!
[
=P {w ∈ Ω : X(w) = xk }
k
= P({w ∈ Ω : X(w) = xk para algún xk ∈ RX })
= P(Ω)
= 1.
Ejemplo 8.2.2. Un laboratorio debe sostenerse a través de los servicios que ofrece a la comunidad.
La cantidad de servicios que presta mensualmente sin tener ninguna ganancia es a lo más siete. Se ha
visto que en un mes se pueden ofrecer hasta 15 servicios en las siguientes proporciones 0 %, 1 %, 3 %,
2 %, 3 %, 5 %, 6 %, 7 %, 6 %, 9 %, 10 %, 20 %, 25 %, 1 %, 1 % y 1 %. El laboratorio quiere determinar
la probabilidad de que, en un mes, no logre sostenerse.
Solución:
Estas proporciones son las probabilidades de que la variable X =cantidad de servicios ofrecidos en el
mes asuma los valores 0, 1, 2, . . . , 15. X asuma del 0 al 7. Esto es:
Se pide la probabilidad de que la
7
X
P(X ≤ 7) = P(X = i)
i=0
= P(X = 0) + P(X = 1) + P(X = 2) + . . . + P(X = 7)
= 0 + 0.01 + 0.03 + 0.02 + 0.03 + 0.05 + 0.06 + 0.07
= 0.27.
Luego, la probabilidad de que en un mes dado el laboratorio no logre sostenerse es de 0.27, por lo que
tendrá que acudir a otras fuentes de nanciación con una probabilidad relativamente alta.
Como en el ejemplo 8.2.2, es natural que en la práctica interese la probabilidad de que una v.a.d. tome
algún valor menor o igual a un límite establecido de antemano, ya que hay varios eventos importantes
cuya probabilidad se calcula de esta manera. Por tal motivo es útil denir una función que de cuenta
de esta probabilidad acumulada. Esta función se denomina función de distribución acumulada (o
simplemente función de distribución) y se dene como sigue:
8.2. VARIABLES ALEATORIAS DISCRETAS 191
Denición 8.2.2. Sea X una v.a.d. que sume los valores x1 , x2 , . . . (ni-
tos o innitos enumerables). La función de distribución acumulada
(abreviado con f.d.a.) de X es la función FX : R −→ [0, 1] denida por
FX (x) = P(X ≤ x)
X
FX (x) = fX (t)
t≤x
donde la suma de la fórmula anterior recorre todos los valores de X que son menores o iguales a t.
También se observa que la f.d.a. está denida para cualquier número real.
Ejemplo 8.2.3. Volviendo al ejemplo 8.1.1, se tiene que la f.d.a. evaluada en los valores que asume
X es:
1
FX (0) = P(X ≤ 0) = fX (0) = = 0.125,
8
1 3 4 1
FX (1) = P(X ≤ 1) = fX (0) + fX (1) = + = = = 0.5,
8 8 8 2
1 3 3 7
FX (2) = P(X ≤ 2) = fX (0) + fX (1) + fX (2) = + + = = 0.875, y
8 8 8 8
1 3 3 1 8
FX (3) = P(X ≤ 3) = fX (0) + fX (1) + fX (2) + fX (3) = + + + = = 1.
8 8 8 8 8
0, si x < 0;
1
8, si 0 ≤ x < 1;
4
FX (x) = 8, si 1 ≤ x < 2;
7,
si 2 ≤ x < 3;
8
1, 3 ≤ x.
si
X
FX (2.7) = fX (t) = fX (0) + fX (1) + fX (2) = 0.875.
t≤2.7
192 CAPÍTULO 8. VARIABLES ALEATORIAS
Proposición 8.2.2. Sea FX una f.d.a. de una v.a.d. X denida sobre un espacio muestral Ω no
vacío. Entonces se satisface que:
donde x− representa el máximo valor que puede asumir X estrictamente menor que x.
iv. Si a y b son números reales tales que a≤b entonces FX (a) ≤ FX (b), es decir, FX es una función
creciente; y además se tiene que
Demostración:
X X
0≤ P(X = xk ) ≤ P(X = xk ) = 1.
xk ≤x k
P(X ≥ x) = 1 − P (X ≥ x)C
= 1 − P {w ∈ Ω : X(w) ≥ x}C
= 1 − P(X ≤ x− )
= 1 − FX (x− )
donde x− representa el máximo valor que puede asumir X estrictamente menor que x.
fX (xk ) = P(X = xk )
k
X k−1
X
= P(X = xi ) − P(X = xi )
i=1 i=1
= P(X ≤ xk ) − P(X ≤ xk−1 )
= FX (xk ) − FX (xk−1 )
= F (xk ) − F (x−
k ).
iv. Si a y b son números reales tales que a≤b entonces FX (a) = P(X ≤ a) ≤ P(X ≤ b) =≤ FX (b),
es decir, FX es una función no decreciente. Ahora, si xq es el mayor valor que asume X tal que
xq ≤ b entonces FX (xq ) = FX (b), en efecto:
Sea xl = a− tal que l ≤ q donde x− el máximo valor que puede asumir X estrictamente menor
que x. Así, se observa que
X
P(a ≤ X ≤ b) = P(X = xk )
xk :a≤xk ≤b
X q
= P(X = xk )
k=l+1
q
X l
X
= P(X = xk ) − P(X = xk )
k=1 k=1
= FX (xq ) − FX (xl )
= FX (b) − FX (a− ).
194 CAPÍTULO 8. VARIABLES ALEATORIAS
Ejemplo 8.2.4. Continuando con el ejemplo 8.2.2, el laboratorio quiere determinar:
a. ¾Cuál es la probabilidad de que en un mes se tengan por lo menos la cantidad de servicios sucientes
para el sostenimiento del laboratorio?
b. Como en muchos meses han tenido que prestar un gran número de servicios, ¾cuál es la probabilidad
de que no presten menos de 13 servicios en un mes?
Solución:
= 1 − F (12)
= 1 − 0.97
= 0.03.
c. Por último, para determinar la probabilidad de que se tengan entre 8 y 12 servicios prestados
inclusive, se debe calcular
= FX (12) − FX (7)
= 0.97 − 0.27
= 0.70.
Como con cualquier otra variable, en variadas ocasiones es de interés encontrar un valor que acumule
cierta proporción de la información. En seguida se generaliza el concepto de percentil para v.a.d.'s:
Denición 8.2.3. Sea X una v.a.d. con f.d.a. FX y p un número real tal
que 0 ≤ p ≤ 100. El percentil p de la distribución de X , denotado con
πp , es el valor más pequeño de X que satisface la siguiente desigualdad:
p
≤ FX (πp ).
100
Nota. En la denición 8.2.3 se emplea una desigualdad ya que para algunos percentiles no se tiene un
p
valor de la variable tal que
100 = FX (πp ). Por esta razón un solo valor de la variable puede ser a la
vez más de un percentil.
Ejemplo 8.2.5. La junta directiva de un hospital quiere mejorar su atención en el horario nocturno de
los pacientes que necesitan de atención quirúrgica inmediata. Para esto, se quiere analizar la variable
X dada por número de pacientes que requieren de atención quirúrgica inmediata reportados entre las
19:00 y las 5:00. El analista encargado asegura que la f.m.p. de X es
(
7x e−7
fX (x) = x! , si x = 0, 1, 2, . . .;
0, en otro caso.
Se pide:
b. Sabiendo que entre las 19:00 y las 5:00 el hospital solo tiene la capacidad de operar en 5 quirófanos,
determinar el porcentaje de jornadas nocturnas en las que se puede atender a todos los pacientes
que lleguen en la noche.
c. Obtener el rango en que se encuentra el número de pacientes que el hospital debe atender en el
50 % de las noches consideradas como más comunes.
d. Gracar la f.d.a. de X.
Solución:
196 CAPÍTULO 8. VARIABLES ALEATORIAS
a. El valor µ̃X que se quiere precisar es el percentil 50, es decir, la mediana. Como X es una v.a.d
entonces µ̃X es el valor más pequeño de X que satisface la desigualdad
µ̃X x −7
X 7 e
0.5 ≤ FX (µ̃X ) = .
x=0
x!
5
X 7x e−7
P(X ≤ 5) = = 0.3007,
x=0
x!
y por lo tanto solo en el 30 % de las noches el hospital puede atender a todos los pacientes que
llegan en la jornada nocturna.
Cuando la variable objeto de estudio es continua, no hace sentido hacer una suma de las probabilidades
de cada uno de los términos en el sentido de las variables discretas, ya que el conjunto de valores
8.3. VARIABLES ALEATORIAS CONTINUAS 197
que toma una variable continua es no numerable. En este caso, se generalizan de modo natural los
R P
conceptos, empleando la integral ( ) en lugar de la suma ( ).
La f.m.p. de una v.a.d. esta asociada con la probabilidad de que la variable tome un valor especíco.
Este concepto no es relevante en el caso de una v.a.c., ya que, como se verá más adelante, en este
caso la probabilidad de obtener un valor especíco es exactamente 0. Sin embargo, se puede construir
una función análoga para una variable continua, llamada función de densidad de probabilidad, que
permite investigar detalladamente la estructura probabilística de la variable de interés.
198 CAPÍTULO 8. VARIABLES ALEATORIAS
Z +∞
f (x) dx = 1.
−∞
donde xmı́n y xmáx son respectivamente el valor máximo y mínimo de la variable X. En la gura 8.3
se presenta un ejemplo de una gráca de una f.d.p. de una v.a.c. X.
Nota. Una v.a.c. que satisface las condiciones de la denición 8.3.1 también se denomina v.a. abso-
lutamente continua.
Al igual que en el caso discreto, hay situaciones en las cuales se quiere calcular la probabilidad de
que el valor observado de una v.a.c. X sea menor o igual que algún número real dado. Como antes,
escribiendo FX (x) = P(X ≤ x) para cada número real x, se dice que FX es la función de distribución
acumulada (o simplemente función de distribución) de la variable X.
iii. Si a y b son dos números reales tales que a≤b entonces FX (a) ≤ FX (b), es decir F es creciente;
y además se tiene que
P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X ≤ b) = P(a < X < b) = FX (b) − FX (a).
200 CAPÍTULO 8. VARIABLES ALEATORIAS
d 0
fX (x) = FX (x) = FX (x)
dx
0
donde FX (x) es la derivada de FX (x) respecto a x.
Demostración:
Z t Z x Z ∞ Z ∞
FX (x) = P(X ≤ x) = fX (t)dt ≤ fX (t)dt + fX (t)dt = fX (t)dt = 1.
−∞ −∞ x −∞
= 0.
y también
Z x
lı́m FX (x) = lı́m fX (t)dt
x→∞ x→∞ −∞
Z ∞
= fX (t)dt
−∞
= 1.
y por lo tanto
= P(X > x) + 0
= P(X > x)
= 1 − P (X > x)C
FX (a) = P(X ≤ a)
Z a
= fX (x)dx
−∞
Z a Z b
≤ fX (x)dx + fX (x)dx
−∞ a
Z b
= fX (x)dx
−∞
= P(X ≤ b)
= FX (b).
y además
d 0
fX (x) = FX (x) = FX (x)
dx
0
donde FX (x) es la derivada de FX (x) respecto a x.
202 CAPÍTULO 8. VARIABLES ALEATORIAS
Nota. Más detalles acerca de la demostración del numeral iv. de la proposición 8.3.1 se pueden en-
contrar en Rudin (1976, p. 133).
Ejemplo 8.3.1. Sea X la v.a. que representa el tiempo (en minutos) que tarda un empleado en
realizar una tarea. Para el caso especíco de una empresa de consultoría determinada, la f.d.p. de la
variable X es: (
ke−x , si x > 0;
fX (x) =
0, si x ≤ 0.
Se pide:
a. Calcular el valor de k.
c. Hallar FX (x).
0
d. Comprobar que FX (x) = fX (x).
Solución:
R∞
a. Como fX es una función de densidad de probabilidad entonces se cumple que
−∞
fX (x)dx = 1.
Luego, se sigue que
Z ∞ Z 0 Z ∞
fX (x)dx = 0dx + ke−x dx
−∞ −∞ 0
Z ∞
−x
=0+k e dx
0
∞
= k −e−x 0
= k lı́m −e−x − (−e−0 )
x→∞
= k(0 − (−1))
= k.
R∞
En virtud de que
−∞
fX (x)dx = k , se concluye que k=1 y por lo tanto
(
e−x , si x > 0;
fX (x) =
0, si x ≤ 0.
b. Toda función de densidad debe ser tal que fX (x) ≥ 0 para todo número real x, y en efecto, en este
caso para todas lasx < 0 se tiene que fX (x) = 0 y para todas las x ≥ 0 se tiene que fX (x) = e−x > 0
−x
dado que el valor de e siempre es positivo sin importar el valor del exponente. Además, si fX es
R∞
una función de densidad se debe satisfacer que
−∞ X
f (x)dx = 1, como se muestra en seguida:
Z ∞ Z 0 Z ∞
fX (x) dx = 0dx + e−x dx
−∞ −∞ 0
Z ∞
= e−x dx
0
∞
= −e−x 0
= lı́m −e−x − (−e−0 )
x→∞
= 0 − (−1)
=1
Z x
FX (x) = fX (t) dt
−∞
Z x
= e−t dt
0
x
= −e−t 0
= −e−x − (−e−0 )
= 1 − e−x
0 d
1 − e−x
FX (x) =
dx
d d −x
= (1) − e
dx dx
−x
=0− e (−1)
= 0 + e−x
= e−x .
Así,
(
0 e−x , si x > 0;
FX (x) =
0, si x ≤ 0.
P(X ≥ 5) = 1 − FX (5)
= 1 − (1 − e−5 )
= 1 − 1 + e−5
= e−5
= 0.00674.
8.3. VARIABLES ALEATORIAS CONTINUAS 205
= e−2 − e−5
= 0.12860.
a. Hallar la probabilidad de que una célula se demore más de 5 minutos en encontrar el alimento.
b. Encontrar la función de densidad de X (esto permite analizar qué tiempos son los más ocurrentes).
Solución:
a. Como se ha propuesto la f.d.a. de X entonces la probabilidad que se busca está dada por:
P(X > 5) = 1 − FX (5) = 1 − 1 − e−5/5 = 0 + e−1 = 0.3678,
y por lo tanto se entiende que es más probable que la próxima célula en encontrar el alimento se
demore menos de 5 minutos.
0 d 1
FX (x) = 1 − e−x/5 = −e−x/5 (−1/5) = e−x/5 .
dx 5
0
Ahora, como la derivada de FX parax ≤ 0 es FX (x) = 0, entonces la f.d.p. de X está dada por:
1 −x/5
fX (x) = 5e , si x > 0;
0, si x ≤ 0.
206 CAPÍTULO 8. VARIABLES ALEATORIAS
A continuación se presenta la denición de percentil cuando se trata con variables continuas, del mismo
en que se generaliza el concepto de percentil para v.a.d.'s.
p
= FX (πp ).
100
Nota. El percentil p de una variable continua X con 0 ≤ p ≤ 100, corresponde al valor del eje de
medición de X tal que el p% del área bajo la gráca de la f.d.p. de X está a la izquierda de πp y el
(100 − p) % está a la derecha. Como antes, el percentil 50 se denomina mediana y se simboliza con
8.3. VARIABLES ALEATORIAS CONTINUAS 207
µ̃X . Esto es, la mitad del área bajo la gráca de la f.d.p. de X está a la izquierda de µ̃X y la otra
mitad a la derecha de µ̃X . De otra parte, como
Z πp
FX (πp ) = fX (x)dx,
−∞
R πp
en la denición 8.3.3 se acostumbra intercambiar por
xmı́n
f (x)dx cuando xmı́n exista.
Ejemplo 8.3.3. Con la información del ejemplo 8.3.1, calcular e interpretar el percentil 95.
Solución:
95
= FX (π95 )
100 Z
π95
0.95 = e−x dx
0
0.95 = 1 − e−π95
0.95 − 1 = −e−π95
−0.05 = −e−π95
ln(0.05) = ln(e−π95 )
ln(0.05) = −π95 .
Ejemplo 8.3.4. En el caso del ejemplo 8.3.2, se quiere determinar un valor que separe las células
que tuvieron un lapso de tiempo menor en encontrar el alimento de las células que tuvieron un lapso
de tiempo mayor. Este valor debe ser tal que el 50 % de las células se encuentre en cada uno de los
grupos.
Solución:
Como se necesita un valor tal que el 50 % de las células se encuentre en cada uno de los grupos,
entonces se está buscando la mediana de la variable (µ̃X ). Este valor se obtiene mediante el siguiente
procedimiento:
50
FX (µ̃X ) =
100
1 − e−µ̃X /5 = 0.5
1 − 0.5 = e−µ̃X /5
ln(0.5) = −µ̃X /5
−5 ln(0.5) = −µ̃X .
208 CAPÍTULO 8. VARIABLES ALEATORIAS
Luego, el valor de interés es µ̃X = 3.4657 minutos, ya que el 50 % de las células encuentran alimento
antes de que transcurran 3.4657 minutos.
Sobre la distribución de una variable se acostumbra registrar algunas características de interés tales
como la localización, la dispersión, el apuntamiento y la simetría, las cuales se estudian de manera
descriptiva en los capítulos de la Parte I de este libro. Aquí se generalizan estas características por
medio de ciertas cantidades denominadas parámetros , que son objeto de estudio cuando se investiga
el comportamiento de una variable. Enseguida se denen algunos parámetros de uso frecuente, empe-
zando por el valor esperado (esperanza o media), medida que formaliza el concepto de promedio que
se presenta en la sección 3.2.1.
Denición 8.4.1. Sea X una v.a. con f.m.p. fX para el caso discreto o
con f.d.p. fX para el caso continuo. El valor esperado de X , denotado
con E[X], se dene como
P
E[X] = R ∞k xk fX (xk ), si X es una v.a.d.;
−∞
xfX (x)dx, si X es una v.a.c..
P
E[g(X)] = R ∞k g(xk )fX (xk ), si X es una v.a.d.;
−∞
g(x)fX (x)dx, si X es una v.a.c..
Nota. El valor esperado de una v.a. X también se simboliza con µX . Además, se observa que la
denición de E[X] es equivalente a la denición de E[g(X)] cuando g(x) = x.
Nota. Es posible que el valor esperado de una v.a. no exista. Esto sucede cuando la sumatoria o la
integral correspondiente diverge.
Ejemplo 8.4.1. Se lanza un dado corriente una vez. Sea X la v.a. que denota el resultado obtenido
en el lanzamiento. Como X es una v.a.d. entonces es claro que:
X
E[X] = xk fX (xk )
k
6
X 1
= x
x=1
6
1 2 1
= 1· + 2· + ... + 6 ·
6 6 6
8.4. VALOR ESPERADO 209
21
= .
6
Entonces el valor esperado del resultado obtenido es 3.5.
(
e−3 3x
fX (x) = x! , si x = 0, 1, 2, . . .;
0, en otro caso.
Solución:
X
E[X] = xk fX (xk )
k
∞
X e−3 3x
= x
x=1
x!
∞
X 3x
= e−3 x
x=1
x!
∞
X 3x
= e−3
x=1
(x − 1)!
∞
X 3y+1
= e−3
y=0
y!
∞
−3
X 3y
= 3e
y=0
y!
= 3e−3 e3
= 3.
∞
X xi
= ex .
i=0
i!
Ejemplo 8.4.3. Se dispone de un capital de $100,000 para una inversión de un año. El inversionista
está considerando dos opciones: colocar el dinero en el mercado de valores, lo que le garantiza un
ingreso anual jo del 15 %, o un plan de inversión cuya ganancia anual se puede considerar como una
v.a. cuyos valores dependen de las condiciones económicas que prevalezcan. Con base en la historia
pasada del segundo plan, un analista ha determinado los posibles valores de la ganancia (en miles) X
210 CAPÍTULO 8. VARIABLES ALEATORIAS
0.05, si x = 5;
0.10, si x = 10;
0.35, si x = 15;
fX (x) =
0.30, si x = 20;
0.20, si x = 25, 30;
0, en otro caso.
Con base en la ganancia esperada, ¾cuál de los dos planes se debe seleccionar?
Solución:
Si se escoge el primer plan, colocar el dinero en el mercado de valores, la ganancia anual que produce
$100,000 es de $15.000, dado que el ingreso anual es jo y su valor es del 15 %. Para el segundo plan,
sea X la v.a. que representa la ganancia anual (en miles) del inversionista. El valor medio de X es
X
E [X] = xk fX (xk )
k
= (5)(0.05) + (10)(0.10) + . . . + (30)(0.20)
= 23.5.
De acuerdo con lo anterior, el segundo plan es una elección mucho mejor puesto que ofrece una ganancia
esperada de $23,500. Sin embargo, se debe tener cautela en este punto, debido a que $23,500 es apenas
el valor esperado y el inversionista no tiene ninguna garantía de que variabilidad de la ganancia anual
sea mínima.
Ejemplo 8.4.4. La v.a. que representa la proporción de accidentes automovilísticos fatales en una
ciudad, tiene la siguiente f.d.p.:
42x(1 − x)5 ,
si 0 < x ≤ 1;
fX (x) =
0, en otro caso.
Solución:
Z ∞
E[X] = xfX (x)dx
−∞
Z 1
= xfX (x)dx
0
Z 1
x 42x(1 − x)5 dx
=
0
8.4. VALOR ESPERADO 211
Z 1
= 42 x2 (1 − x)5 dx
0
Z 1
= 42 x2 (−x5 + 5x4 − 10x3 + 10x2 − 5x + 1)dx
0
Z 1
= 42 (−x7 + 5x6 − 10x5 + 10x4 − 5x3 + x2 )dx
0
1 8 5 7 10 6 10 5 5 4 1 3 1
= 42 − x + x − x + x − x + x
8 7 6 5 4 3 0
1 5 10 10 5 1
= 42 − + − + − +
8 7 6 5 4 3
1
=
4
Por lo tanto, la proporción media de accidentes automovilísticos fatales es esta ciudad es 25 %.
Ejemplo 8.4.5. Una variable X tiene la siguiente f.d.p.:
2e−2x ,
si x>0;
fX (x) =
0, si x ≤ 0.
Calcular el valor esperado de X.
Solución:
Integrando por partes, haciendo u=x y dv = 2e−2x dx, se obtiene que v = −e−2x y du = dx. Por
consiguiente
Z
E[X] = µX = uv − vdu
Z ∞
∞
= x −e−2x − −e−2x dx
0 0
∞ Z ∞
−2x
= −xe + e−2x dx
0 0
e−2x ∞
lı́m −xe−2x − −0e−0 +
=
−2 0
x→∞
1
lı́m e−2x − e−0
= (0 − 0) −
2 n→∞
1
= − (0 − 1)
2
1
=
2
Esto es, el valor esperado de X es 0.5.
212 CAPÍTULO 8. VARIABLES ALEATORIAS
Nota. Se puede demostrar que si X es una v.a.c. entonces una fórmula alternativa para calcular el
valor esperado de X es
Z ∞ Z ∞
E [X] = (1 − FX (x))dx − FX (−x)dx
0 0
donde FX es la f.d.a. de X.
Proposición 8.4.1. Sea X una v.a. y a, b números reales. Entonces se tiene que:
i. E[a] = a.
n
" # n
X X
E ai Xi = ai E[Xi ]
i=1 i=1
A continuación presenta la demostración para el caso continuo ya que la prueba es análoga para el
caso discreto.
Demostración:
Z ∞ Z ∞
E [a] = afX (x)dx = a fX (x)dx = a(1) = a
−∞ −∞
ii. Utilizando nuevamente la denición del valor esperado, la propiedad i. y desarrollando se tiene
que
Z ∞
E [aX + b] = (ax + b)fX (x)dx
−∞
Z ∞
= (axfX (x) + bfX (x))dx
−∞
8.4. VALOR ESPERADO 213
Z ∞ Z ∞
= axfX (x)dx + bfX (x)dx
−∞ −∞
Z ∞
= axfX (x)dx + b
−∞
Z ∞
=a xfX (x)dx + E [b]
−∞
= aE [X] + b
iii. Aunque la demostración de esta propiedad requiere de conceptos más avanzados, se invita al lector
a ver la demostración de esta propiedad en Hogg, McKean & Craig (2005).
Nota. Dadas las v.a. X, Y y los números reales a y b, de la proposición 8.4.1 se desprende la siguiente
identidad para el caso en que n = 2.
E [aX + bY ] = aE [X] + bE [Y ]
Ejemplo 8.4.6. Una empresa de productos bio-sintéticos está utilizando cierto tipo de reactivos
para aumentar o disminuir la cantidad de proteínas que tienen en un cultivo, de tal manera que
agregar q mililitros de reactivos implica que la población sea ahora de tamaño qP , donde P es el
tamaño de la población inicial. Además de la aplicación de estos reactivos, añaden una cantidad ja
de proteínas ligeramente diferentes para que el conjunto nal de proteínas tenga un balance adecuado
de las cualidades que proporcionan los grupos de proteínas. Si se sabe que la variable número de
individuos en el cultivo inicial de proteínas (X ) tiene una f.m.p. fX con media µX = 3 × 104 entonces
se quiere saber cual debería ser la cantidad en mililitros de reactivos que se deben aplicar para que
la razón esperada entre el número total de proteínas nal y el número agregado de proteínas sea
ligeramente diferente de 2.9, si se agregan 430, 000 de estas últimas proteínas.
Solución:
qX + 430, 000
E [Y ] = E
430, 000
Ahora, como el interrogante se encuentra en la cantidad q en relación a la razón esperada entre los
dos grupos de proteínas, se plantea que E [Y ] = 2.9 de donde
qX + 430, 000
E = 2.9
430, 000
q
E X + 1 = 2.9
430, 000
q
E [X] + 1 = 2.9.
430, 000
Así, despejando para q se obtiene que
430000
q = (2.9 − 1)
E [X]
430000
q = 1.9
3 × 104
q = 27.23333.
Ejemplo 8.4.7. Un par de empresas de construcción tienen pensado realizar una fusión con el n de
aumentar sus ingresos medios, pensando en que la fusión creará un aumento de los ingresos de cada
una de ellas y por ende de los ingresos totales. Según el historial de cada una de las empresas sus
ingresos medios son 1.3 billones y 1.6 billones respectivamente. Los factores en los cuales se quiere que
aumenten los ingresos para cada una de las compañías son de 1.13 y 1.44 respectivamente. Al cabo
de un año las empresas se dieron cuenta que la ganancia media de la fusión fue de 2.84 billones, cifra
menor a lo que se tenía pensado previamente. A pesar de que efectivamente lograron aumentar las
ganancias según los factores que se propusieron, la primera empresa decide cancelar la fusión. ¾Por
qué?
Solución:
Según el planteamiento inicial que tenían las empresas, estas esperaban una ganancia media de la
fusión dada por:
E [1.13X + 1.44Y ]
donde X son las ganancias de la primera empresa y Y las ganancias de la segunda empresa. Por
lo que la ganancia esperada una vez establecida la fusión es de
E [1.13X + 1.44Y ] = 1.13E [X] + 1.44E [Y ] = 1.13 × 1.3 + 1.44 × 1.6 = 3.773.
Ahora, si la primera empresa al darse cuenta que la ganancia media de la fusión fue menor a lo que se
tenía pensado previamente, a pesar de que si se obtuvieron los factores de aumento, se podría pensar
que la segunda empresa mintió sobre su ganancia media dado que
La primera canceló la fusión porque esta cantidad es mucho menor de la que la segunda empresa
reportó al momento de hacer la fusión de las compañías.
8.5. Momentos
Las siguientes dos deniciones son parte fundamental de otras medidas características de las v.a.'s;
por tal razón es esencial que se manejen de forma apropiada y ecaz.
Denición 8.5.1. Sea X una v.a. con f.m.p. fX para el caso discreto
o con f.d.p. fX para el caso continuo. El j -ésimo momento de X para
j = 1, 2, . . ., denotado con µ0j , está dado por
P j
µ0j = R ∞k xkjfX (xk ), si X es una v.a.d.;
−∞
x fX (x)dx, si X es una v.a.c..
Nota. La denición del j -ésimo momento de una v.a. X es un caso particular de E[g(X)] cuando
g(x) = x . Además, se observa que el segundo momento de una v.a. X se simboliza con µ02 y está dado
j
2
por E[X ], esto es:
P 2
0
µ2 = R ∞k xk2fX (xk ), si X es una v.a.d.;
−∞
x fX (x)dx, si X es una v.a.c..
El segundo momento es de uso frecuente en las medidas que describen de dispersión de una variable.
La importancia de los momentos de una distribución radica en la relación que tienen éstos con las
medidas básicas para describir v.a.'s, como la media, la varianza y las medidas de forma, entre otras.
En particular el segundo momento de una v.a. es de gran importancia en la teoría estadística básica
y avanzada.
Solución:
216 CAPÍTULO 8. VARIABLES ALEATORIAS
Se pide calcular el segundo momento de X, es decir, µ02 = E[X 2 ]. Como X es una v.a.c. entonces se
obtiene que
Z ∞
E[X 2 ] = x2 fX (x)dx
−∞
Z 1
= x2 (2x)dx
0
Z 1
=2 x3 dx
0
x4 1
=
2 0
1 4
= (1 − 04 )
2
1
= .
2
Por lo tanto el segundo momento de X es 0.5.
Denición 8.5.2. Sea X una v.a. con f.m.p. fX para el caso discreto
o con f.d.p. fX para el caso continuo. El j -ésimo momento centrado
alrededor de la media de X para j = 1, 2, . . ., denotado con µj , está
dado por
j
P
µj = R ∞k (xk − µX )j fX (xk ), si X es una v.a.d.;
−∞
(x − µX ) fX (x)dx, si X es una v.a.c..
Nota. Como antes, la denición del j -ésimo momento centrado alrededor de la media de una v.a. X
es un caso particular de E[g(x)] cuando g(x) = (x − µX )j .
Ejemplo 8.5.2. Un departamento de ciencias forenses se encuentra ante un caso en el cual los
individuos han muerto debido a diferentes concentraciones de cianuro. En el departamento se hacen
mediciones de estos niveles en cada cuerpo, lo que dene una v.a.c. que asumen tiene la f.d.p. dada
por:
1 3
fX (x) = 5,184 x , si 0 < x < 12;
0, en otro caso.
Si en las mediciones que se han realizado se han dado cuenta que los niveles entre 8 y 12 son los más
frecuentes, ¾la función de densidad propuesta es aceptable? Además, también se quiere determinar
si la concentración en los niveles se está agrupando de manera consistente. Por tal motivo se pide
calcular la medida
E (X − µX )4
ξX = −3
(E [(X − µX )2 ])2
que se espera de como resultado un valor mayor a 3, para así conrmar que los valores tienen una alta
densidad alrededor de la media. Discutir el resultado de esta medida.
8.5. MOMENTOS 217
Solución:
La f.d.p. para concentraciones entre 0 y 12 se puede observar en la gura 8.6, donde se aprecia la alta
frecuencia de los niveles de cianuro entre 8 y 12, luego bajo esta perspectiva, es una f.d.p. aceptable.
µX = E [X]
Z ∞
= xfX (x)dx
−∞
Z 12
1
= x x3 dx
0 5, 184
Z 12
1
= x4 dx
5, 184 0
1 12
= x5
(5)(5, 184) 0
1
= (125 − 05 )
25, 920
= 9.6,
Z ∞
E (X − µX )2 = (x − µX )2 fX (x)dx
−∞
Z 12
1
= (x − 9.6)2 x3 dx
0 5, 184
Z 12
1
= (x − 9.6)2 x3 dx
5, 184 0
Z 12
1 2
= x2 − (2)(9.6)x + 9.62 x3 dx
5, 184 0
Z 12
1
x5 − 19.2x4 + 92.16x3 dx
=
5, 1840
12 !
1 x6 x5 x4
= − 19.2 + 92.16
5, 184 6 5 4 0
6 5
124
1 12 12
= − 19.2 + 92.16
5, 184 6 5 4
= 3.84
y
Z ∞
E (X − µX )4 = (x − µX )4 fX (x)dx
−∞
Z 12
1
= (x − µX )4 x3 dx
0 5, 184
218 CAPÍTULO 8. VARIABLES ALEATORIAS
Z 12
1
x4 − 4x3 µX + 6x2 µ2X − 4xµ3X + µ4X x3 dx
=
5, 184 0
Z 12
1
x7 − 4µX x6 + 6µ2X x5 − 4µ3X x4 + µ4X x3 dx
=
5, 184 0
!
4 12
1 x8 x7 2 x
6
3 x
5
4 x
= − 4µX + 6µX − 4µX + µX
5, 184 8 7 6 5 4 0
!
4 12
1 128 127 12 6
12 5
12
= − 4µX + 6µ2X − 4µ3X + µ4X
5, 184 8 7 6 5 4 0
= 54.51.
E (X − µX )4 54.51
ξX = 2 2
−3= − 3 = 0.6964.
(E [(X − µX ) ]) 3.842
Por lo tanto, según lo sugerido en el ejercicio esta medida por ser mayor a 0 arma la alta densidad
de los niveles de cianuro alrededor del nivel promedio.
0.30
0.25
0.20
f(x)
0.15
0.10
0.05
0.00
0 2 4 6 8 10 12
8.6. Varianza
En el capitulo 4 se introducen algunas medidas descriptivas que dan cuenta de la dispersión de una
variable. En esta sección se dene de manera formal y se profundizan los conceptos de varianza,
desviación estándar y coeciente de variación de una v.a. a través de su distribución probabilística.
Denición 8.6.1. Sea X una v.a. con f.m.p. fX para el caso discreto o con f.d.p.
fX para el caso continuo. Se dene la varianza de X, denotada con Var[X], como
el segundo momento centrado alrededor de la medida de X, esto es:
2
P
VarX = R ∞k (xk − µX )2 fX (xk ), si X es una v.a.d.;
−∞
(x − µX ) fX (x)dx, si X es una v.a.c..
2
Nota. El valor esperado de una v.a. X también se simboliza con σX . Además, se observa que la
denición de Var[X] es equivalente a la denición de E[g(X)] cuando g(x) = (x − µX )2 , es decir, a
µ2 .
La siguiente proposición establece una forma alternativa para calcular la varianza de una variable.
Esta nueva expresión de la varianza que utiliza el segundo momento de la variable puede resultar más
sencilla en muchos casos.
Proposición 8.6.1. 2
Si X es una v.a. entonces se satisface que Var [X] = E X 2 − (E [X]) .
A continuación presenta la demostración para el caso continuo ya que la prueba es análoga para el
caso discreto.
Demostración:
Asumiendo que X es una v.a.c. con f.d.p. fX , empleando la denición de varianza se sigue que
Z ∞
Var [X] = (x − µX )2 fX (x)dx
−∞
Z ∞
x2 − 2xµX + µ2X fX (x)dx
=
−∞
Z ∞
x2 fX (x) − 2xµX fX (x) + µ2X fX (x) dx
=
−∞
Z ∞ Z ∞ Z ∞
= x2 fX (x)dx − 2xµX fX (x)dx + µ2X fX (x)dx
−∞ −∞ −∞
Z ∞ Z ∞
= E X 2 − 2µX xfX (x)dx + µ2X
fX (x)dx
−∞ −∞
220 CAPÍTULO 8. VARIABLES ALEATORIAS
= E X 2 − 2µ2X + µ2x
= E X 2 − µ2X .
Se deja como ejercicio para el lector la demostración en el caso discreto. Sin embargo, a continuación
se una prueba general más simple empleando las propiedades del valor esperado:
Var [X] = E (X − µX )2
= E X 2 − 2XµX + µ2X
= E X 2 − E [2XµX ] + E µ2X
= E X 2 − 2µX µX + µ2X
= E X 2 − µ2X .
Una vez se tienen denidas de manera formal la esperanza µX y la varianza σ2 de una v.a. X, varias
medidas descriptivas mencionadas en capítulos anteriores se formalizan también cuando se calculan
empleando los conceptos formales de media y varianza.
q
σX = 2 .
σX
Ejemplo 8.6.1. Calcular e interpretar el coeciente de variación de la v.a. del ejemplo 8.4.5.
Solución:
Z ∞
E X2 = x2 fX (x)dx
−∞
Z ∞
x2 2e−2x dx
=
Z0 ∞
= 2x2 e−2x dx
0
8.6. VARIANZA 221
1
= .
2
2
2 2 1 1 1
Var [X] = E X − µX = − =
2 2 4
√
y por lo tanto la desviación estándar de X es σX = 0.25 = 0.5. Luego, el coeciente de variación de
X es
σX 0.5
CVX = = = 100 %
µX 0.5
y en consecuencia la dispersión de la variable X es alta con respecto al valor medio.
Ejemplo 8.6.2. Calcular e interpretar el coeciente de variación de la v.a. del ejemplo 8.4.1.
Solución:
Primero se calcula E X2 y se obtiene que
X 2
E X2 = xk fX (xk )
k
6
X 1
= x2
x=1
6
1 1 1
= (0 · ) + (12 · ) + . . . + (62 · )
6 6 6
91
= .
6
Por lo tanto, la varianza de X está dada por:
2
91 21 35
Var [X] = E X 2 − µ2X =
− = .
6 6 12
σX 35
CVX = = 12 = 83.3 %.
µX 21
6
Este coeciente indica que los valores del resultado obtenido en el lanzamiento tienen un alto grado
de heterogeneidad con respecto al valor esperado del lanzamiento. Este hecho se puede anticipar dado
que se tiene un experimento donde todos los resultados son equiprobables.
222 CAPÍTULO 8. VARIABLES ALEATORIAS
Ejemplo 8.6.3. Calcular e interpretar el coeciente de variación de la v.a. del ejemplo 8.4.2.
Solución:
X 2
E X2 = xk fX (xk )
k
∞
X e−3 3x
= x2
x=1
x!
∞
X 3x
= e−3 x2
x=1
x!
∞
X 3x
= e−3 x
x=1
(x − 1)!
∞
X 3y+1
= e−3 (y + 1)
y=0
y!
∞ ∞
( )
y+1 y+1
X 3 X 3
= e−3 y +
y=0
y! y=0
y!
(∞ ∞
)
X 3y+1 X 3y
−3
=e y +3
y=1
y! y=0
y!
( ∞ )
X 3y
= e−3 3 y + 3e3
y=1
y!
= e−3 3e3 E [X] + 3e3
= 12.
Por lo tanto, se obtiene que
Ejemplo 8.6.4. Calcular e interpretar el coeciente de variación de la v.a. del ejemplo 8.5.1.
Solución:
dado que
Z ∞
E X2 = x2 fX (x)dx
−∞
Z1
= x2 (2x)dx
0
Z 1
= 2x3 dx
0
4 1
x
=
2 0
1
= (1 − 0)
2
= 0.5.
Este valor del coeciente indica que la dispersión de la variable es alta con respecto al valor medio.
Proposición 8.6.2. Sea X una v.a. y a, b números reales. Entonces se tiene que:
i. Var [X] ≥ 0.
Demostración:
2
ii. Con facilidad se deduce que Var [a] = E a2 − (E [a]) = a2 − a2 = 0.
Ejemplo 8.6.5. Continuando con el ejemplo 8.4.6, dado que los productos bio-sintéticos de la com-
pañía requieren de altos niveles de precisión, es necesario observar constantemente la variación de sus
componentes, en particular de los componentes bióticos. Por esta razón se quiere comparar analizar
la dispersión del número de proteínas en el cultivo nal respecto al número de proteínas en el cultivo
inicial, teniendo en cuenta que la varianza del número de individuos en el cultivo inicial de proteínas
2
es σX = 19, 600, 000.
Solución:
µZ = E [27.33X + 430, 000] = 27.33E [X] + 430, 000 = 27.33 × 3 × 104 + 430, 000 = 1, 249, 900
8.7. ALGUNAS DESIGUALDADES 225
2
= Var [27.33X + 430000] = 27.332 Var [X] = 27.332 (19, 600, 000) = 14, 639, 806, 440.
σZ
Solución:
Entendiendo la pregunta desde un punto de vista económico y haciendo uso de los coecientes de
variación de las variables, se sigue que
σX 0.1324
CVX =
= = 10.2 %
µX 1.3
y
σY 0.5800
CVY = = = 36.2 %.
µY 1.6
Con esta evidencia, se concluye que la decisión que tomó la primera empresa cancelando la fusión es
correcta, ya que de continuar podría sacricar la regularidad de sus ganancias dada la volatilidad de
las ganancias de la segunda compañía.
Una vez introducido el concepto de probabilidad, media y varianza de manera formal, se puede for-
malizar también la idea presentada en la sección 4.9 sobre la desigualdad de Chebyshev, por medio
de los siguientes teoremas:
226 CAPÍTULO 8. VARIABLES ALEATORIAS
Teorema 8.7.1. Sea X una v.a. tal que el valor esperado y la varianza de X existen y g(X) una
función no negativa. Si E [g(X)] existe entonces para cualquier número real positivo c se tiene que
E [g(X)]
P(g(X) ≥ c) ≤
c
Demostración:
dado que g(X) es una función no negativa. Ahora, como g(x) ≥ c para todo número real x en Ac ,
entonces
Z Z Z
g(x)fX (x)dx ≥ cfX (x)dx = c fX (x)dx = cP(X ∈ Ac ) = cP(g(X) ≥ c)
Ac Ac Ac
y por lo tanto
E [g(X)]
≥ P(g(X) ≥ c).
c
dado que g(X) es una función no negativa. Ahora, como g(x) ≥ c para todo número real x en Ac ,
entonces X X X
g(x)fX (x) ≥ cfX (x) = c fX (x) = cP(X ∈ Ac ) = cP(g(X) ≥ c)
Ac Ac Ac
y por lo tanto
E [g(X)]
≥ P(g(X) ≥ c).
c
8.7. ALGUNAS DESIGUALDADES 227
1
P(|X − µX | < kσX ) ≥ 1 −
k2
o equivalentemente
1
P(|X − µX | ≥ kσX ) ≤
k2
donde k es un número real positivo.
Demostración:
Haciendo g(X) = (X − µX )2 y c = k 2 σX
2
en el teorema 8.7.1 se obtiene que
E (X − µX )2
P (X − µX )2 ≥ k 2 σX
2
≤ 2
k 2 σX
y dado que E (X − µX )2 = σX
2
entonces
1
P((X − µX )2 ≥ k 2 σX
2
)≤ .
k2
Como el evento (X − µX )2 ≥ k 2 σX
2
= |X − µX | < kσX y además k > 0, se concluye que
1
P(|X − µX | ≥ kσX ) ≤
k2
de donde
1
P(|X − µX | < kσX ) ≥ 1 − ,
k2
Nota. El teorema 8.7.2 se conoce como teorema de Chebyshev o desigualdad de Chebyshev.
Ejemplo 8.7.1. Dada una v.a. X con valor esperado µX y varianza
2
σX se quiere obtener un valor a
tal que
P(µX − a < X < µX + a) ≥ 0.75.
2
Además, si σX =1 y a = 3, se pide hallar una cota inferior para
Solución:
1
0.75 = 1 −
k2
228 CAPÍTULO 8. VARIABLES ALEATORIAS
1
= 0.25
k2
1
|k| = √
0.25
|k| = 2.
Ejemplo 8.7.2. Una compañía dedicada al mercado bursátil sabe que para cualquier día la variable
X que representa la ganancia (en miles de millones) del día sigue la f.d.p. dada por:
1 4
3,410 x , si −3 < x < 7;
fX (x) =
0, en otro caso.
Teniendo en cuenta que los valores negativos de la variable representan pérdidas, se quiere determinar:
b. Una cota para la probabilidad de que las ganancias se encuentren a una distancia menor de la
media de tres veces la desviación estándar.
Solución:
a. El valor esperado de X es
Z ∞ Z 7 7
1 1 1
E [X] = xfX (x)dx = x x4 = x6 = (76 − (−3)6 ) = 5.7145
−∞ −3 3, 410 (6)(3, 410) −3 40, 460
y
Z ∞ Z 7 7
1 1 1
E X2 = 2
x2 x4 = x7 = (77 − (−3)7 ) = 34.5927
x fX (x)dx =
−∞ −3 3, 410 (7)(3, 410) −3 23, 870
de donde
Var [X] = 34.59279 − (5.714565)2 = 1.9365.
8.8. FUNCIÓN GENERADORA DE MOMENTOS 229
Se observa que la distancia a la media puede ser por valores de menor o mayor magnitud, por lo
cual tiene sentido el valor absoluto de la diferencia para denotar la distancia.
P(|X − µX | < 3σX ) = P(µX − 3σX < X < µX + 3σX ) = P(5.714 − 4.174 < X < 5.714 + 4.174).
Como
Z 7 7
1 1
P(1.539 < X < 9.888) = P(1.539 < X < 7) = x4 = x5 = 0.9849
1.539 3, 410 (5)(3, 410) 1.539
entonces calculando la probabilidad de manera exacta se tiene que siempre será mayor o igual
que la cota obtenida mediante el teorema de Chebyshev y esta probabilidad puede estar alejada
signicativamente de la cota propuesta, por lo que es necesario ser prudentes con el uso de esta
cota.
Como se ha visto, el valor esperado es de uso frecuente, tanto para denir los momentos de una v.a.,
como para denir la varianza, entre otros parámetros. En esta sección se introduce una versión especial
del valor esperado que permite calcular con facilidad todos los momentos de una v.a. e identicar su
distribución probabilística.
Denición 8.8.1. Sea X una v.a. con f.m.p. fX para el caso discreto o
con f.d.p. fX para el caso continuo. La función generadora de mo-
mentos (abreviado con f.g.m.) de X , denotada con mX (t), se dene
como
mX (t) = E etX
donde t ∈ (−h, h) con h>0 un valor jo para el que E etX existe.
230 CAPÍTULO 8. VARIABLES ALEATORIAS
0.7
0.6
0.5
0.4
f(x)
0.3
0.2
0.1
0.0
−2 0 2 4 6
P txk
E etX = R ∞k e tx fX (xk ), si X es una v.a.d.;
−∞
e fX (x)dx, si X es una v.a.c..
La función generadora de momentos se vuelve una herramienta muy útil para calcular los momentos
de una v.a. al igual que para identicar su distribución probabilística, ya que hay una relación 1-1
entre la f.g.m. y la función de distribución. Sin embargo, se debe tener en cuenta que la f.g.m. no
siempre existe así como el valor esperado.
Teorema 8.8.1.
tX
existe para t ∈ (−h, h) con h > 0. Entonces
Xk una v.a. tal que E e
Sea el
k -ésimo momento E X de X para k = 1, 2, . . ., se puede calcular como la k -ésima derivada de la
f.g.m. evaluada en 0, esto es:
(k)
E X k = mX (0)
(k) dk
donde mX (t) = dtk
mX (t).
8.8. FUNCIÓN GENERADORA DE MOMENTOS 231
Demostración:
Si X es una v.a.d. con f.m.p. fX entonces la función generadora de momentos de X está dada por:
X tx
mX (t) = E etX =
e fX (x).
x
Luego, entendiendo a mX (t) como una función de valor real se tiene que
dk dk X tx X dk X
k
mX (t) = k e fX (x) = k
etx fX (x) = xk etx fX (x)
dt dt x dt
k k
dk X
k 0x
X
xk fX (x) = E X k .
m (t) = x e f (x) =
X X
dtk
t=0
RX x
Por último, si X es una v.a.c. con f.d.p. fX entonces la función generadora de momentos de X está
dada por:
Z ∞
mX (t) = E etX = etx fX (x)dx.
−∞
1
Luego, entendiendo mX (t) como una función de valor real y bajo un resultado del análisis real se
tiene que
∞ ∞
dk dk dk tx
Z Z
tx
mX (t) = e fX (x)dx = e fX (x)dx.
dtk dtk −∞ −∞ dtk
Evaluando en t=0 se tiene que
Z ∞ Z ∞
dk
k 0x
xk fX (x)dx = E xk .
m (t) = x e f (x)dx =
k X X
dt
t=0 −∞ −∞
Ejemplo 8.8.1. Una entidad bancaria está evaluando el servicio que presta en su página web. Uno
de los principales puntos de evaluación es la capacidad de la página para la ejecución de transacciones
virtuales. El número máximo de transacciones por minuto de la página web de esta entidad es 10. Una
variable de interés es el tiempo (en minutos) restante para la siguiente operación nanciera cuya
f.d.p. está dada por:
2e−2x ,
si x > 0;
fX (x) =
0, si x ≤ 0.
Se quiere encontrar la f.g.m. y los dos primeros momentos de la variable para calcular el coeciente
de variación y analizarlos respecto al número máximo de transacciones por minuto.
Solución:
1 El lector ávido puede encontrar en Rudin (1976, p. 236) las condiciones bajo las cuales se puede hacer el intercambio
entre integral y derivada.
232 CAPÍTULO 8. VARIABLES ALEATORIAS
Como
Z ∞
E etX = etX fX (x)dx
−∞
Z ∞
etx 2e−2x dx
=
Z0 ∞
= 2etx−2x dx
0
Z ∞
= 2e−x(2−t) dx
0
∞
2 − t −x(2−t)
Z
= 2 e dx
0 2 −t
Z ∞
2
= (2 − t)e−x(2−t) dx
2−t 0
2 −x(2−t) ∞
= −e
2−t
0
2
= (0 − (−1))
2−t
2
= .
2−t
2
Luego, mX (t) = 2−t para t < 2, en particular para −2 < t < 2. Ahora, como
(1) 2 (2) 4
mX (t) = y mX (t) =
(2 − t)2 (2 − t)3
entonces los primeros dos momentos de la v.a. X son
(1) 2 1 (2) 4 1
mX (0) = 2
= y mX (0) = 3
= .
(2 − 0) 2 (2 − 0) 2
En consecuencia, el coeciente de variación es
√
σX 0.5 − 0.52
CVX = = = 100 %.
µX 0.5
Así, se espera que la página web reciba una nueva transacción cada medio minuto, lo que está dentro
de las capacidades de la página. Sin embargo, dada la alta dispersión respecto al valor medio, se
aconseja optimizar los procesos informáticos para garantizar la eciencia del servicio.
Nota. Queda como ejercicio para el lector justicar detalladamente que
(1) 2 4
mX (t) = y m(2)
x (t) = .
(2 − t)2 (2 − t)3
Proposición 8.8.2.
Sea X una v.a. tal que E etX existe para t ∈ (−h, h) con h > 0. Si a, b son
número reales y Y = aX + b entonces
Demostración:
mY (t) = E eyt
h i
= E e(aX+b)t
= E eaXt+bt
= E eaXt ebt
h i
= ebt E e(aX)t
= ebt mX (at).
Ejemplo 8.8.2. Continuando con el ejemplo 8.8.1, con el transcurrir de los meses la entidad se ha
dado cuenta que el tiempo para que se realice la siguiente transacción a disminuido al 10 % de lo
que era anteriormente. Se quiere determinar los cambios que hubo en la media y en la dispersión de
la variable.
Solución:
Como el tiempo para que se realice la siguiente transacción a disminuido al 10 % de lo que era
anteriormente, entonces la variable objeto de estudio es Y = 0.1X . Como ya se tiene la f.g.m. de X,
basta utilizar la proposición 8.8.2 para obtener mY (t). De esta forma se obtiene que
2
mY (t) = m0.1X (t) = mX (0.1t) = .
2 − 0.1t
2
Como mx (t) = 2−t existe para −2 < t < 2, entonces mY (t) existe para −2 < 0.1t < 2, es decir, para
−20 < t < 20. Ahora, calculando los momentos se sigue que
Luego, se espera que la página web ahora reciba una nueva transacción cada 0.05 minuto, lo cual
se encuentra dentro del valor que la entidad bancaria puede manejar. Sin embargo, el coeciente de
variación continúa reejando una alta dispersión respecto al valor medio, lo que indica que todavía
debe haber un control persistente sobre la eciencia de los procesos de la página.
234 CAPÍTULO 8. VARIABLES ALEATORIAS
2 1
fX (x) = I{−0.5,0.5} (x) + I{−0.1,0.1} (x)
5 10
donde
1, si x ∈ A;
IA (x) =
0, en otro caso.
Además, se estableció que una de las máquinas del proceso ha aumentado las desviaciones en la
cantidad de polietileno en 0.33 unidades. Si antes de tener este cambio esta máquina seguía el mismo
comportamiento de la variable X, ¾cuál es el desvío esperado en la cantidad de polietileno aplicado?
Solución:
(1) 2 1
µX = mX (0) = (0.5 − 0.5) + (0.1 − 0.1) = 0.
5 10
8.8. FUNCIÓN GENERADORA DE MOMENTOS 235
Por consiguiente, la fórmula de ψX para inspeccionar la tendencia de los niveles de polietileno se puede
reescribir como
E X3
ψX =
(E [X 2 ])3/2
y en consecuencia se puede obtener ψX por medio de la f.g.m. calculando el segundo y tercer momento,
como sigue:
(2) 2 1
0.52 e0.5t + 0.52 e−0.5t + 0.12 e0.1t + 0.12 e−0.1t
mX (t) =
5 10
de donde
(2) 2 1
E X 2 = mX (0) = 2 0.52 + 2 0.12 = 0.102,
5 10
y para el tercer momento
(3) 2 1
0.53 e0.5t − 0.53 e−0.5t + 0.13 e0.1t − 0.13 e−0.1t
mX (t) =
5 10
de donde
(3) 2 1
E X 3 = mX (0) = 0.53 − 0.53 + 0.13 − 0.13 = 0.
5 10
Por lo que,
0
ψX = = 0.
(0.102)3/2
Entonces, se puede decir que la frecuencia con la que se da un exceso en la cantidad de polietileno es
igual a la que se obtiene cuando hay un décit respecto a la cantidad óptima de polietileno.
Ahora, para saber la desviación esperada para la máquina con variaciones se considera la variable
Y = X +0.33. Utilizando la f.g.m. de X se obtiene este valor esperado como se muestra a continuación:
(1) 2
mY (t) = (0.33 − 0.5)e(0.33−0.5)t + (0.33 + 0.5)e(0.33+0.5)t
5
1
+ (0.33 − 0.1)e(0.33−0.1)t + (0.33 + 0.1)e(0.33+0.1)t
10
de donde
(1) 2 1
µY = mY (0) = ((0.33 − 0.5) + (0.33 + 0.5)) + ((0.33 − 0.1) + (0.33 + 0.1)) = 0.33.
5 10
Así, se concluye que el cambio en la máquina implica que la media de la desviación en la cantidad de
polietileno aplicado por la máquina sea de 0.33, lo que quiere decir que la máquina está generando
productos con un valor esperado de polietileno mayor al óptimo.
236 CAPÍTULO 8. VARIABLES ALEATORIAS
A continuación se presenta sin demostración un teorema que facilita relacionar de forma directa la
f.g.m. de una v.a. con su distribución probabilística:
Teorema 8.8.3. Sean X y Y v.a.'s cuyas f.g.m.'s existen. Si para todo t se tiene que mX (t) = mY (t)
entonces X y Y tienen la misma distribución probabilística.
Nota. El teorema 8.8.3 permite identicar fácilmente la distribución de una v.a. dada por medio de su
f.g.m., lo que quiere decir que a través de esta función es posible precisar completamente la distribución
probabilística de una variable.
8.9.1. Generalidades
A partir del concepto de v.a. (denición 8.1.1) se puede generar otro tipo de variables aleatorias
mediante la composición o la función de variables, lo cual es de gran utilidad para explorar diversas
características que únicamente se obtienen por medio de transformaciones.
Teorema 8.9.1. Sean X y Y dos v.a.'s tales que X:Ω→R y Y : R → R. Entonces se tiene que:
Ejemplo 8.9.1. Una empresa abrió licitaciones para un proyecto de renovación de laboratorios, la
cual emplea la siguiente ecuación para obtener los puntajes de las empresas que se presentan a la
licitación y de esta forma se pueda adjudicar el contrato:
X1 + 0.5X2 − 3X3
Y =
10
donde X1 , X2 y X3 son respectivamente las v.a.'s que representan los años cumplidos de experiencia,
la cantidad de personal en la empresa y los los años de retraso en la entrega de obras anteriores.
Solución:
Puesto que X1 , X2 y X3 son v.a.'s, en virtud del teorema 8.9.1 se tiene que Y1 = 0.5X , Y2 = 3X3 son
v.a.'s, y por lo tanto Y3 = Y1 − Y2 y Y4 = X1 + Y3 también son v.a.'s. Finalmente, Y = Y104 también
es una v.a..
8.9. FUNCIONES DE VARIABLES ALEATORIAS 237
Ejemplo 8.9.2. En la tabla 8.1 se presentan los puntajes de las empresas que se presentaron a la
licitación del ejemplo 8.9.1.
Empresa X1 X2 X3 Y Z ◦Y
Constructora A 10 24 1.2 18.4 0
Constructora B 9 19 0.5 17.0 0
Constructora C 11 20 0.3 20.1 1
Constructora D 15 34 3.7 20.9 1
Tabla 8.1: Datos asociados con el puntaje de las empresas constructoras participantes en la licitación.
Para determinar qué empresas pasan a la siguiente etapa se tiene un nivel de corte, el cual está dado
por la v.a. Z como sigue:
¾Cuál es la v.a. que muestra que una constructora pasa a la siguiente etapa? ¾Cuáles empresas pasan
el corte?
Solución:
El espacio muestral de la variable Y es Ω = N × N × (R+ ∪ {0}), dado que las primeras dos variables
solamente asumen valores de los número enteros positivos, mientras que la última variable puede
asumir cualquier valor de los números reales positivos. Así, el puntaje de una empresa depende de los
valores que la compañía tome en las variables de estudio.
Una vez obtenido el valor de la variable Y para una empresa determinada, tiene sentido evaluar si
ésta pasa o no el corte con base en el valor registrado. Es decir, la v.a. (Z ◦ Y )(w) = Z(Y (w)) para
cada w ∈Ω es la v.a. de interés. Como se observa en la tabla 8.1, las empresas que pasan el corte
están representadas por el valor 1 en la v.a. Z ◦Y.
Teorema 8.9.2. Si X : Ω → R es una v.a. y f : R → R es una función continua de valor real
entonces f (X) también es una v.a..
Ejemplo 8.9.3. Una de las transformaciones más conocidas y empleadas en la estadística se denomina
estandarización, proceso mediante el cual se obtiene una v.a. con esperado igual a 0 y varianza igual
2
a 1. De modo que si X es una v.a. tal que E [X] = µX y Var [X] = σX entonces
X − µX
Z=
σX
es una nueva v.a. tal que E [Z] = 0 y Var [Z] = 1. Justicar.
238 CAPÍTULO 8. VARIABLES ALEATORIAS
Solución:
Para un gen particular se han encontrado los resultados dados en la tabla 8.2. ¾Cuáles dicultades
puede tener la v.a. X dada por el número de proteínas para determinar bajo qué escenarios la
expresión génica es mayor? Dar una posible solución.
Estimulo X log(X)
pH 100 4.60517
Humedad 45,677 10.72935
Salinidad 137,893,332 18.74199
% de luz 1,245 7.12689
Tabla 8.2: Datos asociados con los valores obtenidos para el número de proteínas producidas por un determinado
gen ante diferentes estímulos.
Solución:
La dicultad para determinar bajo que escenarios la expresión génica es mayor se puede pensar como
la gran variación que tienen los valores de la variable, ya que, la diferencia entre pH y salinidad es de
más de 10 veces la cantidad obtenida en el pH, más sin embargo estas dos cantidades son más de 20
veces menores que los valores obtenidos en humedad y salinidad. Por lo tanto, directamente con estas
cantidades es complicado analizar bajo que estímulos hay una mayor expresión genética.
Una posible solución consiste en estandarizar las variables, sin embargo, como se observa en el ejemplo
8.9.3, puede que la estandarización elimine información relevante para el análisis o no logre resolver
8.9. FUNCIONES DE VARIABLES ALEATORIAS 239
el problema. Por lo tanto, otra posible alternativa es el uso de la función logaritmo, la cual reduce
la distancia entre las cantidades transformadas como se observa en la tabla 8.2, y además como la
función logaritmo es una función continua sobre los números reales positivos, entonces log(X) también
es una v.a., y por tal motivo es posible analizar estadísticamente la expresión genética a través de esta
transformación.
Asumiendo que se tiene una transformación g(X) de una v.a. X , la cantidad Y = g(X) también puede
ser una v.a. según sean las especicaciones de g(X). Por consiguiente, si Y es una v.a. entonces hace
sentido preguntarse por la distribución probabilística de Y . A continuación se presentan un par de
alternativas para deducir la distribución de una función de una v.a. X :
ii. Si X es una v.a.c. con f.d.p. fX y Y = g(X) entonces se utiliza el siguiente teorema:
Teorema 8.9.3. Sea X una v.a.c. con f.d.p. fX y Y = g(X) una función diferenciable de X
uno-a-uno sobre RX . Si X = g −1 (Y ) denota la función inversa de g(X) entonces la f.d.p. de Y
está dada por:
dx
fY (y) = fX (g −1 (y))
dy
dx d −1
donde dy = dy g (y) .
Demostración:
Como g(X) es invertible y continua, entonces g(X) es monótona
creciente o monótona decreciente.
Si g(X) que es monótona creciente entonces dx dy = dx y además
dy
de donde
d d d dx
fY (y) = FY (y) = FX (g −1 (y)) = fX (g −1 (y)) g −1 (y) = fX (g −1 (y)) .
dy dy dy dy
dx
Ahora, si g(X) es monótona decreciente entonces − dx
dy = dy
y además
de donde
d d d dx
fY (y) = FY (y) = (1 − FX (g −1 (y))) = −fX (g −1 (y)) g −1 (y) = fX (g −1 (y)) .
dy dy dy dy
Así, se obtiene la igualdad en cualquiera de los dos casos.
Ejemplo 8.9.5. Con la información del ejemplo 8.2.2, se quiere una variable Y que divida en tres
escenarios el sostenimiento del laboratorio como sigue:
Solución:
Puesto que
Ejemplo 8.9.6. Continuando con el ejemplo 8.5.2, el departamento de ciencias forenses tiene la
hipótesis de que este envenenamiento proviene del suministro de agua potable, lo cual los tiene un
tanto preocupados ya que últimamente las concentraciones que han encontrado son mucho mayores;
de hecho han planteado que en este momento la nueva variable que mide la concentración de esta
sustancia es Y = X 2. ¾Cuál es la probabilidad de que encuentren niveles de cianuro mayores a 2 en el
suministro de agua potable?
Solución:
Dado que se quiere establecer P(Y > 2), se necesita la f.d.p. de Y y dado que X es una v.a.c. y
Y = X2 es una transformación continua, uno-a-uno e invertible en RX entonces por el teorema 8.9.3
√
para valores de Y = X2 tales que 0< y < 12 se tiene que
√ d √
fY (y) = fX ( y) y
dy
√ 1
= fX ( y) 1/2
2y
1 √ 3 1
= ( y) 1/2
5, 184 2y
3/2
1 y
=
2 × 5, 184 y 1/2
1
= y 3/2−1/2
10, 368
1
= y
10, 368
de donde 1
fY (y) = 10,368 y si 0 < y < 144;
0, en otro caso.
Ahora, como el rango de X es RX = {x : 0 < x < 12} entonces el rango de Y es RY = {y : 0 < y <
144}, y por lo tanto
144
y2 1442 − 22
Z 144
1
P(Y > 2) = ydy = = = 0.999807.
10, 368 (2)(10, 368) 2 20, 736
2
8.10. Comentarios
El término modelamiento es uno de los más empleados en la disciplina estadística, porque hace
referencia a la asunción de que un fenómeno particular tiene un comportamiento descrito por algún
242 CAPÍTULO 8. VARIABLES ALEATORIAS
constructo matemático o estadístico determinado. Un ejemplo muy sencillo, pero a la vez muy ilus-
trativo es el modelamiento del resultado del lanzamiento de un dado, el cual es modelado mediante
una v.a. que sigue una distribución donde todos los resultados son igualmente probables (detalles
en la sección 9.2). Este capítulo introduce las primeras nociones involucradas con el modelamiento,
partiendo de los fundamentos de las variables aleatorias, hasta la formalización de los conceptos de
media y varianza, entre otros.
Así, en este capítulo se hace énfasis en el concepto de variables aleatoria, las diferencias entre las
variables discretas y continuas, las distribuciones probabilísticas (de masa, de densidad y acumuladas)
y la función generadora de momentos. Estos aspectos teóricos son de vital importancia para aquellos
que deseen hacer un buen uso de la estadística y comprender modelos más interesantes y sosticados.
8.11. Ejercicios
8.1 Identicar si las siguientes v.a.'s son discretas o continuas:
c. El tiempo requerido por un bus de una ruta determinada para realizar un trayecto dado.
g. El tiempo que dura un semáforo, de una determinada esquina en la ciudad, en cambiar de rojo
a verde.
8.2 Tres personas tienen entrevistas programadas para empleo durante vacaciones. En cada caso, el
resultado de la entrevista será que les ofrezcan empleo o no. Los resultados experimentales se
denen en función de los resultados de las tres entrevistas.
b. ¾La v.a. dada por la cantidad de ofertas hechas es una v.a. discreta o continua?
c. Indicar el valor de esta variable para cada uno de los puntos muestrales.
8.4 ¾Por qué el porcentaje exacto de noches en el numeral c. del ejercicio 8.2.5 es igual a 82 %?
8.6 Una empresa, que atiende pedidos por correo, tiene cinco líneas telefónicas. Sea X la v.a. que
representa el número de líneas en uso en un momento especíco. La f.d.p. de X está dada en la
siguiente tabla:
x 0 1 2 3 4 5
fX (x) 0.20 0.25 0.10 0.15 0.09 fX (x6 )
a. Calcular x6 .
b. Determinar y representar la f.d.a. de X y con esta calcular la probabilidad de cada uno de los
siguientes eventos:
8.7 Una empresa de electrodomésticos ofrece a sus clientes diferentes opciones para el pago de sus
cuotas. Para un cliente seleccionado al azar, sea X la v.a. que representa el número de meses
entre pagos sucesivos. La f.d.a. de X es
0.00, si x < 1;
0.39, si 1 ≤ x < 4;
0.53, si 4 ≤ x < 6;
FX (x) =
0.69, si 6≤x<8
0.80, si 8 ≤ x < 12;
1.00, si 12 ≤ x.
a. Determinar la f.m.p. de X.
b. Calcular la probabilidad de que el número de meses entre pagos sucesivos:
8.8 Determinar y justicar si las siguientes funciones son posibles ejemplos de funciones de densidad
de una v.a.c. X:
a. b.
( (
x
2, si 0 ≤ x ≤ 2; 5, si 0 ≤ x ≤ 2;
fX (x) = fX (x) =
0, en otro caso. 0, en otro caso.
244 CAPÍTULO 8. VARIABLES ALEATORIAS
c. ( d. (
e−x , si x > 0; −ex , si x > 0;
fX (x) = fX (x) =
0, en otro caso. 0, en otro caso.
Determinar el valor de k.
8.10 Considerar la v.a. X que representa las utilidades diarias (en millones de pesos) de una empresa
que pertenece a un sector económico determinado. La f.d.p. de X está dada por:
( 1 2
xe− 2 x , si x > 0;
fX (x) =
0, en otro caso.
b. Encontrar la f.d.a. de X.
c. ¾Cuál es la probabilidad de que las ganancias
a. ¾Cuál es el rango de X?
b. ¾La variable es discreta o continua?
8.12 La duración en horas que un empleado tarda en hacer una tarea determinada es una v.a. X con
f.d.a. dada por:
( 1
1 − e− 20 x , si x > 0;
FX (x) =
0, en otro caso.
a. Hallar la f.d.p. de X.
8.11. EJERCICIOS 245
b. Calcular la probabilidad de que la duración del empleado haciendo la tarea exceda las 50 horas.
8.13 Un distribuidor de computadores, vende tres modelos diferentes de computadores con capacidad
de 200 GB, 250 GB y 300 GB del disco duro. Sea X la v.a. que representa a la cantidad de
espacio del disco duro de un computador comprado por el siguiente cliente. La f.m.p. de X está
dada por:
a. Calcular x3 .
b. Calcular e interpretar E[X] y CVX .
c. Si el precio de un computador con capacidad X GB de disco duro es Y = 15X − 3, calcular e
interpretar E[Y ] y CVY .
d. Mientras la capacidad nominal de un computador es X, la capacidad real es Z = X2 − X.
Calcular e interpretar E[Z] y CVZ .
8.15 Una empresa compra varios computadores último modelo al nal de cada año. El número exacto
depende de la frecuencia de reparaciones en el año anterior. Sea X la v.a. que representa el número
de computadores último modelo que la empresa compra al nal cada año. La f.m.p. de X está
dada por:
x 0 1 2 3
fX (x) 1/4 3/16 1/4 x4
a. Calcular el x4 .
b. Calcular e interpretar E[X] y CVX .
c. Si el costo del modelo que se desea permanece jo a $2,830,451 a lo largo de este año y se
2
obtiene un descuento de $100,000X en cualquier compra, ¾cuánto espera gastar esta empresa
en nuevos computadores al nal de este año?
8.16 Una compañía fabrica paquetes de minas para portaminas. El número de minas por paquete
varía, como se indica en la tabla de abajo. El costo (en pesos) de fabricar un paquete de minas es
2X + 1, 000, donde X es el número de minas por paquete. El ingreso por la venta de un paquete,
independientemente del número de minas que contenga, es de $3,000. Si el benecio se dene como
la diferencia entre el ingreso y el costo, hallar e interpretar la media y el coeciente de variación
del benecio por paquete.
246 CAPÍTULO 8. VARIABLES ALEATORIAS
Número de minas 7 8 9 10 11 12 13
Porcentaje 0.21 0.29 0.03 0.20 0.10 0.04 0.13
2
8.17 Demostrar que si X es una v.a. entonces E X 2 ≥ (E [X]) .
8.18 Si la utilidad diaria (en millones de pesos) de un distribuidor de computadores se puede ver
como una v.a. X cuya f.d.p. está dada por:
(
2(3−x)
5 , si 0 < x < 1;
fX (x) =
0, en otro caso.
b. ¾Cuál es la ganancia media por computador del distribuidor si la ganancia en cada uno está
dado por 2X 2 + 2X + 1?
8.19 Un vendedor recibe un salario anual de $12,000,000, más un 5 % del valor de las ventas que
realiza. Las ventas anuales pueden representarse mediante una v.a. con media $20,000,000 de
pesos y desviación típica de $2,000,000. Hallar la media y el coeciente de variación del ingreso
anual de este vendedor.
0, si x < −2;
0.4, si −2 ≤ x < 0.5;
FX (x) =
0.8, si 0.5 ≤ x < 3;
1, x ≥ 3.
si
a. Hallar la f.m.p. de X.
b. Calcular E[X] y CVX .
8.21 Sea X una v.a. que representa las utilidades diarias (en millones de pesos) de una empresa. Esta
variable tiene f.d.p. dada por:
0.1, si −1 ≤ x ≤ 0;
fX (x) = kx + 0.2, si 0 < x ≤ 1;
0,
en otro caso.
a. Determinar el valor de k.
b. Hallar la f.d.a. de X.
c. ¾Cuál es la probabilidad de que en un día determinado esta empresa tenga
1. ganancias?
2. pérdidas?
8.22 La cantidad aleatoria de dinero ahorrado por una persona en un mes tiene la siguiente f.d.a.:
0, si x < 0;
x
2,
si 0 ≤ x < 1;
1
FX (x) = 2, si 1 ≤ x < 2;
x
4, 2 ≤ x < 4;
si
x ≥ 4.
1, si
8.23 La demanda X, expresada en toneladas, de un determinado producto es una v.a. cuya f.d.p. es:
x
k, si 2 ≤ x ≤ 4;
fX (x) =
0, en otro caso.
a. Determinar el valor de k.
b. Calcular e interpretar la media y la mediana de X.
c. Calcular e interpretar el coeciente de variación de X.
d. El fabricante del producto sabe que cada kilo vendido reporta un benecio de 12 dólares, y
cada kilo que queda sin vender supone una pérdida de 6 dólares. Es por tanto, importante
para él establecer cuál es la cantidad a fabricar. Si el criterio para establecer dicha cantidad es
maximizar la ganancia esperada, determinar cuál es la fabricación óptima.
8.24 Una caja contiene 8 artículos, de los cuales 3 son defectuosos. Se selecciona un artículo de la caja
y se prueba. Si éste sale defectuoso se selecciona y se prueba otro artículo, hasta que se escoja
uno que no sea defectuoso. Hallar el número esperado de artículos seleccionados.
Se pide:
248 CAPÍTULO 8. VARIABLES ALEATORIAS
a. La f.d.p. de X.
b. El valor esperado de X y el coeciente de variación de X.
c. La mediana de X.
d. El coeciente de variación de 1.2X + 1.
8.26 El tiempo (en días) que tarda un administrador en hacer una auditoría su puede modelar con la
f.d.p. dada por:
fX (x) = k(x + 1)I(2,4) (x)
a. b. c.
k
fX (x) = kxex I(−100<x<0) (x). fX (x) = k log(x)I(1<x<17) (x). fX (x) = I(−51<x<−17) (x).
x
8.28 Sea X una v.a. que representa el tiempo (en horas) que tarda un empleado en ejecutar una labor
administrativa cuya f.d.p. está dada por:
k(x2 + 1),
si 0 < x < 3;
fX (x) =
0, en otro caso.
Se pide:
8.11. EJERCICIOS 249
a. Determinar el valor de k.
b. Hallar la f.d.a. de X.
c. Calcular e interpretar E[X] y CVX .
d. Hallar e interpretar la probabilidad de que X esté comprendida entre 1 y 2.
e. Calcular e interpretar P(X < 1), P(X < 2|X > 1) y P(|X − µX | ≥ 2σX ).
8.29 Con objeto de establecer un plan de producción, una empresa ha estimado que la demanda alea-
toria de sus potenciales clientes se comportará semanalmente de acuerdo con la f.d.p.dada por:
3
− 2x2 ),
8 (4x si 0 ≤ x ≤ 2;
fX (x) =
0, en otro caso.
donde la v.a. X está expresada en millones de unidades. ¾Qué cantidad c deberá tener dispuesta
a la venta, al comienzo de cada semana, para poder satisfacer la demanda en dicho periodo con
una probabilidad de 0.5?
8.30 La duración en horas que un empleado tarda en hacer una tarea es una v.a.c. X cuya f.d.p. está
dada por:
100
fX (x) = x2 , x > 100;
0, en otro caso.
Se pide:
a. Calcular la f.d.a. de X.
b. Calcular e interpretar las siguientes probabilidades:
8.31 Con objeto de establecer un plan de producción, una empresa ha estimado que la demanda alea-
toria de sus potenciales clientes se comportará semanalmente con arreglo a la ley de probabilidad
denida por la función de densidad
3
− 2x2 ),
8 (4x si 0 ≤ x ≤ 2;
fX (x) =
0, en otro caso.
donde X viene expresada en millones de unidades. ¾Qué cantidad C deberá tener dispuesta a la
venta, al comienzo de cada semana, para poder satisfacer la demanda en dicho periodo con una
probabilidad de 0.5?
250 CAPÍTULO 8. VARIABLES ALEATORIAS
8.32 El tiempo de vida (en cientos de horas) de un artículo es una v.a. con f.d.a. dada por:
0, si x < 0;
FX (x) = 2
1 − e−x , si x ≥ 0.
Se pide:
a. Obtener la f.d.p. de X.
b. Calcular la probabilidad de que un determinado artículo dure más de 200 horas.
x+6
k , si −6 ≤ x ≤ 4;
fX (x) =
0, en otro caso.
a. Determinar el valor de k.
b. Hallar la f.d.a. de X.
c. Calcular e interpretar E[X] y CVX .
d. Hallar c si P(c < x < c + 1) = 0.09.
8.34 Sea X una v.a. que mide el precio de los productos vendidos en una tienda en decenas de miles
de pesos. La f.d.p. es
kxk−1 ,
si 0 < x < 1;
fX (x) =
0, en otro caso.
a. Determinar el valor de k.
b. Encontrar la f.d.a. de X.
c. Calcular e interpretar P(0.3 < X < 0.8).
d. Calcular e interpretar E[X] y CVX .
e. Calcular la mediana de X.
1
49 (7
+ x), si −7 ≤ x ≤ 0;
fX (x) = k(7 − x), si 0 < x ≤ 7;
0,
en otro caso.
Determinar el valor de k.
1 − mx, si 2 ≤ x ≤ 4;
fX (x) =
0, en otro caso.
Se pide:
8.11. EJERCICIOS 251
a. Determinar el valor de m.
b. Calcular la f.d.a. de X.
c. Calcular e interpretar E[X] y CVX .
d. Calcular e interpretar los cuartiles.
8.37 Se tiene una v.a. denida como en el ejemplo 8.2.5. Ahora el interés es la v.a. Y = 2X + 1. Se
pide:
a. La f.d.p. de Y.
b. Calcular E[Y ] con base en fY .
c. Calcular E[Y ] con base en E[X].
8.38 Teniendo en cuenta la v.a. X denida en el ejemplo 8.1.1, si se realizan apuestas alrededor de los
resultados de la variable X , obteniendo las siguientes ganancias: 5,000 si X toma el valor 1, 3,000
si toma el valor 2, 500 si toma el valor 3 y 0 si toma el valor 0. Determinar:
c. La f.g.m. de X.
d. La f.g.m. de las ganancias.
8.39 Para estudiar la variable X que representa el tiempo (en minutos) en el que una célula encuentra
el alimento (como en el ejemplo 8.3.2) se ha propuesto la siguiente f.d.a. dada por:
Se tiene la hipótesis que el tiempo en el que una célula encuentra el alimento esta relacionado con
el tamaño de la célula mediante una relación directa denida por Y = 0.15X + 0.8.
a. Determinar la f.d.p. de Y.
b. Calcular e interpretar E [X] y CVX .
c. Encontrar la f.g.m. de X, si existe.
8.40 La v.a. que representa la proporción de accidentes automovilísticos fatales en una ciudad (como
en el ejemplo ??), tiene la f.d.p. dada por:
42x(1 − x)5 ,
si 0 < x ≤ 1;
fX (x) =
0, en otro caso.
8.41 Se está trabajando con la hipótesis de que el ritmo cardíaco (en latidos por minuto (lpm)) de las
personas sin problemas cardíacos sigue la f.d.p. dada por:
Se cree que el ritmo cardíaco de las personas que sufren de taquicardia se relacionan con un nivel
estable en el ritmo cardíaco bajo la relación 2(X − 10). Se quiere determinar:
a. El valor de k.
b. La probabilidad de que una persona sin problemas cardíacos tenga su ritmo cardíaco:
2) abajo de 60 lpm.
4) La probabilidad de que una persona sin problemas cardíacos tenga su ritmo cardíaco a lo
más a 30 lpm del ritmo cardíaco esperado de una persona sin problemas cardíacos.
c. Una cota para la probabilidad de que una persona sin problemas cardíacos tenga su ritmo
cardíaco a lo mas a 30 lpm del ritmo cardíaco esperado de una persona sin problemas cardíacos.
8.42 Un laboratorio está tratando de replicar el ambiente de los bosques tropicales. Para esto deben
simular varias de las condiciones climáticas que allí se presentan como por ejemplo la pluviosidad.
En particular, para esta característica están manejando el siguiente sistema probabilístico:
a. El valor de k.
b. El valor esperado y el coeciente de variación de la pluviosidad.
2
c. La mediana y la moda de la pluviosidad.
T = 50 − P/2.
2 Sea X una v.a. con f.m.p. fX si X es discreta o con f.d.p. fX si X es continua. Una moda de X (si existe), denotada
con µ̆X , es el número real que maximiza globalmente fX .
8.11. EJERCICIOS 253
8.43 La concentración (en porcentaje) de endornas producidas por cierto organismo se rige por la
f.d.p. dada por:
1
fX (x) = (0.005120709)e 2,000 x I[15,200] (x)
Se quiere determinar:
c. Una cota para la probabilidad de que la concentración de endornas sea mayor a 150. Suge-
rencia : emplear el teorema 8.7.1.
d. Una cota para la probabilidad de que la concentración de endornas se encuentre a una distancia
de la media no menor a 30.
k
fX (x) = 4x , si x = 1, 2, 3, . . .;
0, en otro caso.
Hallar el valor de k.
8.46 Demostrar que si f y g son f.d.p. y λ es una número real tal que 0 < λ < 1 entonces λf + (1 − λ)g
también es una f.d.p..
8.47 Sea X una v.a. y a y b números reales. Establecer si cada expresión es falsa o verdadera y justicar.
a. Var[X] ≥ 0.
b. Var[aX] = a2 V ar[X].
c. Var[X + b] = V ar[X].
8.48 En una investigación se considera la variable X que representa el porcentaje de reactivo disuelto
en la tierra. Se desconoce la distribución probabilística de X , lo cual representa un inconveniente
para el aval comercial de la investigación, ya que se debe garantizar que los valores de X no van
a distar en más de 13.5 puntos porcentuales de la media, con una probabilidad de 0.975. Lo único
2
que se puede asegurar de la variable es que µX = 0.5 y que σX = 8.4. ¾Qué se puede decir acerca
del aval comercial de la investigación?
8.49 Calcular el valor de k para que la siguiente función sea una f.d.p.:
x2 , 0 < x2 < k ;
si
f (x) =
0, en otro caso.
¾Cuál es la media, la varianza y función generadora de momentos de una variable con esta distri-
bución?
Capı́tulo 9
Distribuciones discretas
9.1. Introducción
Como se sabe, la distribución probabilística de una v.a.d. X está denida si se conoce su f.m.p. fX (·)
o su f.d.a. FX (·). Además, cuando se tiene la distribución probabilística de X , es posible determinar el
valor esperado, la varianza y la f.g.m., que permiten obtener las medidas estadísticas que caracterizan
la variable de estudio.
La distribución uniforme discreta tiene lugar cuando el rango de una v.a. es un conjunto nito cuyos
valores son equiprobables.
254
9.2. DISTRIBUCIÓN UNIFORME DISCRETA 255
Denición 9.2.1. Se dice que una v.a.d. X que asume los valores
x1 , x2 , . . . , xn tiene una distribución uniforme discreta de paráme-
tro n si la f.m.p. de X está dada por:
1
fX (x; n) = n , si x = x1 , x2 , . . . , xn ;
0, en otro caso.
Nota. Cuando una v.a. X tiene distribución uniforme discreta de parámetro n se escribe X ∼ U (n).
1
Es claro que caso todos los valores de del rango de X tienen la misma probabilidad, a saber,
n.
n2 −1
n+1 1
Pn
i. E[X] = 2 . ii. Var[X] = 12 .
iii. mX (t) = n i=1 eit .
Demostración:
i.
n n n
X X 1 1X 1 n(n + 1) (n + 1)
E[X] = xi fX (xi ) = i· = i= = .
i=1 i=1
n n i=1 n 2 2
ii.
n 2 n
1 X 2 (n + 1)2
2
X n+1
Var[X] = E X 2 − (E[X]) = x2i fX (xi ) −
= i −
i=1
2 n i=1 4
1 n(n + 1)(2n + 1) (n + 1)2 4(n + 1)(2n + 1) − 6(n + 1)2
= − =
n 6 4 24
2(n + 1)(2(2n + 1) − 3(n + 1)) (n + 1)(4n + 2 − 3n − 3)
= =
24 12
(n + 1)(n − 1) n2 − 1
= = .
12 12
iii.
n n n
X X 1 1 X it
mX (t) = E eXt = exi t fX (xi ) = exi t =
e .
i=1 i=1
n n i=1
256 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
Figura 9.1: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución uniforme discreta de parámetro
n = 6.
Ejemplo 9.2.1. Se considera el experimento aleatorio en el que se lanza un dado corriente una vez.
Sea X la v.a. denida por el resultado obtenido en el lanzamiento. En este caso X es una v.a.d.
con distribución uniforme de parámetro n = 6, es decir, X ∼ U (6), dado que todos los resultados del
experimento son equiprobables. Así, se sigue que
1
fX (x; 6) = 6, si x = 1, 2, 3, 4, 5, 6;
0, en otro caso.
n+1 6+1 7
i. E[X] = 2 = 2 = 2 = 3.5.
n2 −1 62 −1
ii. Var[X] = 12 = = 2.971.
12
1
Pn it 1
P6 it
iii. mX (t) = n i=1 e = 6 i=1 e .
En la gura 9.1 se presenta el gráco de la f.m.p. y de la f.d.a. de una variable con distribución
uniforme discreta de parámetro n = 6.
Nota. La f.m.p. de una v.a. con distribución uniforme de parámetro n está constituida por n líneas
del mismo tamaño que se distribuyen a lo largo del eje de las abscisas sobre los valores que asume la
9.3. DISTRIBUCIÓN DE BERNOULLI Y BINOMIAL 257
variable. Por tal motivo, los saltos que se observan en la f.d.a. son constantes y equivalentes al tamaño
de cada línea de la f.m.p. en cada elemento del rango de la variable.
n
π x (1 − π)n−x ,
x si x = 0, 1, . . . , n;
fX (x; n, π) =
0, en otro caso.
Nota. Cuando una v.a. X tiene distribución binomial de parámetros n y π se escribe X ∼ Bin(n, π).
Además, cuando n = 1, la distribución binomial recibe el nombre de distribución de Bernoulli de
parámetro π, denominada así en honor a Jakob Bernoulli 1
, lo que se escribe X ∼ Ber(π).
Demostración:
Primero se demuestra a que corresponde la f.g.m. de la variable y luego utilizando las propiedades de
esta función se obtienen el valor esperado y la varianza como sigue:
iii.
mX (t) = E eXt
Xn
= eit fX (i; n, π)
i=0
n
X n i
= eit
π (1 − π)n−i
i=0
x
n
X n i
= πet (1 − π)n−i
i=0
x
= (πet + 1 − π)n .
i.
d
= n(πet + 1 − π)n−1 πet = n(π + 1 − π)n−1 π = nπ.
E[X] = mX (t)
dt t=0 t=0
ii.
2
Var[X] = E X 2 − (E[X])
d2
− (nπ)2
= 2 mX (t)
dt t=0
t n−2 t t t n−1 t
− n2 π 2
= nπ (n − 1)(πe + 1 − π) πe e + (πe + 1 − π) e
t=0
= nπ (n − 1)(π + 1 − π)n−2 π + (π + 1 − π)n−1 − n2 π 2
= nπ ((n − 1)π + 1) − n2 π 2
= n2 π 2 − nπ 2 + nπ − n2 π 2
= nπ(1 − π).
9.3. DISTRIBUCIÓN DE BERNOULLI Y BINOMIAL 259
Solución:
En este caso se tiene que la v.a. de estudio es el número de personas en la muestra de 10 pacientes
que se recupera de la enfermedad. En este caso el éxito consiste en recuperarse de la enfermedad y
esto ocurre con una probabilidad de 0.3. En consecuencia, la f.m.p. de X es
10 x 10−x
fX (x; 10, 0.3) = x (0.3) (0.7) , si x = 0, 1, . . . , 10;
0, en otro caso.
Además, se pide calcular la probabilidad de que por lo menos nueve de las 10 personas que toman el
medicamento se recuperen, esto es, P(X ≥ 9). Así,
= 0.000144.
Por lo tanto, la probabilidad de que por lo menos nueve de las 10 personas que toman el medicamento
se recuperen es de 0.0144 %.
i. E[X] = 10(0.3) = 3. Este valor indica que se espera la recuperación de 3 enfermos de una muestra
aleatoria de 10 pacientes.
En la gura 9.3 se presenta el gráco de la f.m.p. y de la f.d.a. de una variable con distribución
binomial de parámetros n = 10 y π = 0.3.
Figura 9.3: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial de parámetros n = 10
y π = 0.3.
Ejemplo 9.3.2. Un vendedor de seguros sabe por experiencia que la oportunidad de vender un plan
es mayor mientras más contactos realice con los clientes potenciales. Empíricamente estableció que la
9.3. DISTRIBUCIÓN DE BERNOULLI Y BINOMIAL 261
probabilidad de que una persona le compre un plan, luego de la visita, es constante e igual a 0.01.
Si el conjunto de visitas que realiza el vendedor es un conjunto independiente de ensayos, ¾cuántos
compradores potenciales debe visitar para que la probabilidad de vender por lo menos un plan sea
igual a 0.85?
Solución:
Se dene a la v.a. X como el número de clientes que compran el plan luego de la visita del vendedor.
Dadas las condiciones de la situación, se tiene que el éxito corresponde a la compra del plan, luego de
la visita y por lo tanto X tiene distribución binomial de parámetros n y π = 0.01. Así, la f.m.p. de X
es
n
(0.01)x (0.99)n−x ,
x si x = 0, 1, . . . , n;
f( x; n, 0.01) =
0, en otro caso.
1 − 0.85 = P(X = 0)
n
0.15 = (0.01)0 (0.99)n−0
0
0.15 = (0.99)n
ln(0.15) = ln ((0.99)n )
ln(0.15) = n ln (0.99)
ln(0.15)
n=
ln (0.99)
n = 188.76.
En consecuencia el vendedor debe visitar por lo menos a 189 clientes para lograr su objetivo.
Ejemplo 9.3.3. Un agente de seguros vende pólizas a cinco individuos, todos de la misma edad. De
acuerdo con las tablas actuariales, la probabilidad de que un individuo con esa edad viva 30 años más
es de 3/5. Determinar la probabilidad de que dentro de 30 años vivan: a. Los cinco individuos. b. Al
menos tres. c. Sólo dos. d. Al menos uno.
Solución:
En este caso, es posible identicar una variable de Bernoulli, ya que dentro de 30 años se pueden
presentar dos situaciones: que la persona esté viva aún (con probabilidad π = 3/5) ó que haya muerto
(con probabilidad 1−π = 2/5). En consecuencia, se tiene una v.a. X dada por el número de individuos
262 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
que aún continúan vivos luego de 30 años de los cinco clientes a los que se les ha vendido la póliza,
con distribución binomial de parámetros n=5 y π = 0.6, esto es, X ∼ Bin(5, 0.6). Por lo tanto, la
f.m.p. de X es
5
(0.6)x (0.4)5−x ,
x si x = 0, 1, . . . , 5;
fX (x; 5, 0.6) =
0, en otro caso.
Se pide calcular:
a.
5
P(X = 5) = (0.6)5 (0.4)5−5 = (0.6)5 = 0.07776
5
.
b.
P(X ≥ 3) = P(X = 3; X = 4; X = 5)
= P(X = 3) + P(X = 4) + P(X = 5)
5 5 5
= (0.6)3 (0.4)5−3 + (0.6)4 (0.4)5−4 + (0.6)5 (0.4)5−5
3 4 5
= 0.68256.
c.
5
P(X = 2) = (0.6)2 (0.4)5−2 = 0.2304.
2
d.
5
P(X ≥ 1) = 1 − P(X = 0) = 1 (0.6)0 (0.4)5−0 = 1 − 0.01024 = 0.98976.
0
En la gura 9.4 se presenta el gráco de la f.m.p. y de la f.d.a. de una variable con distribución
binomial de parámetros n=5 y π = 0.6.
Figura 9.4: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial de parámetros n=5 y
π = 0.6.
Figura 9.5: Grácos de la f.m.p. de una distribución binomial de parámetros n = 10 y π = 0.25, n = 10 y π = 0.50, y
n = 10 y π = 0.75.
Ahora se consideran experimentos que obedezcan las propiedades de un experimento binomial, pero
debilitando la propiedad de independencia entre los experimentos de Bernoulli individuales. Este nuevo
264 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
i. La población o conjunto donde se deba hacer el muestreo es una población nita con N elementos.
ii. Cada elemento de la población se puede caracterizar como un éxito (tiene la característica de
interés) o como un fracaso (no tiene la característica de interés).
iv. Se elige una muestra aleatoria sin reemplazo de n individuos, de tal forma que sea igualmente
probable seleccionar cualquier subconjunto de tamaño n.
Denición 9.4.1. Se dice que una v.a. X tiene una distribución hipergeo-
métrica de parámetros n, M y N si la f.m.p. de X esta dada por:
M N −M
( x )( n−x )
, si x = máx{0, n + M − N }, . . . , mı́n{n, M };
fX (x; n, M, N ) = (Nn )
0, en otro caso.
Ejemplo 9.4.1. Considerando que se tiene un total de 10 objetos, tres de los cuales son defectuosos,
si se seleccionan cuatro objetos al azar y sin reemplazo, ¾cuál es la probabilidad de que dos sean
defectuosos?
Solución:
Se tiene que la v.a. de interés X es el número de objetos en la muestra seleccionada que son defec-
tuosos; dadas las condiciones, esta variable tiene distribución hipergeométrica de parámetros n = 4,
M =3 y N = 10, esto es, X ∼ Hg(4, 3, 10). Así, la f.m.p. de X está dada por:
3 7
(x)(4−x)
, si x = 0, 1, . . . , 3;
fX (x; 4, 3, 10) = (10
4)
0, en otro caso.
En la gura 9.6 se presenta el gráco de la f.m.p. y de la f.d.a. de una variable con distribución
hipergeométrica de parámetros n = 4, M = 3 y N = 10.
Figura 9.6: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución hipergeométrica de parámetros
n = 4, M = 3 y N = 10.
Ejemplo 9.4.2. Para evitar que lo descubran en la aduana, un viajero ha colocado seis tabletas de un
narcótico en una botella que contiene nueve píldoras de vitamina que son similares en apariencia. Si el
ocial de la aduana selecciona tres tabletas aleatoriamente para analizarlas, ¾cuál es la probabilidad
de que el viajero sea arrestado por posesión de narcóticos? ¾Cuál es la probabilidad de que no sea
arrestado por posesión de narcóticos?
Solución:
Por lo tanto, la probabilidad de que el viajero sea arrestado por posesión de narcóticos es
P(X ≥ 1) = P(X = 1; X = 2; X = 3)
266 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
P(X ≥ 1) = 1 − P(X = 0)
6
9
0 3−0
=1− 15
3
84
=1−
455
= 0.8153.
Ejemplo 9.4.3. Un equipo de trabajo establecido por el Ministerio de Medio Ambiente, programó
visitas a dos fábricas para investigar posibles violaciones a los reglamentos para el control de conta-
minación ambiental. Sin embargo, los recortes presupuestales han reducido drásticamente el tamaño
del equipo de trabajo por lo que solamente se podrán investigar cinco de las 25 fábricas. Si se sabe
que 10 de las fábricas están operando sin cumplir los reglamentos, calcular la probabilidad de que al
menos una de las fábricas muestreadas esté operando en contra del reglamento.
Solución:
Se dene la v.a. X como el número de fábricas en la muestra seleccionada que operan sin cumplir los
reglamentos; de acuerdo con las características del problema se supone que el muestreo se hace sub
reemplazo y por lo tanto se sigue que X ∼ H(5, 10, 25). Así, la probabilidad pedida es
5
X
P(X ≥ 1) = P(X = i)
i=1
= 1 − P(X = 0)
10 15
0
=1− 25
5
5
= 0.9434.
En consecuencia, la probabilidad de que al menos una de las fábricas muestreadas esté operando en
contra al reglamento es 0.9434.
Ejemplo 9.4.4. Una compañía recibe un pedido de 20 artículos. Dado que la inspección de cada ar-
tículo es cara, se sigue la política de analizar una muestra sin reemplazo de seis artículos de cada envío,
9.4. DISTRIBUCIÓN HIPERGEOMÉTRICA 267
Solución:
Sea X la v.a. dada por el número de artículos defectuosos en la muestra seleccionada. En este caso
se tiene que X ∼ H(6, 5, 20). Entonces, la probabilidad pedida es
P(X ≤ 1) = P(X = 0; X = 1)
= P(X = 0) + P(X = 1)
5 20−5 5 20−5
0 6−0 1 6−1
= 20
+ 20
6 6
= 0.516.
Así, la probabilidad de que sea aceptado un pedido con cinco artículos defectuosos es 0.516.
Una aplicación muy útil de la distribución hipergeométrica consiste en hallar un valor aproximado
del tamaño de una población sin necesidad de enumerar sus elementos uno por uno. Este método se
conoce como el método de captura-recaptura y consiste en capturar M individuos de la población,
marcarlos y luego devolverlos a la población. Una vez los individuos se mezclan homogéneamente, se
toma sin reemplazo una muestra de tamaño n. Si X denota la v.a. dada por el número de individuos
marcados en la muestra se sigue que X n, M y N .
tiene distribución hipergeométrica de parámetros
En un momento dado, se observa la variable X y se obtiene el valor x0 , por ejemplo. En Blanco (2004,
p. 107) se demuestra que un posible valor de N que maximiza la probabilidad de que X sea igual a
b , es un estimador2 de N . Tal estimador se conoce como estimador de máxima
x0 , denotado con N
verosimilitud y está dado por
nM
N=
b
x0
donde [a] denota la parte entera de a.
N −n
i. E[X] = n M
N. ii. Var[X] = n M
N 1−
M
N N −1 .
Ejemplo 9.4.5. Con la información del ejemplo 9.4.2, calcular el valor esperado y la varianza del
número de narcóticos en la muestra seleccionada.
Solución:
2 Un estimador es una función de una muestra aleatoria que se utiliza para estimar un parámetro desconocido de
la población.
268 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
Como X ∼ H(3, 6, 15) entonces se tiene que el valor esperado del número de narcóticos en la muestra
seleccionada es
M 6
E[X] = n =3 = 1.2
N 15
con varianza
M M N −n 6 6 15 − 3
Var[X] = n 1− =3 1− = 0.6171.
N N N −1 15 15 15 − 1
Nota. La razón M/N corresponde a la proporción de éxitos de la población. Si se sustituye M/N por
π en las fórmulas de la proposición 9.4.1 se obtiene que:
i. E[X] = nπ . N −n
ii. Var[X] = nπ(1 − π) N −1 .
n
1− N
1
1− N
que es aproximadamente igual a 1 cuando el tamaño de la población es muy grande, esto es, cuando
N −→ ∞. Una regla de uso frecuente establece que el factor de corrección se puede pasar por alto
cuando n/N ≤ 5 %, es decir, cuando la muestra contiene menos del 5 % de los elementos de la población.
Si esto sucede entonces las distribuciones binomial e hipergeométrica coinciden como se muestra en la
proposición 9.4.2.
M N −M
x n−x n x
N
−→ π (1 − π)n−x
n
x
donde x es un elemento del rango de una v.a. con distribución binomial de parámetros n y π.
La demostración de esta proposición está fuera de los intereses de este libro. La demostración se puede
consultar en Blanco (2004, p. 110).
9.4. DISTRIBUCIÓN HIPERGEOMÉTRICA 269
Ejemplo 9.4.6. En el ejemplo 9.4.2, ¾hubiera sido recomendable utilizar la distribución binomial en
lugar de la distribución geométrica?
Solución:
Dado que n/N = 3/15 = 0.20 > 5 % entonces no se recomienda utilizar la distribución binomial en la
lugar de la distribución geométrica para realizar los cálculos respectivos.
Ejemplo 9.4.7. El Ministerio de Salud de un país asegura que el porcentaje de individuos que padece
de una determinada enfermedad infecciosa de una ciudad con cuatro millones de habitantes es 10 %.
Una agencia no gubernamental quiere tomar una muestra aleatoria de 20 individuos de la ciudad.
¾Cuál es la probabilidad de que ningún ciudadano de la muestra esté enfermo?
Solución:
Sea X la variable dada por el número de personas en la muestra que están enfermas. Se observa que
X tiene distribución hipergeométrica de parámetros n = 20, M = 400, 000 y N = 4, 000, 000. Teniendo
en cuenta la proposición 9.4.2, se sigue la distribución probabilística de X se puede aproximar por
medio de una distribución binomial de parámetros n = 20 y π = 0.1. Por tal motivo la probabilidad
pedida es
100
(0.1)0 (1 − 0.1)20−0 = 0.121.
0
Ejemplo 9.4.8. En la tabla 9.1 se ejemplica la proposición 9.4.2 por medio de una v.a. X con
distribución hipergeométrica de parámetros n = 10, M = 500 y N = 1, 000. En la segunda columna
de la tabla se presentan las probabilidades asociadas con todos los valores del rango de X que se
obtienen por medio de la f.m.p. dada por:
500 500
x 10−x
1,000
10
donde x es cualquier número entero entre 0 y 10. De otra parte, utilizando la aproximación por medio
de la distribución binomial que sugiere la proposición 9.4.2, en la tercera columna de la tabla se
muestran las probabilidades calculadas a través de la función
10
(0.5)x (1 − 0.5)10−x
x
que corresponde a la f.m.p. de una variable con distribución binomial de parámetros n = 10 y π = 0.5.
Como se observa en la última columna de la tabla, la mayor disimilitud se obtiene cuando x = 5,
donde la diferencia con la probabilidad exacta se empieza a notar en el lugar de las milésimas. En
todos los demás casos la diferencia es casi nula y únicamente se percibe a partir de la cuarta cifra
después del punto decimal. Esto evidencia que la aproximación que establece la proposición 9.4.2 para
este caso es bastante acertada.
270 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
Tabla 9.1: Probabilidades asociadas con los valores de una v.a. con distribución hipergeométrica de parámetros n = 10,
M = 500 y N = 1, 000, su respectiva aproximación por medio de la distribución binomial de parámetros n = 10 y π = 0.5,
y la diferencia correspondiente.
Esto es, un experimento binomial negativo de parámetros r y π está caracterizado por las sigui-
entes condiciones:
i. El experimento consta de una serie de experimentos de Bernoulli que son independientes entre sí.
iii. El experimento continúa hasta que un total de r éxitos se haya observado, siendo r un entero
positivo dado.
De esta forma el interés reside en calcular la probabilidad de tener que repetir el experimento de
Bernoulli x veces para obtener de manera exacta r éxitos. Ahora, el número de éxitos permanece
constante en tanto que el número de repeticiones X es una v.a..
9.5. DISTRIBUCIÓN GEOMÉTRICA Y BINOMIAL NEGATIVA 271
x−1 r x−r
fX (x; r, π) = r−1 π (1 − π) , si x = r, r + 1, r + 2, . . .;
0, en otro caso.
Nota. Cuando una v.a. X tiene distribución binomial negativa de parámetros r y π se escribe X ∼
BN (r, π). Además, similar a la distribución binomial, se dice que una v.a. X tiene distribución
geométrica cuando r = 1, lo que se denota con X ∼ G(π), esto es, una distribución geométrica de
parámetro π.
Suponga que no interesa conocer el número de ensayos necesarios hasta obtener de manera exacta r
éxitos (X ) sino el número de fracasos ocurridos antes de obtener de manera exacta r éxitos (Y ).
En consecuencia, se sigue que X = Y + r y por lo tanto
r+y−1 r y
fY (y; r, π) = r−1 π (1 − π) , si y = 0, 1, 2, . . .;
a
0, en otro caso.
Algunos autores llaman a esta última distribución binomial negativa, mientras que a la distribución
de probabilidad dada inicialmente la llaman distribución de Pascal .
Ejemplo 9.5.1. En una auditoría se investigan los estados nancieros con inconformidades. Un
estudio precedente señaló que la proporción de estados nancieros con defectos es 3 %. ¾Cuál es la
probabilidad de que el vigésimo estado nanciero investigado sea el tercero que tenga algún error?
Solución:
Sea X la v.a. que representa el número de estados nancieros que es necesario inspeccionar hasta
obtener exactamente tres con algún error. En consecuencia la variable X tiene distribución binomial
negativa de parámetros r = 3 y π = 0.03, esto es, X ∼ BN (3, 0.03). Así, la f.m.p. de X está dada por:
x−1 3 x−3
fX (x; 3, 0.03) = 2 (0.03) (0.97) , x = 3, 4, 5, . . .;
0, en otro caso.
Figura 9.7: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución binomial negativa de parámetros
r=3 y π = 0.03.
Ejemplo 9.5.2. El gerente del departamento de control de calidad de una compañía está investigando
una medida que se ha implementado para mejorar las cualidades de sus productos. Esta medida indica
que la probabilidad de encontrar algún producto defectuoso es apenas del 1 %. ¾Cuál es la probabilidad
de que se tenga que revisar más de diez artículos hasta encontrar dos con alguna imperfección?
Solución:
Aquí interesa la v.a. X dada por el número de unidades que es necesario inspeccionar hasta encon-
trar dos defectuosas. De acuerdo con la situación se tiene que la probabilidad de encontrar alguna
imperfección en algún artículo es constate e igual a 0.01 y por lo tanto se sigue X tiene distribución
binomial negativa de parámetros r=2 y π = 0.01. Así, la f.m.p. de X está dada por:
x−1
2 x−2
fX (x; 2, 0.01) = 1 (0.01) (0.99) , x = 2, 3, 4, . . .;
0, en otro caso.
Entonces, la probabilidad de que se tenga que revisar más de diez artículos hasta encontrar dos con
alguna imperfección es
= 1 − P(X = 2) − . . . − P(x = 9)
2−1 2 2−2 9−1
=1− (0.01) (0.99) − ... − (0.01)2 (0.99)9−2
1 1
= 1 − 0.0042662
= 0.9957.
r(1−π)
r
r πet
i. E[X] = π, ii. Var[X] = π2 . iii. mX (t) = .
1−(1−π)et
La demostración está fuera de los intereses de este libro. La demostración se puede consultar en Ross
(1998, p. 166).
Ejemplo 9.5.3. Encontrar el valor esperado, la varianza y la f.g.m. de la variable que estudia en el
ejemplo 9.5.2.
Solución:
Dado que la variable X tiene distribución binomial negativa de parámetros r=2 y π = 0.01, esto es,
X ∼ BN (2, 0.01), entonces se sigue que:
2
i. E[X] = 0.01 = 200. Este valor indica que se espera inspeccionar alrededor de 200 artículos hasta
completar dos unidades defectuosas.
2(1−0.01)
ii. Var[X] = (0.01)2 = 19, 800.
2 2
0.01et 0.01et
iii. mX (t) = 1−(1−0.01)et = 1−0.99et .
maximiza la probabilidad de que X sea igual a x0 . Tal estimador, también se conoce como estimador
de máxima verosimilitud y es igual a
b = M x0
N
k
donde [a] es la parte entera de a.
Esta distribución probabilística fue introducida en 1837 por el matemático francés Siméon Denis
Poisson 3
y se utiliza para describir la ocurrencia de un fenómeno aleatorio en una unidad de tiempo
o espacio. Esta distribución también sirve como modelo del número de defectos o disconformidades
que ocurren en una unidad de un producto. Las siguientes son las características correspondientes a
una variable con distribución de Poisson:
• El experimento aleatorio consiste en contar el número de veces que ocurre un evento particular
durante una unidad de tiempo, área, volumen, peso, distancia, o cualquier otra unidad de medida
dada bien denida.
• La probabilidad de que el evento ocurra en una unidad de medida dada es la misma para todas
las unidades.
• El número de eventos que ocurren en una unidad de medida es independiente del número de
eventos que ocurren en otras unidades.
(
e−λ λx
fX (x; λ) = x! , si x = 0, 1, 2, . . .;
0, en otro caso.
Nota. Cuando una v.a. X tiene distribución de Poisson de parámetro λ se escribe X ∼ ¶(λ).
t
−1)
i. E[X] = λ. ii. Var[X] = λ. iii. mX (t) = eλ(e .
Demostración:
iii.
mX (t) = E eXt
∞
X
= eit fX (i; λ)
i=0
∞
X e−λ λi
= eit
i=0
i!
∞
X λi eit
= e−λ
i=0
i!
∞ i
−λ
X (λet )
=e
i=0
i!
−λ λet
=e e
t
= eλ(e −1)
.
i.
d λ(et −1) t
= eλ(1−1) λ = λ.
E[X] = mX (t)
=e λe
dt t=0 t=0
ii.
2
Var[X] = E X 2 − (E[X])
d2
− λ2
= 2 mX (t)
dt t=0
t λ(et −1) t
+ λet eλ(e −1)
λet − λ2
= λe e
t=0
= λeλ(1−1) + λeλ(1−1) λ − λ2
= λ.
Nota. En la primera parte de la demostración de la proposición 9.6.1 se aplica la identidad
∞
X xn
ex =
n=0
n!
Ejemplo 9.6.1. Los sábados por la mañana, los clientes entran en una tienda de un centro comercial
a una tasa esperada de 0.50 clientes por minuto. Hallar la probabilidad de que el número de clientes
que entran en un intervalo especíco de 10 minutos sea a lo más 3.
Solución:
Las hipótesis del proceso de Poisson parecen ser razonables en este contexto. Se da por sentado que
los clientes no llegan en grupos (o es posible contar al grupo entero como un solo cliente) y que la
entrada de un cliente no aumenta ni disminuye la probabilidad de que llegue otro. Para obtener λ,
se observa que a una tasa media de 0.50 por minuto durante un periodo de 10 minutos, se sigue que
λ = (0.50)(10) = 5 entradas. SeaX la v.a. dada por el número de clientes que entran en un intervalo
de 10 minutos. Así, se tiene que X ∼ P (5), por lo que la f.m.p de X es
( −5 x
e 5
fX (x; 5) = x! , si x = 0, 1, 2, . . .;
0, en otro caso.
Se pide calcular
P(X ≤ 3) = P(X = 0; X = 1; X = 2; X = 3)
= P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)
e−5 50 e−5 51 e−5 52 e−5 53
= + + +
0! 1! 2! 3!
= 0.2650.
Se observa además que
En la gura 9.9 se presenta el gráco de la f.m.p. y la f.d.a. de una variable con distribución de poisson
de parámetro λ = 5.
Figura 9.9: Gráco de la f.m.p. (a) y de la f.d.a. (b) de una variable con distribución de Poisson de parámetro λ = 5.
Ejemplo 9.6.2. Si un banco recibe en promedio seis cheques sin fondo por día, ¾cuáles son las
probabilidades de que reciba: a. cuatro cheques sin fondo en un día dado y b. 10 cheques sin fondos
en cualquier par de días consecutivos?
Solución:
Dado que se cumplen los requerimientos de un proceso de Poisson (¾por qué?), se tiene que la v.a.
de interés X es el número de cheques sin fondo que llegan al banco en un día cualquiera, de donde
λ=6 cheques sin fondo por día. Así, una de las probabilidades pedidas es
e−6 64
P(X = 4) = = 0.1392.
4!
De otra parte, cuando interesan dos días consecutivos, se dene la v.a. X como el número de cheques
sin fondo que llegan al banco en dos días consecutivos, por lo que ahora λ = 6 × 2 = 12. En
consecuencia, la segunda probabilidad pedida es
e−12 1210
P(X = 10) = = 0.1049.
10!
278 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
Nota. En la gura 9.10 se presentan los grácos de la f.m.p. de una distribución de Poisson para
algunos valores de λ. En esta gura se observa como se modica la agudeza del sesgo de la distribución
a medida que aumenta el valor de λ.
λ
fX (x; λ) = fX (x − 1; λ).
x
donde x es un número entero positivo.
Demostración:
Ejemplo 9.6.3. Sea X una v.a. con distribución de Poisson de parámetro λ=5 como en el ejemplo
9.6.1. A continuación se generan algunos valores de esta distribución utilizando la fórmula recursiva
de la proposición 9.6.2 utilizando λ = 5:
Esta iteración se puede prolongar hasta obtener todos las probabilidades que sean requeridas.
Empíricamente se ha establecido que si n > 100, π < 0.01 y nπ < 20 entonces es posible aproximar
la distribución binomial de parámetros n y π por una distribución de Poisson de parámetro nπ , esto
es, Bin(nπ) ≈ P (nπ). Esto quiere decir que la distinción de Poison ofrece un modelo probabilístico
adecuado para todos los experimentos aleatorios en los que las repeticiones son independientes unas de
otras y en los que solo hay dos posibles resultados denominados éxito y fracaso, con probabilidad
de éxito pequeña, y en los que el interés se centra en describir el número de éxitos obtenidos al realizar
el experimento un numero sucientemente grande de veces (Blanco 2004). Este hecho se especica
propiamente en la siguiente proposición:
Proposición 9.6.3. Si πn es una sucesión tal que 0 < πn < 1 y nπn −→ λ cuando n −→ ∞, entonces
e−λ λx
n x
πn (1 − πn )n−x −→
x x!
donde x es un elemento del rango de una v.a. con distribución de Poisson de parámetro λ.
La demostración de esta proposición está fuera de los intereses de este libro. La demostración se puede
consultar en Ross (1998, p. 154).
Ejemplo 9.6.4. En la tabla 9.2 se ejemplica la proposición 9.6.3 por medio de una v.a. X con
distribución binomial de parámetros n = 400 y π = 0.005. En la segunda columna de la tabla se
presentan las probabilidades asociadas con algunos valores del rango de X que se obtienen por medio
de la f.m.p. dada por:
400
(0.005)x (1 − 0.005)400−x
x
donde x es cualquier número entero entre 0 y 400. De otra parte, utilizando la aproximación por medio
de la distribución de Poisson que sugiere la proposición 9.6.3, en la tercera columna de la tabla se
muestran las probabilidades calculadas a través de la función
e−2 2x
x!
que corresponde a la f.m.p. de una variable con distribución de Poisson de parámetro λ = 2. Como se
observa en la última columna de la tabla, la diferencia entre el cálculo exacto de las probabilidades y
la aproximación que establece la proposición 9.6.3 es casi nula (de hecho en algunos casos lo es) y por
lo tanto se sigue que en escenarios como este la aproximación es bastante acertada.
280 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
Tabla 9.2: Probabilidades asociadas con los valores de una v.a. con distribución binomial de parámetros n = 400 y
correspondiente.
Ejemplo 9.6.5. La probabilidad de que un artículo sea defectuoso es igual a 0.001. Un cliente mayo-
ritario acepta un embarque de producción siempre y cuando al tomar una muestra aleatoria de 10,000
unidades del embarque no resulten más de diez unidades defectuosas. ¾Cuál es la probabilidad de que
un cliente acepte el embarque?
Solución:
Sea X la v.a. dada por el número de unidades en la muestra que tienen algún defecto. En este
caso se tiene que X tiene distribución binomial de parámetros n = 10, 000 y π = 0.001, esto es,
X ∼ Bin(10, 000, 0.001). Dadas las condiciones de la situación es posible aproximar esta distribución
binomial por medio de una distribución de Poisson de parámetro nπ = 10. Así, la probabilidad de que
el cliente acepte el embarque es
10 10
X X e−10 10i e−10 100 e−10 1010
P(X ≤ 10) = P(X = i) = = + ... + = 0.583.
i=0 i=0
i! 0! 10!
9.7. Comentarios
En este capítulo se presentan las distribuciones discretas de uso común en estadística. Estas distri-
buciones son de especial interés porque los supuestos bajo los cuales se fundamentan, les permiten
ajustarse a variados fenómenos de la vida real relacionados con procesos discretos.
Para todas las distribuciones se presentan el valor esperado, la varianza y la f.g.m., con el propósito de
9.8. EJERCICIOS 281
describir a mayor profundidad los fenómenos que describen por medio de tales medidas características.
Además, se presentan un par de resultados asintóticos, que permiten aproximar bajo ciertas condiciones
algunas de estas distribuciones.
9.8. Ejercicios
9.1 Se lanza un dado corriente 12 veces seguidas. Calcular la probabilidad de obtener por lo menos
cinco veces el número uno.
9.2 Sea X una v.a. con distribución de Poisson de parámetro λ tal que P(X = 0) = 0.02. Calcular la
media y la varianza de X.
9.3 Sea X una variable aleatoria con distribución de Bernoulli de parámetro π . Hallar el valor esperado,
la varianza y la f.g.m. de X.
9.4 Sea X una variable aleatoria con distribución Geométrica de parámetro π . Hallar el valor esperado,
la varianza y la f.g.m. de X.
9.5 Se supone que la probabilidad de obtener una unidad defectuosa es de 5 %. El conjunto de unidades
terminadas constituye un conjunto de ensayos independientes. Si se toma una muestra aleatoria
de 10 unidades, calcular la probabilidad de que:
9.6 El gerente de un restaurante que solo da servicio mediante reservas sabe, por experiencia, que
el 20 % de las personas que reservan una mesa no asistirán. Si el restaurante acepta 25 reservas
pero solo dispone de 20 mesas, ¾cuál es la probabilidad de que a todas las personas que asistan al
restaurante se les asigne una mesa?
9.7 Una empresa de electrónica observa que el número de componentes que fallan antes de cumplir
100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de estos
fallos es ocho, calcular la probabilidad de que:
9.8 Un lote contiene 100 artículos de un proveedor local y 200 unidades de un proveedor vecino. Si se
seleccionan cuatro piezas al azar y sin reemplazo, calcular la probabilidad de que:
282 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
9.9 Una prueba consta de 200 preguntas de verdadero o falso. Para una persona que responda al azar,
calcular la probabilidad de que responda acertadamente:
9.10 En un centro turístico, para averiguar el tamaño N de una población de lagartos se utiliza el
siguiente método de captura-marcaje-recaptura. Se capturan k lagartos, se les marca y se les
reincorpora a su población. Un tiempo después se realizan n avistamientos independientes y se
dene X como el número de lagartos marcados en los n avistamientos independientes.
9.11 En un proceso de fabricación de cierto artículo se sabe que 2 % resultan defectuosos. Los artículos
se empaquetan en cajas de 50 artículos. Calcular la probabilidad de que en una caja haya el
siguiente número de artículos con defectos:
a. Ninguno.
b. Uno.
c. Más de dos.
9.12 Los mensajes que llegan a una computadora utilizada como servidor lo hacen de acuerdo con una
distribución de Poisson con una tasa promedio de 0.1 mensajes por minuto.
b. Determinar el intervalo de tiempo necesario para que la probabilidad de que no llegue ningún
mensaje durante ese lapso de tiempo sea 0.8.
9.13 Se sabe que de un lote de 40 semillas no está en buenas condiciones la cuarta parte. Se toman
al azar ocho semillas y se analizan en el laboratorio. ¾Cuál es la probabilidad de que tres de las
semillas analizadas estén en malas condiciones?
9.14 Un banco recibe en promedio 6 cheques falsos al día acorde a un proceso de Poisson. Hallar la
probabilidad de que se reciban:
9.15 Una rma de pedidos por correo envía una carta a sus clientes. La probabilidad de que un cliente
elegido al azar conteste a esa carta es de 0.1. Sean X el número de cartas que debe enviar la
rma hasta obtener exactamente 1 respuesta y Y el número de cartas que debe enviar la rma
para obtener exactamente 3 respuestas. Calcular e interpretar P(X > 2) y P(Y ≤ 5). ¾Cuál es el
valor esperado de estas variables?
9.16 Una caja con 12 artículos tiene cuatro defectuosos. Si se toma una muestra de tres, en un caso con
reemplazamiento y en otro sin reemplazamiento, ¾cuál será la probabilidad de no incluir artículos
defectuosos en la muestra?
9.17 De estudios anteriores se conoce que el tipo de grupo sanguíneo de una población se distribuye
de acuerdo a las siguientes categorías: A (43.2 %), B (14.2 %), AB (6.0 %) y O (36.6 %). En una
situación de emergencia se necesitan realizar cinco transfusiones de tipo A. Se solicitan voluntarios
a la población y se realizan extracciones sucesivas. ¾Cuál es la probabilidad de cubrir la emergencia
con el décimo donante?
9.18 La central telefónica de un hotel recibe en promedio 0.5 llamadas por minuto de acuerdo a un
proceso de Poisson. Determinar la probabilidad de que en una hora al determinada:
a. Se reciba 60 llamadas.
c. La central quede bloqueada, sabiendo que no puede realizar más de 3 conexiones por minuto.
9.19 El 4 % de las reservas de un vuelo no son utilizadas. Según esta observación, una compañía de
aviación vende 75 billetes para 73 plazas. ¾Cuál es la probabilidad de que todos los pasajeros
consigan viajar?
b. Suponiendo que cada respuesta acertada vale 1 punto, ¾cuánto debe valer cada respuesta fallada
para que la nota esperada del estudiante que prueba suerte sea nula?
9.21 Una caja contiene 100 artículos de los que cuatro son defectuosos. Sea X el número de artículos
defectuosos encontrados en una muestra de nueve artículos sin reemplazado.
9.22 El número de llamadas telefónicas que recibe una operadora desde las 9:00 horas hasta las 9:05
horas sigue una distribución de Poisson de parámetro 4. Hallar la probabilidad de que:
284 CAPÍTULO 9. DISTRIBUCIONES DISCRETAS
b. En los dos próximos días la operadora reciba un total de tres llamadas en ese intervalo de
tiempo.
9.23 Una agencia inmobiliaria dedicada a la venta de apartamentos en la Costa ha realizado un estudio
de ventas, comprobando que solo el 5 % de las personas que acuden a visitar el piso piloto compran
un apartamento. Se pide:
a. Calcular la probabilidad de que tenga que recibir 10 visitas hasta vender un apartamento.
b. Calcular la probabilidad de que tenga que recibir 10 visitas hasta vender dos apartamentos.
9.24 Sea X una v.a. con distribución de Poisson de parámetro λ. Demostrar que E X 2 = λE[X + 1].
9.25 Se lanza una moneda tantas veces como sea necesario hasta obtener por primera vez cara. Sea X
la v.a. que denota el número de lanzamientos requeridos. Calcular E[X]
a. Calcular la probabilidad de que en una ciudad de dicho país, de 400,000 habitantes, haya ocho
o más homicidios en un mes dado.
b. Calcular la probabilidad de que haya, por lo menos, dos meses durante el año en los que, en
dicha ciudad ocurran ocho o más homicidios.
9.27 La policía sospecha que en un camión cargado con 40 bultos de arroz se han camuado paquetes
de cocaína. Para conrmar su sospecha, la policía escoge al azar cinco bultos para inspeccionarlos.
Si en efecto, de los 40 bultos de arroz que contiene el camión, diez tienen camuada cocaína, ¾cuál
es la probabilidad de que por lo menos uno de los bultos de la muestra contenga cocaína?
9.28 Un procedimiento de laboratorio requiere de 12 etapas independientes para realizarse. Sin embargo,
la probabilidad de completar satisfactoriamente una etapa es de 0.5, por lo que se puede repetir
un máximo de 6 etapas de manera independiente. Se quiere determinar cuál es la probabilidad de
que la proporción de etapas completadas satisfactoriamente sea mayor o igual 72.22 %.
Capı́tulo 10
Distribuciones continuas
10.1. Introducción
En la sección 9 se estudian las distribuciones discretas de uso común, haciendo énfasis en los escenarios
que describen y sus aplicaciones, junto con los parámetros asociados, con el propósito de describir
probabilísticamente un fenómeno discreto dado. A diferencia de las v.a.d.'s, que describen variables
con valores nitos o innitos numerables, las v.a.c.'s hacen referencia a variables que asumen un
conjunto innito no numerable de valores.
En este capítulo se presentan las distribuciones continuas de uso frecuente en estadística, por medio
de las funciones relacionadas, esto es, la f.d.p. y la f.d.a., y los parámetros asociados para describir las
variables de interés. El estudio de las distribuciones continuas de probabilidad es fundamental porque
varios métodos de la inferencia estadística se apoyan en este tipo de distribuciones.
La distribución uniforme continua es aquella distribución que puede tomar cualquier valor dentro de
un intervalo dado, siempre con la misma densidad; por ende, todos los subintervalos de la misma
longitud son equiprobables. Es una distribución continua porque puede tomar cualquier valor y no
únicamente un número determinado de ellos, como ocurre en la distribución uniforme discreta.
285
286 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
Nota. Cuando una v.a. X tiene distribución uniforme continua sobre el intervalo [a, b] se escribe
X ∼ U [a, b]. Esta distribución probabilística también se puede denir sobre el intervalo abierto (a, b),
lo que se escribe X ∼ U (a, b). En este caso la f.d.p. de X es
1
fX (x; a, b) = b−a , si a < x < b;
0, en otro caso.
a+b
i. E[X] = 2 . iv.
ii. Var[X] = (b−a)2 0, si x < a;
12 . x−a
FX (x; a, b) = b−a , si a ≤ x ≤ b;
etb −eta 1, si x > b.
iii. mX (t) = t(b−a) .
Demostración:
i.
Z ∞
E[X] = xfX (x)dx
∞
Z b
x
= dx
a b − a
Z b
1
= xdx
b−a a
1 x2 b
=
b−a 2 a
2
b − a2
1
=
b−a 2
1 (b − a)(b + a)
=
b−a 2
(a + b)
= .
2
ii. Como
Z ∞
E X2 = x2 fX (x)dx
∞
10.2. DISTRIBUCIÓN UNIFORME CONTINUA 287
b
x2
Z
= dx
a b−a
Z b
1
= x2 dx
b−a a
1 x3 b
=
b−a 3 a
3
b − a3
1
=
b−a 3
1 (b − a)(a2 + ab + b2 )
=
b−a 3
a2 + ab + b2
=
3
entonces
2
Var [X] = E X 2 − (E [X])
2
a2 + ab + b2
(a + b)
= −
3 2
2 2
a + ab + b (a + 2ab + b2 )
2
= −
3 4
4a2 + 4ab + 4b2 − 3a2 − 6ab − 3b2
=
12
a2 − 2ab + b2
=
12
(a − b)2
= .
12
iii.
mX (t) = E eXt
Z ∞
= ext fX (x)dx
∞
b
ext
Z
= dx
a b−a
Z b
1
= ext dx
b−a a
1 ext b
=
b−a t a
1 ebt − eat
=
b−a t
ebt − eat
= .
t(b − a)
288 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
Ejemplo 10.2.1. La tesorería de una empresa indica que la utilidad diaria (en millones de pesos) de
la compañía tiene distribución uniforme entre −3 y 2. Calcular la probabilidad que en un día dado la
empresa tenga
a. ganancias.
c. pérdidas.
Solución:
Se tiene que la v.a. de interés X corresponde a la utilidad diaria (en millones de pesos) de la empresa.
De acuerdo con la tesorería de la compañía X tiene distribución uniforme sobre el intervalo a = −3 y
b = 2, es decir, X ∼ U [−3, 2]. Por consiguiente, la f.d.p. de X es
1
5, si −3 ≤ x ≤ 2;
fX (x; −3, 2) =
0, en otro caso.
a. ganancias es:
Z ∞
P(X ≥ 0) = fX (x)dx
0
Z 2
1
= dx
0 5
1 2
= x
5 0
1
= (2 − 0)
5
= 0.4.
c. pérdidas es:
En la gura 10.1 se presenta el gráco de la f.d.p. y de la f.d.a. de una variable con distribución
uniforme continua sobre sobre el intervalo a = −3 y b = 2.
Nota. Las probabilidades calculadas en el ejemplo 10.2.1 también se pueden obtener utilizando la
f.d.a. de la variable, esto es, con la función:
0, si x < −3;
x+3
FX (x; −3, 2) = 5 , si −3 ≤ x ≤ 2;
1, x > 2.
si
a. ganancias es:
c. pérdidas es:
Figura 10.1: Gráco de la f.d.p. (a) y de la f.d.a. (b) de una variable con distribución uniforme continua sobre el
intervalo a = −3 y b = 2.
Ejemplo 10.2.2. Con la información del ejemplo 10.2.1, calcular el valor esperado y la varianza de
la utilidad diaria de esta empresa.
Solución:
Como la utilidad diaria de la empresa tiene distribución uniforme continua sobre el intervalo a = −3
y b = 2, entonces el valor esperado y la varianza son respectivamente
a+b −3 + 2 −1
E[X] = = =
2 2 2
En consecuencia, se espera que en un día dado, la compañía tenga pérdidas por un valor de $500,000
y por tal motivo debería considerar seriamente declararse en banca rota.
Nota. La variabilidad respecto al valor esperado calculado en el ejemplo 10.2.2 es notable. ¾Por qué?
10.3. DISTRIBUCIÓN NORMAL 291
10.3.1. Generalidades
Muchas v.a.c.'s de carácter económico, morfológico y sociológico siguen una distribución normal,
o por lo menos aproximadamente normal. Una de sus características más importantes es que, bajo
ciertas condiciones, casi cualquier distribución de probabilidad, tanto discreta como continua, se puede
aproximar por una distribución normal.
2πσ 2
donde µ es un número real y σ2 es un número real positivo.
Nota. Cuando una v.a. X tiene distribución normal de parámetros µ y σ2 se escribe X ∼ N (µ, σ 2 ).
Se acostumbra denominar a µ parámetro de localización
2
y a σ2 parámetro de escala .
3
De otra parte, la f.d.a. de una v.a. X con distribución normal de parámetros µ y σ2 , denotada con
ΦX , está dada por:
Z x
1 t−µ 2
e− 2 ( )
1
2
ΦX (x; µ, σ ) = √ σ para todo x ∈ R.
−∞ 2πσ 2
Por lo general, el cálculo de esta función en un valor dado se hace por medio de una tabla (detalles
ver la sección 10.3.3). En la gura 10.4 se presentan algunos ejemplos al respecto.
1 2 2
i. E[X] = µ. ii. Var[X] = σ 2 . iii. mX (t) = eµt+ 2 σ t
.
Nota. Hay toda una familia de distribuciones normales. Cada distribución normal especíca, es decir,
2
cada miembro de esta familia, se distingue por su valor esperado µ y su varianza σ .
4
Como se observa en las grácas de la gura 10.4, la gráca de la f.d.p. de una variable X con
distribución normal tiene forma de campana y un máximo global en el centro de la misma. De esta
manera, la media aritmética (µX ), la mediana (µ̃X ) y la moda (µ̆X ) de X coinciden y se localizan en
la abscisa correspondiente al máximo de la gráca. En consecuencia, la distribución de probabilidad
normal es simétrica respecto al valor esperado. Además, la curva desciende suavemente en ambas
direcciones a partir del valor medio de forma asintótica, lo que quiere decir que la curva se acerca cada
vez más al eje x pero jamás llega a tocarlo.
Figura 10.4: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución normal para diferentes
valores de los parámetros µ y σ2 .
Se observó que no existe una sola distribución de probabilidad normal, sino una familia de ellas,
cuyos miembros se identican por el valor de la media y de la varianza. Por lo tanto, el número de
integrantes de esta familia es ilimitado y es imposible proporcionar una sola tabla de probabilidades
para cada combinación de la media y la varianza. Para resolver este problema, se utiliza un solo
miembro de la familia de distribuciones normales: aquel con media igual a 0 y varianza igual a 1. La
importancia de esta distribución, conocida como distribución normal estándar, radica en que todas
las distribuciones normales se pueden referenciar a ella mediante una transformación denominada
estandarización (detalles en la sección 10.3.4).
Nota. Una v.a. con distribución normal estándar se denota con Z y de acuerdo con la denición 10.3.2
es tal que Z ∼ N (0, 1). Además, se tiene que
1 1 2
φ(z) = φZ (z; 0, 1) = √ e− 2 z
2π
y
Z z
1 1 2
Φ(z) = ΦZ (z; 0, 1) = √ e− 2 t dt.
−∞ 2π
Proposición 10.3.2. Si Z es una v.a. con distribución normal estándar entonces para todo número
real Z se tiene que:
Demostración:
i.
1 1 2 1 1 2
φ(−z) = √ e− 2 (−z) = √ e− 2 z = φ(z).
2π 2π
ii. Como
Z ∞
1 1 2
P(Z > −z) = √ e− 2 t dt
−z 2π
Z −∞
1 1 2
=− √ e− 2 (−u) du
2π
Z zz
1 1 2
= √ e− 2 u du
−∞ 2π
= Φ(z)
10.3. DISTRIBUCIÓN NORMAL 295
Las probabilidades dadas en la tabla de la sección D.4 corresponden a algunas áreas bajo la curva
de la distribución normal estándar. Esta tabla muestra la función de distribución acumulada Φ(z) =
P(Z ≤ z) para diferentes valores de z donde Z ∼ N (0, 1).
Ejemplo 10.3.1. Se quiere calcular Φ(2.91) = P(Z ≤ 2.91). Para ello, primero se localiza 2.9 en
la columna izquierda de la tabla, y después a 0.01 en la la superior. Buscando en el interior de la
tabla, se observa que el renglón de 2.9 y la columna de 0.01 se intersectan en el valor 0.9982. Por
consiguiente, la probabilidad requerida es Φ(2.91) = P(Z ≤ 2.91) = 0.9982. Similarmente, se tiene que
Φ(−1.33) = P(Z ≤ −1.33) = 0.0918.
Nota. También es posible determinar Φ(−1.33) de otra forma. Primero, se encuentra el renglón
correspondiente a 1.3 y después se avanza por éste hasta la columna de 0.03. Allí se observa que
Φ(1.33) = 0.9082, sin embargo esta no es la probabilidad requerida, pero sí es su complemento. Este
hecho se puede deducir mediante el gráco de la gura 10.5. Por lo tanto, Φ(−1.33) = 1 − Φ(1.33) =
1 − 0.9082 = 0.0918.
Figura 10.5: Ilustración gráca del cálculo de probabilidades bajo la distribución normal.
Hay valores de Z que no aparecen en la tabla. En este caso, se debe aproximar a 0 las probabilida-
des correspondientes a los valores negativos y a 1, las probabilidades correspondientes a los valores
positivos. Así, Φ(3.5) ≈ 1 y Φ(−4.2) ≈ 0, por ejemplo.
Ejemplo 10.3.2. Sea Z una v.a. con distribución normal estándar. Calcular:
Solución:
296 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
α
Φ(zα ) = .
100
α
Nota. De la denición 10.3.3 se observa que 100 corresponde a una probabilidad y que P(Z > zα ) =
α
P(Z ≥ zα ) = 1 − 100 .
Solución:
α
En este caso
100 = 0.0465 y se debe encontrar un valor x tal que Φ(x) = 0.0465. Observando los
valores dentro de la tabla de la distribución normal estándar se tiene que Φ(−1.68) = 0.0465 y por lo
tanto x = z4.65 = 1.68.
10.3.4. Estandarización
Cuando una v.a. X tiene distribución normal de parámetros µ y σ2 , entonces, las probabilidades
asociadas con X se calculan estandarizando la variable X, esto es, por medio de la transformación
X −µ
.
σ
Proposición 10.3.3. Si X es una v.a. tal que X ∼ N (µ, σ 2 ) entonces se satisfacen las siguientes
propiedades:
X−µ
i. La v.a. Z dada por Z= σ tiene distribución normal estándar.
10.3. DISTRIBUCIÓN NORMAL 297
Demostración:
FZ (z) = P(Z ≤ z)
X −µ
=P ≤z
σ
= P(X ≤ σz + µ)
= FX (σz + µ)
Z σz+µ
= fX (t)dt
−∞
Z σz+µ
1 1 t−µ 2
= √ e− 2 ( σ ) dt.
−∞ 2πσ
t−µ
Haciendo la sustitución u= σ se obtiene que
Z z
1 1 2
FZ (z) = √ e− 2 u du = Φ(z)
−∞ 2π
t−µ
−∞, (σz+µ)−µ
dado que lı́mt→−∞ σ = σ =z y du = σdt.
ii.
X −µ a−µ
P(X ≤ a) = P ≤
σ σ
a−µ
=P Z≤
σ
a−µ
=Φ .
σ
iii.
a−µ X −µ b−µ
P(a ≤ X ≤ b) = P ≤ ≤
σ σ σ
a−µ b−µ
=P ≤Z≤
σ σ
b−µ a−µ
=Φ −Φ .
σ σ
298 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
Ejemplo 10.3.4. Sea X una v.a. tal que X ∼ N (100, 162 ). Calcular la probabilidad de que X tome
un valor entre 100 y 115, y que tome un valor mayor que 90.
Solución:
Demostración:
FX (xα ) = P(X ≤ xα )
xα − µ
=Φ
σ
α
= .
100
Por lo tanto
xα − µ
= zα
σ
y despejando xα se obtiene que xα = σzα + µ.
10.3. DISTRIBUCIÓN NORMAL 299
Ejemplo 10.3.5. El coeciente de inteligencia de 550 aspirantes a una beca escolar en una universidad
extranjera tiene distribución normal con media 115 y desviación estándar 10. Se pide:
b. El puntaje que, según la prueba, separa el 10 % de los aspirantes más inteligentes del resto, es decir,
el percentil 90 de X.
c. ¾Cuál debe ser el valor de la media si se quiere que la probabilidad de que un aspirante tenga un
coeciente de al menos 230 sea igual a 0.05?
Solución:
95 − 115
P(X ≥ 95) = 1 − Φ = 1 − Φ (−2) = 1 − 0.0228 = 0.9772.
10
b. Como de la tabla de la distribución normal estándar se obtiene que z90 = 1.28, entonces, de acuerdo
con la proposición 10.3.4, el percentil 90 de X es
Por consiguiente, el puntaje que, según la prueba, separa el 10 % de los aspirantes más inteligentes
del resto es 127.8.
c. La probabilidad de que un aspirante tenga un coeciente de al menos 230 sea igual a 0.05 se traduce
en P(X ≥ 230) = 0.05, expresión que a su vez es equivalente a P(X ≤ 230) = 0.95. Esto quiere
decir que, bajo esta condición, el percentil 95 de X debe ser igual a 230. Por lo tanto, se sigue que
230 = (10)(1.64) + µ de donde µ = 213.6.
Proposición 10.3.5. Sea X una variable aleatoria con distribución normal de parámetros µ y σ2 y
a y b números reales. Si Y = aX + b entonces Y tiene distribución normal de parámetros aµ + b y
(aσ)2 .
Demostración:
300 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
que corresponde a la f.g.m. de una v.a. con distribución normal de parámetros aµ + b y (aσ)2 . Por lo
tanto, siguiendo el teorema 8.8.3 se obtiene el resultado.
Ejemplo 10.3.6. Rehacer el numeral a. del ejemplo 10.3.5, suponiendo que, debido a errores en el
sistema, todos los aspirantes aumentaron su coeciente de inteligencia 8.7 % y obtuvieron un descuento
de 3 puntos.
Solución:
La distribución binomial (detalles en la sección 9.3) se puede aproximar por medio de la distribución
normal bajo ciertas condiciones. En el siguiente teorema se establece este hecho:
Teorema 10.3.6. Sea X una v.a. con distribución binomial de parámetros n y π . Si a y b son números
reales tales que a<b entonces cuando n −→ ∞ se tiene que
!
X − nπ
P a≤ p ≤b −→ Φ(b) − Φ(a)
nπ(1 − π)
Cuando se aproxima una distribución de probabilidad discreta distribución binomial mediante una
distribución de probabilidad continua distribución normal se debe hacer una corrección por con-
tinuidad en el cálculo de las respectivas probabilidades, como sigue:
a−0.5−nπ
• Si interesa aproximar P(X = a), se debe calcular P √ ≤ √X−nπ a+0.5−nπ
≤√ .
nπ(1−π) nπ(1−π) nπ(1−π)
a+0.5−nπ
• Si interesa aproximar P(X ≤ a), se debe calcular P Z≤ nπ(1−π) .
a−0.5−nπ
√
• Si interesa aproximar P(X ≥ a), se debe calcular P Z≥ .
nπ(1−π)
a−0.5−nπ
√ b+0.5−nπ
• Si interesa aproximar P(a ≤ X ≤ b) , se debe calcular P ≤Z≤ √ .
nπ(1−π) nπ(1−π)
Ejemplo 10.3.7. Sea X una v.a. con distribución binomial de parámetros n = 100 y π = 0.4.
Calcular P(X ≤ 45) de forma exacta y de forma aproximada utilizando el teorema de Moivre-Laplace.
Comparar los resultados obtenidos.
Solución:
De otra parte, calculando la probabilidad de forma aproximada por medio del teorema de Moivre-
Laplace se tiene que
!
X − (100)(0.4) 45.5 − (100)(0.4)
P(X ≤ 45) ≈ P p ≤p
(100)(0.4)(1 − 0.4) (100)(0.4)(1 − 0.4)
= P(Z ≤ 1.12)
= Φ(1.12)
= 0.86921.
En las secciones D.5, D.6 y D.7 se presentan respectivamente la f.d.p. y la tabla de probabilidades de
las distribuciones t de Student, Ji-cuadrado de Pearson y F de Snedecor, que se obtienen a partir de
la distribución normal y se utilizan frecuentemente en la inferencia estadística.
λe−λx ,
si x > 0;
fX (x; λ) =
0, en otro caso.
Nota. Cuando una v.a. X tiene distribución exponencial de parámetro λ se escribe X ∼ Exp(λ). En
5
las grácas de la gura 10.6 se presentan algunos ejemplos de la f.d.p. y la f.d.a. de la distribución
exponencial para diferentes valores de λ.
1
i. E[X] = λ. iv.
1
ii. Var[X] = λ2 . 1 − e−λx ,
si x > 0;
FX (x; λ) =
iii. mX (t) = λ 0, en otro caso.
λ−t .
Demostración:
5 Fotografía tomada de la página web http://es.wikipedia.org/wiki/Distribuci%C3%B3n_exponencial.
10.4. DISTRIBUCIÓN EXPONENCIAL 303
Figura 10.6: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución exponencial para
diferentes valores del parámetro λ.
iii. Primero se demuestra a que corresponde la f.g.m. de la variable y luego utilizando las propiedades
de esta función se obtienen el valor esperado y la varianza como sigue:
mX (t) = E eXt
Z ∞
= ext fX (x)dx
−∞
Z ∞
= ext λe−λx dx
0
Z ∞
=λ e(t−λ)x dx
0
∞
e(t−λ)x
=λ
t − λ 0
λ
= lı́m e(t−λ)x − e(t−λ)0
t − λ x→∞
λ
= (0 − 1)
t−λ
λ
=
λ−t
i.
d λ λ 1
E[X] = mX (t)
=− 2
(−1) = 2
= .
dt t=0 (λ − t) t=0 (λ − 0) λ
ii.
2
Var[X] = E X 2 − (E[X])
304 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
2
d2
1
= 2 mX (t) −
dt t=0 λ
λ 1
=− 2(λ − t)(−1) − 2
(λ − t)4 λ
2λ 1
= (λ − 0) − 2
(λ − 0)4 λ
2 1
= 2− 2
λ λ
1
= 2.
λ
Nota. Queda como ejercicio para el lector justicar detalladamente que
lı́m e(t−λ)x = 0.
x→∞
Ejemplo 10.4.1. Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una
distribución exponencial con media de 16 años. ¾Cuál es la probabilidad de que a una persona a la
que se le ha implantado este marcapasos se le deba reimplantar otro antes de 20 años?
Solución:
Aquí la v.a. de interés X es la duración de un marcapasos en una persona. Como E[X] = 16 entonces
1
λ= 16 de donde 1
1 − 16 x
fX (x; 1/16) = 16 e , si x > 0;
0, en otro caso.
Figura 10.7: Gráco de la f.d.p. (a) y de la f.d.a. (b) de una variable con distribución exponencial de parámetro
1
λ= 16
.
Nota. En el ejemplo 10.4.1 también se puede utilizar la f.d.a. para efectuar los cálculos. ¾Cómo?
Solución:
FX (µ̃X ) = 0.5
1
donde FX es la f.d.a. de X. Como X tiene distribución exponencial de parámetro λ= 16 , siguiendo
la proposición 10.6, se tiene que
1
1 − e− 16 x ,
si x > 0;
FX (x; 1/16) =
0, en otro caso.
de donde
1
1 − e− 16 µ̃X = 0.5
1
−e− 16 µ̃X = 0.5 − 1
1
e− 16 µ̃X = 0.5
1
ln e− 16 µ̃X = ln(0.5)
306 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
1
− µ̃X = ln(0.5)
16
µ̃X = −16 ln(0.5)
µ̃X = 11.0903.
Entonces, la mitad de los marcapasos tiene una vida útil menor a 11 años.
La distribución gamma es una distribución más general que la distribución exponencial y que otras
distribuciones probabilísticas. Bajo ciertas condiciones, esta distribución es de utilidad para describir
el tiempo transcurrido desde que inicia la observación de la llegada de los individuos a una línea de
espera hasta el momento en que llega un sujeto determinado, por ejemplo.
(
β α−1 −βx
fX (x; α, β) = Γ(α) (βx) e , si x > 0;
0, en otro caso.
Z ∞
Γ(x) = tx−1 e−t dt
0
es la función gamma.
Nota. Cuando una v.a. X tiene distribución gamma de parámetros α y β se escribe X ∼ G(α, β). En
6
las grácas de la gura 10.8 se presentan algunos ejemplos de f.d.p. de la distribución gamma para
diferentes valores de los parámetros α y β. En esta gura se observa por que es común denominar a
7
α parámetro de escala y a β parámetro de forma .
Bajo las condiciones de un experimento de Poisson (detalles en la sección 9.6), el número de individuos
que llegan a una línea de espera en el intervalo de tiempo (0, t] tiene distribución de Poisson de
parámetro λt. Si X denota la v.a. que representa el tiempo transcurrido desde el momento que se
Figura 10.8: Algunas grácas de la f.d.p. de la distribución gamma para diferentes valores de los parámetros α y β.
inicia la llegada de los individuos hasta el momento en que llega el n-ésimo sujeto entonces X tiene
distribución gamma de parámetros n y λ, es decir, X ∼ G(n, λ).
α
i. E[X] = β.
iv. (
0, si x ≤ 0;
FX (x; α, β) = 1
R βx α−1 −t
Γ(α) 0
t e dt, si x > 0.
Demostración:
Primero se demuestra a que corresponde la f.g.m. de la variable y luego utilizando las propiedades de
esta función se obtienen el valor esperado y la varianza como sigue:
iii.
mX (t) = E eXt
308 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
Z ∞
= ext fX (x; α, β)
−∞
Z ∞
β
= (βx)α−1 e−βx dx
ext
0 Γ(α)
Z ∞
1 α−1 −(β−t)x
= βα x e dx
0 Γ(α)
∞
βα (β − t)α α−1 −(β−t)x
Z
= x e dx
(β − t)α 0 Γ(α)
α Z ∞
β (β − t)
= ((β − t)x)α−1 e−(β−t)x dx
β−t 0 Γ(α)
α
β
= (1)
β−t
α
β
=
β−t
i.
βα βα
d α
E[X] = mX (t)
= (−α)(−1)
α+1
= α α+1
= .
dt t=0 (β − t) t=0 β β
ii.
2
Var[X] = E X 2 − (E[X])
2
d2
α
= 2 mX (t)
−
dt t=0 β
βα α2
= α(−(α + 1))(−1) α+2
− 2
(β − t)
t=0 β
βα α2
= (α2 + α) α+2
− 2
β β
α
= .
β2
iv. Se tiene que FX (x; α, β) = 0 siempre que x≤0 porque fX (x; α, β) = 0. De otra parte, si x>0
entonces
Z x
FX (x; α, β) = fX (u; α, β)du
−∞
Z x
β
= (βu)α−1 e−βu dt
0 Γ(α)
Z x
β
= (βu)α−1 e−βu dt
Γ(α) 0
Z xβ
β 1 α−1 −t
= t e dt
Γ(α) 0 β
10.6. DISTRIBUCIÓN BETA 309
Z xβ
1
= tα−1 e−t dt
Γ(α) 0
dado que t = βu de donde dt = βdu.
Ejemplo 10.5.1. La gerencia de servicio al cliente de una cadena de supermercados le indica a la
junta directiva que el valor esperado del tiempo transcurrido desde la apertura de un punto de pago
hasta el momento en que llega el cuarto cliente es 2 minutos con una desviación estándar de 1 minuto.
La junta directiva ha decidido hacer una inversión considerable en infraestructura para disminuir el
tiempo de espera de los clientes siempre y cuando el tiempo transcurrido desde la apertura de un
punto de pago hasta el momento en que llega el cuarto cliente sea de al menos 5 minutos ocurra con
una probabilidad superior a 0.9. Suponiendo que la distribución del tiempo transcurrido es de tipo
gamma, ¾la gerencia de servicio al cliente debe recomendar la inversión?
Solución:
Sea X la v.a. que representaba el tiempo transcurrido desde la apertura de un punto de pago hasta
el momento en que llega el cuarto cliente que se supone tiene distribución gamma de parámetros α
2β
y β. Como µX = α
β = 2 y σX = α
β2 = 1, entonces α = 2β y
β2 =1 de donde β=2 y α = 4. Así, se
tiene que X ∼ G(4, 2).
La gerencia de servicio al cliente debe recomendar la inversión si P(X ≥ 5) > 0.9. Calculando se
obtiene que:
La distribución beta se utiliza frecuentemente para modelar v.a.'s que mesuren una proporción, ya que
está distribución solamente toma valores entre 0 y 1. Ejemplos de variables que sigan esta distribución
310 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
1 α−1
− x)β−1 ,
B(α,β) x (1 si 0 < x < 1;
fX (x; α, β) =
0, en otro caso.
Z 1
B(x) = tα−1 (1 − x)β−1 dt
0
es la función beta.
Nota. Cuando una v.a. X tiene distribución beta de parámetros α y β se escribe X ∼ B(α, β). En las
8
grácas de la gura 10.9 se presentan algunos ejemplos de la f.d.p. y la f.d.a. de la distribución beta
para diferentes valores de los parámetros α y β.
Figura 10.9: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución beta para diferentes
valores de los parámetros α y β.
Nota. La distribución uniforme continua de parámetro sobre el intervalo (0,1) es un caso especial de
la distribución beta de parámetros α=1 y β = 1, esto es, U (0, 1) ≡ B(1, 1). ¾Por qué?
α
i. E[X] = α+β .
αβ
ii. Var[X] = (α+β+1)(α+β)2 .
8 Fotografía tomada de la página web http://es.wikipedia.org/wiki/Distribuci%C3%B3n_beta.
10.6. DISTRIBUCIÓN BETA 311
iii.
∞ k−1
!
X Y α+r tk
mX (t) = 1 +
r=0
α+β+r k!
k=1
.
iv.
0, Rx si x ≤ 0;
1
FX (x; α, β) = B(α,β) 0
tα−1 (1 − t)β−1 dt, si 0 < x < 1;
x ≥ 1.
1, si
Nota. En Blanco (2004, p. 151) se estipula que las funciones gamma y beta se relacionan mediante la
identidad
Γ(x)Γ(y)
B(x, y) =
Γ(x + y)
donde x y x son números reales positivos.
Ejemplo 10.6.1. El asesor nanciero de una empresa de electrodomésticos le asegura al gerente ge-
neral que semanalmente no se están cumpliendo las metas en relación a las ventas de los productos y
que por tal motivo éste debe intervenir. Anteriormente, una empresa de consultoría le había suminis-
trado al gerente un informe en el que se precisa que el porcentaje de artículos que se venden durante
una semana dada tiene distribución beta de parámetros α=2 y β = 4. Con base en este modelo, el
gerente cree que, si la proporción de artículos que se venden semanalmente no supera el 0.8 con una
probabilidad mayor a 0.5 entonces debe ejecutar urgentemente un plan de acción. ¾Qué decisión debe
tomar el gerente?
Solución:
Sea X la v.a. que denota el porcentaje de artículos que se vende durante una semana dada que según
el informe sigue una distribución beta de parámetros α = 2 y β = 4, esto es, X ∼ B(2, 4). El gerente
ha decidido ejecutar un plan de acción siempre que P(X ≤ 0.8) ≥ 05. Calculando se obtiene que:
P(X ≤ 0.8) = FX (0.8; 2, 4)
Z 0.8
1
= t2−1 (1 − t)4−1 dt
B(2, 4) 0
Z 0.8
1
= t(1 − t)3 dt
B(2, 4) 0
Z 0.8
1
= t(1 − t)3 dt
1/20 0
= (20)(0.049664)
= 0.99328.
En consecuencia, el gerente no debe ejecutar el plan de acción.
R 0.8 3
Nota. Queda como ejercicio para el lector justicar que B(2, 4) = 1/20 y que
0
t(1 − t) dt =
0.049664.
312 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
Con el propósito de ofrecer un panorama más amplio y a su vez menos restrictivo para describir
variables aleatorias, en esta se sección se presentan sin demostración las generalidades de otras distri-
buciones probabilísticas de uso común en estadística.
9
Nota. En las grácas de la gura 10.10 se presentan algunos ejemplos de la f.d.p. y la f.d.a. de la
distribución de Weibull para diferentes valores de los parámetros α y β. En esta gura se observa por
que es común denominar a α parámetro de escala y a β parámetro de forma.
Figura 10.10: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución de Weibull para
diferentes valores de los parámetros α y β.
i. E[X] = αΓ 1 + β1 . iv.
2
ii. Var[X] = α2 Γ 1 + β2 − (E[X]) . (
0, si x < 0;
P∞ k k FX (x; α, β) = −( α
x
)
β
1
fX (x; α, β) = 2
x−α
πβ 1 + β
1
fX (x; 0, 1) = .
π (1 + x2 )
10
En las grácas de la gura 10.11 se presentan algunos ejemplos de la f.d.p. y la f.d.a. de la distribución
de Cauchy para diferentes valores de los parámetros α y β . En esta gura se observa por que es común
denominar a α parámetro de localización y a β parámetro de escala.
Figura 10.11: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución de Cauchy para
diferentes valores de los parámetros α y β.
ii. no existe.
Var[X] 1 x−α
FX (x; α, β) = arctan .
iii. mX (t) no existe. π β
11
Nota. En las grácas de la gura 10.12 se presentan algunos ejemplos de la f.d.p. y la f.d.a. de la
distribución de Laplace para diferentes valores de los parámetros α y β. En esta gura se observa por
que es común denominar a α parámetro de localización y a β parámetro de escala.
Figura 10.12: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución de Laplace para
diferentes valores de los parámetros α y β.
i. E[X] = α.
ii. Var[X] = 2β 2 .
eαt
iii. mX (t) = 1−β 2 t2 .
iv.
1 |x−α|
FX (x; α, β) = 1 + sgn(x − α) 1 − e− β .
2
11 Fotografía tomada de la página web http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_Laplace.
10.8. COMENTARIOS 315
( 2
ln(x)−µ
− √
√ 1 e 2σ , si x > 0;
fX (x; µ, σ) = 2πσx
0, en otro caso.
12
Nota. En las grácas de la gura 10.13 se presentan algunos ejemplos de la f.d.p. y la f.d.a. de la
distribución de lognormal cuando el parámetro µ = 0 para diferentes valores del parámetro σ . En esta
gura se observa por que es común denominar a σ parámetro de forma.
Figura 10.13: Algunos ejemplos de la f.d.p. (izquierda) y de la f.d.a. (derecha) de la distribución lognormal cuando el
parámetro µ=0 para diferentes valores del parámetro σ.
1 2
i. E[X] = eµ+ 2 σ .
2 2
ii. Var[X] = eσ − 1 e2µ+σ .
10.8. Comentarios
En esta sección se presentan con cierto grado de profundidad los aspectos más relevantes de las
distribuciones continuas de uso frecuente en la estadística. Se abordan el valor esperado, la varianza,
la f.g.m. y la f.d.a. de las distribuciones uniforme continua, normal y exponencial, entre otras. El
manejo adecuado de estas distribuciones probabilísticas da al lector una herramienta poderosa para
entender y aplicar varias técnicas relevantes de la inferencia estadística. Se enfatiza el uso pertinente
de la distribución normal, pues ésta es parte importante de la mayoría de las prácticas probabilísticas
porque, como lo indica el teorema del límite central, bajo ciertas condiciones, la distribución del
promedio muestral converge a la distribución normal a medida que aumenta el tamaño de la muestra,
sin que importe la distribución original de la variable de interés. Finalmente, también se abordan los
tópicos relacionados con otras distribuciones continuas de uso común, promoviendo su uso por medio
de ejemplos y ejercicios, donde se estudian sus posibles aplicaciones.
10.9. Ejercicios
10.1 Si X es una v.a. tal que X ∼ N (10, 4), calcular las siguientes probabilidades:
10.2 Calcular los percentiles 90, 95 y 99 para la v.a. del ejercicio 10.1.
10.3 Una empresa estatal puede comprar materia prima a dos proveedores diferentes y está interesada
en el contenido de impurezas del producto. Una revisión de los registros de cada proveedor indi-
ca que los niveles de impurezas contenidos en sendas remesas de producto siguen distribuciones
normales con media y desviación típica contenidas en la tabla de abajo. La empresa está especial-
mente preocupada porque el contenido de impurezas no exceda el 4 %, y comprará al proveedor
que con más probabilidad cumpla con este requisito. ¾Qué proveedor habrá que elegir?
Proveedor µ σ
Proveedor A 3.3 0.3
Proveedor B 3.1 0.5
10.4 Estudiando los productos de una compañía fabricante de una maquinaria especíca, se identicó
que la vida promedio de dicha maquinaria es dos años con una desviación estándar de un mes.
La empresa reemplaza gratis todas las maquinarias que fallen dentro del tiempo de garantía y
ha decidido reemplazar solo el 1 % de las maquinarias que fallen. Si la duración de la maquinaria
sigue una distribución normal, ¾de qué duración debe ser la garantía que ofrezca la compañía?
10.6 Las calicaciones de los 675 aspirantes presentados a un examen para contratación laboral, se
distribuye normalmente con media 6.5 y varianza 4.
10.9. EJERCICIOS 317
d. ¾Cuál es el puntaje que separa el 5 % de los estudiantes más calicados del resto?
10.7 La estatura media de los alumnos de un centro educativo es de 164 cm y solo 24 de los 200
alumnos miden menos de 150 cm. Suponiendo que la estatura de los alumnos tiene distribución
normal, ¾cuál es la desviación estándar de la estatura?
10.8 El percentil 70 de una distribución normal es igual a 88, siendo 0.27 la probabilidad de que
la variable tenga un valor inferior a 60. Calcular la media y la desviación estándar de esta
distribución.
10.9 Las puntuaciones de un examen se distribuyen normalmente con media 15 puntos. La puntuación
a ha sido superada por el 23 % de los alumnos. La puntuación b está situada a 5 puntos por debajo
de la media. Entre b y la media se encuentra el 30 % de los alumnos. Calcular la desviación típica
de las calicaciones y el porcentaje de alumnos entre a y b.
10.10 En un estudio realizado sobre los ingresos familiares en los que los dos cónyuges trabajan, se ha
observado que el salario mensual, en miles de pesos, de las mujeres (X ) se distribuye normalmente
con media 100, en tanto que el de los hombres (Y ) está dado por la siguiente transformación
Y = X + 20. Además, el 15 % de los hombres no superan el percentil 75 de las mujeres.
c. Calcular e interpretar el coeciente de variación del salario de los hombres y de las mujeres.
10.11 El tiempo de reparación de cierta maquinaria tiene una distribución exponencial con media 22
minutos.
a. Hallar la probabilidad de que el tiempo de reparación sea menor que diez minutos.
b. El costo de reparación es de 2,000 USD por cada media hora o fracción. ¾Cuál es la probabi-
lidad de que una reparación cueste 4,000 USD o más?
c. Para efectuar una programación, ¾cuánto tiempo se debe asignar a cada reparación para que
la probabilidad de que cualquier tiempo de reparación mayor que el tiempo asignado sea solo
de 0.1?
10.12 Ejercicio tomado de Blanco (2004, p. 138). Un instructor asume que las calicaciones nales de
los estudiantes son los valores de una v.a. X con distribución normal de parámetros µ y σ 2 . El
instructor decide asignar la calicación A a aquellos estudiantes cuyo puntaje exceda a µ + σ,
la calicación B a aquellos estudiantes cuyo puntaje estén entre µ y µ + σ , la calicación C a
aquellos estudiantes cuyos puntajes estén entre µ−σ y µ, la calicación D a aquellos estudiantes
cuyos puntajes estén entre µ − 2σ y µ − σ, y la calican F a aquellos estudiantes cuyos puntajes
sean inferiores a µ − 2σ . Encontrar el porcentaje de estudiantes que obtienen como calicación
A, B, C, D o F.
318 CAPÍTULO 10. DISTRIBUCIONES CONTINUAS
10.13 Los pesos (en kilogramos) de 2,000 estudiantes presentan una distribución normal de media 65
y desviación típica 8. Calcular la probabilidad de que un estudiante elegido al azar pese:
a. más de 61.
b. entre 63 y 69.
c. menos de 70.
d. más de 75.
10.14 Sea X una v.a. tal que X ∼ U (a, b). Determinar el valor de los parámetros a y b teniendo en
cuenta que E [X] = 6 y P(X ≤ 6) = 0.5.
10.15 Sea X una v.a. tal que X ∼ U (0, 1). Hallar la f.d.p. de la v.a. Y = X 2 + 1.
10.17 El personal de una compañía usa una terminal para realizar sus pedidos internacionales. El
tiempo que emplea un comercial en la terminal tiene distribución exponencial con una media de
36 minutos.
10.18 Con la información del ejemplo 10.4.1 Si el marcapasos lleva funcionando correctamente 5 años
en un paciente, ¾cuál es la probabilidad de que haya que cambiarlo antes de 25 años?
10.19 Un punto aleatorio X tiene distribución uniforme en el intervalo [0, 1] y otro punto aleatorio Y
tiene distribución uniforme en el intervalo [2, 3]. Se dene la v.a. D como la distancia entre X y
Y dada por D = |Y − X|. Calcular el valor esperado de D.
10.20 Se sabe que la cantidad aleatoria demandada durante un periodo de tiempo por parte de una
empresa textil tiene distribución uniforme y no supera una tonelada. Determinar para dicho
periodo de tiempo:
b. La probabilidad de que la cantidad demandada no esté comprendida entre 800 y 900 kilogra-
mos.
10.21 Una empresa tiene una función de costos que viene dada por C = 2X + 100, 000. En el mercado
vende cada unidad a 5 euros y la demanda X del artículo tiene distribución uniforme entre 25,000
y 30,000 unidades. ¾Cuál es el benecio esperado y la varianza?
10.9. EJERCICIOS 319
10.23 Demostrar que si X es una v.a. con distribución exponencial de parámetro λ entonces la mediana
ln(2)
de X es
λ .
10.24 Demostrar que si X es una v.a. con distribución normal de parámetros µ y σ2 entonces la media,
la mediana y la moda de X coinciden y son iguales a µ.
10.25 Demostrar que si X es una v.a. con distribución normal de parámetros µ y σ 2 y a y b son número
reales entonces Y = aX + b es una v.a. con distribución normal de parámetros aµ + b y a2 σ 2 .
10.26 Con la información del ejemplo 10.3.5, rehacer el numeral a. suponiendo que, debido a errores
en el sistema, todos los aspirantes aumentaron su coeciente de inteligencia 8.7 % y obtuvieron
un descuento de 3 puntos.
α−1
X (βx)k
FX (x) = 1 − e−βx .
k!
k=0
10.30 Demostrar que la distribución uniforme continua de parámetro sobre el intervalo (0,1) es un caso
especial de la distribución beta de parámetros α=1 y β = 1.
(
(α+β+1)! α−1
(α−1)!(β−1)! x (1 − x)β−1 , si 0 < x < 1;
fX (x) =
0, en otro caso.
10.32 Demostrar que si X es una v.a. con distribución de Cauchy de parámetros α y β entonces el
valor esperado de X no existe.
Capı́tulo 11
Distribuciones de probabilidad
multivariadas
(Emilio Pablo Berdugo Camacho)
11.1. Introducción
Como ejemplo de motivación, se retoma el ejemplo 6.4.2 donde se consideran las variables peso y edad.
Como la edad no se ha jado antes de extraer la muestra, se sigue que estas variables son aleatorias
y de manera a priori se puede suponer cierta relación probabilística entre ellas (el valor signicativo
del coeciente de correlación de Pearson calculado en el ejemplo 6.5.3 así lo sugiere). Por ejemplo,
3
se quiere construir un modelo probabilístico para estimar la probabilidad de observar un niño de la
población de interés con un peso superior a 40 kilogramos y una edad inferior a 12.5 años. En este caso,
1 Este capítulo fue en su totalidad escrito por M.Sc. Emilio Pablo Berdugo Camacho y revisado por los autores.
2 Un estudio multivariado e aquel donde se observa más de una variable respuesta que se analizan conjuntamente.
3 Los procedimientos de estimación pertenecen a la estadística inferencial que se presenta en la denición 1.4.2.
320
11.2. VECTORES ALEATORIOS 321
es claro que no parece adecuado construir separadamente modelos individuales para cada variable; en
lugar de ello, se debe pensar en un modelo conjunto que tenga en cuenta el grado de asociación entre
estas dos características.
Los vectores aleatorios son los objetos de interés de los estudios multivariados. A continuación se
presentan las generalidades de este tipo de objetos.
X1
X2
T
X = . = [X1 , X2 , . . . , Xp ] .
..
Xp
6
En principio, todas las componentes deben estar denidas sobre el mismo espacio de probabilidad ,
7
lo cual obliga, entre otras cosas, a que todas las variables sean discretas o continuas . De esta forma,
se dice que un vector aleatorio es discreto si todas sus componentes lo son v.a.d.'s, y análogamente,
se dice que un vector aleatorio es continuo si todas sus componentes son v.a.c.'s.
A continuación se presenta un ejemplo de un vector aleatorio conocido como vector aleatorio mul-
tinomial :
Ejemplo 11.2.1. Se consideran las condiciones bajo las cuales se dene una v.a. binomial en la sección
9.3, pero ahora el experimento admite p posibles resultados excluyentes entre sí, representados con
Una ilustración de un vector aleatorio multinomial consiste en un proceso de control de calidad en una
8
industria donde se toma una muestra aleatoria de 25 artículos producidos en una semana determinada.
Después de una inspección, los artículos se clasican según su estado de calidad como aceptable,
inferior o intolerable. Se denen las v.a.'s X1 , X2 y X3 como número de artículos clasicados como
aceptables, número de artículos clasicados como inferiores y número de artículos clasicados como
intolerables respectivamente. Es claro que estas variables solo pueden tomar valores enteros positivos
y además satisfacen la restricción X1 + X2 + X3 = 25. De esta forma, si en la muestra se observan 20
artículos aceptables, 2 en con calidad inferior y 3 intolerables, entonces el vector aleatorio observado
T
es x = [20, 2, 3] .
En el siguiente ejemplo considera un vector aleatorio que consiste en una generalización multivariada
de la distribución normal (detalles en la sección 10.3). Este vector se llama vector aleatorio normal
multivariado :
Como se indicó en la introducción, en situaciones donde se estudia más una variable asociada al mismo
fenómeno aleatorio, puede ser inadecuado construir modelos probabilísticos individuales debido a que
esta estrategia no tiene en cuenta las posibles relaciones de asociación. En lugar de ello, se construyen
modelos o distribuciones de probabilidad conjuntas que permitan calcular probabilidades de eventos
asociados con más de una variable. Estas distribuciones conjuntas se abordan separadamente para
vectores de componentes discretas y luego continuas.
8 Para que el supuesto de independencia sea válido, el tamaño de muestra debe ser muy pequeño en comparación
con la producción semanal.
11.3. DISTRIBUCIONES CONJUNTAS DE PROBABILIDAD 323
El caso en el que un vector aleatorio posea dos componentes, además de ser el más simple, es uno de
los más comunes en las aplicaciones, y por esta razón es el caso que se considera inicialmente. Una
vez se desarrolla la teoría para el escenario bivariado (dos variables), su extensión resulta inmediata
para más de dos componentes.
Se considera el caso en el que un vector aleatorio X contiene dos componentes discretas X y Y . La idea
es hacer una extensión del concepto de f.m.p. presentando en la sección 8.2 para una v.a. discreta y
que permita calcular probabilidades conjuntas de la forma P X = (x, y)T , denotadas frecuentemente
mediante P(X = x, Y = y).
(
1
36 , si (x, y)T ∈ {1, 2, 3, 4, 5, 6} × {1, 2, 3, 4, 5, 6},
fXY (x, y) =
0, en otro caso.
donde X es la v.a.d. que corresponde al primer resultado obtenido, Y la v.a.d. asociado con el
9 Los dados se llaman distinguibles si es posible diferenciarlos por alguna característica como tamaño, color o textura.
324CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
0.04
● ● ● ● ● ●
● ● ● ● ● ●
● ● ● ● ● ●
0.03
y
6
fXY(x, y)
5
0.02
4
3
0.01
2
1
0.00
0
0 1 2 3 4 5 6 7
Figura 11.1: Función másica de probabilidad conjunta de las variables asociadas con los resultados de dos dados
distinguibles y balanceados.
Ejemplo 11.3.2. En la tabla 6.3 se muestra la distribución porcentual conjunta de las variables
género y nivel educativo de una muestra conformada por 46 empleados de una empresa. Las frecuencias
10 El producto cartesiano entre los conjuntos A y B es el conjunto conformado por todas las parejas ordenadas
cuya primera componente es un elemento del conjunto A y cuya segunda componente es un elemento del conjunto B ,
esto es, A × B = {(x, y) : x ∈ A y y ∈ B}.
11 Si los dados no fuesen balanceados algunos resultados serían más probables que otros y en consecuencia la distri-
bución de probabilidad conjunta no sería constante.
11.3. DISTRIBUCIONES CONJUNTAS DE PROBABILIDAD 325
12
relativas asociadas a cada una de las celdas centrales de la tabla se pueden considerar estimaciones
puntuales de los valores de la función de probabilidad conjunta de las variables en cuestión. Se observa
que las componentes del vector aleatorio de estudio son ambas de naturaleza categórica. Así, con base
en los valores de la tabla es posible estimar probabilidades como:
0.25
0.20
0.15
0.10
0.05
Preg.
0.00
Bach.
Hombre Mujer
Figura 11.2: Función másica de probabilidad conjunta estimada para las variables género y nivel educativo .
12 En inferencia estadística se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de
un parámetro de una población a partir de los datos proporcionados por una muestra (Wikipedia 2012d).
326CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
XX
FXY (x, y) = P(X ≤ x, Y ≤ y) = fXY (u, v)
u≤x v≤y
13
Un gráco típico de una función de distribución acumulada conjunta de un vector aleatorio bivariado
se muestra en la gura 11.3. Esta es una función escalonada que se mantiene constante dentro de un
grupo de regiones rectangulares del plano xy .
Figura 11.3: Función de distribución acumulada conjunta para dos variables discretas.
Ejemplo 11.3.3. Construir la función de distribución acumulada conjunta para las v.a.'s X y Y del
ejemplo 11.3.1.
Solución:
Para construir FXY (x, y) en este escenario se deben considerar los siguientes casos:
• Caso 1: x < 1 o y < 1. En este caso se tienen probabilidades de la forma P[(X < 1) ∩ (Y < y)]
o P[(X < x) ∩ (Y < 1)], para los cuales se cumple que:
FXY (x, y) = P[(X < 1) ∩ (Y < y)] = P[φ ∩ (Y < y)] = P(φ) = 0
o
FXY (x, y) = P[(X < x) ∩ (Y < 1)] = P[(X < x) ∩ φ] = P(φ) = 0.
• Caso 2: (x, y)T ∈ [1, 6] × [1, 6]. En este caso se tiene que:
6 X 6
X 1 1
FXY (x, y) = = · 36 = 1.
u=1 v=1
36 36
La tabla 11.1 muestra todos los valores de FXY (x, y). Aunque no es necesario elaborar esta tabla,
ya que se puede construir una expresión cerrada para la función de distribución acumulada conjunta,
no en todos lo casos es posible contar con dicha expresión y la única forma de expresar FXY (x, y)
es tabular. La gura 11.4 muestra la gráca de la función de distribución acumulada conjunta de las
variables asociadas con los resultados de dos dados distinguibles y balanceados.
i. lı́m lı́m FXY (x, y) = lı́m FXY (x, y) = lı́m FXY (x, y) = 0.
x→−∞ y→−∞ x→−∞ y→−∞
328CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
X \Y Y <1 1≤Y <2 2≤Y <3 3≤Y <4 4≤Y <5 5≤Y <6 6≤Y
X<1 0 0 0 0 0 0 0
1≤X<2 0 1/36 1/18 1/12 1/9 5/36 1/6
2≤X<3 0 1/18 1/9 1/6 2/9 5/18 1/3
3≤X<4 0 1/12 1/6 1/4 1/3 5/12 1/2
4≤X<5 0 1/9 2/9 1/3 4/9 5/9 2/3
5≤X<6 0 5/36 5/18 5/12 5/9 25/36 5/6
6≤X 0 1/6 1/3 1/2 2/3 5/6 1
Tabla 11.1: Valores de la función de distribución acumulada conjunta de las variables asociadas con los resultados de
dos dados distinguibles y balanceados.
1.0
0.8
F(x,y)
0.6
0.4
0.2
0.0
8
6
8
4
y
6
2 4
x
2
0 0
Figura 11.4: Función de distribución acumulada conjunta de las variables asociadas con los resultados de dos dados
distinguibles y balanceados.
iii. Si y2 > y1 y x2 > x1 entonces FXY (x2 , y2 ) + FXY (x1 , y1 ) − FXY (y2 , x1 ) − FXY (y2 , x2 ) > 0.
Yp
n
fX (x1 , x2 , . . . , xp ) = π xi
x1 x2 · · · xp i=1 i
Pp
donde n es el número de ensayos y (x1 , x2 , . . . , xp )T es un elemento de Np tal que i=1 xi = n.
Demostración:
x1 x2 xp
está dada por π1 π2 · · · πp . Es posible reorganizar esta secuencia de resultados por medio de per-
mutaciones en donde los elementos pertenecientes a la misma serie de resultados son indistinguibles.
De acuerdo con la técnica implementada en los ejemplos 7.7.25 y 7.7.26, existen
n!
x1 !x2 ! · · · xp !
fX (x1 , x2 , . . . , xp ) = P(X1 = x1 , X2 = x2 , . . . , Xp = xp )
n!
· π1x1 π2x2 · · · πpxp
=
x1 !x2 ! · · · xp !
Y p
n
= π xi
x1 x2 · · · xp i=1 i
Nota. Cuando un vector aleatorio X tiene distribución multinomial de parámetros n, p, π1 , π2 , . . . , πp
se escribe X ∼ M N (n, π1 , π2 , . . . , πp ).
El rango de un vector con distribución multinomial aunque es nito puede llegar a tener un cardinal
n+p−1
considerable. Se puede demostrar (ejercicio 11.2) que tal rango tiene un cardinal dado por .
n
330CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
25+3−1
Como ilustración, el cardinal para el rango del vector multinomial en el ejemplo 11.2.1 es
25 =
27
25 = 351. Es decir, el vector que clasica a los artículos según su estado de calidad puede asumir
351 diferentes realizaciones.
Ejemplo 11.3.4. Si en el ejemplo 11.2.1 se asume que las proporciones de artículos clasicados
con calidad aceptable, inferior e intolerable son 0.97, 0.02 y 0.01 respectivamente, calcular la
probabilidad para los valores observados en el ejemplo a partir de una muestra de 25 artículos.
Solución:
Los valores observados incluyen 20 artículos aceptables, 2 en con calidad inferior y 3 intolerables.
Según la información suministrada X ∼ M N (25, 0.97, 0.02, 0.01). Se examinan que tan probables son
los valores observados como sigue:
La distribución conjunta de probabilidad para dos v.a.c.'s X e Y puede ser especicada al proporcionar
un método que permita calcular la probabilidad de que estas dos variables asuman valores en una región
14 Esta es la base de la inferencia estadística: si bajo un modelo probabilístico asumido se obtiene información muestral
poco probable, entonces dicho modelo no es apropiado de manera parcial o total.
11.3. DISTRIBUCIONES CONJUNTAS DE PROBABILIDAD 331
R del espacio bidimensional R2 . Como una extensión directa del caso unidimensional tratado en la
denición 8.3.1, la idea es introducir una función de densidad cuya integral doble sobre la región R
proporcione la probabilidad de interés.
Denición 11.3.3. Una función fXY : R −→ [0, ∞) se dice que es una función de
densidad conjunta del vector aleatorio X = [X, Y ]T conformado por las v.a.c.'s X
y Y si satisface las siguientes condiciones:
P[(x, y)T ∈ R] = R2
RR
ii. fXY (x, y)dxdy , para cualquier región R contenida en
R
RR R∞ R∞
iii. fXY (x, y)dxdy = fXY (x, y)dxdy = 1
R2 −∞ −∞
Nota. Aunque la integral en iii. se calcula por denición sobre todo R2 , en la práctica ésta se considera
T 2
sobre la región S := {(x, y) ∈ R : fXY (x, y) 6= 0} llamada el soporte de fXY .
La gráca de fXY (x, y) es una supercie en el espacio tridimensional R3 tal como se muestra en la
15 T
gura 11.5, donde también se puede observar queP[(x, y) ∈ R] es el volumen del sólido acotado
inferiormente por la región R, superiormente por la supercie fXY (x, y) y lateralmente por la supercie
cilíndrica obtenida al proyectar R sobre fXY (x, y).
Ejemplo 11.3.5. Sea X la v.a. que representa el tiempo en milésimas de segundo que demora un
servidor de computadora en conectar un equipo, y Y la v.a. que representa el tiempo en milésimas de
segundo que demora dicho servidor en autorizar el equipo como un usuario válido. Es evidente que
X <Y, ya que primero se necesita tener conexión antes de iniciar sesión como usuario. Se asume que
la función de densidad conjunta de (X, Y )T viene dada por
16
:
(x+2y)
(
ke− 1,000 si 0 < x < y,
fXY (x, y) =
0 en otro caso.
a. Determinar el valor de k de tal forma que fXY (x, y) sea una función de densidad válida.
Solución:
a. El soporte de fXY (x, y) es el región del primer cuadrante ubicada encima de la recta y = x, como
se muestra en la gura 11.6. La constante desconocida k debe ser tal que se satisfaga la propiedad
Figura 11.5: Ejemplo de una función de densidad conjunta de un vector aleatorio bidimensional.
Z∞ Z∞ Z∞ Z∞ Z∞ Z∞
(x+2y) (x+2y)
−
fXY (x, y)dxdy = ke 1,000 dydx = k e− 1,000 dy dx
−∞ −∞ 0 x 0 x
Z∞ Z∞ Z∞
y x x x
− 1,000
=k e − 500
dy e dx = k 500 e− 500 e− 1,000 dx
0 x 0
Z∞
3x
− 1,000 1, 000 500, 000
= 500k e dx = 500k =k
3 3
0
= 1.
3
En consecuencia k= 500,000 . La gráca de fXY (x, y) se muestra en la gura 11.7.
b. La región de interés puede expresarse como R := {(x, y)| 0 < x < y, 0 < x < 1000, 0 < y < 2000}
y aparece descrita en la gura ??. La probabilidad pedida está dada por:
1,000
Z 2,000
Z
P(X < 1, 000, Y < 2, 000) = fXY (x, y)dxdy
0 x
11.3. DISTRIBUCIONES CONJUNTAS DE PROBABILIDAD 333
1,000
Z 2,000
Z
3 (x+2y)
= e− 1,000 dydx
500, 000
0 x
1,000
Z 2,000
Z
3 y
x
= e− 500 dy e− 1,000 dx
500, 000
0 x
1,000
Z
3 x x
e− 500 − e−4 e− 1,000 dx
= 500
500, 000
0
1,000
Z
3 3x x
= e− 1,000 − e−4 e− 1,000 dx
1, 000
0
3 1, 000
1 − e−3 − 1, 000e−4 1 − e−1
=
1, 000 3
= 1 − e−3 − 3e−4 + 3e−5
Por lo tanto, se sigue que P(X < 1, 000, Y < 2, 000) = 0.9155.
1e+10
3000
2000
R
5e+09
soporte de f(XfXY
Y ((x,
x, yy)))
y
1000
0e+00
x x
Figura 11.6: Soporte de la función de densidad conjunta y región de integración de la probabilidad pedida del del
ejemplo 11.3.5.
4e−06
3e−06
f(x,y)
2e−06 2000
1e−06
1500
0e+00
0
1000
y
500
1000 500
x
1500
2000 0
Figura 11.7: Función de densidad conjunta de las variables asociadas a los tiempos de respuesta en un servidor de
computadoras.
En el escenario continuo FXY (x, y) cumple las mismas propiedades señaladas en la proposición 11.3.1
y además, en los puntos donde fXY es continua, se cumple que:
∂ 2 FXY (x, y) ∂ 2 FXY (x, y)
fXY (x, y) = = .
∂x∂y ∂y∂x
Ejemplo 11.3.6. Obtener la función de distribución acumulada conjunta FXY (x, y) de las variables
X y Y del ejemplo 11.3.5 y comprobar a partir de ésta que se puede obtener la función de densidad
conjunta fXY (x, y).
Solución:
FXY (x, y) = P (X ≤ x, Y ≤ y)
Z xZ y
3 (u+2v)
= e− 1,000 dvdu
0 u 500, 000
Z x Z y
3 v u
= e− 500 dv e− 1,000 du
500, 000 0 u
Z x
3 3u
− 1,000 y u
= e − e− 500 e− 1,000 du
1, 000 0
3u x
y u
= 3e− 500 e− 1,000 − e− 1,000
0
y x 3x x
− 500 − 1,000 − 1,000
= 3e e −e − 3e− 500 + 1
x
y
= e− 1,000 − 1 3e− 500 − 1 .
Y en consecuencia:
x y
e− 1000 − 1 3e− 500 − 1 ,
si 0 < x < y;
FXY (x, y) =
0, en otro caso.
∂ 2 FXY (x, y)
∂ ∂ − 1,000x
y
= e − 1 3e− 500 − 1
∂x∂y ∂x ∂y
∂ 3 − y − 1,000 x
= − e 500 e −1
∂x 500
3 − y ∂ − 1,000 x
=− e 500 e −1
500 ∂x
3 − y 1 x
= − e 500 − e− 1,000
500 1, 000
3 (x+2y)
= e− 1,000
500, 000
= fXY (x, y)
336CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
0.8
0.6
F(x,y)
0.4
0.2
0.0
10000
8000
6000 10000
8000
y
4000
6000
2000 4000 x
2000
0 0
Figura 11.8: Función de distribución acumulada conjunta para las variables asociadas a los tiempos de respuesta en
un servidor de computadoras.
En el ejemplo 11.2.2 se describe de manera simple un vector normal multivariado. En esta sección se
hace énfasis particular en el escenario p = 2, conocido como vector normal bivariado.
( 2 2 )
x−µX x−µX y−µY y−µY
σX −2ρXY σX σY + σY
exp 2(ρ2XY −1)
fXY (x, y; µX , µY , σX , σY , ρXY ) = p
2πσX σY 1 − ρ2XY
Nota. Los parámetros µX , µY y σX , σY son respectivamente los valores esperados y las desviaciones
típicas de las variables X e Y . El parámetro ρXY es tal que
R∞ R∞
(x − µX )(y − µY )fXY (x, y)dxdy
−∞ −∞
ρXY =
σX σY
11.3. DISTRIBUCIONES CONJUNTAS DE PROBABILIDAD 337
0.15
f(x,y)
0.10
3
0.05 3 0.8 2
2 1
1 0.6 0
y
−3
F(x,y
−2 0 −1
0.4
y
−1
)
−1 −2
0 0.2
x 1 −2
−3
2 −3 −2 −1 0 1 2 3
3 −3 x
Figura 11.9: Función de densidad conjunta y función de distribución acumulada conjunta de la distribución normal
bivariada de parámetros µX = µY = ρXY = 0 y σX = σY = 1.
Para la distribución normal bivariada al igual que en el escenario univariado la función de distri-
bución acumulada FXY (x, y) está expresada mediante una integral que no tiene forma cerrada y por
tanto sus valores deben ser aproximados mediante métodos numéricos ya implementados en algunos
paquetes computacionales.
Ejemplo 11.3.7. Se supone que X y Y representan las ganancias trimestrales en millones de dólares
de dos divisiones pertenecientes a una misma corporación nanciera. Los analistas de la corporación
han modelado el comportamiento conjunto de estas variables por medio de la distribución normal
bivariada [X, Y ]T ∼ N B(µX = 3, µY = 7.7, σX = 0.04, σY = 0.08, ρXY = 0.8). Se espera que para el
próximo trimestre las ganancias de la división X se muevan entre los 2.95 millones y los 3.05 millones;
mientras que para la división Y estén entre los 7.6 millones y los 7.8 millones. Calcular la probabilidad
de que las ganancias del próximo trimestre se encuentren dentro de los rangos esperados.
Solución:
338CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
Se pide calcular P(2.95 ≤ X ≤ 3.05, 7.6 ≤ Y ≤ 7.8). Como se señaló anteriormente, no existen
tablas ni fórmulas explícitas que permitan obtener los valores de la función conjunta de distribución
acumulada y en este caso se hace uso de la función pmvnorm incluida en la librería mvtnorm (Genz
et al. 2012, Genz & Bretz 2009) del paquete computacional R (R Core Team 2012), obteniendo el
siguiente resultado:
P(2.95 ≤ X ≤ 3.05, 7.6 ≤ Y ≤ 7.8) = 0.6974968.
Por lo tanto, existe casi un 70 % de probabilidad de que las ganancias del próximo trimestre estén
dentro de los rangos esperados.
En esta sección se extienden por medio de las v.a.'s multivariadas algunos conceptos de los capítulos 6
y 7, como las frecuencias relativas marginales (sección 6.2), los perles o distribuciones condicionadas
(sección 6.3) y la independencia de eventos (sección 7.12).
Si más de una variable es denida dentro de un mismo experimento aleatorio, es importante distinguir
entre la distribución conjunta del vector aleatorio y la distribución de probabilidad de cada componente
denominada distribución de probabilidad marginal.
donde C(x) denota el conjunto de todos los puntos (x, y) para los cuales X = x y
C(y) denota el conjunto de todos los puntos (x, y) para los cuales Y = y.
11.4. OTRAS DISTRIBUCIONES RELACIONADAS 339
Las expresiones anteriores proporcionan un método para recuperar la distribución de cada compo-
nente del vector aleatorio a partir de la distribución conjunta; lo contrario (construir la distribución
conjunta a partir de las marginales) es más difícil, salvo en algunos casos particulares.
Ejemplo 11.4.1. Continuando con el ejemplo 11.3.1, donde se denen las variables X e Y para
representar los resultados obtenidos al lanzar cada uno de dos dados balanceados y distinguibles.
Obtener la función de probabilidad marginal de X y de Y.
Solución:
6
X X 1 1
fX (x) = fXY (x, y) = =
y=1
36 6
C(y)
para todo x ∈ {0, 1, 2, · · · , 6}. Puesto que ambos dados tienen la misma composición, la función de
probabilidad marginal para la variable Y es idéntica a la de X. El resultado no sorprende, ya que si
cada uno de los dados está balanceado, la distribución marginal de la variable que cuenta el número
1
de puntos en su cara superior debe ser uniforme con valor
6 . En esta situación no es estrictamente
necesario conocer fXY (x, y) para obtener las distribuciones marginales.
Ejemplo 11.4.2. Para las variables X y Y que representan los tiempos de conexión y autorización
de un servidor de computadoras descritos en el ejemplo 11.3.5, obtener las funciones de densidad
marginal de X y de Y.
Solución:
En este escenario se tiene que C(x) = [x, ∞) y C(y) = (0, y), lo cual es fácilmente vericable si se
trazan líneas paralelas a los ejes coordenados en la gura 11.6, de forma que para un x jo, y sólo
puede tomar valores superiores a x, y para un y jo, x sólo puede tomar valores menores que y.
Por lo tanto:
( 3x
3 − 1,000
fX (x) = 1,000 e , si x > 0;
0, en otro caso.
Z
fY (y) = fXY (x, y)dy
C(y)
Zy
3 x+2y
= e− 1,000 dy
500, 000
0
Zy
3 y x
= e − 500
e− 1,000 dx
500, 000
0
y
3 y
x
= e− 500 (−1, 000) e− 1,000
500, 000 0
3 − y y
= e 500 1 − e− 1,000 .
500
Por lo tanto:
( y
y
3 − 500
500 e 1 − e− 1,000 , si y > 0;
fY (y) =
0, en otro caso.
En este ejemplo es difícil obtener la distribución conjunta fXY (x, y) a partir de las distribuciones
marginales sin contar con información adicional.
fXY (x, y)
fX|Y (x|y) =
fY (y)
Ejemplo 11.4.3. Continuando con el ejemplo 11.3.1, donde se denen las variables X y Y para
representar los resultados obtenidos al lanzar cada uno de dos dados balanceados y distinguibles.
Obtener las funciones de probabilidad fX|Y (x|y) y fY |X (y|x).
Solución:
Puesto que ambos dados tienen la misma composición, fY |X (y|x) tiene una estructura idéntica a
fX|Y (x|y). También es interesante observar que fX|Y (x|y) = fX (x) (un resultado análogo se tiene
para fY |X (y|x)) y aunque en general esto no siempre se cumple, en la sección 11.4.3 se proporcionan
argumentos para entender cuando se da esta igualdad.
Ejemplo 11.4.4. Para las variables X y Y que representan los tiempos de conexión y autorización
de un servidor de computadoras descritos en el ejemplo 11.3.5, obtener las funciones de densidad
condicional fX|Y (x|y) y fY |X (y|x).
Solución:
y x
3 − 500
e− 1,000
x
fXY (x, y) 500,000 e e− 1,000
fX|Y (x|y) = = y
= y
fY (y) y
3 − 500
1 − e− 1,000 1, 000 1 − e− 1,000
500 e
Continuando con la extensión natural de las ideas que se desarrollan en el capítulo 7, ahora se trata
el concepto de independencia aplicado a un conjunto de v.a.'s.
Nota. Las igualdades de la denición 11.4.3 no se deben comprobar de manera simultánea ya que el
cumplimiento de una implica el cumplimiento de la otra.
La siguiente proposición suministra un resultado equivalente al de la denición 11.4.3, pero con mayor
valor desde el punto de vista práctico.
Demostración:
Primero, se supone que las variables X y Y son independientes, entonces por la denición 11.4.2 se
tiene que fXY (x, y) = fY (y)fX|Y (x|y). Como X y Y son independientes, por la denición 11.4.3 se
cumple que fX|Y (x|y) = fX (x) y sustituyendo en la anterior igualdad se obtiene que:
Ahora, se supone que fXY (x, y) = fX (x)fY (y). Aplicando la denición 11.4.2 se tiene que:
siempre que fY (y) > 0. Por lo tanto, en virtud de la denición 11.4.3, se obtiene que X e Y son v.a.'s
independientes.
Nota. La proposición 11.4.1 establece que dos v.a.'s son independientes si y solo si su función másica
o de densidad de probabilidad conjunta se puede expresar como el producto de las distribuciones
marginales correspondientes.
El resultado anterior se generaliza en seguida a un conjunto nito de más de dos v.a.'s mediante la
siguiente denición:
Y
fX I (xI ) = fXi (xi )
i∈I
Nota. La denición 11.4.4 se puede sintetizar al armar que un grupo nito de n v.a.'s son inde-
pendientes si y solo si la distribución conjunta de probabilidad para cualquier subconjunto de estas
variables se puede expresar como el producto de las respectivas distribuciones marginales.
Ejemplo 11.4.5. Como se hace notar en el ejemplo 11.4.3, las distribuciones condicionales de las
variables X y Y que representan los resultados obtenidos al lanzar cada uno de dos dados balanceados
y distinguibles, coinciden con las respectivas distribuciones marginales de X e Y. Es decir, dado
y ∈ {1, 2, 3, 4, 5, 6} se tiene que:
fX|Y (x|y) = fX (x)
lo que implica la independencia de X y Y. Esta relación de independencia no sorprende y se puede
explicar empíricamente debido a que el resultado de uno de los dados no afecta al del otro.
Ejemplo 11.4.6. En el ejemplo 11.4.2 se obtienen las distribuciones marginales de las variables X y Y
que representan los tiempos de conexión y autorización para un servidor de computadoras. Determinar
si las variables son independientes o no.
Solución:
3 3x 3 − y y
9e− 3x+2y
1,000 y
fX (x)fY (y) = e− 1,000 e 500 1 − e− 1,000 = 1 − e− 1,000
1, 000 500 500, 000
que es una expresión que no coincide con la función de densidad conjunta de X y Y . Con lo anterior se
muestra que fXY (x, y) 6= fX (x)fY (y) y en virtud de la proposición 11.4.1 se concluye que las variables
X y Y no son independientes.
344CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
En los dos ejemplos anteriores se pide probar independencia. En el siguiente ejemplo la independencia
se garantiza inicialmente y se utiliza para calcular una probabilidad conjunta:
Ejemplo 11.4.7. Una inversionista y un corredor de bolsa suscriben el siguiente acuerdo: el día de
mañana entre las 10:00 a.m. y las 11:00 a.m. el corredor hará disponible la opción de compra para
un grupo de acciones bastante apetecidas, y en este mismo intervalo de tiempo el inversionista aspira
haber vendido unos bonos y con el dinero de la venta adquirir acciones. Si el inversionista vende los
bonos antes de que el corredor haga pública la opción de compra, este sólo esperará máximo diez
minutos o de lo contrario queda libre de comprarle a otro corredor; si el corredor publica la opción de
venta antes de que el inversionista cuente con le dinero de los bonos, este sólo esperará máximo diez
minutos o de lo contrario queda libre de negociar las acciones con otro inversionista. Si los instantes
en los que cada uno vende los bonos y es autorizado para hacer pública la venta de las acciones son
independientes e uniformemente distribuidos, calcular la probabilidad de que el inversionista le compre
al corredor.
Solución:
Si X representa el tiempo (en minutos) después de las 10:00 a.m. en el que el inversionista cuenta con
el dinero de sus bonos y Y tiene el mismo signicado para el tiempo (en minutos) en que el corredor
hace pública la oferta de venta, entonces las distribuciones marginales de X e Y son respectivamente:
1/60, si 0 ≤ x ≤ 60; 1/60, si 0 ≤ y ≤ 60;
fX (x) = y fY (y) =
0, en otro caso. 0, en otro caso.
Como la función de densidad conjunta es constante, la probabilidad pedida se puede expresar como
el producto del área sombreada y dicho valor constante (1/3600). Como se muestra en la gura, el
área de esta región se puede expresa como la suma de los dos triángulos en los extremos y el área del
rectángulo central, es decir:
10 · 10 √ √
Área(R) =2 + 10 2 · 50 2 = 100 + 1, 000 = 1, 100.
2
En consecuencia, se obtiene que
1 1 11
P(|X − Y | ≤ 10) = Área(R) = 1, 100 =
3600 3, 600 36
es la probabilidad de que el inversionista le compre al corredor.
18 Imagen tomada de Soong (2004, p. 59).
11.5. COMBINACIONES LINEALES DE VARIABLES ALEATORIAS 345
Figura 11.10: Región de integración asociada con el evento |X − Y | ≤ 10 del ejemplo 11.4.7.
p
X
Y = cj Xj = c1 X1 + c2 X2 + · · · + cp Xp
j=1
Las combinaciones lineales de v.a.'s son de mucho interés en situaciones prácticas y teóricas dentro de
la estadística. Los siguientes ejemplos lo ilustran.
Ejemplo 11.5.1. Una empresa fabrica cinta adhesiva de 4 calibres diferentes y vende las unidades
(rollos) a $3, $5, $8 y $12. Sean X1 , X2 , X3 y X4 las v.a.'s que representan el número de unidades
346CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
vendidas en un día para cada calibre de cinta. Obtener una expresión general para el ingreso total por
las ventas.
Solución:
El ingreso total es la suma de los ingresos parciales por cada calibre de cinta. El ingreso parcial se
obtiene al multiplicar el número de unidades vendidas por el precio de venta. El ingreso total por
ventas I se puede expresar como:
4
X
I = 3X1 + 5X2 + 8X3 + 12X4 = cj Xj
j=1
Ejemplo 11.5.2. Sean X1 , X2 , . . . , Xn las variables que conforman una muestra aleatoria19 de tamaño
n. Se ha visto que la media muestral es otra v.a. dada por:
n
1X 1 1 1
X= Xi = X1 + X2 + . . . + Xn .
n i=1 n n n
Así, la media muestral resulta ser una combinación lineal de las variables X1 , X2 , . . . , Xn donde c1 =
1
c2 = · · · = cn = n.
De otra parte, haciendo Zi = (Xi − X)2 , la varianza muestral se puede expresar mediante:
n n
2 1 X 2 1 X 1 1 1
SX := Xi − X = Zi = Z1 + Z2 + . . . + Zn .
n − 1 i=1 n − 1 i=1 n−1 n−1 n−1
Por lo tanto, la varianza muestral resulta ser una combinación lineal de las variables Z1 , Z2 , . . . , Zn
1
donde c1 = c2 = · · · = cn = n−1 .
En esta sección se generalizan para v.a.'s las ideas sobre medidas de asociación que se tratan en el
capítulo 6. A continuación, se denen la covarianza y correlación entre una pareja de v.a.'s.
19 En el ámbito de la inferencia estadística, una muestra aleatoria se reere a una familia de v.a.'s independientes
e idénticamente distribuidas.
11.5. COMBINACIONES LINEALES DE VARIABLES ALEATORIAS 347
La siguiente proposición suministra una expresión alterna para el cálculo de la covarianza ente X y
Y.
Proposición 11.5.1. La covarianza entre las v.a's X y Y se puede expresar mediante:
Cov(X, Y ) = E[XY ] − µX µY .
Ejemplo 11.5.3. Calcular la covarianza de las variables X y Y que representan los tiempos de
conexión y autorización para un servidor de computadoras del ejemplo 11.3.5.
Solución:
Primero se deben calcular los valores esperados de X y Y. Para ello se utilizan las distribuciones
348CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
Z ∞ Z ∞
3 3x
E[X] = xfX (x)dx = x e− 1,000 dx ≈ 333.3
−∞ 0 1, 000
Z ∞ Z ∞
3 − y y
E[Y ] = yfY (y)dy = y e 500 1 − e− 1,000 dy ≈ 833.3.
−∞ 0 500
Z Z
E[XY ] = xyfXY (x, y)dxdy
S
Z∞ Z∞ (x+2y)
= 6 × 10 −6
xy e− 1,000 dy dx
0 x
Z∞ Z∞
y x
= 6 × 10−6 ye− 500 dy xe− 1000 dx
0 x
Z∞
x x
= 6 × 10−6 500e− 500 (x + 500)xe− 1,000 dx
0
Z∞
3x
= 0.003 xe− 1,000 (x + 500)dx = 388, 889.
0
Como se indica en la sección 6.5.1, el signo de la covarianza mide la dirección de la relación lineal entre
el par de variables. En este caso Cov[X, Y ] > 0, lo que indica una relación directa entre las variables,
las cuales crecen o decrecen de manera simultánea. Por lo tanto, el tiempo hasta recibir la autorización
(Y ) siempre es mayor que el tiempo de conexión (X ) ya que el computador debe esperar a que haya
conexión con el servidor para posteriormente solicitar la autorización como usuario registrado. Y Si
los equipos tienden a conectarse más rápido (X decrece) se esperaría una tendencia a que reciba la
autorización más rápido (Y decrece) y viceversa.
Como se especica en la sección 6.5.2, para establecer que tan fuerte es la relación lineal entre las
variables se usa el coeciente de correlación de Pearson dado por
σXY
ρXY = ,
σX σY
Ejemplo 11.5.4. Calcular el coeciente de correlación de Pearson para las variables X y Y que
representan los tiempos de conexión y autorización para un servidor de computadoras del ejemplo
11.3.5.
Solución:
Primero se deben calcular las varianzas de X y Y. Para ello se utilizan las distribuciones marginales
obtenidas en el ejemplo 11.4.2, de forma que:
Z ∞ Z∞
3 3x
2
σX = 2
x fX (x)dx − µ2X = x2 e− 1,000 dx − (333.3)2 = 11, 1133.1
−∞ 1, 000
0
Z ∞ Z∞
3 − y y
σY2 = 2
y fY (y)dy − µ2Y = y2 e 500 1 − e− 1,000 dy − (833.3)2 = 361, 167.1.
−∞ 500
0
Este valor de ρXY indica la existencia de una relación lineal aceptable entre los tiempos de interés.
Ejemplo 11.5.5. En el ejemplo 11.4.5 se muestra que las variables X y Y, las cuales representan los
resultados obtenidos al lanzar cada uno de dos dados balanceados y distinguibles, son independientes.
Se demuestra de manera sencilla (ejercicio 11.8) que ρXY = 0.
Ejemplo 11.5.6. En el ejemplo 11.5.4 se obtiene que el valor de ρXY es diferente de cero; esto implica
que X y Y no son v.a.'s independientes.
350CAPÍTULO 11. DISTRIBUCIONES DE PROBABILIDAD MULTIVARIADAS (EMILIO PABLO BERDUGO CAMAC
En esta sección se muestran algunos resultados concernientes a las combinaciones lineales de v.a.'s
que después se utilizan en situaciones prácticas. A continuación se presenta sin demostración una
proposición relacionada con los parámetros de una combinación lineal de v.a.'s:
Proposición 11.5.3.
Pp
Sea j=1 cj Xj una combinación lineal de las v.a.'s X1 , X2 , . . . , Xp con
Y =
2
valores esperados, varianzas y covarianzas nitas µi , σi y σij respectivamente para i = 1, 2, . . . , p.
Entonces:
i. ii.
p
X p
X p−1 X
X p
E[Y ] = cj µj . Var[Y ] = c2j σj2 +2 ci cj σij .
j=1 j=1 j=1 i=j+1
Nota. En la proposición 11.5.3, la identidad i. se cumple sin importar si las variables sean indepen-
dientes o no y se interpreta armando que el valor esperado de una combinación lineal de variables
aleatorias es la combinación lineal de los valores esperados individuales. Además, si las v.a.'s son
independientes entonces se tiene que:
p
X
Var[Y ] = c2j σj2 = c21 σ12 + c22 σ22 + . . . + c2p σp2 .
j=1
¾Por qué?
Ejemplo 11.5.7. Suponiendo que en el ejemplo 11.5.2 las n v.a.'s son independientes e igualmente
distribuidas
20
, es decir, ρXi Xj = 0 para todo i 6= j , y además E[Xi ] = µ y Var[Xi ] = σ 2 para
i = 1, . . . , n. Calcular el valor esperado y la varianza de la media muestral X .
Solución:
n
X 1 1 1 1 1
E X = µj = µ + µ + · · · + µ = n µ =µ
j=1
n n n n n
n 2
σ2
X 1 1 1 1 1 2
Var X = σj2 = 2 σ 2 + 2 σ 2 + · · · + 2 σ 2 = n 2
σ = .
j=1
n n n n n n
20 Igualmente distribuidas signica que comparten el mismo modelo probabilístico y por lo tanto poseen la misma
media y varianza por lo que no se necesitan los subíndices para identicarlas.
11.5. COMBINACIONES LINEALES DE VARIABLES ALEATORIAS 351
El hecho interesante de estos resultados consiste en que al tomar mediciones independientes de una
misma variable aleatoria, resulta mas ventajoso trabajar con la media aritmética de las mediciones
ya que esta comparte el mismo valor esperado y además presenta menos variabilidad ya que Var[X]
decrece cuando se aumenta el tamaño muestral n.
Ejemplo 11.5.8. Se supone que en el ejemplo 11.5.1 se tiene que µ1 = 8, 000, µ2 = 10, 500, µ3 =
9, 100, µ4 = 12, 250, σ12 = 1, 600, σ22 = 1, 200, σ32 = 900 y σ42 = 2, 050. Además, si las demandas para
cada calibre de cinta se consideran independientes, calcular el valor esperado y la desviación estándar
del ingreso total por ventas.
Solución:
p P4
Se pide calcular E[I] y Var[I] donde I = i=1 ci Xi . Siguiendo las identidades de la proposición
11.5.3 se sigue que:
4
X
µI = cj µj = 3(8, 000) + 5(10, 500) + 8(9, 100) + 12(12, 250) = 296, 300
j=1
v
u 4
uX p
σI = t c2j σj2 = (3)2 (1, 600) + (5)2 (1, 200) + (8)2 (900) + (12)2 (2, 050) = 41, 572.9.
j=1
El siguiente ejemplo ilustra como se obtiene una distribución de probabilidad de una combinación
lineal de variables normales:
Ejemplo 11.5.9. Considere las variables X y Y que representan las ganancias trimestrales de dos
divisiones pertenecientes a una misma corporación de tecnología como en el ejemplo 11.3.7. Sea G :=
X + Y la ganancia total trimestral de la corporación. Obtener la función de densidad de probabilidad
de G y calcular la probabilidad de de que las ganancias trimestrales totales de la corporación estén
por encima de los 11 millones de dólares.
Solución:
Se nota que G es una combinación lineal de las ganancias de cada división donde c1 = c2 = 1. En
consecuencia:
Por denición, toda combinación lineal de componentes normales multivariadas tiene una distribución
G ∼ N (10.7, 0.01312). Ahora se calcula P(G > 11) como sigue:
normal univariada, y por lo tanto
11 − 10.7
P(G > 11) = 1 − P(G ≤ 11) = 1 − Φ √ = 1 − Φ(2.62) = 1 − 0.9956 = 0.0044.
0.01312
11.6. Comentarios
En este capítulo se exponen de manera resumida algunos conceptos relacionados con las distribu-
ciones de probabilidad multivariadas, con especial atención en el caso bivariado. El lector que por
sus necesidades académicas o profesionales requiera profundizar en la metodología multivariada, debe
tener claro que los conceptos expuestos no son sino la antesala para poder abordar una literatura más
especializada.
Se debe tener presente que a diferencia de capítulos anteriores, donde la mayoría de situaciones invo-
lucran operaciones aritméticas sencillas, las cuales se pueden ejecutar con una calculadora cientíca
común y en algunas ocasiones utilizando tablas, la aritmética detrás de los métodos multivariados es
en muchas ocasiones demasiado compleja para ejecutarse manualmente. Un caso de esta complejidad
computacional se presenta en el ejemplo 11.3.7, donde la probabilidad pedida se calcula con la ayuda
de un paquete estadístico especializado.
11.7. Ejercicios
11.1 En una empresa hay nueve ejecutivos, de los cuales tres son solteros y dos son divorciados. Tres
de ellos serán seleccionados al azar para un ascenso. Sea X1 la variable que representa el número
de ejecutivos casados de los funcionarios seleccionados y X2 la variable asociada con el número
de ejecutivos solteros de los funcionarios seleccionados.
a. ¾Se puede utilizar la distribución multinomial como modelo probabilístico para estudiar este
caso? ¾Por qué?.
11.2 Demostrar que si X es un vector aleatorio tal que X ∼ M N (n, π1 , π2 , . . . , πp ) entonces el cardinal
n+p−1
del rango de X viene dado por
n .
11.4 Cierto informe de inspección de aviones comerciales clasica las suras en las alas en tres cate-
gorías: inexistentes, detectables y serias. Los registros históricos indican que el 70 % de los
11.7. EJERCICIOS 353
aviones no tenía suras en las alas; 25 % tenía suras perceptibles y 5% tenía suras críticas. Se
eligen aleatoriamente 5 aviones. Calcular la probabilidad de que:
a. Uno de ellos tenga suras críticas, dos tengan suras detectables y dos no tengan suras.
kx21 x2 ,
si 0 ≤ x1 ≤ x2 y x1 + x2 ≤ 2 ;
fX1 X2 (x1 , x2 ) =
0, en otro caso.
b. Determinar el valor de k.
c. Calcular e interpretar P[X1 + X2 < 1].
11.6 Para la situación del ejemplo 11.3.7, determinar la distribución de las ganancias trimestrales
promedio y usarla para calcular la probabilidad de que la ganancia trimestral promedio no
supere los 5.2 millones de dólares.
11.8 Mostrar que ρXY = 0 para las variables aleatorias X y Y, del ejemplo 11.5.5.
11.10 Mostrar que el número de covarianzas (o correlaciones) entre las parejas de componentes de un
p(p−1)
vector aleatorio de p componentes es
2 .
Apéndice A
Elementos básicos de matemáticas
A.1. Introducción
En este apéndice se presentan las nociones básicas de matemáticas que se usan frecuentemente en la
disciplina estadística y que son fundamentales para llevar a buen término las prácticas cuantitativas
desarrolladas a lo largo de este libro. Aquí se destacan variadas secciones donde se estudian en cierto
detalle los fundamentos de matemáticas, desde los conceptos primordiales de la aritmética y el álgebra,
pasando por las razones, la factorización de polinomios, las ecuaciones y los logaritmos, hasta el manejo
de las sumatorias y las productorias. Se enfatiza el hecho de que el manejo pleno de estos temas
garantiza en cierta medida el éxito del desarrollo de los métodos estadísticos objeto de estudio y dará
al lector una base sólida para abordar sin dicultades cualquier técnica aplicada fundamentada en
cualquier metodología cuantitativa.
Para llevar a cabo las operaciones aritméticas, es necesario seguir algunas reglas y una metodología
apropiada. Las siguientes son las propiedades básicas de estas operaciones:
354
A.2. OPERACIONES ARITMÉTICAS 355
Proposición A.2.1. Sean a, b, c y d números reales tales que hacen sentido las siguientes operaciones
algebraicas. Entonces se cumplen las siguientes propiedades:
i. iii.
a b a±b a c a·c
± = . · = .
c c c b d b·d
ii. iv.
a c (a · d) ± (b · c) a c a·d
± = . ÷ = .
b d b·d b d b·c
a. c.
5 3
6 + 2 +2 1 2 2 1
1 4 . ÷ · ÷ .
+ +4 3 5 3 4
3 9
b. d.
2 3
1 4
(0.02) · (0.0003)
· ÷ · . .
5 4 3 7 0.002
Solución:
a.
5 3 5 9 12
6 + 2 +2 6 + 6 + 6
1 4 = 3 4 36
3 + 9 +4 9 + 9 + 9
5+9+12
6
= 3+4+36
9
26
6
= 43
9
26 · 9
=
6 · 43
356 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
13 · 3
=
1 · 43
39
= .
43
b.
2 3 1 4 2·3 1·4
· ÷ · = ÷
5 4 3 7 5·4 3·7
6 4
= ÷
20 21
3 4
= ÷
10 21
3 · 21
=
10 · 4
63
= .
40
c.
1 2 2 1 1·5 2·4
÷ · ÷ = ·
3 5 3 4 3·2 3·1
5 8
= ·
6 3
5·8
=
6·3
5·4
=
3·3
20
= .
9
d.
2 3
(0.02) · (0.0003) 100 ·10,000
= 2
0.002
1,000
2·3
100·10,000
= 2
1,000
2 · 3 · 1, 000
=
100 · 10, 000 · 2
3
=
1, 000
= 0.003.
A.3. EXPONENTES Y RADICALES 357
A continuación se presenta un resumen de algunas de las reglas básicas que se deben tener en cuenta
al trabajar con exponentes y radicales:
Proposición A.3.1. Sean m, n, x y y números reales tales que hacen sentido las siguientes opera-
ciones algebraicas. Entonces se cumplen las siguientes propiedades:
√
i. xm · xn = xm+n . iv. x0 = 1 y x1 = x. vii. xm/n = n xm .
√ √ √
m x · y = m x · m y.
ii. xm ÷ xn = xm−n . v. 0x = 0 y 1x = 1. viii.
q √
m x
m x =
x−m = ix. m y.
1 √
iii. (xm )n = xm·n . vi. xm . y
a. d.
−[5x − (3y − 5x) − (2x − 5y)]. (xm + 5y n )(3xm − 4y n ).
b.
4 3
2 6 3−2m
− xm−2 · x . e.
3 4 v√
u 3 p √
c.
u 2 3 x4 x
4 q · √ .
x−1 y −2 + x2 y −1
t
1
4
x
. 8
y −2 − x−2
Solución:
a.
b.
4 3 4 3
2 6 3−2m 2 4 6 3
− xm−2 · x = − · xm−2 · · x3−2m
3 4 3 4
358 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
24 63 4·(m−2) 3·(3−2m)
= (−1)4 · · ·x ·x
34 43
24 · 23 · 33
= 1 · 4 3 3 · x4m−8+9−6m
3 ·2 ·2
2 1−2m
= x .
3
c.
1 1
x−1 y −2 + x2 y −1 x y2 + x2 y1
= 1 1
y −2 − x−2 y2 − x2
1 x2
xy 2 + y
= 1·x2 −1·y 2
x2 y 2
1 x3 y
xy 2 + xy 2
= x2 −y 2
x2 y 2
1+x3 y
xy 2
= x2 −y 2
x2 y 2
(1 + x3 y) · x2 y 2
=
(x2 − y 2 ) · xy 2
x(1 + x3 y)
= .
(x2 − y 2 )
d.
e.
v√ 14 13
√
1
4
1
x · x
u 3 p 2
u 2 3 4
x x 23
4 q
t · √ = 1 · 1
1
4
x 1 2 x4
8 8
1 1 1 1 1
2 3·4 x4· 3 · x 2 · 3
= 1 · 1
1 1 x4
82·4
1 1 4 1
2 12 · 8 8 x 3 + 6
= · 1
1 x4
1 1 3 1
= 2 12 · 23 8 · x 2 − 4
1 3 6 1
= 2 12 · 2 8 · x 4 − 4
A.4. FACTORIAL 359
2+9 5
=2 24 · x4
11 4 1
= 2 24 · x 4 · x 4
√
24
√4
= 211 · x1 · x1
p √
= 24 2, 048 x 4 x.
A.4. Factorial
El factorial es una expresión de uso frecuente en las técnicas combinatorias. En seguida algunas
generalidades al respecto:
n! = n · (n − 1) · (n − 2) · . . . · 3 · 2 · 1.
Además, se dene 0! = 1.
52!
a. 5!. b.
(52−5)! . c. 3! + 6!. d. 3! · 6!.
Solución:
a.
5! = 5 · 4 · 3 · 2 · 1
= 120.
b.
52! 52!
=
(52 − 5)! 47!
52 · 51 · 50 · 49 · 48 · 47!
=
47!
= 52 · 51 · 50 · 49 · 48
= 311, 875, 200.
360 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
c.
3! + 6! = (3 · 2 · 1) + (6 · 5 · 4 · 3 · 2 · 1)
= 6 + 720
= 726.
d.
3! · 6! = (3 · 2 · 1) · (6 · 5 · 4 · 3 · 2 · 1)
= 6 · 720
= 4, 320.
Nota. Los factoriales no se trabajan utilizando las reglas aritméticas. El factorial es una forma de
presentar de modo conveniente productos crecientes de enteros. Por lo tanto, no se pueden sumar
(restar) o multiplicar (dividir). Por lo tanto:
(m + n)! 6= m! + n! y (m · n)! 6= m! · n!
Las razones, las fracciones y los porcentajes son relaciones primordiales en cualquier ámbito donde se
quiera expresar una proporcionalidad de forma sencilla e informativa.
Ejemplo A.5.1. El número de estudiantes en un colegio es 5,000 de los cuales 1,000 son niñas.
Calcular la razón de niñas a niños en el colegio.
Solución:
La razón de niñas a niños es 1, 000/4, 000 = 1/4 o 1 : 4. Lo que quiere decir que hay 1 niña por cada
4 niños.
A.5. RAZONES, FRACCIONES Y PORCENTAJES 361
La razón de una parte a un todo se llama fracción . Por ejemplo, la expresión ¾qué fracción de los
trabajadores son mujeres? se entiende como ¾cuál es la razón del número de trabajadores mujeres al
total de trabajadores?. Una fracción se representa como la razón de una parte al todo; en símbolos:
Parte
Todo
o
Parte : Todo.
Ejemplo A.5.2. Hay 15 hombres y 20 mujeres en una clase. ¾Qué fracción de los estudiantes son
mujeres?
Solución:
Parte
Fracción =
Todo
20
=
15 + 20
20
=
35
4
= .
7
4
Esto signica que
7 de los estudiantes son mujeres, o 4 de cada 7 estudiantes es mujer, o que la razón
de estudiantes mujeres al total de estudiantes es 4:7.
Ejemplo A.5.3. En una clase de 30 estudiantes, la razón de niños al total de estudiantes es 2:5.
¾Cuántos niños hay en la clase?
Solución:
Parte
Fracción =
Todo
2 Niños
=
5 30
2
Lo que quiere decir que el número de niños en la clase es
5 · 30 = 12.
Un porcentaje , al igual que una fracción, constituye otra manera de expresar una parte determinada
de una unidad. El porcentaje es la parte de un todo que se ha divido en 100 porciones iguales; de ahí
la palabra porcentaje o la expresión tanto por ciento. Así, se obtiene que
Parte x
=
Todo 100
y por lo tanto, cuando una fracción se multiplica por 100 y se agrega el símbolo % se convierte en un
porcentaje, esto es,
Parte
x= · 100 %.
Todo
362 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
Ejemplo A.5.4. ¾Qué porcentaje es 18 con respecto a 72? ¾Qué parte corresponde al 35 % de 72?
Solución:
Parte 18
· 100 % = · 100 % = 25 %.
Todo 72
Además, la parte que corresponde al 35 % de 72 es:
35
35 % · 72 = · 72 = 0.35 · 72 = 25.2.
100
A.6. Desigualdades
A continuación se enumeran algunas propiedades asociadas con desigualdades que involucran números
reales: si a, b y c son números reales entonces se satisfacen las siguientes propiedades:
iv. Si a<b y c>0 entonces ac < bc. ix. Si |a| < b si y solo si −b < a < b.
v. Si a<b y c<0 entonces ac > bc. x. Si |a| > b si y solo si a < −b ∨ a > b.
Nota. Las propiedades del mayor estricto son análogas a las que se presentaron anteriormente. Ade-
más, las estas propiedades también se cumplen si se reemplazan las desigualadades estrictas por
desigualdades no estrictas.
Solución:
2x − 7 < 4x − 2
2x − 7 + 7 < 4x − 2 + 7
2x < 4x + 5
A.7. FACTORIZACIÓN DE POLINOMIOS 363
2x − 4x < 4x + 5 − 4x
−2x < 5
1 1
− · (−2x) > − · 5
2 2
5
x>− .
2
Solución:
−5 ≤ 2x + 6 ≤ 4
−5 − 6 ≤ 2x + 6 − 6 ≤ 4 − 6
−11 ≤ 2x ≤ −2
1 1 1
· (−11) ≤ · 2x ≤ · (−2)
2 2 2
11
− ≤ x ≤ −1.
2
La factorización de polinomios permite la resolución de variados problemas con cierta facilidad. Do-
minar las técnicas que se presentan en seguida es importante para adquirir destreza en el cálculo y
sus anes.
an xn + an−1 xn−1 + . . . + a1 x + a0
donde an 6= 0.
364 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
Nota. En la denición A.7.1, los números a0 , a1 , . . . , an−1 , an se denominan coecientes del polino-
mio. En particular, a0 se llama término independiente .
Ejemplo A.7.1. Los siguientes son algunos polinomios:
Factor común
iii. Escribir el factor común, y a continuación, los cocientes hallados en el numeral anterior, cada uno
precedido por su respectivo signo.
a. b.
27a3 x2 − 18ax3 . 12a2 b3 x − 6ab + 12a62b4 .
Solución:
A.7. FACTORIZACIÓN DE POLINOMIOS 365
a.
b.
Para factorizar un polinomio con el factor común por agrupación de términos se debe:
iii. Realizar una segunda factorización por medio del factor común de los agrupamientos.
a. c.
an + 2a + n + 2. a2 x2 − 3bx2 + a2 y 2 − 3by 2 .
b. d.
am − bn − bm + an. 4a3 − 1 − a2 + 4a.
Solución:
a.
an + 2a + n + 2 = (an + 2a) + (n + 2)
= a(n + 2) + 1(n + 2)
= (a + 1)(n + 2).
b.
c.
d.
= 4a a2 + 1 − 1 a2 + 1
= (4a − 1) a2 + 1 .
ii. Extraer la raíz cuadrada del primer y tercer término, y comprobar que el doble del producto de
estas raíces coincide con el segundo término del trinomio.
a. b. c.
Solución:
a.
a2 + 25 − 10a = a2 − 10a + 25
= a2 − (2 · 5 · a) + 52
= (a − 5)2 .
A.7. FACTORIZACIÓN DE POLINOMIOS 367
b.
c.
Diferencia de cuadrados
a. c.
a2 − 25. 9a6 − 64x2 y 4 .
b. d.
1 − 4m2 . 4 − (a + 1)2 .
Solución:
a.
a2 − 25 = a2 − 52
= (a − 5)(a + 5).
368 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
b.
1 − 4m2 = 12 − (2m)2
= (1 − 2m)(1 + 2m).
c.
2 2
9a6 − 64x2 y 4 = 3a3 − 8xy 2
= 3a3 − 8xy 2 3a3 + 8xy 2 .
d.
4 − (a + 1)2 = 22 − (a + 1)2
= (2 − (a + 1))(2 + (a + 1))
= (1 − a)(3 + a).
Trinomio de la forma x2 + bx + c
a. c.
m2 + 5m − 14. x8 y 8 − 100a2 − 15ax4 y 4 .
b. d.
20 − 9y 2 + y 4 . 3(a − 1) − 108 + (a − 1)2 .
Solución:
a.
m2 + 5m − 14 = m2 + (7 + (−2))m + (7 · (−2))
= (m + 7)(m − 2).
A.7. FACTORIZACIÓN DE POLINOMIOS 369
b.
20 − 9y 2 + y 4 = y 4 − 9y 2 + 20
2
= y 2 + ((−5) + (−4))y 2 + ((−5) · (−4))
= y2 − 5 y2 − 4 .
c.
d.
Otros casos
a3 + b3 = (a + b) a2 − ab + b2 a3 − b3 = (a − b) a2 + ab + b2 .
y
a. b.
c. e.
a3 b3 + x6 . 4x8 + y 8 .
d. f.
64a3 − 729. 2x2 + 3x − 2.
Solución:
a.
= (1 + 5x)3 .
b.
= (2a − 3b)3 .
c.
3
a3 b3 + x6 = (ab)3 + x2
2
= ab + x2 (ab)2 − ab · x2 + x2
= ab + x2 a2 b2 − abx2 + x4 .
d.
e.
2 2
4x8 + y 8 = 2x4 + y4
2 2
= 2x4 + y4 + 2 · 2x4 · y 4 − 2 · 2x4 · y 4
2 2
2x4 + 2 · 2x4 · y 4 + y 4 − 4x4 y 4
=
2 2
= 2x4 + y 4 − 2x2 y 2
2x4 + y 4 − 2x2 y 2 2x4 + y 4 + 2x2 y 2
=
2x4 − 2x2 y 2 + y 4 2x4 + 2x2 y 2 + y 4 .
=
A.8. ECUACIONES 371
f.
2 2x2 + 3x − 2
2x2 + 3x − 2 =
2
(2x)2 + 3(2x) − 4
=
2
(2x)2 + (4 + (−1))(2x) − (4 · (−1))
=
2
(2x + 4)(2x − 1)
=
2
2(x + 2)(2x − 1)
=
2
= (x + 2)(2x − 1).
Nota. Los casos de factorización expuestos son apenas unos cuantos de uso común; algunos otros
resultan como una combinación de éstos o como una modicación del caso inicial mediante un proce-
dimiento algebraico previo. Así, los demás casos de factorización son una consecuencia inmediata de
un dominio completo de los casos presentados anteriormente.
A.8. Ecuaciones
• Incógnita : valor desconocido de la ecuación que interesa conocer; usualmente se denota con x
o y, aunque es posible utilizar cualquier símbolo.
• Grado : mayor exponente de la incógnita. En este apéndice se tratan ecuaciones de primer grado
(lineales) y de segundo grado (cuadráticas).
Ejemplo A.8.1. Sumar en los dos miembros de la ecuación 5x+2 = 8x−19 la expresión −5x+19.
Solución:
5x + 2 = 8x − 19
5x + 2 + (−5x + 19) = 8x − 19 + (−5x + 19)
5x + 2 − 5x + 19 = 8x − 19 − 5x + 19
21 = 3x
3x = 21.
ii. Multiplicar en los dos miembros de la ecuación por una expresión diferente de 0.
Solución:
5(2x + 3) − 5x = −5 + 3(x − 4)
10x + 15 − 5x = −5 + 3x − 12
10x − 5x − 3x = −15 − 5 − 12
2x = −32
−32
x=
2
x = −16.
A.8. ECUACIONES 373
Solución:
x 2x
+ = 2(x − 5)
2 3
3x 4x
+ = 2x − 10
6 6
7x
= 2x − 10
6
7x = 6(2x − 10)
7x = 12x − 60
7x − 12x = −60
−5x = −60
−60
x=
−5
x = 12.
Solución:
2x − 3 11
−2=
x+4 x2 − 16
(2x − 3) · 1 − (x + 4) · 2 11
= 2
x+4 x − 16
2x − 3 − 2x − 8 11
=
x+4 (x − 4)(x + 4)
−11 11
=
x+4 (x − 4)(x + 4)
−11 x + 4 11 x+4
· = ·
x+4 11 (x − 4)(x + 4) 11
1
−1 =
x−4
−1(x − 4) = 1
−x + 4 = 1
−x = 1 − 4
x = 3.
374 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
a1 x + b1 y = c1
a2 x + b2 y = c2
donde a1 , a2 , b1 y b2 son los coecientes, x y y son las incógnitas y c1 y c2 son los términos indepen-
dientes.
Para resolver uno de estos sistemas hay disponibles varias técnicas, entre ellos se distinguen el método
de sustitución y el método de igualación .
Ejemplo A.8.6. Resolver el sistema de ecuaciones
3x + y = 11
5x − y = 13
Solución:
Primero, en alguna de las ecuaciones se halla el valor de alguna de las incógnitas. Por ejemplo, se
puede despejar y en la primera ecuación suponiendo conocido el valor de x. Así, se obtiene que
y = 11 − 3x.
que corresponde a una sola ecuación de primer grado con una sola incógnita. Resolviendo:
5x − (11 − 3x) = 13
5x − 11 + 3y = 13
5x + 3x = 13 + 11
8x = 24
x = 3.
y = 11 − 3x
A.8. ECUACIONES 375
y = 11 − 3 · 3
y = 11 − 9
y = 2.
Solución:
Primero, se despeja en las dos ecuaciones la misma incógnita, y por ejemplo. Así,
y = 11 − 3x
y = 5x − 13
Luego, igualando las dos ecuaciones se obtiene una sola ecuación de primer grado con una sola incóg-
nita. Resolviendo:
11 − 3x = 5x − 13
3x + 5x = 11 + 13
8x = 24
x = 3.
Este valor de x se sustituye en cualquiera de las ecuaciones iniciales de y, la primera por ejemplo, y
se obtiene que
y = 11 − 3x
y = 11 − 3 · 3
y = 11 − 9
y = 2.
donde a11 , a12 , . . . , ann son los coecientes, x1 , x2 , . . . , xn son las incógnitas y b1 , b2 , . . . , bn son los
términos independientes, corresponde a un sistema de ecuaciones de primer grado con n in-
cógnitas , n ≥ 2, que se puede resolver con los métodos mencionados anteriormente.
ax2 + bx + c = 0
Para resolver una ecuación de este tipo se puede factorizar el primer miembro de la igualdad y despejar
para x, o se puede aplicar la siguiente fórmula general:
√
−b ± b2 − 4ac
x=
2a
donde ± indica que la ecuación tiene dos soluciones que se obtienen aplicando la fórmula con el signo
+ y con el signo − por separado. La fórmula anterior se conoce como fórmula cuadrática y las
soluciones se llaman raíces de la ecuación.
Nota. Las raíces de una ecuación de segundo grado pueden coincidir, o incluso pueden ser números
√
complejos, esto es, un número de la forma a + bi donde a y b son número reales e i = −1 es la unidad
imaginaria (detalles en la sección B.4).
Ejemplo A.8.8. Resolver la ecuación x2 + 11x = −24 por medio de la factorización de un miembro
de la igualdad.
Solución:
x2 + 11x = −24
x2 + 11x + 24 = 0
x2 + (8 + 3)x + (8 · 3) = 0
(x + 8)(x + 3) = 0.
Luego, x+8 =0 o x + 3 = 0, puesto que un producto es igual a 0 si y solo si alguno de sus factores
lo es, en consecuencia se obtiene que las raíces de la ecuación son -8 y-3.
Ejemplo A.8.9. Resolver la ecuación x2 + x + 1 = 0 por medio de la fórmula cuadrática.
Solución:
Por lo tanto,
√
−b ± b2 − 4ac
x=
2a p
−(−16) ± (−16)2 − 4 · 1 · 63
=
√ 2·1
16 ± 256 − 243
=
√2
16 ± 4
=
2
16 ± 2
= .
2
16+2 18 16−2 14
De donde x= 2 = 2 =9 o x= 2 = 2 = 7.
Solución:
4x2 + 16x + 16 = 0
2
(2x) + (2 · 4 · 2x) + 42 = 0
(2x + 4)2 = 0.
Por lo tanto las dos soluciones de la ecuación son iguales a −2 dado que la única opción es 2x + 4 = 0.
Solución:
√
−b ± b2 − 4ac
x=
√2a
−2 ± 22 − 4 · 1 · 2
=
√2 · 2
−2 ± 4 − 8
=
4
√
−2 ± −4
=
2
√ √
−2 ± −1 4
=
2
−2 ± 2i
=
2
378 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
2 · (−1 ± i)
=
2
= −1 ± i.
De donde x = −1 + i o x = −1 − i.
A.9. Logaritmos
logb (x) = y ⇔ x = by
Nota. Como cualquier número real positivo diferente de uno puede tomarse como base, existe una
innidad de sistemas de logaritmos, pero tradicionalmente, solo se utilizan los siguientes sistemas:
Proposición A.9.1. Sean a, b, x1 y x2 números reales tal que b > 0, b 6= 1, x1 > 0 y x2 > 0 .
Entonces se tiene que:
logb (b) = 1.
logb (1) = 0.
v. El logaritmo de un cociente es igual al logaritmo del dividendo menos el logaritmo del divisor:
x1
logb = logb (x1 ) − logb (x2 ).
x2
vi. El logaritmo de una potencia es igual al producto entre exponente y el logaritmo de la base:
La demostración se deja como ejercicio para el lector, al igual que escribir las propiedades correspon-
dientes trabajando con logaritmos binarios, comunes y naturales.
a. √ b. c.
log 10 . 1
ln . log2 (0.125).
e5
Solución:
a. b. c.
√ 1
log 10 = log 10 2
1
= ln e−5
ln
1 e5 log2 (0.125) = log2 (1/8)
= log (10)
2 = log2 8−1
= −5 ln (e)
1
= ·1 = −5 · 1 = − log2 (8)
2
= 0.5. = −5. = −3.
Solución:
q
1
Sea y = log√3 5
81 . Entonces se tiene que:
√
r
y1 5
3 =
81
1 y 1 51
32 =
34
y 4
3 2 = 3− 5
y 4
log3 3 2 = log3 3− 5
y 4
=−
2 5
8
y=− .
5
A.9. LOGARITMOS 381
x x+1
− ln x2 − 1 .
ln + ln
x−1 x
Solución:
x x+1 2 x x+1
− ln x2 − 1
ln + ln − ln x − 1 = ln
x−1 x x−1 x
x+1
= ln − ln ((x + 1)(x − 1))
x−1
x+1
!
x−1
= ln
(x + 1)(x − 1)
x+1
= ln
(x + 1)(x − 1)2
1
= ln
(x − 1)2
= ln (x − 1)−2
= −2 ln (x − 1) .
a. b.
Solución:
a.
b.
e2x − ex − 6 = 0
2
(ex ) − ex − 6 = 0
(ex + 2) (ex − 3) = 0.
Luego, ex + 2 = 0 o ex − 3 = 0 . Por lo tanto ex = −2, lo que no puede ser, porque ex > 0 para
todo número real x, o también
ex = 3
ln (ex ) = ln(3)
x = ln(3)
x ≈ 1.09861.
En ocasiones se hace necesario calcular logaritmos por medio de bases diferentes. Cuando esta situación
se presenta se hace necesario realizar un cambio de base para transformar la expresión de una base
desconocida a una base conocida.
Proposición A.9.2. Sean b, k y x números reales tal que b y k son bases de logaritmos y x > 0.
Entonces se tiene que:
logk (x)
logb (x) = .
logk (b)
Demostración:
Sea y un número real dado por y = logb (x), de donde by = x . Luego, tomando logaritmo en base k en
ambos términos de esta igualdad y en virtud de la propiedad vi. de la proposición A.9.1 se tiene que:
puesto que y = logb (x). Como b es la base de un logaritmo entonces b 6= 1 y en consecuencia logk (b) 6= 0.
Entonces, dividiendo ambos miembros de la última igualdad por logk (b) se obtiene que:
logk (x)
logb (x) = .
logk (b)
A.10. SUMATORIAS Y PRODUCTORIAS 383
Solución:
Dado que 8 y 16 son potencias de 2, y que 9 y 27 son potencias de 3, entonces conviene transformar
los logaritmos como sigue:
Solución:
63x+2 = 200
63x+2 = log6 (200)
log6
3x + 2 = log6 (200)
3x = log6 (200) − 2
log6 (200) − 2
x=
3
ln(200)
ln(6) − 2
x=
3
x ≈ 0.31901.
Nota. El cambio de base en el ejemplo anterior se realiza con el propósito de hacer los cálculos
directamente en una calculadora cientíca corriente que tiene a disposición el logaritmo común y el
logaritmo natural; así, el cambio de base en este ejemplo también se puede hacer a base 10. Queda
como ejercicio para el lector comprobar que los resultados coinciden.
Al darse la suma o el producto de una secuencia numérica, en donde se destaque un orden, es posible
abreviar tal secuencia bajo una expresión. De esta forma,
n
X n
Y
ak y ak
k=m k=m
corresponden a una forma de expresar la sumatoria y la productoria de los términos de una secuen-
cia numérica respectivamente, que se obtienen dando a la variable k los valores enteros comprendidos
384 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
entre los límites escritos en la parte inferior y superior (inclusive) de los símbolos asociados. Por lo
tanto:
n
X
ak = am + am+1 + am+2 + . . . + an−2 + an−1 + an
k=m
y
n
Y
ak = am · am+1 · am+2 · . . . · an−2 · an−1 · an .
k=m
n
X n
X n
X n
Y n
Y n
Y
ai = aj = ak y que ai = aj = ak
i=m j=m k=m i=m j=m k=m
y en consecuencia utilizar i, j, k o cualquier otra letra no marca ninguna diferencia. Es común utilizar
la letra i.
Ejemplo A.10.1. Escribir las siguientes secuencias utilizando el símbolo de sumatoria o de produc-
toria según corresponda:
√
4
√
5
√
6 29
√
a. a1 + a2 + a3 + . . . + a64 . d. 6· 8· 10 · . . . · 56.
b. x21 · x22 · x23 · . . . · x251 . e. (y1 − k)2 + (y2 − k)2 + (y3 − k)2 + . . . + (yn − k)2 .
Solución:
a.
64
X
a1 + a2 + a3 + . . . + a64 = ai .
i=1
b.
51
Y
x21 · x22 · x23 · . . . · x251 = x2i .
i=1
c.
58
X
152 + 172 + 192 + . . . + 1172 = (2i + 1)2 .
i=7
d.
28
√
4
√
5
√
6
√
29
Y i+1
√
6· 8· 10 · . . . · 56 = 2i.
i=3
e.
n
X
(y1 − k)2 + (y2 − k)2 + (y3 − k)2 + . . . + (yn − k)2 = (yi − k)2 .
i=1
A.10. SUMATORIAS Y PRODUCTORIAS 385
f.
47
Y
x5 y6 · x6 y7 · x7 y8 · . . . · x47 y48 = xi yi+1 .
i=5
Nota. La forma de escribir una sumatoria (o una productoria) no es única. Por ejemplo,
58
X 59
X
(2i + 1)2 = (2i − 1)2 .
i=7 i=8
Queda como ejercicio para el lector encontrar otra forma de escribir esta sumatoria.
a. c. e.
6
X 6
X 6
X
xi . x2i . (xi − 3).
i=1 i=1 i=1
b. d.
6
Y 6
Y
xi . (xi + 1)2 .
i=1 i=1
Solución:
a.
6
X
xi = x1 + x2 + . . . + x6
i=1
= 2 + 5 + 0 + (−1) + 6 + 4
= 16.
b.
6
Y
xi = x1 · x2 · . . . · x6
i=1
= 2 · 5 · 0 · (−1) · 6 · 4
= 0.
c.
6
X
x2i = x21 + x22 + . . . + x26
i=1
386 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
= 22 + 52 + 02 + (−1)2 + 62 + 42
= 4 + 25 + 0 + 1 + 36 + 16
= 82.
d.
6
Y
(xi + 2)2 = (x1 + 2)2 · (x2 + 2)· . . . · (x6 + 2)2
i=1
= (2 + 2)2 · (5 + 2)2 · (0 + 2)2 · ((−1) + 2)2 · (6 + 2)2 · (4 + 2)2
= 4 · 49 · 4 · 1 · 64 · 36
= 1, 806, 336.
e.
6
X
(xi − 3) = (x1 − 3) + (x2 − 3) + . . . + (x6 − 3)
i=1
= (2 − 3) + (5 − 3) + (0 − 3) + ((−1) − 3) + (6 − 3) + (4 − 3)
= (−1) + 2 + (−3) + (−4) + 3 + 1
= −2.
y en particular que
n n
!2
X X
a2i 6= ai .
i=m i=m
n n
! n
!
Y Y Y
(ai + bi ) 6= ai + bi .
i=m i=m i=m
Proposición A.10.1. Sean am , am+1 , . . . , an−1 , an y bm , bm+1 , . . . , bn−1 , bn dos sucesiones de núme-
ros reales donde m ≤ n, y c un número real constante. Entonces se cumple que:
A.10. SUMATORIAS Y PRODUCTORIAS 387
i. La sumatoria de la suma de dos (o más) términos es igual a la suma de las sumatorias separadas
de los términos:
n
X n
X n
X
(ai + bi ) = ai + bi .
i=m i=m i=m
La productoria del producto de dos (o más) términos es igual al producto de las productorias
separadas de los términos:
n
Y n
Y n
Y
a i bi = ai · bi .
i=m i=m i=m
ii. La sumatoria de la diferencia de dos (o más) términos es igual a la diferencia de las sumatorias
separadas de los términos:
n
X n
X n
X
(ai − bi ) = ai − bi .
i=m i=m i=m
La productoria del cociente de dos (o más) términos es igual al cociente de las productorias
separadas de los términos:
n Qn
Y ai ai
= Qi=m
n .
b
i=m i i=m bi
iii. La sumatoria de una constante multiplicada por un término es igual a la constante multiplicada
por la sumatoria del término:
n
X n
X
c ai = c ai .
i=m i=m
iv. La sumatoria de un término más una constante es igual a la sumatoria del término más la
constante multiplicada por el número que indiquen los límites de la sumatoria:
n
X n
X
(ai + c) = ai + c (n − m + 1).
i=m i=m
n
Y n
Y
c ai = cn−m+1 ai .
i=m i=m
v. La sumatoria de una constante es igual a la constante multiplicada por el número que indiquen
los límites de la sumatoria:
n
X
c = c (n − m + 1).
i=m
388 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
La productoria de una constante es igual a la constante a la potencia que indiquen los límites de
la productoria:
n
Y
c = cn−m+1 .
i=m
Solución:
i.
4
X
(xi + yi ) = x1 + y1 + x2 + y2 + x3 + y3 + x4 + y4
i=1
=2+1+5+3+1+1+2+5
=3+8+2+7
= 20.
4
X 4
X
xi + yi = x1 + x2 + x3 + x4 + y1 + y2 + y3 + y4
i=1 i=1
=2+5+1+2+1+3+1+5
= 10 + 10
= 20.
4
Y
xi yi = x1 · y1 · x2 · y2 · x3 · y3 · x4 · y4
i=1
=2·1·5·3·1·1·2·5
= 2 · 15 · 1 · 10
= 300.
4
Y 4
Y
xi · yi = x1 · x2 · x3 · x4 · y1 · y2 · y3 · y4
i=1 i=1
=2·5·1·2·1·3·1·5
= 20 · 15
= 300.
A.10. SUMATORIAS Y PRODUCTORIAS 389
ii.
4
X
(xi − yi ) = x1 − y1 + x2 − y2 + x3 − y3 + x4 − y4
i=1
=2−1+5−3+1−1+2−5
= 1 + 2 + 0 + (−3)
= 0.
4
X 4
X
xi − yi = x1 + x2 + x3 + x4 − (y1 + y2 + y3 + y4 )
i=1 i=1
= 2 + 5 + 1 + 2 − (1 + 3 + 1 + 5)
= 10 − 10
= 0.
4
Y xi x1 x2 x3 x4
= · · ·
i=1
yi y1 y2 y3 y4
2 5 1 2
= · · ·
1 3 1 5
20
=
15
4
= .
3
Q4
xi x1 · x2 · x3 · x4
Qi=1
4 =
i=1 yi
y1 · y2 · y3 · y4
2·5·1·2
=
1·3·1·5
20
=
15
4
= .
3
iii.
4
X
2 xi = 2 x1 + 2 x2 + 2 x3 + 2 x4
i=1
=2·2+2·5+2·1+2·2
= 4 + 10 + 2 + 4
= 20.
4
X
2 xi = 2 (x1 + x2 + x3 + x4 )
i=1
390 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
= 2 (2 + 5 + 1 + 2)
= 2 · 10
= 20.
4
Y
x2i = x21 · x22 · x23 · x24
i=1
= 22 · 52 · 12 · 22
= 4 · 25 · 1 · 4
= 400.
4
!2
Y
xi = (x1 · x2 · x3 · x4 )2
i=1
= (2 · 5 · 1 · 2)2
= 202
= 400.
iv.
4
X
(xi + 2) = x1 + 2 + x2 + 2 + x3 + 2 + x4 + 2
i=1
=2+2+5+2+1+2+2+2
=4+7+3+4
= 18.
4
X
xi + 2 (n − m + 1) = x1 + x2 + x3 + x4 + 2 (4 − 1 + 1)
i=1
=2+5+1+2+2·4
= 10 + 8
= 18.
4
Y
2 xi = 2 x1 · 2 x2 · 2 x3 · 2 x4
i=1
=2·2·2·5·2·1·2·2
= 4 · 10 · 2 · 4
= 320.
A.11. EJERCICIOS 391
4
Y
2n−m+1 xi = 24−1+1 · x1 · x2 · x3 · x4
i=1
= 24 · 2 · 5 · 1 · 2
= 16 · 20
= 320.
v.
4
X
2 = 2 + 2 + 2 + 2 = 8.
i=1
2 (n − m + 1) = 2 (4 − 1 + 1)
=2·4
= 8.
4
Y
2 = 2 · 2 · 2 · 2 = 16.
i=1
2n−m+1 = 24−1+1
= 24
= 16.
A.11. Ejercicios
A.1. Calcular:
a. d.
2 −2
1 7
1 5 1
· ÷ ÷ . % .
4 3 7 2 4
e.
1 1 1
b. 5 − 4+ 20
2 3 2 .
− 17
0.25 · (0.1) 3
.
0.5 · 40 f.
√ √ √ √
(3 2 − 5 3)(2 2 + 3 3).
c.
vq
u 3 125 g.
1
u
27
tq .
u
1 .
4 32 1+ 1+ 1
81 1+ 1 1
1+
2
392 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
h. l.
1 1 1 r !
− 2−2 −3 −3 − . 1
2 3 2 log2 .
8
i.
log(0.00001). m.
j.
√ 1
log 31 .
log2
4
64 . 9
k. n.
1
ln (e) + ln e2 + ln e3 .
log0.01 .
10
a. h.
(3xm + 4y n )(3xm − 4y n ).
−3x − (4x + 3y − (2x − y)
− (4x + 2y) − 3x) − 2y. i.
v !8n
b. u m 2m
−2m (y 2 )
t − 124 n x
u
2m
−4m m .
−(5x − (3y − 5x) − (2x − 5y)) y 1 n
x−6m
16
− ((2x − 7y) − (2y − z)).
j.
c. 31
m 2n 3−2n −2m 125x6 y 3m · 8x9 y −12m .
5x2m+1 y −3x3n y
.
d. k.
2x2 −y 2
v
u (−7x−2 )2 (5y)−4
u
x −y
t 1 . 4x2 +y 2
.
1 −4 2
x (−2y 2 )4 4xy +1
9
e. l.
x−y y y2
(x + 2y)(3x − 5y) − (x − y)(x + 2y). − − .
x x + y x(x + y)
f. m.
2x2 + 3x(2x − 3y(x + 2y) − y 2 ). √
3
√
logx x + logy ( 4 y) .
g.
n.
1 x y
xyz xy − yz + xz
x
. logx + logx (xy) .
x−3 yz 2 y
c. Una tienda deportiva ordenó una misma cantidad de bolas de tenis blancas y amarillas.
El almacén solicitó 30 bolas blancas adicionales, haciendo que la razón de bolas blancas a
amarillas sea 6:5. ¾Cuántas bolas de tenis se ordenaron inicialmente?
d. El precio de un artículo disminuye 20 por ciento. ¾Por cuál porcentaje se debe incrementar
el precio del artículo para que vuelva al precio inicial?
f. Un hombre compra 10 cajas de naranjas por un total de $80,000. Si este hombre pierde dos
cajas, ¾cuál es el precio al que debe vender el resto de las cajas para obtener una ganancia
del 25 % sobre el costo inicial?
g. El 10 % de las niñas de una clase tienen ojos azules. La razón de niños a niñas en esta clase
es 3:4. ¾Cuál es la fracción de estudiantes en la clase que tienen ojos azules?
i 1 2 3 4 5 6 7 8 9 10
xi 3 -4 5 6 -1 -4 3 1 0 2
yi 5 1 -2 -1 3 2 7 -2 -12 -7
Por medio de las propiedades correspondientes, calcular las siguientes sumatorias y productorias:
a. e. i.
10 10
!2 10
X Y
3x2i + 1 . x2i · 2yi .
X
2xi − 9 .
i=1 i=1 i=1
b. j.
10 f.
X 2 10 10 2 3
(xi − 2yi ) . X
2
Y xi
(2xi − 9) . −1 .
i=1
i=1 i=1
y i
c.
g. k.
10
X 10 10 2
(5xi − 2yi + 1) . Y Y 1
3x2i − 5. xi yi .
i=1
i=1 i=1
3
d.
h. l.
38
X 10
Y 10
Y yi −1
3x2i 2
(3xi − yi )(2yi + xi ). −5 . .
i=1 i=1 i=1
x−2
i
a. b. c.
38
X 38
X 38
X
(8xi − 3). (2xi + 5yi ). (3xi − 3)(2yi + 1).
i=1 i=1 i=1
394 APÉNDICE A. ELEMENTOS BÁSICOS DE MATEMÁTICAS
a. m.
2x 3(1 − 2x)
3(x − 5) = + . x1 + x2 + x3 = 1
4 6
2x1 + 3x2 + 4x3 = 3
b.
4x − 1 3x − 1 4x1 + 9x2 + 16x3 = 11.
+2= .
6 8
n.
c.
2(x + 1) x 2x1 + 3x2 − x3 = 5
+ 4(x − 2) = + 5.
3 2 −x1 + 2x2 + 3x3 = 0
d. 4x1 − x2 + x3 = −1.
(x + 3)(x − 3) = (x + 6)2 .
ñ.
e.
2 4 −10 2x2 − 7x = −3.
− = 2 .
x+3 x−2 x +x−6
o.
f. 1 1
x−2 x−3 x2 − x + = 870 + .
− = 0. 4 4
x+8 x+2
p.
g.
1 1 5 x2 + 2x − 15.
+ = 2 .
x−3 x+2 x −x−6
q.
h.
2 − 2(x − 3) x + 4 2 ln(x) = ln(2) + ln(3x − 4).
− = 3.
2 4
r.
i. √
( x 324
2x = y − 7 2= √
x
.
32
y = 5x + 16.
s.
j.
( 52+3x = 84x−1 .
x+3
y =5
x − y = 9. t.
log8 (x − 6) + log8 (x + 6) = 2.
k. (
5x+3
2y+1 =5 u.
2x − 5y = −5x + 7y. ln x3 − 1 = 1 + ln x2 + x + 1 .
l.
v.
(
x+1
y−2 =6 6
x−3
= 14 . log(x) + = 5.
y+5 log(x)
a. b. c.
d. i. ñ.
12x2 − x − 6.
f. l.
n2 + 28n − 29. b4m
49a10n − . q.
81
g. m.
1 1 + 3a2 − 3a − a3 .
− 4x2m . 3x2 − 5x − 2.
9
n. r.
h.
2 2 3
a − 2a − 35. 27 − 27x + 9x − x . 216 − x12 .
i. ii. iii.
n n n 2
X n(n + 1) X n(n + 1)(2n + 1) X n(n + 1)
i= . i2 = . i3 = .
i=1
2 i=1
6 i=1
2
A.9. El valor absoluto de un número real x, denotado con |x|, se dene como:
x, x ≥ 0;
|x| =
−x, x < 0.
Sean x y y números reales tales que hacen sentido las siguientes operaciones algebraicas. De-
mostrar que se cumplen las siguientes propiedades:
i. iv.
√
|x| = x2 . |x + y| ≤ |x| + |y|.
ii. v.
|x · y| = |x| · |y|. |x| ≤ y ⇔ −y ≤ x ≤ y.
iii. vi.
|x/y| = |x|/|y|. |x| ≥ y ⇔ x ≤ −y ∨ x ≥ y.
a. g.
4x − 7 < 3x + 5. 3x + 7 > 1 y 2x + 1 < 3.
b. h.
x+5 3x + 7 > 1 o 2x + 1 < −5.
≤ 0.
2x − 1
c. i.
7 |3x − 5| ≥ 1.
> 3.
2x
j.
d. x
1 | − 2| ≤ 6.
≤ 4. 3
3x − 2
k.
e. 1
x2 − x − 12 < 0. | − 3| > 6.
x
f. l.
Referencias electrónicas
Las siguientes son las páginas web de las que se han tomado algunos ejemplos o ejercicios:
http://recursostic.educacion.es/secundaria/edad/4esomatematicasB/radicales/impresos/quincena2.pdf.
http://www.vitutor.com/di/re/r_e.html.
http://es.wikipedia.org/wiki/Factorizaci%C3%B3n.
http://es.wikipedia.org/wiki/Polinomio.
http://www.galeon.com/damasorojas8/BALDOR.pdf.
http://algebrabaldor.webcindario.com/id181.htm.
http://algebrabaldor.webcindario.com/id303.htm.
http://es.wikipedia.org/wiki/Logaritmo.
http://www.mat.uson.mx/~jldiaz/Documents/Derivadas/Repaso_Logaritmos.pdf.
http://www.vitutor.com/al/log/log.html.
http://www.mat.uson.mx/~jldiaz/Documents/Derivadas/Repaso_Logaritmos.pdf.
http://www.mat.uson.mx/~jldiaz/Documents/Derivadas/Repaso_Logaritmos.pdf.
http://www.vitutor.com/al/log/ecu1_Contenidos.html.
http://www.mat.uson.mx/~jldiaz/Documents/Derivadas/Repaso_Logaritmos.pdf.
http://www.x.edu.uy/liceo26/libro/logaritmos.pdf.
http://recursostic.educacion.es/secundaria/edad/3esomatematicas/3quincena3/3eso_quincena3.pdf.
http://www.vitutor.com/ecuaciones/2/ecu_Contenidos.html.
http://huitoto.udea.edu.co/Matematicas/3.4.html.
http://recursostic.educacion.es/secundaria/edad/3esomatematicas/3quincena3/3eso_quincena3.pdf.
http://facultad.bayamon.inter.edu/edavila/PRECALCULO%20%20ARCHIVOS/ECUACIONES%20Y%20FUNCIONES%20LOGARITMICAS.
htm.
A.11. EJERCICIOS 397
Apéndice B
Elementos básicos de conjuntos
B.1. Introducción
En este apéndice se presentan las nociones fundamentales de conjuntos que se usan frecuentemente
en la disciplina estadística. Tales conceptos son esenciales para abordar cualquier teoría y práctica
cuantitativa en la ciencia y sus anes, en especial la estadística, en la que estas ideas son parte
primordial de la teoría de las probabilidades. Aquí se muestran las nociones relacionadas con las
deniciones fundamentales de conjuntos, algunas propiedades asociadas con las operaciones entre
ellos, ciertas observaciones sobre conjuntos numéricos y algunas relaciones entre las funciones y los
conjuntos. La estructura general y parte del contenido de este apéndice ha sido tomado del libro de
probabilidad de Blanco (2004), que ha servido como una excelente guía para ilustrar los conceptos
dados.
Nota. Aunque no es una norma, es costumbre denotar los conjuntos con las letras mayúsculas del
alfabeto, como A, B , C , y sus elementos con las letras minúsculas, como a, b, c, por ejemplo.
398
B.2. CONCEPTOS GENERALES 399
Los objetos de la colección pueden ser cualquier cosa. Cada uno de ellos es un elemento o miembro
del conjunto que a su vez es denido únicamente por éstos y por nada más. En particular, el orden
en el que se representen los elementos de un conjunto es irrelevante. Además, cada elemento puede
aparecer de manera idéntica una sola vez, esto es, no puede haber elementos totalmente idénticos
repetidos.
Nota. Si A es un conjunto entonces se escribe a ∈ A para indicar que a es un miembro del conjunto
A. Si por el contrario a no es un elemento de A se escribe x ∈
/ A.
Los conjuntos se pueden escribir enumerando todos sus elementos uno por uno o por medio de una
propiedad que todos posean. En el primer caso se dice que el conjunto está dado por extensión y en
el segundo por comprensión .
Ejemplo B.2.1. El conjunto
A = {N, , F, }
está escrito extensivamente, mientras que el conjunto
B = {x : x es un número primo}
F∈A y H∈
/ A,
mientras que
2∈B y 1∈
/ B,
por ejemplo.
Ejemplo B.2.2. Teniendo en cuenta los conjuntos del ejemplo B.2.1 se observa que A es un conjunto
nito ya que #A = 4, mientras que B es un conjunto innito porque el conjunto de números primos
no es un conjunto nito.
Si A y B son conjuntos tales que A⊆B y existe por lo menos un elemento de B que no está en A,
se dice que A es un subconjunto propio de B . Cuando el conjunto A es un subconjunto propio del
conjunto B se escribe A ⊂ B. Por lo tanto, si A ⊂ B entonces A ⊆ B , pero la implicación contraria
no es cierta. ¾El lector puede dar un ejemplo que rectique este hecho?
Nota. Para demostrar que dos conjuntos A y B son iguales es usual demostrar primero que A⊆B y
luego que B ⊆ A.
Ejemplo B.2.3. Sea A un conjunto como en el ejemplo B.2.1. Entonces se tiene que
por ejemplo.
Nota. En seguida se expresan simbólicamente los aspectos ya mencionados relacionados con la conte-
nencia de conjuntos. Si A y B son dos conjuntos entonces:
1 Los diagramas de Venn son ilustraciones usadas en la teoría de conjuntos. Estos diagramas se usan para mostrar
grácamente la disposición de los conjuntos, representando cada conjunto mediante un círculo, un óvalo o cualquier otra
gura. La posición relativa de tales círculos muestra la relación entre los conjuntos involucrados (Wikipedia 2012c).
B.2. CONCEPTOS GENERALES 401
i. iii.
A ⊆ B ⇔ ∀x ∈ A : x ∈ B. A ⊂ B ⇔ A ⊆ B ∧ ∃x ∈ B : x ∈
/ A.
ii. iv.
A * B ⇔ ∃x ∈ A : x ∈
/ B. A = B ⇔ A ⊆ B ∧ B ⊆ A.
El símbolo ⇔ se lee si y solo si y representa una equivalencia entre dos expresiones lógicas. Los
símbolos ∀ y∃ se leen respectivamente para todo y existe. Y los símbolos ∧ y ∨ son conectores
lógicos y se leen respectivamente y y o.
2
Nota. Las partes del conjunto A es un conjunto de conjuntos denotado con PA dado por
PA = {X : X ⊆ A}.
A partir de la denición B.2.5 es claro que para cualquier conjunto A se tiene que Φ ∈ PA y A ∈ PA .
Ejemplo B.2.4. Las partes del conjunto A = {a, b, c} son:
PA = {Φ; {a}; {b}; {c}; {a, b}; {a, c}; {b, c}; A}.
Se observa que los elementos de PA son conjuntos.
Proposición B.2.1. Sea A un conjunto con n elementos. Entonces la cantidad de subconjuntos de
A es
#PA = 2n ,
y además el número de subconjuntos de A con r elementos, con r ≤ n, es
n!
r!(n − r)!
donde n! corresponde al producto de todos los enteros desde 1 hasta n.
Nota. La expresión ! se llama factorial y se estudia con cierto detalle en la sección A.4.
Ejemplo B.2.5. En el ejemplo B.2.4 se observa que la cantidad de subconjuntos del conjunto A es
#PA = 23 = 8,
y además el número de subconjuntos de A con dos elementos es
3! 3·2·1
= = 3,
2!(3 − 2)! (2 · 1)(1)
por ejemplo.
2 Conjunto cuyos elementos son a su vez conjuntos.
402 APÉNDICE B. ELEMENTOS BÁSICOS DE CONJUNTOS
En las aplicaciones de teoría de conjuntos es usual que todos los conjuntos de interés sean subconjuntos
de un conjunto mayor a todos. A este gran conjunto se le llama conjunto universo y se denota con
U.
En esta sección se presentan las operaciones básicas entre conjuntos, a saber, la unión, la intersección,
la diferencia, la diferencia simétrica y el complemento.
A ∪ B = {x : x ∈ A ∨ x ∈ B}.
Nota. De la misma forma, si A1 , A2 , . . . , An son n conjuntos entonces la unión de todos ellos está
dada por:
n
[
Ai = A1 ∪ A2 ∪ . . . ∪ An = {x : x ∈ Ai para algún i = 1, 2, . . . , n}.
i=1
A ∩ B = {x : x ∈ A ∧ x ∈ B}.
n
\
Ai = A1 ∩ A2 ∩ . . . ∩ An = {x : x ∈ Ai para todo i = 1, 2, . . . , n}.
i=1
De otra parte, si A y B son dos conjuntos tales que A∩B = Φ entonces se dice que A y B son
excluyentes o disjuntos . En la gura B.2 se muestra un ejemplo de un par de conjuntos con esta
característica.
B.3. OPERACIONES ENTRE CONJUNTOS 403
A − B = {x : x ∈ A ∧ x ∈
/ B}.
Nota. Se observa que la diferencia de conjuntos no es conmutativa, esto es, A − B 6= B − A. ¾El lector
puede dar un ejemplo que rectique este hecho?
A4B = {x : (x ∈ A ∧ x ∈
/ B) ∨ (x ∈
/ A ∧ x ∈ B)}.
AC = {x : x ∈ U ∧ x ∈
/ A}.
i. Leyes conmutativas: a. A ∪ (B ∪ C) = (A ∪ B) ∪ C = A ∪ B ∪ C .
a. A ∪ B = B ∪ A. b. A ∩ (B ∩ C) = (A ∩ B) ∩ C = A ∩ B ∩ C .
b. A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C). d. A − (B − C) = (A − B) ∪ (A − C).
c. (A ∪ B) − C = (A − C) ∪ (B − C). e. A − (B ∪ C) = (A − B) ∩ (A − C).
iv. Leyes complementarias: f. (A − B) ∪ (A ∩ B) = A.
a. A ∪ AC = U . g. (A − B) ∩ (A ∩ B) = Φ.
a. A − B = A ∩ BC . b. A ∩ A = A.
b. A − B = A − (A ∩ B). viii. Ley involutiva:
C
c. A − B = (A ∪ B) − B . AC = A.
En la gura B.3 se muestran los diagramas de Venn para las operaciones entre conjuntos.
Ejemplo B.3.1. Sean A = {1, 2, 3, 4, 5, 6, 7} y B = {2, 4, 6, 8} dos subconjuntos del conjunto universo
U = {1, 2, 3, 4, 5, 6, 7, 8, 9}. Escribir extensivamente:
a. c. e.
A ∪ B. A − B. A M B.
b. d. f.
A ∩ B. B − A. AC .
Solución:
a. d.
A ∪ B = {1, 2, 3, 4, 5, 6, 7, 8}. B − A = {8}.
b. e.
A ∩ B = {2, 4, 6}. A M B = {1, 3, 5, 7, 8}.
c. f.
A − B = {1, 3, 5, 7}. AC = {8, 9}.
C C
A ∩ BC ∪B .
Solución:
C C C C
A ∩ BC ∪B = AC ∪ B C ∪ B
C
= AC ∪ B ∪ B
C
= AC ∪ (B ∪ B)
C
= AC ∪ B
C
= AC ∩ B C
= A ∩ BC .
Figura B.3: Diagramas de Venn para las operaciones entre conjuntos. De izquierda a derecha y de arriba a abajo:
A ∪ B , A ∩ B , A − B , B − A, A4B y AC .
i. ∀i = 1, 2, . . . , n : Ai 6= Φ.
ii. ∀i, j = 1, 2, . . . , n, i 6= j : Ai ∩ Aj = Φ.
Sn
iii. i=1 Ai = U .
406 APÉNDICE B. ELEMENTOS BÁSICOS DE CONJUNTOS
Nota. De otra forma, la denición B.3.6 establece que los subconjuntos de una partición de un conjunto
universo U deben ser tales que: i. ninguno de ellos sea vacío, ii. todos sean disjuntos dos a dos y iii. la
unión de todos ellos debe ser igual a U.
Ejemplo B.3.3. Sea U como en el ejemplo B.3.1. La colección de subconjuntos
i. {5, 7, 9} =
6 Φ, {2, 4, 6, 8} =
6 Φ y {1, 3} =
6 Φ.
ii. {5, 7, 9} ∩ {2, 4, 6, 8} = Φ, {5, 7, 9} ∩ {1, 3} = Φ y {2, 4, 6, 8} ∩ {1, 3} = Φ.
iii. {5, 7, 9} ∪ {2, 4, 6, 8} ∪ {1, 3} = U .
A continuación se muestran algunas generalidades sobre conjuntos numéricos, desde los números na-
turales hasta los números complejos.
N = {1, 2, 3, 4, . . .}.
Nota. Puesto que los números naturales se utilizan para contar objetos, el 0 puede considerarse el
número que corresponde a la ausencia de los mismos. Dependiendo del autor y de la tradición, el
conjunto de los números naturales puede presentarse con o sin el 0. Además, se dice que el conjunto
3
de los números naturales es un conjunto innito numerable .
3 Un conjunto se llama numerable cuando existe una función biyectiva (detalles en la sección C.2) entre dicho
conjunto y el conjunto de los números naturales o un subconjunto nito del mismo. En caso contrario se dice que el
conjunto es no numerable . Se observa que todo conjunto no numerable es un conjunto innito.
B.4. CONJUNTOS NUMÉRICOS 407
Nota. Al igual que el conjunto de los números naturales, el conjunto de los números enteros también
4
es un conjunto innito numerable . Además, se observa que N ⊂ Z, es decir, todo número natural es
un número entero.
na o
Q= :a∈Z∧b∈N .
b
Nota. Al igual que el conjunto de los números enteros, el conjunto de los números racionales también
es un conjunto innito numerable. Además, se observa que Z ⊂ Q, es decir, todo número entero es un
número racional.
Todo número racional admite una representación decimal, obtenida al dividir el numerador entre el
denominador. Esto da lugar a dos tipos de expresiones decimales, a saber, las exactas y las periódicas.
1 1
Por ejemplo,
2 = 0.5 es una expansión decimal exacta y
3 = 0.33333 . . . es una expansión decimal
periódica.
Nota. El conjunto de los números irracionales es un conjunto innito no numerable. Además, se observa
que Q ∩ I = Φ.
De esta forma, los números irracionales no admiten una representación decimal exacta o periódica
y por lo tanto tales números tienen una expansión decimal innita no periódica. En general, toda
expresión decimal de los números irracionales es solo una aproximación en números racionales al
número irracional referido. Por ejemplo, el número racional 1.4142135 es una aproximación a siete cifras
√
decimales del número irracional
√ 2, el cual posee innitas cifras decimales no periódicas. Entonces,
√
se dice que 2 es aproximadamente igual a 1.4142135, lo que se escribe 2 ≈ 1.4142135. Debido a
5
ello, los números irracionales más conocidos son identicados mediante símbolos especiales . Además,
los números irracionales se clasican en dos tipos, a saber, los algebraicos y los trascendentes. Por
√
ejemplo, 2 es un número irracional algebraico y π es un número racional trascendente. Queda como
ejercicio para el lector profundizar más sobre esta clasicación.
R = {x : x ∈ Q ∨ x ∈ I}.
Nota. El conjunto de los números reales es un conjunto innito no numerable. Además, se observa
que Q ⊂ R, I ⊂ R y R = Q ∪ I.
El conjunto de los números reales incluye a todos los conjuntos numéricos descritos hasta el momento
y a su vez hace parte de un conjunto de números más general denominado conjunto de los números
complejos . Este conjunto se denota con
√ C y está conformado por los números de la forma a + bi
donde a y b son números reales e i = −1 es la unidad imaginaria . De esta forma, el conjunto
de los números complejos está conformado por los números reales (números de la forma a + 0i), los
números imaginarios puros (números de la forma 0 + bi con b 6= 0) y los números complejos mixtos
(números de la forma a + bi con a 6= 0 y b 6= 0).
Nota. Los símbolos −∞ y ∞ se leen respectivamente menos innito y más innito y no son números
reales. Además, el intervalo (−∞, ∞) coincide con R.
5 Tres números irracionales muy conocidos son: el número π ≈ 3.1415 que corresponde a la razón entre la longitud
1 n
de una circunferencia y su diámetro; el número e ≈ 2.7182 que corresponde a lı́mn→∞ 1 + (detalles en la sección
√ n
C.3); y el número φ ≈ 1.6180 que corresponde a la proporción áurea dada por (1 + 5)/2.
B.5. FUNCIONES Y CONJUNTOS 409
En esta sección se presentan algunos conceptos asociados con las funciones y los conjuntos.
Nota. No se debe confundir la notación de la imagen inversa de un subconjunto C por una función f
−1
simbolizada con f (C), con la inversa de una función evaluada en x denotada con f −1 (x) (detalles
en la sección C.2).
Ejemplo B.5.1. Sea f :R→R una función dada por f (x) = x2 + 1. Hallar:
a. b.
f −1 ([17, ∞)) . f ((0, 1]) .
Solución:
a.
b.
Algunas de las propiedades más importantes de las imagen inversa de conjuntos por una función están
resumida a continuación:
i. iii.
−1
f f (N ) ⊆ N.
f −1 (N1 ∩ N2 ) = f −1 (N1 ) ∩ f −1 (N2 ).
B.6. Ejercicios
B.1. Demostrar que si A y B son dos conjuntos tales que A⊆B entonces:
a. A ∪ B = B. b. A ∩ B = A. c. A − B = Φ. d. A4B = B − A.
a. b.
C
C C 4 A − BC ∪ C . AC ∪ B 4 C C − B .
a. b.
n
!C n n
!C n
[ \ \ [
Ai = AC
i . Ai = AC
i .
i=1 i=1 i=1 i=1
B.4. Demostrar que si A1 y A2 son colecciones de subconjuntos de un conjunto universo U tales que
A1 ⊆ A2 entonces
∩A2 ⊆ ∩A1 ⊆ ∪A1 ⊆ ∪A2
donde
para i = 1, 2.
AP = {X ∩ P : X ∈ A}
es una partición de P.
C.1. Introducción
En este apéndice se presentan las nociones fundamentales del cálculo usadas frecuentemente en la
disciplina estadística. Tales ideas se presentan con el propósito de facilitar la aproximación del lector a
las probabilidades desde la perspectiva de las variables aleatorias continuas. En este apéndice, basado
principalmente en el libro de cálculo de una variable de Thomas (2006) de donde se han tomado
textualmente variados conceptos y ejemplos se muestran los aspectos teóricos del cálculo univariado
relacionados con las funciones, los límites las derivadas y las integrales. Se deja como ejercicio para el
lector que consulte todas las demostraciones de las proposiciones dadas en este apéndice.
C.2. Funciones
Las funciones representan el principal objeto de análisis en el cálculo y la estadística, ya que constituyen
la clave para describir los fenómenos del mundo real en términos matemáticos. Cuando el valor de una
cantidad variable y depende y está totalmente determinado por el valor de otra cantidad variable x de
un conjunto (detalles en el apéndice B), se dice que y es una función de la variable x. Frecuentemente
el valor de y está dado por una fórmula que indica como calcularlo a partir del valor de x. Una manera
simbólica de expresar y es una función de la variable x consiste en escribir
y = f (x)
412
C.2. FUNCIONES 413
Ejemplo C.2.1. En la tabla C.1 se muestran el dominio y el rango de algunas funciones y en la gura
2
C.1 se presenta la gráca de cada una de ellas.
p(x)
f (x) =
q(x)
donde p(x) y q(x) son funciones polinomiales. El dominio de una función racional es {x ∈ R :
q(x) 6= 0}, es decir, el conjunto de todos lo números reales tales que q(x) 6= 0.
1 En este apéndice todas las funciones los son.
2 La gráca de una función y = f (x) consiste en el conjunto de todos los puntos en el plano cartesiano cuyas
coordenadas son (x, f (x)) donde x es cualquier valor del dominio de la función.
414 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
• Una función algebraica es una función constituida a partir de polinomios usando las operacio-
3
nes algebraicas . Las funciones polinomiales y racionales son un caso particular de las funciones
algebraicas.
f (x) = bx
donde b es un número real positivo tal que b 6= 1 denominado base . El dominio y el rango de
todas las funcione exponenciales es (−∞, ∞) y (0, ∞) respectivamente.
• Una función logarítmica es una función de la forma
donde b es una base (detalles en la sección A.9). Las funciones logarítmicas son las funciones
inversas de las funciones exponenciales. El dominio y el rango de todas las funciones logarítmicas
es (0, ∞) y (−∞, ∞) respectivamente.
• Una función trascendente es una función no algebraica. Entre ellas se encuentran las funciones
trigonométricas, las exponenciales y las logarítmicas.
Ejemplo C.2.2. La función f1 (x) = x2 es una función par dado que f1 (−x) = (−x)2 = x2 , mientras
3
que la función f2 (x) = x es una función impar puesto que f2 (−x) = (−x)3 = −x3 . En la gura C.2
se presenta la gráca de ambas funciones.
Nota. La gráca de una función par es simétrica respecto al eje y y la gráca de una función impar
4
es simétrica respecto al origen .
A continuación se denen algunos tipos de funciones que satisfacen ciertas propiedades especiales en
relación con el dominio y el rango:
Nota. Usando la notación de la denición C.2.3, las funciones inyectivas también se pueden denir
como sigue: se dice que f es una función inyectiva si para cada par de elementos a1 y a2 de A tales que
a1 6= a2 se sigue que f (a1 ) 6= f (a2 ). ¾Por qué estas dos deniciones de función inyectiva coinciden?
Además, toda función biyectiva es tanto inyectiva como sobreyectiva.
Ejemplo C.2.3. Demostrar que la función f : (0, ∞) → R denida por f (x) = ln(x) es biyectiva.
Solución:
Esta función es inyectiva puesto que si x1 y x2 son un par de elementos de (0, ∞) tales que f (x1 ) =
f (x2 ) entonces:
ln(x1 ) = ln(x2 )
eln(x1 ) = eln(x2 )
x1 = x2 .
Además, esta función también es sobreyectiva porque para cualquier número real y , existe un número
real positivo x tal que ln(x) = y , a saber, x = ey . En consecuencia, se sigue que f es biyectiva dado
que f es tanto inyectiva como sobreyectiva.
Ejemplo C.2.4. La función f : R → R dada por f (x) = x2 no es inyectiva ya que para todo número
real x se tiene que f (x) = f (−x). Además, esta función tampoco es sobreyectiva porque no existe
ningún número real que tenga como imagen un número real negativo dado. No obstante, si la función
f (x) = x2 se redene de forma tal que f : [0, ∞) → [0, ∞) entonces se sigue que f es biyectiva. Queda
como ejercicio para el lector demostrar este hecho.
Proposición C.2.1. Sea f :A→B una función denida entre el conjunto A y el conjunto B.
i. Si f es inyectiva entonces #A ≤ #B .
Como cada valor de una función uno-a-uno proviene de una y solo una entrada, el efecto de la función
se pude invertir, enviando la salida de regreso a la entrada de la que vino bajo la función.
Nota. Es claro que el dominio y el rango de la función f −1 de la denición C.2.4 son respectivamente
el rango y el dominio de f. Además, no se debe confundir la notación de la imagen inversa de un
subconjunto C por una función f simbolizada con f −1 (C) (detalles en la sección B.5), con la inversa
−1
de una función evaluada en x denotada con f (x).
Ejemplo C.2.5. Determinar la función inversa de f (x) = e2x + 1.
Solución:
y = e2x + 1
y − 1 = e2x
ln(y − 1) = ln e2x
ln(y − 1) = 2x
ln(y − 1)
=x
2
y por lo tanto
ln(x − 1)
f −1 (x) =
2
−1
para x > 1. En la gura C.3 se muestra la gráca de f y f . En la parte superior de la recta se
−1
observa la gráca de f y en la pare inferior la gráca de f . Se observa que cada curva es el reejo
de la otra respecto a la recta y = x.
Nota. Si f es una función inyectiva y x es un punto del dominio de f entonces se sigue que
f −1 ◦ f (x) = x.
Como los números, las funciones también se pueden sumar, restar, multiplicar y dividir excepto
cuando el denominador es 0 para obtener nuevas funciones. Si f (x) y g(x) son funciones entonces
418 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
para toda x que pertenezca al dominio de ambas funciones y siempre que g(x) 6= 0 en el caso del
cociente se denen las funciones f + g, f − g, f g y f /g como sigue:
f (x)
(f /g) (x) = .
g(x)
Las funciones también se pueden multiplicar por un número real. Si f (x) es una función y c es un
número real entonces para toda x en el dominio de f se dene:
Denición C.2.5. Sean f (x) y g(x) funciones tales que el rango de g(x)
es un subconjunto del dominio de f (x). Se dene la composición entre
f (x) y g(x), denotada con f ◦ g , como
(f ◦ g)(x) = f (g(x)).
Nota. El dominio de la función f ◦g está conformado por todos los números reales x del dominio
de g para los que g(x) está denida en el dominio de f. Además, la composición de funciones no es
conmutativa, es decir,
f ◦ g 6= g ◦ f.
¾El lector puede dar un ejemplo que rectique este hecho?
Las operaciones aritméticas y la composición entre funciones se puede extender a un caso más general
en el que se operen tres o más funciones. Por ejemplo:
n
! n
X X
fi (x) = fi (x)
i=1 i=1
a. d.
(cf )(x). (f g)(x).
b. e.
(f + g)(x). (f /g) (x).
c. f.
(f − g)(x). (f ◦ g)(x).
Solución:
a. = x2 + 2x + 1.
d.
(f + g)(x) = f (x) + g(x)
2
= x + (2x + 1) (f g)(x) = f (x)g(x)
420 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
= x2 (2x + 1) f.
3 2
= 2x + x .
(f ◦ g)(x) = f (g(x))
e. = f (2x + 1)
f (x) = (2x + 1)2 .
(f /g)(x) =
g(x)
x2
= .
2x + 1
C.3. Límites
El concepto de límite es fundamental en cálculo y la estadística dado que no son pocos los operado-
res matemáticos y los fenómenos naturales que se fundamentan en este concepto. Intuitivamente, si
y = f (x) es una función denida en un intervalo abierto alrededor de un número real x0 , excepto,
posiblemente, en el mismo punto x0 , cuando f (x) se acerca tanto como se quiera al número real L
para toda x lo sucientemente cerca de x0 , se dice que f (x) se aproxima a L cuando x se acerca a x0 .
lı́m f (x) = L,
x→x0
si, para cada número > 0, existe un número δ>0 tal que, para toda
x, se tiene que
Nota. En la denición C.3.1, el valor de δ no es único y depende del valor de . Además, cualquier
valor menor a un δ que cumpla la condición dada satisface la implicación requerida.
lı́m (2x + 1) = 3.
x→1
Solución:
C.3. LÍMITES 421
Siguiendo la denición C.3.1 se tiene que x0 = 1, f (x) = 2x + 1 y L = 3. Así, para cualquier >0
dado, se debe encontrar un número δ>0 tal que, para todax, se siga que
Para determinar δ , se trabaja hacia atrás a partir de la última desigualdad de tal forma que sea posible
identicar un posible valor de δ . De esta forma:
0 < |x − 1| < ⇒ 0 < 2|x − 1| <
2
⇒ 0 < |2(x − 1)| <
⇒ 0 < |2x − 2| <
⇒ 0 < |2x + 1 − 3| <
⇒ 0 < |f (x) − 3| < .
Proposición C.3.1. Sic es un número real y f (x) = an xn +an−1 xn−1 +. . .+a1 x+a0 es una función
polinomial de grado n donde a0 , a1 , . . . , an son números reales con an 6= 0 y n es un número entero
no negativo, entonces
lı́m f (x) = an cn + an−1 cn−1 + . . . + a1 c + a0 .
x→c
x2 − 3x + 1 .
lı́m
x→−1
Solución:
422 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
Proposición C.3.2. Si p(x) y q(x) son funciones polinomiales y c es un número real tal que q(c) 6= 0,
entonces
p(x) p(c)
lı́m = .
x→c q(x) q(c)
Ejemplo C.3.3. Calcular:
x2 − 3x + 5
lı́m .
x→2 x−1
Solución:
x2 −3x+5 p(x) 2
Como f (x) = x−1 es una función de la forma
q(x) donde p(x) = x − 3x + 5 y q(x) = x − 1
son funciones polinomiales con q(2) 6= 0, entonces el límite se obtiene evaluando directamente en la
función como sigue:
x2 − 3x + 5 22 − 3(2) + 5
lı́m = = 3.
x→2 x−1 2−1
A continuación se introducen algunas reglas que permiten calcular límites de funciones que son com-
binaciones aritméticas de otras funciones cuyos límites ya se conocen:
Proposición C.3.3. Sean c y k números reales, y f (x) y g(x) dos funciones cuyos límites existen.
Entonces, donde las funciones correspondientes hagan sentido, se cumplen las siguientes reglas de los
límites:
siempre que las operaciones asociadas hagan sentido, donde r y s son números enteros sin factores
comunes con s 6= 0.
Nota. Al combinar las reglas de la suma y del múltiplo constante, se obtiene la regla del límite de
una diferencia :
lı́m (f (x) − g(x)) = lı́m f (x) − lı́m g(x).
x→c x→c x→c
a. p d.
lı́m 4x2 − 3. lı́m 3(2x − 1)2 .
x→−2 x→−2
e. √
b. 3
p
lı́m 3 x(3x − 1)2 . lı́m x2 − x + 1 .
x→0
x→1
c. f.
x+2
lı́m (x − 5)(x − 7). lı́m √ .
x→6 x→−3 x2+7−3
Solución:
a.
p q
lı́m 4x2 − 3 = lı́m (4x2 − 3)
x→−2 x→−2
p
= 4(−2)2 − 3
√
= 13.
b.
p q
3
lı́m x(3x − 1)2 = 3 lı́m (x(3x − 1)2 )
x→1 x→1
r
= 3 lı́m (x) · lı́m (3x − 1)2
x→1 x→1
r 2
3
= (1) lı́m (3x − 1)
x→1
q
3 2
= (3(1) − 1)
√
3
= 4.
424 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
c.
lı́m (x − 5)(x − 7) = lı́m (x − 5) · lı́m (x − 7)
x→6 x→6 x→6
= (6 − 5) (6 − 7)
= −1.
d.
lı́m 3(2x − 1)2 = lı́m (3) · lı́m (2x − 1)2
x→−2 x→−2 x→−2
2
= (3) lı́m (2x − 1)
x→−2
= 3(2(−2) − 1)2
= 75.
e.
√ √
3 3
lı́m x2 − x + 1 = lı́m x2 + lı́m (−x + 1)
x→0 x→0 x→0
23
= lı́m x + (−0 + 1)
x→0
2
= 03 + 1
= 1.
f.
x+2 lı́mx→−3 (x + 2)
lı́m √ = √
x→−3 x2 + 7 − 3 lı́mx→−3 x2 + 7 − 3
−3 + 2
= √
lı́mx→−3 x2 + 7 − lı́mx→−3 (3)
−1
= 1
(lı́mx→−3 (x2 + 7)) 2 − 3
−1
=p
(−3)2 + 7 − 3
= −1.
Se debe tener presente que los símbolos −∞ y ∞ no representan números reales. Se usan para des-
cribir el comportamiento de una función cuando los valores sobrepasan cualesquiera cotas nitas. Por
ejemplo, la función f (x) = 1/x está denida para todo número real diferente de 0; cuando x es positiva
y se hace cada vez más grande, se tiene que el cociente 1/x se hace cada vez más pequeño. Se dice
entonces que el límite cuando x tiende a innito de f (x) = 1/x es igual a 0.
C.3. LÍMITES 425
lı́m f (x) = L,
x→∞
si, para cada número > 0, existe un número δ tal que, para toda x, se
tiene que
x > δ ⇒ |f (x) − L| < .
Se dice que y = f (x) tiene límite el número real L cuando x tiende a
menos innito, lo que se escribe
lı́m f (x) = L,
x→−∞
si, para cada número > 0, existe un número δ tal que, para toda x, se
tiene que
x < δ ⇒ |f (x) − L| < .
Solución:
Siguiendo la denición C.3.2 se tiene que f (x) = 1/x y L = 0. Para cualquier >0 dado, se debe
encontrar un número δ tal que, para toda x, se siga que
Las propiedades de los límites al innito son análogas a las de la proposición C.3.3 y se utilizan de la
misma manera.
426 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
3x2 − 5x + 2
lı́m .
x→∞ 6x2 + 2x − 1
Solución:
3x2 − 5x + 2 3x2 /x2 − 5x/x2 + 2/x2
lı́m = lı́m
x→∞ 6x2 + 2x − 1 x→∞ (6x2 /x2 ) + (2x/x2 ) − (1/x2 )
3 − (5/x) + 2/x2
= lı́m
x→∞ 6 + (2/x) − (1/x2 )
lı́mx→∞ 3 − (5/x) + 2/x2
=
lı́mx→∞ (6 + (2/x) − (1/x2 ))
lı́mx→∞ (3) − lı́mx→∞ (5/x) + lı́mx→∞ 2/x2
=
lı́mx→∞ (6) + lı́mx→∞ (2/x) − lı́mx→∞ (1/x2 )
3 − 5 lı́mx→∞ (1/x) + 2 lı́mx→∞ 1/x2
=
6 + 2 lı́mx→∞ (1/x) − lı́mx→∞ (1/x2 )
3 − 5(0) + 2(0)
=
6 + 2(0) − (0)
1
= .
2
Nota. Los siguientes son un par de límites al innito de uso común asociados con la función exponen-
cial:
n
x n X xi
ex = lı́m 1+ y ex = lı́m .
n→∞ n n→∞
i=1
i!
Nota. Se deja como ejercicio para el lector consultar los detalles de los límites innitos 5
y los
límites laterales .
Cuando se dibujan los valores de una función, ya sea generados en un laboratorio o recopilados en
campo es frecuente que los puntos se unan mediante una curva continua para mostrar los valores de
la función en los tiempos que no se midieron. Al hacerlo, se supone que se está trabajando con una
función continua, de manera que los resultados varían de forma continua de acuerdo con los datos en
lugar de saltar de un valor a otro sin tomar en cuenta los valores intermedios.
5 Las siguientes son las deniciones asociadas con innito y menos innito como límites:
Se dice que y = f (x) tiende a ∞ cuando se aproxima a x0 , lo que se escribe lı́mx→x0 f (x) = ∞, si, para todo número
, existe un númeroδ > 0 tal que, para toda x, se tiene que 0 < |x − x0 | < δ ⇒ f (x) > .
Se dice que y = f (x) tiende a −∞ cuando se aproxima a x0 , lo que se escribe lı́mx→x0 f (x) = −∞, si, para todo número
, existe un número δ > 0 tal que, para toda x, se tiene que 0 < |x − x0 | < δ ⇒ f (x) < .
C.4. DERIVADAS 427
Nota. Una función es continua en un intervalo si y solo si es continua en todos los puntos del mismo.
Del mismo modo, una función continua es aquella función continua en todos los puntos de su dominio,
aunque no es necesario que lo sea en todos los intervalos. ¾El lector puede dar un ejemplo que rectique
este hecho?
De otra parte, las combinaciones algebraicas y la composición de funciones continuas son funciones
continuas. Además, también son continuas en su dominio las funciones polinomiales, las funciones
racionales, las funciones trigonométricas, las funciones exponenciales y las funciones logarítmicas.
C.4. Derivadas
El concepto de derivada está estrechamente relacionado con el de límite. Una forma usual de abordar
el concepto de derivada de una función y = f (x) evaluada en un punto a es como la pendiente de la
recta tangente a la gráca de la función en el punto (a, f (a)).
f (a + h) − f (a)
f 0 (a) = lı́m
h→0 h
siempre que este límite exista.
Nota. La derivada de una función y = f (x) evaluada en el número real a también se puede denir
como
f (z) − f (a)
f 0 (a) = lı́m
z→a z−a
siempre que este límite exista. ¾Por qué estas dos deniciones de derivada coinciden?
El dominio de f0 es el subconjunto de puntos del dominio de f para los que existe el límite asociado
con la derivada, y puede ser el mismo o menor que el dominio de f . Si f 0 existe en un punto x entonces
se dice que f es diferenciable o derivable en x. Además, si f 0 existe en todos los puntos del dominio
de f entonces se dice que f es diferenciable o derivable.
428 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
Solución:
f (x + h) − f (x)
f 0 (x) = lı́m
h→0 h
x+h x
x+h−1 − x−1
= lı́m
h→0 h
1 (x + h)(x − 1) − x(x + h − 1)
= lı́m
h→0 h (x + h − 1)(x − 1)
1 x − x + hx − h − x2 − hx + x
2
= lı́m
h→0 h (x + h − 1)(x − 1)
1 −h
= lı́m
h→0 h (x + h − 1)(x − 1)
−1
= lı́m
h→0 (x + h − 1)(x − 1)
1
=− .
(x − 1)2
Por lo tanto f 0 (x) = − (x−1)
1
2 para x 6= 1.
√
Ejemplo C.4.2. Encontrar la derivada de la función f (x) = x para x > 0.
Solución:
f (z) − f (x)
f 0 (x) = lı́m
z→x z−x
√ √
z− x
= lı́m
z→x z−x
√ √
z− x
= lı́m √ √ √ √
z→x ( z − x)( z + x)
1
= lı́m √ √
z→x z+ x
1
= √ .
2 x
En consecuencia f 0 (x) = 1
√
2 x
para x > 0.
Nota. Hay muchas formas de simbolizar la derivada de una función. Algunas de las notaciones alter-
nativas de uso común para la derivada de una función y = f (x) en el punto x son:
d df dy
f 0 (x) = y 0 = f (x) = (x) = .
dx dx dx
C.4. DERIVADAS 429
dy = f 0 (x)dx.
Solución:
√
Si y= x entonces
1 dx
dy = f 0 (x)dx = √ dx = √
2 x 2 x
para x > 0.
A continuación se introducen algunas reglas que permiten derivar una gran variedad de funciones sin
tener que aplicar la denición de derivada directamente:
Proposición C.4.1. Sean f (x) y g(x) dos funciones diferenciables y k un número real. Entonces,
donde las funciones correspondientes hagan sentido y sean diferenciables, se cumplen las siguientes
reglas de derivación:
a. d.
d d 33
(π) . πx + 5 .
dx dx 5x
b. e.
d √
3
d
(3x2 − 5)(2x4 − x) .
x2 . dx
dx
c. f.
d √ 3 d x−1
2x . .
dx dx x+1
Solución:
a.
d
(π) = 0.
dx
b.
d √
3
d 2
x2 = x3
dx dx
2 2
= x 3 −1
3
2 −1
= x 3
3
2
= √ .
33x
C.4. DERIVADAS 431
c.
d √ 3 d √ √ 3
2x = 2 x
dx dx
√ d 3
= 2 x2
dx
√
3 3
= 2 x 2 −1
2
√
3 2√
= x.
2
d.
d 3 d d 3
πx3 + 5 = πx3 +
dx 5x dx dx 5x5
d 3 d
x3 + x−5
=π
dx 5 dx
3
= (3)πx 3−1
+ (−5)x−5−1
5
2 3
= 3πx − 6 .
x
e.
d d d
(3x2 − 5)(2x4 − x) = (3x2 − 5) (2x4 − x) + (3x2 − 5) (2x4 − x)
dx dx dx
= (3(2)x2−1 )(2x4 − x) + (3x2 − 5)(2(4)x4−1 − (1)x1−1 )
= 6x(2x4 − x) + (3x2 − 5)(8x3 − 1)
= 12x5 − 6x2 + 24x5 − 3x2 − 40x3 + 5
= 36x5 − 40x3 − 9x2 + 5.
f.
d d
(x − 1) (x + 1) − (x − 1) dx
d x−1 dx (x + 1)
= 2
dx x+1 (x + 1)
((1)x1−1 − 0)(x + 1) − (x − 1)((1)x1−1 + 0)
=
(x + 1)2
(x + 1) − (x − 1)
=
(x + 1)2
2
= .
(x + 1)2
La derivada de una función se puede lograr de distintas formas dependiendo de como se enfoque la
función a derivar y de como se apliquen las reglas de derivación. Por ejemplo, la derivada de la función
432 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
f (x) = 1/x se puede realizar por medio de la regla de la derivada de un cociente, tomando la función
del numerador como 1 y la función del denominador como x, o se puede hacer utilizando la regla de
la derivada de potencias, teniendo en cuenta que f (x) = x−1 .
La regla de la suma se extiende a sumas de más de dos funciones, siempre y cuando la suma conste
de un número nito de funciones:
Proposición C.4.2. Si f1 (x), f2 (x), . . . , fn (x) son n funciones diferenciables entonces también lo es
P n
i=1 fi (x) y además
!
n n
d X X
fi (x) = fi0 (x).
dx i=1 i=1
a. b.
x4
d 3 2 d 12 4 1
+ x +x . + 3+ 4 .
dx 2 2 dx x x x
Solución:
a.
x4 d x4
d 3 d 3 2 d
+ x2 + x = + x + (x)
dx 2 2 dx 2 dx 2 dx
1 3
= (4)x4−1 + (2)x2−1 + (1)x1−1
2 2
= 2x3 + 3x + 1.
b.
d 12 4 1 d 12 d 4 d 1
+ 3+ 4 = + 3
+
dx x x x dx x dx x dx x4
d d d
12x−1 + 4x−3 + x−4
=
dx dx dx
= 12(−1)x−1−1 + 4(−3)x−3−1 + (−4)x−4−1
12 12 4
= − 2 − 4 − 5.
x x x
Proposición C.4.3. Si f (u) es una función diferenciable en u = g(x), y a su vez g(x) es una función
diferenciable en x, entonces la función compuesta (f ◦ g)(x) = f (g(x)) es diferenciable en x, y además
d
((f ◦ g)(x)) = f 0 (g(x)) · g 0 (x).
dx
C.4. DERIVADAS 433
Nota. La proposición C.4.3 se conoce como regla de la cadena y se puede extender a un caso en el
que se tenga la compuesta de tres o más funciones.
a. b.
d 7 d 1
5x3 − x4 . .
dx dx 3x − 2
Solución:
a.
d 7 7−1 d
5x3 − x4 = 7 5x3 − x4 5x3 − x4
dx dx
6
= 7 5x3 − x4 5(3)x3−1 − (4)x4−1
6
= 7 5x3 − x4 15x2 − 4x3 .
b.
d 1 d
(3x − 2)−1
=
dx 3x − 2 dx
d
= (−1)(3x − 2)−1−1 (3x − 2)
dx
−2 1−1
= −(3x − 2) (3(1)x − 0)
= −3(3x − 2)−2
−3
= .
(3x − 2)2
i. iv.
d x d 1
(e ) = ex . (logb (x)) =
dx dx x ln(b)
ii. siempre que b > 0 y b 6= 1.
d x
(a ) = ax ln(a) v.
dx d
siempre que a > 0. (sin(x)) = cos(x).
dx
iii. vi.
d 1 d
(ln(x)) = . (cos(x)) = − sin(x).
dx x dx
434 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
a. d.
d d
sin3 (2x) . ln πx4 .
dx dx
b. e.
d x2 d
cos 23x .
e . dx
dx
c. f.
d d log(x)
cos −e2x .
2 .
dx dx
Solución:
a.
d d
sin3 (2x) = 3 sin3−1 (2x) (2x)
dx dx
= 3 sin2 (2x) 2(1)x1−1
= 6 sin2 (2x).
b.
d x2 2 d
= ex x2
e
dx dx
2
= ex 2x2−1
2
= 2xex .
c.
d d
cos −e2x = − sin −e2x −e2x
dx dx
d
= − sin −e2x (−1)e2x
(2x)
dx
= e2x sin −e2x 2(1)x1−1
d.
d 1 d
ln πx4 = πx4
dx πx4 dx
1
= π(4)x4−1
πx4
1
= 4πx3
πx4
4
= .
x
C.4. DERIVADAS 435
e.
d d
cos 23x = − sin 23x 23x
dx dx
3x
3x d
= − sin 2 2 ln(2) (3x)
dx
= −23x ln(2) sin 23x 3(1)x1−1
f.
d log(x) d
2 = 2log(x) ln(2) (log(x)])
dx dx
log(x) 1
=2 ln(2)
x ln(10)
2log(x) ln(2)
= .
x ln(10)
Solución:
√
Si f (x) = x2 entonces f 0 (x) = 2x y f −1 (x) = x para x ≥ 0. Por lo tanto se sigue que:
0 1
f −1 (x) =
f0 (f −1 (x))
1
= √
f 0 ( x)
1
= √ .
2 x
Nota. El resultado del ejemplo C.4.8 también se puede obtener aplicando la regla de la derivada de
una potencia sobre la función inversa.
Si y = f (x) es una función diferenciable entonces su derivada f 0 (x) también es una función de x. Si
f (x) también es una función diferenciable entonces es posible derivar f 0 (x)
0
y se obtiene una nueva
436 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
función de x denotada con f 00 (x) tal que f 00 (x) = (f 0 )0 (x). La función f 00 se llama segunda derivada
de f respecto a x puesto que es la derivada de la primera derivada. Por lo tanto se escribe:
d2 d2 f d2 y
f 00 (x) = y 00 = f (x) = (x) = .
dx2 dx2 dx2
Del mismo modo, si y 00 = f 00 (x) es una función diferenciable entonces su derivada f 000 (x) también es
una función de x y se denomina tercera derivada de f respecto a x. Como se puede imaginar, el
proceso continúa y
dn dn f dn y
f (n) (x) = y (n) = f (x) = (x) =
dxn dxn dxn
denota la n-ésima derivada de f respecto a x donde n es cualquier entero positivo. Luego, f
(0)
= f,
f (1) = f 0 , f (2) = f 00 , etc.
Ejemplo C.4.9. Calcular:
a. b.
d2 d2
(xex ) . cos(x2 ) .
dx2 dx 2
Solución:
a.
d2
x d d x
(xe ) = (xe )
dx2 dx dx
d
= ((1)ex + xex )
dx
= ex + (1)ex + xex
= ex (2 + x).
b.
d2
2
d d 2
cos(x ) = (cos(x )
dx2 dx dx
d
−2x sin(x2 )
=
dx
= (−2) sin x2 − 2x(2x) cos x2
donde tanto f (x) como g(x) tienden a 0 cuando x tiende a c, entonces este límite puede existir o no
y se conoce como forma indeterminada del tipo 0/0. De igual manera se constituyen las formas
indeterminadas del tipo ∞/∞ y del tipo −∞/ − ∞. La siguiente regla permite calcular límites para
estas formas indeterminadas:
Proposición C.4.6. Si f (x) y g(x) son funciones diferenciables en un intervalo abierto que contiene
al número real c tales que f (c) = g(c) = 0, y además g(x) 6= 0 en este intervalo si x 6= c, entonces
f (x) f 0 (x)
lı́m = lı́m 0
x→c g(x) x→c g (x)
Nota. La regla de la proposición C.4.6 se conoce como regla de L'Hôpital , en honor a Guillaume
François de L'Hôpital 6
, y aplica cuando las funciones satisfacen los requerimientos dados en la
proposición. Esta regla también es válida para límites laterales y para límites al innito.
a. b.
ln(x) ln(x)
lı́m . √ .
lı́m
x→1 x − 1 x→∞ 3 x
Solución:
6 Fotografía tomada de la página web http://www.educared.org/global/premiointernacional/finalistas/710/
biograf/Blhopit.html.
438 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
a. Como
lı́m (ln(x)) = 0 y lı́m (x − 1) = 0
x→1 x→1
d
ln(x) dx (ln(x))
lı́m = lı́m d
x→1 x − 1 x→1 (x − 1)
dx
1
x
= lı́m
x→11
1
= lı́m
x→1 x
= 1.
b. Como
√
lı́m (ln(x)) = ∞ y lı́m 3
x=∞
x→∞ x→∞
d
ln(x) dx (ln(x))
√ = lı́m
lı́m d √
x→∞ 3 x
dx ( x)
x→∞ 3
1
= lı́m 1 x− 2
x→∞ x 3
3
3
= lı́m √
x→∞ 3
x
1
= 3 lı́m √
x→∞ 3 x
= 0.
C.5. Integrales
La integración es una técnica para calcular mucho más que áreas y volúmenes. Como los límites, las
integrales tienen una gran variedad de aplicaciones en el cálculo y la estadística. La integración permite
calcular muchas cantidades, dividiéndolas en partes más pequeñas y sumando después la contribución
de cada una de ellas.
La denición de la integral denida se basa en la idea de que, para ciertas funciones, los valores de las
sumas de Riemann, en honor a Bernhard Riemann 7 8
, tienden a un valor límite I, siempre que las
normas de las particiones de [a, b] tienden a 0. Es decir, una suma de Riemann estará cerca del valor
límite I cuando la norma de la partición correspondiente sea lo sucientemente pequeña.
X n
f (ck )∆k − I < .
i=1
Nota. Cuando se satisface la denición C.5.1 se dice que las sumas de Riemann de f en [a, b] convergen
a la integral denida
n
!
Z b X
I= f (x)dx = lı́m f (ck )∆k
a kP k→0
i=1
Proposición C.5.1.
Rb
Si y = f (x) es una función continua denida en el intervalo [a, b] entonces
a
f (x)dx existe.
La proposición C.5.1 establece la existencia de la integral denida cuando se trata con funciones
continuas denidas en un intervalo cerrado, mas no indica como calcular tales integrales. La siguiente
proposición señala como realizar los cálculos correspondientes:
Z x
F (x) = f (t)dt
a
cerrados, se eligen n − 1 puntos x1 , x2 , . . . , xn−1 entre a y b tales que a = x0 < x1 < x2 < . . . < xn−1 < xn = b. El
conjunto P = {x0 , x1 , x2 , . . . , xn−1 , xn } se llama partición de [a, b]. El k-ésimo subintervalo de P es [xk−1 , xk ] y su
longitud, denotada con ∆k , está dada por ∆k = xk − xk−1 para k = 1, . . . , n. La norma de una partición P , denotada
con kP k, es la longitud del intervalo más grande de la partición, esto es, kP k = máx{∆k : k = 1, 2, . . . , n}. En cada
intervalo se elige algún número; el punto seleccionado en el k -ésimo intervalo se simboliza con ck para k = 1, . . . , n. La
i=1 f (ck )∆k se conoce como suma de Riemann para f en el intervalo [a, b]. Cualquier suma de Riemann
Pn
suma
dene rectángulos que aproximan la región entre la gráca de f y el eje x.
440 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
la función F (x) se llama antiderivada o primitiva de la función f y es aquella función tal que
10
F 0 (x) = f (x) en el intervalo [a, b]. Además, si F (x) es una antiderivada de f (x) entonces se sigue que
Z b b
f (x)dx = F (x) = F (b) − F (a).
a a
a. b. π
2
Z Z 2
2 cos(x)dx.
x dx.
−1 −π
4
Solución:
9 Una versión más sosticada de este teorema establece que si a(x) y b(x) son funciones diferenciables de x y f (t) es
una función continua en el intervalo [a(x), b(x)] entonces
"Z #
d b(x)
f (t)dt = f (b(x))b0 (x) − f (a(x))a0 (x).
dx a(x)
10 Si F (x) es una antiderivada de f y c es un número real entonces F (x) + c también es una antiderivada de f y por
lo tanto si una función tiene una antiderivada entonces ésta tiene innitas antiderivadas.
C.5. INTEGRALES 441
a.
2 2
x3
Z
2
x dx =
−1 3 −1
23 (−1)3
= −
3 3
8 1
= +
3 3
= 3.
b.
Z π/2 π/2
cos(x)dx = sin(x)
−π/4 −π/4
Proposición C.5.3. Sean f (x) y g(x) dos funciones integrables en el intervalo [a, b] y k un número
real. Entonces se cumplen las siguientes reglas de integración:
La regla de la suma se extiende a sumas de más de dos funciones, siempre y cuando la suma conste
de un número nito de funciones:
Proposición C.5.4.PSi f1 (x), f2 (x), . . . , fn (x) son n funciones integrables en el intervalo [a,b] en-
n
tonces también lo es i=1fi (x) y
Z b X n
! n Z b
X
fi (x) dx = fi (x).
a i=1 i=1 a
Solución:
Z 1 Z 1 Z 1 Z 1
2x3 − 3x + 1 dx = 2x3 dx −
3xdx + 1dx
−2 −2 −2 −2
Z 1 Z 1 Z 1
3
=2 x dx − 3 xdx + 1dx
−2 −2 −2
4 1
1 1
x2
x
=2 − 3 + x
4 −2
2 −2
−2
1 1 1
1 3
= x4 − x2 + x
2 −2 2 −2 −2
1 4 4
3 2
1 − (−2)2 + (1 − (−2))
= 1 − (−2) −
2 2
= 0.
C.5. INTEGRALES 443
Una integral denida es un número denido al tomar el límite de sumas de Riemann asociadas a
particiones de un intervalo cerrado nito cuyas normas tienden a 0. Además, si
Rb f es una función
positiva denida en el intervalo [a, b] entonces
a
f (x)dx representa el área entre la curva y la porción
del eje x entre a y b. De otra parte, la integral indenida de una función y = f (x) respecto de x,
denotada con Z
f (x)dx,
es el conjunto de todas las antiderivadas de la función f. Por lo tanto, si F (x) es una antiderivada de
f (x) entonces
Z
f (x)dx = F (x) + c
Nota. Cuando se encuentre la integral indenida de una función, no se debe olvidar incluir una
Rb
Rconstante arbitraria. Además, tampoco se debe olvidar que a f (x)dx es un número real, mientras que
f (x)dx es una función más una constante arbitraria.
Proposición C.5.5. Sea c un número real. Se satisfacen las siguientes reglas de integración:
i. iv.
xa+1
Z Z
a
x dx = +c 1
a+1 dx = ln (|x|) + c.
x
siempre que a 6= −1.
v.
ii. Z
bx
Z
bx dx = +c sin(x)dx = − cos(x) + c.
ln(b)
siempre que b > 0 y b 6= 1.
vi.
iii.
Z
Z
x
e dx = e + c. x cos(x)dx = sin(x) + c.
a. c.
Z r Z √
2 2 sin(x) +
3
x2 dx.
dx.
x
b. d. Z
2
Z
x x
(x − 3e ) dx. − 2 dx.
x
Solución:
a.
Z r Z √
2 1
dx = 2 √ dx
x x
444 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
√ Z −1
= 2 x 2 dx
√ x− 21 +1
= 2 1 +c
−2 + 1
√ x 12
= 2 1 +c
2
√ √
= 2 2 x + c.
b.
Z Z Z
x
(x − 3e ) dx = xdx − 3 ex dx
x2
= + c1 − 3ex + c2
2
x2
= − 3ex + c.
2
c.
Z √
3
Z Z √
3
2 sin(x) + x2 dx = 2 sin(x)dx + x2 dx
2
x 3 +1
= −2 cos(x) + c1 + 2 + c2
3 +1
3 √
3
= −2 cos(x) + x x2 + c.
5
d.
Z Z Z
2 x 1
− 2 dx = 2 dx − 2x dx
x x
2x
= 2 ln (|x|) + c1 − + c2
ln(2)
2x
= 2 ln (|x|) − + c.
ln(2)
Proposición C.5.6. Sea u = g(x) una función diferenciable en el intervalo [a, b] y f (x) una función
continua en el rango de g(x). Entonces se tiene que:
Z b Z g(b)
f (g(x)) g 0 (x)dx = f (u)du.
a g(a)
Nota. La técnica de integración que se presenta en a proposición C.5.6 se conoce como integración
por sustitución .
Ejemplo C.5.4. Calcular:
C.5. INTEGRALES 445
a. Z d. Z
2
sin(x) cos(x)dx. xex dx.
b. e. Z
Z
e −3x
dx. cos(7x + 5)dx.
c. f. Z
2x
Z
x x 2 √ dx.
e (e − 1) dx. 3
x2 + 1
Solución:
Z Z
sin(x) cos(x)dx = udu
u2
= +c
2
sin2 (x)
= + c.
2
1 u∗
= e +c
2
1 ∗
= eu + c
2
1
= e2u + c
2
1 x
= e2(e −1) + c
2
donde u∗ = 2u y du∗ = 2du.
Z Z
1
cos(7x + 5)dx = cos(u)du
7
Z
1
= cos(u)du
7
1
= sin(u) + c
7
1
= sin(7x + 5) + c.
7
Z Z
2x 1
√
3
dx = √ du
x2 + 1 3
u
Z
1
= u− 3 du
1
u− 3 +1
= 1 +c
−3 + 1
3 2
= u3 + c
2q
33 2 2
= (x + 1) + c.
2
C.5. INTEGRALES 447
Proposición C.5.7. Sean f (x) y g(x) un par de funciones diferenciables. Entonces se tiene que:
Z b b Z b
0
f 0 (x)g(x)dx.
f (x)g (x)dx = f (x)g(x) −
a a a
Nota. La técnica de integración que se presenta en a proposición C.5.7 se conoce como integración
por partes . En ocasiones es más fácil recordar la fórmula si se escribe en forma diferencial: si u = f (x)
y v = g(x) entonces la fórmula de integración por partes se transforma en
Z b b Z b
udv = uv − vdu.
a a a
a. Z b. Z c. Z
x
xe dx. ln(x)dx. ex cos(x)dx.
Solución:
= xex − ex + c
= ex (x − 1) + c.
Z Z
ln(x)dx = udv
Z
= uv − vdu
Z
1
= x ln(x) − x dx
x
Z
= x ln(x) − 1dx
= x ln(x) − x + c
= x(ln(x) − 1) + c.
448 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
La segunda integral en el lado derecho de la igualdad es similar a la primera, salvo que se tiene
sin(x) en lugar de cos(x). Para evaluarla, nuevamente se utiliza la integración por partes haciendo
u = ex y dv = sin(x)dx de donde du = ex dx y v = − cos(x), y por lo tanto:
Z Z
x x x x
e cos(x)dx = e sin(x) − −e cos(x) − (− cos(x))e dx
Z
= ex sin(x) + ex cos(x) − ex cos(x)dx.
Ahora la integral desconocida aparece en ambos lados de la ecuación. Sumando esta integral a
ambos lados se obtiene que:
Z
2 ex cos(x)dx = ex sin(x) + ex cos(x)
y en consecuencia
ex sin(x) + ex cos(x)
Z
ex cos(x)dx = +c
2
1
= ex (sin(x) + cos(x)) + c.
2
Nota. La integración por sustitución y la integración por partes son apenas un par de métodos de
integración, pero no son los únicos. Así que se deja como ejercicio consultar los detalles de otras
técnicas de integración, como la integración por fracciones parciales y la integración por el método
de Heaviside . Además, cuando no sea posible determinar una antiderivada 11
para una función dada
o cuando requiera mucho trabajo, se recomienda trabajar con la integración numérica, que consiste
en aproximar una integral denida por medio de métodos numéricos como la regla del trapecio y la
regla de Simpson .
Solución:
El método consiste en expresar la función racional del integrando como una suma de fracciones más
sencillas, denominadas fracciones parciales, más fáciles de integrar. De esta forma y teniendo en cuenta
que x2 − 2x − 3 = (x + 1)(x − 3), se deben determinar las constantes A y B tales que:
5x − 3 A B
= + .
(x + 1)(x − 3) x+1 x+3
5x − 3 = A(x − 3) + B(x + 1)
= Ax − 3A + Bx + B
= Ax + Bx − 3A + B
= (A + B)x + (−3A + B)
de donde
A+B =5 y − 3a + B = −3
Z
5x − 3
Z
2 3
dx = + dx
x2 − 2x − 3 x+1 x−3
Z Z
2 3
= dx + dx
x+1 x−3
= 2 ln (|x + 1|) + 3 ln (|x − 3|) + c.
Hasta el momento, a las integrales se les ha exigido que tengan dos propiedades: primera, que el
dominio de la integración sea un intervalo nito; y segunda, que el rango del integrando sea nito en
este dominio. En la práctica, es posible encontrar problemas que no cumplen una o ambas condiciones.
En cualquier caso se dice que las integrales son impropias y se calculan como límites.
450 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
Z ∞ Z b
f (x)dx = lı́m f (x)dx.
a b→∞ a
Z b Z b
f (x)dx = lı́m f (x)dx.
−∞ a→−∞ a
a. b.
Z ∞ Z ∞
−x ln(x)
e dx. dx.
0 1 x
Solución:
a.
Z ∞ Z b
e−x dx = lı́m e−x dx
0 b→∞ 0
b !
−x
= lı́m −e
b→∞ 0
−b
− −e0
= lı́m −e
b→∞
= − lı́m e−b + lı́m e0
b→∞ b→∞
= −0 + 1
= 1.
C.5. INTEGRALES 451
b. Integrando por partes haciendo u = ln(x) y dv = 1/x2 dx se obtiene que du = 1/xdx y v = −1/x ,
y por lo tanto:
b Z b !
Z ∞
ln(x)
dx = lı́m uv − vdu
1 x b→∞ 1 1
b Z b !
1 1 1
= lı́m ln(x) − − − dx
b→∞ x 1
1 x x
b Z b !
ln(x) 1
= lı́m − + 2
dx
b→∞ x 1 1 x
b b !
ln(x) 1
= lı́m − −
b→∞ x 1 x 1
ln(b) ln(1) 1 1
= lı́m − − − + − − −
b→∞ b 1 b 1
ln(b) 1
= lı́m − +0− +1
b→∞ b b
ln(b) 1
= − lı́m − lı́m + lı́m (1)
b→∞ b b→∞ b b→∞
!
d
(ln(b))
= − lı́m db d −0+1
db (b)
b→∞
1/b
= − lı́m +1
b→∞ 1
1
= − lı́m +1
b→∞ b
= −0 + 1
= 1.
Nota. Se deja como ejercicio consultar los detalles de las integrales impropias tipo II 12
y los
criterios de convergencia asociados con la evaluación de las integrales impropias, como el criterio
de la comparación directa y el criterio de la comparación de límite .
12 Se reeren a las integrales de funciones que se vuelven innitas en un punto dentro del intervalo de integración.
452 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
C.6. Ejercicios
Los ejercicios que se presentan a continuación son tomados principalmente de Thomas (2006) y Purcell
& Varberg (1993):
a. d.
−2
2x − 2x2
1 5
√ − √ . .
2 2 2 x3 − 2x2 + x
e.
b.
x2 − x − 6 18 4 6
. − + .
x−3 x2 + 3x x x + 3
c. f.
3 x3 − 8
2+ . .
1 + 25 2x − 4
a. g.
f (x) = |x|. f (x) = e−x .
b. h.
f (x) = [x]. f (x) = |2x − 1|.
c.
i.
f (x) = |[x]| . f (x) = ln(x + 2).
d.
j.
f (x) = x − [x]. |x|
f (x) = .
e. x
f (x) = x2 − 2. k. 2
x , si x ≤ 0;
f.
1 f (x) = x, 0 < x < 1;
f (x) = . 2
x + 1, x ≥ 1.
x−1
Recordar que [x] = mayor número entero menor o igual a x y se denomina parte entera de x.
2
C.3. Sean f (x) = x3 + 2 y g(x) =
x−1 . Encontrar una fórmula para cada una de las siguientes
expresiones y establecer su dominio:
a. b.
c. f.
(f − g)(x). (f ◦ g)(x).
d. g.
(f · g)(x). (g ◦ f )(x).
e. h.
(f /g)(x). (f ◦ f )(x).
x−3
C.5. Sea f (x) = x+1 . Encontrar la fórmula de (f ◦ f ◦ f )(x).
a. i.
lı́m (x − 2) (2x + 3) . x2 + 7x + 6
x→−1 lı́m .
x→−1 x2 − 4x − 5
b. j.
√ √
lı́m 3x + 1. 5x + 4 − 2
x→0 lı́m .
x→0 x
c.
2 k. √
lı́m +1 . x2 + 8 − 3
x→3 x lı́m .
x→−1 x+1
d. √
x2 + 9 l. √
lı́m . x−3
x→4 x−3 lı́m .
x→9 x−9
e.
x2 − 5x + 6 m.
lı́m 2 . x+3
x→2 x − x − 2 lı́m .
x→−3 x2 + 4x + 3
f.
n.
2x3 + 3x2 − 2x − 3 4−x
lı́m . lı́m √ .
x→1 x2 − 1 x→4 5− x2 + 9
g.
r ñ.
3 4x3 + 8x 1
− 1
lı́m . lı́m x+2 2
.
x→2 x+4 x→0 x
h. o.
3x4 − 8
sin x2
lı́m 3 . lı́m .
x→−2 x + 24 x→0 x
a. b.
5 − 5 cos(x) 3x − 1
lı́m . lı́m .
x→0 ex − x − 1 x→0 x
454 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
c. j.
4 − 4ex
2
lı́m . lı́m π− .
x→0 xex x→−∞ x2
d.
k.
2x 2x + 3
lı́m √ . lı́m .
x→0 x + 7 x x→∞ 5x + 7
e.
l.
10x − 1 7x3
lı́m . lı́m .
x→0 x x→−∞ x3 − 3x2 + 6x
f. m.
2x √
lı́m . 2 x + x1
x→∞ 2ex lı́m .
x→∞ 3x − 7
g. n. √
3x − 5 2+ x
lı́m 2
. lı́m √ .
x→∞ 2x − x + 2 x→∞ 2 − x
h. ñ.
x −x4
lı́m . lı́m .
x→∞ ex
x→−∞ x4 − 7x3 + 7x2 + 9
i. o.
2 x2 − 1
lı́m −3 . lı́m .
x→∞ x x→−∞ ex
a. h.
d p 2
d 5y + 1
x +4 . √ .
dx dy 2 y
b. i.
d x d
x5
. .
dx x−5 dx 120
c.
j.
d cos(x)
.
d 3y + 1
dx x (3 − y) .
dy 3y
d.
d k.
(sin(y) cos(y)) . d
sin2 (πy − 2) .
dy
dy
e.
d l.
sin3 (x) .
dx d
3e−2x .
f.
dx
d 3y − 1 m.
sin . d
2ye−3y .
dy 2y + 5
dy
g.
n.
(x + 1)2
d d
. 2ye−3y .
dx 3x − 4 dx
C.6. EJERCICIOS 455
ñ. p.
d d
3(y 2 − 2)−2 .
(2x2 + 2x − 1)3 .
dy dx
o. q.
d p 3 d y+x
y + 2y . .
dy dx y−x
a. j.
x3
d d
ln x2 y .
.
dx y + x2 dy
b. k.
d p 2 d x
e 1 − x2 .
x + y2 .
dy dx
c. l.
√ ex − 1
d d
(y + x) y − x . .
dx dx ey − 1
d. m.
ex − 1
r
d y+x d
. .
dy y−x dy ey − 1
e. n.
d √ d sin(x)
(y + 3 x)3 . e .
dx dx
f. ñ.
d p d2 √
y cos(xy) . 2
9−x .
dy dx
g. o.
d
1
d3
cos y 2 .
tan2 (x) . dy 3
dx 2
p.
h. d2
d (sin(3y)) .
(ln(cos(xy))) . dy 2
dx
q.
i.
d3
d 1
ln x2 y . .
dx dx3 x−3
a. Z c. Z
2
(4x − x + 1)dx. (2x − 1)1/2 dx.
b. Z d. Z
(2y −3 − y −2 )dy. 3e−2x dx.
456 APÉNDICE C. ELEMENTOS BÁSICOS DE CÁLCULO
e. Z m. Z
−y 1
2ye dy. sin(xy) − dy .
y
f. Z n. Z
xy cos(x)dx. (x2 − 3x + 3)dx.
g. Z ñ. √
2x2 + x − 1
Z
xy cos(x)dy. dx.
x2
h. Z o. Z
x2 ex dx. y(2 − 3xy)dx.
i. Z p. Z
xe2x dx. y(2 − 3xy)dy.
j. Z q. Z
ey cos (ey ) dy. 2e−2x dx.
k. Z r.
2
Z
x3x +5
dx. 2xe−2x dx.
l. Z s.
1
Z
sin(xy) − dx. 2x2 e−2x dx.
y
a. g.
Z 1
16x Z π/2
√ dx. y 3 cos(2y)dy.
0 8x2 + 1 0
b. h.
0 ∞
y3
Z Z
1
dy. √ dy.
−1 y2 − 2y + 1 0 y(y + 1)
c. i.
Z 1/6 2
1 Z
√ dx. x ln(x)dx.
0 1 − 9x2 1
d. j.
Z ∞ Z ∞
−x2
2xe dx. e−2y dy.
−∞ 0
e. Z 3 k.
1 Z e
√ dy. x3 ln(x)dx.
−2 e2y −1 1
f. l.
Z −2 ∞
2
Z
1
2
dy. √ dx.
−∞ y −1 2 x−1
C.6. EJERCICIOS 457
m. p.
Z 1
3 y Z π/3
y e dy.
−1 y tan2 (y)dy.
0
n. Z ∞
1
dx. q.
2 ln(x) Z 1
1
ñ. dx.
Z 1 p 0 (x + 1)(x2 − 1)
y 1 − ydy.
0 r.
o. √ 1
x3
Z
3
3y 2 + y + 4
Z
dy. dx.
y3 + y 0 x2 + 2x + 1
1
Referencias electrónicas
Las siguientes son las páginas web de las que se han tomado algunos ejemplos o ejercicios de este
apéndice:
http://www.vaxasoftware.com/doc_edu/mat/derivada.pdf.
Apéndice D
Tablas estadísticas
D.1. Introducción
Las tablas que se muestran a continuación están asociadas con las funciones de distribución acumulada
de algunas distribuciones de probabilidad de uso frecuente. Estas tablas se crean con el n de facilitar
los cálculos cuando no se disponga de un software especializado para realizarlos y para facilitar el
desarrollo de los ejercicios y ejemplos de este texto. Las probabilidades se redondean y se expresan
con cuatro (4) cifras decimales a lo sumo.
[x]
X n k
P (X ≤ x) = π (1 − π)n−k
k
k=0
n [x] π =0.05 π =0.10 π =0.15 π =0.20 π =0.25 π =0.30 π =0.35 π =0.40 π =0.45 π =0.50
2 1 0.9975 0.9900 0.9775 0.9600 0.9375 0.9100 0.8775 0.8400 0.7975 0.7500
2 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
3 1 0.9928 0.9720 0.9393 0.8960 0.8438 0.7840 0.7182 0.6480 0.5747 0.5000
2 0.9999 0.9990 0.9966 0.9920 0.9844 0.9730 0.9571 0.9360 0.9089 0.8750
3 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
4 1 0.9860 0.9477 0.8905 0.8192 0.7383 0.6517 0.5630 0.4752 0.3910 0.3125
2 0.9995 0.9963 0.9880 0.9728 0.9492 0.9163 0.8735 0.8208 0.7585 0.6875
3 1.0000 0.9999 0.9995 0.9984 0.9961 0.9919 0.9850 0.9744 0.9590 0.9375
4 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
5 1 0.9774 0.9185 0.8352 0.7373 0.6328 0.5282 0.4284 0.3370 0.2562 0.1875
2 0.9988 0.9914 0.9734 0.9421 0.8965 0.8369 0.7648 0.6826 0.5931 0.5000
458
D.2. DISTRIBUCIÓN BINOMIAL 459
3 1.0000 0.9995 0.9978 0.9933 0.9844 0.9692 0.9460 0.9130 0.8688 0.8125
4 1.0000 1.0000 0.9999 0.9997 0.9990 0.9976 0.9947 0.9898 0.9815 0.9688
5 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
6 1 0.9672 0.8857 0.7765 0.6554 0.5339 0.4202 0.3191 0.2333 0.1636 0.1094
2 0.9978 0.9841 0.9527 0.9011 0.8306 0.7443 0.6471 0.5443 0.4415 0.3437
3 0.9999 0.9987 0.9941 0.9830 0.9624 0.9295 0.8826 0.8208 0.7447 0.6563
4 1.0000 0.9999 0.9996 0.9984 0.9954 0.9891 0.9777 0.9590 0.9308 0.8906
5 1.0000 1.0000 1.0000 0.9999 0.9998 0.9993 0.9982 0.9959 0.9917 0.9844
6 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
7 1 0.9556 0.8503 0.7166 0.5767 0.4449 0.3294 0.2338 0.1586 0.1024 0.0625
2 0.9962 0.9743 0.9262 0.8520 0.7564 0.6471 0.5323 0.4199 0.3164 0.2266
3 0.9998 0.9973 0.9879 0.9667 0.9294 0.8740 0.8002 0.7102 0.6083 0.5000
4 1.0000 0.9998 0.9988 0.9953 0.9871 0.9712 0.9444 0.9037 0.8471 0.7734
5 1.0000 1.0000 0.9999 0.9996 0.9987 0.9962 0.9910 0.9812 0.9643 0.9375
6 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9994 0.9984 0.9963 0.9922
7 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
8 1 0.9428 0.8131 0.6572 0.5033 0.3671 0.2553 0.1691 0.1064 0.0632 0.0352
2 0.9942 0.9619 0.8948 0.7969 0.6785 0.5518 0.4278 0.3154 0.2201 0.1445
3 0.9996 0.9950 0.9786 0.9437 0.8862 0.8059 0.7064 0.5941 0.4770 0.3633
4 1.0000 0.9996 0.9971 0.9896 0.9727 0.9420 0.8939 0.8263 0.7396 0.6367
5 1.0000 1.0000 0.9998 0.9988 0.9958 0.9887 0.9747 0.9502 0.9115 0.8555
6 1.0000 1.0000 1.0000 0.9999 0.9996 0.9987 0.9964 0.9915 0.9819 0.9648
7 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9993 0.9983 0.9961
8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
9 1 0.9288 0.7748 0.5995 0.4362 0.3003 0.1960 0.1211 0.0705 0.0385 0.0195
2 0.9916 0.9470 0.8591 0.7382 0.6007 0.4628 0.3373 0.2318 0.1495 0.0898
3 0.9994 0.9917 0.9661 0.9144 0.8343 0.7297 0.6089 0.4826 0.3614 0.2539
4 1.0000 0.9991 0.9944 0.9804 0.9511 0.9012 0.8283 0.7334 0.6214 0.5000
5 1.0000 0.9999 0.9994 0.9969 0.9900 0.9747 0.9464 0.9006 0.8342 0.7461
6 1.0000 1.0000 1.0000 0.9997 0.9987 0.9957 0.9888 0.9750 0.9502 0.9102
7 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9986 0.9962 0.9909 0.9805
8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9992 0.9980
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
10 1 0.9139 0.7361 0.5443 0.3758 0.2440 0.1493 0.0860 0.0464 0.0233 0.0107
2 0.9885 0.9298 0.8202 0.6778 0.5256 0.3828 0.2616 0.1673 0.0996 0.0547
3 0.9990 0.9872 0.9500 0.8791 0.7759 0.6496 0.5138 0.3823 0.2660 0.1719
4 0.9999 0.9984 0.9901 0.9672 0.9219 0.8497 0.7515 0.6331 0.5044 0.3770
5 1.0000 0.9999 0.9986 0.9936 0.9803 0.9527 0.9051 0.8338 0.7384 0.6230
6 1.0000 1.0000 0.9999 0.9991 0.9965 0.9894 0.9740 0.9452 0.8980 0.8281
7 1.0000 1.0000 1.0000 0.9999 0.9996 0.9984 0.9952 0.9877 0.9726 0.9453
8 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9995 0.9983 0.9955 0.9893
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
12 1 0.8816 0.6590 0.4435 0.2749 0.1584 0.0850 0.0424 0.0196 0.0083 0.0032
2 0.9804 0.8891 0.7358 0.5583 0.3907 0.2528 0.1513 0.0834 0.0421 0.0193
3 0.9978 0.9744 0.9078 0.7946 0.6488 0.4925 0.3467 0.2253 0.1345 0.0730
4 0.9998 0.9957 0.9761 0.9274 0.8424 0.7237 0.5833 0.4382 0.3044 0.1938
5 1.0000 0.9995 0.9954 0.9806 0.9456 0.8822 0.7873 0.6652 0.5269 0.3872
6 1.0000 0.9999 0.9993 0.9961 0.9857 0.9614 0.9154 0.8418 0.7393 0.6128
7 1.0000 1.0000 0.9999 0.9994 0.9972 0.9905 0.9745 0.9427 0.8883 0.8062
8 1.0000 1.0000 1.0000 0.9999 0.9996 0.9983 0.9944 0.9847 0.9644 0.9270
9 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9992 0.9972 0.9921 0.9807
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9989 0.9968
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
14 1 0.8470 0.5846 0.3567 0.1979 0.1010 0.0475 0.0205 0.0081 0.0029 0.0009
2 0.9699 0.8416 0.6479 0.4481 0.2811 0.1608 0.0839 0.0398 0.0170 0.0065
3 0.9958 0.9559 0.8535 0.6982 0.5213 0.3552 0.2205 0.1243 0.0632 0.0287
4 0.9996 0.9908 0.9533 0.8702 0.7415 0.5842 0.4227 0.2793 0.1672 0.0898
5 1.0000 0.9985 0.9885 0.9561 0.8883 0.7805 0.6405 0.4859 0.3373 0.2120
6 1.0000 0.9998 0.9978 0.9884 0.9617 0.9067 0.8164 0.6925 0.5461 0.3953
7 1.0000 1.0000 0.9997 0.9976 0.9897 0.9685 0.9247 0.8499 0.7414 0.6047
8 1.0000 1.0000 1.0000 0.9996 0.9978 0.9917 0.9757 0.9417 0.8811 0.7880
9 1.0000 1.0000 1.0000 1.0000 0.9997 0.9983 0.9940 0.9825 0.9574 0.9102
10 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9989 0.9961 0.9886 0.9713
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9978 0.9935
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9991
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
16 1 0.8108 0.5147 0.2839 0.1407 0.0635 0.0261 0.0098 0.0033 0.0010 0.0003
2 0.9571 0.7892 0.5614 0.3518 0.1971 0.0994 0.0451 0.0183 0.0066 0.0021
3 0.9930 0.9316 0.7899 0.5981 0.4050 0.2459 0.1339 0.0651 0.0281 0.0106
4 0.9991 0.9830 0.9209 0.7982 0.6302 0.4499 0.2892 0.1666 0.0853 0.0384
5 0.9999 0.9967 0.9765 0.9183 0.8103 0.6598 0.4900 0.3288 0.1976 0.1051
6 1.0000 0.9995 0.9944 0.9733 0.9204 0.8247 0.6881 0.5272 0.3660 0.2272
7 1.0000 0.9999 0.9989 0.9930 0.9729 0.9256 0.8406 0.7161 0.5629 0.4018
8 1.0000 1.0000 0.9998 0.9985 0.9925 0.9743 0.9329 0.8577 0.7441 0.5982
9 1.0000 1.0000 1.0000 0.9998 0.9984 0.9929 0.9771 0.9417 0.8759 0.7728
10 1.0000 1.0000 1.0000 1.0000 0.9997 0.9984 0.9938 0.9809 0.9514 0.8949
11 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987 0.9951 0.9851 0.9616
12 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9991 0.9965 0.9894
460 APÉNDICE D. TABLAS ESTADÍSTICAS
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9994 0.9979
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
18 1 0.7735 0.4503 0.2241 0.0991 0.0395 0.0142 0.0046 0.0013 0.0003 0.0001
2 0.9419 0.7338 0.4797 0.2713 0.1353 0.0600 0.0236 0.0082 0.0025 0.0007
3 0.9891 0.9018 0.7202 0.5010 0.3057 0.1646 0.0783 0.0328 0.0120 0.0038
4 0.9985 0.9718 0.8794 0.7164 0.5187 0.3327 0.1886 0.0942 0.0411 0.0154
5 0.9998 0.9936 0.9581 0.8671 0.7175 0.5344 0.3550 0.2088 0.1077 0.0481
6 1.0000 0.9988 0.9882 0.9487 0.8610 0.7217 0.5491 0.3743 0.2258 0.1189
7 1.0000 0.9998 0.9973 0.9837 0.9431 0.8593 0.7283 0.5634 0.3915 0.2403
8 1.0000 1.0000 0.9995 0.9957 0.9807 0.9404 0.8609 0.7368 0.5778 0.4073
9 1.0000 1.0000 0.9999 0.9991 0.9946 0.9790 0.9403 0.8653 0.7473 0.5927
10 1.0000 1.0000 1.0000 0.9998 0.9988 0.9939 0.9788 0.9424 0.8720 0.7597
11 1.0000 1.0000 1.0000 1.0000 0.9998 0.9986 0.9938 0.9797 0.9463 0.8811
12 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9986 0.9942 0.9817 0.9519
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987 0.9951 0.9846
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9990 0.9962
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
20 1 0.7358 0.3917 0.1756 0.0692 0.0243 0.0076 0.0021 0.0005 0.0001 0.0000
2 0.9245 0.6769 0.4049 0.2061 0.0913 0.0355 0.0121 0.0036 0.0009 0.0002
3 0.9841 0.8670 0.6477 0.4114 0.2252 0.1071 0.0444 0.0160 0.0049 0.0013
4 0.9974 0.9568 0.8298 0.6296 0.4148 0.2375 0.1182 0.0510 0.0189 0.0059
5 0.9997 0.9887 0.9327 0.8042 0.6172 0.4164 0.2454 0.1256 0.0553 0.0207
6 1.0000 0.9976 0.9781 0.9133 0.7858 0.6080 0.4166 0.2500 0.1299 0.0577
7 1.0000 0.9996 0.9941 0.9679 0.8982 0.7723 0.6010 0.4159 0.2520 0.1316
8 1.0000 0.9999 0.9987 0.9900 0.9591 0.8867 0.7624 0.5956 0.4143 0.2517
9 1.0000 1.0000 0.9998 0.9974 0.9861 0.9520 0.8782 0.7553 0.5914 0.4119
10 1.0000 1.0000 1.0000 0.9994 0.9961 0.9829 0.9468 0.8725 0.7507 0.5881
11 1.0000 1.0000 1.0000 0.9999 0.9991 0.9949 0.9804 0.9435 0.8692 0.7483
12 1.0000 1.0000 1.0000 1.0000 0.9998 0.9987 0.9940 0.9790 0.9420 0.8684
13 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9985 0.9935 0.9786 0.9423
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9984 0.9936 0.9793
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9985 0.9941
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9987
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
19 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
20 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
D.3. DISTRIBUCIÓN DE POISSON 461
[x] −λ k
X e λ
P (X ≤ x) =
k!
k=0
x λ =0.1 λ =0.3 λ =0.5 λ =0.7 λ =0.9 λ =1.1 λ =1.3 λ =1.5 λ =1.7 λ =1.9
0 0.9048 0.7408 0.6065 0.4966 0.4066 0.3329 0.2725 0.2231 0.1827 0.1496
1 0.9953 0.9631 0.9098 0.8442 0.7725 0.6990 0.6268 0.5578 0.4932 0.4337
2 0.9998 0.9964 0.9856 0.9659 0.9371 0.9004 0.8571 0.8088 0.7572 0.7037
3 1.0000 0.9997 0.9982 0.9942 0.9865 0.9743 0.9569 0.9344 0.9068 0.8747
4 1.0000 1.0000 0.9998 0.9992 0.9977 0.9946 0.9893 0.9814 0.9704 0.9559
5 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990 0.9978 0.9955 0.9920 0.9868
6 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9991 0.9981 0.9966
7 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9996 0.9992
x λ =2 λ =3 λ =4 λ =5 λ =6 λ =7 λ =8 λ =9 λ =10 λ =11
0 0.1353 0.0498 0.0183 0.0067 0.0025 0.0009 0.0003 0.0001 0.0000 0.0000
1 0.4060 0.1991 0.0916 0.0404 0.0174 0.0073 0.0030 0.0012 0.0005 0.0002
2 0.6767 0.4232 0.2381 0.1247 0.0620 0.0296 0.0138 0.0062 0.0028 0.0012
3 0.8571 0.6472 0.4335 0.2650 0.1512 0.0818 0.0424 0.0212 0.0103 0.0049
4 0.9473 0.8153 0.6288 0.4405 0.2851 0.1730 0.0996 0.0550 0.0293 0.0151
5 0.9834 0.9161 0.7851 0.6160 0.4457 0.3007 0.1912 0.1157 0.0671 0.0375
6 0.9955 0.9665 0.8893 0.7622 0.6063 0.4497 0.3134 0.2068 0.1301 0.0786
7 0.9989 0.9881 0.9489 0.8666 0.7440 0.5987 0.4530 0.3239 0.2202 0.1432
8 0.9998 0.9962 0.9786 0.9319 0.8472 0.7291 0.5925 0.4557 0.3328 0.2320
9 1.0000 0.9989 0.9919 0.9682 0.9161 0.8305 0.7166 0.5874 0.4579 0.3405
10 1.0000 0.9997 0.9972 0.9863 0.9574 0.9015 0.8159 0.7060 0.5830 0.4599
11 1.0000 0.9999 0.9991 0.9945 0.9799 0.9467 0.8881 0.8030 0.6968 0.5793
12 1.0000 1.0000 0.9997 0.9980 0.9912 0.9730 0.9362 0.8758 0.7916 0.6887
13 1.0000 1.0000 0.9999 0.9993 0.9964 0.9872 0.9658 0.9261 0.8645 0.7813
14 1.0000 1.0000 1.0000 0.9998 0.9986 0.9943 0.9827 0.9585 0.9165 0.8540
15 1.0000 1.0000 1.0000 0.9999 0.9995 0.9976 0.9918 0.9780 0.9513 0.9074
16 1.0000 1.0000 1.0000 1.0000 0.9998 0.9990 0.9963 0.9889 0.9730 0.9441
17 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9984 0.9947 0.9857 0.9678
18 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9993 0.9976 0.9928 0.9823
19 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9997 0.9989 0.9965 0.9907
20 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9984 0.9953
21 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9998 0.9993 0.9977
22 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9997 0.9990
x λ =12 λ =13 λ =14 λ =15 λ =16 λ =17 λ =18 λ =19 λ =20 λ =21
0 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
1 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
2 0.0005 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
3 0.0023 0.0011 0.0005 0.0002 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000
4 0.0076 0.0037 0.0018 0.0009 0.0004 0.0002 0.0001 0.0000 0.0000 0.0000
5 0.0203 0.0107 0.0055 0.0028 0.0014 0.0007 0.0003 0.0002 0.0001 0.0000
6 0.0458 0.0259 0.0142 0.0076 0.0040 0.0021 0.0010 0.0005 0.0003 0.0001
7 0.0895 0.0540 0.0316 0.0180 0.0100 0.0054 0.0029 0.0015 0.0008 0.0004
8 0.1550 0.0998 0.0621 0.0374 0.0220 0.0126 0.0071 0.0039 0.0021 0.0011
9 0.2424 0.1658 0.1094 0.0699 0.0433 0.0261 0.0154 0.0089 0.0050 0.0028
10 0.3472 0.2517 0.1757 0.1185 0.0774 0.0491 0.0304 0.0183 0.0108 0.0063
11 0.4616 0.3532 0.2600 0.1848 0.1270 0.0847 0.0549 0.0347 0.0214 0.0129
12 0.5760 0.4631 0.3585 0.2676 0.1931 0.1350 0.0917 0.0606 0.0390 0.0245
13 0.6815 0.5730 0.4644 0.3632 0.2745 0.2009 0.1426 0.0984 0.0661 0.0434
14 0.7720 0.6751 0.5704 0.4657 0.3675 0.2808 0.2081 0.1497 0.1049 0.0716
15 0.8444 0.7636 0.6694 0.5681 0.4667 0.3715 0.2867 0.2148 0.1565 0.1111
16 0.8987 0.8355 0.7559 0.6641 0.5660 0.4677 0.3751 0.2920 0.2211 0.1629
17 0.9370 0.8905 0.8272 0.7489 0.6593 0.5640 0.4686 0.3784 0.2970 0.2270
18 0.9626 0.9302 0.8826 0.8195 0.7423 0.6550 0.5622 0.4695 0.3814 0.3017
19 0.9787 0.9573 0.9235 0.8752 0.8122 0.7363 0.6509 0.5606 0.4703 0.3843
20 0.9884 0.9750 0.9521 0.9170 0.8682 0.8055 0.7307 0.6472 0.5591 0.4710
21 0.9939 0.9859 0.9712 0.9469 0.9108 0.8615 0.7991 0.7255 0.6437 0.5577
22 0.9970 0.9924 0.9833 0.9673 0.9418 0.9047 0.8551 0.7931 0.7206 0.6405
23 0.9985 0.9960 0.9907 0.9805 0.9633 0.9367 0.8989 0.8490 0.7875 0.7160
24 0.9993 0.9980 0.9950 0.9888 0.9777 0.9594 0.9317 0.8933 0.8432 0.7822
25 0.9997 0.9990 0.9974 0.9938 0.9869 0.9748 0.9554 0.9269 0.8878 0.8377
26 0.9999 0.9995 0.9987 0.9967 0.9925 0.9848 0.9718 0.9514 0.9221 0.8826
27 0.9999 0.9998 0.9994 0.9983 0.9959 0.9912 0.9827 0.9687 0.9475 0.9175
28 1.0000 0.9999 0.9997 0.9991 0.9978 0.9950 0.9897 0.9805 0.9657 0.9436
29 1.0000 1.0000 0.9999 0.9996 0.9989 0.9973 0.9941 0.9882 0.9782 0.9626
30 1.0000 1.0000 0.9999 0.9998 0.9994 0.9986 0.9967 0.9930 0.9865 0.9758
31 1.0000 1.0000 1.0000 0.9999 0.9997 0.9993 0.9982 0.9960 0.9919 0.9848
32 1.0000 1.0000 1.0000 1.0000 0.9999 0.9996 0.9990 0.9978 0.9953 0.9907
33 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9995 0.9988 0.9973 0.9945
34 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9994 0.9985 0.9968
462 APÉNDICE D. TABLAS ESTADÍSTICAS
x 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
D.5. DISTRIBUCIÓN T DE STUDENT 463
x
Γ n+1
Z
2 2 − n+1
Ftn (x) = P (tn ≤ x) = √ n (1 − t )
2 dt = t
n,1−α
−∞ nπ Γ 2
1−α n =1 n =2 n =3 n =4 n =5 n =6 n =7 n =8 n =9 n =10
0.500 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.550 0.1584 0.1421 0.1366 0.1338 0.1322 0.1311 0.1303 0.1297 0.1293 0.1289
0.600 0.3249 0.2887 0.2767 0.2707 0.2672 0.2648 0.2632 0.2619 0.2610 0.2602
0.650 0.5095 0.4447 0.4242 0.4142 0.4082 0.4043 0.4015 0.3995 0.3979 0.3966
0.700 0.7265 0.6172 0.5844 0.5686 0.5594 0.5534 0.5491 0.5459 0.5435 0.5415
0.750 1.0000 0.8165 0.7649 0.7407 0.7267 0.7176 0.7111 0.7064 0.7027 0.6998
0.800 1.3764 1.0607 0.9785 0.9410 0.9195 0.9057 0.8960 0.8889 0.8834 0.8791
0.850 1.9626 1.3862 1.2498 1.1896 1.1558 1.1342 1.1192 1.1081 1.0997 1.0931
0.900 3.0777 1.8856 1.6377 1.5332 1.4759 1.4398 1.4149 1.3968 1.3830 1.3722
0.905 3.2506 1.9534 1.6880 1.5767 1.5158 1.4775 1.4513 1.4321 1.4175 1.4061
0.910 3.4420 2.0261 1.7413 1.6226 1.5579 1.5172 1.4894 1.4691 1.4537 1.4416
0.915 3.6554 2.1045 1.7981 1.6712 1.6023 1.5590 1.5295 1.5079 1.4916 1.4788
0.920 3.8947 2.1894 1.8589 1.7229 1.6493 1.6033 1.5718 1.5489 1.5315 1.5179
0.925 4.1653 2.2819 1.9243 1.7782 1.6994 1.6502 1.6166 1.5922 1.5737 1.5592
0.930 4.4737 2.3834 1.9950 1.8375 1.7529 1.7002 1.6643 1.6383 1.6185 1.6031
0.935 4.8288 2.4954 2.0719 1.9016 1.8104 1.7538 1.7153 1.6874 1.6663 1.6498
0.940 5.2422 2.6202 2.1562 1.9712 1.8727 1.8117 1.7702 1.7402 1.7176 1.6998
0.945 5.7297 2.7604 2.2494 2.0475 1.9405 1.8744 1.8297 1.7973 1.7729 1.7538
0.950 6.3138 2.9200 2.3534 2.1318 2.0150 1.9432 1.8946 1.8595 1.8331 1.8125
0.955 7.0264 3.1040 2.4708 2.2261 2.0978 2.0192 1.9662 1.9280 1.8992 1.8768
0.960 7.9158 3.3198 2.6054 2.3329 2.1910 2.1043 2.0460 2.0042 1.9727 1.9481
0.965 9.0579 3.5782 2.7626 2.4559 2.2974 2.2011 2.1365 2.0902 2.0554 2.0283
0.970 10.5789 3.8964 2.9505 2.6008 2.4216 2.3133 2.2409 2.1892 2.1504 2.1202
0.975 12.7062 4.3027 3.1824 2.7764 2.5706 2.4469 2.3646 2.3060 2.2622 2.2281
0.980 15.8945 4.8487 3.4819 2.9985 2.7565 2.6122 2.5168 2.4490 2.3984 2.3593
0.985 21.2049 5.6428 3.8960 3.2976 3.0029 2.8289 2.7146 2.6338 2.5738 2.5275
0.990 31.8205 6.9646 4.5407 3.7469 3.3649 3.1427 2.9980 2.8965 2.8214 2.7638
0.995 63.6567 9.9248 5.8409 4.6041 4.0321 3.7074 3.4995 3.3554 3.2498 3.1693
0.999 318.3088 22.3271 10.2145 7.1732 5.8934 5.2076 4.7853 4.5008 4.2968 4.1437
464 APÉNDICE D. TABLAS ESTADÍSTICAS
1−α n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
0.500 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.550 0.1286 0.1283 0.1281 0.1280 0.1278 0.1277 0.1276 0.1274 0.1274 0.1273
0.600 0.2596 0.2590 0.2586 0.2582 0.2579 0.2576 0.2573 0.2571 0.2569 0.2567
0.650 0.3956 0.3947 0.3940 0.3933 0.3928 0.3923 0.3919 0.3915 0.3912 0.3909
0.700 0.5399 0.5386 0.5375 0.5366 0.5357 0.5350 0.5344 0.5338 0.5333 0.5329
0.750 0.6974 0.6955 0.6938 0.6924 0.6912 0.6901 0.6892 0.6884 0.6876 0.6870
0.800 0.8755 0.8726 0.8702 0.8681 0.8662 0.8647 0.8633 0.8620 0.8610 0.8600
0.850 1.0877 1.0832 1.0795 1.0763 1.0735 1.0711 1.0690 1.0672 1.0655 1.0640
0.900 1.3634 1.3562 1.3502 1.3450 1.3406 1.3368 1.3334 1.3304 1.3277 1.3253
0.905 1.3969 1.3892 1.3829 1.3774 1.3728 1.3687 1.3652 1.3620 1.3592 1.3567
0.910 1.4318 1.4237 1.4170 1.4113 1.4063 1.4021 1.3983 1.3950 1.3920 1.3894
0.915 1.4684 1.4599 1.4528 1.4467 1.4415 1.4369 1.4330 1.4295 1.4263 1.4235
0.920 1.5069 1.4979 1.4903 1.4839 1.4784 1.4736 1.4694 1.4656 1.4623 1.4593
0.925 1.5476 1.5380 1.5299 1.5231 1.5172 1.5121 1.5077 1.5037 1.5002 1.4970
0.930 1.5906 1.5804 1.5718 1.5646 1.5583 1.5529 1.5482 1.5439 1.5402 1.5369
0.935 1.6365 1.6256 1.6164 1.6087 1.6020 1.5962 1.5911 1.5867 1.5827 1.5791
0.940 1.6856 1.6739 1.6641 1.6558 1.6487 1.6425 1.6370 1.6322 1.6280 1.6242
0.945 1.7385 1.7259 1.7154 1.7064 1.6988 1.6921 1.6863 1.6812 1.6766 1.6725
0.950 1.7959 1.7823 1.7709 1.7613 1.7531 1.7459 1.7396 1.7341 1.7291 1.7247
0.955 1.8588 1.8440 1.8317 1.8213 1.8123 1.8046 1.7978 1.7918 1.7864 1.7816
0.960 1.9284 1.9123 1.8989 1.8875 1.8777 1.8693 1.8619 1.8553 1.8495 1.8443
0.965 2.0067 1.9889 1.9742 1.9617 1.9509 1.9417 1.9335 1.9264 1.9200 1.9143
0.970 2.0961 2.0764 2.0600 2.0462 2.0343 2.0240 2.0150 2.0071 2.0000 1.9937
0.975 2.2010 2.1788 2.1604 2.1448 2.1314 2.1199 2.1098 2.1009 2.0930 2.0860
0.980 2.3281 2.3027 2.2816 2.2638 2.2485 2.2354 2.2238 2.2137 2.2047 2.1967
0.985 2.4907 2.4607 2.4358 2.4149 2.3970 2.3815 2.3681 2.3562 2.3456 2.3362
0.990 2.7181 2.6810 2.6503 2.6245 2.6025 2.5835 2.5669 2.5524 2.5395 2.5280
0.995 3.1058 3.0545 3.0123 2.9768 2.9467 2.9208 2.8982 2.8784 2.8609 2.8453
0.999 4.0247 3.9296 3.8520 3.7874 3.7328 3.6862 3.6458 3.6105 3.5794 3.5518
1−α n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
0.500 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.550 0.1272 0.1271 0.1271 0.1270 0.1269 0.1269 0.1268 0.1268 0.1268 0.1267
0.600 0.2566 0.2564 0.2563 0.2562 0.2561 0.2560 0.2559 0.2558 0.2557 0.2556
0.650 0.3906 0.3904 0.3902 0.3900 0.3898 0.3896 0.3894 0.3893 0.3892 0.3890
0.700 0.5325 0.5321 0.5317 0.5314 0.5312 0.5309 0.5306 0.5304 0.5302 0.5300
0.750 0.6864 0.6858 0.6853 0.6848 0.6844 0.6840 0.6837 0.6834 0.6830 0.6828
0.800 0.8591 0.8583 0.8575 0.8569 0.8562 0.8557 0.8551 0.8546 0.8542 0.8538
0.850 1.0627 1.0614 1.0603 1.0593 1.0584 1.0575 1.0567 1.0560 1.0553 1.0547
0.900 1.3232 1.3212 1.3195 1.3178 1.3163 1.3150 1.3137 1.3125 1.3114 1.3104
0.905 1.3544 1.3524 1.3505 1.3488 1.3472 1.3458 1.3444 1.3432 1.3420 1.3410
0.910 1.3870 1.3848 1.3828 1.3810 1.3794 1.3778 1.3764 1.3751 1.3739 1.3728
0.915 1.4210 1.4187 1.4166 1.4147 1.4130 1.4113 1.4098 1.4085 1.4072 1.4060
0.920 1.4567 1.4542 1.4520 1.4500 1.4482 1.4464 1.4449 1.4434 1.4421 1.4408
0.925 1.4942 1.4916 1.4893 1.4871 1.4852 1.4834 1.4817 1.4801 1.4787 1.4774
0.930 1.5338 1.5311 1.5286 1.5263 1.5242 1.5223 1.5205 1.5189 1.5174 1.5159
0.935 1.5759 1.5730 1.5703 1.5679 1.5657 1.5636 1.5617 1.5600 1.5583 1.5568
0.940 1.6207 1.6176 1.6148 1.6122 1.6098 1.6076 1.6056 1.6037 1.6020 1.6004
0.945 1.6688 1.6655 1.6624 1.6596 1.6571 1.6547 1.6526 1.6506 1.6487 1.6470
0.950 1.7207 1.7171 1.7139 1.7109 1.7081 1.7056 1.7033 1.7011 1.6991 1.6973
0.955 1.7773 1.7734 1.7699 1.7667 1.7637 1.7610 1.7585 1.7561 1.7540 1.7520
0.960 1.8397 1.8354 1.8316 1.8281 1.8248 1.8219 1.8191 1.8166 1.8142 1.8120
0.965 1.9092 1.9045 1.9003 1.8965 1.8929 1.8897 1.8867 1.8839 1.8813 1.8789
0.970 1.9880 1.9829 1.9782 1.9740 1.9701 1.9665 1.9632 1.9601 1.9573 1.9546
0.975 2.0796 2.0739 2.0687 2.0639 2.0595 2.0555 2.0518 2.0484 2.0452 2.0423
0.980 2.1894 2.1829 2.1770 2.1715 2.1666 2.1620 2.1578 2.1539 2.1503 2.1470
0.985 2.3278 2.3202 2.3132 2.3069 2.3011 2.2958 2.2909 2.2864 2.2822 2.2783
0.990 2.5176 2.5083 2.4999 2.4922 2.4851 2.4786 2.4727 2.4671 2.4620 2.4573
0.995 2.8314 2.8188 2.8073 2.7969 2.7874 2.7787 2.7707 2.7633 2.7564 2.7500
0.999 3.5272 3.5050 3.4850 3.4668 3.4502 3.4350 3.4210 3.4082 3.3962 3.3852
D.5. DISTRIBUCIÓN T DE STUDENT 465
1−α n =40 n =50 n =60 n =70 n =80 n =90 n =100 n =150 n =500 n =1000
0.500 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
0.550 0.1265 0.1263 0.1262 0.1261 0.1261 0.1260 0.1260 0.1259 0.1257 0.1257
0.600 0.2550 0.2547 0.2545 0.2543 0.2542 0.2541 0.2540 0.2538 0.2535 0.2534
0.650 0.3881 0.3875 0.3872 0.3869 0.3867 0.3866 0.3864 0.3861 0.3855 0.3854
0.700 0.5286 0.5278 0.5272 0.5268 0.5265 0.5263 0.5261 0.5255 0.5247 0.5246
0.750 0.6807 0.6794 0.6786 0.6780 0.6776 0.6772 0.6770 0.6761 0.6750 0.6747
0.800 0.8507 0.8489 0.8477 0.8468 0.8461 0.8456 0.8452 0.8440 0.8423 0.8420
0.850 1.0500 1.0473 1.0455 1.0442 1.0432 1.0424 1.0418 1.0400 1.0375 1.0370
0.900 1.3031 1.2987 1.2958 1.2938 1.2922 1.2910 1.2901 1.2872 1.2832 1.2824
0.905 1.3332 1.3286 1.3256 1.3234 1.3218 1.3205 1.3195 1.3165 1.3124 1.3115
0.910 1.3646 1.3598 1.3566 1.3543 1.3526 1.3513 1.3502 1.3470 1.3426 1.3417
0.915 1.3974 1.3923 1.3889 1.3865 1.3847 1.3833 1.3822 1.3788 1.3742 1.3732
0.920 1.4317 1.4263 1.4227 1.4202 1.4183 1.4168 1.4156 1.4121 1.4072 1.4061
0.925 1.4677 1.4620 1.4582 1.4555 1.4535 1.4519 1.4507 1.4469 1.4417 1.4406
0.930 1.5057 1.4996 1.4956 1.4927 1.4906 1.4889 1.4876 1.4836 1.4781 1.4770
0.935 1.5459 1.5394 1.5352 1.5321 1.5298 1.5281 1.5267 1.5225 1.5166 1.5153
0.940 1.5887 1.5818 1.5772 1.5740 1.5716 1.5697 1.5682 1.5637 1.5574 1.5561
0.945 1.6345 1.6271 1.6222 1.6187 1.6161 1.6141 1.6125 1.6077 1.6010 1.5996
0.950 1.6839 1.6759 1.6706 1.6669 1.6641 1.6620 1.6602 1.6551 1.6479 1.6464
0.955 1.7375 1.7289 1.7232 1.7192 1.7162 1.7138 1.7120 1.7064 1.6987 1.6970
0.960 1.7963 1.7870 1.7808 1.7765 1.7732 1.7707 1.7687 1.7626 1.7543 1.7525
0.965 1.8617 1.8516 1.8448 1.8401 1.8365 1.8337 1.8315 1.8249 1.8158 1.8139
0.970 1.9357 1.9244 1.9170 1.9118 1.9078 1.9048 1.9024 1.8951 1.8851 1.8829
0.975 2.0211 2.0086 2.0003 1.9944 1.9901 1.9867 1.9840 1.9759 1.9647 1.9623
0.980 2.1229 2.1087 2.0994 2.0927 2.0878 2.0839 2.0809 2.0718 2.0591 2.0564
0.985 2.2503 2.2338 2.2229 2.2152 2.2095 2.2050 2.2015 2.1909 2.1763 2.1732
0.990 2.4233 2.4033 2.3901 2.3808 2.3739 2.3685 2.3642 2.3515 2.3338 2.3301
0.995 2.7045 2.6778 2.6603 2.6479 2.6387 2.6316 2.6259 2.6090 2.5857 2.5808
0.999 3.3069 3.2614 3.2317 3.2108 3.1953 3.1833 3.1737 3.1455 3.1066 3.0984
466 APÉNDICE D. TABLAS ESTADÍSTICAS
Z x
1 n−2 t
Fχ2n (x) = P χ2n ≤ x = e− 2 dt = χ2n,1−α
n n
t 2
0 2 Γ
2
2
1−α n =1 n =2 n =3 n =4 n =5 n =6 n =7 n =8 n =9 n =10
0.005 0.0000 0.0100 0.0717 0.2070 0.4117 0.6757 0.9893 1.3444 1.7349 2.1559
0.010 0.0002 0.0201 0.1148 0.2971 0.5543 0.8721 1.2390 1.6465 2.0879 2.5582
0.015 0.0004 0.0302 0.1516 0.3682 0.6618 1.0160 1.4184 1.8603 2.3349 2.8372
0.020 0.0006 0.0404 0.1848 0.4294 0.7519 1.1344 1.5643 2.0325 2.5324 3.0591
0.025 0.0010 0.0506 0.2158 0.4844 0.8312 1.2373 1.6899 2.1797 2.7004 3.2470
0.030 0.0014 0.0609 0.2451 0.5351 0.9031 1.3296 1.8016 2.3101 2.8485 3.4121
0.035 0.0019 0.0713 0.2731 0.5824 0.9693 1.4140 1.9033 2.4281 2.9821 3.5606
0.040 0.0025 0.0816 0.3002 0.6271 1.0313 1.4924 1.9971 2.5366 3.1047 3.6965
0.045 0.0032 0.0921 0.3263 0.6698 1.0898 1.5659 2.0848 2.6377 3.2185 3.8225
0.050 0.0039 0.1026 0.3518 0.7107 1.1455 1.6354 2.1673 2.7326 3.3251 3.9403
0.055 0.0048 0.1131 0.3768 0.7502 1.1987 1.7016 2.2457 2.8225 3.4258 4.0514
0.060 0.0057 0.1238 0.4012 0.7884 1.2499 1.7649 2.3205 2.9080 3.5215 4.1567
0.065 0.0067 0.1344 0.4251 0.8255 1.2993 1.8258 2.3921 2.9897 3.6128 4.2572
0.070 0.0077 0.1451 0.4487 0.8616 1.3472 1.8846 2.4611 3.0683 3.7004 4.3534
0.075 0.0089 0.1559 0.4720 0.8969 1.3937 1.9415 2.5277 3.1440 3.7847 4.4459
0.080 0.0101 0.1668 0.4949 0.9315 1.4390 1.9967 2.5921 3.2172 3.8661 4.5350
0.085 0.0114 0.1777 0.5176 0.9654 1.4832 2.0505 2.6548 3.2881 3.9449 4.6213
0.090 0.0128 0.1886 0.5401 0.9987 1.5264 2.1029 2.7157 3.3570 4.0214 4.7049
0.095 0.0142 0.1996 0.5623 1.0314 1.5688 2.1540 2.7751 3.4241 4.0957 4.7861
0.100 0.0158 0.2107 0.5844 1.0636 1.6103 2.2041 2.8331 3.4895 4.1682 4.8652
0.900 2.7055 4.6052 6.2514 7.7794 9.2364 10.6446 12.0170 13.3616 14.6837 15.9872
0.905 2.7875 4.7078 6.3684 7.9082 9.3753 10.7927 12.1734 13.5256 14.8549 16.1652
0.910 2.8744 4.8159 6.4915 8.0434 9.5211 10.9479 12.3372 13.6975 15.0342 16.3516
0.915 2.9666 4.9302 6.6213 8.1859 9.6745 11.1112 12.5095 13.8780 15.2226 16.5473
0.920 3.0649 5.0515 6.7587 8.3365 9.8366 11.2835 12.6912 14.0684 15.4211 16.7535
0.925 3.1701 5.1805 6.9046 8.4963 10.0083 11.4659 12.8834 14.2697 15.6309 16.9714
0.930 3.2830 5.3185 7.0603 8.6664 10.1910 11.6599 13.0877 14.4836 15.8537 17.2026
0.935 3.4050 5.4667 7.2271 8.8485 10.3863 11.8671 13.3058 14.7117 16.0913 17.4490
0.940 3.5374 5.6268 7.4069 9.0444 10.5962 12.0896 13.5397 14.9563 16.3459 17.7131
0.945 3.6821 5.8008 7.6018 9.2564 10.8232 12.3300 13.7924 15.2203 16.6206 17.9978
0.950 3.8415 5.9915 7.8147 9.4877 11.0705 12.5916 14.0671 15.5073 16.9190 18.3070
0.955 4.0186 6.2022 8.0495 9.7423 11.3423 12.8789 14.3686 15.8220 17.2460 18.6457
0.960 4.2179 6.4378 8.3112 10.0255 11.6443 13.1978 14.7030 16.1708 17.6083 19.0207
0.965 4.4452 6.7048 8.6069 10.3450 11.9846 13.5567 15.0790 16.5626 18.0150 19.4415
0.970 4.7093 7.0131 8.9473 10.7119 12.3746 13.9676 15.5091 17.0105 18.4796 19.9219
0.975 5.0239 7.3778 9.3484 11.1433 12.8325 14.4494 16.0128 17.5345 19.0228 20.4832
0.980 5.4119 7.8240 9.8374 11.6678 13.3882 15.0332 16.6224 18.1682 19.6790 21.1608
0.985 5.9165 8.3994 10.4650 12.3391 14.0978 15.7774 17.3984 18.9739 20.5125 22.0206
0.990 6.6349 9.2103 11.3449 13.2767 15.0863 16.8119 18.4753 20.0902 21.6660 23.2093
0.995 7.8794 10.5966 12.8382 14.8603 16.7496 18.5476 20.2777 21.9550 23.5894 25.1882
D.6. DISTRIBUCIÓN JI-CUADRADO DE PEARSON 467
1−α n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
0.005 0.0000 0.0100 0.0717 0.2070 0.4117 0.6757 0.9893 1.3444 1.7349 7.4338
0.010 0.0002 0.0201 0.1148 0.2971 0.5543 0.8721 1.2390 1.6465 2.0879 8.2604
0.015 0.0004 0.0302 0.1516 0.3682 0.6618 1.0160 1.4184 1.8603 2.3349 8.8105
0.020 0.0006 0.0404 0.1848 0.4294 0.7519 1.1344 1.5643 2.0325 2.5324 9.2367
0.025 0.0010 0.0506 0.2158 0.4844 0.8312 1.2373 1.6899 2.1797 2.7004 9.5908
0.030 0.0014 0.0609 0.2451 0.5351 0.9031 1.3296 1.8016 2.3101 2.8485 9.8971
0.035 0.0019 0.0713 0.2731 0.5824 0.9693 1.4140 1.9033 2.4281 2.9821 10.1692
0.040 0.0025 0.0816 0.3002 0.6271 1.0313 1.4924 1.9971 2.5366 3.1047 10.4154
0.045 0.0032 0.0921 0.3263 0.6698 1.0898 1.5659 2.0848 2.6377 3.2185 10.6413
0.050 0.0039 0.1026 0.3518 0.7107 1.1455 1.6354 2.1673 2.7326 3.3251 10.8508
0.055 0.0048 0.1131 0.3768 0.7502 1.1987 1.7016 2.2457 2.8225 3.4258 11.0468
0.060 0.0057 0.1238 0.4012 0.7884 1.2499 1.7649 2.3205 2.9080 3.5215 11.2314
0.065 0.0067 0.1344 0.4251 0.8255 1.2993 1.8258 2.3921 2.9897 3.6128 11.4062
0.070 0.0077 0.1451 0.4487 0.8616 1.3472 1.8846 2.4611 3.0683 3.7004 11.5727
0.075 0.0089 0.1559 0.4720 0.8969 1.3937 1.9415 2.5277 3.1440 3.7847 11.7317
0.080 0.0101 0.1668 0.4949 0.9315 1.4390 1.9967 2.5921 3.2172 3.8661 11.8843
0.085 0.0114 0.1777 0.5176 0.9654 1.4832 2.0505 2.6548 3.2881 3.9449 12.0311
0.090 0.0128 0.1886 0.5401 0.9987 1.5264 2.1029 2.7157 3.3570 4.0214 12.1728
0.095 0.0142 0.1996 0.5623 1.0314 1.5688 2.1540 2.7751 3.4241 4.0957 12.3098
0.100 0.0158 0.2107 0.5844 1.0636 1.6103 2.2041 2.8331 3.4895 4.1682 12.4426
0.900 2.7055 4.6052 6.2514 7.7794 9.2364 10.6446 12.0170 13.3616 14.6837 28.4120
0.905 2.7875 4.7078 6.3684 7.9082 9.3753 10.7927 12.1734 13.5256 14.8549 28.6444
0.910 2.8744 4.8159 6.4915 8.0434 9.5211 10.9479 12.3372 13.6975 15.0342 28.8874
0.915 2.9666 4.9302 6.6213 8.1859 9.6745 11.1112 12.5095 13.8780 15.2226 29.1420
0.920 3.0649 5.0515 6.7587 8.3365 9.8366 11.2835 12.6912 14.0684 15.4211 29.4097
0.925 3.1701 5.1805 6.9046 8.4963 10.0083 11.4659 12.8834 14.2697 15.6309 29.6920
0.930 3.2830 5.3185 7.0603 8.6664 10.1910 11.6599 13.0877 14.4836 15.8537 29.9910
0.935 3.4050 5.4667 7.2271 8.8485 10.3863 11.8671 13.3058 14.7117 16.0913 30.3089
0.940 3.5374 5.6268 7.4069 9.0444 10.5962 12.0896 13.5397 14.9563 16.3459 30.6489
0.945 3.6821 5.8008 7.6018 9.2564 10.8232 12.3300 13.7924 15.2203 16.6206 31.0144
0.950 3.8415 5.9915 7.8147 9.4877 11.0705 12.5916 14.0671 15.5073 16.9190 31.4104
0.955 4.0186 6.2022 8.0495 9.7423 11.3423 12.8789 14.3686 15.8220 17.2460 31.8430
0.960 4.2179 6.4378 8.3112 10.0255 11.6443 13.1978 14.7030 16.1708 17.6083 32.3206
0.965 4.4452 6.7048 8.6069 10.3450 11.9846 13.5567 15.0790 16.5626 18.0150 32.8547
0.970 4.7093 7.0131 8.9473 10.7119 12.3746 13.9676 15.5091 17.0105 18.4796 33.4624
0.975 5.0239 7.3778 9.3484 11.1433 12.8325 14.4494 16.0128 17.5345 19.0228 34.1696
0.980 5.4119 7.8240 9.8374 11.6678 13.3882 15.0332 16.6224 18.1682 19.6790 35.0196
0.985 5.9165 8.3994 10.4650 12.3391 14.0978 15.7774 17.3984 18.9739 20.5125 36.0926
0.990 6.6349 9.2103 11.3449 13.2767 15.0863 16.8119 18.4753 20.0902 21.6660 37.5662
0.995 7.8794 10.5966 12.8382 14.8603 16.7496 18.5476 20.2777 21.9550 23.5894 39.9968
1−α n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
0.005 8.0337 8.6427 9.2604 9.8862 10.5197 11.1602 11.8076 12.4613 13.1211 13.7867
0.010 8.8972 9.5425 10.1957 10.8564 11.5240 12.1981 12.8785 13.5647 14.2565 14.9535
0.015 9.4708 10.1390 10.8147 11.4974 12.1867 12.8821 13.5833 14.2900 15.0019 15.7188
0.020 9.9146 10.6000 11.2926 11.9918 12.6973 13.4086 14.1254 14.8475 15.5745 16.3062
0.025 10.2829 10.9823 11.6886 12.4012 13.1197 13.8439 14.5734 15.3079 16.0471 16.7908
0.030 10.6013 11.3125 12.0303 12.7543 13.4840 14.2190 14.9592 15.7042 16.4538 17.2076
0.035 10.8839 11.6055 12.3334 13.0672 13.8066 14.5512 15.3007 16.0549 16.8134 17.5761
0.040 11.1395 11.8703 12.6072 13.3498 14.0978 14.8509 15.6087 16.3711 17.1377 17.9083
0.045 11.3740 12.1131 12.8581 13.6087 14.3645 15.1253 15.8906 16.6603 17.4342 18.2119
0.050 11.5913 12.3380 13.0905 13.8484 14.6114 15.3792 16.1514 16.9279 17.7084 18.4927
0.055 11.7945 12.5483 13.3077 14.0723 14.8419 15.6162 16.3948 17.1775 17.9641 18.7545
0.060 11.9858 12.7461 13.5120 14.2829 15.0587 15.8390 16.6235 17.4121 18.2044 19.0004
0.065 12.1670 12.9335 13.7053 14.4822 15.2637 16.0497 16.8398 17.6338 18.4315 19.2328
0.070 12.3394 13.1117 13.8892 14.6716 15.4586 16.2499 17.0453 17.8444 18.6472 19.4534
0.075 12.5041 13.2819 14.0648 14.8525 15.6447 16.4410 17.2414 18.0454 18.8530 19.6639
0.080 12.6620 13.4451 14.2331 15.0259 15.8229 16.6241 17.4291 18.2378 19.0500 19.8654
0.085 12.8140 13.6020 14.3950 15.1925 15.9942 16.8000 17.6096 18.4227 19.2392 20.0589
0.090 12.9605 13.7534 14.5510 15.3531 16.1594 16.9695 17.7834 18.6008 19.4214 20.2452
0.095 13.1023 13.8997 14.7019 15.5083 16.3189 17.1333 17.9513 18.7728 19.5974 20.4251
0.100 13.2396 14.0415 14.8480 15.6587 16.4734 17.2919 18.1139 18.9392 19.7677 20.5992
0.900 29.6151 30.8133 32.0069 33.1962 34.3816 35.5632 36.7412 37.9159 39.0875 40.2560
0.905 29.8521 31.0548 32.2528 33.4464 34.6359 35.8216 37.0036 38.1823 39.3577 40.5300
0.910 30.0998 31.3071 32.5096 33.7077 34.9015 36.0915 37.2777 38.4604 39.6398 40.8161
0.915 30.3594 31.5715 32.7788 33.9814 35.1798 36.3741 37.5647 38.7517 39.9353 41.1157
0.920 30.6322 31.8494 33.0616 34.2690 35.4721 36.6711 37.8662 39.0577 40.2456 41.4304
0.925 30.9200 32.1424 33.3597 34.5723 35.7803 36.9841 38.1840 39.3801 40.5727 41.7619
0.930 31.2246 32.4526 33.6754 34.8932 36.1065 37.3154 38.5202 39.7213 40.9187 42.1126
0.935 31.5486 32.7825 34.0110 35.2344 36.4531 37.6674 38.8776 40.0838 41.2863 42.4852
0.940 31.8949 33.1350 34.3696 35.5990 36.8235 38.0435 39.2593 40.4710 41.6789 42.8831
0.945 32.2673 33.5140 34.7551 35.9908 37.2216 38.4477 39.6694 40.8870 42.1006 43.3106
0.950 32.6706 33.9244 35.1725 36.4150 37.6525 38.8851 40.1133 41.3371 42.5570 43.7730
0.955 33.1111 34.3726 35.6282 36.8782 38.1228 39.3626 40.5977 41.8283 43.0549 44.2774
0.960 33.5972 34.8673 36.1311 37.3891 38.6416 39.8891 41.1318 42.3699 43.6038 44.8336
0.965 34.1409 35.4203 36.6932 37.9601 39.2214 40.4775 41.7285 42.9749 44.2169 45.4546
0.970 34.7593 36.0492 37.3323 38.6093 39.8804 41.1460 42.4066 43.6622 44.9132 46.1599
0.975 35.4789 36.7807 38.0756 39.3641 40.6465 41.9232 43.1945 44.4608 45.7223 46.9792
0.980 36.3434 37.6595 38.9683 40.2704 41.5661 42.8558 44.1400 45.4188 46.6927 47.9618
0.985 37.4345 38.7681 40.0941 41.4130 42.7252 44.0311 45.3311 46.6256 47.9147 49.1989
0.990 38.9322 40.2894 41.6384 42.9798 44.3141 45.6417 46.9629 48.2782 49.5879 50.8922
0.995 41.4011 42.7957 44.1813 45.5585 46.9279 48.2899 49.6449 50.9934 52.3356 53.6720
468 APÉNDICE D. TABLAS ESTADÍSTICAS
1−α n =40 n =50 n =60 n =70 n =80 n =90 n =100 n =150 n =500 n =1000
0.005 20.7065 27.9907 35.5345 43.2752 51.1719 59.1963 67.3276 109.1422 422.3034 888.5635
0.010 22.1643 29.7067 37.4849 45.4417 53.5401 61.7541 70.0649 112.6676 429.3875 898.9124
0.015 23.1130 30.8180 38.7435 46.8362 55.0612 63.3942 71.8177 114.9148 433.8652 905.4354
0.020 23.8376 31.6639 39.6994 47.8934 56.2128 64.6347 73.1422 116.6076 437.2194 910.3127
0.025 24.4330 32.3574 40.4817 48.7576 57.1532 65.6466 74.2219 117.9845 439.9360 914.2572
0.030 24.9437 32.9509 41.1504 49.4953 57.9553 66.5093 75.1419 119.1554 442.2381 917.5959
0.035 25.3940 33.4734 41.7383 50.1434 58.6595 67.2661 75.9486 120.1806 444.2476 920.5074
0.040 25.7989 33.9426 42.2656 50.7243 59.2902 67.9437 76.6705 121.0968 446.0389 923.1005
0.045 26.1684 34.3702 42.7458 51.2528 59.8638 68.5597 77.3265 121.9283 447.6607 925.4463
0.050 26.5093 34.7643 43.1880 51.7393 60.3915 69.1260 77.9295 122.6918 449.1468 927.5944
0.055 26.8268 35.1308 43.5990 52.1911 60.8814 69.6517 78.4890 123.3995 450.5216 929.5803
0.060 27.1245 35.4743 43.9838 52.6140 61.3397 70.1433 79.0121 124.0605 451.8035 931.4309
0.065 27.4055 35.7981 44.3464 53.0123 61.7712 70.6060 79.5042 124.6818 453.0064 933.1666
0.070 27.6720 36.1050 44.6898 53.3893 62.1795 71.0436 79.9697 125.2690 454.1416 934.8035
0.075 27.9258 36.3971 45.0165 53.7478 62.5676 71.4596 80.4119 125.8265 455.2177 936.3546
0.080 28.1686 36.6762 45.3285 54.0900 62.9380 71.8564 80.8338 126.3579 456.2419 937.8303
0.085 28.4014 36.9438 45.6274 54.4178 63.2926 72.2363 81.2375 126.8661 457.2203 939.2392
0.090 28.6255 37.2010 45.9147 54.7328 63.6333 72.6010 81.6251 127.3537 458.1578 940.5887
0.095 28.8416 37.4490 46.1915 55.0361 63.9612 72.9522 81.9982 127.8228 459.0585 941.8847
0.100 29.0505 37.6886 46.4589 55.3289 64.2778 73.2911 82.3581 128.2751 459.9261 943.1326
0.900 51.8051 63.1671 74.3970 85.5270 96.5782 107.5650 118.4980 172.5812 540.9303 1057.7239
0.905 52.1140 63.5068 74.7645 85.9200 96.9950 108.0041 118.9582 173.1337 541.8982 1059.0721
0.910 52.4364 63.8612 75.1477 86.3298 97.4295 108.4618 119.4378 173.7094 542.9056 1060.4748
0.915 52.7738 64.2319 75.5485 86.7583 97.8836 108.9401 119.9390 174.3106 543.9568 1061.9380
0.920 53.1280 64.6208 75.9689 87.2076 98.3598 109.4415 120.4643 174.9404 545.0568 1063.4686
0.925 53.5010 65.0303 76.4113 87.6802 98.8606 109.9688 121.0166 175.6024 546.2118 1065.0750
0.930 53.8952 65.4629 76.8786 88.1794 99.3894 110.5255 121.5996 176.3007 547.4288 1066.7669
0.935 54.3139 65.9220 77.3743 88.7088 99.9502 111.1156 122.2176 177.0405 548.7166 1068.5566
0.940 54.7606 66.4118 77.9029 89.2731 100.5477 111.7444 122.8759 177.8281 550.0859 1070.4587
0.945 55.2401 66.9372 78.4698 89.8781 101.1882 112.4182 123.5812 178.6714 551.5503 1072.4918
0.950 55.7585 67.5048 79.0819 90.5312 101.8795 113.1453 124.3421 179.5806 553.1268 1074.6794
0.955 56.3235 68.1232 79.7486 91.2422 102.6317 113.9363 125.1698 180.5690 554.8379 1077.0526
0.960 56.9459 68.8039 80.4820 92.0241 103.4588 114.8057 126.0794 181.6541 556.7136 1079.6524
0.965 57.6402 69.5627 81.2992 92.8950 104.3797 115.7736 127.0916 182.8608 558.7956 1082.5362
0.970 58.4278 70.4230 82.2251 93.8813 105.4221 116.8688 128.2367 184.2247 561.1442 1085.7868
0.975 59.3417 71.4202 83.2977 95.0232 106.6286 118.1359 129.5612 185.8004 563.8515 1089.5309
0.980 60.4361 72.6133 84.5799 96.3875 108.0693 119.6485 131.1417 187.6785 567.0698 1093.9772
0.985 61.8117 74.1111 86.1883 98.0976 109.8741 121.5423 133.1197 190.0254 571.0789 1099.5095
0.990 63.6907 76.1539 88.3794 100.4252 112.3288 124.1163 135.8067 193.2077 576.4928 1106.9690
0.995 66.7660 79.4900 91.9517 104.2149 116.3211 128.2989 140.1695 198.3602 585.2066 1118.9481
D.7. DISTRIBUCIÓN F DE SNEDECOR 469
x m+n
m
Γ t 2 −1
Z
m n
FFm,n (x) = P (Fm,n ≤ x) = m
2 n m n
2 2 m+n dt = Fm,n,1−α
0 Γ 2 Γ 2 (n + mt) 2
m n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
1 3.2252 3.1765 3.1362 3.1022 3.0732 3.0481 3.0262 3.0070 2.9899 2.9747
2 2.8595 2.8068 2.7632 2.7265 2.6952 2.6682 2.6446 2.6239 2.6056 2.5893
3 2.6602 2.6055 2.5603 2.5222 2.4898 2.4618 2.4374 2.4160 2.3970 2.3801
4 2.5362 2.4801 2.4337 2.3947 2.3614 2.3327 2.3077 2.2858 2.2663 2.2489
5 2.4512 2.3940 2.3467 2.3069 2.2730 2.2438 2.2183 2.1958 2.1760 2.1582
6 2.3891 2.3310 2.2830 2.2426 2.2081 2.1783 2.1524 2.1296 2.1094 2.0913
7 2.3416 2.2828 2.2341 2.1931 2.1582 2.1280 2.1017 2.0785 2.0580 2.0397
8 2.3040 2.2446 2.1953 2.1539 2.1185 2.0880 2.0613 2.0379 2.0171 1.9985
9 2.2735 2.2135 2.1638 2.1220 2.0862 2.0553 2.0284 2.0047 1.9836 1.9649
10 2.2482 2.1878 2.1376 2.0954 2.0593 2.0281 2.0009 1.9770 1.9557 1.9367
11 2.2269 2.1660 2.1155 2.0729 2.0366 2.0051 1.9777 1.9535 1.9321 1.9129
12 2.2087 2.1474 2.0966 2.0537 2.0171 1.9854 1.9577 1.9333 1.9117 1.8924
13 2.1930 2.1313 2.0802 2.0370 2.0001 1.9682 1.9404 1.9158 1.8940 1.8745
14 2.1792 2.1173 2.0658 2.0224 1.9853 1.9532 1.9252 1.9004 1.8785 1.8588
15 2.1671 2.1049 2.0532 2.0095 1.9722 1.9399 1.9117 1.8868 1.8647 1.8449
16 2.1563 2.0938 2.0419 1.9981 1.9605 1.9281 1.8997 1.8747 1.8524 1.8325
17 2.1467 2.0839 2.0318 1.9878 1.9501 1.9175 1.8889 1.8638 1.8414 1.8214
18 2.1380 2.0750 2.0227 1.9785 1.9407 1.9079 1.8792 1.8539 1.8314 1.8113
19 2.1302 2.0670 2.0145 1.9701 1.9321 1.8992 1.8704 1.8450 1.8224 1.8022
20 2.1230 2.0597 2.0070 1.9625 1.9243 1.8913 1.8624 1.8368 1.8142 1.7938
21 2.1165 2.0530 2.0001 1.9555 1.9172 1.8840 1.8550 1.8294 1.8066 1.7862
22 2.1106 2.0469 1.9939 1.9490 1.9106 1.8774 1.8482 1.8225 1.7997 1.7792
23 2.1051 2.0412 1.9881 1.9431 1.9046 1.8712 1.8420 1.8162 1.7932 1.7727
24 2.1000 2.0360 1.9827 1.9377 1.8990 1.8656 1.8362 1.8103 1.7873 1.7667
25 2.0953 2.0312 1.9778 1.9326 1.8939 1.8603 1.8309 1.8049 1.7818 1.7611
26 2.0909 2.0267 1.9732 1.9279 1.8891 1.8554 1.8259 1.7999 1.7767 1.7559
27 2.0869 2.0225 1.9689 1.9235 1.8846 1.8508 1.8213 1.7951 1.7719 1.7510
28 2.0831 2.0186 1.9649 1.9194 1.8804 1.8466 1.8169 1.7907 1.7674 1.7465
29 2.0795 2.0149 1.9611 1.9155 1.8765 1.8426 1.8128 1.7866 1.7632 1.7422
30 2.0762 2.0115 1.9576 1.9119 1.8728 1.8388 1.8090 1.7827 1.7592 1.7382
m n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
1 2.9610 2.9486 2.9374 2.9271 2.9177 2.9091 2.9012 2.8938 2.8870 2.8807
2 2.5746 2.5613 2.5493 2.5383 2.5283 2.5191 2.5106 2.5028 2.4955 2.4887
3 2.3649 2.3512 2.3387 2.3274 2.3170 2.3075 2.2987 2.2906 2.2831 2.2761
4 2.2333 2.2193 2.2065 2.1949 2.1842 2.1745 2.1655 2.1571 2.1494 2.1422
5 2.1423 2.1279 2.1149 2.1030 2.0922 2.0822 2.0730 2.0645 2.0566 2.0492
6 2.0751 2.0605 2.0472 2.0351 2.0241 2.0139 2.0045 1.9959 1.9878 1.9803
7 2.0233 2.0084 1.9949 1.9826 1.9714 1.9610 1.9515 1.9427 1.9345 1.9269
8 1.9819 1.9668 1.9531 1.9407 1.9292 1.9188 1.9091 1.9001 1.8918 1.8841
9 1.9480 1.9327 1.9189 1.9063 1.8947 1.8841 1.8743 1.8652 1.8568 1.8490
10 1.9197 1.9043 1.8903 1.8775 1.8658 1.8550 1.8451 1.8359 1.8274 1.8195
11 1.8956 1.8801 1.8659 1.8530 1.8412 1.8303 1.8203 1.8110 1.8024 1.7944
12 1.8750 1.8593 1.8450 1.8319 1.8200 1.8090 1.7989 1.7895 1.7808 1.7727
13 1.8570 1.8411 1.8267 1.8136 1.8015 1.7904 1.7802 1.7708 1.7620 1.7538
14 1.8412 1.8252 1.8107 1.7974 1.7853 1.7741 1.7638 1.7542 1.7454 1.7371
15 1.8271 1.8111 1.7964 1.7831 1.7708 1.7596 1.7492 1.7395 1.7306 1.7223
16 1.8146 1.7984 1.7837 1.7703 1.7579 1.7466 1.7361 1.7264 1.7174 1.7090
17 1.8034 1.7871 1.7723 1.7587 1.7463 1.7349 1.7243 1.7146 1.7055 1.6970
18 1.7932 1.7768 1.7619 1.7483 1.7358 1.7243 1.7137 1.7039 1.6947 1.6862
19 1.7840 1.7675 1.7525 1.7388 1.7263 1.7147 1.7040 1.6941 1.6849 1.6763
20 1.7756 1.7590 1.7439 1.7302 1.7175 1.7059 1.6951 1.6852 1.6759 1.6673
21 1.7678 1.7512 1.7360 1.7222 1.7095 1.6978 1.6870 1.6770 1.6677 1.6590
22 1.7607 1.7440 1.7288 1.7149 1.7021 1.6904 1.6795 1.6695 1.6601 1.6514
23 1.7541 1.7374 1.7221 1.7081 1.6953 1.6835 1.6726 1.6625 1.6531 1.6443
24 1.7481 1.7312 1.7159 1.7019 1.6890 1.6771 1.6662 1.6560 1.6465 1.6377
25 1.7424 1.7255 1.7101 1.6960 1.6831 1.6712 1.6602 1.6500 1.6405 1.6316
26 1.7372 1.7202 1.7047 1.6906 1.6776 1.6657 1.6546 1.6444 1.6348 1.6259
27 1.7322 1.7152 1.6997 1.6855 1.6725 1.6605 1.6494 1.6391 1.6295 1.6206
28 1.7276 1.7106 1.6950 1.6808 1.6677 1.6556 1.6445 1.6342 1.6246 1.6156
29 1.7233 1.7062 1.6906 1.6763 1.6632 1.6511 1.6399 1.6295 1.6199 1.6109
30 1.7193 1.7021 1.6864 1.6721 1.6589 1.6468 1.6356 1.6252 1.6155 1.6065
D.7. DISTRIBUCIÓN F DE SNEDECOR 471
m n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
1 4.8443 4.7472 4.6672 4.6001 4.5431 4.4940 4.4513 4.4139 4.3807 4.3512
2 3.9823 3.8853 3.8056 3.7389 3.6823 3.6337 3.5915 3.5546 3.5219 3.4928
3 3.5874 3.4903 3.4105 3.3439 3.2874 3.2389 3.1968 3.1599 3.1274 3.0984
4 3.3567 3.2592 3.1791 3.1122 3.0556 3.0069 2.9647 2.9277 2.8951 2.8661
5 3.2039 3.1059 3.0254 2.9582 2.9013 2.8524 2.8100 2.7729 2.7401 2.7109
6 3.0946 2.9961 2.9153 2.8477 2.7905 2.7413 2.6987 2.6613 2.6283 2.5990
7 3.0123 2.9134 2.8321 2.7642 2.7066 2.6572 2.6143 2.5767 2.5435 2.5140
8 2.9480 2.8486 2.7669 2.6987 2.6408 2.5911 2.5480 2.5102 2.4768 2.4471
9 2.8962 2.7964 2.7144 2.6458 2.5876 2.5377 2.4943 2.4563 2.4227 2.3928
10 2.8536 2.7534 2.6710 2.6022 2.5437 2.4935 2.4499 2.4117 2.3779 2.3479
11 2.8179 2.7173 2.6347 2.5655 2.5068 2.4564 2.4126 2.3742 2.3402 2.3100
12 2.7876 2.6866 2.6037 2.5342 2.4753 2.4247 2.3807 2.3421 2.3080 2.2776
13 2.7614 2.6602 2.5769 2.5073 2.4481 2.3973 2.3531 2.3143 2.2800 2.2495
14 2.7386 2.6371 2.5536 2.4837 2.4244 2.3733 2.3290 2.2900 2.2556 2.2250
15 2.7186 2.6169 2.5331 2.4630 2.4034 2.3522 2.3077 2.2686 2.2341 2.2033
16 2.7009 2.5989 2.5149 2.4446 2.3849 2.3335 2.2888 2.2496 2.2149 2.1840
17 2.6851 2.5828 2.4987 2.4282 2.3683 2.3167 2.2719 2.2325 2.1977 2.1667
18 2.6709 2.5684 2.4841 2.4134 2.3533 2.3016 2.2567 2.2172 2.1823 2.1511
19 2.6581 2.5554 2.4709 2.4000 2.3398 2.2880 2.2429 2.2033 2.1683 2.1370
20 2.6464 2.5436 2.4589 2.3879 2.3275 2.2756 2.2304 2.1906 2.1555 2.1242
21 2.6358 2.5328 2.4479 2.3768 2.3163 2.2642 2.2189 2.1791 2.1438 2.1124
22 2.6261 2.5229 2.4379 2.3667 2.3060 2.2538 2.2084 2.1685 2.1331 2.1016
23 2.6172 2.5139 2.4287 2.3573 2.2966 2.2443 2.1987 2.1587 2.1233 2.0917
24 2.6090 2.5055 2.4202 2.3487 2.2878 2.2354 2.1898 2.1497 2.1141 2.0825
25 2.6014 2.4977 2.4123 2.3407 2.2797 2.2272 2.1815 2.1413 2.1057 2.0739
26 2.5943 2.4905 2.4050 2.3333 2.2722 2.2196 2.1738 2.1335 2.0978 2.0660
27 2.5877 2.4838 2.3982 2.3264 2.2652 2.2125 2.1666 2.1262 2.0905 2.0586
28 2.5816 2.4776 2.3918 2.3199 2.2587 2.2059 2.1599 2.1195 2.0836 2.0517
29 2.5759 2.4718 2.3859 2.3139 2.2525 2.1997 2.1536 2.1131 2.0772 2.0452
30 2.5705 2.4663 2.3803 2.3082 2.2468 2.1938 2.1477 2.1071 2.0712 2.0391
472 APÉNDICE D. TABLAS ESTADÍSTICAS
m n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
1 4.3248 4.3009 4.2793 4.2597 4.2417 4.2252 4.2100 4.1960 4.1830 4.1709
2 3.4668 3.4434 3.4221 3.4028 3.3852 3.3690 3.3541 3.3404 3.3277 3.3158
3 3.0725 3.0491 3.0280 3.0088 2.9912 2.9752 2.9604 2.9467 2.9340 2.9223
4 2.8401 2.8167 2.7955 2.7763 2.7587 2.7426 2.7278 2.7141 2.7014 2.6896
5 2.6848 2.6613 2.6400 2.6207 2.6030 2.5868 2.5719 2.5581 2.5454 2.5336
6 2.5727 2.5491 2.5277 2.5082 2.4904 2.4741 2.4591 2.4453 2.4324 2.4205
7 2.4876 2.4638 2.4422 2.4226 2.4047 2.3883 2.3732 2.3593 2.3463 2.3343
8 2.4205 2.3965 2.3748 2.3551 2.3371 2.3205 2.3053 2.2913 2.2783 2.2662
9 2.3660 2.3419 2.3201 2.3002 2.2821 2.2655 2.2501 2.2360 2.2229 2.2107
10 2.3210 2.2967 2.2747 2.2547 2.2365 2.2197 2.2043 2.1900 2.1768 2.1646
11 2.2829 2.2585 2.2364 2.2163 2.1979 2.1811 2.1655 2.1512 2.1379 2.1256
12 2.2504 2.2258 2.2036 2.1834 2.1649 2.1479 2.1323 2.1179 2.1045 2.0921
13 2.2222 2.1975 2.1752 2.1548 2.1362 2.1192 2.1035 2.0889 2.0755 2.0630
14 2.1975 2.1727 2.1502 2.1298 2.1111 2.0939 2.0781 2.0635 2.0500 2.0374
15 2.1757 2.1508 2.1282 2.1077 2.0889 2.0716 2.0558 2.0411 2.0275 2.0148
16 2.1563 2.1313 2.1086 2.0880 2.0691 2.0518 2.0358 2.0210 2.0073 1.9946
17 2.1389 2.1138 2.0910 2.0703 2.0513 2.0339 2.0179 2.0030 1.9893 1.9765
18 2.1232 2.0980 2.0751 2.0543 2.0353 2.0178 2.0017 1.9868 1.9730 1.9601
19 2.1090 2.0837 2.0608 2.0399 2.0207 2.0032 1.9870 1.9720 1.9581 1.9452
20 2.0960 2.0707 2.0476 2.0267 2.0075 1.9898 1.9736 1.9586 1.9446 1.9317
21 2.0842 2.0587 2.0356 2.0146 1.9953 1.9776 1.9613 1.9462 1.9322 1.9192
22 2.0733 2.0478 2.0246 2.0035 1.9842 1.9664 1.9500 1.9349 1.9208 1.9077
23 2.0633 2.0377 2.0144 1.9932 1.9738 1.9560 1.9396 1.9244 1.9103 1.8972
24 2.0540 2.0283 2.0050 1.9838 1.9643 1.9464 1.9299 1.9147 1.9005 1.8874
25 2.0454 2.0196 1.9963 1.9750 1.9554 1.9375 1.9210 1.9057 1.8915 1.8782
26 2.0374 2.0116 1.9881 1.9668 1.9472 1.9292 1.9126 1.8973 1.8830 1.8698
27 2.0299 2.0040 1.9805 1.9591 1.9395 1.9215 1.9048 1.8894 1.8751 1.8618
28 2.0229 1.9970 1.9734 1.9520 1.9323 1.9142 1.8975 1.8821 1.8677 1.8544
29 2.0164 1.9904 1.9668 1.9453 1.9255 1.9074 1.8907 1.8752 1.8608 1.8474
30 2.0102 1.9842 1.9605 1.9390 1.9192 1.9010 1.8842 1.8687 1.8543 1.8409
D.7. DISTRIBUCIÓN F DE SNEDECOR 473
m n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
1 6.7241 6.5538 6.4143 6.2979 6.1995 6.1151 6.0420 5.9781 5.9216 5.8715
2 5.2559 5.0959 4.9653 4.8567 4.7650 4.6867 4.6189 4.5597 4.5075 4.4613
3 4.6300 4.4742 4.3472 4.2417 4.1528 4.0768 4.0112 3.9539 3.9034 3.8587
4 4.2751 4.1212 3.9959 3.8919 3.8043 3.7294 3.6648 3.6083 3.5587 3.5147
5 4.0440 3.8911 3.7667 3.6634 3.5764 3.5021 3.4379 3.3820 3.3327 3.2891
6 3.8807 3.7283 3.6043 3.5014 3.4147 3.3406 3.2767 3.2209 3.1718 3.1283
7 3.7586 3.6065 3.4827 3.3799 3.2934 3.2194 3.1556 3.0999 3.0509 3.0074
8 3.6638 3.5118 3.3880 3.2853 3.1987 3.1248 3.0610 3.0053 2.9563 2.9128
9 3.5879 3.4358 3.3120 3.2093 3.1227 3.0488 2.9849 2.9291 2.8801 2.8365
10 3.5257 3.3736 3.2497 3.1469 3.0602 2.9862 2.9222 2.8664 2.8172 2.7737
11 3.4737 3.3215 3.1975 3.0946 3.0078 2.9337 2.8696 2.8137 2.7645 2.7209
12 3.4296 3.2773 3.1532 3.0502 2.9633 2.8890 2.8249 2.7689 2.7196 2.6758
13 3.3917 3.2393 3.1150 3.0119 2.9249 2.8506 2.7863 2.7302 2.6808 2.6369
14 3.3588 3.2062 3.0819 2.9786 2.8915 2.8170 2.7526 2.6964 2.6469 2.6030
15 3.3299 3.1772 3.0527 2.9493 2.8621 2.7875 2.7230 2.6667 2.6171 2.5731
16 3.3044 3.1515 3.0269 2.9234 2.8360 2.7614 2.6968 2.6404 2.5907 2.5465
17 3.2816 3.1286 3.0039 2.9003 2.8128 2.7380 2.6733 2.6168 2.5670 2.5228
18 3.2612 3.1081 2.9832 2.8795 2.7919 2.7170 2.6522 2.5956 2.5457 2.5014
19 3.2428 3.0896 2.9646 2.8607 2.7730 2.6980 2.6331 2.5764 2.5265 2.4821
20 3.2261 3.0728 2.9477 2.8437 2.7559 2.6808 2.6158 2.5590 2.5089 2.4645
21 3.2109 3.0575 2.9322 2.8282 2.7403 2.6651 2.6000 2.5431 2.4930 2.4484
22 3.1970 3.0434 2.9181 2.8139 2.7260 2.6507 2.5855 2.5285 2.4783 2.4337
23 3.1843 3.0306 2.9052 2.8009 2.7128 2.6374 2.5721 2.5151 2.4648 2.4201
24 3.1725 3.0187 2.8932 2.7888 2.7006 2.6252 2.5598 2.5027 2.4523 2.4076
25 3.1616 3.0077 2.8821 2.7777 2.6894 2.6138 2.5484 2.4912 2.4408 2.3959
26 3.1516 2.9976 2.8719 2.7673 2.6790 2.6033 2.5378 2.4806 2.4300 2.3851
27 3.1422 2.9881 2.8623 2.7577 2.6692 2.5935 2.5280 2.4706 2.4200 2.3751
28 3.1334 2.9793 2.8534 2.7487 2.6602 2.5844 2.5187 2.4613 2.4107 2.3657
29 3.1253 2.9710 2.8451 2.7403 2.6517 2.5758 2.5101 2.4527 2.4019 2.3569
30 3.1176 2.9633 2.8372 2.7324 2.6437 2.5678 2.5020 2.4445 2.3937 2.3486
474 APÉNDICE D. TABLAS ESTADÍSTICAS
m n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
1 5.8266 5.7863 5.7498 5.7166 5.6864 5.6586 5.6331 5.6096 5.5878 5.5675
2 4.4199 4.3828 4.3492 4.3187 4.2909 4.2655 4.2421 4.2205 4.2006 4.1821
3 3.8188 3.7829 3.7505 3.7211 3.6943 3.6697 3.6472 3.6264 3.6072 3.5894
4 3.4754 3.4401 3.4083 3.3794 3.3530 3.3289 3.3067 3.2863 3.2674 3.2499
5 3.2501 3.2151 3.1835 3.1548 3.1287 3.1048 3.0828 3.0626 3.0438 3.0265
6 3.0895 3.0546 3.0232 2.9946 2.9685 2.9447 2.9228 2.9027 2.8840 2.8667
7 2.9686 2.9338 2.9023 2.8738 2.8478 2.8240 2.8021 2.7820 2.7633 2.7460
8 2.8740 2.8392 2.8077 2.7791 2.7531 2.7293 2.7074 2.6872 2.6686 2.6513
9 2.7977 2.7628 2.7313 2.7027 2.6766 2.6528 2.6309 2.6106 2.5919 2.5746
10 2.7348 2.6998 2.6682 2.6396 2.6135 2.5896 2.5676 2.5473 2.5286 2.5112
11 2.6819 2.6469 2.6152 2.5865 2.5603 2.5363 2.5143 2.4940 2.4752 2.4577
12 2.6368 2.6017 2.5699 2.5411 2.5149 2.4908 2.4688 2.4484 2.4295 2.4120
13 2.5978 2.5626 2.5308 2.5019 2.4756 2.4515 2.4293 2.4089 2.3900 2.3724
14 2.5638 2.5285 2.4966 2.4677 2.4413 2.4171 2.3949 2.3743 2.3554 2.3378
15 2.5338 2.4984 2.4665 2.4374 2.4110 2.3867 2.3644 2.3438 2.3248 2.3072
16 2.5071 2.4717 2.4396 2.4105 2.3840 2.3597 2.3373 2.3167 2.2976 2.2799
17 2.4833 2.4478 2.4157 2.3865 2.3599 2.3355 2.3131 2.2924 2.2732 2.2554
18 2.4618 2.4262 2.3940 2.3648 2.3381 2.3137 2.2912 2.2704 2.2512 2.2334
19 2.4424 2.4067 2.3745 2.3452 2.3184 2.2939 2.2713 2.2505 2.2313 2.2134
20 2.4247 2.3890 2.3567 2.3273 2.3005 2.2759 2.2533 2.2324 2.2131 2.1952
21 2.4086 2.3728 2.3404 2.3109 2.2840 2.2594 2.2367 2.2158 2.1965 2.1785
22 2.3938 2.3579 2.3254 2.2959 2.2690 2.2443 2.2216 2.2006 2.1812 2.1631
23 2.3801 2.3442 2.3116 2.2821 2.2551 2.2303 2.2076 2.1865 2.1671 2.1490
24 2.3675 2.3315 2.2989 2.2693 2.2422 2.2174 2.1946 2.1735 2.1540 2.1359
25 2.3558 2.3198 2.2871 2.2574 2.2303 2.2054 2.1826 2.1615 2.1419 2.1237
26 2.3450 2.3088 2.2761 2.2464 2.2192 2.1943 2.1714 2.1502 2.1306 2.1124
27 2.3348 2.2986 2.2659 2.2361 2.2089 2.1839 2.1609 2.1397 2.1201 2.1018
28 2.3254 2.2891 2.2563 2.2265 2.1992 2.1742 2.1512 2.1299 2.1102 2.0919
29 2.3165 2.2802 2.2473 2.2174 2.1901 2.1651 2.1420 2.1207 2.1010 2.0827
30 2.3082 2.2718 2.2389 2.2090 2.1816 2.1565 2.1334 2.1121 2.0923 2.0739
D.7. DISTRIBUCIÓN F DE SNEDECOR 475
m n =11 n =12 n =13 n =14 n =15 n =16 n =17 n =18 n =19 n =20
1 9.6460 9.3302 9.0738 8.8616 8.6831 8.5310 8.3997 8.2854 8.1849 8.0960
2 7.2057 6.9266 6.7010 6.5149 6.3589 6.2262 6.1121 6.0129 5.9259 5.8489
3 6.2167 5.9525 5.7394 5.5639 5.4170 5.2922 5.1850 5.0919 5.0103 4.9382
4 5.6683 5.4120 5.2053 5.0354 4.8932 4.7726 4.6690 4.5790 4.5003 4.4307
5 5.3160 5.0643 4.8616 4.6950 4.5556 4.4374 4.3359 4.2479 4.1708 4.1027
6 5.0692 4.8206 4.6204 4.4558 4.3183 4.2016 4.1015 4.0146 3.9386 3.8714
7 4.8861 4.6395 4.4410 4.2779 4.1415 4.0259 3.9267 3.8406 3.7653 3.6987
8 4.7445 4.4994 4.3021 4.1399 4.0045 3.8896 3.7910 3.7054 3.6305 3.5644
9 4.6315 4.3875 4.1911 4.0297 3.8948 3.7804 3.6822 3.5971 3.5225 3.4567
10 4.5393 4.2961 4.1003 3.9394 3.8049 3.6909 3.5931 3.5082 3.4338 3.3682
11 4.4624 4.2198 4.0245 3.8640 3.7299 3.6162 3.5185 3.4338 3.3596 3.2941
12 4.3974 4.1553 3.9603 3.8001 3.6662 3.5527 3.4552 3.3706 3.2965 3.2311
13 4.3416 4.0999 3.9052 3.7452 3.6115 3.4981 3.4007 3.3162 3.2422 3.1769
14 4.2932 4.0518 3.8573 3.6975 3.5639 3.4506 3.3533 3.2689 3.1949 3.1296
15 4.2509 4.0096 3.8154 3.6557 3.5222 3.4089 3.3117 3.2273 3.1533 3.0880
16 4.2134 3.9724 3.7783 3.6187 3.4852 3.3720 3.2748 3.1904 3.1165 3.0512
17 4.1801 3.9392 3.7452 3.5857 3.4523 3.3391 3.2419 3.1575 3.0836 3.0183
18 4.1503 3.9095 3.7156 3.5561 3.4228 3.3096 3.2124 3.1280 3.0541 2.9887
19 4.1234 3.8827 3.6888 3.5294 3.3961 3.2829 3.1857 3.1013 3.0274 2.9620
20 4.0990 3.8584 3.6646 3.5052 3.3719 3.2587 3.1615 3.0771 3.0031 2.9377
21 4.0769 3.8363 3.6425 3.4832 3.3498 3.2367 3.1394 3.0550 2.9810 2.9156
22 4.0566 3.8161 3.6224 3.4630 3.3297 3.2165 3.1192 3.0348 2.9607 2.8953
23 4.0380 3.7976 3.6038 3.4445 3.3111 3.1979 3.1006 3.0161 2.9421 2.8766
24 4.0209 3.7805 3.5868 3.4274 3.2940 3.1808 3.0835 2.9990 2.9249 2.8594
25 4.0051 3.7647 3.5710 3.4116 3.2782 3.1650 3.0676 2.9831 2.9089 2.8434
26 3.9904 3.7500 3.5563 3.3969 3.2635 3.1503 3.0529 2.9683 2.8941 2.8286
27 3.9768 3.7364 3.5427 3.3833 3.2499 3.1366 3.0392 2.9546 2.8804 2.8148
28 3.9641 3.7237 3.5300 3.3706 3.2372 3.1238 3.0264 2.9418 2.8675 2.8019
29 3.9522 3.7119 3.5182 3.3587 3.2253 3.1119 3.0145 2.9298 2.8555 2.7898
30 3.9411 3.7008 3.5070 3.3476 3.2141 3.1007 3.0032 2.9185 2.8442 2.7785
476 APÉNDICE D. TABLAS ESTADÍSTICAS
m n =21 n =22 n =23 n =24 n =25 n =26 n =27 n =28 n =29 n =30
1 8.0166 7.9454 7.8811 7.8229 7.7698 7.7213 7.6767 7.6356 7.5977 7.5625
2 5.7804 5.7190 5.6637 5.6136 5.5680 5.5263 5.4881 5.4529 5.4204 5.3903
3 4.8740 4.8166 4.7649 4.7181 4.6755 4.6366 4.6009 4.5681 4.5378 4.5097
4 4.3688 4.3134 4.2636 4.2184 4.1774 4.1400 4.1056 4.0740 4.0449 4.0179
5 4.0421 3.9880 3.9392 3.8951 3.8550 3.8183 3.7848 3.7539 3.7254 3.6990
6 3.8117 3.7583 3.7102 3.6667 3.6272 3.5911 3.5580 3.5276 3.4995 3.4735
7 3.6396 3.5867 3.5390 3.4959 3.4568 3.4210 3.3882 3.3581 3.3303 3.3045
8 3.5056 3.4530 3.4057 3.3629 3.3239 3.2884 3.2558 3.2259 3.1982 3.1726
9 3.3981 3.3458 3.2986 3.2560 3.2172 3.1818 3.1494 3.1195 3.0920 3.0665
10 3.3098 3.2576 3.2106 3.1681 3.1294 3.0941 3.0618 3.0320 3.0045 2.9791
11 3.2359 3.1837 3.1368 3.0944 3.0558 3.0205 2.9882 2.9585 2.9311 2.9057
12 3.1730 3.1209 3.0740 3.0316 2.9931 2.9578 2.9256 2.8959 2.8685 2.8431
13 3.1187 3.0667 3.0199 2.9775 2.9389 2.9038 2.8715 2.8418 2.8144 2.7890
14 3.0715 3.0195 2.9727 2.9303 2.8917 2.8566 2.8243 2.7946 2.7672 2.7418
15 3.0300 2.9779 2.9311 2.8887 2.8502 2.8150 2.7827 2.7530 2.7256 2.7002
16 2.9931 2.9411 2.8943 2.8519 2.8133 2.7781 2.7458 2.7160 2.6886 2.6632
17 2.9602 2.9082 2.8613 2.8189 2.7803 2.7451 2.7127 2.6830 2.6555 2.6301
18 2.9306 2.8786 2.8317 2.7892 2.7506 2.7153 2.6830 2.6532 2.6257 2.6003
19 2.9039 2.8518 2.8049 2.7624 2.7238 2.6885 2.6561 2.6263 2.5987 2.5732
20 2.8796 2.8274 2.7805 2.7380 2.6993 2.6640 2.6316 2.6017 2.5742 2.5487
21 2.8574 2.8052 2.7583 2.7157 2.6770 2.6416 2.6092 2.5793 2.5517 2.5262
22 2.8370 2.7849 2.7378 2.6953 2.6565 2.6211 2.5887 2.5587 2.5311 2.5055
23 2.8183 2.7661 2.7191 2.6765 2.6377 2.6022 2.5697 2.5398 2.5121 2.4865
24 2.8010 2.7488 2.7017 2.6591 2.6203 2.5848 2.5522 2.5223 2.4946 2.4689
25 2.7850 2.7328 2.6856 2.6430 2.6041 2.5686 2.5360 2.5060 2.4783 2.4526
26 2.7702 2.7179 2.6707 2.6280 2.5891 2.5536 2.5209 2.4909 2.4631 2.4374
27 2.7563 2.7040 2.6568 2.6140 2.5751 2.5395 2.5069 2.4768 2.4490 2.4233
28 2.7434 2.6910 2.6438 2.6010 2.5620 2.5264 2.4937 2.4636 2.4358 2.4100
29 2.7313 2.6789 2.6316 2.5888 2.5498 2.5141 2.4814 2.4513 2.4234 2.3976
30 2.7200 2.6675 2.6202 2.5773 2.5383 2.5026 2.4699 2.4397 2.4118 2.3860
Referencias
Blanco, L. (2004), Probabilidad, Unibiblos. 6.5.2, 24, 26, 9.4, 9.4, 9.4, 9.5, 9.6, 10.6, 12, 6, 11.3.1, B.1
Freund, J., Miller, I. & Miller, M. (2000), Estadística matemática con aplicaciones, Prentice Hall.
10.3.5
Genz, A. & Bretz, F. (2009), Computation of Multivariate Normal and t Probabilities, Lecture Notes
in Statistics, Springer-Verlag, Heidelberg. 11.3.7
Genz, A., Bretz, F., Miwa, T., Mi, X., Leisch, F., Scheipl, F. & Hothorn, T. (2012), mvtnorm: Multi-
variate Normal and t Distributions. R package version 0.9-9992.
URL: http://CRAN.R-project.org/package=mvtnorm 11.3.7
Hogg, R., McKean, J. & Craig, A. (2005), Introduction to Mathematical Statistics, sixth edn, Prentice
Hall. 7.9, iii
Mendenhall, W., Beaver, R. & Beaver, B. (2008), Introducción a la probabilidad y estadística, décimo
segunda edición edn, Cengage Learning.
Purcell, E. & Varberg, D. (1993), Cálculo con geometría analítica, Pearson. C.6
R Core Team (2012), R: A Language and Environment for Statistical Computing, R Foundation for
Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.
URL: http://www.R-project.org/ 11.3.7
477
478 REFERENCIAS
Ross, S. (1998), A First Course in Probability, Fifth Edition edn, Prentice Hall. 9.5, 9.6, 10.3.1
Rudin, W. (1976), Elements of Mathematical Analisys, third edn, McGraw Hill. 8.3, 1
Sarabia, J., Gómez, E. & Vázquez, F. (2007), Estadística actuarial. Teoría y aplicaciones, Pearson.
10.6
Soong, T. (2004), Fundamentals of Probability and Statistics for Engineers, John Wiley & Sons. 13,
15, 18
Sturges, H. A. (1926), `The choice of a class interval', Journal of the American Statistical Association
21(153), 6566. 1iii
479
480 ÍNDICE TEMÁTICO
imagen método
recortada, 63 ojiva, 29
mediana, 47, 206 operaciones aritméticas, 354
medible, 7 origen, 415
medición, 9 outlier, 68
medida outliers, 46
relativa, 82
robusta, 49, 67 parámetro, 6, 208
moda, 49 pictograma, 31
muestra, 6 de frecuencias, 29
no probabilística, 6 suavizado, 92
probabilística, 6 ponderación, 46
probabilístico, 6 principio
muestral, 6 de Sturges, 23
poblacional, 6 del límite
propiedad de la potencia, 423
asociativa de un cociente, 422
de la suma, 354 de un producto, 422
del producto, 355 de una diferencia, 423
conmutativa de una función constante, 422
de la suma, 354 de una suma, 422
del producto, 354 del múltiplo constante, 422
distributiva, 355 del trapecio, 448
punto empírica, 81
muestral, 141 regularidad
estadística, 148
radical, 357
rango, 23, 55, 65, 187 saber, 2
de una función, 413 cientíco, 2
intercuartílico, 66, 67 cotidiano, 2
razón, 360 segundo miembro, 372
realización de una variable, 42 sesgo, 91
recolección simetría, 92
de la información, 14 sistema de ecuaciones de primer grado
recorrido, 23 con n incógnitas, 376
regla con dos incógnitas, 374
de Barrow, 440 soporte, 331
de Cramer, 375 subconjunto, 400
de L'Hôpital, 437 propio, 400
de la cadena, 433 suceso
de la derivada aleatorio, 141
de potencias, 429 suma de
de un cociente, 430 Riemann, 438
de un producto, 430 sumatoria, 383
de una diferencia, 430
de una función constante, 429 término independiente, 364, 372
de una suma, 430 tabla
del múltiplo constante, 429 de clasicación, 21, 105
de la integración de contingencia, 105
de la aditividad, 442 de doble entrada, 104, 105
de la dominación, 442 tasa, 50
orden de, 441 teorema
de la integral de Bayes, 173
de una diferencia, 442 de Chebyshev, 79, 80, 227
de una suma, 441 de la multiplicación, 169
del múltiplo constante, 441 de la probabilidad total, 171
sobre un punto, 441 de Markov, 227
de Simpson, 448 de Moivre-Laplace, 300
ÍNDICE TEMÁTICO 485
valor
esperado, 208
valor absoluto, 395
variabilidad, 72
variable, 7
adimensional, 78
aleatoria, 186
continua, 186
discreta, 186
auxiliar, 7
bidimensional, 109
cualitativa, 7
cuantitativa, 8
continua, 8
discreta, 8
dependiente, 109, 412
estandarizada, 78
independiente, 109, 412
latente, 7
longitudinal, 8
tipicada, 78
transversal, 8
variables
aleatoria, 185
conmensurables, 44
independientes, 342
varianza, 71, 72, 219