Anda di halaman 1dari 56

Probabilidad y Estadística

Guía de ejercicios – 2017

Juan Olivares
Copyright
c 2017 Juan Olivares

P UBLICADO POR J UAN O LIVARES

HTTP :// WWW. UDA . CL

Primera impresión, Marzo 2017


Índice general

I Probabilidad
1 Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1 Espacio muestral y eventos 7
1.2 Técnicas de conteo 7
1.3 Probabilidad de un evento 8
1.4 Probabilidad condicional 9
1.5 Regla de Bayes 10
1.6 Ejercicios 10

2 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1 Concepto de variables aleatorias 15
2.2 Distribuciones de probabilidad discretas 15
2.3 Distribuciones de probabilidad continuas 15
2.4 Distribución de probabilidad conjunta 15
2.5 Independencia de variables aleatorias 16
2.6 Esperanza matemática 17
2.7 Ejercicios 20

3 Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1 Proceso Bernoulli 27
3.2 Distribución binomial 27
3.3 Distribución geométrica 27
3.4 Distribución binomial-negativa 28
3.5 Distribución hipergeométrica 28
3.6 Distribución de Poisson 29
3.7 Ejercicios 29

4 Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.1 Distribución uniforme continua 33
4.2 Distribución normal 33
4.3 Distribución exponencial 34
4.4 Distribución gamma 34
4.5 Distribución χ 2 34
4.6 Distribución beta 34
4.7 Distribución log-normal 35
4.8 Distribución Weibull 35
4.9 Distribución t-student 36
4.10 Distribución F 36
4.11 Ejercicios 37

II Estadística
5 Estimación puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.1 Conceptos generales 43
5.2 Métodos de estimación puntual 44
5.3 Ejercicios 44

6 Estimación por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47


6.1 Estimación de la media 47
6.2 Estimación de la diferencia entre dos medias 48
6.3 Estimación de la proporción 49
6.4 Estimación de la diferencia de dos proporciones 49
6.5 Estimación de la varianza 50
6.6 Estimación de la proporción de varianzas 50
6.7 Ejercicios 50

7 Pruebas de hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
7.1 Conceptos generales 53
7.2 Pruebas sobre la media 54
7.3 Ejercicios 54
I
Probabilidad

1 Probabilidades . . . . . . . . . . . . . . . . . . . . 7
1.1 Espacio muestral y eventos
1.2 Técnicas de conteo
1.3 Probabilidad de un evento
1.4 Probabilidad condicional
1.5 Regla de Bayes
1.6 Ejercicios

2 Variables aleatorias . . . . . . . . . . . . . . 15
2.1 Concepto de variables aleatorias
2.2 Distribuciones de probabilidad discretas
2.3 Distribuciones de probabilidad continuas
2.4 Distribución de probabilidad conjunta
2.5 Independencia de variables aleatorias
2.6 Esperanza matemática
2.7 Ejercicios

3 Distribuciones discretas . . . . . . . . . 27
3.1 Proceso Bernoulli
3.2 Distribución binomial
3.3 Distribución geométrica
3.4 Distribución binomial-negativa
3.5 Distribución hipergeométrica
3.6 Distribución de Poisson
3.7 Ejercicios

4 Distribuciones continuas . . . . . . . . 33
4.1 Distribución uniforme continua
4.2 Distribución normal
4.3 Distribución exponencial
4.4 Distribución gamma
4.5 Distribución χ 2
4.6 Distribución beta
4.7 Distribución log-normal
4.8 Distribución Weibull
4.9 Distribución t-student
4.10 Distribución F
4.11 Ejercicios
1. Probabilidades

1.1 Espacio muestral y eventos


Definición 1.1.1 — Espacio muestral. Al conjunto de todos los resultados posibles de un experi-
mento aleatorio se le llama espacio muestral y se representa con el símbolo Ω.

Definición 1.1.2 — Evento. Un evento es un subconjunto de resultados contenidos en el espacio


muestral Ω. Un evento es simple si consiste en exactamente un resultado y compuesto si consiste en
más de un resultado.
Definición 1.1.3 Algunas relaciones de la teoría de conjuntos:
1. El complemento de un evento, denotado por Ac , es el conjunto de todos los resultados en Ω que
no están contenidos en A.
2. La unión de dos eventos A y B, denotados por A ∪ B y leídos “A o B”, es el evento que consiste en
todos los resultados que están en A o en B o en ambos eventos (de tal manera que la unión incluya
resultados donde tanto A como B ocurren, así también resultados donde ocurre exactamente uno),
es decir, todos los resultados en por lo menos uno de los eventos.
3. La intersección de dos eventos A y B, denotada A ∩ B y leída “A y B”, es el evento que consiste
en todos los resultados que están tanto en A como en B.

Definición 1.1.4 Que 0/ denote el evento nulo (el evento sin resultados). Dos eventos A y B son
mutuamente excluyentes o disjuntos si A ∩ B = 0;
/ es decir, si A y B no tienen elementos en común.

1.2 Técnicas de conteo


Definición 1.2.1 — Principio de multiplicación. Si una operación se puede ejecutar en n1 formas, y
si para cada una de éstas se puede llevar a cabo una segunda operación en n2 formas, y para cada una
de las primeras dos se puede realizar una tercera operación en n3 formas, y así sucesivamente, entonces
la serie de k operaciones se puede realizar en n1 n2 · · · nk .

Definición 1.2.2 Una permutación es una arreglo de todo o parte de un conjunto de objetos.

Definición 1.2.3 Para cualquier entero no negativo n, n!, denominado “n factorial” se define como

n! = n(n − 1)(n − 2) · · · 2 · 1,

con el caso especial de 0! = 1.

Teorema 1.2.1 El número de permutaciones de n objetos es n!.


8 Capítulo 1. Probabilidades

Teorema 1.2.2 El número de permutaciones de n objetos distintos tomados de r a la vez es

n!
n Pr = .
(n − r)!

Teorema 1.2.3 El número de permutaciones de n objetos ordenados en un círculo es (n − 1)!.

Teorema 1.2.4 El número de permutaciones distintas de n objetos, en el que n1 son de una clase, n2 de
una segunda clase, . . . , nk de una k-ésima clase es
n!
.
n1 !n2 ! · · · nk !

Teorema 1.2.5 El número de formas de partir un conjunto de n objetos en r celdas con n1 elementos
en la primera celda, n2 elementos en la segunda, y así sucesivamente, es
 
n n!
= ,
n1 , n2 , . . . , nr n1 !n2 ! · · · nr !

donde n1 + n2 + · · · + nr = n.

Teorema 1.2.6 El número de combinaciones de n objetos distintos tomados de r a la vez es


 
n n!
= .
r r!(n − r)!

1.3 Probabilidad de un evento


Axioma 1.3.1 Axiomas de Kolmogorov:
1. Para cualquier evento A, P(A) ≥ 0.
2. P(Ω) = 1.
3. Si A1 , A2 , A3 , . . . es un conjunto de eventos mutuamente excluyentes, entonces

P(A1 ∪ A2 ∪ A3 ∪ · · · ) = ∑ P(Ai ).
i=1

/ = 0, donde 0/ es el evento nulo (el evento que no contiene resultados en absoluto).


Proposición 1.3.2 P(0)
Esto a su vez implica que la propiedad contenida en el axioma 3 es válida para un conjunto finito de
eventos.
Proposición 1.3.3 Para cualquier evento A, P(A) + P(Ac ) = 1, a partir de la cual P(A) = 1 − P(Ac ).
Proposición 1.3.4 Para cualquier evento A, P(A) ≤ 1.

Teorema 1.3.5 Para dos eventos cualesquiera A y B,

P(A ∪ B) = P(A) + P(B) − P(A ∩ B).


1.4 Probabilidad condicional 9

Corolario 1.3.6 Si A y B son mutuamente excluyentes, entonces

P(A ∪ B) = P(A) + P(B).

Corolario 1.3.7 Si A1 , A2 , . . . , An son mutuamente excluyentes, entonces

P(A1 ∪ A2 ∪ · · · ∪ An ) = P(A1 ) + P(A2 ) + · · · + P(An ).

Teorema 1.3.8 Para tres eventos cualesquiera A, B y C,

P(A ∪ B ∪C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩C) − P(B ∩C) + P(A ∩ B ∩C).

1.4 Probabilidad condicional


Definición 1.4.1 La probabilidad condicional de B, dado A, que se denota por P(B|A), se define como

P(A ∩ B)
P(B|A) = , siempre que P(A) > 0.
P(A)

Definición 1.4.2 Dos eventos A y B son independientes si y sólo si

P(B|A) = P(B), o P(A|B) = P(A),

si se asume la existencia de la probabilidad condicional. De otra forma, A y B son dependientes.

Teorema 1.4.1 Si en un experimento pueden ocurrir los eventos A y B, entonces

P(A ∩ B) = P(A)P(B|A), siempre que P(A) > 0.

Teorema 1.4.2 Dos eventos A y B son independientes si y sólo si

P(A ∩ B) = P(A)P(B).

Por lo tanto, para obtener la probabilidad de que ocurran dos eventos independientes simplemente
calculamos el producto de sus probabilidades individuales.

Teorema 1.4.3 Si, en un experimento, pueden ocurrir los eventos A1 , A2 , . . . , An , entonces

P(A1 ∩ A2 ∩ · · · ∩ An ) = P(A1 )P(A2 |A1 )P(A3 |A1 ∩ A2 ) · · · P(An |A1 ∩ A2 ∩ · · · An−1 ).

Si los eventos A1 , A2 , . . . , An son independientes, entonces

P(A1 ∩ A2 ∩ · · · ∩ An ) = P(A1 )P(A2 ) · · · P(An ).


10 Capítulo 1. Probabilidades

1.5 Regla de Bayes


Teorema 1.5.1 — Ley de probabilidad total. Si los eventos B1 , B2 , . . . , Bn constituyen una partición
del espacio muestral Ω, tal que P(Bi ) > 0 para i = 1, 2, . . . , n, entonces, para cualquier evento A de Ω,
n n
P(A) = ∑ P(Bi ∩ A) = ∑ P(Bi )P(A|Bi ).
i=1 i=1

Teorema 1.5.2 — Regla de Bayes. Si los eventos B1 , B2 , . . . , Bn constituyen una partición del espacio
muestral Ω, donde P(Bi ) > 0 para i = 1, 2, . . . , n, entonces, para cualquier evento A de Ω, tal que
P(A) > 0,

P(Br ∩ A) P(Br )P(A|Br )


P(Br |A) = n = n , para r = 1, 2, . . . , n.
∑i=1 P(Bi ∩ A) ∑i=1 P(Bi )P(A|Bi )

1.6 Ejercicios
1. Sea P(A) = 0,59, P(B) = 0,30 y P(A ∩ B) = 0,21, gen de un sistema de coordenadas cartesianas en el
calcule las siguientes probabilidades: a) P(A ∩ Bc ). plano. Lanza una moneda. En cada lanzamiento, si
b) P(Ac ∪ Bc ). c) P(Ac ∩ Bc ). obtiene una “cara” avanza una unidad hacia arriba;
2. Los empleados de cierta compañía se encuentran se- si obtiene un “sello” avanza una unidad hacia la
parados en tres divisiones. La siguiente tabla indica derecha. Determine la probabilidad que al cabo de
el número de empleados en cada división clasifica- 4 lanzamientos se encuentre en el punto (2, 2).
dos por sexo. 5. En un pueblo de n + 1 habitantes, una persona dice
un rumor a otra quien a su vez se lo repite a una
Sexo tercera persona y así sucesivamente. En cada pa-
División Mujer Hombre so el receptor del rumor es elegido al azar entre n
Administración 20 30 personas.
Operación planta 60 140
a) Describa en palabras el espacio muestral aso-
Ventas 100 50
ciado a este experimento.
Se selecciona un empleado aleatoriamente. Calcule b) Encuentre la probabilidad de que el rumor se
la probabilidad de que: transmite exactamente r veces antes de que
a) Trabaje en ventas o sea mujer. retorne a su iniciador.
b) Sea hombre y no trabaje en operación planta. c) Encuentre la probabilidad de que el rumor se
c) No sea mujer y no trabaje en ventas. transmite exactamente r veces, sin ser repeti-
3. Un químico analiza muestras de agua de mar para do a ninguna persona.
detectar la presencia de dos metales pesados: plomo 6. Calcule la probabilidad de que en un conjunto de
y mercurio. Encuentra que el 38 % de las muestras n personas, al menos dos de ellas tengan la misma
tomadas en las proximidades de la desembocadura fecha de cumpleaños. Además, determine el valor
de un río, en cuyas orillas se localizan numerosas de n, en forma aproximada, para que la probabili-
plantas industriales, tiene niveles tóxicos de plomo dad anterior sea mayor que 50 %. Sugerencia: no
o de mercurio, y que el 32 % tiene nivel tóxico de considere la existencia de años bisiestos y ni las
plomo. De estas muestras, el 10 % contiene un nivel personas gemelas.
tóxico de ambos metales. Calcule la probabilidad 7. Un lote consta de 14 artículos buenos, 4 con defec-
de que una muestra dada contenga niveles tóxicos: tos pequeños y 2 con defectos graves. Se eligen 3
a) Sólo de mercurio. artículos al azar y sin reposición. Calcule la proba-
b) De plomo pero no de mercurio. bilidad de que:
4. Suponga que una persona está ubicada en el ori- a) Todos los artículos sean buenos.
1.6 Ejercicios 11

b) Uno de cada tipo sean seleccionados. de que él o ella también pague oportunamente el
c) Por lo menos uno sea bueno. siguiente mes; sin embargo, si un cliente no paga
8. Se lanza una moneda al aire una vez. Entonces, si oportunamente en un mes, la probabilidad de que
cae “cara”, se lanza un dado una vez, si cae “se- él o ella pague oportunamente el siguiente mes es
llo”, la moneda se lanza dos veces más. Utilice la solamente 0,40. Suponga que el pago oportuno o
notación en la que (C, 2), por ejemplo, denota el no en un mes, depende solamente del mes anterior.
evento de que la moneda cae “cara” y entonces el Calcule la probabilidad de que:
dado cae en 2, y (S, S, S) denota el evento de que la a) Un cliente que paga oportunamente en un mes
moneda cae en “sello” tres veces seguidas. Calcule también pagará oportunamente los tres meses
la probabilidad de que se obtenga: siguientes.
a) Exactamente una “cara”. b) Un cliente que no paga oportunamente en un
b) Al menos dos veces “sello” o un número ma- mes tampoco pagará oportunamente los si-
yor que 4. guientes dos meses y después haga un pago
9. En determinada área de producción, 1/3 de los pro- oportuno al mes siguiente de ello.
ductos hechos son defectuosos. Si tres productos 13. Supongamos que en la ciudad de Copiapó los días
fueron seleccionados a azar, calcúlese la probabili- pueden ser soleados o nublados. La probabilidad de
dad de que: que a un día nublado le siga un día nublado es 0,80
a) Solamente uno de ellos sea defectuoso. y la probabilidad de que a un día soleado le siga
b) Al menos uno de ellos sea defectuoso. un día nublado es 0,60. Suponga que cada día es
10. Un investigador está estudiando los efectos de la clasificado como lluvioso o soleado y que el tiempo
temperatura, la presión, y el tipo de catalizador en el de cualquier día depende sólo del tiempo del día
rendimiento de una determinada reacción química. anterior. Encuentre la probabilidad de que a un día
Tres diferentes temperaturas, cuatro diferentes pre- nublado le siga:
siones, y cinco diferentes catalizadores están bajo a) Un día nublado, un día soleado y otro día
consideración. nublado.
a) Si cualquier ejecución del experimento, impli- b) Dos días soleados y después un día nublado.
ca el uso de una sola temperatura, una presión, c) Dos días nublados y después dos días solea-
y un catalizador, cuántas ejecuciones del ex- dos.
perimento son posibles? 14. Un conjunto electrónico consta de dos subsistemas,
b) ¿Cuántas ejecuciones del experimento impli- se define A como el evento de que el primer sistema
can el uso de la temperatura más baja y las falle y B el evento de que el segundo sistema falle.
dos presiones más bajas? A partir de una serie de pruebas previas, se presu-
c) Supongamos que cinco ejecuciones del ex- ponen las siguientes probabilidades: P(A) = 0,20,
perimento diferentes deben ser hechas en el P(B) = 0,15 y P(A ∩ B) = 0,15. Calcular las si-
primer día. Si los cinco son seleccionados guientes probabilidades: a) P(A|B). b) P(A ∪ B).
al azar de entre todas las posibilidades, don- c) P(A ∩ Bc ).
de cualquier grupo de cinco tiene la misma 15. Una costura hecha en un avión necesita 25 rema-
probabilidad de selección, ¿cuál es la probabi- ches. La costura tendrá que volver a realizarse si
lidad de que un catalizador diferente se utiliza cualquiera de los remaches está defectuoso. Supon-
en cada ejecución del experimento? ga que los remaches están defectuosos indepen-
11. Una familia tiene tres hijos. Determinar todas las dientemente unos de otros, cada uno con la misma
posibles permutaciones, con respecto al sexo de los probabilidad.
hijos. Bajo las suposiciones adecuadas calcule la a) Si 14 % de todas las costuras necesitan volver
probabilidad de tener: a efectuarse, ¿cuál es la probabilidad de que
a) Dos de los hijos tengan el mismo sexo. un remache esté defectuoso?
b) Un varón y dos mujeres. b) ¿Qué tan pequeña debe ser la probabilidad de
c) Tres hijos del mismo sexo. un remache defectuoso para asegurar que só-
12. Una tienda departamental que factura a sus clientes lo 10 % de todas las costuras necesitan volver
una vez al mes ha encontrado que si un cliente paga a efectuarse.
oportunamente en un mes, la probabilidad es 0,90 16. Un avión tiene cuatro motores. Cada motor tiene
12 Capítulo 1. Probabilidades

una probabilidad de fallar de 0,001 en un vuelo las órdenes. Calcule la probabilidad de que:
de Nueva York a París. El avión se estrellará si en a) Se cometa un error en una orden.
algún momento dos o menos motores trabajan en b) Si se comete un error en una orden, la orden
forma adecuada. Suponga que las fallas de motores haya sido surtida por U.
distintos son independientes. c) Si se comete un error en una orden, la orden
a) ¿Cuál es la probabilidad de que el avión se haya sido surtida por V .
estrelle? 20. Tres máquinas A, B y C, producen el 45 %, 30 % y
b) Dado que el motor 1 no fallará durante el vue- 25 %, respectivamente, del total de artículos en una
lo, ¿cuál es la probabilidad de que el avión se fábrica. Los porcentajes de producción defectuosa
estrelle? de las máquinas A, B y C son del 3 %, 4 % y 5 %,
c) Dado que el motor 1 fallará durante el vuelo, respectivamente.
¿cuál es la probabilidad de que el avión no se a) Se selecciona al azar un artículo, ¿cuál es la
estrelle? probabilidad que el artículo sea defectuoso?
17. Por experiencia se sabe que en cierta industria 60 % b) Seleccionamos al azar un artículo y resulta
de todos los litigios entre los trabajadores y la admi- defectuoso, ¿cuál es la probabilidad de ha-
nistración son por salarios, 15 % por las condiciones ber sido producido por la máquina A?, ¿qué
de trabajo y 25 % son sobre aspectos de prestacio- máquina tiene mayor probabilidad de haber
nes. También 45 % de los litigios por salarios se producido la pieza defectuosa?
resuelven sin huelgas, 70 % de los litigios por con- 21. En cierta gasolinera, 60 % de los clientes utilizan
diciones de trabajo, se resuelven sin huelgas y 40 % gasolina regular y 40 % extra. De los clientes que
de los litigios acerca de prestaciones se resuelven consumen gasolina regular, 30 % llenan sus tanques
sin huelgas. y de los que consumen gasolina extra, 50 % llenan
a) ¿Cuál es la probabilidad de que un litigio sus tanques.
entre trabajadores y la administración se re- a) ¿Cuál es la probabilidad de que el siguiente
suelva sin una huelga? cliente llene el tanque?
b) ¿Cuál es la probabilidad de que un litigio b) Si el siguiente cliente llena el tanque, ¿cuál
entre los trabajadores y la administración se es la probabilidad de que pida gasolina extra?
resuelva sin huelga, sea por salario? 22. Se sabe que una empresa utiliza cuatro máquinas
18. Un empresario petrolero desea saber si su campo en la fabricación de cierto producto y que la produc-
petrolero del sur de Japón producirá petróleo. Con- ción diaria de cada una de ellas es, respectivamente
trató a un geólogo para que efectúe unas pruebas 1 000, 1 200, 1 800 y 2 000 piezas. Se sabe además
en el campo. Si hay petróleo en el campo, hay 95 % que en promedio, el 1 % de la producción de la
de posibilidades de que las pruebas del geólogo primera máquina es “defectuoso”, el 0,5 % de la
indiquen que hay petróleo. Si el campo no tiene pe- producción de la segunda es “defectuoso”, el 0,5 %
tróleo, hay 5 % de posibilidades de que las pruebas de la producción de la tercera es “defectuoso” y el
del geólogo indiquen que si lo hay. Si las pruebas 1 % de la producción de la cuarta es “defectuosos”.
del geólogo dicen que no hay petróleo, ¿cuál es la a) ¿Cuál es la probabilidad de que una pieza sea
probabilidad de que el campo tenga petróleo? Antes defectuosa?
de que el geólogo efectúe las pruebas, el empresario b) Si de la producción de cierto día se extrae una
cree que hay 10 % de posibilidades de que el campo pieza que resulta ser defectuosa, ¿cuál es la
tenga petróleo. probabilidad de que dicha pieza proceda de
19. Amazon c
emplea tres personas que trabajan en la tercera máquina?
la bodega, U, V y W , quienes retiran los artículos 23. Una empresa produce un tipo de chip para compu-
de los anaqueles y los reúnen para su subsecuente tadora. Esta empresa tiene fábricas en Antofagasta,
verificación y empaque. U comete un error en una Copiapó y La Serena. La fábrica de Antofagasta
orden (saca el artículo equivocado o la cantidad produce el 40 % del total de unidades con un índice
equivocada) una vez de cien, V comete un error de defectos del 5 %, en Copiapó se produce el 35 %
en una orden cinco veces de cien, y W comete un de las unidades con un índice de defectos del 8 %
error en una orden tres veces de cien. Si U, V y W y en La Serena, el 25 % con un índice de defectos
surten, respectivamente 30 %, 40 % y 30 % de todas del 10 %. Si se encuentra un chip que es defectuo-
1.6 Ejercicios 13

so, ¿de dónde es más probable que provenga, de F2 y F3 producen el mismo número de componentes,
Antofagasta, Copiapó o de La Serena? Justifique su mientas que F1 produce el doble de componentes
respuesta. que F2 . Por experiencia pasada se sabe, que el 2 %
24. Un ingeniero químico esta interesado en determi- de los componentes producidos por F1 y F2 respec-
nar si cierta traza de impureza está presente en un tivamente son defectuosos, en tanto que el 4 % de
producto. La probabilidad de que la impureza es- los producidos por F3 son defectuosos. Los compo-
té presente es 0,40 y que esté ausente es 0,60. Un nentes producidos por las tres fabricas se guardan
experimento tiene una probabilidad de 0,80 de de- en un mismo almacén. Si se escoge un componente
tectar la impureza si está presente. La probabilidad del almacén:
de no detectar la impureza si no está presente es a) ¿Cuál es la probabilidad que sea defectuoso?
0,90. b) Si el componente es defectuoso, ¿cuál es la
a) ¿Cuál es la probabilidad de que el experimen- probabilidad que haya sido fabricado por F1 ?
to detecte la impureza? 27. La compañía ensambladora de automóviles CAR,
b) Si el experimento detecta una impureza. se ha presentado a una licitación, para ensamblar
¿Cuál es la probabilidad de que la impureza un nuevo modelo de automóvil. La probabilidad
esté presente en el producto? de que CAR gane la licitación es de 0,90 si una
25. Una compañía de desarrollo urbano está consideran- firma competidora MOTOR no se presente a ella,
do la posibilidad de construir un centro comercial en tanto que es de sólo 0,20 si MOTOR se presen-
en el sector alto de la ciudad de Copiapó. Un ele- ta. El gerente general de CAR estima que hay una
mento vital en esta consideración es un proyecto probabilidad de 0,80 que MOTOR se presente.
de una autopista que une este sector con el centro a) ¿Cuál es la probabilidad de que CAR gane la
de la ciudad. Si el consejo municipal aprueba esta licitación?
autopista, hay una probabilidad de 0,90 de que la b) Dado que CAR ganó la licitación, ¿cuál es la
compañía construya el centro comercial en tanto probabilidad de que MOTOR se haya presen-
que si la autopista no es aprobada la probabilidad tado a ella?
es de sólo 0,20. Basándose en la información dis- 28. Una prueba de sangre de laboratorio es 99 % efecti-
ponible, el presidente de la compañía estima que va para detectar cierta enfermedad cuando ocurre
hay una probabilidad de 0,60 que la autopista sea realmente. Sin embargo, la prueba también da un
aprobada. resultado “positivo falso” en 1 % de las personas
a) ¿Cuál es la probabilidad que la compañía sanas a las que se les aplica. (Es decir, si se le hace
construya el centro comercial? a prueba a una persona sana, con probabilidad 0,01
b) Dado que el centro comercial fue construido, el resultado de la prueba implicará que la persona
¿cuál es la probabilidad de que la autopista padece la enfermedad). Si 0,5 % de la población
haya sido construida? tiene realmente la enfermedad, ¿cuál es la probabi-
26. Una compañía que produce cierto componente elec- lidad de que una persona tenga la enfermedad si la
trónico, tiene tres fabricas: F1 , F2 y F3 . Las fabricas prueba dio resultado positivo?
2. Variables aleatorias

2.1 Concepto de variables aleatorias


Definición 2.1.1 Una variable aleatoria es una función que asocia un número real con cada elemento
del espacio muestral.

Definición 2.1.2 Si un espacio muestral contiene un número finito de posibilidades, o una serie
interminable con tantos elementos como números enteros existen, se llama espacio muestral discreto.

Definición 2.1.3 Si un espacio muestral contiene un número infinito de posibilidades, igual al número
de puntos en un segmento de recta, se le denomina espacio muestral continuo.

2.2 Distribuciones de probabilidad discretas


Definición 2.2.1 El conjunto de pares ordenados (x, f (x)) es una función de probabilidad, una
función de masa de probabilidad o una distribución de probabilidad de la variable aleatoria discreta
X si, para cada resultado x posible,
1. f (x) ≥ 0,
2. ∑x f (x) = 1,
3. P(X = x) = f (x).

Definición 2.2.2 La función de distribución acumulada F(x) de una variable aleatoria discreta X
con distribución de probabilidad f (x) es

F(x) = P(X ≤ x) = ∑ f (t), para − ∞ < x < ∞.


t≤x

2.3 Distribuciones de probabilidad continuas


Definición 2.3.1 La función f (x) es una función de densidad de probabilidad (fdp) para la variable
aleatoria continua X, definida en el conjunto de números reales, si
1. Rf (x) ≥ 0, para toda x ∈ R.

2. −∞ f (x) dx = 1.
3. P(a < X < b) = ab f (x) dx.
R

Definición 2.3.2 La función de distribución acumulada F(x), de una variable aleatoria continua X
con función de densidad f (x), es
Z x
F(x) = P(X ≤ x) = f (t) dt, para − ∞ < x < ∞.
−∞

2.4 Distribución de probabilidad conjunta


16 Capítulo 2. Variables aleatorias
Definición 2.4.1 La función f (x, y) es una distribución de probabilidad conjunta o función de
masa de probabilidad de las variables aleatorias discretas X e Y , si
1. f (x, y) ≥ 0 para toda (x, y),
2. ∑x ∑y f (x, y) = 1,
3. P(X = x,Y = y) = f (x, y).
Para cualquier región A en el plano, P((X,Y ) ∈ A) = ∑ ∑A f (x, y).

Definición 2.4.2 La función f (x, y) es una función de densidad de conjunta de las variables aleato-
rias continuas X e Y , si
1. Rf (x,Ry) ≥ 0 para toda (x, y),
∞ ∞
2. −∞ −∞ f (x, y) dxRdy
R
= 1,
3. P((X,Y ) ∈ A) = A f (x, y) dx dy, para cualquier región A en el plano.

Definición 2.4.3 Las distribuciones marginales sólo si X y sólo de Y son

g(x) = ∑ f (x, y), y h(y) = ∑ f (x, y),


y x

para el caso discreto, y


Z ∞ Z ∞
g(x) = f (x, y) dy, y h(y) = f (x, y) dx,
−∞ −∞

para el caso continuo.

Definición 2.4.4 Sean X e Y dos variables aleatorias, discretas o continuas. La distribución condi-
cional de la variable aleatoria Y , dado que X = x, es

f (x, y)
f (y|x) = , siempre que g(x) > 0.
g(x)

De manera similar, la distribución condicional de la variable aleatoria X, dado que Y = y, es

f (x, y)
f (x|y) = , siempre que h(y) > 0.
h(y)

2.5 Independencia de variables aleatorias


Definición 2.5.1 Sean X e Y dos variables aleatoria, discretas o continuas, con distribución de
probabilidad conjunta f (x, y) y distribuciones marginales g(x) y h(y), respectivamente. Se dice que las
variables aleatorias X e Y son estadísticamente independientes si y sólo si

f (x, y) = g(x)h(y),

para toda (x, y) dentro de sus rangos.

Definición 2.5.2 Sean X1 , X2 , . . . , Xn , n variables aleatorias, discretas o continuas, con distribución


de probabilidad conjunta f (x1 , x2 , . . . , xn ) y distribuciones marginales f1 (x1 ), f2 (x2 ), . . . , fn (xn ), res-
pectivamente. Se dice que las variables aleatorias X1 , X2 , . . . , Xn son recíproca y estadísticamente
2.6 Esperanza matemática 17

independientes si y sólo si

f (x1 , x2 , . . . , xn ) = f1 (x1 ) f2 (x2 ) · · · fn (xn ),

para toda (x1 , x2 , . . . , xn ) dentro de sus rangos.

2.6 Esperanza matemática


Definición 2.6.1 Sea X una variable aleatoria con distribución de probabilidad f (x). La media o
valor esperado de X es

µ = E[X] = ∑ x f (x),
x

si X es discreta, y
Z ∞
µ = E[X] = x f (x) dx,
−∞

si X es continua.

Teorema 2.6.1 Sea X una variable aleatoria con distribución de probabilidad f (x). La media o valor
esperado de la variable aleatoria g(X) es

µg(X) = E[g(X)] = ∑ g(x) f (x),


x

si X es discreta, y
Z ∞
µg(X) = E[g(X)] = g(x) f (x) dx,
−∞

si X es continua.

Definición 2.6.2 Sean X e Y variables aleatorias con distribuciones de probabilidad conjunta f (x, y).
La media o valor esperado de la variable aleatoria g(X,Y ) es

µg(X,Y ) = E[g(X,Y )] = ∑ ∑ g(x, y) f (x, y),


x y

si X e Y son discretas, y
Z ∞Z ∞
µg(X,Y ) = E[g(X,Y )] = g(x, y) f (x, y) dx dy,
−∞ −∞

si X e Y son continuas.
Definición 2.6.3 Sea X una variable aleatoria con distribución de probabilidad f (x) y media µ = E[X].
18 Capítulo 2. Variables aleatorias

La varianza de X es

σ 2 = V(X) = E[(X − µ)2 ] = ∑(x − µ)2 f (x), si X es discreta, y


x
Z ∞
σ 2 = V(X) = E[(X − µ)2 ] = (x − µ)2 f (x) dx, si X es continua.
−∞

La raíz cuadrada positiva de la varianza, se llama desviación estándar de X. Además la varianza se


puede definir como

σ 2 = E[X 2 ] − µ 2 .

Teorema 2.6.2 Sea X una variable aleatoria con distribución de probabilidad f (x). La varianza de la
variable aleatoria g(X) es
2
σg(X) = E[(g(X) − µg(X) )2 ] = ∑(g(x) − µg(x) )2 f (x),
x

si X es discreta, y
Z ∞
2 2
σg(X) = E[(g(X) − µg(X) ) ] = (g(x) − µg(x) )2 f (x) dx,
−∞

si X es continua.

Definición 2.6.4 Sean X e Y variables aleatorias con distribución de probabilidad conjunta f (x, y). La
covarianza de X e Y es

σXY = E[(X − µX )(Y − µY )] = ∑ ∑(x − µX )(y − µY ) f (x, y),


x y

si X e Y son discretas, y
Z ∞Z ∞
σXY = E[(X − µX )(Y − µY )] = (x − µX )(y − µY ) f (x, y) dx dy,
−∞ −∞

si X e Y son continuas.

Teorema 2.6.3 La covarianza de dos variables aleatorias X e Y , con medias µX y µY , respectivamente


está dada por

σXY = E[XY ] − µX µY .

Definición 2.6.5 Sean X e Y variables aleatorias con covarianza σXY y desviaciones estándar σX y
σY , respectivamente. El coeficiente de correlación de X e Y es
σXY
ρXY = .
σX σY
2.6 Esperanza matemática 19

Teorema 2.6.4 Si a y b son constantes, entonces,

E[aX + b] = aE[X] + b.

Corolario 2.6.5 Al establecer a = 0 vemos que E[b] = b.

Corolario 2.6.6 Al establecer b = 0 vemos que E[aX] = aE[X].

Teorema 2.6.7 El valor esperado de la suma o diferencia de dos o más funciones de una variable
aleatoria X es la suma o diferencia de los valores esperados de las funciones. Es decir,

E[g(X) ± h(X)] = E[g(X)] ± E[h(X)].

Teorema 2.6.8 El valor esperado de la suma o diferencia de dos o más funciones de las variables
aleatorias X e Y es la suma o diferencia de los valores esperados de las funciones. Es decir,

E[g(X,Y ) ± h(X,Y )] = E[g(X,Y )] ± E[h(X,Y )].

Corolario 2.6.9 Si establecemos que g(X,Y ) = g(X) y h(X,Y ) = h(Y ), vemos que

E[g(X) ± h(Y )] = E[g(X)] ± E[h(Y )].

Corolario 2.6.10 Si establecemos que g(X,Y ) = X y h(X,Y ) = Y , vemos que

E[X ±Y ] = E[X] ± E[Y ].

Teorema 2.6.11 Sean X e Y dos variables aleatorias independientes. Entonces,

E[XY ] = E[X]E[Y ].

Corolario 2.6.12 Sean X e Y dos variables aleatorias independientes. Entonces, σXY = 0.

Teorema 2.6.13 Si X e Y son variables aleatorias con distribución de probabilidad conjunta f (x, y), y
a, b y c son constantes, entonces
2 2 2 2 2
σaX+bY +c = a σX + b σY + 2abσXY .

Corolario 2.6.14 Si se establece que b = 0, vemos que


2
σaX+c = a2 σX2 = a2 σ 2 .
20 Capítulo 2. Variables aleatorias

Corolario 2.6.15 Si se establece que a = 1 y b = 0, vemos que


2
σX+c = σX2 = σ 2 .

Corolario 2.6.16 Si se establece que b = 0 y c = 0, vemos que


2
σaX = a2 σX2 = a2 σ 2 .

Corolario 2.6.17 Si X e Y son variables aleatorias independientes, entonces


2
σaX+bY = a2 σX2 + b2 σY2 .

Corolario 2.6.18 Si X e Y son variables aleatorias independientes, entonces


2
σaX−bY = a2 σX2 + b2 σY2 .

Corolario 2.6.19 Si X1 , X2 , . . . , Xn son variables aleatorias independientes, entonces

σa21 X1 +a2 X2 +···+an Xn = a21 σX21 + a22 σX22 + · · · + a2n σX2n .

Teorema 2.6.20 — Teorema de Chebyshev. La probabilidad de que cualquier variable aleatoria X


tome un valor dentro de k desviaciones estándar de la media es de al menos 1 − 1/k2 . Es decir,

1
P(µ − kσ < X < µ + kσ ) ≥ 1 − .
k2

2.7 Ejercicios
1. Un juego consiste en lanzar un dado y ganar en di- to aleatorio.
nero el número que sale multiplicado por $1 000, es b) Defina el soporte de la variable aleatoria X.
decir, si sale 5 se gana $5 000. Por otra parte, para c) Encuentre la función de masa de probabilidad
participar en el juego, es decir, lanzar una vez el de la variable aleatoria X.
dado debe pagar $4 000. Sea X la variable aleatoria 3. Se lanzan tres monedas honestas simultáneamente
que refleja la ganancia en el juego. hasta que las tres muestran el mismo lado, es decir,
a) Defina el soporte de la variable aleatoria. hasta que o bien las tres muestran “cara” o bien las
b) Encuentre la función de masa de probabilidad tres muestran “sello”. Defina la variable aleatoria X
de la variable aleatoria X. como aquella variable que cuenta los lanzamientos
c) ¿Aconsejaría usted a un amigo(a) participar necesarios para que las tres monedas muestran el
en el juego? mismo lado.
2. Se lanzan dos dados equilibrados distinguibles. Pue- a) Determine el conjunto de valores que puede
de utilizar la notación (i, j) que denota el evento de tomar la variable X. Además, obtenga la fun-
que el resultado del “dado 1” fue i y el resultado ción de masa de probabilidad del número de
del “dado 2” fue j. Si se define la variable aleatoria lanzamientos de este experimento.
X como la suma de los resultados obtenidos por los b) Calcule la probabilidad que deba que lanzar-
dados. las más de tres veces.
a) Determine el espacio muestral del experimen- 4. Se lanza una serie de cohetes hasta que el primer
2.7 Ejercicios 21

lanzamiento exitoso tiene lugar. Si esto no ocurre en 8. Un contratista es requerido por un departamento de
5 ensayos, el experimento se detiene y se inspeccio- planeación de un municipio para que remita uno,
na el equipo. Supóngase que hay una probabilidad dos, tres, cuatro o cinco formularios (dependiendo
constante de 0,8 de tener un lanzamiento exitoso y de la naturaleza del proyecto) para solicitar permiso
que los ensayos sucesivos son independientes. Ade- de construcción. Sea Y : “el número de formularios
más, el costo del primer lanzamiento es k dólares requeridos del siguiente solicitante”. La probabili-
mientras que los lanzamientos que siguen cuestan dad de que y formularios se requieran es proporcio-
k/3 dólares. Cada vez que hay un lanzamiento exi- nal a y, esto es, p(y) = ky, para y = 1, . . . , 5.
toso, se obtiene cierta cantidad de información que a) ¿Cuál es el valor de k?
puede expresarse como una ganancia financiera de b) ¿Cuál es la probabilidad de que por lo menos
c dólares. Si T es el costo neto del experimento, se necesiten tres formularios?
encuentre la función de masa de probabilidad del c) ¿Cuál es la probabilidad de que se necesiten
costo neto del experimento. entre dos y cuatro formularios?
5. Una urna contiene cuatro esferas numeradas (1, 2, 9. Sea X una variable aleatoria con función de distri-
3 y 4). Se extraen dos esferas en forma aleatoria, bución acumulada dada por:
una a la vez y sin reemplazo. Sea X la variable alea- 
0 , si x < 1,
toria que denota la suma de los números de las dos 
 13 , si 1 ≤ x < 4,



esferas seleccionadas. 1
a) Determine Ω.
F(x) = 2 , si 4 ≤ x < 6,
5
, si 6 ≤ x < 10,


b) Determine el soporte de la variable aleatoria  6


1 , si x ≥ 10,
y calcule su función de masa de probabilidad.
c) Calcule: i) P(X ≥ 6). ii) P(3 < X ≤ 5). encuentre:
iii) P(X = 6). a) P(2 < X ≤ 6).
6. Suponga que un fabricante de computadora recibe b) P(X = 4).
chips en lotes de cinco. Dos chips son selecciona- c) La función de masa de probabilidad de X.
dos de cada lote para realizar una inspección de 10. Sea X una variable aleatoria con función de distri-
control de calidad. Podemos representar los posi- bución acumulada dada por:
bles resultados del proceso de selección por pares. 
0 , si x < 1,
Por ejemplo, el par (1, 2) representa la selección


 0,2 , si 1 ≤ x < 2,


del chips 1 y 2.
F(x) = 0,6 , si 2 ≤ x < 3,
a) Liste los diez diferentes posibles resultados 

 0,7 , si 3 ≤ x < 4,
del proceso de selección. 

1 , si x ≥ 4.
b) Suponga que los chips 1 y 2 son los únicos
chips defectuosos en el lote de cinco. Los Calcule la esperanza y varianza de X.
chips son seleccionados en forma aleatoria. 11. Sea X una variable aleatoria discreta con la siguien-
Defina X como el número de chips defectuo- te función de masa de probabilidad:
sos observados. Encuentre la función de masa    x  4−x
4 3 1
de probabilidad de X. f (x) = , x = 0, 1, 2, 3, 4.
x 4 4
c) Encuentre la función de distribución acumu-
lada F(x). Calcule la esperanza y varianza de X.
7. Tres hombres y tres mujeres son ordenados en for- 12. Sea X una variable aleatoria con función de distri-
ma descendientes de acuerdo al puntaje obtenido en bución acumulada dada por:
un examen. Supongamos que no tenemos resultados 
0 , si x < 1,
iguales y que los 10! posibles ordenamientos son 


 0,1 , si 1 ≤ x < 2,
igualmente probables. Definamos la variable alea-


0,3 , si 2 ≤ x < 3,

toria X que representa la posición más alta lograda F(x) =
0,7 , si 3 ≤ x < 4,
por una mujer (por ejemplo, si X = 2, entonces la


0,9 , si 4 ≤ x < 5,


persona con mejor puntaje ha sido un hombre y la


1 , si x ≥ 5.

siguiente es una mujer). Encuentre P(X = i), para
i = 1, 2, 3, 4. Calcule la esperanza y varianza de X.
22 Capítulo 2. Variables aleatorias

13. La función de distribución acumulada de la dura- 18. Sea X una variable aleatoria continua, con función
ción X del tiempo de préstamo de un libro, es dada de densidad de probabilidad, dada por:
por:  1
  2 x − 21 , si 1 ≤ x < 2,
 0 , si x < 0, f (x) = 1
, si 2 ≤ x ≤ 72 ,
x2 2
F(x) = , si 0 ≤ x < 2, 
0 , en otro caso.
 4
1 , si x ≥ 2.
Encuentre:
a) A partir de F(x), calcule: i) P(X ≤ 1).
a) La esperanza y varianza de X.
ii) P(0,5 ≤ X ≤ 1).
b) La función de distribución acumulada, F(x).
b) Determine la función de densidad de probabi-
c) El valor de q, tal que P(X ≤ q) = 12 .
lidad.
19. Sea X una variable aleatoria continua, con función
c) A partir de la función de densidad de proba-
de densidad de probabilidad, dada por:
bilidad, calcule P(0,5 < X < 1,5).
14. Sea X una variable aleatoria continua, con la si- , si 0 ≤ x < 12 ,
 8x2

guiente función de densidad de probabilidad:
 f (x) = 7
−3x + 2 , si 12 ≤ x ≤ 76 ,
 1 + x , si − 1 ≤ x < 0, 0 , en otro caso.

f (x) = 1 − x , si 0 ≤ x ≤ 1,

0 , en otro caso. Encuentre:
a) La esperanza y varianza de X.
a) Verifique que f (x) es efectivamente una fun- b) La función de distribución acumulada, F(x).
ción de densidad de probabilidad. c) El valor de q, tal que P(X ≤ q) = 23 24 .
b) Calcule: i) P(X < 0). ii) P(−1/2 ≤ X ≤ 3/4). 20. Sea X una variable aleatoria continua, definamos
c) Encuentre la función de distribución acumu- además la siguiente función:
lada de la variable aleatoria X.

d) Determine E[X] y V(X).  x , si 0 ≤ x < 1,

15. En una cierta ciudad el consumo diario de agua (en 
1 , si 1 ≤ x < 2,
millones de litros) es una variable aleatoria cuya g(x) =

 −x + 3 , si 2 ≤ x ≤ 3,
función de densidad de probabilidad está dada por: 
0 , en otro caso.
 1 −x
9 xe
3 , si x > 0,
f (x) = a) Determine el valor de c, para que f (x) =
0 , en otro caso.
cg(x) sea una función de densidad de pro-
Calcule la probabilidad de que en un día dado: babilidad.
a) El consumo de agua en esta ciudad no sea b) Calcule: i) P(X ≥ 1). ii) P(1/2 < X < 3/2).
mayor de 6 millones de litros. 21. El porcentaje de alcohol (100X) en cierto compues-
b) El abastecimiento de agua sea inadecuado si to se puede considerar como una variable aleatoria,
la capacidad diaria de esta ciudad es 9 millo- donde 0 < X < 1, tiene la siguiente función de den-
nes de litros. sidad de probabilidad:
16. Sea X una variable aleatoria continua con función
de densidad dada por: f (x) = cx3 (1 − x), 0 < x < 1.
|x|
f (x) = , |x| < 4. donde c es una constante desconocida.
16
a) Determine el valor de c, para que f (x) sea
Determine E[X] y V(X). una función de densidad de probabilidad.
17. Si la función de densidad de probabilidad de la b) Calcule P(X ≤ 2/3).
variable aleatoria X está dada por: 22. Suponga que X, el tiempo de falla (en horas) de un
 x
, si 0 < x ≤ 1, sistema, tiene la siguiente función de densidad de
 21

probabilidad:

2 , si 1 < x ≤ 2,
f (x) = 3 x
− , si 2 < x < 3,
 2 2 f (x; α) = e−(x−α) , x > α > 0,


0 , en otro caso.
encuentre la esperanza de g(X) = X 2 − 5X + 3. donde α > 0 es una constante.
2.7 Ejercicios 23

a) Encuentre la función de distribución acumu- b) La esperanza y varianza de la variable X.


lada, F(x). c) El valor de q, tal que P(X ≤ q) = 0,75.
b) Calcule E[X] y V(X). 28. Si la ganancia de un contratista en un trabajo de
23. Sea X una variable aleatoria continua con función construcción se puede considerar como una varia-
de densidad de probabilidad dada por: ble aleatoria continua que tiene función de densidad
 de probabilidad dada por
6x(1 − x) , si 0 < x < 1,
f (x) =  1
0 , en otro caso, f (x) = 18 (x + 1) , si − 1 < x < 5,
0 , en otro caso.
Determine:
a) Es una función de densidad de probabilidad. donde las unidades están en US$1 000.
b) La función de distribución acumulada. a) ¿Cuál es la probabilidad de que el contratista
24. Sea X una variable aleatoria continua, con función tenga una ganancia superior a $3 500?
de densidad de probabilidad dada por: b) ¿Cuál es la ganancia esperada por el contra-
tista?
 1
b−a , si a < x < b, 29. Un puerto tiene capacidad de acomodar 4 naves
f (x) =
0 , en otro caso, de cierto tipo durante la noche. Si X es la varia-
ble aleatoria que representa el número de naves
tal que 0 < a < b < ∞. buscando atracadero por noche y suponiendo que
a) Encuentre el n-ésimo momento de la variable P(X = x) = 1/6 para x = 1, 2, 3, 4, 5, 6. Un segundo
aleatoria X. puerto está disponible para manejar el exceso de
b) A partir del ítem (a), encuentre la esperanza naves, si existen. Sea Y el número de barcos solici-
y varianza de la variable aleatoria X. tando atracadero en el segundo puerto (lo cual sólo
25. Sea X una variable aleatoria continua, con función ocurrirá, si el primer puerto, está lleno) Calcule:
de densidad de probabilidad dada por: a) La función de masa conjunta de X e Y .
α b) La función marginal de Y .
β
f (x) = xα−1 e−β x , x > 0, 30. Sea (X,Y ) un vector aleatorio, con función de masa
Γ(α)
conjunta dada por la siguiente tabla:
donde α > 0 y β > 0 son constantes. Encuentre la x
esperanza y varianza de la variable aleatoria X. f (x, y) −2 −1 1 2
26. Sea X el total de gastos médicos (en miles de dó- −1 0,05 0,10 0,15 0,20
lares) que incurre un individuo particular durante y
1 0,20 0,15 0,10 0,05
un año. Aunque X es una variable aleatoria discre-
ta, supongamos que su distribución puede ser muy Calcule: i) P(X > 0,Y = 1). ii) P(X > 0,Y ≥ 1).
bien aproximada por una distribución continua con 31. Sea (X,Y ) un vector aleatorio, con función de masa
función de densidad dada por: conjunta dada por la siguiente tabla:
x
2 −7
 
f (x) = c 1 + x , x ≥ 0. f (x, y) 0 1 2 3
5 1 0,15 0,05 0,00 0,04
a) ¿Cuál es el valor de c? y 3 0,06 0,24 0,01 0,03
b) ¿Cuál es el valor esperado y la desviación 5 0,22 0,00 0,15 0,05
estándar del total de gastos médicos? a) Determine las funciones marginales de las
27. Sea X una variable aleatoria continua, con función variables aleatorias X e Y .
de densidad de probabilidad f (x), dada por: b) ¿Son independientes las variables X e Y ?
 32. Sea (X,Y ) un vector aleatorio, con función de masa
 x , si 0 ≤ x ≤ 1, conjunta dada por la siguiente tabla:
f (x) = 2 − x , si 1 < x ≤ 2,

0 , en otro caso. x
f (x, y) 0 1 2
Encuentre: −1 0,06 0,16 0,18
a) La función de distribución acumulada. y
0 0,09 0,24 0,27
24 Capítulo 2. Variables aleatorias

a) Calcule: P(X = 0,Y > 0) y P(X < 0,Y ≥ 1). c) Determine la esperanza y varianza de X.
b) ¿Son independientes las variables X e Y ? 39. Sea (X,Y ) un vector aleatorio, con función de den-
33. Sea (X,Y ) un vector aleatorio, con La función de sidad conjunta dada por:
masa conjunta dada por:  −(x+y)
e , si x > 0, y > 0,
( 2 2 f (x, y) =
x +y
, si x = 0, 1, 2, 3, y = 0, 1, 0 , en otro caso.
f (x, y) = 32
0 , en otro caso. a) Encuentre la función de distribución acumu-
lada conjunta.
Encuentre: b) A partir del ítem (a), determine las funciones
a) Las funciones marginales de X e Y . de densidad marginales.
b) La función de condicional de X, dado Y = y. c) ¿Son independientes las variables X e Y ?
c) La función de condicional de Y , dado X = x 40. Sea (X,Y ) un vector aleatorio, con función de den-
34. Dos firmas comerciales principales, A y B, contro- sidad conjunta dada por:
lan el 50 % y 30 % del mercado, respectivamente. Si  6
se escogen al azar una muestra de dos compradores (x + y2 ) , si 0 ≤ x ≤ 1, 0 ≤ y ≤ 1,
f (x, y) = 5
para una observación. ¿Cuál es la distribución de 0 , en otro caso.
probabilidad conjunta del número de compradores
a) Encuentre la función de distribución acumu-
que favorecen a cada firma de la muestra? Calcular:
lada conjunta.
a) E[X]. b) E[Y ]. c) E[X +Y ]. d) E[XY ].
b) ¿Son independientes las variables X e Y ?
35. Encuentre el valor de k, de tal manera que la fun-
41. Sea (X,Y ) un vector aleatorio, con función de den-
ción:
sidad conjunta dada por:
 x
k y , si 0 < x < 1, 1 < y < 2,  2 xy
f (x, y) = x + 3 , si 0 < x < 1, 0 < y < 2,
0 , en otro caso, f (x, y) =
0 , en otro caso.
sea una función de densidad conjunta del vector a) Calcule: P(X > 1/2) y P(Y < X).
aleatorio (X,Y ). b) ¿Son independientes las variables X e Y ?
36. Sea (X,Y ) un vector aleatorio, con función de den- 42. Sea X e Y los puntajes sobre una prueba de inte-
sidad conjunta dada por: ligencia y un test de preferencias ocupacionales,
 −(x+y)
e , si x > 0, y > 0, respectivamente. La función de densidad conjunta,
f (x, y) = del vector aleatorio (X,Y ) está dado por:
0 , en otro caso.
 k
, si 0 ≤ x ≤ 100, 0 ≤ y ≤ 10,
a) Encuentre las funciones marginales de X e Y . f (x, y) = 1 000
0 , en otro caso.
b) ¿Son independientes las variables X e Y ?
37. Sea (X,Y ) un vector aleatorio, con función de den- Encuentre el valor de k y posteriormente la función
sidad conjunta dada por: de distribución acumulada conjunta.
 43. Consideremos, una situación en la cual se miden la
x + y , si 0 < x < 1, 0 < y < 1,
f (x, y) = tensión superficial y la acidez de un producto quími-
0 , en otro caso.
co. Estas variables son codificadas tal que la tensión
a) Compruebe que efectivamente f (x, y) es una superficial se mide en una escala de 0 ≤ x ≤ 2 y la
función de densidad conjunta. acidez se mide en una escala de 2 ≤ y ≤ 4. La fun-
b) Encuentre las funciones marginales de X e Y . ción de densidad conjunta de (X,Y ) es:
c) Son independientes las variables X e Y ?
f (x, y) =
38. Sea (X,Y ) un vector aleatorio, con función de den- 
sidad conjunta dada por: k(6 − x − y) , si 0 ≤ x ≤ 2, 2 ≤ y ≤ 4,
 −2(x+y) 0 , en otro valor.
4e , si x > 0, y > 0,
f (x, y) = a) Encuentre el valor de k.
0 , en otro caso.
b) Calcule: P(X < 1), P(X < 3) y P(X +Y ≤ 4).
a) Encuentre las funciones marginales de X e Y . c) Determine las funciones marginales de X e
b) ¿Son independientes las variables X e Y ? Y.
2.7 Ejercicios 25

44. Sea (X,Y ) un vector aleatorio, con función de den- 49. Sea X e Y dos variables aleatorias cuya función de
sidad conjunta dada por: densidad conjunta es:
(
1 − 5x+4y

e 20 , si x > 0, y > 0, 4x(1 − y) , 0 < x < 1, 0 < y < 1,
f (x, y) = 20 f (x, y) =
0 , en otro caso. 0 , en otro caso.

a) Encuentre la función de distribución acumu- Encuentre las funciones de densidad marginal de X


lada conjunta. e Y . ¿Son independientes las variables aleatorias?
b) Determine las funciones marginales de X e 50. En el examen de admisión a cierta universidad se
Y. califica en base a 100 puntos. Sea X la calificación
c) ¿Son independientes las variables X e Y ? que obtiene uno de los estudiantes (que continua
45. Sea (X,Y ) un vector aleatorio continuo. Considere sus estudios hasta graduarse) y sea Y su razón del
la siguiente función: punto de calidad al graduarse (4 puntos = A). La
( función de densidad conjunta de X e Y es:
x y
ke−( 2 + 3 ) , si x > 0, y > 0,
f (x, y) =
0 , en otro caso. f (x, y) =
 1
a) Encuentre el valor de k. 50 , si 2 < x < 4, 2(y − 1) < x < 25y,
0 , en otro caso.
b) Calcule la función de distribución acumulada
conjunta. a) Calcule: E[X], E[Y ] y E[XY ].
46. Sea (X,Y ) un vector aleatorio continuo. Considere b) Calcule: σX2 ,σY2 , σXY y ρXY .
la siguiente función: 51. Se prueba dos componentes electrónicos hasta que
( y fallan. Sea X el tiempo de falla menor y sea Y el
ke−(x+ 4 ) , si x > 0, y > 0, tiempo de falla mayor. La función de densidad con-
f (x, y) =
0 , en otro caso. junta está dada por:
a) Encuentre el valor de k. (
2 x
−( 100 y
+ 100 ) , si 0 < x < y,
2e
b) Calcule la función de distribución acumulada f (x, y) = (100)
conjunta. 0 , en otro caso.
c) Son independientes las variables X e Y ?
Encuentre la función de densidad condicional de Y ,
47. Sean X e Y variables aleatorias independientes, con
dado X = 60.
funciones de densidad dadas por:
52. Un equipo que consta de dos componentes elec-
 −2x
2e , x > 0, trónicos independientes permanecerá en funciona-
g(x) = miento tanto tiempo como uno de sus componentes
0 , en otro caso,
 1 esté aún en operación. El equipo tiene una garantía
2 , 0 < y < 2, del fabricante que cubre la sustitución si el aparato
h(y) =
0 , en otro caso. se vuelve inutilizable en menos de una año desde
Encuentre la función de distribución acumulada la fecha de compra. La vida X (en años) del pri-
conjunta. mer componente e Y la vida (en años) del segundo,
48. Dos componentes de un computador tiene la si- son variables aleatorias con función de densidad
guiente función de densidad conjunta para sus tiem- conjunta:
po de vidas X e Y :  1 −x/2 −y/2
4e e , si x ≥ 0, y ≥ 0,
 −x(1+y) f (x, y) =
xe , x ≥ 0, y ≥ 0, 0 , en otro caso.
f (x, y) =
0 , en otro caso.
Usted compra uno de esos equipos, seleccionado
Encuentre las funciones de densidad marginal de aleatoriamente entre las existencias del fabricante.
X e Y . ¿Son independientes los tiempos de vida de ¿Cuál es la probabilidad de que la garantía expire
cada componente? antes de que su equipo se vuelva inutilizable?
3. Distribuciones discretas

3.1 Proceso Bernoulli


Definición 3.1.1 En términos estrictos el proceso Bernoulli se caracteriza por lo siguiente:
1. El experimento consta de ensayos repetidos.
2. Cada ensayo produce un resultado que se puede clasificar como éxito o fracaso.
3. La probabilidad de un éxito, que se denota con p, permanece constante de un ensayo a otro.
4. Los ensayos repetidos son independientes.

3.2 Distribución binomial


Definición 3.2.1 — Distribución binomial. Un ensayo de Bernoulli puede tener como resultado un
éxito con probabilidad p y un fracaso con probabilidad 1 − p. Entonces, la distribución de probabilidad
de la variable aleatoria binomial X, el número de éxitos en n ensayos independientes, es
 
n x
f (x; n, p) = p (1 − p)n−x , x = 0, 1, 2, . . . , n.
x

Lo cual denotamos X ∼ Bin(n, p).

Teorema 3.2.1 La media y varianza de la distribución binomial son

E[X] = np, y V(X) = np(1 − p).

Definición 3.2.2 — Distribución multinomial. Si un ensayo dado puede producir los k resultados
E1 , E2 , . . . , Ek con probabilidades p1 , p2 , . . . , pk , entonces la distribución de probabilidad de las variables
aleatorias X1 , X2 , . . . , Xk , que representan el número de ocurrencias para E1 , E2 , . . . , Ek en n ensayos
independientes, es
 
n
f (x1 , x2 , . . . , xk ; p1 , p2 , . . . , pk ) = px1 px2 · · · pxkk ,
x1 , x2 , . . . , xk 1 2
con
k k
∑ xi = n, y ∑ pi = 1.
i=1 i=1

3.3 Distribución geométrica


Definición 3.3.1 — Distribución geométrica. Si ensayos de Bernoulli independientes repetidos
pueden tener como resultado un éxito con probabilidad p y un fracaso con probabilidad 1 − p, entonces
la distribución de probabilidad de la variable aleatoria X, el número del ensayo en el que ocurre el
28 Capítulo 3. Distribuciones discretas

primer éxito, es

f (x; p) = p(1 − p)x−1 , x = 1, 2, 3, . . . ,

Lo cual denotamos X ∼ Geo(p).

Teorema 3.3.1 La media y varianza de una variable aleatoria que sigue la distribución geométrica
X ∼ Geo(p) son

1 1− p
E[X] = , y V(X) = 2 .
p p

3.4 Distribución binomial-negativa


Definición 3.4.1 — Distribución binomial-negativa. Si ensayos de Bernoulli independientes repe-
tidos pueden dar como resultado un éxito con probabilidad p y un fracaso con probabilidad 1 − p,
entonces la distribución de probabilidad de la variable aleatoria X, el número del ensayo en el que
ocurre el r-ésimo éxito, es
 
x−1 r
f (x; r, p) = p (1 − p)x−r , x = r, r + 1, r + 2, . . . ,
r−1

Lo cual denotamos X ∼ BN(r, p).

Teorema 3.4.1 La media y varianza de una variable aleatoria que sigue la distribución binomial-
negativa son

r r(1 − p)
E[X] = , y V(X) = .
p p2

3.5 Distribución hipergeométrica


Definición 3.5.1 — Distribución hipergeométrica. La distribución de probabilidad de la variable
aleatoria hipergeométrica X, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona
de N artículos, en los que k se denomina éxito y N − k fracaso, es
k N−k
x n−x
f (x; N, n, k) = N
, máx{0, n − (N − k)} ≤ x ≤ mı́n{n, k}.
n

Lo cual denotamos X ∼ Hiper(N, n, k).

Teorema 3.5.1 La media y la varianza de la distribución hipergeométrica son


 
nk N − n nk k
E[X] = , y V(X) = 1− .
N N −1 N N
3.6 Distribución de Poisson 29
Definición 3.5.2 — Distribución hipergeométrica multivariada. Si N artículos se pueden dividir
en las k celdas A1 , A2 , . . . , Ak con a1 , a2 , . . . , ak elementos, respectivamente, entonces la distribución de
probabilidad de las variables aleatorias X1 , X2 , . . . , Xk , que representan el número de elementos que se
seleccionan de A1 , A2 , . . . , Ak en una muestra aleatoria de tamaño n, es
a1  a2  ak 
x x · · · xk
f (x1 , x2 , . . . , xk ; a1 , a2 , . . . , ak , N, n) = 1 2 N  ,
n

con ∑ki=1 xi = n y ∑ki=1 ai = N.

3.6 Distribución de Poisson


Definición 3.6.1 — Distribución de Poisson. La distribución de probabilidad de la variable aleatoria
de Poisson X, la cual representa el número de resultados que ocurren en un intervalo de tiempo dado o
región específicos y se denota con t, es

e−λt (λt)x
f (x; λt) = , x = 0, 1, 2, . . . ,
x!
donde λ es el número promedio de resultados por unidad de tiempo, distancia, área o volumen. Lo cual
denotamos X ∼ Poisson(λt).

Teorema 3.6.1 Tanto la media como la varianza de la distribución de Poisson son λt.

3.7 Ejercicios
1. La probabilidad que en cierto establecimiento in- más probable en un mes?
dustrial el consumo de energía eléctrica sea normal 3. Un geólogo ha recolectado 10 especímenes de roca
(es decir, no sobrepase un número determinado de basáltica y 10 de granito. Se instruye a un asistente
kW) en 24 horas es igual a 3/4. Determinar la dis- de laboratorio para que seleccione al azar 15 de los
tribución de probabilidad del número de días de especímenes para analizarlos.
consumo normal de energía eléctrica en un lapso de a) ¿Cuál es la función de probabilidad de espe-
seis días. ¿Cuál es la probabilidad que haya 4 días címenes de basalto seleccionado para anali-
de consumo normal? zarlos?
2. El número de computadoras que fallan por mes en b) ¿Cuál es la probabilidad de que todos los es-
un laboratorio de cómputo tiene una distribución pecímenes de uno de los dos tipos de roca
Poisson con un promedio mensual λ = 2 máquinas sean seleccionados para el análisis?
descompuestas. El laboratorio tiene capacidad pa- c) ¿Cuál es la probabilidad de que la cantidad
ra reparar hasta dos máquinas por mes. Cuando se de especímenes de granito seleccionados para
descomponen más de dos máquinas, las restantes su análisis esté a menos de una desviación
se envían fuera del laboratorio para su reparación. estándar de su valor promedio?
4. En una determinada región la distribución de los
a) ¿Cuál es la probabilidad de que en un mes
ingresos por familia en unidades monetarias (u.m.)
cualquiera sea necesario enviar máquinas fue-
es una variable aleatoria continua X con función de
ra del laboratorio para su reparación?
densidad dada por:
b) Responda el inciso anterior cuando se reduce
1
 x
la capacidad de reparación del laboratorio a  10 + 10 , si 0 ≤ x ≤ 2,
una computadora por mes. 3x 9
f (x) = − 40 + 20 , si 2 < x ≤ 6,
c) ¿Cuál es el número de computadoras con falla 
0 , en otro caso.
30 Capítulo 3. Distribuciones discretas

a) Calcule la probabilidad de que una familia ras 8 horas de operación de la máquina es 0,2; si
seleccionada al azar tenga ingresos entre 1 y supera las primeras 8 horas de operación, la pro-
3 u.m. babilidad de falla durante las siguiente 8 horas es
b) Se seleccionan familias al azar hasta encon- 0,4. Determine la probabilidad de que la máquina
trar tres con ingreso superior a 3 u.m. Hacien- funcione continuamente durante: (i) 8 horas, y (ii)
do los supuestos necesarios, determinar la 16 horas.
probabilidad de que sea necesario entrevistar 8. Una fábrica emplea un patrón de aceptación de los
a 5 familias. artículos producidos antes de embarcarlos. El plan
c) Suponga que se seleccionan 50 familias. Ha- consiste en el siguiente: cajas de 25 artículos son
ciendo los supuestos necesarios determine la preparados para su embarque; un inspector toma un
probabilidad de que al menos 3 tengan ingre- artículo al azar, lo inspecciona y lo devuelve a la
so inferior a 1 u.m. caja; un segundo y un tercero efectúan el mismo
5. El SEREMI de Salud de la Región de Atacama, a procedimiento. Si cualquiera de los tres inspectores
partir de una serie de denuncias sobre alimentos encuentra un artículo defectuoso, la caja no embar-
contaminados vendidos en una cadena de supermer- ca. ¿Cuál es la probabilidad de:
cados, a recolectado un total de 30 especímenes a) embarcar una caja que contenga tres artículos
de las cuales 10 están contaminados. Se instruye a defectuosos?
un asistente de laboratorio para que seleccione en b) no embarcar una caja que contiene sólo un
forma aleatoria 15 de los especímenes para anali- artículo defectuoso?
zarlos. 9. Se observa una fuente radioactiva durante 7 inter-
a) ¿Cuál es la función de probabilidad de es- valos de 10 segundos de duración cada uno y se
pecímenes contaminados seleccionados para cuenta el número de partículas emitidas durante ca-
analizarlos? da período. Suponiendo que el número de partículas
b) ¿Cuál es la probabilidad de que todos los es- emitidas, digamos X, durante cada período observa-
pecímenes contaminados sean seleccionados do tiene una distribución de Poisson con parámetro
para el análisis? λ = 5.
c) ¿Cuál es la probabilidad de que la cantidad de a) ¿Cuál es la probabilidad de que en cada uno
especímenes contaminados seleccionados pa- de los 7 intervalos de tiempo, sean emitidas 4
ra el análisis esté a menos de una desviación o más partículas?
estándar de su valor promedio? b) ¿Cuál es la probabilidad de que el menos en
6. Un examen consta de n preguntas con k alternati- uno de los 7 intervalos de tiempo, sean emiti-
vas cada una. Suponga que cierto alumno responde das 4 o más partículas?
cada pregunta de acuerdo al siguiente procedimien- 10. Se lanzan dos moneda honestas simultáneamente.
to: si sabe la alternativa correcta, entonces escoge Consideraremos que el lanzamiento fue un “éxito”
dicha alternativa con probabilidad 1; si no la sa- si las dos monedas muestran el resultado “cara”. De-
be, entonces escoge una al azar. Suponga que la fina la variable aleatoria X como aquella variable
probabilidad que el alumno sepa la respuesta co- que cuenta los lanzamientos necesarios para obtener
rrecta a una pregunta es p ∈ (0, 1), constante para dos éxitos, no necesariamente consecutivos.
todas las preguntas, y que las distintas preguntas se a) Determine el conjunto de valores que puede
responden en forma independiente. tomar la variable aleatoria X.
a) Obtenga la distribución de X, el número de b) Determine la función de probabilidad asocia-
preguntas respondidas correctamente. da a la variable aleatoria X.
b) Si una de estas preguntas, digamos la prime- c) Calcule la probabilidad que haya que lanzar-
ra, fue respondida correctamente, ¿cuál es la las más de tres veces.
probabilidad que el alumno haya sabido la 11. Una máquina produce artículos de tipo A y B si-
alternativa correcta? multáneamente; el productor afirma que la máquina
7. Una máquina es accionada por tres baterías, todas produce 2 artículos tipo B por cada 3 de tipo A. Una
del mismo tipo, y funcionará siempre que dos de persona somete a prueba y de un lote grande extrae
ellos trabajen adecuadamente. La probabilidad de estos artículos hasta lograr un artículo tipo A.
que una batería de este tipo falle durante las prime- a) Suponga que la persona decide comprar estos
3.7 Ejercicios 31

artículos si logra extraer un artículo A antes cajas, cada una contiene un número grande y fijo
de la cuarta extracción, ¿cuál es la probabili- de éstos, producidos por una máquina; por lo tanto,
dad que la persona compre estos artículos? el 40 % de las cajas contiene artículos producidos
b) Suponga que la persona compra si logra ex- por la máquina A y así sucesivamente. Las cajas
traer un artículo A antes de la tercera extrac- se almacenan juntas, sin que se pueda distinguir a
ción, ¿cuál es la probabilidad que no compre? qué máquina pertenecen los artículos que contienen.
12. En una población grande se sabe que el 10 % pade- Se escoge una caja al azar, y se toma una muestra
ce de cierta enfermedad rara. Con la finalidad de aleatoria de 100 artículos, de los cuales 4 son defec-
hacer un diagnóstico se necesitan 10 personas afec- tuosos. ¿Cuál es la probabilidad que provenga de la
tadas por dicha enfermedad para el análisis corres- máquina A? ¿Cuál es la probabilidad que proven-
pondiente. Defina X como el número de personas ga de la máquina B? ¿Cuál es la probabilidad que
seleccionadas hasta que se tenga las 10 personas provenga de la máquina C?
afectadas por la enfermedad. 17. Suponga que la probabilidad de que un motor falle
a) Encuentre la distribución de probabilidad de en un vuelo de rutina entre dos ciudades es 0,005.
la variable aleatoria X. Úsese la aproximación de Poisson a la distribución
b) Calcular la probabilidad de que se necesiten Binomial para encontrar aproximadamente la pro-
seleccionar exactamente 15 personas. babilidad de:
13. Una empresa manufacturera recibe un lote que con- a) por lo menos una falla en 1 000 vuelos.
tiene 100 artículos de los cuales cinco son defectuo- b) por lo menos dos fallas en 1 000 vuelos.
sos. La compañía revisa constantemente los lotes 18. Suponga que las moléculas de un gas raro se encuen-
que recibe para establecer la calidad del material. Si tra a razón promedio de 3 por cm3 de aire. Suponga
la calidad de un lote recibido es baja, regresa al pro- que las moléculas de este gas están distribuidas in-
veedor el lote completo. Suponga que la compañía dependientemente y al azar en el aire. Determinar el
recibe un lote y lo acepta si hay a lo más 1 artículo tamaño de la muestra (número de cm3 ) de aire que
defectuoso en una muestra de tamaño 6 sin reposi- se debe tomar para que la probabilidad de encontrar
ción. ¿Cuál es la probabilidad de que se acepte un al menos una molécula de este gas en la muestra
lote de 100 artículos que contenga 5 defectuosos? sea 0,99 como mínimo.
14. En un estudio biológico se emplea un grupo de 15 19. Un fabricante vende cierto artículo en lotes de 5 000
personas. El grupo contiene 5 personas con sangre piezas. De acuerdo con uno de sus clientes se adop-
tipo O, 6 con tipo A y 4 con tipo B. ¿Cuál es la pro- ta la siguiente regla de inspección: Se selecciona al
babilidad que una muestra aleatoria de 6 contenga azar una muestra de 100 artículos de cada lote que
2 personas con sangre tipo O, 3 con sangre tipo A se vende. Si la muestra contiene 4 o menos artículos
y 1 con tipo B? defectuosos, el cliente acepta el lote. Si se encuen-
15. En determinada empresa minera han ocurrido acci- tran más de 4 defectuosos se inspecciona cada uno
dentes a razón de 1 cada 2 meses. Suponiendo que de los artículos del lote. Si la inspección cuesta
ocurren en forma independiente. $75 dólares por cada 100 artículos, y el fabricante
a) ¿Cuál es el número esperado de accidentes al produce 2 % de artículos defectuosos, determine el
año? costo promedio de inspección por lote.
b) ¿Cuál es la desviación estándar del número 20. Se va ha probar un lote grande de artículos por el
de accidentes al año? siguiente método de muestro doble. En la primera
c) ¿Cuál es la probabilidad que no haya acciden- muestra se toman 20 artículos y si no hay artícu-
tes en determinado mes? los defectuosos, el lote se aprueba. Si hay 2 o más
16. Tres máquinas contribuyen a la producción de una artículos defectuosos, el lote se rechaza y si se en-
fábrica de cierto artículo. La máquina A produce cuentra 1 artículo defectuoso, se toma una segunda
3 % de artículos defectuosos y contribuye a la pro- muestra de 40 artículos siguiendo las siguientes
ducción total con un 40 %; la máquina B produce disposiciones: si sólo hay 1 o ningún artículo de-
4 % de artículos defectuosos y contribuye a la pro- fectuoso se aprueba el lote, en caso contrario se
ducción total con un 35 %; mientras que C produce rechaza. Si la proporción real de defectuosos en el
el 5 % de artículos defectuosos y 25 % de la pro- lote es 0,05 ¿cuál es la probabilidad de aceptar el
ducción total. Los artículos son almacenados en lote?
4. Distribuciones continuas

4.1 Distribución uniforme continua


Definición 4.1.1 — Distribución uniforme continua. La función de densidad de la variable aleatoria
uniforme continua X en el intervalo (a, b) ⊂ R es

1
f (x; a, b) = , a < x < b.
b−a
Lo cual denotamos X ∼ Unif(a, b).

Teorema 4.1.1 La media y la varianza de la distribución uniforme continua son

a+b (b − a)2
E[X] = , y V(X) = .
2 12

4.2 Distribución normal


Definición 4.2.1 — Distribución normal. La densidad de la variable aleatoria normal X, con media
µ ∈ R y varianza σ 2 > 0, es

1 (x−µ)2
2 −
f (x; µ, σ ) = √ e 2σ 2 , −∞ < x < ∞.
σ 2π

Lo cual denotamos X ∼ N(µ, σ 2 ).

Teorema 4.2.1 La media y la varianza de una variable aleatoria normal son µ y σ 2 , respectivamente.
Por lo tanto, la desviación estándar es σ .

Definición 4.2.2 La distribución de una variable aleatoria normal con media 0 y varianza 1 se llama
distribución normal estándar.

Teorema 4.2.2 Si X es una variable aleatoria binomial con media µ = np y varianza σ 2 = np(1 − p),
entonces la forma limite de la distribución es
X − np
Z=p ,
np(1 − p)

conforme n → ∞, es la distribución normal estándar.

Teorema 4.2.3 Sea X una variable aleatoria binomial con parámetros n y p. Para n → ∞ y p → 0,
entonces, X tiene distribución aproximadamente normal con µ = np y σ 2 = np(1 − p).
34 Capítulo 4. Distribuciones continuas

4.3 Distribución exponencial


Definición 4.3.1 — Distribución exponencial. La variable aleatoria continua X tiene una distribu-
ción exponencial, con parámetro θ > 0, si su función de densidad es dada por
1 −x/θ
f (x; θ ) = e , x > 0.
θ
Lo cual denotamos X ∼ Exp(θ ).

Teorema 4.3.1 La media y la varianza de la distribución exponencial son

E[X] = θ , y V(X) = θ 2 .

4.4 Distribución gamma


Definición 4.4.1 La función gamma se define como
Z ∞
Γ(α) = xα−1 e−x dx, para α > 0.
0

Definición 4.4.2 — Distribución gamma. La variable aleatoria continua X tiene una distribución
gamma, con parámetros α > 0 y β > 0, si su función de densidad está dada por
1
f (x; α, β ) = xα−1 e−x/β , x > 0,
β α Γ(α)

Lo cual denotamos X ∼ Gamma(α, β ).

Teorema 4.4.1 La media y la varianza de la distribución gamma son

E[X] = αβ , y V(X) = αβ 2 .

4.5 Distribución χ 2
Definición 4.5.1 — Distribución χ 2 . La variable aleatoria continua X tiene una distribución χ 2 , con
ν grados de libertad, si su función de densidad es dada por
1
f (x; ν) = xν/2−1 e−x/2 , x > 0,
2ν/2 Γ(ν/2)

donde ν es un entero positivo. Lo cual denotamos X ∼ χν2 .

Teorema 4.5.1 La media y la varianza de la distribución χ 2 son

E[X] = ν, y V(X) = 2ν.

4.6 Distribución beta


4.7 Distribución log-normal 35
Definición 4.6.1 La función beta es definida por
Z 1
Γ(a)Γ(b)
B(a, b) = xa−1 (1 − x)b−1 dx = , para a, b > 0.
0 Γ(a + b)

donde Γ(a) es la función gamma.

Definición 4.6.2 — Distribución beta. La variable aleatoria continua X tiene una distribución beta
con los parámetros a > 0 y b > 0, si su función de densidad es dada por
1
f (x; a, b) = xa−1 (1 − x)b−1 , 0 < x < 1.
B(a, b)

Lo cual denotamos X ∼ Beta(a, b).

Teorema 4.6.1 La media y la varianza de una distribución beta en la que los parámetros a y b son

a ab
E[X] = , y V(X) = 2
,
a+b (a + b) (a + b + 1)

respectivamente.

4.7 Distribución log-normal


Definición 4.7.1 — Distribución log-normal. La variable aleatoria continua X tiene una distribución
log-normal si la variable aleatoria Y = log(X) tiene distribución normal con media µ ∈ R y desviación
estándar σ > 0. La función de densidad de X que resulta es
1 − 1 (log(x)−µ)2
f (x; µ, σ 2 ) = √ e 2σ 2 , x > 0,
σ x 2π

Lo cual denotamos X ∼ LN(µ, σ 2 ).

Teorema 4.7.1 La media y la varianza de la distribución log-normal es


2 /2 2 2
E[X] = eµ+σ , y V(X) = e2µ+σ (eσ − 1).

4.8 Distribución Weibull


Definición 4.8.1 — Distribución Weilbull. La variable aleatoria continua X tiene una distribución
Weibull, con parámetros α > 0 y β > 0, si su función de densidad es dada por
β
f (x; α, β ) = αβ xβ −1 e−αx , x > 0.

Lo cual denotamos X ∼ Weibull(α, β ).


36 Capítulo 4. Distribuciones continuas

Teorema 4.8.1 La media y la varianza de la distribución Weibull son


      
−1/β 1 −2/β 2 2 1
E[X] = α Γ 1+ , y V(X) = α Γ 1+ −Γ 1+ .
β β β

Definición 4.8.2 La función de distribución acumulada para la distribución Weibull es dada por
β
F(x) = 1 − e−αx , x > 0,

para α > 0 y β > 0.

4.9 Distribución t-student


Teorema 4.9.1 — Distribución t-student. Sea Z una variable aleatoria normal estándar y V una
variable aleatoria χ 2 con ν grados de libertad. Si Z y V son independientes, entonces la distribución de
la variable aleatoria X, donde
Z
X=p ,
V /ν

es dada por la función de densidad


  − ν+1
Γ ν+1
x2 2
f (x; ν) = ν
2
√ 1+ , −∞ < x < ∞.
Γ 2 πν ν

Ésta se conoce como la distribución t con ν grados de libertad. Lo cual denotamos X ∼ tν .

Corolario 4.9.2 Sean X1 , X2 , . . . , Xn variables aleatorias independientes normales con media µ y


desviación estándar σ . Sea
1 n 2 1 n
X̄ = ∑ i
n i=1
X , y S = ∑ (Xi − X̄)2.
n − 1 i=1
x̄−µ
Entonces la variable aleatoria √
s/ n
tiene una distribución t con n − 1 grados de libertad.

4.10 Distribución F
Teorema 4.10.1 — Distribución F. Sean U y V dos variables aleatorias independientes que tienen
distribuciones χ 2 con ν1 y ν2 grados de libertad, respectivamente. Entonces, la distribución de la variable
aleatoria X = U/ν 1
V /ν es dada por la función de densidad
2

 ν1 /2 ν1 +ν2   −(ν1 +ν2 )/2


ν1 Γ 2 ν /2−1 ν1
f (x; ν1 , ν2 ) = ν1  ν2  x
1 1+ x , x > 0.
ν2 Γ 2 Γ 2
ν2

Ésta se conoce como la distribución F con ν1 y ν2 grados de libertad. Lo cual denotamos X ∼ Fν1 ,ν2 .
4.11 Ejercicios 37

4.11 Ejercicios
1. EL tiempo medio en minutos, que cierta persona si una componente dure menos de 400 horas, paga-
invierte en ir de su casa a la estación del tren es un rá una multa de M dólares. ¿Qué proceso deberá
fenómeno aleatorio con distribución uniforme en el usar?
intervalo de 20 a 25 minutos. ¿Cuál es la probabili- 5. Sea X el tiempo entre dos llegadas sucesivas en la
dad que alcance el tren que sale de la estación a las ventanilla de un banco local. Si X tiene una distri-
7 : 28 a.m. en punto, si sale de su casa exactamente bución exponencial con θ = 1/4.
a las 7 : 05 a.m. a) Calcule e interprete P(X ≤ 4) y P(2 ≤ X ≤
2. El petróleo es separado por destilación en tres dife- 5).
rentes productos, listado en la siguiente tabla: b) Calcule la probabilidad de que el tiempo entre
dos llegadas sucesivas esté a menos de una
Temperatura de Precio de venta desviación estándar el promedio.
Producto destilación (C◦ ) por galón ($) 6. El tiempo (en años) que un satélite permanece en
Gas menos de 20 C1 el espacio es una variable aleatoria exponencial T ,
Ether 20 − 60 C2 cuya función de distribución acumulada está dada
Ligroin 60 − 100 C3 por:

Suponga que C dólares es el costo de producir un F(t) = 1 − e−t/2 , t > 0.


galón de petróleo y la temperatura de destilación T
a) Encuentre la probabilidad que un satélite per-
está distribuida uniformemente en [0, 100]. Calcule
manezca en el espacio entre uno y tres años.
el beneficio neto esperado (por galón) para cada
b) ¿Cuál es la probabilidad que un satélite per-
producto.
manezca en el espacio más de 4 años?
3. La confiabilidad de un componente (o sistema) en
c) Si son lanzados 3 satélites simultáneamente,
el tiempo, denotémosla R(t), está definida como:
¿cuál es la probabilidad de que por lo menos
R(t) = P(T > t), uno permanezca en el espacio más de 4 años?
7. Si una compañía emplea n vendedores, sus ven-
en donde T es la duración del componente (o siste- tas brutas en miles de dólares se puede considerar
ma). Un tipo especial de sistema es en paralelo. En como una variable aleatoria que tiene una distribu-

este sistema las componentes están conectadas de ción gamma con α = 80 n y β = 2. Si el costo
tal manera que el sistema deja de funcionar sólo si de ventas es $8 000 dólares por vendedor, ¿cuántos
todas las componentes dejan de funcionar. vendedores debe emplear la compañía para maxi-
a) Suponiendo que el sistema en paralelo tiene mizar la utilidad esperada?
2 componentes los cuales funcionan indepen- 8. En cierta ciudad, el consumo diario de energía eléc-
dientemente, determine la confiabilidad del trica en millones de kilowatt-hora se puede tratar
sistema, R(t), en función de las confiabilida- como una variable aleatoria que tiene la distribución
des de las componentes, R1 (t) y R2 (t). gamma con α = 2 y β = 2. Si la planta generadora
b) Supongamos que la duración de los compo- de esta ciudad tiene una capacidad diaria de 12 mi-
nentes (en horas), T1 y T2 son variables aleato- llones de kilowatt-hora, ¿cuál es la probabilidad de
rias con distribuciones exponencial con media que esta oferta de energía sea inadecuada cualquier
igual a 100, calcule la confiabilidad, calcule día dado?
la confiabilidad del sistema para 10 horas. 9. Si la proporción anual de declaraciones erróneas de
4. Suponga que un fabricante tenga que decidir entre impuestos sometidas al SII se puede considerar una
dos procesos de fabricación de cierto componente variable aleatoria que tiene distribución beta con
electrónico. El costo del proceso A es de c dólares a = 2 y b = 9, ¿cuál es la probabilidad de que en
y del proceso B es kc dólares por unidad de compo- un año dado cualquiera habrá menos del 10 % de
nente, donde k > 1. Los componentes electrónicos declaraciones erróneas?
tiene un tiempo de falla exponencial con θA = 200 10. Si la proporción anual de nuevos restaurantes que
para los fabricados por el proceso A y θB = 300 pa- fracasan en una ciudad dada se puede considerar co-
ra B. El fabricante debe garantizar, de manera que, mo una variable aleatoria que tiene una distribución
38 Capítulo 4. Distribuciones continuas

beta con a = 1 y b = 4, encuentre: ta aleación está normalmente distribuida con media


a) la media de esta distribución, esto es, la pro- 80 y desviación estándar de 5 (la dureza Rockwell
porción anual de nuevos restaurantes que se se mide en una escala continua).
puede esperar que fracasen en la ciudad dada.
b) la probabilidad de que al menos 25 % por a) Si un espécimen es aceptable sólo si su dure-
ciento de todos los nuevos restaurantes fraca- za está entre 75 y 85, ¿cuál es la probabilidad
sen en la ciudad dada en un año cualquiera. de que un espécimen seleccionado aleatoria-
11. Un sistema cuenta con un gran número de compo- mente tenga una dureza aceptable?
nentes de un mismo tipo. Suponga que el tiempo b) Si la escala aceptable de dureza es (80 −
de falla T (medido en horas) de cualquiera de es- c, 80 + c), ¿para qué valor de c tendría una
tas componentes sigue una distribución normal con dureza aceptable el 98 % de todos los especí-
media igual a 100 horas y desviación estándar de menes?
20 horas. c) Si se seleccionan aleatoriamente especímenes
a) Calcule la probabilidad que una componente para examinar hasta encontrar 3 con una du-
cualquiera dure más de 110 horas. reza aceptable (considere que la escala de du-
b) Se desea dar una garantía de reemplazo para reza aceptable es como en el ítem (a)), ¿cuál
cualquier componente que dure menos de k es la probabilidad de tener que examinar 5
horas. Encuentre el valor de k para que la pro- especímenes?
babilidad de que se haga efectiva la garantía
sea sólo de un 1 %. 15. Sea X la variable aleatoria que mide el tiempo de
c) Considere 10 componentes con tiempos de funcionamiento en horas de cierta máquina. Se sa-
falla independientes. Calcule la probabilidad be que X se distribuye normalmente con media de
de que más de un componente dure menos de 720 hrs. y desviación estándar de 48 hrs. Suponga-
90 horas. mos además que, en el momento que la máquina
12. Una constructora usa piedras extraídas de cierto comienza a funcionar debemos decidir cuando un
terreno, donde el diámetro de las piedras tiene una técnico vendrá a inspeccionarla. Si llamamos al téc-
distribución normal con media 22 cm. y desviación nico antes de que falle, se ocasiona un costo de a
estándar de 5 cm. Las piedras sólo son útiles si su dólares por haber desperdiciado una inspección. Si
diámetro se encuentra entre 15 y 30 cm. llamamos al técnico después de que la máquina ha
a) Calcule la probabilidad que una piedra extraí- fallado, se ocasiona un costo de b dólares por el no
da de este terreno sea útil. funcionamiento de la máquina.
b) Si se extrajeron 10 piedras, calcule la proba-
bilidad de que 8 o más piedras sean útiles. a) Determine una expresión para el costo espe-
13. En una cierta ciudad se decide instalar 2 000 lámpa- rado, considerando que el tiempo hasta que el
ras eléctricas en sus calles. Si la vida útil de estas técnico es llamado a inspeccionar la máquina
lámparas obedece a una distribución normal con es de t horas.
media µ = 1 000 horas y una desviación estándar b) Suponga que el técnico es llamado en un tiem-
σ = 200 horas. po de t = 816 hrs. Calcule la probabilidad de
a) ¿Cuál es el número estimado de bajas en las que el inspector llegue tarde a la inspección,
primeras 700 horas de alumbrado? es decir, la máquina ya ha dejado de funcio-
b) ¿Qué número de lámparas estima usted que nar.
fallarán entre 900 y 1 300 horas de alumbra- c) Se observa este proceso durante 15 períodos.
do? Determine la probabilidad de que el técnico
c) ¿Después de cuántas horas de alumbrado llegue tarde más de 12 veces.
aproximadamente el 10 % de las lámparas de-
ja de funcionar? 16. Un combustible para cohetes va a contener cierto
14. La dureza Rockwell de un metal se determina al porcentaje (digamos X) de un compuesto particular.
golpear con un punto acerado la superficie del metal Las especificaciones exigen que X esté entre 30 y
y después se mide la profundidad de penetración 35 por ciento. El fabricante tendrá una utilidad neta
del punto. Suponga que la dureza Rockwell de cier- en el combustible (por galón) que es la siguiente
4.11 Ejercicios 39

función de X: b) Calcular la proporción de estudiantes que tie-


 nen puntuaciones que exceden por lo menos

 0,05 , si 25 < X < 30, en cinco puntos de la puntuación que marca
0,10 , si 30 ≤ X ≤ 35,

la frontera entre “apto” y “no apto” (son de-
T (X) =

 0,05 , si 35 < X < 40, clarados “no aptos” el 25 % de los estudiantes
−0,10 , en otro caso.

que obtuvieron las puntuaciones más bajas).
c) De cinco estudiantes seleccionados al azar,
Si X tiene distribución N(33, 9), calcule E[T ]. ¿cuál es la probabilidad de que al menos dos
tengan una puntuación inferior a 65?
17. El departamento de control de calidad de una fabri- 19. La especificación con la que se fabrican los tornillos
ca de baterías, a determinado que la duración pro- de acero de sección transversal circular requiere que
medio de éstas es de tres años con una desviación sus longitudes se encuentren entre 8,45 y 8,65 cm.
estándar de 0,5 años. Suponiendo que la duración y sus diámetros entre 1,55 y 1,60 cm. Los tornillos
de las baterías tiene distribución normal. producidos por cierta máquina tienen longitudes
a) ¿Qué porcentaje de baterías tiene una dura- que siguen una distribución normal con media 8,65
ción entre 2, 5 y 4 años? cm. y desviación estándar de 0,05 cm. y diáme-
b) Se desea dar una garantía de reemplazo para tros que siguen también una distribución normal
cualquier batería que dure menos de k años. independiente con media 1,58 cm. y desviación es-
Encuentre el valor de k para que la probabi- tándar 0,001 cm. Determine los siguientes datos
lidad de que se haga efectiva la garantía, sea para tornillos que fabrica esta máquina:
sólo en un 25 % casos. a) El porcentaje que estará fuera de los límites
c) El departamento de control de calidad a deter- de longitud especificados.
minado que aquellas baterías con vida inferior b) El porcentaje que estará fuera de los límites
a 2, 67 años tendrán derecho a la garantía de especificados de diámetro.
reemplazo. De 5 clientes cual es la probabi- c) El porcentaje que no cubra la especificación.
lidad, de que, no más de dos hagan uso de la 20. Suponga que X es la resistencia a la ruptura de una
garantía. cuerda (en libras) tiene distribución normal con me-
18. Se supone que los resultados de un examen siguen dia 100 y varianza 16. Cada 100 pies de alambre
una distribución normal con media 78 y desviación para cuerda produce una utilidad de $25 dólares, si
estándar de 36. X > 95. Si X ≤ 95, la cuerda puede utilizarse con
a) ¿Cuál es la probabilidad de que una perso- un objetivo diferente y se obtiene una utilidad de
na que se presenta al examen obtenga una $10 por alambre. Encuentre la utilidad esperada por
calificación superior a 72? alambre.
II
Estadística

5 Estimación puntual . . . . . . . . . . . . . . 43
5.1 Conceptos generales
5.2 Métodos de estimación puntual
5.3 Ejercicios

6 Estimación por intervalos . . . . . . . 47


6.1 Estimación de la media
6.2 Estimación de la diferencia entre dos medias
6.3 Estimación de la proporción
6.4 Estimación de la diferencia de dos proporciones
6.5 Estimación de la varianza
6.6 Estimación de la proporción de varianzas
6.7 Ejercicios

7 Pruebas de hipótesis . . . . . . . . . . . . 53
7.1 Conceptos generales
7.2 Pruebas sobre la media
7.3 Ejercicios
5. Estimación puntual

5.1 Conceptos generales


Definición 5.1.1 Una estimación puntual de un parámetro θ es un número único que puede ser con-
siderado como un valor sensible de θ . Se obtiene una estimación puntual seleccionando un estadístico
apropiado y calculando su valor con los datos muestrales datos. El estadístico seleccionado se llama
estimador puntual de θ .

Definición 5.1.2 Se dice que un estimador puntual θ̂ es un estimador insesgado de θ si E[θ̂ ] = θ


con todo valor posible de θ . Si θ̂ no es insesgado, la diferencia E[θ̂ ] − θ se conoce como el sesgo de θ̂ .

Definición 5.1.3 — Principio de estimación insesgada. Cuando se elige entre varios estimadores
diferentes de θ , se elige uno insesgado.

Definición 5.1.4 — Principio de estimación insesgada con varianza mínima. Entre todos los
estimadores de θ insesgados, se selecciona el de varianza mínima. El θ̂ resultante se llama estimador
insesgado con varianza mínima (EIVM) de θ .
q
Definición 5.1.5 El error estándar de un estimador θ̂ es su desviación estándar σθ̂ = V(θ̂ ). Si el
error estándar implica parámetros desconocidos cuyos valores pueden ser estimados, la sustitución de
estas estimaciones en σθ̂ da el error estándar estimado (desviación estándar estimada) del estimador.
El error estándar estimado puede ser denotado o por σ̂θ̂ .
44 Capítulo 5. Estimación puntual

5.2 Métodos de estimación puntual


Definición 5.2.1 Si X1 , X2 , . . . , Xn constituyen una muestra aleatoria proveniente de una función de
masa de probabilidad o de una función de densidad de probabilidad f (x). Con k = 1, 2, 3, . . . el k-ésimo
momento de la población o el k-ésimo momento de la distribución f (x), es E[X k ]. El k-ésimo
momento muestral es (1/n) ∑ni=1 Xik .

Definición 5.2.2 — Método de momentos. Si X1 , X2 , . . . , Xn son una muestra aleatoria de una distri-
bución con función de masa de probabilidad o función de densidad de probabilidad f (x; θ1 , θ2 , . . . , θm ),
donde θ1 , θ2 , . . . , θm son parámetros cuyos valores son desconocidos. Entonces, los estimadores de
momento θ̂1 , θ̂2 , . . . , θ̂m se obtienen igualando los primeros m momentos muestrales con los primeros
m momentos de la población correspondientes y resolviendo para θ1 , θ2 , . . . , θm .

Definición 5.2.3 — Método de máxima verosimilitud. Si X1 , X2 , . . . , Xn son una muestra aleatoria


de una distribución con función de masa de probabilidad o función de densidad de probabilidad
f (x; θ1 , θ2 , . . . , θm ), donde θ1 , θ2 , . . . , θm son parámetros cuyos valores son desconocidos. Cuando
x1 , x2 , . . . , xn son los valores muestrales observados, se define la función de verosimilitud
n
L(θ1 , θ2 , . . . , θm ) = ∏ f (xi ; θ1 , θ2 , . . . , θm ).
i=1

Las estimaciones de máxima verosimilitud (EMV) θ̂1 , θ̂2 , . . . , θ̂m son aquellos valores de las θi que
incrementan al máximo la función de verosimilitud, de modo que

L(θ̂1 , θ̂2 , . . . , θ̂m ) ≥ L(θ1 , θ2 , . . . , θm ), con todos los θ1 , θ2 , . . . , θm .

Definición 5.2.4 — Principio de invarianza. Sea θ̂1 , θ̂2 , . . . , θ̂m los estimadores de máxima verosi-
militud de los parámetros θ1 , θ2 , . . . , θm . Entonces, el estimador de máxima verosimilitud de cualquier
función h(θ1 , θ2 , . . . , θm ) de estos parámetros es la función h(θ̂1 , θ̂2 , . . . , θ̂m ) de los estimadores de
máxima verosimilitud.

5.3 Ejercicios
1. Considere una muestra aleatoria X1 , . . . , Xn , con fun- Encuentre el EMV de θ .
ción de densidad de probabilidad dada por: 4. Considere una muestra aleatoria X1 , . . . , Xn , con fun-
1 1 ción de masa de probabilidad dada por:
f (x; θ ) = 1, θ −
<x<θ+ .
2 2
 
r+x−1 r
f (x; r, p) = p (1 − p)x ,
Encuentre el EMV de θ . x
2. Considere una muestra aleatoria X1 , . . . , Xn , con fun-
con x = 0, 1, 2, . . . y donde 0 < p < 1 y r = 1, 2, . . . ,
ción de densidad de probabilidad dada por:
es decir, X tiene distribución binomial-negativa de
f (x; λ ) = λ 2 xe−λ x , x > 0, λ > 0. parámetros p y r. Utilice el método de momentos
para hallar los estimadores de p y r.
Encuentre un estimador para el parámetro λ usan-
5. Considere una muestra aleatoria X1 , . . . , Xn , con fun-
do: a) El método de momentos. b) El método de
ción de densidad de probabilidad dada por:
máxima verosimilitud.
3. Considere una muestra aleatoria X1 , . . . , Xn , con fun- Γ(a + b) a−1
f (x; a, b) = x (1 − x)b−1 , 0 < x < 1,
ción de densidad de probabilidad dada por: Γ(a)Γ(b)
f (x; θ ) = θ (1 − x)θ −1 , 0 < x < 1, θ > 0. donde a > 0 y b > 0, es decir, X tiene distribución
5.3 Ejercicios 45

beta de parámetros a y b. Utilice el método de mo- 12. Sea X1 , . . . , Xn una muestra aleatoria de tamaño n
mentos para hallar los estimadores de a y b. de la variable aleatoria X con función de densidad
6. Considere una muestra aleatoria X1 , . . . , Xn con fun- de probabilidad dada por:
ción de densidad de probabilidad dada por:
1
2 f (x; θ ) = , θ < x < 5.
x − 2x
5 − θ
f (x; θ ) = 2 e 2θ , x ≥ 0, θ > 0.
θ
donde θ > 0. Se proponen los siguientes estimado-
a) Encuentre el EMV de θ . res para θ : (i) θ̂1 = 2X̄ − 5, y (ii) θ̂2 = X(1) . ¿Cuál
b) Calcule el sesgo del estimador de θ . estimador (θ̂1 ó θ̂2 ) es preferible considerar?
7. Considere una muestra aleatoria X1 , . . . , Xn con fun- 13. Sea X la proporción de tiempo asignado que un
ción de densidad de probabilidad dada por: estudiante seleccionado al azar utiliza trabajando
1 − 1 (log x−µ)2
en una determinada prueba de aptitud. Supongamos
f (x; µ, σ 2 ) = √ e 2σ 2 , x > 0, que la función de densidad de probabilidad de X es:
x 2πσ 2
donde µ ∈ R y σ 2 > 0. Encuentre los EMV de µ y f (x; θ ) = (θ + 1)xθ , 0 ≤ x ≤ 1,
σ 2.
donde −1 < θ . Una muestra de diez estudiantes
8. Considere una muestra aleatoria X1 , . . . , Xn con fun-
produce los datos x1 = 0,92, x2 = 0,79, x3 = 0,90,
ción de densidad de probabilidad dada por:
x4 = 0,65, x5 = 0,86, x6 = 0,47, x7 = 0,73, x8 =
1 0,97, x9 = 0,94, x10 = 0,77. Use el método de mo-
f (x; θ ) = , 0 ≤ x ≤ θ .
θ mentos y máxima verosimilitud para obtener el esti-
mador de θ y calcule el estimador correspondiente
Estudie el sesgo del EMV de θ .
con los datos dados.
9. Considere una muestra aleatoria X1 , . . . , Xn con fun-
14. Considere una muestra aleatoria X1 , . . . , Xn , con fun-
ción de densidad de probabilidad dada por:
ción de densidad dada por:
θ
f (x; θ ) = 2 , x > θ > 0. 1
x f (x; θ ) = 2 xe−x/θ , x > 0, θ > 0.
θ
Estudie el sesgo del EMV de θ .
10. Suponga que la variables aleatoria T , representa el Se proponen los siguientes estimadores para el pa-
tiempo de falla (en horas) de un instrumento elec- rámetro θ :
trónico, que tiene la siguiente función de densidad 1 n 1 n
de probabilidad: θ̂ 1 = ∑ Xi , y θ̂ 2 = ∑ Xi
2n i=1 n i=1
f (t; α, β ) = β e−β (t−α) , t > α > 0, Calcule e interprete el sesgo en ambos casos.
15. Considere una muestra aleatoria X1 , . . . , Xn , con fun-
es decir, T tiene una distribución exponencial trun-
ción de densidad dada por:
cada a la izquierda en α. Suponga además que se
prueban n artículos y que se registra los tiempos de 
x−α , si α < x < α + 1,

falla t1 , . . . ,tn . Encuentre los estimadores de máxi- f (x; α) = −x + α + 2 , si α + 1 ≤ x < α + 2,
ma verosimilitud de α y β . 
0 , en otro caso.
11. Considere una muestra aleatoria X1 , . . . , Xn , con fun-
ción de densidad de probabilidad por: Se proponen los siguientes estimadores para el pa-
rámetro α:
f (x; λ ) = λ 2 xe−λ x , x > 0, λ > 0.
1 n 1 n
Encuentre el EMV de λ . Además, calcule el ses- α̂1 = ∑ Xi , y α̂2 = ∑ (Xi − 1).
n i=1 n i=1
go y el error cuadrático medio para el estimador
encontrado. Calcule e interprete el sesgo en ambos casos.
6. Estimación por intervalos

6.1 Estimación de la media


Definición 6.1.1 — Intervalo de confianza de µ cuando se conoce σ 2 . Si x̄ es la media de una
muestra aleatoria de tamaño n de una población de la que se conoce su varianza σ 2 , lo que da un
intervalo de confianza de 100(1 − α) % para µ es
σ σ
x̄ − zα/2 √ < µ < x̄ + zα/2 √ ,
n n

donde zα/2 es tal que P(Z > zα/2 ) = α/2, con Z ∼ N(0, 1).

Teorema 6.1.1 Si utilizamos x̄ como una estimación de µ, podemos tener 100(1 − α) % de confianza
en que el error no excederá a zα/2 √σn .

Teorema 6.1.2 Si usamos x̄ como una estimación de µ, podemos tener 100(1 − α) % de confianza en
que el error no excederá a una cantidad específica ` cuando el tamaño de la muestra sea
2
zα/2 σ

n= .
`

Definición 6.1.2 — Límites de confianza unilaterales de µ cuando se conoce el valor de σ 2 . Si


x̄ es la media de una muestra aleatoria de tamaño n a partir de una población con varianza σ 2 , los
límites de confianza unilaterales del 100(1 −√ α) % para µ son dados por
Límite unilateral superior: x̄ + zα σ /√n,
Límite unilateral inferior: x̄ − zα σ / n.

Definición 6.1.3 — Intervalo de confianza de µ cuando se desconoce σ 2 . Si x̄ y s son la media


y la desviación estándar de una muestra aleatoria de una población normal de la que se desconoce su
varianza σ 2 , un intervalo de confianza del 100(1 − α) % para µ es
s s
x̄ − tn−1,α/2 √ < µ < x̄ + tn−1,α/2 √ ,
n n

donde tn−1,α/2 es tal que P(T > tn−1,α/2 ) = α/2, con T ∼ tn−1 .

Definición 6.1.4 — Intervalo de predicción cuando se conoce σ 2 . Para una distribución normal
de mediciones con media µ desconocida y varianza σ 2 conocida, un intervalo de predicción del
48 Capítulo 6. Estimación por intervalos

100(1 − α) % de una observación futura x0 es


r r
1 1
x̄ − zα/2 σ 1 + < x0 < x̄ + zα/2 σ 1 + ,
n n
donde zα/2 es tal que P(Z > zα/2 ) = α/2, con Z ∼ N(0, 1).

Definición 6.1.5 — Intervalo de predicción cuando se desconoce σ 2 . Para una distribución


normal de mediciones con media µ y la varianza σ 2 se desconocen, un intervalo de predicción del
100(1 − α) % de una observación futura x0 es
r r
1 1
x̄ − tn−1,α/2 s 1 + < x0 < x̄ + tn−1,α/2 s 1 + ,
n n
donde tn−1,α/2 es tal que P(T > tn−1,α/2 ) = α/2, con T ∼ tn−1 .

6.2 Estimación de la diferencia entre dos medias


Definición 6.2.1 — Intervalo de confianza para µ1 − µ2 cuando se conocen σ12 y σ22 . Si x̄1 y x̄2
son las medias de muestras aleatorias independientes de tamaño n1 y n2 , de poblaciones que tienen
varianzas conocidas σ12 y σ22 , respectivamente, un intervalo de confianza del 100(1 − α) % para µ1 − µ2
es dada por
s s
2
σ1 σ2 2 σ12 σ22
(x̄1 − x̄2 ) − zα/2 + < µ1 − µ2 < (x̄1 − x̄2 ) + zα/2 + ,
n1 n2 n1 n2

donde zα/2 es tal que P(Z > zα/2 ) = α/2, con Z ∼ N(0, 1).

Definición 6.2.2 — Estimado agrupado de la varianza.

(n1 − 1)S12 + (n2 − 1)S22


S2p = .
n1 + n2 − 2

Definición 6.2.3 — Intervalo de confianza para µ1 − µ2 cuando se desconocen σ12 = σ22 . Si x̄1 y
x̄2 son las medias de muestras aleatorias independientes de tamaño n1 y n2 , respectivamente, tomadas de
poblaciones más o menos normales con varianzas iguales pero desconocidas, un intervalo de confianza
del 100(1 − α) % para µ1 − µ2 es dado por
r r
1 1 1 1
(x̄1 − x̄2 ) − tn1 +n2 −2,α/2 s p + < µ1 − µ2 < (x̄1 − x̄2 ) + tn1 +n2 −2,α/2 s p + ,
n1 n2 n1 n2
donde s p es la estimación agrupada de la desviación estándar de la población y tn1 +n2 −2,α/2 es tal que
P(T > tn1 +n2 −2,α/2 ) = α/2, con T ∼ tn1 +n2 −2 .

Definición 6.2.4 — Intervalo de confianza para µ1 − µ2 cuando se desconocen σ12 6= σ22 . Si x̄1
y s21 y x̄2 y s22 son las medias y varianzas de muestras aleatorias independientes de tamaños n1 y n2 ,
respectivamente, tomadas de poblaciones aproximadamente normales con varianzas desconocidas y
6.3 Estimación de la proporción 49

diferentes, un intervalo de confianza aproximado del 100(1 − α) % para µ1 − µ2 es dado por


s s
2 2
s1 s2 s21 s22
(x̄1 − x̄2 ) − tν,α/2 + < µ1 − µ2 < (x̄1 − x̄2 ) + tν,α/2 + ,
n1 n2 n1 n2

donde tν,α/2 es tal que P(T > tν,α/2 ) = α/2, con T ∼ tν y

(s21 /n1 + s22 /n2 )2


ν= .
(s21 /n1 )2 (s22 /n2 )2
n1 −1 + n2 −1

Definición 6.2.5 — Intervalo de confianza para observaciones pareadas. Si d¯ y sd son la media


y la desviación estándar, respectivamente, de las diferencias distribuidas normalmente de n pares
aleatorios de mediciones, un intervalo de confianza del 100(1 − α) % para µd = µ1 − µ2 es
sd sd
d¯ − tn−1,α/2 √ < µd < d¯ + tn−1,α/2 √ ,
n n

donde tn−1,α/2 es tal que P(T > tn−1,α/2 ) = α/2, con T ∼ tn−1 .

6.3 Estimación de la proporción


Definición 6.3.1 — Intervalo de confianza para p. Si p̂ es la proporción de éxitos en una muestra
aleatoria de tamaño n, un intervalo de confianza aproximado del 100(1 − α) % para el parámetro p se
obtiene por medio de
r r
p̂(1 − p̂) p̂(1 − p̂)
p̂ − zα/2 < p < p̂ + zα/2 .
n n
donde zα/2 es tal que P(Z > zα/2 ) = α/2, con Z ∼ N(0, 1).

Teorema 6.3.1 Si p̂ se utiliza un estimado de p, podemos tener un 100(1 − α) % de confianza en que


el error será menos que una cantidad específica ` cuando el tamaño de la muestra sea aproximadamente

z2α/2 p̂(1 − p̂)


n= .
`2

6.4 Estimación de la diferencia de dos proporciones


Definición 6.4.1 — Intervalo de confianza para p1 − p2 . Si p̂1 y p̂2 son las proporciones de éxitos
en muestras aleatorias de tamaños n1 y n2 , respectivamente, un intervalo de confianza aproximado del
100(1 − α) % para la diferencia p1 − p2 es dado por
s s
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 ) p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
( p̂1 − p̂2 )−zα/2 + < p1 − p2 < ( p̂1 − p̂2 )+zα/2 +
n1 n2 n1 n2

donde zα/2 es tal que P(Z > zα/2 ) = α/2, con Z ∼ N(0, 1).
50 Capítulo 6. Estimación por intervalos

6.5 Estimación de la varianza


Definición 6.5.1 — Intervalo de confianza para σ 2 . Si s2 es la varianza de una muestra aleatoria de
tamaño n de una población normal, un intervalo de confianza del 100(1 − α) % para σ 2 es

(n − 1)s2 2 (n − 1)s2
2
< σ < 2
,
χn−1,α/2 χn−1,1−α/2

2
donde χn−1,α/2 2
y χn−1,1−α/2 2
son tal que P(χ > χn−1,α/2 2
) = α/2 y P(χ > χn−1,1−α/2 ) = 1 − α/2, con
2 .
χ ∼ χn−1

6.6 Estimación de la proporción de varianzas


Definición 6.6.1 — Intervalo de confianza para σ12 /σ22 . Si s21 y s22 son las varianzas de muestras
independientes de tamaño n1 y n2 , respectivamente, tomadas de poblaciones normales, entonces un
intervalo de confianza del 100(1 − α) % para σ12 /σ22 es

s21 1 σ12 s21


< < fn −1,n1 −1,α/2 ,
s22 fn1 −1,n2 −1,α/2 σ22 s22 2

donde fn1 −1,n2 −1,α/2 es tal que P(F > fn1 −1,n2 −1,α/2 ) = α/2, con F ∼ Fn1 −1,n2 −1 , y fn2 −1,n1 −1,α/2 es
tal que P(F > fn2 −1,n1 −1,α/2 ) = α/2, con F ∼ Fn2 −1,n1 −1 .

6.7 Ejercicios
1. Una empresa de material eléctrico fabrica lámparas con una desviación estándar de 3 900 kilómetros.
eléctricas que tienen una duración distribuida de for- Suponga que la distribución de las mediciones es
ma aproximadamente normal, con una desviación aproximadamente normal.
estándar de 40 horas. Si una muestra de 30 lámpa- a) Construya un intervalo de confianza del 99 %
ras eléctricas tiene una duración promedio de 780 para el número promedio de kilómetros que
horas, calcule un intervalo de confianza del 96 % un propietario de un automóvil conduce
para la media de la población de todas las lámparas anualmente en la región.
eléctricas producidas por esta empresa. b) ¿Qué podemos afirmar con un 99 % de con-
2. Las estaturas de una muestra aleatoria de 50 estu- fianza acerca del posible tamaño del error, si
diantes universitarios tienen una media de 174,5 estimamos que los propietarios de automóvi-
centímetros y una desviación estándar de 6,9 centí- les conducen un promedio de 23 500 kilóme-
metros. tros por año?
a) Construya un intervalo de confianza del 98 % 4. ¿Qué tan grande debe ser la muestra en el ejercicio
para la estatura media de todos los estudiantes (1) si deseamos tener un 96 % de confianza en que
universitarios. nuestra media muestral estará dentro de 10 horas a
b) ¿Qué podemos afirmar con una confianza partir de la media verdadera?
del 98 % acerca del posible tamaño de nues- 5. Un experto en eficiencia desea determinar el tiempo
tro error, si estimamos que la estatura media promedio que toma perforar tres hoyos en cierta pla-
de todos los estudiantes universitarios es de ca metálica. ¿De que tamaño debe ser una muestra
174,5 centímetros? para tener un 95 % de confianza en que esta media
3. Una muestra aleatoria de 100 propietarios de auto- muestral estará dentro de 15 segundos de la media
móviles de la región revela que éstos conducen su verdadera? Suponga que por estudios previos se
automóvil, en promedio, 23 500 kilómetros por año, sabe que σ = 40 segundos.
6.7 Ejercicios 51

6. Una máquina produce piezas metálicas de forma Una muestra aleatoria de 100 piezas se sumerge
cilíndrica. Se toma una muestra de las piezas y los en un baño por 24 horas sin el tratamiento, lo que
diámetros son: 1,01; 0,97; 1,03; 1,04; 0,99; 0,98; produce un promedio de 12,2 milímetros de metal
0,99; 1,01 y 1,03 centímetros. Calcule un intervalo eliminados y una desviación estándar muestral 1,1
de confianza del 99 % para la media del diámetro milímetros. Una segunda muestra de 200 piezas se
de las piezas que se manufacturan con esta má- somete al tratamiento, seguido de 24 horas de in-
quina. Suponga una distribución aproximadamente mersión en el baño, lo que da como resultado una
normal. eliminación promedio de 9,1 milímetros de metal,
7. En un estudio para determinar la dureza de Rock- con una desviación estándar muestral 0,9 milíme-
well en la cabeza de alfileres para costuras se toma tros. Calcule un intervalo de confianza del 98 %
una muestra aleatoria de 12. Se toman mediciones para la diferencia entre las medias de las pobla-
de la dureza de Rockwell para cada una de las 12 ciones. ¿El tratamiento parece reducir la cantidad
cabezas y se obtiene un valor promedio de 48,50, media del metal eliminado?
con una desviación estándar muestral de 1,5. Su- 12. En un proceso químico por lotes se comparan los
ponga que las mediciones se distribuyen de forma efectos de dos catalizadores sobre la potencia de
normal y con base en esto construya un interva- la reacción del proceso. Se prepara una muestra de
lo de confianza de 90 % para la dureza media de 12 lotes utilizando el catalizador 1 y una muestra
Rockwell. de 10 lotes utilizando el catalizador 2. Los 12 lotes
8. Se registran las siguientes mediciones del tiempo para los que se utilizó el catalizador 1 en la reacción
de secado, en horas, de cierta marca de pintura viní- dieron un rendimiento promedio de 85 con una des-
lica: viación estándar muestral de 4; en tanto que para
la segunda muestra, la de 10 lotes, el promedio fue
3,4 2,5 4,8 2,9 3,6
de 81, con una desviación estándar muestral de 5.
2,8 3,3 5,6 3,7 2,8
Calcule un intervalo de confianza del 90 % para la
4,4 4,0 5,2 3,0 4,8
diferencia entre las medias de la población, supo-
Suponga que las mediciones representan una mues- niendo que las poblaciones se distribuyen de forma
tra aleatoria de una población normal y con base en aproximadamente normal y que tienen varianzas
esto calcule el intervalo de confianza del 95 % para iguales.
el tiempo de secado. 13. Una empresa de taxis trata de decidir si compraría
9. Una muestra aleatoria de tamaño n1 = 25, tomada neumáticos de la marca A o de la marca B para su
de una población normal con una desviación están- flotilla de taxis. Para estimar la diferencia entre las
dar σ1 = 5, tiene una media x̄1 = 80. Una segunda dos marcas realiza un experimento utilizando 12
muestra aleatoria de tamaño n2 = 36, que se toma neumáticos de cada marca, los cuales utiliza hasta
de una población normal diferente con una des- que se desgastan. Los resultados son:
viación estándar σ2 = 3, tiene una media x̄2 = 75.
Calcule un intervalo de confianza del 94 % para
Marca A: x̄A = 36 300 kilómetros
µ1 − µ2 .
sA = 5 000 kilómetros
10. Se comparan las resistencias de dos clases de hilo.
Marca B: x̄B = 38 100 kilómetros
Se prueban 50 piezas de cada clase de hilo en condi-
sB = 6 100 kilómetros
ciones similares. La marca A tiene una resistencia
a la tensión promedio de 78,3 kilogramos, con una
desviación estándar de 5,6 kilogramos; en tanto que Calcule un intervalo de confianza del 95 % para
la marca B tiene una resistencia a la tensión prome- µA − µB , suponiendo que las poblaciones se distri-
dio de 87,2 kilogramos con una desviación estándar buyen de forma aproximadamente normal. Puede
de 6,3 kilogramos. Construya un intervalo de con- no suponer que las varianzas son iguales.
fianza del 95 % para la diferencias de las medias de 14. Con referencia al ejercicio anterior, calcule un in-
la población. tervalo de confianza del 99 % para µA − µB si se
11. Se realiza un estudio para determinar si cierto tra- asignan al azar neumáticos de las dos marcas a las
tamiento tiene algún efecto sobre la cantidad de ruedas traseras izquierda y derecha de 8 taxis y se
metal que se elimina en una operación de encurtido. registran las siguientes distancias, en kilómetros:
52 Capítulo 6. Estimación por intervalos
Taxi Marca A Marca B za del 95 % para σ 2 , después decida si la afirmación
1 34 400 36 700 del fabricante de que σ 2 = 1 es válida. Suponga que
2 45 500 46 800 las duraciones de las baterías se distribuye de forma
3 36 700 37 700 aproximadamente normal.
4 32 000 31 100 19. Una muestra aleatoria de 20 estudiantes obtuvo una
5 48 400 47 800 media de x̄ = 72 y una varianza de s2 = 16 en un
6 32 800 36 400 examen universitario. Suponga que las calificacio-
7 38 100 38 900 nes se distribuyen normalmente y con base en esto
8 30 100 31 500 construya un intervalo de confianza del 98 % para
Suponga que las diferencias de las distancias se σ 2.
distribuyen de forma aproximadamente normal. 20. Se llevó a cabo un experimento para determinar si
15. En una muestra aleatoria de 1 000 viviendas en cier- el acabado superficial tiene un efecto en el límite de
ta ciudad se encuentra que 228 utilizan diesel como resistencia a la fatiga del acero. Una teoría indica
combustible para la calefacción. Calcule un inter- que el pulido aumenta el límite medio de resistencia
valo de confianza del 99 % para la proporción de a la fatiga (para la flexión inversa). Desde un punto
viviendas es esta ciudad que utilizan diesel con el de vista práctico, el pulido no debería tener efecto
fin mencionado. alguno sobre la desviación estándar del límite de
16. Un fabricante de smartphone utiliza un conjunto de resistencia a la fatiga, el cual se sabe, a partir de la
pruebas exhaustivas para evaluar el funcionamiento realización de diversos experimentos de límite de
electrónico de su producto. Todos los smartphone resistencia a la fatiga, que es de 4 000 psi. Se reali-
deben pasar todas las pruebas antes de ser puestos a za un experimento sobre acero al carbono al 0,4 %
la venta. De una muestra aleatoria de 500 smartpho- usando especímenes sin pulido y especímenes con
ne, 15 no pasan una o más de las pruebas. Calcule pulido suave. Los datos son los siguientes:
un intervalo de confianza del 90 % para la propor- Límite de fatiga (psi)
ción de los smartphone de la población que pasan Acero Acero al carbono
todas las pruebas. al carbono al 0,4 % al 0,4 % sin pulir
17. Una encuesta de 1 000 estudiantes reveló que 274 85 500 82 600
eligen al equipo de fútbol A como su equipo favo- 91 900 82 400
rito. En 2010 se realizó una encuesta similar con 89 400 81 700
760 estudiantes y 240 de ellos también eligieron a 84 000 79 500
ese equipo como su favorito. Calcule un intervalo 89 900 79 400
de confianza de 95 % para la diferencia entre la pro- 78 700 69 800
porción de estudiantes que favorecen al equipo A 87 500 79 900
en las dos encuestas. ¿Hay diferencia significativa? 83 100 83 400
18. Un fabricante de baterías para automóvil afirma que
sus baterías durarán, en promedio, 3 años con una Calcule un intervalo de confianza del 95 % para la
varianza de 1 año. Suponga que 5 de estas baterías diferencia entre las medias de la población para
tienen duraciones de 1,9, 2,4, 3,0, 3,5, 4,2 años y los dos métodos. Suponga que las poblaciones se
con base en esto construya un intervalo de confian- distribuyen de forma aproximadamente normal.
7. Pruebas de hipótesis

7.1 Conceptos generales

Definición 7.1.1 Una hipótesis estadística es una aseveración respecto a una o más poblaciones.

Definición 7.1.2 La hipótesis nula denotada por H0 , es la pretensión de que inicialmente se supone
cierta (la pretensión de “creencia previa”). La hipótesis alternativa denotada por H1 , es la aseveración
contradictoria a H0 . La hipótesis nula será rechazada en favor de la hipótesis alternativa sólo si la
evidencia muestral sugiere que H0 es falsa. Si la muestra no contradice fuertemente a H0 , se continuará
creyendo en la verdad de la hipótesis nula. Las dos posibles conclusiones derivadas de una análisis de
prueba de hipótesis son entonces rechazar H0 o no rechazar H0 .

Definición 7.1.3 Un procedimiento de prueba se especifica como sigue:


1. Un estadístico de prueba, una función de los datos muestrales en los cuales ha de basarse la
decisión (rechazar H0 o no rechazar H0 ).
2. Una región crítica, el conjunto de todos los valores estadísticos de prueba por los cuales H0 será
rechazada.
La hipótesis nula será rechazada entonces si y sólo si el valor estadístico de prueba observando o
calculado queda en la región de rechazo.

Definición 7.1.4 Un error de tipo I consiste en rechazar la hipótesis nula cuando es verdadera. Un
error de tipo II implica no rechazar H0 cuando H0 es falsa. Donde

α =P(Error de tipo I),


β =P(Error de tipo II).

Proposición 7.1.1 Supóngase que un experimento y un tamaño de muestra están fijos y que se selecciona
un estadístico de prueba. Entonces si se reduce el tamaño de la región crítica para obtener un valor más
pequeño de α se obtiene un valor más grande de β con cualquier valor de parámetro particular compatible
con H1 .
54 Capítulo 7. Pruebas de hipótesis

7.2 Pruebas sobre la media


Estadístico Región
H0 H1
de prueba crítica
µ = µ0 µ < µ0 z < −zα
x̄−µ
√0
(σ conocido) z= σ/ n µ > µ0 z > zα
µ 6= µ0 |z| > zα/2
µ = µ0 µ < µ0 t < −tn−1,α
x̄−µ
√0
(σ desconocido) z= s/ n µ > µ0 t > tn−1,α
µ 6= µ0 |t| > tn−1,α/2
µ1 − µ2 = δ0 x̄1 −x̄2 )−δ0
(r µ1 − µ2 < δ0 z < −zα
z=
(σ1 y σ2 conocidas) σ12 σ22 µ1 − µ2 > δ0 z > zα
n1 + n2
µ1 − µ2 6= δ0 |z| > zα/2
µ1 − µ2 = δ0 −x̄2 )−δ0
(x̄1q
µ1 − µ2 < δ0 t < −tn1 +n2 −2,α
(σ1 y σ2 desconocidas) t= 1 1 µ1 − µ2 > δ0 t > tn1 +n2 −2,α
sp n1 + n2
µ1 − µ2 6= δ0 |t| > tn1 +n2 −2,α/2
µ1 − µ2 = δ0 1 −x̄2 )−δ0
(x̄r µ1 − µ2 < δ0 t < −tν,α
t=
(σ1 6= σ2 desconocidas) s21 s22 µ1 − µ2 > δ0 t > tν,α
n1 + n2
µ1 − µ2 6= δ0 |t| > tν,α/2
µD = d0 µD < d0 t < −tn−1,α
¯ 0
d−d
(observaciones t= √
sd / n
µD > d0 t > tn−1,α
pareadas) µD 6= d0 |t| > tn−1,α/2

7.3 Ejercicios
1. El Edison Electric Institute publica cifras del núme- mente, de 162,5 centímetros, con una desviación
ro de kilowatt-hora que gastan anualmente varios estándar de 6,9 centímetros. ¿Existe alguna razón
aparatos electrodomésticos. Se afirma que una as- para creer que ha habido un cambio en la estatura
piradora gasta un promedio de 46 kilowatt-hora al promedio, si una muestra aleatoria de 50 mujeres
año. Si una muestra aleatoria de 12 hogares, que del grupo actual de primer año tiene una estatura
se incluye en un estudio planeado, indica que las promedio de 165,2 centímetros? Suponga que la
aspiradoras gastan un promedio de 42 kilowatt-hora desviación estándar permanece constante. Utilice
al año con una desviación estándar de 11,9 kilowatt- un nivel de significancia de 0,05.
hora, ¿esto sugiere que las aspiradoras gastan, en 4. Se afirma que los automóviles recorren en prome-
promedio, menos de 46 kilowatt-hora al año a un dio más de 20 000 kilómetros por año. Para probar
nivel de significancia de 0,05? Suponga que la po- tal afirmación se pide a una muestra de 100 propie-
blación de kilowatt-hora es normal. tarios de automóviles seleccionada de manera alea-
2. Una empresa de material eléctrico fabrica lámparas toria que lleven un registro de los kilómetros que
eléctricas que tiene una duración que se distribuye recorren. ¿Estaría usted de acuerdo con esta afirma-
de forma aproximadamente normal con una media ción, si la muestra aleatoria indicara un promedio
de 800 horas y una desviación estándar de 40 horas. de 23 500 kilómetros y una desviación estándar de
Pruebe la hipótesis de que µ = 800 horas contra la 3 900 kilómetros? Utilice un nivel de significancia
alternativa de que µ 6= 800 horas, si una muestra de 0,05.
aleatoria de 30 lámparas eléctricas tiene una dura- 5. De acuerdo con Chemical Engineering, una pro-
ción promedio de 788 horas. Utilice un nivel de piedad importante de la fibra es su absorbencia de
significancia de 0,05. agua. Se encontró que el porcentaje promedio de
3. La estatura promedio de mujeres en el grupo de absorción de 25 pedazos de fibra de algodón selec-
primer año de cierta universidad ha sido, histórica- cionados al azar es 20, con una desviación estándar
7.3 Ejercicios 55

de 1,5. Una muestra aleatoria de 25 pedazos de utilizan hasta que se desgastan. Los resultados son
acetato reveló un porcentaje promedio de 12 con los siguientes:
una desviación estándar de 1,25. ¿Existe evidencia
sólida de que el porcentaje promedio de absorción Marca A: x̄1 = 37 900 kilómetros
de la población es significativamente mayor para la s1 = 5 100 kilómetros
fibra de algodón que para el acetato? Suponga que Marca B: x̄2 = 39 800 kilómetros
el porcentaje de absorbencia se distribuye de forma s2 = 5 900 kilómetros
casi normal y que las varianzas de la población en Pruebe la hipótesis de que no hay diferencia en el
el porcentaje de absorbencia para las dos fibras son desgaste promedio de las 2 marcas de neumáticos.
iguales. Utilice un nivel de significancia de 0,05. Suponga que las poblaciones se distribuyen de for-
6. Una muestra aleatoria de tamaño n1 = 25, tomada ma aproximadamente normal con varianzas iguales.
de una población normal con una desviación están- Utilice un nivel de significancia de 0,05.
dar σ1 = 5,2, tiene una media x̄1 = 81. Una segunda 10. Se llevó a cabo un estudio para saber si el aumento
muestra aleatoria de tamaño n2 = 36, que se toma en la concentración de sustrato tiene un efecto apre-
de una población normal diferente con una desvia- ciable sobre la velocidad de una reacción química.
ción estándar σ2 = 3,4, tiene una media x̄2 = 76. Con una concentración de sustrato de 1,5 moles por
Pruebe la hipótesis de que µ1 = µ2 contra la alter- litro, la reacción se realizó 15 veces, con una veloci-
nativa µ1 6= µ2 . Utilice un nivel de significancia de dad promedio de 7,5 micromoles por 30 minutos y
0,01. una desviación estándar de 1,5. Con una concentra-
7. Un fabricante afirma que la resistencia promedio ción de sustrato 2,0 moles por litro, se realizaron 12
a la tensión del hilo A excede a la resistencia a la reacciones que produjeron una velocidad promedio
tensión promedio del hilo B en al menos 12 kilo- de 8,8 micromoles por 30 minutos y una desvia-
gramos. Para probar esta afirmación se pusieron a ción estándar muestral de 1,2. ¿Hay alguna razón
prueba 50 pedazos de cada tipo en condiciones simi- para creer que este incremento en la concentración
lares. El hilo tipo A tuvo una resistencia promedio de sustrato ocasiona un aumento en la velocidad
a la tensión de 86,7 kilogramos con una desviación media de la reacción de más 0,5 micromoles por
estándar de 6,28 kilogramos; mientras que el hilo 30 minutos? Utilice un nivel de significancia de
tipo B tuvo una resistencia promedio a la tensión 0,01 y suponga que las poblaciones se distribuyen
de 77,8 kilogramos con una desviación estándar de de forma aproximadamente normal con varianzas
5,61 kilogramos. Pruebe la afirmación del fabrican- iguales.
te usando un nivel de significancia de 0,05. 11. Cinco muestras de una sustancia ferrosa se usaron
8. Para indagar si un nuevo suero frena el desarrollo para determinar si existe una diferencia entre un
de la leucemia se seleccionaron 9 ratones, todos en análisis químico de laboratorio y un análisis de fluo-
una etapa avanzada de la enfermedad. Cinco rato- rescencia de rayos X del contenido de hierro. Cada
nes reciben el tratamiento y cuatro no. Los tiempos muestra se dividió en dos submuestras y se apli-
de supervivencia, en años, a partir del momento en caron los dos tipos de análisis. A continuación se
que comienza el experimento son los siguientes: presentan los datos codificados que muestran los
análisis de contenido de hierro:
Con tratamiento 2,1 5,3 1,4 4,6 0,9
Sin tratamiento 1,9 0,5 2,8 3,1 Muestra
Análisis 1 2 3 4 5
A un nivel de significancia de 0,05, ¿se puede de-
Rayos X 2,0 2,0 2,3 2,1 2,4
cir que el suero es eficaz? Suponga que las dos
Químico 2,2 1,9 2,5 2,3 2,4
poblaciones se distribuyen de forma normal con
varianzas iguales. Suponga que las poblaciones son normales y prue-
9. Los ingenieros de una armadora de automóviles de be, al nivel de significancia de 0,05, si los dos mé-
gran tamaño están tratando de decidir si comprarán todos de análisis dan, en promedio, el mismo resul-
neumáticos de la marca A o de la marca B para sus tado.
modelos nuevos. Con el fin ayudarlos a tomar una 12. De acuerdo con informes publicados, el ejercicio en
decisión se realiza un experimento en el que se usan condiciones de fatiga altera los mecanismos que de-
12 neumáticos de cada marca. Los neumáticos se terminan el desempeño. Se realizó un experimento
56 Capítulo 7. Pruebas de hipótesis

con 15 estudiantes universitarios hombres, entrena- Diferencias absolutas


dos para realizar movimiento horizontal continuo Sujeto Sin fatiga Con fatiga
del brazo, de derecha a izquierda, desde un micro- 1 158 91
interruptor hasta una barrera, golpeando sobre la 2 92 59
barrera en coincidencia con la llegada de una ma- 3 65 215
necilla del reloj a la posición de las 6 en punto. Se 4 98 226
registró el valor absoluto de la diferencia entre el 5 33 223
tiempo, en milisegundos, que toma golpear sobre la 6 89 91
barrera y el tiempo para que la manecilla alcance la 7 148 92
posición de las 6 en punto (500 mseg). Cada parti- 8 58 177
cipante ejecutó la tarea cinco veces en condiciones 9 142 134
sin fatiga y con fatiga, y se registraron las siguientes 10 117 116
sumas de las diferencias absolutas para las cinco 11 74 153
ejecuciones: 12 66 219
13 109 143
14 57 164
15 85 100
Un aumento en la diferencia media absoluta de
tiempo cuando la tarea se ejecuta en condiciones de
fatiga apoyaría la afirmación de que el ejercicio, en
condiciones de fatiga, altera el mecanismo que de-
termina el desempeño. Suponga que las poblaciones
se distribuyen normalmente y pruebe tal afirmación.
Utilice un nivel de significancia de 0,05.

Anda mungkin juga menyukai