Anda di halaman 1dari 75

Estadstica y Probabilidad

Mat: Luis Alfonso Len Garca

1. Estadstica descriptiva

Como inicio diremos que la estadstica es el estudio de los fenmenos aleatorios. Aleatorio
es lo mismo que al azar.

La estadstica descriptiva es aquella parte de la estadstica que nos proporciona una serie de
conceptos y de tcnicas orientadas a la reduccin de la informacin numrica. Se encarga de la
descripcin de ciertas caractersticas pertenecientes a la misma. En dnde se concentran los
datos, con qu dispersin.

El aspecto ms importante de la estadstica es la obtencin de conclusiones basadas en los


datos experimentales. Este proceso se conoce como inferencia estadstica.

Para comprender la naturaleza de la inferencia estadstica, es necesario entender las


nociones de poblacin y muestra. Pero antes de hacer este estudio conozcamos algunas formas
de graficar datos.

1.1 Representacin grfica para datos agrupados y no agrupados

Grfica. Representacin por medio de lneas, rectngulos (barras), puntos, en los ejes
coordenados. Como ejemplos considere los siguientes casos.

La tabla siguiente muestra las diez operaciones de ciruga plstica ms comunes:

Ciruga de Casos
atendidos
Mano 160,000
Reparacin de desgarres 150,000
Remocin de tumores 100,000
Aumento de senos 75,000
Accidentes industriales 70,000
Prpados 57,000
Nariz 55,000
Eliminacin de 45,000
quemaduras
Reconstrucciones 45,000
Faciales 40,000

Haga una grfica de barras con la informacin dada.

Una tabla que recoge informacin de una variable en funcin del tiempo se llama serie de
tiempo.

Ejemplo. La informacin de la siguiente tabla es la que se reporta en la revista Notas, revista


de informacin y anlisis, nm. 17, enero marzo, 2002 del INEGI, sobre el producto interno bruto
total nacional.

Ao 1995 1996 1997 1998 1999 2000


Total PIB 1 678 834 2 296 674 2 873 272 3 517 781 4 205 703 4 974 463
828 526 991 860 889 616

Pgina 1
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Obtenga la grafica de la serie de tiempo.

La figura se puede representar por rectngulos, llamados diagrama de barras, de una serie
de tiempo, el ancho de la barra no tiene importancia, las barras no deben tocar una con otra.
Tambin se le llama diagrama de Pareto. Los nmeros de las hectreas habitadas se pueden
colocar por encima de cada barra, no siempre deben de ir.

Si las grficas antes presentadas suelen ser comunes, se puede emplear otro grfico
llamado pictograma, se emplea para representar datos en forma ntida para el pblico lector.
Encierra una dosis de originalidad y oficio del trabajo a presentar.

Existen otras formas de grficas, en las cuales se involucran dos o ms medidas, se pueden
hacer comparaciones, entre tipos de cosechas, el tiempo que se lleva efectuar una tarea, entre
otras.

La tabla que a continuacin se muestra, registra el tiempo en horas y minutos que debieron
trabajar los conductores de cinco ciudades para comprar comida chatarra, para una familia de
cinco miembros. Las cifras corresponden a los aos 2004 y 2006.

Ciudad 2004 2006


Distrito 0:58 1:02
Federal
Cuernavaca 1:29 1:19
Toluca 1:52 2:18
Quertaro 1:41 1:47
Puebla 2:02 2:24

Las grficas pueden ser por trazo comparativo, ya sea por puntos unidos por una lnea
continua o por barras.

Diferente tipo de grafico, puede ser por barras en forma de complemento, incluyendo el total
producido por periodo o por medio de un porcentaje, este ltimo solo presentar barras de tamao
igual, al 100%. Se puede obtener con la aplicacin de la siguiente expresin:

Cprod
1= Cprod + Cprod
1
( 100 )
1 2

1
2=100

Pgina 2
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Otro forma es usando barras horizontales, en estas se comparan entre s varios datos, como
por ejemplo, el rea ocupada por los continentes alrededor del mundo, los tipos de alimentos del
cuadro bsico de nutricin.

Por ejemplo: En un estudio de preferencias de equipos de Futbol, arrojo los siguientes


datos1:
Edad Chivas Amrica Cruz Azul Pumas Otros
18 a 29 aos 22 25 14 15 24
30 a 49 aos 22 22 22 14 27
50 y mas 26 16 13 7 38

Como se podr dar cuenta, slo hemos tratado grficas en las que se incluyen puntos unidos
por lneas, barras; pero presentamos otro tipo de grfico que es llamado diagrama de pastel
[queso, pie, pizza, circular].

Para construirlo, hacemos que el total de los encuestados por edad en este caso, equivale a
360
0.36
1000
360. As, 1000 encuestados corresponde a la operacin de: /preferencias de
equipo.

Existen ms tipos de grficos y cada usuario de la estadstica descriptiva puede elegir el que
ms le agrade, siempre y cuando los datos que se presentan sean claros y le den buena
informacin del estudio realizado.

Muestreo. La teora del muestreo estudia la relacin entre una poblacin y los datos
tomados de ella. Como dichos datos muestreados u obtenidos se pueden estimar magnitudes tales
como la media y la varianza [variancia], llamados comnmente parmetros de la poblacin. De
estos parmetros y de su conocimiento de las magnitudes (tamao) sobre la muestra se dice que
tenemos un estadstico o estadstica de la muestra.

1.2 Medidas de tendencia central. Media, mediana, moda, media geomtrica, media armnica
y media ponderada

Esta teora es tambin til para determinar si las diferencias observadas entre dos muestras
son debidas a variaciones fortuitas (en ocasiones) o si son realmente significativas.

Promedio o medidas de tendencia central. Es un valor tpico o representativo de un conjunto


de datos. Tales valores suelen situarse al centro de las medidas. Los promedios se conocen como
medidas de tendencia central.

Las medidas de tendencia central. Son valores numricos que representan la ubicacin
central de los datos; media [ x , , E(x)], mediana [Me], moda [Mo], cuartles [Qi], decles [Di],
Percentiles o Percentiles [Pi].

1 RECORD, deportivo, pp. 20, Paola Nez, Consulta a mil mayores, El tamao de la
muestra para elaborar el estudio de Mitofsky fue de mil mexicanos, mayores de 18 aos con
credencial para votar, y fue elaborada entre el 17 y el 22 de enero de 2008, con entrevistas
en viviendas particulares.

Pgina 3
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

La media aritmtica, o tambin conocida como media, es el valor esperado del conjunto de
medidas observadas en el estudio. Se define como:

xi
=E ( x )=x = i=1
n

Por ejemplo: Se han tomado diez medidas del largo de las puertas, para casa habitacin,
producidas en una carpintera. Las medidas fueron las siguientes:

1.55 1.53 1.58 1.54 1.60 1.62 1.61 1.52 1.50 1.51

Encuentre el valor promedio o media aritmtica de los datos y grafique los datos encontrando el
valor de la media en la grfica.

Considera ahora que se tienen ms lecturas de una observacin y que en ocasiones hay
datos que se repiten, esto debido a la casualidad; para ello se emplea la siguiente expresin:

( f i xi )
=E ( x )=x = i=1
n

Ejemplo. En un semforo, de un crucero de poco transito, se anot el nmero de ocupantes


por automvil:
5 3 2 2 1 1 4 4 5 3
4 4 5 3 2 2 1 1 2 4
2 1 1 1 1 3 3 2 5 2

Encuentre la esperanza del tamao de ocupantes cuando se realiz la observacin y


grafique los datos encontrando el valor de la media en la grfica.

Cuando los datos son de ms de 50 observaciones, se deben formar grupos o familias, en la


mayora de las veces a estas se les denomina clases de datos. Para este proceso se toma el valor
ms pequeo y el valor ms grande de las observaciones, se restan y se dividen entre el nmero
de clases que se elija.

LsLi
Ic=
Nc

Ic_intervalo de clase; Ls_lmite superior o dato mayor; Li_lmite inferior o dato menor; NC_nmero
de clases, un valor entre 5 y 20.

Ejemplo. Los datos siguientes representan el nmero de ciclos transcurridos hasta que se
presenta una falla en una prueba de piezas de aluminio sujetas a un esfuerzo alternamente
repetido de 21,000 psi, a 18 ciclos por segundo:

1115 1567 1223 1782 1055 798 1016 2100 910 1501

Pgina 4
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

1310 1883 375 1522 1764 1020 1102 1594 1730 1228
1540 1203 2265 1792 1330 865 1605 2023 1102 990
1502 1270 1910 1000 1608 2130 706 1315 1578 1468
1258 1015 1018 1820 1535 1421 2215 1269 758 1512
1315 845 1452 1940 1781 1109 785 1260 1416 1750
1085 1674 1890 1120 1750 1481 885 1888 1560 1642

Obtenga la media aritmtica, un histograma de frecuencias y un polgono de frecuencias.

Para ordenar los datos se requiere de los intervalos de clase, una vez obtenido el tamao del
intervalo se obtiene el nmero de frecuencias en cada clase. Para la parte de grficas se necesita
obtener un punto medio [o marca de clase] el cual ser el representante de cada clase y los datos
de observaciones pasan a segundo trmino.

Lsc + Lic
PM =
2

PM_punto medio, Lsc_lmite superior de la clase, Lic_lmite inferior de la clase.

La forma de obtener el dato de la esperanza o media aritmtica para datos grandes, se


emplea la siguiente expresin:

PM i f i
x = i=1
n

La mediana. La mediana de un conjunto de observaciones es el valor para el cual, cuando


todas las observaciones se ordenan de manera creciente, la mitad de stas es menor que este
valor y la otra mitad es mayor2.

Mediana o punto central en el cual la muestra se divide en dos mitades iguales 3.

Modelo matemtico:
N
Me=Li+
( 2
f )
Ic
f med

Me_mediana, Li_lmite inferior donde est la mediana, N_nmero de datos, f med_frecuencia de la mediana, Ic_intervalo de
clase, f_suma de las frecuencias antes de la mediana.

Ejercicio. Obtenga la mediana de los datos de las pruebas de falla.

2 Canavos, Probabilidad y Estadstica, pp. 12


3 Hines & Montgomery, Probabilidad y Estadstica, pp. 11

Pgina 5
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

La moda. La moda de un conjunto de observaciones es el valor de la observacin que ocurre


con mayor frecuencia4.

La moda de un conjunto de nmeros es el valor que ocurre con mayor frecuencia; es decir, el
valor ms frecuente. La moda no podr existir, e incluso no ser nica en el caso de existir 5.
La moda es la observacin que se presenta con mayor frecuencia en la muestra 6.

Modelo matemtico:
d1
Mo=Li+ ( )
d 1+ d 2
Ic

Mo_moda, Li_lmite inferior de la moda, d1_exceso de la frecuencia modal sobre la clase inferior, d2_exceso de la frecuencia
modal sobre la clase superior, Ic_intervalo de clase.

Ejercicio: Ahora obtenga la moda de los datos de las pruebas de falla.

Cuartles, decles y percentiles

Cuando los datos se dividen en cuatro partes iguales, los puntos de divisin se conocen
como cuartles. El primer cuartl inferior, q 1, es el valor que tiene aproximadamente el 25% ( ) de
los datos u observaciones por debajo de l; el segundo cuartl se empata con el valor de la
mediana, pues en este se halla el 50% (2/4 ) de los datos. El 75% ( ) de los datos se
encuentran en el tercer cuartl, q 3, tambin nombrado cuartl superior. Al igual que en el caso de la
mediana, es posible que los cuartles no sean nicos7.

Cuartles para datos no agrupados.


Divida el nmero de datos entre cuatro, tome los valores, inferior y superior de cada parte, y
obtenga los cuartles correspondientes con la funcin:
Li + Ls
qi =
2

Ejemplo. Se tomaron observaciones de orden de tiempo de falla, en horas, de un material


aislante elctrico (adaptacin del trabajo de Nelson, Applied Life Data Anlisis, 1982)

204 228 252 300 324 444 624 720 816 912 1176 1296 1392 1488 1512 2520 2856
3192 3528 3710

Obtenga los cuartles correspondientes.

Cuartles para datos agrupados.

4 Canavos, Probabilidad y Estadstica, pp. 12


5 Spiegel, Estadstica, pp. 63
6 Montgomery & Runger, Probabilidad y Estadstica, pp. 19
7 Montgomery & Runger, Probabilidad y estadstica, pp.21

Pgina 6
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Se obtienen aplicando las siguientes expresiones:

N 2N 3N
q =L +
( 4
f )
I ; q =L +
( 4
f )
I ; q =L +
( 4
f )
I .
1 i c 2 i c 3 i c
fq 1
fq 2
fq 3

Aplique estas expresiones al problema de los datos de las pruebas de falla.

Los valores que dividen en diez partes iguales al conjunto de observaciones de denominan
decles, y se pueden obtener de la misma manera que los cuartles.

f
d =L +
( 10
)
I
i i c
fd i

Los valores que se obtienen de dividir en cien partes iguales a la coleccin de datos se
denominan percentiles.

f
p =L +
( 100
)
I
i i c
fp i

Aplique estas expresiones al problema de los datos de las pruebas de falla.

1.3 Medidas de dispersin. Amplitud, rango, desviacin media, desviacin estndar, varianza,
coeficiente de variacin

Medidas de dispersin. Valores numricos que indican que tan separados del centro estn
mis datos; varianza o variancia [s2 para pequeas muestras, 2 para grandes muestras]; Rango [R];
desviacin estndar [s, ], desviacin media [MD].

Las medidas de dispersin o variacin de datos nos da una idea de cuan tan espaciados se
encuentran stos. Entre estas medidas se encuentra la llamada Rango (traduccin: intervalo),
desviacin media, varianza o variancia y la desviacin estndar.

Rango. Es el largo que ocupa el conteo de datos u observaciones. El modelo matemtico es:
R=V M V m=V s V i

R_intervalo, Vs_valor ms grande, Vi_valor inferior.

De los ejercicios que a continuacin se muestran obtenga el rango de cada uno de ellos.

Desviacin media o desviacin promedio, es la cantidad alejada de la media, hacia la derecha


y hacia la izquierda de sta. Modelo matemtico:

Pgina 7
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

|x i x|
MD= i=1
n
x
xi_dato i-simo de la tabla, _el valor de la media, n_nmero de datos.

Ejercicio. Se han tomado las medidas de diez cables elctricos, para uso telefnico, para ser
instalado en cada aparato fabricado por la compaa ACME electrnicos, los cuales estn en
metros:
13.9 13.5 12.9 12.8 13.2 13.7 12.8 12.7 12.9 12.6

(a) Encuentre la media de los datos;


(b) encuentre la desviacin media.

Varianza o variancia. Est definido como el promedio del cuadrado de las distancias entre
cada observacin y la media del conjunto de observaciones. Se denota como el modelo
matemtico siguiente:

( x i x )2
Var ( x )=s 2= 2= i=1
( n1 )

Ejemplo. Calcule la media y la varianza de las siguientes millas recorridas por galn de
combustible, obtenidas en 20 recorridos, en permetro citadino con un automvil de tamao
intermedio.

19.7 21.5 22.5 22.2 22.6 21.9 20.5 19.3 19.9 21.7 22.8 23.2 21.4 20.8 21.4 20.8 19.4
22.1 23.4 21.6 21.3 20.9

Para cuando se tienen los datos agrupados se considera el punto medio (PM) o marca de
clase, de cada intervalo en lugar de considerar las xi.
n

( PM i x )2 f i
2 i=1
s=
( n1 )

Ejercicio. Obtenga la varianza de los datos de las pruebas de falla.

Medidas de tendencia central. La media se puede considerar tanto para muestras como para
poblaciones, del mismo modo, pero se puede denotar de forma diferente; la media muestral se
x
denota por y la media poblacional 8.

8 Weimer, Estadstica, pp. 73

Pgina 8
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Medidas de dispersin o variabilidad. La varianza de una poblacin se define como el


promedio de los cuadrados de las desviaciones de los valores y se denota por 2. La varianza de
una muestra se denota por s2. 9

La desviacin estndar se define como la raz cuadrada positiva de la varianza.


= 2 ; s= s 2

9 Weimer, Estadstica, pp.96

Pgina 9
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

2. Probabilidad

La probabilidad es un mecanismo por medio del cual pueden estudiar sucesos aleatorios,
cuando stos se comparan con fenmenos determinsticos.

La probabilidad tiene un papel importante en la aplicacin de la inferencia estadstica porque


una decisin, cuyo fundamento se encuentra en la informacin contenida en una muestra aleatoria,
puede estar equivocada.

Para la mayora de nosotros, probabilidad es un trmino comn empleado en el lenguaje


cotidiano para indicar la posibilidad de la ocurrencia de un evento futuro.

2.1 Elementos de clculo combinatorio

Para lograr un desarrollo ordenado de la teora de probabilidad, se requiere conocer los


conceptos bsicos de la teora de conjuntos.

Elementos de un conjunto A = {a1, a2,..., an}

Sea U el conjunto de todos los conjuntos considerados; es decir, U es el conjunto universal.


Para cualquier par de conjuntos A y B, se dice que A es un subconjunto de B o bien que A B.
A B = {x x A y x B, A B}

La unin de A y B, denotada por A B, es el conjunto de todos los puntos A, en B o bien, en


ambos.
A B = {x xA xB}

La interseccin de A y B, denotada por A B, o bien, por AB es el conjunto de todos los


puntos que estn tanto en A como en B.

A B = {x xA y xB}

Si A es un conjunto de S, entonces el complemento de A, denotado por Ac, es el conjunto de


puntos localizados en S pero no se encuentran en A.

A = Ac = A = {x x A}

Se dice que dos conjuntos, A y B, son disjuntos o mutuamente excluyentes s A B = . No


tienen elementos en comn.
A B = {x (xA y xB) (xA y xB)}

Ejercicios:
1. Halla todos los subconjuntos que se pueden formar del conjunto T = {5, d, 8, 2, a, v, 3, k}.

2. Enlista los elementos de los siguientes conjuntos:


2.a Naciones de Amrica Central que no limitan con Mxico.
2.b Nmeros impares menores a 19.

Pgina 10
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

3. Dados los siguientes conjuntos, obtn las operaciones que se indican.


A = {b, c, e, f, 5, z, w, k, m, n} B = {a, d, m, n, z, 11, 5, k}
C = {s, 11, 5, e, a, f} M = {b, c, f, e, m, n, 2, a, 11, 5, w}

Operaciones.
AB BCA MCB (M A) (C B)

4. Suponga que en una familia hay dos nios de diferente edad y que nos interesa el gnero
de stos nios. Se utiliza F para designar una nia y una M para indicar un nio y un par FM para
denotar que el nio con ms edad es del gnero femenino y el ms pequeo del gnero masculino.

Existen entonces puntos en el conjunto S de las observaciones posibles S = {FF, FM, MF,
MM}.

Sea A el conjunto de todas las posibilidades que no incluyen varones; B, el subconjunto que
contiene dos varones, y C el subconjunto que contiene al menos un varn. Liste los elementos de
A, B, C, A B, A C, A C, B C, B C, C B.

5. De una encuesta aplicada a 60 estudiantes que asisten a la universidad, 9 habitan fuera del
recinto universitario, 36 son estudiantes de licenciatura y 3 son estudiantes de licenciatura que
habitan fuera del recinto.
a) Encuentre el nmero de estudiantes, de licenciatura, que habitan fuera del recinto o que
satisfacen ambas caractersticas;
b) Encuentre el nmero de estudiantes de licenciatura y que habitan en el recinto;
c) Encuentre el nmero de estudiantes que ya tienen licenciatura y que habitan en el recinto.

6. De 25 microcomputadoras disponibles en un almacn, 10 de ellas tienen tarjetas


adaptadoras ara impresora, 5 tienen tarjetas adaptadoras para mdem, y 13 no tienen ninguna de
ellas. Utilizar P para representar a aquellas que tengan tarjetas de impresora, M para las que
tienen tarjetas de mdem y, luego, representar simblicamente los siguientes conjuntos, as como
mencionar el nmero de microcomputadoras que hay en cada uno.
a) Las que tengan ambas tarjetas;
b) Las que no tengan tarjeta alguna;
c) Las que slo tengan tarjetas para impresora;
d) Las que tengan exactamente una de las tarjetas.

Definicin. Un experimento es el proceso por medio del cual se obtiene una observacin.

Entre los ejemplos de experimentos incluye el lanzamiento de monedas y de dados, la


medicin del IQ (Intelectual Queficient) de un individuo, o la cuantificacin del nmero de bacterias
por centmetro cbico de una porcin de comida preparada.

Cuando se efecta un experimento, podemos tener uno o ms resultados que se denominan


eventos.

Definicin. Un evento simple es un evento que no se puede descomponer. A cada evento


simple corresponde uno y slo un punto muestral. La letra E con un subndice se utilizar para
denotar un evento simple o el punto muestral correspondiente.

Pgina 11
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

2.2 Espacio muestral y eventos

Eventos de inters.
Seguro, aquel que incluye todos los resultados posibles;

Imposible, que no tiene ningn resultado posible, se denota como ;

Complementario, B es complemento de A, s B = {y y S, y A};

Mutuamente excluyente o disjunto, si sus resultados no tienen nada en comn, con una
interseccin formal el conjunto es vaco.

Espacio de resultados o espacio muestral. Es el conjunto de todos los resultados posibles de


un experimento. Denotado como S [de Space, en ingls], el conjunto de todos los posibles
resultados puede ser finito, infinito numerable o infinito no numerable.

Podemos ver que el espacio muestral S, asociado con el experimento del lanzamiento de un
dado, consta de seis puntos muestrales que corresponden a los eventos simples, E1, E2, E3, E4, E5,
E6.

Para el ejemplo de microbiologa en el que se encuentra el nmero de bacterias en una


porcin de comida, E0 corresponde al hecho de observar cero bacterias, E1 al observar una
bacteria y as sucesivamente. Entonces el espacio muestral es
S = {E0, E1, E2, E3,...}

ya que no se puede descartar a ningn entero como posible resultado del conteo de bacterias.

Espacio muestral discreto.

Definicin. Un espacio muestral discreto es un espacio muestral que contiene un nmero


finito o numerablemente infinito de puntos muestrales.

Cuando se realiza un experimento una sola vez, se puede observar uno y slo un evento
simple. Los eventos compuestos se pueden considerar como agrupaciones de puntos muestrales
como uniones de los conjuntos con puntos muestrales correspondientes a los eventos simples
apropiados.

Por ejemplo, el evento A del experimento del lanzamiento de un dado, la observacin de un


nmero impar, ocurrir si y slo si, ocurre uno de los eventos simples, E1, E3, E5. Entonces

A = {E1, E3, E5} o bien A = E1 E3 E5.

Definicin. Un evento definido en un espacio muestral discreto S es una coleccin de puntos


muestrales, es decir, un subconjunto de S.

Pgina 12
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

2.3 Definicin de probabilidad

Se puede construir un modelo probabilstico para un experimento con un espacio muestral


discreto, asignando una probabilidad a cada evento simple del espacio muestral S. al hacerlo, se
nmero, representa una media de la posibilidad de la ocurrencia en una sola realizacin del
experimento, de tal manera que sea consistente con el concepto de frecuencia relativa de la
probabilidad.

Definicin (de frecuencia relativa). Si un experimento se repite n veces bajo las mismas
nB
condiciones y nB de los resultados son favorables a un atributo B, el lmite de n conforme n se

vuelve grande, se define como la probabilidad del atributo B.

Al analizar el concepto de frecuencia de la probabilidad, se observa que se debe cumplir tres


condiciones.

Definicin. Supngase que un espacio muestral S est asociado con un experimento. A cada
evento E definido en S, se le asigna un nmero, P(E), denominado probabilidad de E; de tal
manera que se cumplen los axiomas siguientes:
i) P(E) 0; La probabilidad del evento siempre es mayor o igual a cero.
ii) P(S) 1; La probabilidad del espacio es siempre equivalente a uno.
iii) Si E1, E2, E3,... forman una sucesin de eventos de S que se excluyen mutuamente,

P( E )
i 1
i

por parejas, entonces P(E1 E2 E3...) = .

Obsrvese que la definicin solamente expresa cules son las propiedades que tiene que
cumplir una probabilidad, pero no expresa como asignar las probabilidades especficas a los
eventos.

Considrese, los siguientes casos.


(a) En un juego de pelota, beisbol, solamente se permite que haya un ganador, la posibilidad
de ganar para cada equipo es de .
(b) En un juego de futbol, hay tres posibles resultados, gana el de casa o el de visita y el otro
es un empate al final.
(c) En una competencia de clavados, se eligen a los 10 mejores para la ltima ronda de la
competencia, la posibilidad de tener un buen resultado es 1/10.

La asignacin de probabilidades especficas se debe hacer de tal manera que sea


congruente con la realidad si se desea que el modelo probabilstico sea til.

Pgina 13
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Ejemplo. Un fabricante tiene cinco terminales de computadora aparentemente idnticas listas


para ser enviadas a su destino. El no sabe que dos de las cinco son defectuosas. Recibe un pedido
especial de dos terminales y lo surte seleccionando al azar dos de las cinco disponibles.
a) Obtenga el espacio muestral para este experimento;
b) Sea A, el evento en el que el pedido se surte con dos terminales no defectuosas;
c) Construya un diagrama de Venn para el experimento, y represente el evento A;
d) Asigne las probabilidades a los eventos simples de tal manera que la informacin en el
problema se utilice y se satisfagan los axiomas antes listados en la definicin;
e) Encuentre la probabilidad del evento A.

Ejercicio. En toda el rea metropolitana los autos que circulan se encuentra que sus placas de
circulacin tienen tres letras y tres dgitos.
a) Cul es el nmero total, si ninguna letra de placas posible, puede usarse ms de una
ocasin?
b) Cul es el nmero total sin esta restriccin?
c) Cul es la probabilidad de que adquiera un auto con las placas 422THU?
Ejercicio. Considere que un auto llega a la interseccin del camino, puede dar vuelta a la
derecha a la izquierda o seguir de frente. Un experimento consiste en observar a dos vehculos al
pasar por dicha interseccin.
(a) Cuntos puntos muestrales hay en el espacio S? Obtenga una lista de ellos;

(b) Cul es la probabilidad de que un auto d la vuelta a la izquierda? Suponiendo que todos
los puntos muestrales son equiprobables10;

(c) Cul es la probabilidad de que a lo ms un vehculo d la vuelta? Suponiendo que los


puntos muestrales son equiprobables.

Ejercicio. Se selecciona una familia que posee dos automviles, y para el ms nuevo y el
ms viejo observamos si fue fabricado en los Estados Unidos, Europa o Asia.
(a) Cules son los posibles resultados de este experimento?

(b) Cules resultados estn contenidos en el evento de que un automvil sea Europeo y
otro Americano?

(c) Cules resultados estn contenidos en el evento de que por lo menos uno de los dos
automviles sea extranjero?

El mtodo de los puntos muestrales para resolver un problema de la probabilidad es simple y


efectivo, y es, en ciertos aspectos un enfoque muy til. Se puede aplicar para encontrar la
probabilidad de cualquier evento definido en un espacio muestral que contiene un conjunto finito o
numerablemente infinito de puntos muestrales, pero no es infalible.

Una complicacin se presenta porque muchos espacios muestrales contienen un gran


nmero de puntos muestrales y la especificacin detallada de cada punto es al mismo tiempo
tediosa y tardada.

2.4 Reglas de probabilidad

10 De misma probabilidad de ocurrencia.

Pgina 14
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Tcnicas para la enumeracin de puntos muestrales.

Definicin. El arreglo ordenado de r objetos o elementos distintos se denomina permutacin.


El nmero de maneras en que se pueden ordenar n objetos distintos tomando r a la vez se denota
por el smbolo
r n!
Pn=
( nr ) !

Una permutacin es un acomodo de datos en cada evento sin que se repita alguna de sus
formas.

Ejemplo. Para abrir una cerradura de combinacin se requiere de la seleccin correcta de un


conjunto de cuatro dgitos en sucesin. Los dgitos se fijan girando el tambor en el sentido de las
manecillas del reloj o al contrario. Supngase que no se utiliza un mismo dgito dos veces.
Encuentre el nmero total de las posibles combinaciones.

Solucin:
n = 10 dgitos; r = tomados 4 a la vez;

r 10 ! 10 9 8 7 6 !
Pn= = =( 10 ) ( 9 ) ( 8 ) ( 7 )=5040
6! 6!

que es el nmero total de combinaciones para abrir la caja fuerte.

La siguiente regla de anlisis combinatorio se puede utilizar para determinar el nmero de


subconjuntos de tamaos diferentes que se pueden formar al hacer una particin de un conjunto de
n objetos distintos.

Teorema. El nmero de formas en que se pueden asignar n objetos distintos de k grupos


diferentes que contienen n1, n2,..., nk objetos respectivamente, es

n
n!
N=
n1 ! n2 ! nk !
; en donde n i=n
i=1

Ejemplo. En una constructora se tienen 20 trabajadores, y se quieren distribuir en cuatro


diferentes actividades. La primera actividad necesariamente debe contar con 6 elementos, la
segunda con 4 y la tercera y cuarta con 5 elementos, respectivamente. Para la actividad uno se
cuenta que hay cuatro trabajadores experimentados. Determine el nmero de formas en las que se
pueden separar los 20 trabajadores en los grupos necesarios para desarrollar la actividad.
Encuentre la probabilidad del evento observado suponiendo que se asignaron los trabajadores
aleatoriamente.

Solucin:
N = 20; n1 = 6; n2 = 4; n3 = 5; n4 = 5.

Pgina 15
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

20! 2.4329 1018


N= = =9777287520
6 ! 4 ! 5! 5 ! 24883200

Sea A el evento de asignacin de trabajadores; n a el nmero de puntos muestrales en A, n a es


el nmero de formas de asignar los trabajadores a los cuatro trabajos, se sabe que 4 de ellos
tienen una mayor experiencia para el trabajo uno, entonces 20 4 = 16

13
16 ! 2.092278989 10
N= = =30270240
2! 4 ! 5 ! 5 ! 691200

De aqu que
30270240
p ( A )= =0.00309
9777287520

0.3% de la asignacin de los trabajadores para desarrollar la actividad nmero uno.

En muchas situaciones los puntos muestrales se identifican por un arreglo de smbolos en


los cuales el orden de los smbolos no es importante.

Definicin. El nmero de combinaciones de n objetos tomados en r a la vez es el nmero de


subconjuntos, cada uno de tamao r, que se puede formar a partir de los n objetos. Este nmero se
denotar por

n!
()
Cnr = n =
r ( nr ) ! r !

Ejercicios.
2.4 Sea A y B dos eventos cualquiera de S. Emplese un diagrama de Venn para demostrar
que P(A B) = P(A) P(A B).

2.5 Una familia tiene tres hijos. Determinar todas las posibles permutaciones, con respecto al
gnero de los hijos. Bajo suposiciones adecuadas, cul es la probabilidad de que, exactamente,
dos de los hijos sean del mismo gnero?, Cul es la probabilidad de tener un varn y dos
mujeres?, Cul es la probabilidad de tener hijos del mismo gnero?

2.8 Una agencia automotriz recibe un embarque de 20 automviles nuevos. Entre stos, dos
tienen defectos. La agencia decide seleccionar, aleatoriamente, dos automviles de entre los 20 y
aceptar el embarque s ninguno de los dos vehculos seleccionados tiene defectos. Cul es la
probabilidad de aceptar el embarque?

2.10 De entre 20 tanques de combustible fabricados para el trasbordador espacial, tres se


encuentran defectuosos. Si se seleccionan aleatoriamente cuatro tanques:
a) Cul es la probabilidad de que ninguno de los tanques se encuentre defectuoso?

Pgina 16
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

b) Cul es la probabilidad de que uno de los tanques tenga defectos?

2.11 La probabilidad de que cierto componente elctrico funcione es de 0.9. Un aparato


contiene dos de stos componentes. El aparato funcionar mientras lo haga, por lo menos, uno de
los componentes.
a) Sin importar cul de los componentes funcione o no, cules son los posibles resultados y
sus respectivas probabilidades? (Puede suponerse independencia en la operacin entre
los componentes.)
b) Cul es la probabilidad de que el aparato funcione?

2.12 Un sistema contiene tres componentes A, B y C. Estos pueden conectarse en una,


cualquiera, de las cuatro configuraciones mostradas a continuacin. Si los tres componentes
operan de manera independiente y si la probabilidad de que uno, cualquiera de ellos, est
funcionando es de 0.95, determinar la probabilidad de que el sistema funcione para cada una de
las cuatro configuraciones.

2.13

Supngase que se va a seleccionar una muestra aleatoria de tamao dos de un lote de 100, y que
se sabe 98 de los 100 artculos se encuentran en buen estado. La muestra se toma de manera tal
que el primer artculo se observa y se regresa antes de seleccionar el segundo artculo. Cul es la
probabilidad de seleccionar,
(a) Dos piezas sin defecto. R: 0.96 96%
(b) A lo ms una con defecto. R: 0.98 98%
(c) Dos con defecto. R: 0.1 * 10-3.

2.18 Una aerolnea tiene seis vuelos diarios de Nueva York a California y siete vuelos de
California a Hawi. Si los vuelos se hacen en das separados, cuntos diferentes arreglos de
vuelos puede ofrecer la aerolnea de Nueva York a Hawi?

2.19 Una operacin de montaje en una empresa manufacturera requiere tres pasos que se
pueden realizar en cualquier orden. De cuntas maneras se puede hacer el montaje?

2.21 Cierta marca de automviles tiene cinco modelos diferentes, con cuatro tipos de motores,
con dos tipos de transmisiones, y en ocho colores.
a) Cuntos coches tendra que adquirir un distribuidor si quiere un automvil por cada combinacin
modelo-motor-transmisin?
b) Cuntos coches tendra que tener en existencia un centro de distribucin si almacenara los
coches de todos los colores disponibles para cada combinacin de (a)?

2.27 Un investigador quiere determinar el efecto de tres variables, presin, temperatura y el


tipo de catalizador, en la produccin de un proceso de refinacin. Si el investigador tiene la
intencin de utilizar tres temperaturas, tres presiones y dos tipos de catalizador, cuntos

Pgina 17
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

experimentos habra que hacer si quisiera incluir todas las posibles combinaciones de presin,
temperatura y tipos de catalizador?

2.28 Cinco empresas E1, E2, E3, E4, E5, hacen propuestas con respecto a tres contratos
separados, C1, C2 y C3. Una empresa slo puede obtener a lo ms un contrato. Los contratos son
completamente diferentes, de tal forma que la asignacin de C1 a E1 se debe diferenciar de la
asignacin de C2 a E1.
a) Cuntos puntos muestrales hay en total en este experimento que trata de la asignacin de los
contratos a las empresas?
b) Encuentre la probabilidad de que se le conceda un contrato a la empresa E3, bajo el supuesto de
que los puntos muestrales son equiprobables.

2.32 En 1976 la Junta de Asesores para las Relaciones Humanas de Gainsville, Florida,
formada por ocho personas, consider la denuncia de una mujer que se quej de discriminacin
por parte de una compaa local, por el hecho de ser mujer. La Junta, compuesta por cinco mujeres
y tres hombres, vot 5 a 3 en favor de la demandante, las cinco mujeres votaron a favor y los tres
hombres en contra. El abogado representante de la compaa apel la decisin de la Junta
alegando parcialidad de los miembros de sta de acuerdo con sus sexos. Si no hubiera parcialidad
por parte de la Junta, sera razonable concluir que cualquier grupo de cinco miembros de la Junta
votara a favor de la demandante con la misma probabilidad. Si esto fuera cierto, cul sera la
probabilidad de que el voto se dividiera d acuerdo con los sexos (las cinco mujeres a favor, los
tres hombres en contra)?

2.5 Probabilidad condicional

La probabilidad de un evento variar dependiendo de la ocurrencia o la no-ocurrencia de uno


o ms eventos relacionados. Por ejemplo, los pescadores se interesan en gran manera en la
probabilidad de que llueva. La probabilidad que llueva en un da dado, cuando se desconocen las
condiciones atmosfricas cotidianas o cualquier otro evento. Esto se llamara la probabilidad
incondicional del evento lluvia en un da dado.

La probabilidad incondicional de obtener un uno en un solo lanzamiento de un dado perfecto


es 1/6. La probabilidad condicional de un uno, de que se obtuvo un nmero impar es 1/3. Es decir,
1, 3 y 5 ocurren con una frecuencia igual. Entonces la probabilidad condicional de un evento es la
probabilidad (frecuencia relativa de ocurrencia) del evento, dado el hecho de que ya ocurrieron uno
o ms eventos. Un examen cuidadoso del ejemplo anterior indicar la concordancia de la definicin
siguiente con el concepto de frecuencia relativa de la probabilidad.

Definicin. La probabilidad condicional de un evento A, ya que ocurri un evento B, es igual a

p ( A B)
p ( A|B )=
p (B )

siempre que P(B) > 0. El smbolo P(A B) se lee la probabilidad de A dado B.

Supngase que un experimento se repite una cantidad de veces, N, y que se obtienen como
resultados ambos eventos, A y B, A B, n11 veces; A y no B, A B, n21 veces; B y no A, A B,
n12 veces, y ni A ni B, A B, n21 veces. Estos resultados se representan en la siguiente tabla:

Pgina 18
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

A A
B n 11 n12
B n21 n22

Note que n11 + n12 + n21 + n22 = N, entonces se tiene que

n1,1 +n2,1 n +n n 1,1 n


p ( A )= ; p ( B )= 1,1 1,2 ; p ( AB )= ; p ( A B )= 1,1 .
N N n1,1 +n1,2 N

Con estas probabilidades podemos ver fcilmente que

p ( A B) p ( A B)
p ( B| A )= ; p ( A|B )= .
p ( A) p (B )

Por lo tanto, la definicin anterior es congruente con el concepto de frecuencia relativa de la


probabilidad.

Supngase que la ocurrencia de un evento A no se afecta por la ocurrencia o no-ocurrencia


de un evento B. Cuando esto sucede, se podra afirmar que el evento A es independiente del
evento B. Esta relacin entre dos eventos se presenta por la siguiente definicin.

Definicin. Dos eventos A y B son independientes s P(A B) = P(A) P(B). Si esta ocurrencia
no se satisface, los eventos son dependientes. Ntese que la definicin es equivalente a expresar
que los eventos A y B son independientes s P(A B) = P(A) P(B A) = P(B).

La nocin de independencia como un concepto probabilstico es congruente con el uso


cotidiano de esta palabra si se consideran cuidadosamente los eventos en cuestin.

Ejemplo: En una encuesta a 159 personas, se ha encontrado sus caractersticas con respecto
a su hbito de fumador y su sexo. Sea el espacio muestral, la poblacin de adultos de la encuesta,
que se divide en los siguientes eventos: fumador A1, no-fumador A2, hombre B1, mujer B2. Los
eventos en S pueden representarse como sigue:

B1 B2
A1 24 77
A2 19 39

Ntese que 24 de los 159 adultos son hombres que fuman, por lo que son poseedores de los
atributos A1 y B1. Supngase que se desea determinar la probabilidad de ocurrencia simultnea de
los eventos A1 y B2. Mediante el empleo de la interpretacin de frecuencia relativa puede
argumentarse que, dado que exactamente 77 de los 159 adultos poseen ambos, fumador y mujer,
la probabilidad es
77
0.4843
159
.

Esta ltima recibe el nombre de probabilidad conjunta, puesto que se insiste en la probabilidad
de resultados comunes a ambos eventos A1 y B2.

Pgina 19
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Supngase que ahora el inters recae en determinar la probabilidad Ai, sin considerar
cualquier otro evento Bj del espacio muestral S. Para especificar, supngase que se necesita la
probabilidad del evento A2. Haciendo uso de nuevo de la interpretacin de frecuencia relativa, el
nmero de personas no fumadoras A2, es 19 + 39; de esta manera se tiene

P ( A2 )
19 39 0.3648
159

Este tipo de probabilidad se conoce como probabilidad marginal porque para determinarla se
ignoran una o ms caractersticas del espacio muestral.

Por ltimo, supngase que el inters ahora es el de determinar la probabilidad de un evento


Ai, dado que ha ocurrido el evento Bj. Para ello se ha elegido una mujer adulta B2. Cul es la
probabilidad de que fume?

El argumento descansa sobre la interpretacin de frecuencia relativa. Sin embargo, una vez el
evento mujer ha ocurrido, ste reemplaza a S como espacio muestral de inters. Por lo tanto, la
probabilidad de tener fumador, A1, es el nmero de mujeres que fuman 77, entre el nmero total de
estas (77 + 39)

77
p ( A 1|B 2) = =0.6638
77+39

donde la barra vertical se lee dado que, y separa al evento A1, cuya probabilidad est condicionada
a la previa ocurrencia del evento B2. Esta recibe el nombre de probabilidad condicional de A1 dada
la ocurrencia B2.

Ejemplo: En cierta ciudad, 40% de los votantes son republicanos y 60% son demcratas; 70%
de los republicanos y 80% de los demcratas estn a favor de una emisin particular de bonos. Al
seleccionar al azar un votante de la ciudad, Cul es la probabilidad de que est a favor de la
emisin de los bonos?

Ejercicio: Una gran tienda de departamentos vende camisas deportivas en tres tallas
(pequea, mediana y grande) y tres modelos (a cuadros, estampadas y de franjas) y dos largos de
manga (corta y larga). Las siguientes tablas dan las proporciones de camisas vendidas que caen
en varias combinaciones de categoras.

Manga corta
Modelo
Talla Cuadros Estampada Franjas
Pequea 0.04 0.02 0.05
Mediana 0.08 0.07 0.12
Grande 0.03 0.07 0.08

Manga larga
Modelo
Talla Cuadros Estampada Franjas
Pequea 0.03 0.02 0.03
Mediana 0.10 0.05 0.07

Pgina 20
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Grande 0.04 0.02 0.08

(a) Cul es la probabilidad de que la siguiente venta sea de una camisa mediana, de manga
larga y estampada?
(b) Cul es la probabilidad de que la siguiente venta sea de una camisa mediana y
estampada?
(c) Cul es la probabilidad de que la siguiente camisa vendida sea de manga corta? Y de
manga larga?

Ejercicio: Un cierto taller repara componentes de audio y video. Denotemos por A el evento de
que el siguiente componente llevado a reparacin sea un componente de audio, y B el evento que
el siguiente componente sea un reproductor de discos compactos (por ello B est contenido en A).
Supongamos que P(A) = 0.6 y P(B) = 0.05. Cul es la probabilidad P(BA).

Ejercicio: Un ingeniero de una fbrica de microcircuitos inspeccionar un lote de obleas de


silicio para tratar de encontrarles defectos. Suponer que cuatro circuitos integrados estn
defectuosos en un recipiente que contiene veinte obleas. Si seleccionan dos obleas al azar para
esa inspeccin. Calcular la probabilidad de que
(a) ninguna de ellas tenga defectos.
(b) por lo menos una de las dos no tenga defectos.
(c) ambas no tengan defectos, dado que por lo menos una no tiene defectos.

2.6 Teorema (o Regla) de Bayes

El procedimiento de la composicin de los eventos para resolver los problemas de la


probabilidad se facilita algunas veces al considerar el espacio muestral S como una unin de
subconjuntos que son mutuamente excluyentes, y al emplear la ley de la probabilidad total.

Teorema. Suponga que S = B1 B2 ... Bk con P(Bi) > 0, i = 1, 2..., k y Bi Bj = , para i j.


Entonces para cualquier evento A

k
p ( A )= p ( Bi ) p ( A|Bi )
i=1

La demostracin de este teorema se puede consultar en cualquier libro de probabilidad. Con


la demostracin se llega al siguiente teorema.

Teorema.
Supngase que S = B1
B2 ... Bk, en donde P(Bi) > 0, i = 1, 2, ..., k, y Bi Bj = para i j. Entonces

Pgina 21
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

p ( B j ) p ( A|B j )
p ( B j| A ) = k

p ( Bi ) p ( A|Bi )
i=1

Ejercicio: Una persona posee dos automviles, un modelo compacto y uno estndar.
Aproximadamente utiliza el vehculo compacto para trasladarse a su trabajo las tres curtas partes
del tiempo y el restante usa el carro ms grande. Cuando emplea el carro compacto llega a su casa
a las 5:30 el 75% de las veces; si utiliza el carro de tamao estndar llega a la misma hora el 60%
de las veces (pero disfruta del aire acondicionado del auto ms grande). Si llega a su casa despus
de las 5:30, Cul es la probabilidad de que haya usado el auto compacto?

Ejercicio: Una compaa compra neumticos de dos proveedores, Prob-1 y Prob-2, El


proveedor uno tiene un antecedente de suministrar llantas con 10% de defectuosos, en tanto que el
proveedor 2 tiene una tasa de slo el 5% de defectos. Supngase que el 40% de las existencias
actuales vinieron del proveedor uno. Si se toma un neumtico de esa existencia y se ve que est
defectuoso, calcule la probabilidad de que haya suministrado el proveedor uno.
R: 4/7

Ejercicio: Entre cinco aspirantes a puestos de ingeniero qumico en una empresa, a dos se les
considera excelentes, y a los dems se les considera buenos. Un gerente escoge al azar dos de
los cinco para la entrevista. Calcula la probabilidad de que el gerente escoja
(a) a los dos excelentes
(b) por lo menos a uno de los excelentes
(c) a los dos excelentes, dado que ya se sabe que uno de los dos seleccionados es
excelente.

Ejercicio: Una empresa produce resistencias y las vende como resistencias de 10 []. Sin
embargo, los Ohms reales de los resistores pueden variar. Se observa que 5% de los valores son
menores que 9.5 [] y 10% son mayores que 10.5 []. Si en determinado sistema se usan dos de
esas resistencias, seleccionadas al azar, calcular la probabilidad de que
(a) ambas tengan valores reales entre 9.5 y 10.5 [].
(b) al menos una tenga un valor real mayor que 10.5 [].

Ejemplo: Se han nominado a tres miembros de un club privado nacional para ocupar la
presidencia del mismo. La probabilidad de que se elija al seor Del Mazo es de 0.3; la de que se
haga lo propio con el seor Crdenas, de 0.5 y la de que gane el seor Castillo, de 0.2. En caso de
que se elija al seor Del Mazo la probabilidad de que la cuota de ingreso se incremente es de 0.8;
si se elige al seor Crdenas o al seor Castillo, las correspondientes probabilidades de que se
incremente la cuota son de 0.1 y 0.4. Cul es la probabilidad de que haya un incremento en la
cuota de membreca?

Si alguien considera entrar al club pero retrasa su decisin por varias semanas slo para
encontrarse con que las cuotas de entrada han aumentado, cul es la probabilidad de que se
haya elegido al seor Castillo como presidente del club?

Probabilidad a priori.

Dadas n alternativas para un resultado en un experimento, y luego de haber formado un juicio


subjetivo del posible resultado de las probabilidades de ocurrencia de n alternativas. Dado que

Pgina 22
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

estas probabilidades reflejan el juicio o grado de creencia del investigador con respecto a la
ocurrencia, antes que estos se presenten se conocen como probabilidades a priori.

Probabilidad a posteriori.

Las probabilidades condicionales P(Bj A), j = 1, 2,..., n, se conocen como probabilidades a


posteriori.

Pgina 23
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

3. Variables aleatorias

Variable aleatoria
El concepto de variable aleatoria proporciona un medio para relacionar cualquier resultado
con una medida cuantitativa.

Definicin. Sea S un espacio muestral sobre el cual se encuentra definida una funcin de
probabilidad. Sea X una funcin de valor real definida sobre S, de manera que transforme los
resultados de S en puntos sobre la recta de los reales. Se dice entonces que X es una variable
aleatoria.

Se dice que X es aleatoria porque involucra la probabilidad de los resultados del espacio
muestral, y X es una funcin definida sobre el espacio muestral, de manera que transforma todos
los posibles resultados del espacio muestral en cantidades numricas.

Definicin. Se dice que una variable aleatoria es discreta si el nmero de valores se puede
tomar es contable (ya sea finito o infinito), y stos pueden arreglarse en una secuencia que
corresponde con los nmeros enteros positivos.

Definicin. Se dice que una variable aleatoria es continua si sus valores consisten en uno o
ms intervalos de la recta de los reales.

Ejemplo. La produccin de tarjetas de circuitos de dos lneas de fabricacin ajustadas para


producir tarjetas idnticas, se mezcla en una bandeja de recoleccin. Cuando los inspectores
examinan las tarjetas, es difcil determinar si una de ellas proviene de la lnea A. En ocasiones
puede ser til una determinacin probabilstica de esta pregunta. Supngase que la bandeja de
recoleccin contiene diez tarjetas de circuitos, de las cuales seis provienen de la lnea A y cuatro
de la lnea B. Un supervisor selecciona dos de estas tarjetas, que parecen idnticas, para
revisarlas. Se interesa en X, el nmero de tarjetas inspeccionadas que provienen de la lnea A.
Calcular la distribucin de probabilidad de X.

3.1 Definicin de variable aleatoria

Los experimentos se conciben de manera que los resultados del espacio muestral son
cualitativos o cuantitativos. Puede ser til la cuantificacin de los resultados cualitativos de un
espacio muestral y, mediante el empleo de medidas numricas, estudiar su comportamiento
aleatorio. El concepto de variable aleatoria proporciona un medio para relacionar cualquier
resultado con una medida cuantitativa.

Definicin. Las variables aleatorias (x1, x2,, xn) constituyen una muestra aleatoria de
tamao n, s
a) las xi son variables aleatorias independientes;
b) todas las xi tienen la misma distribucin de probabilidad.

Una variable aleatoria discreta representa los resultados de un espacio muestral en forma tal
que por P(X = x) se entender la probabilidad de que X tome el valor de x. Esta funcin recibe el
nombre de funcin de probabilidad de la variable aleatoria X.

Pgina 24
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Definicin. Sea X una variable aleatoria discreta. Se llamar a P(x) = P(X = x), funcin de
probabilidad de la variable aleatoria X, si satisface las siguientes propiedades
1. p(x) 0 para todos los valores x de X;
2. x p(x) = 1

Definicin. La funcin de distribucin acumulativa de la variable aleatoria X es la probabilidad


de que X sea menor o igual a un valor especfico de x y est dada por:
F(x) = P(X = x) = p(xi)

Ejemplo. Se tiene una parte de un circuito elctrico con dos relevadores numerados, 1 y 2,
que trabajan en paralelo. La corriente pasa cuando el cerrar un interruptor, cierra cualquiera de los
dos relevadores o los dos. La probabilidad de que cierre un relevador en forma correcta es 0.8, y
es la misma para ambos. Sea Ei, el evento en el que el relevador i cierra en forma correcta el
interruptor. Ahora bien, X puede tener slo tres posibles valores, ya que el nmero de relevadores
que cierran puede ser 0, 1 y 2. Calcular las probabilidades de estos valores de x.

Definicin. Se dice que una variable aleatoria X es continua si puede tomar el nmero infinito
de valores posibles asociados con intervalos de nmeros reales, y hay una funcin f(x), llamada
funcin de densidad de probabilidad, tal que

f(x) 0 La funcin de probabilidad f(x) es mayor o igual a cero.


La integral de la funcin de probabilidad siempre es igual a
f ( x ) dx=1 uno.

b La probabilidad de un intervalo conocido es el resultado de


p ( a X b ) = f ( x ) dx esa integral en el intervalo.
a

Ejemplo. Supngase que hemos llevado a cabo un experimento con el objeto de medir la
vida til de 50 bacterias de un determinado tipo, seleccionadas de entre una mayor poblacin. El
comportamiento de su vida til sigue la funcin de densidad de probabilidad de la forma

{
x
1 ( 2)
e cuando x >0
f ( x )= 2
0 en otro caso

a) Calcular la probabilidad de que la vida til de una bacteria determinada de ste tipo sea menor
de 200 o mayor de 400 horas.

b) Ahora queremos saber la probabilidad de que una bacteria de este tipo dure ms de 300 horas
dado que ya ha estado en uso durante ms de 200 horas.

Definicin. La funcin de distribucin de una variable aleatoria X se define como F(b) = P(X
= x).

Pgina 25
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Si X es continua y tiene la funcin de densidad de probabilidad f(x), entonces



F ( b )= f ( x) dx

Note que F(x) = f(x).

Continuando con el ejemplo, X tiene una funcin de densidad de probabilidad

{
x
1 ( 2)
e cuando x >0
f ( x )= 2
0 en otro caso

S, F(b) = 0; pues porque solo tiene valor cuando x > 0;

x
b x
e2
F ( b )=P ( X b )= dx=e 2

0
2

Cuandob > 0;

Ejercicio. Un vendedor de petrleo difano tiene un tanque de 200 galones lleno al principio de
cada semana. Sus demandas semanales tienen un comportamiento de frecuencia relativa que
aumenta constantemente hasta llegar a 100 galones, y a continuacin permanece igual entre 100 y
200 galones. Si x representa la demanda semanal en cientos de galones, suponer que las
frecuencias relativas de la demanda se modelan en forma adecuada mediante:
0 x0


x 0 x 1

f (x )
1 1 x 2
2


0 x2

Calcular F(b) para esta variable aleatoria. Usar F(b) para calcular la probabilidad de que la
demanda sea mayor a 150 galones en determinada semana.

La distribucin acumulativa F(x), es una funcin lisa no decreciente de los valores de la


variable aleatoria con las siguientes propiedades:
1. F(-) = 0; cuando el valor de x no ha sido evaluado en los intervalos de accin de la
funcin;
2. F() = 1; cuando la funcin alcanza el mximo valor de la evaluacin;
3. P(a < X < b) = F(b) F(a);
dF ( x)
f ( x)
dx
4. .

Pgina 26
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Ejemplo. La variable aleatoria X representa el intervalo de tiempo entre dos llegadas


consecutivas a una tienda y su funcin de densidad de probabilidad est dada por:
ke x / 2 cuando x 0
f ( x)
0 en otro caso

a) determinar el valor de k (el tiempo de llegadas), la funcin de distribucin acumulativa;


b) la probabilidad de que 2 < X < 6;
c) la probabilidad de que X 8.

3.2 Distribuciones de probabilidad

La distribucin de probabilidad o distribucin de una variable aleatoria x es una descripcin


del conjunto de valores posibles de x, junto con la probabilidad asociada con cada uno de estos
valores. A menudo la distribucin de probabilidad de una variable aleatoria es el resumen ms til
de un experimento aleatorio.

La distribucin de probabilidad de una variable aleatoria puede darse de varias maneras.


Para una variable aleatoria que puede tomar un nmero pequeo de valores, es conveniente
enlistar los valores posibles junto con las probabilidades, ya visto en clase; En otros casos, es
conveniente expresar en trminos de una frmula la probabilidad de que la variable aleatoria x
tome un valor xi.

3.3 Esperanza matemtica

Definicin. Sea X una variable aleatoria. El n-simo momento de X alrededor de cero se define
por:
' n=E ( x n )= x n p ( x ) si x es variable discreta
x

' n=E ( x n ) = x n f ( x ) dx si x es variable continua


Este valor, n, alrededor de cero es conocida como la media o valor esperado de la variable
aleatoria. La media de una variable aleatoria se considera como una cantidad numrica alrededor
de la cual los valores de la variable aleatoria tienden a agruparse. Por lo tanto, la media es una
medida de tendencia central.

3.4 Momentos. Funcin generatriz de momentos

Definicin. El n-simo momento central de X o el n-simo momento alrededor de la media de


X se define por

Pgina 27
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

n n
n=E ( x ) = ( x ) p ( x )
x
n n
n=E ( x ) = ( x ) f ( x ) dx

El momento central, cero, de cualquier variable aleatoria es la unidad, dado que


0 = E (x )0 = E (1) = 1

De manera similar, para el primer momento:


1 = E(x )1 = E (x) = 0
Pues el valor de la esperanza menos el valor de la media, que es la esperanza, es igual a cero.

Para el segundo momento ser:


2 = E(x )2
El cual recibe el nombre de varianza o variancia de la variable aleatoria. Puesto que:
2 = E(x )2 = E (x2 2x + 2) = 2 2 = 2.

El tercer momento: 3 = E(x )3, esta relacionado con la asimetra de probabilidad de X. De


hecho cualquier momento de una variable aleatoria X puede expresarse en trminos de los
momentos de sta, alrededor de cero.

Por definicin n = E (x )n, pero E(x )n puede expresarse como:

n i

i ()
( x ) = (1 ) r i x ni

Ya que la esperanza de una suma es igual a la suma de las esperanzas. Para el tercer
momento:
3 = 3 32 + 23

3
3= 3
Estandarizando el tercer momento queda:
( 2)2

El cuarto momento central es: 4 = E (x )4 = 4 4 3 + 622 34.

Pgina 28
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Es
una medida de qu tan puntiaguda es la distribucin de probabilidad y recibe el nombre de curtosis.
Es posible estandarizarlo y queda como:
4
4= 2
2

Como vimos, el valor esperado, esperanza o media , de una variable aleatoria discreta X
que tiene una funcin p(x) de probabilidad est dada por:
E ( x )= x i p ( x i )= ' 1=
i=0

La varianza o variancia, de una variable aleatoria X cuyo valor esperado , es


Var ( x )=E ( x )2= 2

Para la desviacin estndar de la variable aleatoria X es la raz cuadrada de la varianza, y


est definida mediante:


= 2= E [ ( x )2 ]

Ejercicios.

3.2.11 Un taller de servicio para automviles que se especializa en afinaciones sabe que el
45% de stas se efecta en vehculos de cuatro cilindros, el 40% en autos de seis cilindros y el
15% en coches de ocho cilindros. Sea X el nmero de cilindros del siguiente automvil que llega a
servicio de afinacin.
(a) Cul es la distribucin de probabilidad de la variable X?
(b) Trace una grfica de la distribucin de probabilidades de X.

3.2.13 Un negocio de computadoras que atiende pedidos por correo tiene seis lneas
telefnicas. Asignamos a Y el nmero de lneas en uso a las 12 horas, obteniendo una distribucin
de probabilidad como sigue
Y 0 1 2 3 4 5 6
p(Y) 0.10 0.15 0.20 0.25 0.20 0.06 0.04

Calcule la probabilidad de que:


(a) A lo mas tres lneas estn en uso;
(b) Menos de tres de ellas se ocupan;

Pgina 29
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

(c) Por lo menos tres lneas estn en uso;


(d) Entre dos y cinco lneas, inclusive, estn en uso.

3.2.14 Un contratista es requerido por un departamento de planeacin de una localidad, para


que emita de un a cinco formas (dependiendo de la naturaleza del proyecto) para solicitar permiso
de construccin. Sea Z el nmero de formas requeridas del solicitante. Se sabe que la probabilidad
de que z formas se requieren es proporcional a z, esto es, p(z) = kz para z = 1, 2,, 5.

a) Qu valor toma la constante k? [sugerencia: p ( z )=1 ]


z=1

b) Cul es la probabilidad de que por lo menos se necesitan tres formas?


c) Cul es la probabilidad de que se necesiten entre dos y cuatro formas (inclusive)?

3.2.15 Muchos fabricantes tienen programas de control de calidad que incluyen la inspeccin
de materiales recibidos para corroborar que no hay defectos. Suponga que el fabricante de
computadoras recibe tarjetas de computadora en lotes de cinco, se seleccionan dos tarjetas de
cada lote para inspeccionarlas. Podemos representar posibles resultados del proceso de seleccin
por pares. Como ejemplo, el par (2, 3) representa la seleccin de las tarjetas 2 y 3 para
inspeccionarse.

a) Haga una lista de los diez posibles resultados

b) Suponga que las tarjetas 1 y 2 son las nicas defectuosas de un lote de cinco. Se van a
escoger dos tarjetas al azar. Defina a X como el nmero de tarjetas defectuosas observando
entre las inspeccionadas. Encuentre la distribucin de probabilidad de X

c) Denote a F(x) como la funcin aculada de la distribucin de probabilidad, determina F(0) =


P(X = 0), F(1) y F(2) y por ltimo a F(x) en forma general.

3.2.17 El voltaje de una batera nueva puede ser aceptable (A) o no aceptable (NA). Cierta
linterna de mano necesita dos bateras, as que stas han de seleccionarse y probarse
independientemente hasta encontrar dos aceptables. Supongamos que el 80% de todas las
bateras tiene voltaje aceptable y denotemos por Y el nmero de bateras que deben ser probadas.
a) Cul es la probabilidad de que haya dos aceptables en la primera seleccin?

b) Cul es la probabilidad de encontrar solo tres bateras tiles?

Pgina 30
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

4. Distribuciones discretas especiales

A continuacin trataremos algunas distribuciones, las ms comunes, que se presentan al


realizar estudios de comportamiento de pruebas y anlisis.

Tipos de distribucin de probabilidad

Variable Aleatoria Discreta Variable Aleatoria Continua


Uniforme discreta Uniforme
Binomial Normal
Geomtrica t-Student
Binomial Negativa
Poisson Ji-Cuadrado
Hipergeomtrica Exponencial
Multinomial Erlang
Gamma
Weibull
F-Fisher

4.1 Distribucin uniforme discreta

La variable aleatoria ms sencilla es aquella que toma slo un nmero finito de valores
posibles, cada uno con la misma probabilidad. Con frecuencia, el inters recae en una variable
1
.
n
aleatoria x que toma los valores numricos x1, x2,, xn; con la misma probabilidad

Definicin. Una variable aleatoria x es una variable aleatoria discreta uniforme si cada uno
de los n valores que estn en el intervalo de sta, x1, x2,, xn; tiene la misma probabilidad.
1
p( x)
n
Entonces

Supngase que x es una variable aleatoria discreta uniforme sobre los enteros consecutivos
a, a + 1, a + 2,, b; con a b.

E ( x)
b a
2
La media de la distribucin uniforme discreta es:

Var ( x) 2
b a 1 2 1
12
La varianza de la distribucin uniforme discreta es:

Ejemplo. La probabilidad de que el primer dgito del nmero de serie de una pieza sea uno
de los nmeros desde cero hasta nueve, es la misma. Si se toma una pieza al azar de un lote muy
grande, y x es el primer dgito del nmero de serie, entonces x tiene una distribucin discreta
uniforme con una probabilidad de 0.1, para cada valor de R = {0, 1, 2,, 9}.

Pgina 31
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Esto es, p(x) = 0.1; para cada valor de R.

Ejemplo. El sistema de comunicacin por voz de una empresa tiene 48 lneas externas. En
un determinado momento, se observa el sistema y algunas lneas estn ocupadas. Sea x la
variable aleatoria que denota el nmero de lneas en uso. Entonces x puede tomar cualquier valor
entero de cero a 48. Supngase que el nmero de lneas de voz que estn ocupadas en un
determinado momento, es una variable aleatoria discreta uniforme x.
( 0+ 48 )
Entonces la esperanza es E ( X )= =24
2

( 480+1 )2
y la varianza es Var ( x )= =200 .
12

4.2 Distribucin binomial

El modelo Binomial. Para obtener la funcin de probabilidad de la distribucin binomial,


primero se determina la probabilidad de tener, en n ensayos, x xitos consecutivos seguidos en x
n fracasos consecutivos. Dado que, por hiptesis, los n ensayos son independientes se tiene:
pp...p(1-p) (1-p)... (1-p) = px (1-p)n-x

La probabilidad de obtener exactamente x xitos y n x fracasos en cualquier otro orden es


la misma puesto que los factores p y (1 p) se reordenan de acuerdo con el orden particular.

Definicin. Sea x una variable aleatoria que representa el nmero de xitos en n ensayos y
p la probabilidad de xito con cualquiera de stos. Se dice entonces que x tiene una distribucin
binomial son funcin de probabilidad.
n! x nx
P ( x , n , p )= p ( 1p )
( nx ) ! x !

x = 0, 1, 2,..., n.

La probabilidad p(x; n, p) = 0, cuando 0 p 1, para n entero.

El nombre de distribucin binomial proviene del hecho de que los valores de p(x; n, p) para x =
0, 1, 2,..., n; son los trminos sucesivos de la expansin binomial de [(1 p) + p] n.
Condiciones para su uso:
1. En una observacin hay exactamente dos resultados posibles, uno de ellos se llama xito y
el otro fracaso.
2. Hay n observaciones, donde n es un mismo entero positivo establecido de antemano, por lo
tanto se consideran poblaciones infinitas.
3. Las observaciones son independientes entre s.
4. La probabilidad de xito se denomina o denota con la letra p, y el fracaso con una q [q = 1
p], para todas las ejecuciones o mediciones es la misma.

La media de una variable aleatoria binomial es: E(x) = = np.

Pgina 32
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

La varianza de una variable aleatoria binomial es: Var (x) = 2 = np (1 p).

Para el tercer momento con respecto de cero 3 = np (1 p) (1 2p);

12 p
3= 1/ 2
El tercer momento estandarizado ser [ np (1 p ) ]

Para el cuarto momento con respecto de cero: 4 = np (1 p) [3np(1 p) + [1 6p(1 p)]].

[ 16 p( 1 p)]
El cuarto momento estandarizado ser 4=3+
np ( 1 p )

La funcin generadora de momentos para la distribucin binomial es:

tx x x n x tp n
m x ( t )=E ( e )= C n p ( 1 p ) =[ ( 1 p ) +e ]
x

Ejemplo. Una mquina para llenar cajas no llena por completo una proporcin p de ellas. Si se
seleccionan al azar 25 cajas de las producidas por esa mquina, calcular la probabilidad de que no
haya ms de dos cajas incompletas cuando:
(a) p = 0.1;
(b) p = 0.2.

Ejemplo. Un sistema de proteccin contra proyectiles dirigidos consiste en n equipos de radar


que trabajan en forma independiente, y cada uno tiene la misma probabilidad de xito, de 0.9, de
descubrir una aeronave que entra a determinada zona (todos los equipos de radar cubren la misma
zona). Si un aeroplano entra a la zona, calcule la probabilidad de que sea descubierto si
(a) n = 2;
(b) n = 4.

Una manera de evitar el clculo con herramientas actuales (calculadora) es mediante el


empleo de tablas.

Pueden determinarse las probabilidades individuales mediante el empleo de esta tabla puesto
que la variable aleatoria binomial tiene un valor entero, y la propiedad P(x; n, p) = F(x; n, p) F(x
1; n, p), se verifica.

Ejemplo. Todos los das se seleccionan, de manera aleatoria, 15 unidades de un proceso de


manufactura con el propsito de verificar el porcentaje de unidades defectuosas en la proporcin.
Con base en la informacin pasada la probabilidad de tener una unidad defectuosa es de 0.05. La
gerencia ha decidido detener la produccin cada vez que una muestra de 15 unidades tenga dos o
ms defectuosas. Cul es la probabilidad de que la produccin se detenga?

Ejemplo. Una compaa de exploracin petrolera va a perforar diez pozos y cada uno de ellos
tiene una probabilidad de 0.1 de producir petrleo en forma comercial. A la compaa le cuesta
$10,000 dlares perforar cada pozo. Un pozo comercial saca petrleo por valor de $500,000
dlares.

Pgina 33
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

(a) Calcula la ganancia que espera obtener la compaa por diez pozos.
(b) Calcula la desviacin estndar de las ganancias de la firma.

Ejemplo. Sea un lote grande de fusibles con 10% de defectuosos. Si se extraen al azar cuatro
fusibles del lote, calcular la probabilidad de que slo un fusible est defectuoso. Calcular la
probabilidad de que por lo menos un fusible en la muestra salga defectuoso.

Ejemplo. En un estudio de la vida til de determinado tipo de bacteria, se encontr que la


probabilidad de que la vida til X sea mayor que cuatro horas es 0.135. Si se usan tres bacterias de
este tipo en sistemas que trabajan en forma independiente, calcular la probabilidad de que slo una
de ellas dure cuatro horas o ms.

Ejercicio. En relacin al ejemplo de los fusibles, supngase que los cuatro fusibles que se
extraen del lote se envan a un cliente antes de probarlos, con garanta. Supngase tambin que
el costo de hacer efectiva la garanta est dada por C = 3y2, donde y es el nmero de piezas
defectuosas en el envo de cuatro. Calcule el costo esperado de reparacin.

Ejercicio. Una industria suministra un producto qumico a 10 plantas manufactureras. La


probabilidad de que cualquiera de las plantas llame y haga un pedido en un determinado da es
0.2, y es la misma para las 10 plantas. Calcular la probabilidad de que en un da determinado, el
nmero de plantas que llamen para hacer un pedido sea
(a) cuando mucho tres;
(b) cuando menos tres;
(c) exactamente tres.

4.3 Distribuciones binomial negativa y geomtrica

El modelo Geomtrico. Supngase que se puede representar una serie de lanzamientos de


cohetes mediante una sucesin de variables aleatorias de Bernoulli, independientes con xi = 1 si el
i-simo intento tiene como resultado un lanzamiento con xito y xi = 0, si no es as. Tambin
supngase que la probabilidad de un lanzamiento con xito es constante para las pruebas, y sea p
esta probabilidad.

Si x representa el nmero del intento en el que se tiene el primer xito, entonces


p ( x ; p )=( 1 p )x1 p

para n = 1, 2,...

Debido a la independencia entre los intentos. A esta frmula se le conoce como distribucin
geomtrica de probabilidad.

Condiciones para su uso.


1. En una observacin hay dos posibles resultados, xito y fracaso.
2. Hay n observaciones, las poblaciones son finitas.
3. Las observaciones son independientes una de otra.
4. Se denota el xito con una p y al fracaso con una q.
5. Se busca slo el primer xito (o fracaso).

Pgina 34
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

1
La media de una variable aleatoria geomtrica es:
E ( x )=
p

1 p
Var ( x )=
La varianza de una variable aleatoria geomtrica es: p2

t
pe
La funcin generadora de momentos queda como:
mx ( t )=
1 (1 p ) et

Ejemplo. Una empresa de reclutamiento encuentra que el 30% de los aspirantes para
determinado puesto en la industria tiene conocimientos avanzados de programacin. Se entrevista
a los aspirantes uno a uno, para lo cual se seleccionan al azar de entre el grupo. Calcular la
probabilidad de que el primer aspirante con conocimientos avanzados de programacin sea el
quinto entrevistado.

Ejemplo. Del ejemplo anterior. Sea X el nmero de la entrevista en la que se encuentre al


primer aspirante con entrenamiento avanzado en programacin de computadoras. Supngase que
al primer aspirante se le ofrece el puesto, y que el aspirante acepta. Si cada entrevista cuesta
$30.00, calcular el valor esperado y la varianza del costo total de las entrevistas hasta que se
ocupa el puesto. Dentro de qu intervalo se acepta que caiga este costo?

Ejercicio. Un contador pblico ha encontrado que nueve de diez auditorias aplicadas a


compaas, contienen errores importantes. Si el contador revisa la contabilidad de una serie de
compaas Cul es la probabilidad de que
(a) la primera contabilidad con errores sustanciales sea la tercera contabilidad revisada?
(b) Cul es la probabilidad de que la primera contabilidad con errores importantes fuera
encontrada despus de revisar la tercera?

Ejercicio. Cul es el valor de la media y la desviacin estndar del nmero de contabilidades


que hay que revisar para obtener la primera con errores sustanciales?

El modelo Binomial negativo. Ahora sabemos que la distribucin geomtrica modela el


comportamiento probabilstico del nmero del intervalo en el que el primer xito se da. En lo
siguiente haremos lo propio para el r-simo xito. La distribucin de probabilidad para estos casos
es la distribucin binomial negativa.

La distribucin binomial negativa se emplea para modelar una gran variedad de fenmenos,
como por ejemplo, de defectos por metro cuadrado de telas, hasta de individuos en una poblacin
de insectos despus de muchas generaciones.

Condiciones para su uso.


1. En una observacin hay dos posibles resultados, xito y fracaso.
2. Hay n observaciones, las poblaciones son finitas.
3. Las observaciones son independientes una de otra.
4. Se denota el xito con una p y al fracaso con una q.
5. Se puede encontrar el n-simo xito (o fracaso) en las observaciones.

Pgina 35
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Para su clculo de la distribucin se emplea la siguiente frmula:

( )
p ( x ; r , p )= x 1 p r ( 1 p )
r 1
xr

donde x = r, r + 1, r + 2,... para 0<p<1

r
La media de una variable aleatoria binomial negativa es:
E ( x )=
p

r ( 1 p )
La varianza de una variable aleatoria binomial negativa es:
Var ( x )=
p2

La funcin generadora de momentos queda como: [


mx ( t )=
p et
1( 1 p ) e t ]
Ejemplo. Un gran lote de bombas usadas contiene un 20% de ellas que no sirven y
necesitan reparacin. Se manda a un mecnico con tres juegos de refacciones. Selecciona
bombas al azar y las prueba una tras otra. Si trabaja una bomba, prosigue con la siguiente. Si no
trabaja, le instala uno de sus juegos de refacciones. Suponga que tarda 10 [min], en probar si una
bomba trabaja o no, y 30 [min], en probar y reparar una bomba que no trabaja. Calcular el valor
esperado y la varianza del tiempo total que le llevar terminar con sus tres juegos.

Ejemplo. La probabilidad de que la calefaccin de un transductor en un instrumento elctrico


cumpla con las especificaciones del sistema de medicin es de 0.6. Suponga que los intentos de
calibracin son independientes. Cul es la probabilidad de que se requieran como mximo tres
intentos para satisfacer las especificaciones del sistema de medicin?

Ejemplo. Un estudio geolgico indica que un pozo exploratorio debera dar petrleo con una
probabilidad de 20%.
(a) Cul es la probabilidad de que el tercer descubrimiento ocurra en la quinta
perforacin?
(b) Determine la media y la varianza del nmero de pozos que hay que perforar si la
compaa quiere establecer tres pozos con produccin petrolera.

Ejercicio. Un gran lote de llantas contiene 10% de defectuosas y de ah se elegirn cuatro


para colocarlas en un auto.
(a) Halle la probabilidad de que seis llantas deban seleccionarse del lote para obtener
cuatro en buen estado.
(b) Calcule el valor esperado y la varianza del nmero de selecciones que deben
efectuarse para obtener cuatro llantas sin defectos.

4.4 Distribucin de Poisson

Pgina 36
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

El modelo de Poisson. Llamada as por Simen Denis Poisson, matemtico Francs.


Muchos eventos aleatorios ocurren de manera independiente con una velocidad constante en el
tiempo o en el espacio. Como por ejemplo el nmero de personas que llegan a una lnea de cobro
en una tienda de autoservicio en un tiempo determinado, en la lnea de las tortillas, en la fila en un
banco, el nmero de defectos de piezas similares para el material de construccin, las lneas de
montaje, las producciones en serie, ensamblaje y empaque de artculos producidos en las
industrias, etctera.

La distribucin de Poisson es el principal modelo de probabilidad empleado para analizar


problemas de lnea de espera, tambin conocido como Teora de Colas. Adems, ofrece una
aproximacin excelente a la funcin de probabilidad binomial cuando p es pequeo y n es grande.

Condiciones para su uso.


1. Las ocurrencias son por unidad de medicin (tiempo, masa, volumen, etctera).
2. Para valores muy grandes de n observaciones y muy pequeas para el promedio [p(x)
es la probabilidad de ocurrencia].
3. La probabilidad de ocurrencia es la misma en todo el campo de observacin.
4. El nmero de ocurrencia de cualquier intervalo es independiente del nmero de
ocurrencias en otros intervalos.

Para el clculo de dicha distribucin se cuenta con la siguiente frmula:


x
e
p (x ; )=
x!
x = 0, 1, 2,... con > 0.

es el nmero de ocurrencias del evento aleatorio por unidad de tiempo.

La probabilidad de que ocurra una variable aleatoria de Poisson x sea menor o igual a un
valor de x se denomina por la funcin de distribucin acumulativa
e i
p ( X=x )=F ( x ; ) =
i i!

El valor esperado o media es: E(x) = .

La varianza es: Var(x) =.

1
3=
El tercer momento estandarizado es:

1
El cuarto momento estandarizado es:
4=3+

m x (t)=e [ e 1]
t

La funcin generadora de momentos es:

Pgina 37
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Ejemplo. Para determinada industria manufacturera, el nmero de accidentes de trabajo es


tres por semana, en promedio.
(a) Calcular la probabilidad de que en una semana no se presenten accidentes.
(b) Considere los datos del ejemplo anterior. Calcule la probabilidad de que el nmero de
accidentes sea como mximo cuatro, que por lo menos haya cuatro accidentes en el
mes y por ltimo que el nmero de accidentes sea cuatro.

Ejemplo. El gerente de una planta industrial planea comprar una mquina nueva de cada
uno de los tipos, A y B. Para cada da de funcionamiento, el nmero de reparaciones X que
necesita la mquina A es una variable aleatoria de Poisson cuyo promedio es 0.01t, siendo t el
tiempo, en horas de funcionamiento diario. El nmero de reparaciones Y para la mquina B es una
variable de Poisson cuyo promedio es 0.12t. El costo diario de operacin es de A, cA(t) = 10t + 30x2;
y para B es cB(t) = 8t + 30y2. Suponer que las reparaciones toman un tiempo tan pequeo que se
puede hacer caso omiso de l, y que se limpian las mquinas durante la noche y, por lo tanto,
trabajan como si fueran nuevas al inicio de cada da. Cul de las mquinas da el costo mnimo
esperado, si un da consiste en
(a) diez horas;
(b) en veinte horas.

Ejercicio. El nmero de errores tipogrficos cometidos por una capturista en una


computadora, en particular tiene una distribucin de Poisson con una media de cuatro errores por
pgina. Si una pgina dada tiene ms de cuatro errores, la mecangrafa tendr que repetir la
pgina entera, Cual es la probabilidad de que no se tenga que repetir cierta pgina?
R: 0.6288

Ejercicio. Un estacionamiento tiene dos entradas. Los coches llegan a la entrada I de


acuerdo con una distribucin de Poisson con una media de tres por hora, y a la entrada II de
acuerdo con una distribucin de Poisson con una media de cuatro por hora Cual es la
probabilidad de que tres coches lleguen al estacionamiento durante una hora dada? (se supone
que los nmeros de coches que llegan a las dos entradas son independientes). R: 0.0521

4.5 Distribucin hipergeomtrica

Definicin. Sea N el nmero de objetos en una poblacin finita, de manera que k de stos
es de un tipo y N k de otro. Si se seleccionan una muestra aleatoria de la poblacin constituida
por n objetos de la probabilidad de que x sea de un tipo exactamente y n x sea del otro; est
dada por la funcin de probabilidad hipergeomtrica:

p ( x ; N , n ,k )=
( x )( nx )
k Nk

( Nn )
x = 0, 1, 2,..., n x k; n k N k; N, n, k .

k xitos de la poblacin; N tamao de la poblacin; x xitos de la muestra; n tamao de la


muestra.

Pgina 38
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

nk
La esperanza o media queda definida por:
E ( x )=
N

k
La varianza es
Var ( x )=np(1 p) ( Nn
N 1 ) con
p=
N

El coeficiente de asimetra o tercer momento como:


( N2 k ) ( N2 n ) ( N1 )1 /2
3= 1/ 2
( N 2 ) [ nk ( N k ) ( Nn ) ]

Y la curtosis relativa o cuarto momento estandarizado

4=
( N1 ) N 2
( N2 )( N3 ) nk ( N k ) ( Nn ) [ N
k
( )
N ( N +1 )6 n ( Nn ) +3 2 ( N k ) [ N ( n2 )N n +6 n ( Nn ) ]
2 2

Ejemplo. En un almacn se tienen 10 impresoras, de las cuales cuatro estn defectuosas.


Una compaa selecciona cinco de las mquinas al azar, suponiendo que todas funcionan bien.
Cul es la probabilidad de que las cinco mquinas sean no defectuosas?
R: 0.024

Ejemplo. La compaa repara las impresoras defectuosas a un costo de $500.00 MN, cada
una. Encuentre la media y la varianza del costo total de reparacin.

Ejemplo. Una corporacin muestrea, sin reemplazo a tres empresas para adquirir ciertos
suministros. La muestra se selecciona de un conjunto de seis empresas, de las cuales cuatro son
locales y dos no lo son. Sea y el nmero de empresas forneas entre las tres escogidas.
(a) Obtenga P(y = 1);
(b) Obtenga P(y 1);
(c) Obtenga P(y 1).

Ejercicio. En una lnea de montaje de robots industriales se pueden instalar cajas de


engranes con un minuto cada una si es que los agujeros de los tornillos se han barrenado en forma
correcta en las cajas, y en diez minutos si es que se deben volver a barrenar. Hay 20 cajas de
engranes y se supone que dos tendrn sus agujeros barrenados en forma incorrecta. Se deben
seleccionar cinco cajas de engranes de las 20 disponibles para que los instalen los siguientes cinco
robots en lnea.
(a) Calcula la probabilidad de que todas las cajas de engranes se ajusten adecuadamente.
(b) Calcula el valor esperado, la varianza y la desviacin estndar del tiempo que se necesita
para instalar las cinco cajas de engranes.

Ejercicio. Suponga que un radiorreceptor contenga seis transistores, de los cuales dos son
defectuosos. Se quitan y se prueban tres escogidos al azar. Sea y el nmero de defectuosos
encontrados, en donde y = 0, 1 2. Encuentre la distribucin de probabilidad para y. Exprese sus
resultados grficamente como un histograma de probabilidades.

Pgina 39
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Ejercicio. Muchas veces se estima el tamao de las poblaciones de animales utilizando el


mtodo de captura-marcaje-recaptura: Bajo este mtodo se capturan K animales, se les marca y se
le suelta en la poblacin. Cierto tiempo despus se capturan n animales, se anota y, el nmero de
animales marcados entre los n: Las probabilidades asociadas a y son una funcin de N, el nmero
de animales en la poblacin y el valor observado de y contiene informacin sobre el valor
desconocido de N. Supngase que k = 4, cuatro, animales son marcados y despus soltados. Se
toma una muestra al azar de n = 3 animales de la misma poblacin. Encuentre P(y = 1) como una
funcin de N. Cul valor de N maximiza P(y = 1)?

4.6 Distribucin multinomial

Una distribucin de probabilidad conjunta para mltiples variables discretas que es de gran
utilidad, es una extensin de la binomial. El experimento aleatorio que genera la distribucin de
probabilidad consiste en una serie de ensayos independientes. Sin embargo, los resultados de
cada ensayo pueden clasificarse en una de p clases.

Supngase que un experimento aleatorio consiste de una serie de n ensayos. Tambin


supngase que
(i) el resultado de cada ensayo se clasifica en una de k clases;
(ii) la probabilidad de que un ensayo genere un resultado en la clase uno [1], la clase dos
[2],, la clase k; es constante en todos los ensayos e igual a p1, p2,, pk,
respectivamente;
(iii) los ensayos son independientes.

Las variables aleatorias X1, X2,, Xk que denotan el nmero de ensayos que caen en la
clase 1, en la clase 2, , en la clase k, respectivamente; tienen una distribucin Multinomial con
una funcin de probabilidad conjunta

n!
p ( X 1=x 1 , X 2=x 2 , , X k =x k )= p x p x p xk
1 2 k

x1 ! x 2 ! x k ! 1 2

Para x1 + x2 ++ xk = n y p1 + p2 ++ pk = 1.

Ejemplo. De los 20 bits recibidos por un aparato electrnico, cul es la probabilidad de que
la calidad de 14 sea excelente [E]; de 3, buena [B]; de 2, aceptable [A] y de 1, pobre [P]?
Supngase que las clasificaciones de cada uno de los bits son eventos independientes y que las
probabilidades de E, B A y P son 0.6, 0.3, 0.08 y 0.02, respectivamente.
Si se utiliza la independencia, se tiene que la probabilidad de esta secuencia es

P(X1 = 14 [E], X2 = 3 [B], X3 = 2 [A], X4 = 1 [P]) = (0.614)(0.33)(0.082)(0.021) = 0.2708 x 10-10

Es evidente que todas las secuencias que estn formadas por el mismo nmero de letras E, B, A y
P tienen la misma probabilidad. En consecuencia, la probabilidad pedida puede hallarse el
multiplicar 0.2708 x 10-10 por el nmero de secuencias con 14 letras E, tres letras B, dos letras A y
una letra P.

La probabilidad pedida es

Pgina 40
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

20 !
p ( X 1=14, X 2=3, X 3 =2, X 4 =1 )= ( 0.2708 1010 )=0.0063
14 ! 3 ! 2! 1 !

La esperanza para la distribucin multimodal queda definida por:


E ( X i ) =n p i

La varianza para la distribucin multimodal queda definida por:


Var ( X i )=n pi ( 1 pi )

Ejercicio. La clasificacin de una plancha de ferrita se hace con base en el nmero de


huecos; la clasificacin es la clasificacin es alto, medio o bajo. El 5% de las planchas se clasifican
como alto; el 80%, medio; el 15% bajo. Se toma una muestra de 20 planchas para someterlas a
examen. Sean X, Y, Z el nmero de planchas clasificadas de manera independiente como alto,
medio o bajo, respectivamente.
Calcule la esperanza y la varianza.

Ejercicio. Se inspecciona una muestra de cuatro hornos electrnicos que se cayeron al ser
embarcados, y se les clasifica de acuerdo con el tipo de defectos que presentan: grandes, menores
o ninguno. En el pasado, 60% de los hornos que se cayeron tuvieron un defecto grande; 30% un
defecto menor, y 10% ningn defecto. Suponga que los defectos en los cuatro hornos se presentan
de manera independiente.
(a) Cul es la probabilidad de que, de los cuatro hornos que forman la muestra, dos tengan
defecto grande y dos uno menor?
(b) Cul es la probabilidad de que ningn horno tenga un defecto?
5. Distribuciones de probabilidad continuas especiales

5.1 Distribucin continua uniforme

Distribucin uniforme. Suponga que ocurre un evento en que una variable aleatoria toma
valores de un intervalo finito, de manera que se encuentran distribuidos sobre el intervalo.

Esto es, la probabilidad de que la variable aleatoria


tome un valor en cada intervalo de igual longitud es la misma.
Se dice entonces que la variable aleatoria se encuentra
distribuida uniformemente sobre el intervalo.

Definicin. Se dice que una variable aleatoria esta


distribuida uniformemente sobre el intervalo (a, b) si su funcin de densidad est dada por:

{
1
f x ; a , b = ba
( )
0

A esta distribucin tambin se le conoce como distribucin rectangular.

Condiciones para su uso


1. Las variables asumen valores sobre la escala continua entre dos puntos.
2. Todos los valores comprendidos en la escala tienen la misma probabilidad de
ocurrencia.

Pgina 41
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

La funcin de probabilidad es:


dc
f ( x ; a , b )=
ba

a es el valor mnimo de la poblacin, b es el valor mximo de la poblacin, c es valor mnimo de la


muestra [c > a, c < b y c < d], d es el valor mximo de la muestra [d > a, d > c y d < b].

a+b
La esperanza de la distribucin es:
E ( x )=
2

( ba )2
La varianza de la distribucin es: Var ( x )=
12

La distribucin acumulativa se determina de la siguiente manera:

{
0
x
(xa)
p ( X=x )=F ( x ; a , b ) =(ba) dt =
1

a (ba)
1

Ejemplo. Al estudiar las ofertas de contratos de envo, una empresa fabricante de


microcomputadoras ve que los contratos intraestados tienen ofertas bajas que se distribuyen
uniformemente entre 20 y 25, en unidades de miles de dlares. Calcule la probabilidad de que la
oferta baja del siguiente contrato de envo interestatal sea
(a) menor que $22 mil dlares;
(b) mayor que $24 mil dlares;
(c) Calcule el costo promedio de las ofertas bajas en contratos de este tipo.

Ejemplo. Para calcular por triangulacin el alcance de una fuente acstica, se debe medir
con exactitud el tiempo en el cual llega el frente de onda esfrico a un censor de repeticin. Segn
el artculo de Perruzzi y Hilliard, Journal of the Acoustical Society of America, 75(1), 1984, pp. 197-
201; se pueden modelar los errores de medicin como si tuvieran distribuciones uniformes.
Suponga que los errores de medicin estn distribuidos uniformemente de 0.05 a 0.05 [s].
(a) Calcula la probabilidad de que determinada medicin del tiempo de llegada tenga un error
de menos de 0.01 [s].
(b) Calcula el promedio y la varianza de tales errores de medicin.

Ejercicio. El espesor de la capa de sustancia fotoprotectora que se aplica a las obleas en el


proceso de fabricacin de semiconductores en cierta rea de la oblea, tiene una distribucin
uniforme entre 0.2050 y 0.2150 [m].
(a) Obtn la fundn de distribucin acumulada del espesor de la sustancia fotoprotectora.
(b) Obtn la proporcin de obleas en las que el espesor de la sustancia es mayor que 0.2125
[m].
(c) Qu espesor excede el 10% de las obleas?
(d) Obtn el valor de la media y la varianza del espesor de la sustancia fotoprotectora.

Pgina 42
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

5.2 Distribuciones Gamma, Exponencial y Chi cuadrado

El modelo exponencial
Condiciones para su uso
1. La obtencin de la distribucin de X depende de la hiptesis de que el nmero de
fallas sigue un proceso de Poisson.
2. El nmero de fallas depende de la longitud del intervalo y no de la posicin.

x
Modelo matemtico: f ( x ; )= e

1
La esperanza de la funcin de distribucin es:
E ( x )=

1
Var ( x )=
La varianza de la funcin de distribucin es: 2

Ejemplo. El tiempo de vida de los reguladores de voltaje de los automviles tiene una
distribucin exponencial con tiempo de vida medio de seis aos. Una persona compra un automvil
que tiene una antigedad de seis aos, con un regulador en funcionamiento y planea tenerlo por
espacio de seis aos.
(a) Cul es la probabilidad de que el regulador de voltaje falle en el lapso de seis aos?
(b) Si el regulador falla despus de tres aos de haber efectuado la compra del auto, se
reemplaza. Cul es el tiempo promedio que transcurrir hasta que el regulador vuelva a
fallar?

Ejemplo. Una refinadora de azcar tiene tres plantas de proceso y todas reciben azcar
morena en general. La cantidad de azcar que puede procesar una planta en un da se puede
representar mediante una funcin exponencial con un promedio de 4 [Ton] (mediciones en
toneladas), para cada una de las plantas. Si las plantas trabajan en forma independiente, calcular
la probabilidad de que procesen ms de cuatro toneladas en un da determinado.

Para la distribucin exponencial, del libro de Scheaffer & McClave:

{
x
e
x 0
f ( x ; )=
0 en lodemas

Ejemplo. En una zona de los EUA se pueden modelar las magnitudes de los terremotos
mediante una distribucin exponencial cuyo promedio es 2.4 en la escala de Richter. Obtn la
probabilidad de que el siguiente temblor que se presente en esa zona sea
(a) mayor que 3.0 grados;

Pgina 43
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

(b) este entre 2 y 3 grados.

El modelo Gamma
Modelo matemtico:

( r )= x r1 ex dx
0

para r > 0.

Propiedades:
(n + 1) = n! n > 0 y entero;
(n + 1) = n (n) n > 0;
(1/2) = .
(r) = (r 1) (r 1) = (r 1)!

r x r1 ex
Modelo probabilstico: f ( x ; ,r )= x > 0.
( r)

Si r es entero es funcin Erlang, si 0 < r < 1, entonces es una funcin Gamma.

r
La esperanza de la funcin de distribucin es:
E ( x )=

r
Var ( x )=
La varianza de la funcin de distribucin es: 2

Ejemplo. El tiempo que transcurre entre los problemas que se presentan en un proceso de
una lnea de produccin tiene una distribucin exponencial con una media de 30 das.
(a) Cul es el tiempo esperado para que se presente el cuarto problema?
(b) Cul es la probabilidad de que el tiempo necesario para que se presente el cuarto
problema sea mayor a 120 das?

Ejemplo. Las llamadas a un sistema telefnico siguen una distribucin de Poisson con media
de cinco llamadas por minuto.
(a) Cul es el nombre de la distribucin, y qu valores tienen los parmetros de sta: para el
tiempo transcurrido hasta que se recibe la dcima llamada?
(b) Cul es el tiempo promedio que transcurre hasta que se recibe la dcima llamada?
(c) Cul es el tiempo promedio entre la novena y la dcima llamada?

El modelo Chi-cuadrado [Ji-cuadrado o 2]


Para estimar la varianza poblacional o la desviacin estndar, necesitamos estar
familiarizados con el estadstico Chi-cuadrado. Si se elige una muestra de tamao n de una

Pgina 44
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

(n 1) s 2
2
poblacin normal con varianza 2, el estadstico tiene una distribucin muestral que es
una distribucin Chi-cuadrado con n 1 grados de libertad y se denota por 2.
El estadstico Chi-cuadrado, tambin se puede dar con una de las siguientes expresiones:
SS ( xx )
2= =
2 2

2
2 ( x )
SS es la suma de los cuadrados x n
n es el tamao de la muestra

Propiedades para la distribucin.


1. Los valores de Chi-cuadrado son mayores o iguales que cero.
2. La forma de una distribucin 2 depende de los grados de libertad. En consecuencia, hay un
nmero finito de distribuciones 2.
3. El rea bajo la curva 2 y sobre el eje horizontal es 1
[uno].
4. Las distribuciones 2 no son simtricas. Tienen
colas estrechas que se extienden a la derecha; esto
es, estn sesgadas a la derecha.
5. Cuando n > 2, la media de la distribucin 2 es n
1, y la varianza es 2(n 1).
6. El valor modal de una distribucin 2 se da en el
valor (n 3).

Ejemplo. Suponga que los tiempos requeridos por cierto autobs para alcanzar uno de sus
destinos en una ciudad forman una distribucin normal con una desviacin estndar de = 1 [min].
Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza
muestral sea mayor que 2, esto es, encuentre p(s2 > 2).

Ejemplo. Suponga que un fabricante de pernos est produciendo piezas de 8 [mm] de


dimetro y que los dimetros de esas piezas se distribuyen normalmente; con propsitos de control
de calidad, se obtuvo una muestra de 25 pernos de una lnea de produccin para estimar la
varianza de todos los dimetros, la cual result ser s 2 = 0.009 [mm2]. La varianza muestral s2 =
0.009 [mm2] da una estimacin puntual 2, que es la varianza de los dimetros que todos los
pernos de 8 [mm] producidos. Con el fin de obtener un intervalo de 95% de confianza para 2,
considere la siguiente figura. Queremos determinar los valores crticos tales que el rea entre ellos
sea 0.95.

Ejercicio. Los tiempos de llegada diaria de cierto tren a uno de sus destinos, se distribuye
normalmente, una muestra de 12 tiempo de llegada indican s = 1.789[min]. Construye un intervalo
del 99% de confianza para una varianza de la poblacin de horas de llegada.

Ejercicio. Se sabe que los pesos de ciertas especies de peces se distribuyen normalmente
con una desviacin estndar de 2 [gr], si se toma una muestra de 12 peces de las especies
referidas, encuentre la probabilidad de que la varianza de la muestra sea menor que 8.

Pgina 45
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Ejercicio. Una muestra de 13 latas de sopa producida por la compaa ACME, produjo los
siguientes pesos netos, medidos en onzas;
11.9 12.2 11.6 12.1 12.1 11.8 11.9 11.8 12.0 12.3 11.8 12.1
12.0 12.1
Si se supone que los pesos netos se distribuyen normalmente, construya intervalos del 95%
de confianza para la varianza y la desviacin estndar de la poblacin de pesos netos de todas las
latas de sopa producidas.

Ejercicio. La concentracin de colorante artificial comestible en seis lotes dio los registros
siguientes: 0.010 0.013 0.018 0.024 0.015 0.013. Se supone que tales concentraciones se
distribuyen normalmente, construya un intervalo de 95% de confianza para su varianza en la
poblacin de los lotes.

5.3 Distribucin normal

Condiciones para su uso.


Esta distribucin puede obtenerse al considerar el modelo bsico de una variable aleatoria
binomial cuando el nmero de ensayos se vuelve grande.

Se le conoce como distribucin


Gaussiana. Se emplea como
distribucin base para el muestreo, ya
que las medidas y proporciones de
muestras tienden a distribuirse
normalmente.

Esta distribucin tiene una forma de campana (por ello se le llama campana de Gauss) y es
simtrica con respecto de su media [localizada en la parte central de la curva]. El rea bajo la curva
representa el 100% de la probabilidad, as la probabilidad de que una variable tenga un valor entre
dos puntos es igual al rea bajo la curva entre estos dos puntos.

La distribucin normal definida con respecto a la


desviacin estndar se representa en la siguiente curva.

Modelo matemtico:
2

e
( ( x )
2
2 )
f ( x ; , )=
2

- < x < - < < >0

La esperanza es: E(x) = La varianza es: Var(x) = 2

Una variable aleatoria normal como = 0 y 2 = 1, recibe el nombre de distribucin aleatoria


normal estndar y se denota como z.

Pgina 46
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Si x es una variable aleatoria normal E(x) = y Var(x) = 2, entonces la variable aleatoria


x
z

, es una variable aleatoria normal con E(z) = 0 y Var(x) = 1.

Ejemplo. La resistencia a la traccin de un papel est modelada por una distribucin normal
con media = 35 [lb/plg2], y desviacin estndar = 2 [lb/plg2].
(a) Cul es la probabilidad de que la resistencia de una muestra sea menor que 40 [lb/plg 2]?
(b) Si las especificaciones requieren que la resistencia sea mayor que 30 [lb/plg 2] qu
proporcin de las muestras ser desechada?

Ejemplo. Una operacin de maquinado produce ejes de acero cuyos dimetros estn
distribuidos normalmente con un promedio de 1.005 [plg] y desviacin estndar de 0.01 [plg]. Las
especificaciones piden dimetros que queden en el intervalo de 1.0 0.02 [plg]. Qu porcentaje
de la produccin no cumplir las especificaciones?

Ejemplo. Un tipo de capacitor tiene resistencias que varan de acuerdo a una distribucin
normal con promedio de 800 [meg-ohm] y desviacin estndar de 200 [meg-ohm] (vase W.
Nelson, Industrial Quality Control, 1967, pp. 261 a 268). Una determinada aplicacin especfica
capacitares cuyas resistencias queden entre 900 y 1000 [meg-ohm].
(a) Qu proporcin de estos capacitares cumplirn con la especificacin?
(b) Si se escogen dos capacitares de un lote de ese tipo, cul es la probabilidad de que ambos
satisfagan la especificacin?

Ejemplo. Las ausencias por enfermedad de los empleados de una empresa en un mes
tienen una distribucin normal aproximada, con promedio de 200 [h] y varianza de 400 [h].
(a) Calcula la probabilidad de que el mes prximo el ausentismo total por enfermedad sea menor
que 150 [h].
(b) Para planear el programa del mes prximo, cunto tiempo debe suponer darse al ausentismo
por enfermedad, si aquella cantidad slo se debe superar con una probabilidad de tan slo
0.1?

Ejercicio. El pago por hora para los trabajadores de cierta planta automotriz se distribuye
normalmente con una media de 12.5 [dlares] y una desviacin estndar de 0.95; si de esta fbrica
se elige una muestra aleatoria de 100 trabajadores, encuentre la probabilidad de que la media del
pago por hora
(a) sea menor que 12.6 [dlares].
(b) est entre 12.45 y 12.65 [dlares].
(c) supere los 12.3 [dlares].

5.4 Distribucin t-Student

Recordatorio histrico.
En 1908, W. Gosset, un dirigente judo de una planta cervecera, public un artculo de
investigacin relativo a la ecuacin para la distribucin de probabilidad de t, como los empleados
de la planta cervecera no tenan permitido publicar los resultados de sus investigaciones, Gosset
public sus resultados firmndolos bajo el nombre de Student; desde entonces, la distribucin
muestral del estadstico t se le conoce como la distribucin t de Student.

Pgina 47
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

La verdadera ecuacin de la distribucin t de Student es muy complicada y para este curso


se omite, en su lugar se emplear la tabla de t que contiene una coleccin de valores t y sus
probabilidades asociadas.

La distribucin t de Student tiene las propiedades siguientes.


1. Su media es cero.
2. Es simtrica en relacin a la media o cero.
3. Es ms variable que la distribucin normal estndar.
4. Tiene la forma de campana.
5. Su forma exacta depende de los grados de libertad (gl = n 1).
2 gl
=
6. Sus varianzas dependen de los grados de libertad y ( gl2 ) si gl > 2.

7. Cuando n crece, la distribucin muestral de t se aproxima a la distribucin normal


estndar z.

Como las distribuciones muestrales de t son


ms variables que la distribucin normal estndar,
tienen las reas de las colas ms grandes que la
distribucin normal estndar, como se muestra en la
siguiente figura:

El estadstico t-Student est dado por la


x
t=
frmula:
s
n
Ejemplo. El promedio de vida de cierto tipo de calentador elctrico es de 10 aos con
desviacin estndar de 1.5, si se sabe que la duracin de los calentadores elctricos se distribuye
normalmente, calcule
(a) La probabilidad de que la media de la duracin en una muestra aleatoria de 16
calentadores sea menor de 10.5 aos.
(b) el valor de x, sea tal que el 20% de las medias calculadas para muestras aleatorias de
tamao 25 caiga debajo de x.

Ejercicio. Una fbrica de conservas de carne acaba de instalar una nueva mquina de
llenado, una muestra al azar de 20 botes llenos da un peso promedio de 16.05 [oz] con una
desviacin estndar de 1.5 [oz].
(a) Haga una estimacin de intervalo para el peso medio verdadero con 1 = 0.95.
(b) Si el contenido neto de cada bote supone que es de 16 [oz] ha sido ajustada
aproximadamente la mquina?

Pgina 48
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

5.2.2 La familia de distribuciones Gamma

Definicin. Se dice que una variable x continua tiene una distribucin gamma si la funcin de
densidad de la probabilidad de x es:

{
x
1 1

x e x 0
f ( x ; , )= ( )
0 de otro modo

La esperanza y la varianza de una variable


aleatoria x que tenga una distribucin gamma
f ( x ; , ) son

E ( x )= ; Var ( x )= 2

Clculo de probabilidades a partir de la


distribucin gamma. Cuando x es una variable aleatoria
estndar, la funcin de distribucin acumulada de x es

x
y 1 e y
F ( x ; )= dy x> 0
0 ( )

Recibe el nombre de funcin gamma incompleta (en ocasiones a esta expresin se le escribe sin el
denominador ( ) del integrando).

La funcin gamma incompleta tambin se le puede utilizar para calcular probabilidades en las que
aparezcan distribuciones gamma que no son estndar.

La distribucin Weibull. La familia de distribuciones Weibull fue introducida por el fsico sueco
Waloddi Weibull en 1939; su artculo A Statistical Distribution Function of Wide Applicability, J.
Applied Mechanics, vol. 18, pp. 293 297, analiza varias aplicaciones.

En algunas situaciones, hay justificaciones tcnicas para lo apropiado de la distribucin


Weibull, pero en otras, simplemente proporciona un buen ajuste para datos observados, para
valores particulares de y .

Pgina 49
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

{

x
1 ( )
x e x0
f ( x ; , )=
0 x< 0

Cuando = 1, la funcin de densidad de la probabilidad se reduce a la distribucin


1
exponencial, con
=
, por lo que la distribucin exponencial es un caso especial tanto de la
distribucin gamma como la de Weibull. Sin embargo, estas son distribuciones gamma que no son
Weibull, o viceversa, por lo que la familia no es un subconjunto de la otra. Tanto como se
pueden hacer variar para obtener un nmero de formas diferentes de distribucin de probabilidad.

Al integrar para obtener la esperanza y varianza resulta

{( ) [ ( )] }
2
1 2 1
( )
E ( x )= 1+ ; Var ( x )= 2 1+ 1+

Cuando x es una variable aleatoria estndar, la funcin de distribucin acumulada de una


variable aleatoria Weibull con parmetros y es

{
0 x <0
F ( x ; , ) = x

1e

() x0

Ejemplo. Sea x la resistencia final a la tensin a 200F de un tipo de acero que presenta
fragilidad al frio a bajas temperaturas. Suponga que x tiene una distribucin de probabilidad Weibull
con parmetros = 20 y = 100. Entonces
20

P ( x 105 )=F ( 105 ; 20,100 )=1e


(105
100 )
=10.0704=0.9295
Y
20 20

P ( 98 x 102 )=F (102 ; 20, 100 )F ( 98 ; 20, 100 )=e(0.98 ) e(1.02) =0.51290.2262=0.2867

Ejercicio. La duracin z en cientos de horas de cierto tipo de tubos al vaco tiene una
distribucin Weibull con parmetros = 2 y = 3. Calcule lo siguiente
(a) Esperanza y varianza;
(b) P(z 6);
(c) P(1.5 z 6).

Ejercicio. Sea x el tiempo (en semanas) del envo de un producto defectuoso hasta que el
cliente regresa el producto. Suponga que el tiempo mnimo de devolucin es = 3.5 y que el
exceso x 3.5 sobre el mnimo tiene una distribucin Weibull con parmetros = 2 y = 1.5.
(a) Cul es la funcin de distribucin acumulada de x?;

Pgina 50
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

(b) Cul es el tiempo esperado de devolucin y la varianza?;


(c) Calcule P(x > 5);
(d) Calcule P(5 x 8).

Pgina 51
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

La distribucin lognormal.

Definicin. Se dice que una variable aleatoria x no negativa tiene una distribucin de
probabilidad lognormal si la variable aleatoria y=ln x tiene una distribucin normal. La funcin
de distribucin de probabilidad resultante de una variable aleatoria lognormal cuando ln(x) esta
normalmente distribuida con parmetros y es

{
2
[ ln x ]
1 ( 2 2)
e x0
f ( x ; , )= x 2
0 x< 0

El lector debe tener cuidado en no confundir a y con la media y


desviacin estndar de la variable, ya que estos parmetros
pertenecen al logaritmo.

La esperanza y la varianza de una variable aleatoria x


lognormal, son

+ 2
2 2

( e 1 )
2 2 +
E ( x )=e ; Var ( x )=e

La Figura, ilustra las graficas de la distribucin de probabilidad lognormal; aun cuando la curva
normal sea simtrica, una curva lognormal tiene sesgo positivo.

Debido a que ln (x) tiene una distribucin normal, la funcin de distribucin acumulada de x
se puede expresar en trminos de la funcin de distribucin acumulada ( z) de una variable
aleatoria normal estndar z, para x > 0

ln x ln x
F ( x ; , ) =P ( X x )=P [ ln X ln x ] =P Z ( ) (
=
)
Ejemplo. Sea x la potencia mediana horaria (en decibeles) de seales de radio recibidas y
transmitidas entre dos ciudades. Los autores del artculo Families of Distributions for Hourly
Median Power and Instantaneus Power of Recieved Radio Signals, J. Research National Bureau of
Standars, 1963, vol. 67D, pp. 753 762, expresan que la distribucin lognormal proporciona un
modelo razonable de probabilidad para X. Si los valores de parmetro son = 3.5 y = 1.2,
entonces

3.50.72 8.44 1.44


E ( x )=e =68 ; Var ( x )=e ( e 1 )=14907.2

La probabilidad de la potencia recibida sea entre 50 y 250 dB es:

Pgina 52
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

P (50 X 250 )=F ( 250 ; 3.5,1.2 )F ( 50 ; 3.5,1.2 )= ( ln 2503.5


1.2 ) ( ln 503.5
1.2 )=0.95350.6331=0.32
La probabilidad de que X no exceda esta media es

P ( X 68 ) = ( ln 683.5
1.2 )=0.7257

Ejercicio. Una justificacin terica, basada en el mecanismo de falla de cierto material, sirve
de fundamento a la suposicin de que la resistencia a la ductilidad x de un material tiene una
distribucin lognormal. Suponga que los parmetros son = 5 y = 0.1.
(a) Calcule la esperanza y varianza de x;
(b) Calcule P(x > 120);
(c) Calcule P(110 x 130);
(d) Cul es el valor de la mediana de la resistencia a la ductilidad?

Ejercicio. El artculo The Statistics of Phytotoxic Air Pollutants, J. Royal Stat. Soc. 1989, pp.
183 198, sugiere la distribucin lognormal como un modelo para la concentracin de SO 2 sobre
cierto bosque. Suponga que los valores de parmetro son = 1.9 y = 0.9.
(a) Cules son el valor medio y la desviacin estndar de la concentracin?
(b) Cul es la probabilidad de que la concentracin sea a lo sumo 10?;
(c) Y que este entre 5 y 10?

Pgina 53
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

6. Estimacin

El propsito principal de la toma de una muestra aleatoria es obtener informacin sobre los
parmetros no conocidos de la poblacin. Por ejemplo, suponga que se desea obtener una
conclusin sobre el uso de transporte pblico hacia el plantel Iztapalapa de la UACM. Sea p el
valor no conocido de la preferencia del uso de cierta ruta. Resulta poco prctico encuestar a los
estudiantes, acadmicos y personal administrativo que acuden a esta casa de estudios para
determinar el valor de p. Para hacer una inferencia con respecto a la proporcin verdadera p, un
procedimiento ms razonable consiste en seleccionar una muestra aleatoria y utilizar la proporcin
observada p de personas en la muestra que prefieren transportarse en la ruta 14.

La proporcin de la muestra p se calcula dividiendo el nmero de personas de la muestra


que prefieren la ruta 44, entre el tamao total de la muestra n. Por lo que p, es una funcin de los
valores observados en la muestra aleatoria. p es una variable aleatoria y se le conoce como
estadstica.

Una estadstica es cualquier funcin de las observaciones contenidas en una muestra


aleatoria.

Al igual que p, la media x, la varianza s2, y la desviacin estndar s; son estadsticos (o


estadsticas).

Puesto que la estadstica es una variable aleatoria, sta tiene una distribucin de
probabilidad. Se conoce como distribucin de muestreo a la distribucin de probabilidad de una
estadstica.

Cuando se estudian problemas de inferencia es conveniente tener en cuenta el smbolo ,


que sirve para dichos fines. El objetivo de la estimacin puntual es seleccionar un nmero, con
base a los datos de la muestra, que sea el valor ms plausible de .

En general, si X es una variable aleatoria con distribucin de probabilidad f(x), y si x 1, x2,,


xn, es una muestra aleatoria de X de tamao n, entonces la estadstica = h(x 1, x2,, xn) recibe el
nombre de estimacin puntual de .

6.1 Estimacin puntual

Una estimacin puntual de algn parmetro de la poblacin es un valor numrico de la


estadstica .

Los problemas de estimacin se presentan con gran frecuencia en la ingeniera. A menudo


es necesario estimar:
La media de una poblacin.
La varianza 2 (o desviacin estndar ) de una poblacin.
La proporcin p de objetos de una poblacin que pertenecen a cierta clase de inters.
La diferencia entre medias de dos poblaciones, 1 2.
La diferencia entre proporciones de dos poblaciones p 1 p2.

Los estimadores puntuales razonables de estos parmetros, son los siguientes:


Para , el estimados es = x, la media muestral.
Para 2, el estimador es 2 = s2, la varianza muestral.

Pgina 54
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Para p, el estimado p = x/n, la proporcin muestral, donde x es el nmero de objetos en


una muestra aleatoria de tamao n que pertenece a la clase de inters.
Para 1 2, el estimado es 1 2 = x1 x2, la diferencia entre las medias muestrales de
dos muestras aleatorias independientes.
Para p1 p2, el estimado es p1 p2, la diferencia entre las proporciones de las dos
muestras, calculadas a partir de dos muestras aleatorias independientes.

6.2 Insesgado, varianza mnima, consistencia, suficiencia, robustez

La estimacin puntual es similar en muchos aspectos al proceso de disparar con un arco a


un blanco. El estimador, que genera estimaciones, es semejante al arco, una estimacin particular,
la flecha, y el parmetro de inters al centro del blanco.

Suponga que una persona dispara al blanco un solo tiro y que ste da en el centro, lo
considerara un buen tirador?, sostendra el blanco?

No podemos evaluar la bondad de un procedimiento de estimacin basndose en una sola


estimacin, ms bien debemos observar los resultados y utilizar el procedimiento de estimacin
muchas veces. Puesto que las estimaciones sin cifras, evaluaramos la bondad de un estimador
puntual construyendo una distribucin de frecuencias de las estimaciones obtenidas en un
muestreo repetitivo y observaramos qu tan cerca se agrupa la distribucin alrededor del
parmetro de estudio.

Supngase que se desea especificar una estimacin puntual para un parmetro de la


poblacin que llamaremos . Se indicar el estimador de por el smbolo .

Desearamos que la distribucin muestral del


estimador, se centrara alrededor del parmetro-objeto como
se muestra en la figura.

En otras
palabras, nos gustara que la media o valor esperado de la
distribucin de las estimaciones fuera igual al parmetro
estimado, es decir, E() = . Los estimadores puntuales que
satisfacen esta propiedad se denominan insesgados. La
distribucin muestral para un estimador puntual sesgado
positivamente, para la cual E() > , se presenta en la
figura 2.

Definicin. Sea un estimador puntual de un parmetro . Entonces es un estimador


insesgado si E() = . De lo contrario, se dice que es sesgado.

Definicin. El sesgo B de un estimador puntual est dado por B = E() .

Se deseara que el estimador tuviera el tipo de distribucin indicado en la figura 3.b, ya que
una menor varianza garantiza que en el muestreo repetitivo una mayor fraccin de valores de 2
queda cerca de . Se desea que Var() sea mnima.

Pgina 55
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

En lugar de utilizar el sesgo para la varianza


para describir la bondad de un estimador puntual,
podramos emplear el valor esperado de ( )2, es
decir, el cuadrado de la distancia entre y su
parmetro-objeto.

Definicin. El cuadrado medio del error de un estimador puntual se define como el valor
esperado de ( )2.

Parmetro Tamao de la(s) Estimador E() 2


objetivo muestra(s) puntual
n Y 2
n
p n Y p pq
p
n n
1 2 n1 y n2 Y1 Y2 1 2 12 22

n1 n2
*
p1 y p2 n1 y n2 p 1 p 2 p1 p2 p1 q1 p 2 q 2

n1 n2

* 21 22 son las varianzas de las poblaciones 1 y 2 respectivamente.


Tabla 1. Valores esperados y varianzas para algunas estimaciones puntuales comunes.

Aunque lo insesgado es muchas veces una propiedad deseada para un estimador puntual,
no todos los estimadores son insesgados.

Se pueden establecer dos comentarios finales con respecto a los estimadores puntuales de
la tabla 1. Primero, los valores esperados y las varianzas dados en la tabla son vlidos
independientemente de la forma de las funciones de densidad de probabilidad de las poblaciones.
Segundo, los cuatro estimadores tendrn distribuciones de probabilidad que son aproximadamente
normales para muestras grandes.

6.3 Estimacin por intervalo. Niveles de confianza

Intervalos de confianza

Pgina 56
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

En muchos casos una estimacin puntual no proporciona informacin suficiente sobre un


parmetro. Por decir algo, si se tiene inters en estimar la resistencia promedio a la tensin de los
elementos estructurales empleados en el ala de un aeroplano, entonces es probable que un solo
nmero no sea tan significativo como un intervalo, dentro del cual se espera encontrar el valor de
este parmetro. El intervalo recibe el nombre de intervalo de confianza.

Un estimador por intervalo es una regla que especifica el mtodo que utiliza las mediciones
de la muestra para calcular dos nmeros que forman los extremos del intervalo. En el proceso ideal
sera conveniente que el intervalo tuviera dos propiedades. Primero que el intervalo contenga al
parmetro objeto . Segundo, que el intervalo sea relativamente estrecho.

Intervalo de confianza para media y varianza conocidas.

x z

n
x
; z ; z=
x
x
x
; x=
N n
n N 1
N tamao de la poblacin; n tamao de la muestra, (intervalo menor al de la poblacin).

Ejemplo. 500 latas tienen un peso promedio de 5.02 [kg] y una desviacin estndar de 0.3
[kg]. Hay la probabilidad de que una muestra al azar de 100 latas, elegidas al azar de este grupo
tenga un peso total comprendido entre 496 [kg] y 500 [kg]. Para la distribucin muestral de medias
se tiene:
x = 5.02 [kg], = 0.3 [kg], n = 100 latas

x=

0.3 500100
100 5001
=0.03 ( 0.8953 )=0.0269

Como se tiene dos extremos de peso por lata, entonces:

496 500
1= =4.96 1= =5.00
100 100

Obtenemos dos extremos en la distribucin normal:

}
4.965.02
z= =2.2305 p z =0.0129

z=
0.0269
5.005.02
0.0269
=0.7435 p
( 1)
( z 2 )=0.2296 }
p ( z1 ) p ( z2 ) =0.2167

Que es el rea bajo la curva:

Pgina 57
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Ejercicio. Una compaa tiene 500


cables. Un ensayo con 40 de ellos, elegidos al azar, dieron una media de resistencia a la rotura de
2400 [lb] y una desviacin estndar de 150 [lb].
(a) Cul es el lmite de confianza de 95% y 99% para estimar la media de resistencia a
la rotura de los 460 cables?
(b) Con qu grado de confianza cabe decir que la media de resistencia a la rotura de los
460 cables sea 2400 32 [lb].

Ejercicio. Se registraron los tiempos utilizados en la compra para 64 clientes seleccionados


al azar en el supermercado local, la media y varianza de estos tiempos fueron 33 [min] y 256 [min 2],
respectivamente. Estima el promedio del tiempo utilizado por clientes en la compra, con un
coeficiente de confianza de 90%.

6.4 Estimacin de medias

Intervalo de confianza para la media, varianza conocida


Supngase que se tiene una poblacin con media desconocida y varianza conocida 2. De
esta poblacin se toma una muestra aleatoria x1, x2,, xn de tamao n. La media muestral x es
un estimador puntual razonable de la media desconocida . Puede obtenerse un intervalo de
confianza del 100(1 ) por ciento para al considerar la distribucin de muestreo de la media
muestral x .

El valor esperado o media de x es , mientras que el


2

de la varianza es n . Por lo que, la distribucin de la
x
z=
estadstica
es una distribucin normal estndar.
n

Al examinar esta figura se detecta que

{ }
x
p z z z = p z z =1
{ 2 2 } 2
2
x

Pgina 58
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

La expresin anterior se puede escribir como

{ ( )
p x z
2

x
x + z

2 x
( )}
=1

Definicin. Si x es la media muestral de una muestra de tamao n de una poblacin con


varianza conocida 2, un intervalo de confianza para del 100(1 ) por ciento est dado por
z
x z
2
( )
x
x + z
2 x
( ) , donde
2
es el punto de la distribucin normal estndar que


corresponde al porcentaje 2 .

Para muestras tomadas de una poblacin normal, o para muestras de tamao n 30, sin
importar la forma que tenga la poblacin, el intervalo de confianza dado por la ecuacin de la
definicin que proporciona buenos resultados. Sin embargo, para muestras pequeas tomadas de
poblaciones que no son normales, no es posible esperar que el nivel de confianza 1 sea
exacto.

Ejemplo A. Un artculo publicado en el Journal of Heat Transfer (Trans. ASME, Sec. C, 96,
1974, pg. 59) describe un nuevo mtodo para medir la conductividad trmica del hierro Armco. Al
utilizar una temperatura de 100 [F] y una potencia de entrada de 550 [W], se obtienen las diez
mediciones siguientes de conductividad trmica (en Btu/hr-ft-F):

41.60 41.48 42.34 41.95 41.86 42.18 41.72 42.26 41.81 42.04

n = 10, = 41.924, 2 = 0.0807155, = 0.284140.

Una estacin puntual de la conductividad trmica promedio a 100 [F] y 550 [W] es la media
x
muestral o = 41.924 (Btu/hr-ft-F).


x ,
n
El error estndar de la media muestral es y dado que es desconocido, puede
reemplazarse por la desviacin estndar muestral s = 0.284 para obtener el error estndar
s 0.284
x 0.0898,
x n 10
estimado de como

Note que el error estndar es alrededor de 0.2% de la media muestral, lo que implica que se
ha obtenido una estimacin puntual relativamente precisa de la conductividad trmica.

Ejemplo. Supngase que se desea encontrar un intervalo de confianza de 95% para


conductividad trmica promedio de este material, y que se sabe que la desviacin estndar de la
conductividad trmica a 100 [F] y 550 [W] es = 30 (Btu/hr ft - F). Si se supone que la

Pgina 59
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

conductividad trmica est distribuida de manera normal, entonces se puede emplear la ecuacin
arriba mencionada para la construccin del intervalo de confianza. Un intervalo del 95% implica
que 1 = 0.95, de modo que = 0.05. De tablas de distribucin normal tenemos que: z /2 = 1.96


x z x z
2 n 2 n
(1.96)(0.3) (1.96)(0.3)
41.924 41.924
10 10
41.738 42.110

Ejercicio. Un fabricante produce anillos para los pistones de un motor de automvil. Se sabe
que el dimetro del anillo est distribuido aproximadamente de manera normal, y que tiene una
desviacin estndar = 0.001 [mm]. Una muestra aleatoria de 15 anillos tiene un dimetro
x
promedio de = 74.036 [mm].
(a) Construya un intervalo de confianza del 99% para el dimetro promedio del anillo.
(b) Construya un lmite inferior de confianza del 95% para el dimetro promedio del anillo.

Ejercicio. Se sabe que la duracin, en horas, de un foco de 75 [watts] tiene una distribucin
aproximadamente normal, con una desviacin estndar de = 25 [h]. Se toma una muestra
x
aleatoria de 20 focos, la cual resulta tener una duracin promedio de = 1014 [h].
(a) Construya un intervalo de confianza del 95% para la duracin promedio.
(b) Construya un intervalo de confianza inferior del 95% para la duracin promedio.

Puesto que la longitud del intervalo de confianza mide la precisin de una estimacin se
observa entonces que la precisin est inversamente relacionada con el nivel de confianza. Tal
como se mostr, es deseable obtener un intervalo de confianza que sea suficientemente pequeo
para fines de toma de decisiones, y que tambin tenga una confianza adecuada. Una manera de
alcanzar esto es mediante la seleccin de una muestra de tamao n suficientemente grande como
para obtener de ella un intervalo de confianza que me de certidumbre en mi anlisis de muestras.

x
Definicin. Si se utiliza como estimacin de , entonces puede tenerse una confianza del
x
100(1 ) por ciento de que el error E = no sea mayor que una cantidad especfica E
cuando el tamao de la muestra sea

2
z
n 2
x

Si el cociente al cuadrado es un valor fraccionario, se debe obtener un redondeo, esto


asegura que el nivel de confianza no sea menor que 100(1 ) por ciento.

Pgina 60
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Ejemplo. Supngase que se desea que el error en la estimacin de la conductividad trmica


promedio del hierro Armco sea menor que E = 0.05 (Btu/hr ft -F), con una confianza del 95%.
Puesto que = 0.1 y z0.025 = 1.96, el tamao requerido de la muestra puede obtenerse con
2
(1.96)( 0.1)
n 15.3664 16
0.05

Ejercicio. Del ejercicio de la duracin de los focos. Supngase que se desea una confianza
de 95% en el que el error en la estimacin de la duracin promedio sea menor que 5 horas. Qu
tamao de muestra debe utilizarse?

Ejercicio. Del mimo caso de la duracin de los focos. Supngase que se desea el ancho
total del intervalo de confianza bilateral sea de seis horas, con una confianza de 95%. Qu
tamao de muestra debe utilizarse para este fin?

Intervalo de confianza para la diferencia entre dos medias, varianzas conocidas

Supngase que se tienen dos poblaciones independientes con medias desconocidas 1 y 2,


y varianzas conocidas 21 y 22, respectivamente. Se desea encontrar un intervalo de confianza del
100(1 ) por ciento para la diferencia de las medias 1 2.

x1 y x 2
Sean n1 y n2 el nmero de observaciones tomadas de las poblaciones. Si son las
x1 y x 2
medias muestrales, la estadstica es un estimador puntual de 1 2. La variable
aleatoria

z
x1 x 2 1 2
12 22

n1 n2

Tiene una distribucin estndar si las dos poblaciones son normales.


x1 y x 2
Definicin. Si son las medias de dos muestras aleatorias independientes de
tamaos n1 y n2 tomadas de poblaciones que tienen varianzas conocidas 21 y 22,
respectivamente, entonces un intervalo de confianza del 100(1 ) por ciento para 1 2 es:
12 22 12 22
x1 x 2 z 1 2 x1 x 2 z
2 n1 n2 2 n1 n2

Donde z/2 es el punto crtico superior que corresponde al porcentaje /2 de la distribucin normal
estndar.

Ejemplo. Se realizan pruebas de resistencia a la tensin sobre dos diferentes clases de


largueros de aluminio utilizados en la fabricacin de alas de aeroplanos comerciales. De la
experiencia pasada con el proceso de fabricacin de largueros y del procedimiento de prueba, se

Pgina 61
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

supone que las desviaciones estndar de las resistencias a la tensin son conocidas. Los datos
obtenidos aparecen en la tabla.

Clase del Tamao de la Media de la Desviacin estndar


larguero muestra resistencia a la (kg/mm2)
tensin (kg/mm2)
1 10 87.6 1.0
2 12 74.5 1.5

Si 1 y 2 denotan los promedios verdaderos de las resistencias a la tensin para las dos
clases de largueros, entonces puede encontrarse un intervalo de confianza del 90% para la
diferencia de las medias 1 y 2 de la siguiente manera:
12 1.5 2 12 1.5 2
87.6 74.5 (1.645) 1 2 87.6 74.5 (1.645)
10 12 10 12
12.22 1 2 13.98 [kg/mm 2 ]

El intervalo de confianza no incluye al cero, lo que implica que la resistencia promedio del
aluminio de clase 1 es mayor que la de clase 2. De hecho, puede afirmarse que se tiene una
confianza del 90% de la resistencia promedio a la tensin del aluminio de clase 1 es mayor al del
aluminio de clase 2.

Ejercicio. Se estudia la tasa de combustin de dos propelentes slidos utilizados en los


sistemas de escape de emergencia de aeroplanos. Se sabe que la tasa de combustin de los dos
propelentes tiene aproximadamente la misma desviacin estndar; esto es, 1 = 2 = 3 [cm/s] Se
prueban dos muestras aleatorias n1 = n2 = 20 especmenes; las medias muestrales de la tasa de
x1 18 y x2 24
combustin son [cm/s]. Construya un intervalo de confianza bilateral del 99%
para la diferencia entre medias de la tasa de combustin.

Ejercicio. Se utilizan dos mquinas para llenar botellas de plstico con detergente para
mquinas lavatrastos. Se sabe que las desviaciones estndar del volumen de llenado son 1 = 0.10
[oz] y 2 = 0.15 [oz] de liquido, respectivamente. Se toman dos muestras aleatorias, n 1 = 12 y n2 =
x1 30.87 y x2 30.68
10 botellas. Los volmenes promedio de llenado son [oz] de liquido.
(a) Construya un intervalo de confianza bilateral del 90% para la diferencia entre las medias del
volumen de llenado.
(b) Construya un intervalo de confianza bilateral del 95% para la diferencia entre las medias del
volumen de llenado. Compare el ancho de este intervalo con el ancho obtenido en el inciso (a).
(c) Construya un intervalo de confianza superior del 95% para la diferencia de medias del volumen
de llenado.

6.5 Estimacin de varianzas.


Intervalo de confianza para la media de una distribucin normal, con varianza desconocida

Se desea encontrar un intervalo de confianza para la media de una distribucin, pero que la
varianza no es conocida. De manera especfica, supngase que se tiene una muestra aleatoria de

Pgina 62
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

x
tamao n, y que y s2 son la media y varianza muestrales, respectivamente. Una posibilidad
sera reemplazar en las frmulas del intervalo de confianza para con varianza conocida con el
valor calculado de la desviacin estndar muestral s. Si el tamao de la muestra n, es
relativamente grande, entonces ste es un procedimiento aceptable. En consecuencia, a menudo
los intervalos de confianza anteriores reciben el nombre de intervalos de confianza para muestras
grandes, debido a que son aproximadamente vlidos incluso si las varianzas no conocidas de la
poblacin se reemplazan con las varianzas muestrales correspondientes.

Cuando el tamao de las muestras es pequeo, el enfoque anterior no funciona, y entonces


debe emplearse otro procedimiento. La hiptesis usual es que la poblacin est distribuida de
manera normal. Esto conduce a intervalos de confianza basados en distribuciones t-Student.
x
t
s
n
Es la distribucin t con n 1 grados de libertad.

Para determinar el intervalo de confianza se emplea la siguiente expresin.


s s
x t , n 1
x t ,n 1
2 n 2 n

Ejemplo. Un artculo en el journal of Testing and Evaluation (Vol. 10, No. 4, 1982, pg. 133)
presenta las siguientes 20 mediciones del tiempo de combustin residual (en segundos) de
especmenes tratados de ropa de dormir para nios.
9.85 9.93 9.75 9.77 9.67 9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88 9.95 9.93 9.92 9.89 9.95

Se desea encontrar un intervalo de confianza del 95% para el tiempo de combustin residual
promedio. Supngase que el tiempo de combustin residual sigue una distribucin normal.
Solucin. E(x) = 9.8525; Var(x) = 0.0093039; s = 0.0964569
De tablas t0.025, 19 = 2.093. Los lmites de confianza sern:
0.0964569 0.0964569
9.8525 2.093 9.8525 2.093
20 20
9.8074 9.8976

Por consiguiente, el intervalo de confianza del 95% es:


9.8074[seg] 9.8976[seg]

Se tiene un intervalo de confianza del 95% de que el tiempo de combustin residual


promedio se encuentra entre 9.8074 segundos y 9.8976 segundos.

Ejercicio. Un ingeniero civil hace pruebas con la resistencia a la compresin del concreto.
Para ello examina 12 bloques (del mismo tamao) y obtiene los siguientes datos:

2216 2225 2318 2237 2301 2255 2249 2281 2275 2204 2263 2295

Pgina 63
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

(a) Construya un intervalo de confianza bilateral del 95% para la resistencia promedio.
(b) Construya un intervalo de confianza inferior del 95% para la resistencia promedio.

Ejemplo. Un ingeniero de control de calidad midi el espesor de la pared de 25 botellas de


vidrio de dos litros. La media muestral es E(x) = 4.05 [mm], la desviacin estndar s = 0.08 [mm].
Encuentre un intervalo de confianza del 90% para la media del espesor de la pared de las botellas.

Pgina 64
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Seleccin del tamao de una muestra

La seleccin del tamao de una muestra necesario para proporcionar un intervalo de


confianza requerida no es tan fcil como el caso donde se conoce , debido a que la longitud del
intervalo depende tanto del valor de , como del tamao de n de la muestra. Por otra parte, n
ingresa al intervalo de confianza a travs de los trminos 1/n y t /2, n 1. En consecuencia, el
tamao n de la muestra debe obtenerse a partir de un procedimiento de prueba y error, utilizando
una estimacin previa de (la cual puede basarse en la experiencia). Otra posibilidad es tomar una
muestra preliminar de n observaciones para obtener una estimacin de , puede emplearse la
2
z
n 2
x

ecuacin para calcular el valor requerido de n que proporciona la exactitud y nivel
de confianza deseados.

Intervalo de confianza para la diferencia de medias de dos distribuciones normales,


varianzas desconocidas

Se tomas dos muestras aleatorias de tamao n1 y n2 de las poblaciones representadas por


x1 y x2, respectivamente; sean E(x1) y E(x2), las medias muestrales, y S21 y S22 las varianzas
muestrales. Puesto que S21 y S22 son estimadores de la varianza comn 2, entonces puede
obtenerse un intervalo combinado de 2, mejor que S21 y S22 por separado. Este estimador es
n1 1 S12 n2 1 S 22
S
2
p
n1 n 2 2
.

Para obtener el estimador de confianza para dos muestras partimos de la expresin


x1 x 2 1 2
tc
1 1
Sp
n1 n2
; es la distribucin t student con n1 + n2 2 grados de libertad.

El intervalo requerido se obtendr entonces de la siguiente expresin

1 1 1 1
x1 x 2 t t S p 1 2 x1 x 2 t t S p 1
n1 n 2 n1 n2

Ejemplo. La pintura para autopista se surte en dos colores: blanco y amarillo. El inters se
centra en el tiempo de secado de la pintura; se sospecha que la pintura de color amarillo se seca
ms rpidamente que la blanca. Se obtienen mediciones de ambos tipos de pintura. Los tiempos
de secado (en minutos son los siguientes:

Blanca 120 132 123 122 140 110 120 107


Amarilla 126 124 116 125 109 130 125 117 129 120

Pgina 65
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

(a) Encuentre un intervalo de confianza del 95% para la diferencia entre los tiempos de
secado promedio, suponiendo que las desviaciones estndar de stos son iguales.
Suponga que el tiempo de secado est distribuido de manera normal.
(b) Existe alguna evidencia que indique que la pintura amarilla se seca ms rpidamente
que la blanca?

Ejercicio. Un artculo publicado en Fire Technology investig dos agentes dispersores de


espuma que pueden emplearse en las boquillas de los equipos extinguidores de fuego. Al tomar
una muestra aleatoria de cinco observaciones con una espuma que forma una pelcula acuosa
(AFFF), se obtuvo una media muestral de 4.7 y una desviacin estndar de 0.6. Una muestra
aleatoria de cinco observaciones con concentrados de tipo alcohlico (ATC) tuvo una media
muestral de 6.9 y una desviacin estndar de 0.8. Encuentre un intervalo de confianza del 95%
para la diferencia en la dispersin de espuma promedio de estos dos agentes. Puede obtenerse
alguna conclusin sobre qu agente produce la mayor dispersin de espuma? Suponga que ambas
poblaciones estn bien representadas por distribuciones normales que tienen las mismas
desviaciones estndar.

Pgina 66
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

7. Prueba de hiptesis.

En esta seccin se estudiar otra rea de la inferencia: la prueba o constante de una


hiptesis estadstica. Y esta hiptesis tiene una fuerte relacin con el concepto de estimacin.

7.1 Definicin de hiptesis estadstica. Hiptesis simples y compuestas

Una hiptesis estadstica es una afirmacin con respecto a alguna caracterstica desconocida
de una poblacin de inters. En forma general, la afirmacin involucra ya sea algn parmetro o
alguna forma funcional no conocida de la distribucin de inters, a partir de la cual se obtiene una
muestra aleatoria. La decisin se toma en base a la probabilidad, y si sta es mnima, entonces
ser rechazada. [Canavos. Pg. 303]

La hiptesis que especifica un valor particular para el parmetro que se estudia se llama
hiptesis nula [Ho]. Esta hiptesis representa normalmente el procedimiento de operacin
acostumbrado de un sistema de especificaciones conocidas.

La hiptesis que especifica a aquellos valores del parmetro que representan un cambio
importante del procedimiento normal de operacin, o de las especificaciones conocidas, se llama
hiptesis alternativa [H1 o Ha].

Las observaciones de la muestra se renen y analizan para determinar si la evidencia


respalda a Ho o a Ha. La cantidad de muestra sobre la
que se basa la desicin de respaldar a H o o a Ha se
llama media estadstica de prueba. El conjunto de
valores de esta media estadstica de prueba que
conduce al rechazo de la hiptesis nula favoreciendo a
la hiptesis alternativa se llama regin de rechazo (o
regin crtica).

Constituyentes de una prueba de hiptesis


Terminologa Ejemplo
Ho = o
Ha o
Media estadstica de prueba x
z o

n
Regin de rechazo z> z/2 con = 1 %

Procedimiento para la prueba de teoras en la investigacin estadstica.


1. Se debe disear un experimento de tal modo que se confirme su teora, si los resultados no
pueden explicarse con la variacin causal incluida en la seleccin de la muestra.

2. Realizar un experimento y recolectar los datos de la muestra.

3. Suponer que los resultados se deben exclusivamente a la casualidad. Esta suposicin es llamada
hiptesis nula.

Pgina 67
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

4. Utilizar una distribucin muestral terica basada en la hiptesis nula para determinar los datos de
una muestra, tan slo por medio de la casualidad.

5. Si la probabilidad de obtener los datos de una muestra, tan slo por medio de la casualidad es
menor que algn pequeo porcentaje predeterminado (por lo comn 5% y 1%), los
resultados sern significativos, puede rechazarse la Ho y considerar confirmada la teora.

Ejemplo. Una empresa en construccin proporciona guantes a sus empleados con una vida
til de 90 das. La empresa aceptar guantes nuevos si stos duran 120 das o ms, con un nivel
de significacin de 5%, para una muestra de 36 guantes y una desviacin estndar de 18 das.

Ejercicio. El ajuste de profundidad de determinado taladro de columna es 2 [plg]. Entonces, se


podra suponer que la profundidad promedio de todos los agujeros barrenados por sta mquina es
2 [plg]. Para comprobar esta hiptesis, as como exactitud del calibre de profundidad, se midi una
muestra aleatoria de 100 agujeros barrenados por esa mquina y se encontr un promedio de
2.005 [plg] con una desviacin estndar de 0.03 [plg]. Si el intervalo de confianza es de 95% Se
puede rechazar la hiptesis con base en estos datos de la muestra?

Ejercicio. La duracin de una muestra de 100 tubos flourecentes es de1570 [h], con una
desviacin estndar de 120 [h]. Si es la duracin media de todos los tubos producidos por la
compaa, comprobar la hiptesis de que = 1600 [h] contra la hiptesis 1600 [h], con un nivel
de significacin de 0.05.

NOTA: Tiene que ser utilizado un ensayo bilateral (dos colas), puesto que si = 1600 [h]
incluye valores mayores y menores de 1600 [h].

Ejercicio. Se comparan dos proyecciones para un laboratorio con respecto a la cantidad


media de luz que se tiene en la superficie a las masas. Se tomaron 40 mediciones independientes
(en bujas pie) en cada laboratorio, los resultados fueron los siguientes.

Diseo I Diseo II
n1 = 40 n2 = 40
x1 = 28.9 x2 = 32.6
s21 = 15.1 s22 = 15.8

Hay evidencia suficiente para pensar que los diseos difieren con respecto a la cantidad promedio
de luz que se recibe? Usar = 0.05.

Ejercicio. Las mediciones de resistencia al cortante hechas en pruebas de compresin sin


confinamiento de dos tipos de suelo dieron los resultados siguientes (en toneladas por pie
cuadrado).
Suelo tipo I Suelo tipo II
n1 = 30 n2 = 35
x1 = 1.65 x2 = 1.43
s1 = 0.26 s2 = 0.22

Parecen diferir los suelos con respecto a la resistencia promedio al cortante en el nivel de
significacin de 1%?

Ejercicio. La Comisin de caza y pesca del estado de Florida, EUA, llev a cabo un estudio
para establecer las cantidades de residuos qumicos que se encontraron en el tejido cerebral de
pelcanos color caf. Para el DDT, muestras de 10 y 13 animales dieron los resultados siguientes,
en partes por milln.

Pgina 68
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Jvenes Adultos
n1 = 10 n2 = 13
x1 = 0.041 x2 = 0.026
s1 = 0.017 s2 = 0.016

Probar la hiptesis de que no hay diferencia entre el promedio de DDT encontrado en los jvenes y
adultos comparndola con la alternativa de que los jvenes tienen mayor cantidad. Usar = 0.05.
(Esta prueba tiene repercusiones importantes acerca de la acumulacin de DDT a lo largo del
tiempo).

Ejercicio. Seis cohetes, cuyo alcance nominal es de 2500 [m], se almacenaron algn tiempo y
despus se probaron. Los alcances en las pruebas fueron 2490, 2510, 2360, 2410, 2300 y 2400
[m]. Otros grupos de seis cohetes, del mismo tipo, se almacenaron el mismo tiempo, pero en forma
distinta. Los alcances de esos seis fueron 2410, 2500, 2360, 2290, 2310 y 2340 [m]. Producen los
mtodos de almacenamiento alcances apreciablemente distintos? Usar = 0.05, y suponer que las
medidas de alcance estn distribuidas en forma aproximadamente normal con la misma varianza
para cada forma de almacenamiento.

Pgina 69
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

7.2 Prueba de una hiptesis estadstica. Errores de tipos I y II

En la mayora de los problemas que se presentan en la ingeniera, ciencias y administracin


es necesario tomar decisiones, estos quedan entre aceptar o rechazar una proposicin de algn
parmetro. Esta proposicin recibe el nombre de hiptesis, y el procedimiento de toma de decisin
sobre la hiptesis se conoce como prueba de hiptesis.

Es conveniente considerar la prueba de hiptesis estadstica como la etapa de anlisis de


datos de un experimento comparativo, en el que el analista est interesado.

Definicin. Una hiptesis estadstica es una proporcin sobre los parmetros de una o ms
poblaciones.

Puesto que se emplean distribuciones de probabilidad para representar poblaciones tambin


es posible considerar una hiptesis estadstica como una proposicin sobre la distribucin de
distribucin de probabilidad de una variable aleatoria. Lo usual es que la hiptesis involucre a uno o
ms parmetros de esta distribucin.

Ejemplo. Supngase que se tiene inters en la rapidez de combustin de un agente


propulsor slido utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves.
La rapidez de combustin es una variable aleatoria que puede describirse con una distribucin de
probabilidad. Supngase que el inters se centra sobre la rapidez de combustin promedio (que es
un parmetro de esta distribucin). De manera especfica, el inters recae en decidir si la rapidez
de combustin promedio es o no 50 [cm/s]. Esto puede expresarse de manera formal como
H 0 : 50[cm / s]
H 1 : 50[cm / s]

La proposicin H0: = 50[cm/s] se conoce como hiptesis nula, mientras que la


proposicin H1: 50[cm/s], recibe el nombre de hiptesis alternativa. Puesto que la hiptesis
alternativa especifica valores de que pueden ser mayores o menores que 59 [cm/s], tambin se
conoce como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es formular
una hiptesis alternativa unilateral, como en

H 0 : 50[cm / s] H 0 : 50[cm / s]
o
H 1 : 50[cm / s] H 1 : 50[cm / s]

Es importante que se recuerde que las hiptesis siempre son proporciones sobre la
poblacin o distribucin bajo estudio, no proporciones sobre la muestra.

Prueba de hiptesis estadstica

Del caso expuesto anteriormente. Supngase que se realiza una prueba sobre una muestra
x
de 10 experimentos, y se observa cul es la rapidez de combustin promedio . La media
muestral es un estimador de la media verdadera de la poblacin . Un valor de la media muestral

Pgina 70
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

x
que est prximo al valor hipottico = 50 [cm/s] es
una evidencia de que el verdadero valor de la media es
realmente 50 [cm/s]; esto es, tal evidencia apoya la
hiptesis nula H0. Por otra parte, una media muestral muy
diferente de 50 [cm/s] constituye una evidencia que apoya
la hiptesis alternativa H1.

x
Si esta ente [48.5 y 51.5] entonces es aceptada
x
la hiptesis nula, si el valor de cae fuera de este intervalo entonces se acepta la hiptesis
alternativa.

Ejercicio. Para determinar si las soldaduras en tubos de una planta de energa nuclear
cumplen con las especificaciones, se selecciona una muestra al azar de 15 soldaduras, y se
realizan pruebas en cada soldadura de la muestra, dando como resultado una media de 103.8
[lb/plg2] y una desviacin estndar de 3.6[lb/plg 2]. La resistencia de la soldadura se mide como la
fuerza requerida para romper la soldadura. Suponga que en las especificaciones se establece que
la resistencia media de soldaduras debe rebasar 100 [lb/plg 2]; el equipo de inspeccin determina
probar:
H 0 : 100
H a : 100

Las muestras cumplen con lo requerido? Para ello utilice un nivel de significancia de 1%.

Ejercicio. Muchas edificaciones antiguas, tiene sistemas elctricos que utilizan fusibles en
lugar de cortacircuitos. Un fabricante de fusibles de 40[A] desea asegurarse de que la media de
corriente a la que se queman los fusibles es en realidad 40[A] o mayor. Se toma una muestra del
amperaje en 50 domicilios cercanos al lugar, obteniendo una media de 36[A] y una desviacin
estndar de 7.8 [A]. Pruebe la hiptesis de que los fusibles fabricados puedan durar sin problemas
hasta resistir los 40[A] en la lnea elctrica domestica. Utilice un nivel de significancia de 1%.

Ejercicio. El voltaje de salida en cierto circuito elctrico debe ser igual a 130, segn se
especifica. Una muestra de 20 lecturas independientes para este circuito dio una media muestral
de 120.4 y una desviacin estndar de 3.4. Pruebe la hiptesis de que el voltaje de salida promedio
en 130 frente a la hiptesis alternativa de que es menor a 130. Utilice un nivel de significacin de
5%.

7.3 Clculo de probabilidades de errores de tipo I y II

El proceso de decisin puede conducir a una de dos conclusiones errneas.

Definicin. El error tipo I se define como el rechazo de la hiptesis nula H0 cuando sta es
verdadera.

Definicin. El error tipo II se define como la aceptacin de la hiptesis nula H0 cuando sta
es falsa.

Pgina 71
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

En lugar de pedir procedimientos libres de error, debemos buscar procedimientos para los
que no sea posible que ocurra ningn tipo de error. Esto es, un procedimiento es aquel para el que
la probabilidad de cometer cualquier tipo de error es pequea. La eleccin de un valor particular de
corte de la regin de rechazo fija las probabilidades de errores tipo I y tipo II. Estas probabilidades
de error se denominan con las letras y , respectivamente. Debido a que H0 especifica un valor
nico del parmetro, hay un solo valor de . Sin embargo, hay un valor diferente de por cada
valor del parmetro consistente con Ha.

La probabilidad de cometer un error tipo I se obtiene con: = P(error tipo I) = P(rechazar


H0 H0 es verdadera).

Ejemplo. El calor emanado, en caloras por gramo, de una mezcla de cemento tiene una
distribucin aproximadamente normal. Se piensa que la media es 100 y que la desviacin estndar
es 2. Se desea probar H0: = 100 contra Ha: 100, con una muestra de 9 observaciones. Si se
x
define el caso de aceptacin como 98.5 101.5, encuentre la probabilidad del error tipo I.

x x
Solucin. = P( < 98.5 = 100) + P( > 101.5 = 100)
98.5 100 101.5 100
z1 2.25 z 2 2.25
2 2
9 9

= P(z < 2.25) + P(z > 2.25) = 0.0122 + 0.0122 = 0.0244

Esto me indica que el 2.44% de las muestras aleatorias conducirn al rechazo de la hiptesis
H0: = 100, cuando la verdadera cantidad de calor emanado es en realidad 100 caloras por
gramo.

Al evaluar un procedimiento de prueba de hiptesis, tambin es importante examinar la


probabilidad del error tipo II, el cual se denota por . Esto es, = P(error tipo II) = P(aceptar H0 H0
es falsa).

Para calcular se debe tener una hiptesis alternativa especfica; esto es, debe tenerse en
cuenta un valor particular de .

Ejemplo. Retomando el caso del calor emanado por el cemento.


(a) Encuentre para el caso donde la media verdadera del calor emanado es 103.
(b) Encuentre para el caso donde la media verdadera del calor emanado es 105. Este valor
de es ms pequeo que el obtenido en (a). Por qu?

Ejercicio. Un fabricante de fibras textiles est investigando una nueva fibra para tapicera, la
cual tiene una elongacin media por hilo de 12[kg] con una desviacin estndar de 0.5 [kg]. La
compaa desea probar la hiptesis H0: = 12, contra la hiptesis H1: < 12, utilizando para ello
una muestra aleatoria de cuatro experimentos. Cul es la probabilidad del error tipo I si la regin
x
crtica est definida como < 11.5 [kg]?

Ejercicio. Un fabricante est interesado en el voltaje de salida de una fuente de alimentacin


utilizada en una computadora personal. Se supone que el voltaje de salida tiene una distribucin

Pgina 72
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

normal, con desviacin estndar 0.25 [V]. El fabricante desea probar H0: = 5 [V] contra la
hiptesis H1: 5 [V], utilizando para ello 8 muestras.
x
(a) La regin aceptada es 4.85 5.15. Encuentre el valor de .
(b) Encuentre la potencia de la prueba para detectar el verdadero voltaje de salida promedio,
que es 5.1 [V].

7.4 Pruebas de medias


Prueba de hiptesis sobre la igualdad de dos medias, varianzas conocidas

Supngase que se tienen dos poblaciones de inters. La primera tiene una media
1 12 2
desconocida y varianza conocida , mientras que la segunda tiene una media desconocida
22
y varianza conocida . El inters recae en probar la hiptesis de que las dos medias
1 2
poblacionales y son iguales. Supngase que las dos poblaciones son normales, y que si no
lo son se aplican condiciones del teorema del limite central.

Considrese primero las hiptesis alternativas bilaterales H0: 1 = 2 contra la hiptesis H1:
1 2.

x1 x 2
z0
12 22

n1 n2
Si la hiptesis nula es verdadera, el estadstico de prueba tiene la
distribucin normal estndar. Por consiguiente, el procedimiento para probar la hiptesis nula es
calcular el valor numrico del estadstico de prueba z 0 de la ecuacin anterior y rechazar la
hiptesis nula si z0 > z/2 o z0 < z/2.

Las hiptesis unilaterales se analizan de forma similar.


H0: 1 = 2 H0: 1 = 2
H1: 1 > 2 H1: 1 < 2
Se rechaza si z0 Se rechaza si z0
> z < -z

Ejemplo. Un diseador de productos est interesado en reducir el tiempo de secado de una


pintura tapa poros. Se prueban dos frmulas de pintura; la frmula 1 tiene el contenido qumico
estndar, y la frmula dos tiene un nuevo ingrediente secante que debe reducir el tiempo de
secado. De la experiencia se sabe que la desviacin estndar del tiempo de secado es ocho
minutos, y esta variabilidad inherente no debe verse afectada por la adicin del nuevo ingrediente.
Se pintan diez muestras con la frmula 1, y otros diez con la frmula 2. Los tiempos promedio de
x1 121 x2 112
secado muestrales son: [min] y [min], respectivamente. A qu

Pgina 73
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

conclusiones puede llegar el diseador del producto sobre la eficacia del nuevo ingrediente,
utilizando = 0.05?

7.5 Pruebas de varianzas.

Algunas veces se necesitan pruebas sobre la varianza o la desviacin estndar de una


poblacin.

Procedimiento de prueba para una poblacin normal


2
Se desea probar la hiptesis de que la varianza de una poblacin normal es igual a un
02
valor especfico, por ejemplo . Sea una muestra aleatoria de n observaciones tomadas de esta
2 0 2 0
2 2

poblacin, para probar H0: = contra la hiptesis H1: ; se utiliza el estadstico de

02
n 1 s 2

02
prueba .

2 02
Donde s2 es la varianza muestral. Ahora, si H0: = es verdadera, el estadstico de
2
0
prueba sigue una distribucin Ji cuadrado con n 1 grados de libertad. Por consiguiente se
02 2 0 02
2

calcula el valor de estadstica de prueba y la hiptesis H0: = debe rechazarse si >


2
/ 2 , n 1 2
0
2
/ 2 , n 1
o si < .

2 / 2, n 1 2 / 2, n 1
Donde y son los puntos que corresponden a los porcentajes 100/2
inferior y superior de la distribucin Ji cuadrado con n 1 grados de libertad, respectivamente.

El mismo estadstico de prueba se utiliza para hiptesis alternativas unilaterales.

02 02
H0: 2 = H0: 2 =
2
0 02
H1: 2 > H1: 2 <
Se rechaza si Se rechaza si
2
0
2
/ 2 , n 1 02 2 / 2, n 1
> <

Pgina 74
Estadstica y Probabilidad
Mat: Luis Alfonso Len Garca

Ejemplo. Considere el caso de la mquina de llenado de las botellas. Al tomar una muestra
de 20 botellas se obtiene una varianza muestral para el volumen de llenado de s 2 = 0.0153 (onzas
de fluido)2. Si la varianza de volumen de llenado es mayor que 0.01 (onzas de fluido) 2, entonces
existe una proporcin inaceptable de botellas que sern llenadas con una cantidad menor de
lquido. Existe evidencia en los datos muestrales que siguieran que el fabricante tiene un
problema con el llenado de las botellas? Utilcese = 0.05.

Pgina 75

Anda mungkin juga menyukai