PROBABILIDADES
CONTENIDO
PRLOGO
UNIDAD I CONCEPTOS GENERALES.
1.
2.
3.
4.
5.
6.
7.
INTRODUCCIN.
DEFINICIN DE ESTADSTICA.
IMPORTANCIA DEL ESTUDIO DE LA ESTADSTICA.
TIPOS DE ESTADSTICA.
Estadstica descriptiva.
4.1.
4.2.
Estadstica Inferencial.
4.3.
Poblacin.
4.4.
Muestra.
TIPOS DE VARIABLES.
5.1.
Variable Cualitativa.
5.2.
Variable Cuantitativa.
5.2.1. Variable cuantitativa discreta
5.2.2. Variable cuantitativa continua
DATOS ESTADSTICOS.
6.1.
Datos de nivel nominal
Datos de nivel ordinal.
6.2.
6.3.
Datos de nivel de intervalo
6.4.
Datos de nivel de razn.
EJERCICIOS DE LA UNIDAD.
3.
4.
5.
INTRODUCCIN
DISTRIBUCIONES DE FRECUENCIA.
2.1.
Definicin.
2.2.
Elaboracin.
2.3.
Propiedades de las distribuciones de frecuencia.
REPRESENTACIONES TALLO Y HOJA.
REPRESENTACIONES GRFICAS DE UNA DISTRIBUCIN DE
FRECUENCIAS.
4.1.
Histograma.
4.2.
Polgono de frecuencias.
4.3.
Distribuciones de frecuencias acumuladas
4.4.
Diagramas circulares.
EJERCICIOS DE LA UNIDAD.
3.
4.
5.
6.
7.
8.
9.
INTRODUCCIN.
MEDIA ARITMTICA.
2.1.
Media poblacional.
2.2.
Media muestral.
2.3.
Propiedades de la media aritmtica
MEDIA PONDERADA.
MEDIANA.
4.1.
Propiedades de la mediana.
MODA.
MEDIA GEOMTRICA.
6.1.
Aumento porcentual promedio en un perodo
determinado.
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS.
7.1.
Media.
Mediana.
7.2.
7.3.
Moda.
MEDIDAS DE DISPERSIN.
Amplitud o intervalo de variacin.
8.1.
8.2.
Desviacin media
8.3.
Varianza
8.4.
Desviacin estndar.
8.5.
Medidas de dispersin para datos agrupados.
8.5.1. Amplitud de variacin.
8.5.2. Desviacin estndar.
8.6.
Deciles, cuartiles y centiles.
8.7.
Interpretacin y usos de la desviacin estndar.
8.7.1. Teorema de Chebyshev.
8.7.2. Regla emprica.
8.8.
Dispersin relativa.
EJERCICIOS DE LA UNIDAD.
3.
INTRODUCCIN.
DEFINICIONES PREVIAS.
2.1.
Experimento.
2.2.
Evento.
2.2.1. Eventos mutuamente excluyentes
2.3.
Espacio muestral.
DEFINICIN DE PROBABILIDAD DE UN EVENTO.
4.
5.
6.
7.
8.
9.
10.
5.
INTRODUCCIN.
DEFINICIN.
VARIABLE ALEATORIA.
DISTRIBUCIN DE PROBABILIDAD DISCRETA.
4.1.
Funcin de distribucin acumulativa
4.2.
Media, varianza y desviacin estndar de una
distribucin de probabilidades discreta.
4.3.
La distribucin binomial.
4.3.1.
Media de una distribucin de probabilidad
binomial.
4.3.2.
Desviacin estndar de una distribucin de
probabilidad binomial.
4.3.3.
Uso de tablas en la distribucin binomial.
4.4.
La distribucin de Poisson
4.4.1.
Media de una distribucin de probabilidad de
Poisson.
4.4.2.
Desviacin estndar de una distribucin de
probabilidad de Poisson.
4.4.3.
Uso de tablas en la distribucin de Poisson
DISTRIBUCIN DE PROBABILIDAD CONTINUA.
5.1.
Funcin de distribucin acumulativa
5.2.
Media, varianza y desviacin estndar de una
distribucin de probabilidades continua
La distribucin normal.
5.3.1.
Distribucin normal estndar
5.3.2.
Clculo de probabilidades.
5.3.3.
Uso de la tabla de la distribucin normal
estndar.
6.
EJERCICIOS DE LA UNIDAD.
TABLAS
5.3.
PRLOGO
Este mdulo es el fruto de mi travesa por la estadstica. El contenido
est dirigido principalmente a los estudiantes del programa de
educacin a distancia de la Universitaria de Investigacin y Desarrollo
UDI y su principal objeto es aproximar el conocimiento de la estadstica
al conjunto de todos ellos.
La experiencia propia en cursos de estadstica muestra que la mayora
de los estudiantes ven a esta materia como un proceso de aplicacin de
frmulas sin sentido y que slo sirve de relleno, descuidando el enorme
poder que hay en ella principalmente si se adapta a situaciones
cotidianas y si se interpretan y analizan casos, especialmente desde la
estadstica inferencial.
La redaccin de este mdulo se da en un lenguaje propio y es el mismo
que utilizo en el aula de clases. Los temas que se explican se muestran
de una manera concisa, un tanto reiterativa cuidndome de no rayar en
la redundancia.
Este mdulo no es un tratado de la estadstica, pero si muestra el
sendero para que el estudiante con las ideas bsicas profundice en libros
un poco ms detallados, por tanto se espera que lo que aqu se escriba
se contraponga con las ideas de textos de estadstica y en lo posible se
complemente.
Muchos de los clculos que se hacen a mano se pueden facilitar si se
conocen las funciones de las calculadoras cientficas digitales o si se
manejan, en lo ms mnimo, hojas de clculo como Excel; por ello invito
al docente de la materia a que incentive en los estudiantes la utilizacin
de estas herramientas.
Al final del mdulo se anexan tablas de distribuciones binomiales, de
Poisson y normal estndar para que el estudiante disponga de ellas al
momento de resolver problemas.
Por ltimo, agradezco a la Universitaria de Investigacin y Desarrollo
permitirme producir este mdulo.
Para cualquier comentario, opinin o sugerencia le agradecer enviarlo
al correo juacrar@yahoo.com.
Juan Arteaga Crawford
Bucaramanga, Junio de 2005.
1. INTRODUCCIN.
En muchos momentos de nuestras vidas necesitamos tomar decisiones,
para hacerlo dirigimos los sentidos necesarios a fin de recolectar
informacin. Por ejemplo, si queremos tomar agua fra, vamos a la
nevera, sacamos el agua y palpamos el recipiente que la contiene. De
acuerdo a lo que diga nuestro sentido del tacto decidiremos si tomamos
o no el agua. Es de apreciar que en el ejemplo se est tomando una
decisin basado en una muestra. Las empresas, el gobierno, los seres
humanos y hasta los animales enfrentan situaciones similares, es por
ello que se deben acudir a muestras para tomar decisiones.
Al entender esto, el hombre se ha encaminado a contar, medir, cualificar
y cuantificar todo lo que le rodea bien sea en forma tcnica o
inconsciente, para despus responder preguntas tales como: cundo?,
cunto?, con qu regularidad?, qu tan rpido?, con qu calidad?,
qu tan grande?, qu tan lejos?, todas ellas referentes a las
experiencias vividas.
Cuando se hace todo lo anterior, se contribuye a que en futuras
experiencias se acte de manera ms eficiente. Es en este momento
cuando toma gran importancia el concepto de tratamiento y
manipulacin de datos, que es fundamentalmente de lo que trata la
estadstica.
2. DEFINICIN DE ESTADSTICA.
Es la ciencia que utiliza una serie de teoras, mtodos y tcnicas
especializadas para recolectar, organizar, ordenar, tabular, presentar
grficamente, describir, analizar e interpretar datos con el objeto de
extraer de ellos conclusiones tiles para ayudar decisiones efectivas.
3. IMPORTANCIA DEL ESTUDIO DE LA ESTADSTICA.
Generalmente los estudiantes al iniciar sus estudios en esta materia se
preguntan por qu debo estudiar estadstica?. La respuesta ms simple
es que en todas las reas de desempeo profesional hay que tomar
decisiones. En realidad, la mayora de las personas que toman
decisiones, en una empresa por ejemplo, no efectan una anlisis
estadstico, pues esta operacin le corresponde a personas
especializadas en la estadstica; pero hay que tener un nivel mnimo de
conocimientos estadsticos, necesarios, para comprender perfectamente
dichos anlisis. La necesidad de tales conocimientos no se limita a la
persona que en ltimas decide. Todos deben estar al tanto de las
tcnicas actuales de esta ciencia. Se puede, entonces, identificar tres
razones por las cuales se debe estudiar estadstica:
4. TIPOS DE ESTADSTICA.
El estudio de la estadstica se divide en dos ramas: Estadstica
descriptiva y Estadstica inferencial.
4.1. Estadstica
descriptiva.
Comprende
primordialmente
la
recoleccin, recopilacin, ordenamiento, organizacin, tabulacin,
presentacin, tratamiento matemtico, y anlisis de datos con el objeto
de presentarlos de manera informativa. Lo que se hace en este tipo de
estadstica es suministrar una informacin de manera detallada, de tal
manera que lo que se quiere describir sea de fcil interpretacin y
anlisis.
4.2. Estadstica Inferencial. Tambin conocida como inferencia
estadstica o estadstica inductiva. Para comprender mejor el objeto de
estudio de esta rama es necesario definir los conceptos de poblacin y
muestra.
4.2.1.
Poblacin. Es el conjunto de todos los posibles individuos,
objetos o medidas que poseen caractersticas comunes y que son de
inters para su estudio. Ejemplos de poblacin pueden ser: Los
estudiantes que estudian en la UDI, Los libros de la biblioteca, Las
estaturas de todos los jugadores de la seleccin colombiana de ftbol.
4.2.2.
Muestra. Es una porcin o parte de la poblacin de inters.
Dentro de las razones por las cuales, en muchas ocasiones, se toma una
muestra en lugar de toda la poblacin estn:
Por
la
necesidad
de hacer
pruebas destructivas.
Generalmente las pruebas de control de calidad son destructivas, por
ejemplo, cuando se quiere medir la resistencia al impacto de los codos
de PVC, estos se dejan caer desde cierta altura de tal manera que al
golpear contra el suelo sufren avera. No se puede tomar toda la
poblacin de codos porque eso implica un gasto total de la produccin y
por ende la no venta de ellos.
Hay que ver que una familia puede tener 0, 1, 2, 3, 4, hijos pero
nunca 2.5 hijos ni 3.2345 hijos. Es decir entre el nmero 3 de hijos y el
nmero 4 de hijos hay un salto o espacio, que es lo que caracteriza a
una variable de tipo discreta.
5.2.2. Variable cuantitativa continua. Es aquella que puede tomar
cualquier valor dentro de un intervalo determinado. Por ejemplo, la
velocidad de un proyectil, la temperatura de un cuerpo, la presin del
aire dentro de una llanta que se desinfla, el tiempo de viaje de una
ciudad a otra.
Es de notar que, por ejemplo, la presin en una llanta que se desinfla
puede tomar valores de 500 psi y 450 psi; pero tambin puede tomar
los valores de 510, 501, 500.01, 500.00001, 500.00000001 psi. Es decir
no hay saltos entre un valor de la presin y su siguiente, su variacin es
continua.
En la figura 1 se representa esquemticamente los conceptos de
variable discreta y continua.
6. DATOS ESTADSTICOS.
Los datos pueden clasificarse de acuerdo a los niveles de medicin. El
nivel de medicin de un dato determina los clculos que se pueden
realizar para resumir y presentar la informacin. Los datos pueden ser
de cuatro niveles: datos de nivel nominal, datos de nivel ordinal, datos
de nivel de intervalo y datos de nivel de razn o cociente.
6.1. Datos de nivel nominal. Son los datos que slo se pueden
contar o clasificar. No existe escala entre ellos. Por ejemplo, se tienen 4
lapiceros de distintos colores de tinta: rojo, azul, negro y verde. Se
pueden clasificar los lapiceros segn su color y no hay un orden entre
ellos, es decir si se quiere hacer una organizacin de ellos, primero se
puede reportar el verde, luego el azul, luego el rojo y por ltimo el
negro, o en cualquier otro orden. Slo es nombramiento de los datos
ms no hay categorizacin entre ellos.
6.2. Datos de nivel ordinal. Son datos que se diferencian
jerrquicamente aunque no es posible hacer diferencia en magnitud
entre ellos. Por ejemplo, si se pide que se califique el desempeo del
profesor de estadstica, los resultados pueden ser: Malo, Regular, Bueno
o Excelente. Se nota que Excelente es mejor que bueno, bueno es mejor
que regular y regular es mejor que malo, es decir, existe jerarqua entre
los datos; pero lo que si no se puede decir es que 2 buenos equivale a 1
excelente, tampoco que la magnitud entre bueno y regular es la
misma entre bueno y excelente.
6.3. Datos de nivel de intervalo. Son datos que se diferencian en
escala y la diferencia entre sus valores tiene una magnitud con un
significado. En esta clase de datos, el cero no representa la ausencia de
la propiedad que se mide, es slo una valor en una escala determinada.
Por ejemplo, supongamos que la temperatura en un da en
Bucaramanga es de 20 C, 23 C, 26 C y 29 C. Estos son datos de
nivel de intervalo, pues la magnitud entre el valor 26 C y el valor 20 C
tiene un significado, la diferencia de temperaturas. El valor de
temperatura de 0 C no significa que no haya temperatura, significa que
es el comienzo de una escala, en este caso la escala Celsius.
6.4. Datos de nivel de razn. Este es el nivel ms alto. Los datos
estn organizados en escala, el punto 0 tiene el significado de ausencia
de la propiedad que se mide y la razn (o cociente) entre dos valores es
significativa. Por ejemplo, el salario de una persona que trabaja en un
banco es de $800.000 y el de un comerciante es 1200.000, el cociente
1'200.000
= 1.5 , lo que significa que el comerciante gana
800.000
1.5 veces ms que el empleado de bancos. Note que tener un salario de
$0, significa que no se tiene salario.
entre ellos es de
7. EJERCICIOS DE LA UNIDAD.
7.1. Clasifique la siguientes variables:
Cul es su edad?
Cul es su estado civil?
Cuanto tiempo emplea para desplazarse a su trabajo?
Cuntos habitantes tiene su municipio de residencia?
Est afiliado a la seguridad social?
Juan es mecnico.
Mara termin el bachillerato.
Juan tiene 30 dientes.
Mara tiene 65 pulsaciones por minuto.
1. INTRODUCCIN.
Muchas veces se dispone de una cantidad muy grande de datos que
para poder analizarlos se hace necesario organizarlos. Tal anlisis puede
consistir en saber dnde se agrupan la mayor cantidad de dichos datos o
cmo varan para poder detectar cualquier tendencia. La organizacin de
datos puede hacerse mediante grficas, diagramas y tablas que sean de
fcil entendimiento y manejo. En esta unidad se ver las tcnicas para
construir estas formas de presentacin.
2. DISTRIBUCIONES DE FRECUENCIA.
2.1 Definicin. Es un mtodo de clasificacin y agrupamiento de datos
estadsticos en clases o intervalos, de tal manera que se pueda
establecer el nmero o porcentaje de cada clase y as manipularlos en
grandes cantidades. El nmero o porcentaje de cada clase se le conoce
como frecuencia de clase. Por ejemplo, la tabla 1 muestra una
distribucin de frecuencias de las estaturas de una poblacin de
jvenes. Las clases son los intervalos de estatura.
Loas frecuencias relativas se calculan respecto al nmero total, as
200/650=0.3076 es la frecuencia relativa de la primera clase.
Estatura (m)
Frecuencia
Frecuencia relativa
1 1.25
1.25 1.5
1.5 1.75
1.75 2
Total
200
250
120
80
650
0.3076
0.4167
0.1846
0.1231
1.00
30.76
41.67
18.46
12.31
100
28 18 26 24 16
18 14 18 13 21
25 17 22 17 20
17 18 19 15 18
12 22 13 19 16
29 15 21 27 27
14 19 31 21 15
18 25 22 18 27
12 19 14 21 20
17 15 18 17 16
20 19 16 13 22
24 13 17 20 15
24 17 21 16 22
21 20 22 26 17
19 13 17 19 30
30 19 24 25 19
22 30 18 14 24
19 26 19 28 19
asistieron a la fiesta del colegio de
Solucin.
La informacin que muestra la tabla 2 est muy desorganizada y el
objetivo es ordenarla de tal manera que su anlisis sea ms fcil.
Paso 1. Determinar el nmero de clases. Para el caso, las clases se
refieren a los intervalos de edades. Demasiadas clases o muy pocas
pueden no revelar la forma bsica del conjunto de datos. Se recomienda
que el lmite inferior de la primera clase sea un poco menor que el valor
ms pequeo del conjunto de datos, para el ejemplo, menor que 12.
Adems que el lmite superior de la ltima clase sea un poco mayor que
el valor ms grande del conjunto de datos, que para el ejemplo es 31.
En general para grandes cantidades de datos se requieren ms clases
que para pequeas cantidades. Por lo general se agrupan de 5 a 15
clases. Se toman 7 clases para el ejemplo.
La frmula que a continuacin se nombra permite calcular el nmero de
clases:
n Si n no es muy grande
N de int ervalos = K =
1 + 3.22 Log en otro caso
Pero en general, la eleccin de las clases depende del criterio del
investigador. Es decir se debe tomar un nmero de clases que no sea
muy grande y que no se muy pequeo.
Paso 2. Determinar la amplitud de clase o intervalo de clase. Se
debe tomar el intervalo igual para todas las clases, sin embargo hay
ocasiones en que se pueden tomar amplitudes de clases desiguales para
evitar clases vacas o casi vacas. Del nmero de datos se busca el valor
ms alto (A) y el valor ms bajo (B) y el intervalo se halla por medio de
la frmula:
I=
A B
K
31 12
= 2.375 . Este
7
Clases
Edades (Aos)
11 14
14 17
17 20
20 23
23 26
26 29
29 32
Total
Tabla 3. Clases formadas para el ejemplo 1.
Edades
11 14
14 17
17 20
20 23
23 26
26 29
29 32
Total
frecuencia
///// ///// ///// //
= 17
= 35
///// ///// ///// ///// ///// ///// ///// ///// ///// ///// ///// ///// /
///// ///// ///// ///// ///// ///// //
= 61
= 32
= 18
///// //// = 9
///// /// = 8
180
Punto medio de clase. Tambin conocida como marca de clase,
se ubica a la mitad entre los lmites inferiores de dos clase consecutivas.
Se calcula sumando el lmite inferior al lmite superior de una clase y se
divide esta suma por 2. La marca de clase se simboliza xi donde i es el
xi
fi
hi
11 14
14 17
17 20
20 23
23 26
26 29
29 32
Total
12.5
15.5
18.5
21.5
24.5
27.5
30.5
150.5
17
35
61
32
18
9
8
180
0.0944
0.1944
0.3389
0.1778
0.1000
0.0500
0.0444
1.0000
9.44
19.44
33.89
17.78
10.00
5.00
4.44
100.00
Las
i =1
es decir,
fi = n .
i =1
3.
Tallo
1
2
3
Hoja
22222222
333333333
4444444444
555555555555555
6666666666
77777777777777777777
888888888888888888888 99999999999999999999
0000000000 111111111111 2222222222 33333 44444444
55555 6666 777 88 99
000 111
14
17
20
23
26
29
32
fi
Fi
17
35
61
32
18
9
8
17
52
113
145
163
172
180
360
x% y que al simplificar se
n x%
100%
obtiene n = 3.6 x . x% es el porcentaje dado y n es el ngulo que le
corresponde dicho porcentaje y que se debe trazar en el crculo, as por
ejemplo, si la frecuencia es el 25%, entonces el ngulo en el crculo es
n = 3.6 * 25 = 90 . Si ahora se tiene un nuevo porcentaje, por ejemplo del
40%, el ngulo es n = 3.6* 40 = 144 que se mide a partir del porcentaje
anterior. Para completar el total falta el 35% que corresponde a
n = 3.6*35 = 126 , medidos a partir del ngulo del porcentaje anterior. La
figura 8 muestra las distribuciones de los porcentajes en el crculo. La
suma de todos los ngulos es 90+144+126=360.
de donde se tiene n =
Figura 8. Diagrama circular que representa los porcentajes 25%, 35% y 40%.
5. EJERCICIOS DE LA UNIDAD.
5.1. El nmero de vacunas que se suministran a una determinada
poblacin se muestra en la siguiente tabla:
Vacuna
Miles
BCG
45
SABIN
100
DPT
70
SARAMPIN
40
TOTAL
255
Construya un diagrama circular con los datos de la tabla.
5.2. Las calificaciones obtenidas en la prueba de una asignatura son las
que se muestran en la siguiente tabla
3.9 4.7
3.2 3.6
3.1 3.3
3.7 4.2
4.0 4.3
5.0 4.0
4.5
3.8
Elabore
Elabore
Elabore
Elabore
Elabore
un polgono de frecuencias.
un diagrama circular.
un histograma.
un polgono de frecuencias acumuladas.
una representacin tallo y hoja.
5.5. Los datos sealan el tiempo (en horas) que demora un cierto tipo
de lmpara incandescente.
20,25,24,26,30,35,32,31,18,15,23,25,26,24,21,23,29,35,18,23,24,16,
18,19,20,20,20,25,26,22,32,31,30,30,30,30,30,25,22,24,26,21,26,25,2
32,21,15,14,13,14,16,17,19,19,19,18,18,15,14,20,20,22,23,26,24,25,
20.
Construya un diagrama de frecuencias con los datos.
Construya un polgono de frecuencias acumulada.
Dnde se concentran los datos?
Construya una representacin tallo y hoja, cul es el dato que ms
se repite?
adecuadamente
las
medidas
de
OBJETIVOS ESPECFICOS.
Calcular la media aritmtica, la media ponderada, la mediana, la
moda y la media geomtrica para datos dispersos y datos agrupados
en una distribucin de frecuencias.
Conocer y explicar las ventajas y desventajas de cada una de las
medidas de tendencia central.
Interpretar las medidas de tendencia central y de dispersin para
analizar los datos estadsticos.
Calcular las medidas de dispersin tales como la varianza, la
desviacin estndar y el coeficiente de dispersin en datos dispersos
y datos agrupados.
1. INTRODUCCIN.
Al tener un conjunto de datos es posible describirlos de dos maneras: la
primera como se hizo en la segunda unidad, es decir, por medio de una
distribucin de frecuencias, una representacin tallo y hoja, un
histograma, un polgono de frecuencias, entre otros. La segunda forma,
como se har en esta unidad, es describirlos mediante un nico valor
que sea representativo de todos los datos. A este valor se le conoce
como medida de tendencia central. Se hace necesario saber que tan
dispersos estn todos los datos respecto a esa medida de tendencia
central, es por eso que adems se estudia en esta unidad las medidas
de dispersin.
2. MEDIA ARITMTICA.
Tambin llamada promedio aritmtico. Si se suman cada uno de los
valores de una variable x y se divide el resultado por el nmero de
valores sumados, se obtiene la media aritmtica o promedio. Cuando se
trabaja con poblaciones se calcula la media poblacional y cuando se
trabaja con muestras se calcula la media muestral. En las frmulas para
calcular la media se utiliza el smbolo de la sumatoria que es una
forma
condensada
de
expresar
una
suma.
As
la
suma
n
X
i =1
hasta
que
i = n.
Por
i = 1 + 2 + 3 + 4 + 5 + 6 = 21
ejemplo,
i =1
= 21 + 2 2 + 23 + 2 4 = 30 .
i =1
X
total de dichos datos. Se calcula mediante la frmula =
i =1
, donde:
: es la media poblacional.
n : es el nmero total de datos de la poblacin.
X i : Valor i de la poblacin.
Ejemplo 2. Una pequea empresa cuenta con 5 empleados cuyos
salarios se muestran en la tabla 8. Calcule la media de los salarios.
Empleado
Salario ($)
500000
2
3
550000
600000
4
5
500000
490000
Solucin.
Como se toma toda la poblacin de la empresa, entonces la media es
poblacional, luego la media es:
5
X
=
i =1
__
mediante la frmula X =
i =1
13
2
3
13
12
4
5
15
17
6
7
13
15
8
9
10
16
16
17
Tabla 9. Horas extras laboradas por las enfermeras del Hospital Universitario
de Santander para el ejemplo 3.
Solucin.
Como es una muestra de la poblacin de todas las enfermeras del
hospital, entonces se calcula la media muestral:
10
__
X=
i =1
10
13 + 13 + 12 + 15 + 17 + 13 + 15 + 16 + 16 + 17
= 14.7 .
10
expresa:
(M X ) = 0 ,
i
es
decir,
(M X 1 ) + (M X 2 ) + ... + (M X n ) = 0 ,
i =1
(14.7 13) + (14.7 13) + (14.7 12) + (14.7 15) + (14.7 17 ) + (14.7 13) + (14.7 15) + (14.7 16)
+ (14.7 16 ) + (14.7 17 ) = 0
Si todos los valores obtenidos son iguales a un valor constante k,
entonces la media es ese valor. Por ejemplo, una persona tiene un
salario mensual de $800.000, entonces la media del ingreso al ao ser
$800.000,
as:
800.000 + 800.000 + 800.000 + 800.000 + 800.000 + 800.000 + 800.000 +
Una desventaja de la media es que ella toma en cuenta todos los valore
de una muestra o poblacin, es posible que encontrarse con valores
muy grandes o muy pequeos comparados con los dems, por lo tanto
la media no sera muy representativa del conjunto de datos, por
ejemplo, las edades de un grupo de 5 personas son 20, 33, 23, 19 y 85
aos, se ve que 85 aos es un valor muy grande comparado con los
dems.
La
media
para
este
conjunto
de
datos
es
20 + 33 + 23 + 19 + 85
=
= 36 aos que no es un valor representativo del
5
conjunto de datos, pues es mayor que la mayora de todos ellos.
3. MEDIA PONDERADA.
Es un caso especial de la media aritmtica. Se aplica cuando hay
observaciones con un mismo valor, lo cual puede ocurrir si los datos se
han agrupado en una distribucin de frecuencias. Se calcula mediante la
n
x f
i i
__
frmula: X p =
i =1
n
i =1
__
x f
Xp =
i =1
3
i i
i =1
4. MEDIANA.
Si en un conjunto de valores se observan que la tendencia de los datos
est sesgada (inclinada) hacia los valores altos o hacia los bajos,
entonces es conveniente utilizar una medida ms representativa llamada
mediana.
La mediana es el valor que corresponde al punto medio de los datos
despus de ordenarlos de menor a mayor o viceversa de tal manera que
el 50% de dichos datos son mayores que ella y el otro 50% menores.
Para cuando el nmero de datos es pequeo ( n 30 ), la mediana se
puede calcular de dos formas:
Si el nmero de datos es impar. Una vez que los datos estn
organizados en orden creciente o decreciente, entonces la mediana
estar a la mitad de los datos. Por ejemplo, se tienen los siguientes
datos: 1,7,25,4,7,2,8,7,1,6,6. Al organizarlos de mayor a menor, se
5. MODA.
Es el valor e la observacin que aparece con ms frecuencia. La moda
es muy til para describir datos de nivel nominal y ordinal, aunque se
puede utilizar en cualquier nivel de datos.
Ejemplo 5. En el siguiente grupo de datos, Cul es la moda o valor
modal? 2,7,6,5,3,3,2,4,5,3,8,9,7,2,3,3.
Solucin.
El dato que ms se repite es 3, por tanto la moda de este conjunto de
datos es 3.
La moda tiene la desventaja de que muchos conjuntos de datos no
tienen valor modal porque ningn dato aparece ms de una vez. Es
posible tambin que un conjunto de datos tenga dos modas (bimodal) y
en ese caso la moda no sera representativa.
6. MEDIA GEOMTRICA.
Se utiliza para encontrar el promedio de porcentajes, razones, ndices o
tasas de crecimiento. La media geomtrica es menor que la media
__
fx
X=
i =1
n
i i
__
, donde
X es la media
i =1
35
45
55
65
75
NMERO DE EMPRESAS
Fi
xi
5
10
21
16
8
5
15
36
52
60
30
40
50
60
70
Solucin.
Segn la frmula para la media de datos agrupados, se tiene:
5
__
fx
X=
i =1
5
i i
i =1
L = 45 ,
n = 60 ,
Fi = 15 ,
f CLASE = 21
I = 10 .
Luego
la
mediana
es
60
15
Med = 45 + 2
*10 = 52.14 .
21
7.3. Moda. La moda se aproxima al punto medio de la clase que
contenga el mayor nmero de frecuencias de clase. Para el ejemplo 8, la
clase que contiene el mayor nmero de frecuencias es 45 55 y su
punto medio es 50, por tanto ese es el valor de la moda.
8. MEDIDAS DE DISPERSIN.
La media, la mediana y la moda slo localiza el centro de los datos; pero
no dice nada acerca de cmo estn dispuestos respecto a la medida de
tendencia central. No es significativo saber cul es la medida de
tendencia central de un conjunto de datos si no se sabe que tan
apartados estn los datos de esa medida. Es decir, tomar una decisin
con slo saber una medida de tendencia central es arriesgado. Por
ejemplo, si usted va a cruzar un ro y ve un aviso que dice que la
profundidad promedio es de 1.5 metros usted lo cruzara con toda
confianza? Muy seguramente si decide o no, sera muy apresurado de su
parte. Pero si en el aviso se anuncia que las profundidades del ro a lo
ancho no estn muy alejadas del promedio, digamos que como mximo
0.2 m, la decisin ahora de cruzar o no el ro tiene mayor respaldo. En
conclusin se necesitara saber cmo varan las profundidades respecto
al promedio, o sea, qu tan dispersas estn las medidas de las
profundidades respecto al promedio.
8.1. Amplitud o intervalo de variacin. Es la diferencia entre el valor
ms grande y el valor ms pequeo de un conjunto de datos, por
ejemplo si los datos son 2,7,8,9,6,3,5 y 2, entonces la amplitud de
variacin es Av = 9 2 = 7 .
8.2. Desviacin media. Es el promedio de los valores absolutos de las
desviaciones con respecto a la media aritmtica. La desviacin de un
dato respecto a la media es la diferencia entre estos valores. Por
ejemplo si la media de un conjunto de datos es 5.3 y si de este conjunto
se toma a 5.8, entonces la desviacin media es 5.3 5.8 = 0.5 . La frmula
n
__
Xx
i =1
__
donde X es la media,
El valor absoluto asegura que las diferencias entre la media y cada dato
sea positiva.
Ejemplo 9. El peso de 5 cajas de llenas de cereales, escogidas al azar,
es de 300, 310, 305, 300 y 308 gramos. Determine la desviacin media.
Solucin.
Antes se debe calcular la media, que para el caso es poblacional:
300 + 310 + 305 + 300 + 308
=
= 304.6
Luego la desviacin media es
5
5
304.6 x
Dm =
=
i =1
304.6 300 + 304.6 310 + 304.6 305 + 304.6 300 + 304.6 308
5
18.4
= 3.68
5
( xi )
( s 2 ). Las frmulas para cada caso son: 2 =
i =1
__
X xi
y s 2 = i =1
n 1
n
__
( 7.5 x )
i
i =1
2
2
5.5
= 0.912
6
Es decir que la media de todas las desviaciones cuadradas es 0.912.
=
Solucin.
La media de la muestra es $640000, entonces la varianza muestral es:
5
( 640000 x )
s2 =
i =1
5 1
2
61000000000
= 15250000000
4
__
x
(
)
X xi
i
. Para el ejemplo 10 la desviacin
= i =1
y s = i =1
n
n 1
estndar poblacional es = 0.912 = 0.955 y para el ejemplo 11, la
desviacin estndar muestral es s = 15250000000 = 123490.89 .
n
TOTAL
50
i =1
f i xi
f i xi2 i =1 n
fi
i =1
s=
i =1
120
140
160
180
200
220
fi
xi
xi2
f i xi2
f i xi
5
7
9
16
10
3
110
130
150
170
190
210
12100
16900
22500
28900
36100
44100
60500
118300
202500
462400
361000
132300
550
910
1350
2720
1900
630
6
f
TOTAL
f i = 50
f
i =1
xi = 8060
i =1
i
xi2 = 1337000
f i xi = 64963600
i =1
fi xi
6
fi xi2 i =1 n
i =1
fi
s=
i =1
6
64963600
1337000 1299272
50
=
= 27.74
50 1
49
1337000
=
i =1
Cuartil
Porcentaje menor
Porcentaje mayor
Q1
Q2
25%
50%
75%
50%
Q3
75%
25%
Porcentaje menor
Porcentaje mayor
D1
D2
10%
20%
90%
80%
D3
30%
70%
D4
40%
60%
D5
D6
50%
60%
50%
40%
D7
D8
70%
80%
30%
20%
D9
90%
10%
Centil
Porcentaje menor
Porcentaje mayor
C1
C2
1%
2%
99%
98%
C3
3%
97%
C4
4%
96%
C5
C6
5%
6%
95%
94%
D7
.
.
.
C98
7%
.
.
.
98%
93%
.
.
.
2%
C99
99%
1%
Ubicacin
del
centil
67.
n = 30
y
P = 67 ,
entonces
67
L25 = ( 30 + 1)
= 31* 0.67 = 20.77 , o sea que el centil 67 est en la posicin
100
20.77. En al posicin 20 est 47 y en la posicin 21 tambin est 47, es
claro que la distancia entre estos valores es cero, luego el centil 67 es
47+0*0.77=47. Es decir cuando dos datos consecutivos son iguales, la
medida es el valor repetido.
Moda=Media=Mediana
Figura 14. Distribucin de frecuencias simtrica o de campana.
1
1
1
= 1 2 = 1
= 0.99 , es
2
k
10
100
decir el99%.
__
__
X 1s y
X + 1s , es decir entre
__
__
__
Frecuencias
fi
0
1
2
3
4
5
100
250
300
500
450
2000
Frecuencias
0 50
50
50 60
60 - 65
65 - 70
200
400
300
Ms de 70
50
Valores
xi
Frecuencias
fi
1
2
3
4
40
30
20
10
Frecuencias
05
5 10
10 20
20 - 50
50 100
100000
110000
160000
100000
30000
Determine
Determine
Determine
Determine
Nmero de jugadores
9
30
25
15
5
2
UNIDAD IV PROBABILIDADES.
OBJETIVO GENERAL. Aplicar los conceptos de probabilidad en la
estadstica inferencial.
OBJETIVOS ESPECFICOS.
Definir el concepto de probabilidad.
Describir los diferentes enfoques de la probabilidad: clsico, emprico
y subjetivo.
Interpretar en forma correcta los trminos: espacio muestral,
experimento, evento o suceso, resultado, permutacin, combinacin.
Diferenciar los conceptos de probabilidad conjunta y probabilidad
condicional.
Calcular probabilidades en problemas tpicos.
Saber construir un diagrama de rbol como ayuda para l clculo e las
probabilidades.
Aplicar de manera correcta el teorema de Bayes.
Aplicar correctamente las tcnicas de conteo.
1. INTRODUCCIN.
En las unidades precedentes se trat sobre la estadstica descriptiva, es
decir, cmo organizar los datos de una muestra o poblacin y que tanto
estaban dispersos respecto a una medida de tendencia central.
La atencin se fija ahora en la estadstica inferencial. Esta se ocupa del
estudio de la posibilidad de que algo ocurra en el futuro. Esta rama de la
estadstica se encarga de obtener conclusiones de una poblacin a partir
de una muestra. Es claro que la toma de decisiones implica una cierta
incertidumbre, es decir, no se sabe si la decisin es la correcta; pero si
se puede saber la probabilidad que resulte confiable tal decisin. Es por
ello que la teora de las probabilidades constituye la base fundamental
para la estadstica inferencial.
La teora de probabilidad es una teora muy intricada y desarrollada para
describir los sucesos aleatorios. La palabra aleatorio proviene del
vocablo alea, el cual significa suerte o azar. Un fenmeno aleatorio es
aqul cuyo resultado est fuera de control y que depende del azar.
Qu tanta incertidumbre se tiene respecto a un fenmeno constituye la
probabilidad de ocurrencia de un evento. La palabra evento, suceso o
acontecimiento significan lo mismo y ms adelante se definir.
2. DEFINICIONES PREVIAS.
Para poder adelantarse al concepto de probabilidad se hace necesario
definir algunos conceptos importantes:
2.1. Experimento. Es un proceso que conduce a que ocurra una y slo
una de varias observaciones posibles. El experimento relativo a la
probabilidad no es algo que se hace en el laboratorio, es casi siempre
una actividad imaginaria. Los experimentos aleatorios cumplen las
siguientes caractersticas:
Se puede repetir las veces que el experimentador requiera, es decir
est sujeto a repeticin.
Su resultado es incierto, es decir, est fuera de control, depende del
azar.
Se puede anticipar la totalidad de los resultados posibles.
Se observa en l un patrn de regularidad que se hace ms evidente
a medida que aumentan las repeticiones.
Solucin.
Experimento: Lanzar un tiro.
Evento E1: que enceste.
Evento E2: que no enceste.
Ejemplo 15. Un estudio en el pas revel que las personas del interior
que hacen turismo el 45% van Cartagena, 50% van a Santamarta, 40%
viajan a Barranquilla y el 35% van a Barranquilla y Santamarta. Cul
es la probabilidad de que un vacacionista visite al menos una de estas
ciudades?
Solucin.
La grfica de la figura 20 ilustra la situacin de este ejemplo.
Figura 20. Porcentaje de los viajeros del interior que visitan las ciudades de
Cartagena, Barranquilla y Santamarta.
6. DIAGRAMAS DE RBOL.
Es un instrumento til dentro de las probabilidades condicionales pues
permiten analizar la problemtica de los eventos cuando estos ocurren
uno despus del otro. Un rbol es un grfico que est constituido por
vrtices y ramas, cada rama parte de un vrtice que representa un
evento aleatorio diferente y la probabilidad de cada evento diferente se
anota sobre la rama que precede a cada evento de la manera en que se
indica en la figura 21.
Figura 24. Particin del espacio muestral S, compuesta por los eventos
E1,E2,E3,,En.
Figura 25. Particin del espacio muestral S, compuesta por los eventos
E1,E2,E3,,En y el evento cualquiera B.
Demostracin:
El evento B es la interseccin de l con el espacio muestral, es decir,
B = B S ; pero el espacio muestral S es la unin de todos los evento
mutuamente excluyentes Ei , o sea, S = E1 E 2 E 3 ... En , por tanto el
evento B se puede escribir en trminos de los eventos Ei as:
B = B (E1 E 2 E 3 ... En ) = (B E1) (B E 2) (B E 3) ... (B En ) ,
luego P( B) = P((B E1) (B E 2) (B E 3) ... (B En )) . Como los eventos
Ei son mutuamente excluyentes, entonces los eventos B Ei tambin lo
son, por consiguiente de la regla de la adicin se tiene:
P( B) = P(B E1) + P(B E 2 ) + P(B E 3) + ... + P(B En ) y al aplicar la regla de
la multiplicacin a cada miembro de la derecha se obtiene
P ( B ) = P ( B / E1) P ( E1) + P ( B / E 2) P ( E 2) + P ( B / E 3) P ( E 3) + ... + P ( B / En) P ( En) que es
la frmula de la probabilidad total.
Ejemplo 19.
En una institucin de educacin se ofrecen cuatro
carreras: Economa, Derecho, Sistemas e Idiomas. La distribucin de los
estudiantes por carrera es: Economa 28%, Derecho 20%, Sistemas
30% e Idiomas 22%. Segn un estudio acerca de las deserciones se
descubri que el porcentaje de estudiantes que finalizan sus estudios
son, respectivamente: en Economa el 85%, en Derecho el 72%, en
Sistemas el 90% y en Idiomas el 40%. Si se supone que el reglamento
de la institucin no permite que un estudiante curse dos carreras
simultneamente, cul es la probabilidad de que un estudiante elegido
al azar termine sus estudios?
Solucin.
La figura 26 muestra los eventos correspondientes para este ejemplo.
P ( Ei / B ) =
P ( Ei ) P ( B / Ei )
P ( E1) P ( B / E1) + P ( E 2) P ( B / E 2) + P ( E 3) P ( B / E 3) + ... + P ( En) P ( B / En)
P ( Ei ) P ( B / Ei )
n
P( Ei) P( B / Ei)
i =1
Demostracin:
Segn la regla de la multiplicacin para dos eventos dependientes Ei y B
se tiene que P ( Ei B ) = P ( Ei / B ).P ( B ) . Al despejar se obtiene que
P ( Ei B )
P ( Ei / B ) =
, ahora como la interseccin de conjuntos es
P( B)
P ( B Ei )
conmutativa, se tiene P ( Ei / B ) =
y al aplicar de nuevo la regla
P( B)
de la multiplicacin al numerador y el teorema de la probabilidad total al
denominador , se obtiene:
P ( Ei ) P ( B / Ei )
P ( E1) P ( B / E1) + P ( E 2) P ( B / E 2) + P ( E 3) P ( B / E 3) + ... + P ( En) P ( B / En)
P ( Ei ) P ( B / Ei )
mejor P ( Ei / B ) = n
.
P( Ei) P( B / Ei)
P ( Ei / B ) =
i =1
9. PRINCIPIOS DE CONTEO.
Si el nmero de resultados posibles de un experimento es relativamente
pequeo, resulta fcil contarlos, por ejemplo al lanzar una moneda al
aire hay dos posibilidades y contar hasta dos resulta muy trivial. Pero si
por ejemplo se quiere contar el nmero de placas para carros que hay
proyectadas en Colombia resultara muy tedioso. Por tanto si se tuviese
tcnicas para contar de manera ms fcil, el trabajo sera ms
provechoso.
Esencialmente existen tres frmulas que permiten facilitar el
procedimiento de conteo de grandes cantidades de objetos, individuos o
eventos.
9.1. Principio aditivo de conteo. Sean E1y E2 dos eventos
mutuamente excluyentes. Si E1 ocurre de m maneras distintas y E2
ocurre de n maneras distintas, entonces el nmero de maneras en que
pueden ocurrir ambas es n + m.
Los caminos en forma explcita son: Aru, Arv, Arw, Arx, Asu, Asv, Asw,
Asx, Atu, Atv, Atw y Atx. Se nota entonces que el principio multiplicativo
facilita el conteo.
Ejemplo 22. Un nio en una fiesta de cumpleaos puede escoger entre
tres helados: vainilla, fresa y ron con pasas; puede escoger entre dos
tipos de galletas: de leche y de chocolate y adems puede escoger entre
tres sabores de gaseosa: uva, naranja y manzana. De cuntas maneras
puede un nio escoger su merienda en la fiesta, suponiendo que come
helado y galleta y toma gaseosa.
Solucin.
Como un nio no puede tomar ms de un helado, galleta o gaseosa,
entonces de acuerdo al principio multiplicativo, un nio puede comer de
3x2x3=18 formas de merienda.
En forma explcita, estas formas son:
1.
Helado
2.
Helado
3.
Helado
4.
Helado
5.
Helado
6.
Helado
7.
Helado
8.
Helado
9.
Helado
10. Helado
11. Helado
12. Helado
13. Helado
14. Helado
naranja.
15. Helado
manzana.
16. Helado
uva.
17. Helado
naranja.
18. Helado
manzana.
4!
4! 4!
= = = 4!= 24 .
(4 4)! 0! 1
4!
4!
Permutaciones con grupos de tres letras: 4 P3 =
= = 4!= 24 .
(4 3)! 1!
4!
4! 2!*3 * 4
Permutaciones con grupos de dos letras: 4 P2 =
= =
= 12!.
(4 2)! 2!
2!
4!
4! 3!*4
= =
= 4.
(4 1)! 3! 3!
6 de 30 cervezas, es decir,
30!
30!
24!*25 * 26 * 27 * 28 * 29 * 30
=
=
= 593775 formas de sacar
6!(30 6)! 6!*24!
1 * 2 * 3 * 4 * 5 * 6 * 24!
grupos de 6 cervezas.
30
C6 =
3 de 40 jugos, es decir,
40!
40!
37 !*38 * 39 * 40
=
=
= 9880 formas de sacar grupos de 3
3!(40 3)! 3!*37 !
1 * 2 * 3 * 37 !
jugos.
40
C3 =
4 de 20 gaseosas, es decir,
20!
20!
16!*17 * 18 * 19 * 20
=
=
= 4845 formas de sacar grupos
4!(20 4)! 4!*16!
1 * 2 * 3 * 4 * 16!
de 4 gaseosas.
20
C4 =
25!
25!
23!*24 * 25
=
=
= 300 formas de sacar grupos de 2
2!(25 2)! 2!*23!
1 * 2 * 23!
botellas de agua.
25
C2 =
115
C15 =
115!
115!
100!*101 * 102 * 103 * ... * 115
=
=
= 2.39 * 1018 .
15!(115 15)! 15!*100!
15!*100!
EJERCICIOS DE LA UNIDAD.
de
probabilidad
su
OBJETIVOS ESPECFICOS.
1.
DEFINICIN.
Figura 30. Diagrama de rbol para las probabilidades de sacar dos esferas en
el ejemplo 25.
5 4 20 5
5 3 15
* =
=
,
P ( E 2) = * =
,
8 7 56 14
8 7 56
3 5 15
3 2
6
3
P ( E 3) = * =
y P ( E 4) = * =
=
. Al resumir estas probabilidades
8 7 56
8 7 56 28
con sus eventos se obtiene una distribucin de probabilidades como se
muestra en la tabla 19.
Las
probabilidades
Evento
son: P ( E1) =
Probabilidad
Nmero de blancas
Nmeros de negras
5
2
0
14
15
E2
1
1
56
15
1
1
E3
56
3
E4
0
2
28
Tabla 19. Distribucin de probabilidades para el ejemplo 25.
E1
VARIABLE ALEATORIA.
Probabilidad
5
0
14
15
BN
1
56
15
NB
1
56
3
NN
2
28
Tabla 20. Distribucin de probabilidades y variable aleatoria que cuenta las
esferas negras en el ejemplo 25.
BB
4.
P(X)
F(X)
5
5
14
14
35
15
1
56
56
50
15
1
56
56
3
56
2
=1
28
56
Tabla 21. funcin de distribucin de la variable aleatoria X que cuenta el
nmero de esferas negras del ejemplo 25.
0
[( X ) P( X )] .
2
Probabilidad
0.15
0.15
0.35
0.18
0.13
0.04
Tabla 22. Ganancias con sus respectivas probabilidades para el segundo plan
de inversin.
Solucin.
La
media
de
esta
distribucin
es:
= 40 * 0.15 + 20 * 0.15 + 18 * 0.35 + 15 * 0.18 + 10 * 0.13 + 3 * 0.04 = 19.42% . Este valor
indica que si se toma la segunda opcin se esperara ganar el 19.42%
de la inversin, esto es, la ganancia esperada ser del 19.42%.
Para el clculo de la desviacin estndar y varianza se utiliza,
sistemticamente, la tabla 23.
X (%)
P( X )
( X )2
40
20
18
15
10
3
0.15
0.15
0.35
0.18
0.13
0.04
20.58
0.58
-1.42
-4.42
-9.42
-16.42
423.5364
0.3364
2.0164
19.5364
88.7364
269.6164
( X )2 P ( X )
63.5305
0.0505
0.7057
3.5166
11.5357
10.7847
2
= 90.1237
Ejemplo 27. Una mquina fabrica una determinada pieza y se sabe que
de cada 200 piezas que produce, 20 son defectuosas. Encuentre la
probabilidad de que al examinar 17 piezas salgan 3 defectuosas.
Solucin.
Es claro que este problema corresponde a una distribucin binomial,
porque la probabilidad siempre es la misma (por cada 200 piezas que se
fabrican salen 20 defectuosas), una pieza no puede ser defectuosa y no
defectuosa a la vez y hay dos posibles resultados: xito para la pieza
defectuosa y fracaso para la pieza no defectuosa. Note que el xito se
refiere al resultado por el cul se indaga. Si la pregunta hubiese sido en
el sentido de la probabilidad de que haya una pieza no defectuosa,
entonces el xito sera no defectuosa y el fracaso defectuosa. Los
elementos de la frmula para el clculo e la probabilidad son:
20
n = 17 ,
p=
= 0 .1
y
x = 3.
Por
tanto
200
17
17 3
P (3) = 0.13 (1 0.1)
= 680 * 0.001 * 0.914 = 0.1555 .
3
Este resultado se habra podido obtener mediante el uso de la tabla para
la distribucin binomial acumulada, que se encuentra en el anexo. En la
tabla 24 se muestra un fragmento de dicha tabla.
P ( X 3) = P (0) + P (1) + P (2) + P (3) = 0.1667 + 0.3150 + 0.2800 + 0.1555 = 0.9172 , que
es el valor que se puede leer directamente de la tabla 24. La diferencia
est en que no se tuvieron en cuenta todos los decimales al momento
del clculo.
Probabilidad
0
1
2
3
0.1667
0.3150
0.2800
0.1555
Figura 36. Los defectos que hay en una subregin no interfieren en los que
hay en otra subregin.
6 0 e 6 e 6
=
= 0.0025 es la probabilidad de que no ocurra
0!
1
accidentes.
61 e 6 6e 6
P (1) =
=
= 0.015 es la probabilidad de que ocurra un accidente.
1!
1
6 2 e 6 36e 6
P ( 2) =
=
= 0.045 es la probabilidad de que ocurran dos
2!
2
accidentes.
P ( 0) =
63 e 6 216e 6
=
= 0.089 es la probabilidad de que ocurran tres
3!
6
accidentes.
P (3) =
Probabilidad
0
1
2
3
0.00225
0.0150
0.0450
0.0890
P ( a X b) =
f ( x)dx
x = a es P(a ) =
f ( x)dx = 0 ,
a
f ( x)dx = 1 .
F ( X ) = P( X a) =
f (t )dt ,
x f ( x)dx .
La
2 =
Varianza.
2
(x )
f ( x)dx .
se
calcula
mediante
la
frmula
(x )
f ( x)dx .
si x 0 .
f ( x) = 40 e
0
si x < 0
Demuestre que esta funcin es una buena funcin de densidad de
probabilidad.
Determine la probabilidad de que la vida til de una batera elegida al
azar
Est entre 30 y 50 horas.
Sea por lo menos 60 horas.
A lo ms 15 horas.
Grafique esta funcin de densidad de probabilidad.
Solucin.
Se nota que la funcin es positiva para todos los x 0 , pues est
definida en este intervalo mediante una funcin exponencial. Para x < 0
la funcin es cero. Luego esa funcin ser positiva o cero para todos los
valores de x . Luego se cumple la primera condicin.
x
1
40
e dx
f ( x)dx = f ( x)dx + f ( x)dx = 0 + f ( x)dx = 40
Lim 40x t
Lim 40t
1 40
e 1 = 1
=
e
dx
=
e
=
t 0 40
t
t
Lim
30
3
40x t
40t
t
t
60
La probabilidad de que la duracin de la batera sea a lo ms 15
horas es
x
15
x 15
15
1
P ( x 15) = e 40 dx = e 40 = e 40 e 0 = (0.687 1) = 0.313 .
0 40
1
P (60 x) = e 40 dx =
60 40
f ( x) =
dada por
1
e
2
( x )2
2 2
y una
diferentes.
con
medias
diferentes
pero
con
+ .
+ 2
1 2
e .
2
a.
Si se quiere calcular la probabilidad de que Z sea menor o igual que
a siendo a positivo, la tabla tampoco servira pues en ella se
encuentran slo valores positivos para Z. La solucin a este
inconveniente se basa en que la curva normal estndar es simtrica, es
decir que calcular el rea debajo de la curva entre menos infinito y a
es la misma rea debajo de la curva entre a y el infinito. Por tanto
P ( Z a ) = P ( Z a ) y de acuerdo con lo visto en el caso anterior se
obtiene P ( Z a ) = 1 P ( Z a ) . En la figura 49 se puede observar la
igualdad de las reas para Z mayores o iguales a a y para Z menores o
iguales a a
Figura 48. rea que representa la probabilidad de que Z sea mayor que
155 150
145 150
= P
Z
= P (0.5 Z 0.5)
10
10
ms
P ( X 155) = P
= P Z
= P ( Z 0.5) = 1 P ( Z 0.5) y
10
por
tablas
se
tiene
que
P ( Z 0.5) = 0.691462 ,
por
tanto
P ( X 155) = 1 0.691462 = 0.308538 .
Hasta este punto se ha pedido calcular la probabilidad de que para un
cierto valor a , Z a ; esto es P ( Z a ) . Ahora si se conoce la probabilidad
de que Z a , por ejemplo, P ( Z a ) = c para algn valor c , cul es el
P ( X a ) = P
= P Z
= 0.980774 y por tablas se obtiene
a
el valor de
= 2.07 y al despejar a = 2.07 * + , por tanto a = 20.35
6. EJERCICIOS DE LA UNIDAD.
BIBLIOGRAFA
MEYER, Paul. PROBABILIDAD Y APLICACIONES ESTADSTICAS. 2a ed.
Washington: Addison Wesley Iberoamericana, 1986.
VELASCO S, Gabriel., y WISNIEWSKI M, Piotr. PROBABILIDAD Y
ESTADSTICA PARA INGENIERA Y CIENCIAS, 1a ed. Mxico: Thomson,
2001.
MENDENHALL, William., VACKERLY D, Dennis., y SCHEAFFER, Richard.
ESTADSTICA MATEMTICA CON APLICACIONES. 2a ed. New York:
Iberoamericana, 1994.
CARRANZA, Roque., MTODOS MATEMTICOS DE ESTADSTICA. 2a ed.
Madrid: Aguilar, 1968.
FREEMAN, Harold., INTRODUCCIN A LA INFERENCIA ESTADSTICA. 3a
ed. Mxico: Trillas, 1970.
RIOS, Sixto., MTODOS ESTADSTICOS. 5a ed. New York: Mc Graw Hill,
1967.
GARCA, lvaro. ESTADSTICA. 2a ed. Bucaramanga: UIS, 1985.
LIND, Douglas., MARCHAL, William., MASON, Robert. ESTADSTICA
PARA ADMINISTRACIN Y ECONOMA. 11a ed. Mxico: Alfaomega,
2005.
TABLAS