ESTADÍSTICA DESCRIPTIVA
E INFERENCIAL II
1
2
ÍNDICE
INTRODUCCIÓN 5
PROPÓSITO 7
CUESTIONAMIENTO GUÍA 9
1.1.1 Normalización 14
RECAPITULACIÓN 70
ACTIVIDADES DE CONSOLIDACIÓN 71
AUTOEVALUACIÓN 73
APENDICES 79
BIBLIOGRAFÍA CONSULTADA 92
3
4
INTRODUCCIÓN
5
6
PROPÓSITO
Con este fascículo puedes estudiar las funciones probabilísticas continuas su distribución
normal estándar, las distribuciones muestrales y teorema central del límite, así como la
distribución T de Student.
Estos temas que parecen sin sentido, toman una importancia fundamental cuando
hablamos de investigación. Para cualquier ciencia o profesión la investigación juega un
papel preponderante, y para que esta sea aceptada científicamente es necesario que
cuente con datos fidedignos y sistematizados adecuadamente ¡ y esta es la contribución
de “nuestros temas sin sentido”! A través de su estudio puedes aprender a sistematizar
los elementos cuantitativos de cualquier investigación, y si estás pensando ¡Yo no seré
investigador, seré médico, o sociólogo, o químico, o pedagogo, o...! Nosotros tendríamos
que contestarte que todos, absolutamente todos, en algún momento de su vida
profesional hacen investigación y entonces requerirás estas herramientas.
Para que puedas ejercitar los contenidos que integran el fascículo, aparecen una serie
de actividades, ¡no dejes de hacerlas!
7
8
CUESTIONAMIENTO GUÍA
Sabemos que las aguas negras de la Ciudad de México se utilizan para el riego de los
campos de cultivo circunvecinos al Valle de México.
Esta agua negras contienen entre otras sustancias, el cloro en cantidades perjudiciales
al sembradío de cereales porque en lugar de beneficiarlo con el riego, lo quema y lo
seca.
Para el análisis se toma una muestra de 5 lt. De aguas negras diariamente. Los
resultados correspondientes al mes de noviembre de 1993 fueron las que se muestran
en la siguiente tabla. Las cantidades de cloro se registran en partes pro millón (ppm).
16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.8
15.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0
16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3
9
10
CAPÍTULO 1
FUNCIONES PROBABILÍSTICAS
CONTÍNUAS
En el siglo XVIII a los jugadores profesionales les interesaba conocer a priori, las
probabilidades de éxito en los distintos juegos de azar, para ello acudieron a los
matemáticos de la época en busca de ayuda. Como una respuesta a una necesidad
planteada a los matemáticos, en 1973 Abraham D’Moavre (1667-1754) es quien obtiene
por primera vez la ecuación matemática de la curva normal.
Otros grandes matemáticos contribuyeron dándole impulso, entre ellos podemos citar a
Friedrich Gauss (1777-1855) quien perfeccionó y la utilizó ampliamente en su teoría de
errores de las mediciones físicas. Laplace la usó en el cálculo de lo errores de las
observaciones astronómicas. El matemático Ruso P.L. Chebyshev estableció varios
teoremas relacionados con la curva de la distribución normal.
Los experimentos realizados pro muchos científicos, permiten determinar que la mayor
parte de las variables aleatorias se pueden estudiar considerando que tiene una función
de densidad normal.
11
1.1 DISTRIBUCIÓN NORMAL ESTÁNDAR
Retomemos el problema de las aguas negras. Los resultados que debiste obtener son:
R = 1.7 M = 16.01
M = 16.05 X = 16.08
S = 0.42
fi
10
0
x
15.2 15.37 15.72 16.08 16.42 16.77
Fig. 1
Del polígono de frecuencias podemos ver que la curva es asimétrica; está sesgada a la
izquierda por lo tanto su asimetría es negativa. Por su puntiagudez es del tipo
leptocúrtica.
1. Simétricos ( Gráfica A )
2. Asimétricos ( Gráficos B y C )
12
fi
B C
A
0 x
Fig. 2
a) Platicúrtico (Gráfica A)
b) Mesocúrtico (Gráfica B)
c) Leptocúrtico (Gráfica C)
fi C
x
0 µ σC σB σA
Fig. 3
De los gráficos anteriores podemos concluir que la forma de cada una, está íntimamente
relacionada con las medidas de tendencia central y de dispersión.
13
Las medidas de dispersión son diferentes, de la figura ( 3 ) obtenemos que:
σA = σB = σC
En las asimétricas las medidas de tendencia central son diferentes y lo mismo ocurre con
las de dispersión.
Las curvas simétricas tienen la forma de campana y las asimétricas no tienen esa forma
pero pueden transformarse a simétricas.
1.1.1. Normalización
Xi − µ
Z= ... (1)
σ
14
Veamos el siguiente ejemplo:
Se desea conocer el peso promedio de los alumnos del turno vespertino del plantel 2 del
Colegio de Bachilleres. Para ello se toma una muestra representativa de 150 alumnos y
se pesan. Los pesos ya organizados en 13 clases, se muestran en la siguiente tabla de
frecuencias:
Clases en kg. 30 – 34 35 − 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 64
fi 1 5 8 8 10 18 12
65 – 69 70 - 74 75 – 79 80 – 84 85 – 89 90 – 94
36 28 12 8 3 1
ACTIVIDAD DE REGULACIÓN
c) La media, y
d) La desviación estándar.
e) Traza el polígono de frecuencias.
15
Los resultados que debiste obtener son:
fi
40
30
20
10
Fig. 4
x
0 27 32 42 52 62 72 82 92 97 102
De esta gráfica podemos concluir que es asimétrica con sesgo negativo y del tipo
leptocúrtica.
Ahora vamos a normalizar estos datos y trazar la curva normal estándar sobre este
polígono de frecuencias para poder constatar el cambio de escala.
16
Para explicar el procedimiento vamos a construir la siguiente tabla:
1 2 3 4 5 6 7 8 9
CLASE fi Lr ∆x=xi–x Z = ∆x/σ PARTE PARTE fe fe
SUP MAYOR MENOR redondeada
∆x = xi – x ... (1)
17
La columna 5 es el valor de Z correspondiente a cada puntuación y se obtiene mediante
la ecuación de normalización o tipificación, esto es:
∆x xi − x
Z = = ... (2)
σ σ
En la cuarta columna se lee el área bajo la curva normal de la parte menor y se registra
en la columna siete de nuestra tabla.
EJEMPLO:
Para z = 2.51 el área de la parte mayor que se lee en la tercera columna es 0.9940.
18
fi
30
20
10
S
0 27 32 37 42 47 52 57 62 67 72 77 82 87 92 97
Z
0 27.3 39.5 51.7 S=63.9 76.1 88.3 100.3
Fig. 5
A = Polígono de frecuencia de los pesos de 150 alumnos del plantel 2 del turno
vespertino del Colegio de Bachilleres.
Del ejemplo anterior habrás notado que normalizar los datos de un problema es
equivalente a cambiar la escala “x” por la “z” y calcular las nuevas frecuencias que son
las ordenadas de cada punto. Para ello usamos los valores de la tabla. Estos valores
corresponden a las áreas bajo la curva normal y se han calculado mediante la ecuación
que define a la función normal y ésta es:
( x −µ ) 2
1 −
2σ
y = f (x) = e ...(3)
2πσ
19
D = 3.1416.... µ = media proporcional
e = 2.718281... σ = desviación estándar de la población
x = cada uno de los datos u observaciones.
Con la ecuación ( 3 ) podemos trazar la curva normal que tiene la forma de campana.
Primero obtenemos µ y σ de los datos del problema y sustituimos en la fórmula ( 3 ).
Para obtener un par ordenado, usamos un valores arbitrario de x obtenemos un valor
de y. Esta sucesión de puntos nos da la curva normal.
B A
Fig. 6
A = Curva normalizada
B = Curva normalizada y estandarizada
µ=0 y σ=1
Con estos valores reducidos, la curva normal estándar se obtiene mediante la gráfica de
la función:
2
1 − x
y = f (x) = e 2
...(4)
2π
20
Y la ecuación de tipificación es la ya conocida:
x−µ
x=µ+σZ ∴ Z= ...(1)
σ
ACTIVIDAD DE REGULACIÓN
Con los datos del problema de las aguas negras, elabora la tabla con los datos
normalizados y traza la curva normal sobre el polígono de frecuencias que ya obtuviste
antes.
b) La curva normal estándar es simétrica con respecto a la media por lo tanto los
parámetros de tendencia central son iguales, es decir:
µ = Mo = Md = 0 ...(5)
21
c) La desviación estándar es σ = 1
Z
µ=0
Fig. 7
El área sombreada vale 1 y como la curva es simétrica cada región a los lados del eje y
vale 0.5.
99%
95%
68%
Z
-3σ -2σ -σ µ=0 σ 2σ 3σ
Fig. 8
De esta gráfica podemos ver que el área antes y después de + 3σ corresponde al 1%, es
decir el 0.5% para cada lado de la gráfica.
22
Por la simetría que tiene la curva normal estándar, existen tablas correspondientes al
área bajo al curva que únicamente contemplan la parte positiva de la gráfica y estos
mismos valores se usan para el lado negativo.
Ejemplo: Con los siguientes valores de “Z” determinaremos el valor de área bajo la curva
y trazaremos un esquema del área correspondiente:
Z = 0.5 ; A = 0. 1915
Z
µ = 0 Z = 0.5
Z = -0.5 , A = 0.1915
Z
Z =-0.5 µ = 0
Z = 0.7 ; A = 0.2580
Z
µ=0 Z = 0.7
23
Z = -0.7 ; A = 0.2580
Z
Z =-0.7 µ=0
Z = 1.5 ; A = 0.4332
Z
µ=0 Z = 1.5
Z = -1.5 ; A = 0.4332
Z
Z =-1.5 µ=0
De las gráficas anteriores podemos ver, que el valor del área es el mismo para valores
positivos y negativos de Z solamente que para el valor negativo, el área se representa a
la izquierda de la media.
24
ACTIVIDAD DE REGULACIÓN
µ=0 µ=0
Si queremos la probabilidad de un evento cuyo valor está limitado por dos puntuaciones,
por ejemplo:
P ( x, ≤ X ≤ x2 )
∴ P ( x1 ≤ x ≤ x2) = P ( Z1 ≤ Z ≤ Z2 )
X1 − µ
Determinamos Z1 = → P ( Z ) = P ( Z1 ) + P ( Z2 )
σ
X2 − µ
Z2 =
σ
25
Las gráficas correspondientes en ambas escalas son:
Si las “x” están en el lado positivo entonces, debemos recordar que los valores que se
leen en la tabla normalizada son a partir de la media hasta el valor de Z.
P ( Z ) = P ( Z2 ) – P ( Z1 )
26
Si los valores de “x” están en la parte negativa de “z” es decir a la izquierda de la media,
entonces los gráficos son:
P ( Z ) = P ( Z2 ) – P ( Z1 )
X2 X1 X X Z2 Z1 µ
Si solamente tenemos una “X” a la derecha de la media entonces el área bajo la curva
es:
P ( Z ) = 0.5 + P ( Z1 )
X X1 X µ=0 Z1 Z
27
Recuerda que la primera mitad del área bajo la curva vale 0.5, es por eso que a la
probabilidad de Z, le sumamos 0.5.
X1 X X Z1 µ=0 Z
←P(X1)→ ←P(Z1)→
X1 X X Z1 µ
28
Si queremos la probabilidad de las partes sombreadas de las siguientes gráficas:
P ( Z ) = [ 0.5 – P ( Z1) ] + [ 0.5 – P ( Z2 )]
←P(X2)→ ←P(Z2)→
←P(X1)→
←P(Z1)→
X1 X X2 X Z1 µ=0 Z2 Z
ACTIVIDAD DE REGULACIÓN
1. a) Z = 0 y Z = 0.94
b) Z = 0 y Z = -2.15
c) A la derecha de Z = 0.62
d) A la derecha de Z = - 0.93
e) A la izquierda de Z = 0.84
f) A la izquierda de Z = -0.35
2. a) Z = - 0.59 y Z = 0.59
b) Z = -0.71 y Z = 1.99
c) Z = 0.32 y Z = 0.92
d) Z = -0.81 y Z = -0.42
e) Z = -1.65 y Z = -0.25
29
Si se conoce la probabilidad de un evento y queremos determinar el valor de Z, entonces
nos situamos en la segunda columna de la tabla ( Área desde la media), localizamos el
valores de la probabilidad y en el mismo renglón y en la misma columna 1 determinamos
el valores deZ.
µ=0 Z Z
P ( Z1 ) = 0.2589
µ=0 Z1 Z
30
En la segunda columna de la tabla localizamos el valor de la probabilidad y en la misma
línea en la primera columna determinamos el valor de Z = -0.34. El valor del signo es
por estar a la izquierda de la media
-Z µ=0 Z
ACTIVIDAD DE REGULACIÓN
a) Entre 0 y Z, P ( Z ) = 0.4864
b) A la izquierda de Z, P ( Z ) = 0.9983
c) A la derecha de Z, P ( Z ) = 0.7324
d) A la derecha de Z, P ( Z ) = 0.2981
e) A la izquierda de Z, P ( Z ) = 0.1314
f) Entre –Z y Z, P ( Z ) = 0.7286
31
EJEMPLO:
10 0 10
F( 0 ) = ( 0 ) ( 0.2 ) ( 0.8 ) = ( 1 ) ( 1 ) ( 0.1073 ) = 0.1073
10 1 9
F( 1 ) = ( 1 ) ( 0.2 ) ( 0.8 ) = ( 10 ) ( 0.2 ) ( 0.1342 ) = 0.2684
10 2 8
F( 2 ) = ( 2 ) ( 0.2 ) ( 0.8 ) = ( 45 ) ( 0.04 ) ( 0.1677 ) = 0.3019
10 3 7
F( 3 ) = ( 3 ) ( 0.2 ) ( 0.8 ) = ( 120 ) ( 0.0008 ) ( 0.2097 ) = 0.2013
10 4 6
F( 4 ) = ( 4 ) ( 0.2 ) ( 0.8 ) = ( 210 ) ( 0.0016 ) ( 0.2621 ) = 0.0881
10 5 5
F( 5 ) = ( 5 ) ( 0.2 ) ( 0.8 ) = ( 252 ) ( 0.00032 ) ( 0.3276 ) = 0.0264
F( 6 ) =
F( 7 ) =
F( 8 ) =
F( 9 ) =
F( 10 ) =
32
Cálculo del segundo problema:
10 0 10
F( 0 ) = ( 0 ) ( 0.8 ) ( 0.2 ) = ( 1 ) ( 1 ) ( 0.000000102 ) = 0.0000001
10 1 9
F( 1 ) = ( 1 ) ( 0.8 ) ( 0.2 )= ( 10 ) ( 0.8 ) ( 0.000000512 ) = 0.0000009
10 2 8
F( 2 ) = ( 2 ) ( 0.8 ) ( 0.2 ) = ( 45 ) ( 0.64 ) ( 0.000002 ) = 0.0000737
10 3 7
F( 3 ) = ( 3 ) ( 0.8 ) ( 0.2 ) = ( 120 ) ( 0.512 ) ( 0.000012 ) = 0.0008
10 4 6
F( 4 ) = ( 4 ) ( 0.8 ) ( 0.2 ) = ( 210 ) ( 0.4096 ) ( 0.000064 ) = 0.0055
10 5 5
F( 5 ) = ( 5 ) ( 0.8 ) ( 0.2 ) = ( 252 ) ( 0.3276 ) ( 0.00032 ) = 0.02642
F( 6 ) =
F( 7 ) =
F( 8 ) =
F( 9 ) =
F( 10 ) =
10 0 10
f( 0 ) = ( 0 ) ( 0.5 ) ( 0.5 ) = ( 1 ) ( 1 ) ( 0.00097 ) = 0.0009
10 1 9
f( 1 ) = ( 1 ) ( 0.5 ) ( 0.5 )= ( 10 ) ( 0.5 ) ( 0.00195 ) = 0.009
10 2 8
f( 2 ) = ( 2 ) ( 0.5 ) ( 0.5 ) = ( 45 ) ( 0.25 ) ( 0.0039 ) = 0.039
10 3 7
f( 3 ) = ( 3 ) ( 0.5 ) ( 0.5 ) = ( 120 ) ( 0.125 ) ( 0.00781 ) = 0.1172
33
10 4 6
f( 4 ) = ( 4 ) ( 0.5 ) ( 0.5 ) = ( 210 ) ( 0.0625 ) ( 0.0156 ) = 0.2051
10 5 5
f( 5 ) = ( 5 ) ( 0.5 ) ( 0.5 ) = ( 252 ) ( 0.03125 ) ( 0.03125 ) = 0.2461
f( 6 ) =
f( 7 ) =
f( 8 ) =
f( 9 ) =
f( 10 ) =
Para poder trazar la gráfica como si fuese una variable continua, cerramos los espacios
entre cada barra del histograma, para ello tomemos medio punto después de cada valor
para obtener el límite real superior de clase.
p<q
34
p>q
35
1.1.3 APROXIMACIÓN NORMAL A LA DISTRIBUCIÓN BINOMIAL
n= 5 n = 11 n = 15 n = 50
En las gráficas anteriores podemos ver si “n “ aumenta, los espacios entre las barras se
van cerrando y la gráfica se aproxima a la campana de Gauss que es la gráfica de una
variable aleatoria continua.
n
f ( x) = p x (1 − p) n − x
x
n = Número de observaciones
x = Número de éxitos esperados
p = Probabilidad de éxito
q = 1-p = Probabilidad de fracaso
Con estos ejemplos podrás notar que el cálculo en la distribución binomial, es muy
laborioso, aunque existen tablas para algunos valores; pero no son suficientes cuando
“n“ crece.
36
Para determinar esta probabilidad tenemos que calcular
f ( 45 ) + f ( 46 ) + f ( 100 ) = P( x ) ...(7)
P (x ) = 1 – [ f ( 0 ) + f ( 1 ) + f ( 2 ) + . . . + f ( 44 ) ] ...(8)
Una forma de ahorrar este trabajo laborioso es haciendo el cálculo de probabilidades por
medio de la distribución normal.
Para usar la distribución normal se calculan los parámetros aplicando las siguientes
ecuaciones:
µ = np ...(9)
σ = np(1 − p) . . . ( 10 )
Solución:
15 1 1 15 1
f (x ) = f ( 6 ) = ( )6 (1 − )15−6 = ( )15 = 5005(0.0000305) = 0.1527
6
2 2 6 2
f ( x ) = 0.1527
Para aplicar esta distribución corregimos los espacios para considerar a la variable como
si fuese continua o sea para 6 águilas tomamos medio punto antes y medio punto
después, es decir:
37
1
x = 5.5 µ = np = 15 ( ) = 7.2
2
1 1 1
x = 6.5 σ = np(1 − p) = (15)( )( ) = 15 = 1.9365
2 2 2
5.5 − 7.5 −2
Z1 = = = −1.033
1.9365 1.9365
6.5 − 7.5 −1
Z2 = = = −0.5164
1.9365 1.9365
P(z) = P(Z2)-P(Z1) =
=P(-1.033)-P(-0.5164)
=0.3485-0.1950=0.1535
P(Z)-f(x)=0.1535-0.1527
=0.0008
Z
-Z2 -Z1 µ=0
Una editorial de libros técnicos obsequia un porcentaje de libros para dar a conocer una
nueva edición. Con el libro de obsequio se envía un cuestionario que deben contestar los
lectores y devolver a la editorial. En el cuestionario se incluyen preguntas con respecto
de las personas para mejorar su contenido y preparar nuevos tirajes; pero la experiencia
de ésta es que la probabilidad de que devuelvan el cuestionario es de P ( x ) = 0.18.
P ( x ) = f ( 15 ) + f ( 16 ) + . . . + f ( 100 ) . . . ( 11 )
O bien
38
P ( x ) = 1-[f ( 0 ) + f ( 1 ) + . . . + f ( 14 )] . . . ( 12 )
El Segundo cálculo es menos laborioso, sin embargo no deja de serlo. Sabemos que una
buena aproximación es mediante la distribución normal cuyo cálculo es más sencillo.
Veamos el desarrollo:
µ = np = 100 ( .18 ) = 18
Para transformar la variable binomial a continua tomamos el límite real inferior de clase
14.5 − 18
X = 14.5 o sea medio punto antes. Con este valor calculamos Z1 = −0.9114
3.84
P(Z) = P (Z1) + 0.5 . . . ( 13 )
De las tablas obtenemos:
P (Z1) = P (-0.9114) = 0.3186
Sustituyendo este valor en ( 13 )
Obtenemos: f(x) = P(Z) = 0.3186+0.5
f(x) = 0.8186
Z
-Z1 µ=0
De acuerdo con este resultado la editorial recibirá el 82% de los cuestionarios enviados.
EJERCICIO:
EJERCICIO:
1) Población 3) Estadística
a) finita e 4) Parámetros
b) infinita
2) Muestra aleatoria
También se estableció por qué es conveniente estudiar una muestra aleatoria en lugar
de la población.
Cuando vamos al mercado nos dan una prueba de barbacoa y del sabor de esta muestra
se infiere el sabor de toda y si nos gusta entonces la compramos. Lo mismo ocurre si
queremos comprar queso, pedimos una prueba y de esta deducimos si todo el queso
está bueno o no.
Si el industrial quiere determinar el número de horas de vida que tiene un foco, toma una
muestra de todo el lote y los mantiene encendidos hasta que se funden.
De estos casos podemos deducir que no es posible analizar todo el queso o la barbacoa
porque no quedaría para vender. El industrial no puede fundir todos los focos porque no
tendría qué vender.
40
DEFINICIÓN:
1. Muestreo sistemático.
2. Muestreo estratificado.
3. Muestreo por conglomerados.
4. Muestreo aleatorio simple.
Muestreo Sistemático
Ejemplo:
Se desea entrevistar a cada décimo estudiante del S.E.A. del Plantel 2 del Colegio de
Bachilleres, para ello se toma una lista de todos los estudiantes. Supongamos que
escogimos el 5º., entonces el siguiente será de los 10 primeros seleccionados al azar y a
partir de este vamos tomando los números décimos de toda la lista.
a) Ventajas:
3. El costo es reducido.
b) Desventajas:
2. Debido a lo anterior se puede cometer el grave error de tomar una muestra que
no sea representativa, por ejemplo:
Por ejemplo:
Los estudiantes del S.E.A. del plantel 2 del Colegio de Bachilleres están
divididos por edades con intervalos de 5 años y los porcentajes son los
siguientes:
de 18 a 23 30%
de 24 a 29 25%
de 30 a 35 20%
de 36 a 41 10%
de 42 a 47 7%
de 48 a 53 5%
de 54 y mas 3%
Se desea saber cuantas horas estudian diariamente; para ello de cada grupo se
toma un porcentaje igual al del grupo, es decir del primer grupo tomamos el 30%
del grupo. De la misma forma se toma el porcentaje de los siguientes grupos
para formar la muestra representativa para su estudio.
Por ejemplo:
42
Para poder hacer el muestreo aleatorio simple debemos contestarnos las
siguientes preguntas:
2. Conociendo las “n” muestras ¿Cómo podemos tomar una de ellas que sea
representativa de la población?
Para dar respuesta a la primera pregunta, nos trasladamos al fascículo donde estudiaste
el análisis y aplicamos la ecuación:
N N!
C = . . .(14)
n
n! (N − n)!
EJEMPLO:
a) n = 2 y N = 20
b) n = 3 y N = 100
Solución:
20 20! 201918!
a) C = = = 190
2
2! ( 20 − 2 )! 2! (18)!
Este resultado nos dice que con una población de 20 elementos podemos tomar 190
muestras de dos elementos cada una.
Este resultado nos indica que de una población de 100 elementos podemos formar 161,
700 muestras de 3 elementos.
Para que estas muestras sean representativas en el primer caso cada muestra debe
1
tener de probabilidad de ser seleccionada.
190
43
1
En el 2° caso cada muestra debe tener de probabilidad de ser seleccionada.
161700
Hay varias formas de tomar la muestra. Estas formas son las siguientes: en el primer
caso cuando el número de muestras no es muy grande se pueden numerar recortes de
papel, doblarlos y meterlos en un recipiente donde se puedan mezclar ampliamente.
Una vez mezclados, se saca la muestra.
Por ejemplo:
Solución:
1. Abraham (A)
2. Dionisio (D)
3. Efraín (E)
4. Fausto ( F)
5. Iván (I )
N 5 5! 543! 20
C = C = = = = 10
n
2
2! ( 5 − 2 )! 2! ( 3)! 2
1
P(n)=
10
Cada muestra la escribimos en un recorte de papel y éstas son:
1 2 3 4 5 6 7 8 9 10
A-D A-E A-F A-I D-E D-F D-I E-F E-I F-I
Quizá haya visto este procedimiento en el sorteo de los equipos para el campeonato
mundial de fútbol. En el sorteo se usaron esferas huecas bisectadas y en su interior se
colocó el nombre de cada equipo, se revolvían ampliamente, se sacaba una esfera de la
cual se tomaba el nombre del equipo y se colocaba en el grupo correspondiente.
44
EJERCICIO:
a) 7 elementos
b) 15 elementos
c) 50 elementos
a) 10 elementos
b) 25 elementos
c) 75 elementos
5
b) Si el número de muestras es muy grande como en el último ejercicio 15, que son
17,259, 390; la forma explicada con recortes de papel no es la adecuada. Para estos
casos se usa otro procedimiento que consiste en usar una tabla de números aleatorios
como la que se incluye en el apéndice “B”.
El Banco Nacional de México tiene una promoción para tarjeta habientes que consiste en
condonarles la cuenta a 10 personas de cada sucursal, en la primera quincena del mes
de enero de 1994. La lista de cuenta habientes es de 550 y para determinar la muestra
aleatoria numeramos cada cliente con tres cifras en orden ascendente esto es: 001,
002, 003, ..., 550 y nos situamos al azar en una columna de números aleatorios y nos
desplazamos en ella en la dirección que queramos analizando las tres primeras cifras de
cada número hasta completar los 10 números de la muestra.
Para nuestro ejemplo nos situamos en la última página de números aleatorios del
apéndice “B”, en la columna 27 renglón 31 y nos desplazamos hacia abajo, los números
obtenidos de 3 cifras son:
187, 155, 388, 320, 281, 088, 520, 275, 480 y 273
Como habrás notado mediante el uso de números aleatorios, es muy fácil tomar una
muestra aleatoria.
EJERCICIO:
Mediante el uso de las tablas del apéndice “B”, realiza e siguiente ejercicio.
Al tomar las muestras aleatorias se cometen ciertos errores que se reflejan en que la
media y la distribución de cada muestra no son iguales, y por lo tanto la media y la
desviación estándar de la población tampoco coinciden con los de la muestra. Por esta
razón, la desviación estándar de la distribución de un estadístico muestral recibe el
nombre de error estándar estadístico.
El error estándar no solamente indica el tamaño del error accidental, sino también la
exactitud que alcanzaremos si usamos un estadístico muestral para estimar un
parámetro de la población.
Solución:
46
σ2 = Varianza de la población:
1
σ2 = [(1-5)+(3-5)+(5–5)+(7–5)+(9–5)]
5
σ2 = 8 σ= 8 = 2.83 ∴ σ = 2.83
5 5!
Número de muestras C = = 10
2
2! ( 5 − 2)
Conjunto de muestras
{(1, 3), (1, 5), (1, 7), (1, 9), (3, 5), (3, 7), (3, 9), (5, 7), (5, 9), (7, 9)}
{2, 3, 4, 5, 4, 5, 6, 6, 7, 8}
Probabilidad
x
Media de la distribución 2 1 de medias muestrales
10
1 1 2 3 1 2 2 1 1
µx = 2 (
10
)+ 3( )+ 4 ( )+ 5
10 10
10 (
10
)+ 6 ( )+ 7 ( )+ 8 ( )
10 10 10
4 2
10
µx = 5 5 2
10
6 2
Varianza de la distribución de 10 medias muestrales:
7 1
10
1 1 1 1 1
σ2 = (2-5) ( ) + (3-5) ( ) + (4-5) 8 1
( ) + (5-5) ( ) + (6-5) ( ) + (7-
10 10 10 10 10 10
1 1
5) ( ) + (8-5) ( )
10 10
σ2 = 3 ∴ σ = 3 = 1.73
47
De estos resultados concluimos que:
De este ejemplo podemos ver el error estándar de la media en que σx < σ, el cual ya
habíamos mencionado.
Dada una población de N elementos, ésta tiene una media µ y una desviación estándar
σ cuya relación entre ellos se muestra en la gráfica siguiente:
Distribución de la
población
µ σ
Gráfica A.
Distribución de
medias muestrales
Gráfica B.
48
De esta población se pueden formar un gran número de muestras pero solamente
mostramos 4 de ellas para ilustrar el procedimiento.
Distribución de
medias muestrales
con µ x = µ
µ=0 σ σx < σ,
Con estas gráficas podemos darnos mejor idea de la secuencia de operaciones que
realizamos para obtener la distribución de medias muestrales representada por la gráfica
C. Esta gráfica es simétrica y tiene la forma de la curva normal o campana de Gauss.
De esta misma gráfica podemos constatar que la media poblacional es igual a la media
de la distribución de medias, lo cual no ocurre con la desviación estándar en la que hay
un error.
σ N−n
σx = = . . . (15)
n N −1
N−n
A la raíz le llamamos factor de corrección por población finita, toda vez que para
N −1
σ
poblaciones infinitas se aplica la ecuación σ x = − . . . (16)
n
49
Veamos el ejemplo que usamos para la distribución de medias en que:
N=5 n=2 σx = 3 σ= 8
EJERCICIO:
2. Determina el factor de corrección para una población N = 10, 000 con muestras
de n = 100 e indica si afecta o no a la desviación estándar de la distribución de
medias muestrales σ x .
En los ejemplos anteriores quedó establecido que las muestras aleatorias tomadas de
una población tienen diferentes medias y comparadas con la media muestral, hay un
determinado error.
Con respecto a este error, el teorema de Chebyshev dice:
50
1
Podemos afirmar con una probabilidad de cuando menos 1- que la media de una
k2
muestra aleatoria de tamaño (n) difiere de la media de la población en un valor igual a
σ x k.
Este teorema de Chebyschev afirma que para estimar la media poblacional, cuando
utilizamos la media de una muestra aleatoria podemos afirmar con una probabilidad de
1
cuando menos 1- que nuestro error será menor que: σ x (k).
k2
EJEMPLO:
1 1
Se afirma con una probabilidad de 1- = 1 2 = 0.75 que la media de la muestra difiere
k 2
2
de la media de la población, y que el error que se comete es menor que:
σ x k = 2.5 ( 2 ) = ( 5 )
Con este teorema podemos conocer el error que cometemos sin tener que hacer el
desarrollo de la distribución de medias muestrales.
Existe otro teorema aún más preciso que el de Chebyshev, éste teorema se llama:
Teorema del límite central y dice:
51
EJEMPLO:
N=64 σ =20
−5 5
Z1 = = −2 y Z2 = =2
20 / 64 20 / 64
Con los valores de Z nos vamos a las tablas del apéndice A, que se encuentran al final
del fascículo, obtenemos
Con este ejemplo podemos ver como el teorema central del límite es más preciso que el
de Chebyshev, toda vez que Chebyshev da un rango de aproximación y el del límite
central nos fija el valor de la probabilidad.
Z
µ-3σ µ-2σ µ-σ µ=0 µ→σ µ+2σ µ+3σ
Figura 9.
52
Veamos el siguiente ejemplo:
Solución:
σ
200 σ 50 50 1 1
= = = =
σ σ 200 200 4 2
50
Con este ejemplo podemos vera que al aumentar el valor de (n), el error de la media
disminuye; en nuestro ejemplo disminuyó la mitad.
Si la naturaleza del problema que se está resolviendo tiene distribución normal, entonces
el teorema del límite central cobra mayor importancia en el cálculo del error estándar de
la media. Veamos el siguiente ejemplo:
µ=0
Figura 10.
53
Ahora formemos muestras con n=20 y la gráfica de esta nueva distribución de medias
maestrales es la C
σ <<<25
X
µ=0
Figura 11.
De lo anterior concluimos que si (n) crece, el error estándar que se comete al tomar a la
media muestral como estimador de la población (µ) es cada vez más pequeño.
Ya dijimos que para n>30 podemos considerar que (n) es grande y aunque el teorema
central del límite se puede aplicar a una muestra cuya n<30, el error estándar es mayor.
En estos casos se recomienda aplicar otra distribución que nos permite cálculos más
precisos en muestras pequeñas y que veremos a continuación.
EJERCICIO:
1. La media de una muestra aleatoria de tamaño n=400 se utiliza para estimar la media
de una población infinita que tiene desviación estándar σ=5. ¿Qué podemos decir
acerca de la probabilidad de que el error será menor que 0.4 mediante el uso de:
a) El teorema de Chebyshev
b) El teorema d}central del límite
54
2. En los equipos de detección de la contaminación por humo, se usan pequeñas
baterías cuya duración tiene una desviación σ=77 horas. Se utiliza la media de una
muestra de tamaño n=49 para estimar la media poblacional. Mediante la aplicación
del límite central, ¿qué podemos decir acerca de la probabilidad de que la estimación
tenga un error?
a) ¿Menor de 10 horas?
b) ¿Menor de 20 horas?
X-µ
t= , ……..(12)
s/ n
donde:
X = media de la muestra
µ = media de la población
s = desviación típica de la muestra
n = tamaño de la muestra
55
La distribución t de Student se basa en la consideración de que la población a partir de la
cual se obtiene la muestra tiene una distribución normal, σ al menos aproximadamente
normal.
Una estimación de este tipo es una estimación puntual ya que consta de un solo número.
Pero esta manera de estimar un parámetro no es la más confiable ya que no nos dice en
cuanta información se basa la estimación y tampoco nos dice nada acerca del posible
tamaño del error. Una estimación por intervalos es mucho más útil que una estimación
puntual, debido a que posee más información; no solo da el valor estimado, sino también
la precisión y el nivel de confianza.
X-µ
Comparando la variable normal estandarizada Z= y la variable “t de student”,
σ/ n
X-µ
t= se observa que son similares y que el único cambio está en el denominador
s/ n
donde se sustituye S en lugar de σ.
56
En la siguiente figura se comparan los dos tipos de curvas.
CURVA Z
Figura 12.
Figura 13.
57
Características de la distribución t de Student
El término “grados de libertad” abreviado (g.l.), se refiere al número de datos que pueden
variar libremente, después de haber impuesto ciertas restricciones a nuestros datos.
µ = X ± error muestral
El máximo error que se comete cuando se utiliza X como estimación de µ, cuando n⋅30
está dado por:
∝ σ ∝
E=Z • , donde Z denota el valor el valor
2 n 2
de Z para el cual el área situada debajo de la curva normal estándar a su derecha es
igual a ∝/2.
La selección del valor de ∝ es arbitraria, depende de qué tanto error se esté dispuesto a
tolerar.
58
EJEMPLO:
∝ = 0.05
∝
= 0.025
2
Z
Z1 µ=0 Zz
Figura 14.
En las tablas del área bajo la curva normal se obtiene Z2=1.96; y como la curva es
simétrica, Z1=-1.96.
Lo anterior significa que el 95% de las diferencias maestrales cae entre -1.96 y 1.96
desviaciones estándares.
EJEMPLO:
Un experto en mecánica utiliza la media de una muestra aleatoria de tamaño n=30 para
estimar el tiempo promedio que le toma a un mecánico realizar cierta tarea. Si con base
en la experiencia, el experto puede suponer f=2.5 minutos para estos datos, ¿qué se
puede decir con un nivel de confianza del 1% acerca del tamaño máximo de su error?
SOLUCIÓN:
Z0.005 = 2.57
σ
Sustituyendo estos datos en la fórmula E = Z∝/2 ⋅ se tiene:
x
( 2.5) 6.425
E = (2.57) = = 1.17
30 5.477
59
El resultado obtenido significa que el experto en mecánica puede afirmar con una
certeza del 99% que su error será cuando mucho de 1.17 minutos.
EJERCICIO:
Con referencia al problema de los pulsos cardiacos de las 32 personas, ¿qué se puede
decir con un nivel de confianza del 5% acerca del error máximo si se utiliza X=26.5 como
estimación del incremento promedio real del pulso de una persona que realiza la tarea
dada?
Z∝ σ
La fórmula E = • , también se puede utilizar para determinar el tamaño de la
2 n
muestra que se necesita para lograr un grado de exactitud deseada. Despejando n de la
expresión anterior se tiene:
2
Z ∝ /2•σ
n= ……….(16)
E
EJEMPLO:
SOLUCIÓN:
60
Sustituyendo los datos de la fórmula:
2
Z ∝ /2 • σ
n = se tiene
E
2
(1.96) (1.50)
n= = 96.04
0.30
EJERCICIO:
Intervalos de confianza
µ = X ± error muestral;
Z∝ σ
pero ya vimos que el máximo error muestral que se puede cometer es E = • , por
2 n
lo tanto podemos escribir:
Z∝ σ
µ=X± • ……….(17)
2 n
donde:
X = media muestral
Z∝ = Es el valor de Z para el cual el área bajo la curva normal a la
2 derecha de Z es ∝/2
∝ = Nivel de confianza
σ = Desviación típioca de la media
n
61
Puesto que los niveles de confianza más utilizados son 0.05 y 0.01, entonces podemos
establecer los siguientes intervalos de confianza:
σ
µ = X ± 1.96 ; intervalo de confianza de 95%
n
σ
µ = X ± 2.58 ; intervalo de confianza de 99%
n
EJERCICIO:
Z, ∝
1. Para ∝ = 0.01, obtener: Z1∝/2 = ___________. = ___________.
2
EJEMPLO:
(1, 5, 2, 3, 4, 1, 2, 2, 4, 3)
89
S= - (2.7) = 8.9 - 7.29
10
62
3er. Paso: se obtiene el error estándar de la media.
σ S
= nótese que el denominador en la fórmula se
X N-1
escribió N-1 en vez de N; la razón es que N-1
corrige el sesgo del error estándar.
σ 1.27 1.27
= = = o.42
X 10 - 1 3
σ
∴ = 0.42
X
4o. paso: Se multiplica el error estándar de ____________ por 1.96 que es el valor de Z
al nivel de confianza de 0.05.
σ
µ = X ± 1.96
X
µ = 2.7 ± 1.96 (0.42)
µ = 2.7 ± 0.82
∴ 1.88 ≤ µ ≤ 3.52
Lo anterior significa que se puede asegurar con un 95% de confianza que la verdadera
muestra poblacional está entre 1.88 y 3.52.
EJERCICIO:
Del conjunto de datos del problema anterior, encontrar el intervalo de confianza del 99%.
EJEMPLO:
SOLUCIÓN:
Se tiene que estimar la dureza media µ en base a una muestra con n = 40, X = 70 y S =
2 y un nivel de confianza del 99%, ya que la situación es bastante delicada.
63
σ
∴ µ = X ± 2.58
n
2
µ = 70 ± (2.58)
40
µ = 70 ± (2.58) (0.82)
o sea:
69.18 ≤ µ ≤ 70.82
El gerente, al recibir el informe, observa que este resultado cae muy cerca del extremo
del rango aceptable (de 68.3 ________), pide que se aumente la precisión del intervalo
de confianza del 0.82 a 0.50, preservando el nivel de confianza en 99%. ¿Qué harías tú?
SOLUCIÓN:
2 2
(2.58) (2) 5.16
n= = = (10.32) 2 = 106.50
0.50 0.50
Entonces nos bastaría una muestra de 107 piezas. Como ya teníamos 40 piezas, se
manda completar la muestra probando la dureza de 67 piezas adicionales. Se calculan
las nuevas X y S en base a la muestra total y se obtiene el nuevo intervalo de confianza
a 99% con precisión de 0.50.
EJERCICIO:
64
Confiabilidad de Promedios en Muestras Pequeñas
X-µ
Si en la distribución Z = , se reemplaza t por Z y σ por S se tiene la distribución:
σ/ n
X-µ
t= distribución de Student.
σ/ n
EJEMPLO:
Para 10 g. l., el 10% del área de la curva está a la derecha del valor t = 1.383, y como la
curva es simétrica, el 10% del área de la curva está a la izquierda del valor t = -1.383.
0.10
0.10
-3 -2 -1 µ=0 1 2 3
Figura 14. Distribución t para 10 g. l. y ∝/2 = 0.10.
De la figura se tiene que el 80% de los casos están comprendidos entre -1.383 y 1. 383.
65
EJERCICIO:
∝ ∝
Para la distribución t de Student se define t, de la misma forma como se definió Z ,
2 2
∝
de manera que el área situada debajo de la curva que está a la derecha de t es igual
2
∝ ∝
a -t . Sin embargo t depende del número de grados de libertad.
2 2
De la figura podemos
afirmar
Distribución t
S
µ = X ± t ∝ /2
n
66
EJEMPLO:
t
-t1 µ=0 t1
Figura 16.
SOLUCIÓN
a) ∝/2 = 0.05
∴ t0.05 = 1.812
EJERCICIO:
EJEMPLO:
Los contenidos de ácido sulfúrico en siete recipientes similares son: 9.8, 10.2, 10.4, 9.8,
10.0, 10.2 y 9.6 litros. Encuentra un intervalo de confianza al 95% para la media de todos
los recipientes, suponiendo una distribución aproximadamente normal.
SOLUCIÓN:
67
Empleando la tabla de la distribución t, se encuentra que t0.025 = 2.447, para 6 g. l.
Recuerda que ∝ = 0.05 == ∝/2 = 0.025
0.283
µ = 10.0 ± (2.447)
7
0.6925
µ = 10.0 ±
2.64575
µ = 10.0 ± 0.26174
EJERCICIO
b) ¿Qué se puede afirmar con el 95% de confianza acerca del error máximo, si
X = 2.36 miligramos se utiliza como estimación de la media de la población
muestreada?
a) 1.87 ≤ µ ≤ 2.85
b) E = 0.34
68
Pruebas de hipótesis
ESTADÍSTICO DE PRUEBA. Es una variable aleatoria cuyo valor se utiliza para llegar a
la decisión de rechazar o no la hipótesis nula.
1-∝
Figura 17.
Estos conceptos serán abordados en la siguiente unidad, prepárate para acceder a ellos.
69
RECAPITULACIÓN
FUNCIÓN
PROBABILÍSTICA
DISCRETA CONTINUA
MUESTREO
ESTRATIFICADO
NORMALIZACIÓN
POR CONGLOMERADOS
ALEATORIO SIMPLE
DISTRIBUCIÓN
NORMAL ESTÁNDAR
PEQUEÑAS GRANDES
n < 30 n > 30
DISTRIBUCIÓN MEDIA
MUESTRAL APLICACIÓN EN LA
“t” DE STUDENT SOLUCIÓN DE
PROBLEMAS
NIVEL DE
CONFIANZA
PRUEBAS DE
HIPÓTESIS
70
ACTIVIDADES DE CONSOLIDACIÓN
Para reafirmar los conceptos aprendidos resuelve el siguiente ejercicio. Si tienes alguna
duda, consulta con tu asesor.
27, 28, 28, 28, 29, 30, 30, 30, 30, 31, 31, 31, 32, 32, 32,
33, 33, 33, 33, 34, 34, 34, 34, 35, 35, 35, 35, 35, 35, 35,
36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 38, 38, 38, 38,
38, 38, 38, 39, 39, 39, 39, 40, 40, 40, 40, 40, 40, 40, 40,
41, 41, 41, 41, 41, 41, 41, 41, 42, 42, 42, 42, 42, 42, 43,
43, 43, 43, 44, 44, 44, 44, 44, 44, 44, 45, 45, 45, 45, 45,
46, 46, 46, 47, 47, 47, 47, 47, 47, 47, 48, 48, 48, 48, 49,
49, 49, 49, 50, 50, 51, 51, 51, 52, 52, 53, 53, 53, 54, 54,
55, 56, 56, 57, 57, 58, 59, 61, 62, 62.
Determina:
1) La media
2) La moda
3) La mediana
4) La varianza
5) La desviación estándar
6) Traza el polígono de frecuencias
7) Normaliza los datos y traza la curva de mejor ajuste sobre la gráfica anterior
para contrastar el cambio
8) Determina el tanto por ciento de casos que se espera hallar entre la media y
las puntuaciones 28, 38 y 60
9) Calcula el tanto por ciento y el número de casos esperados entre los
siguientes pares de puntuaciones:
a) 35 y 45
b) 50 y 55
c) 56 y 60
10) ¿Cuántos casos se espera hallar por encima de una puntuación igual a 50?
¿Cuántos por debajo de 35?
71
PROBLEMA
a) estimar el incremento promedio real del pulso cardiaco de una persona que
realiza una tarea ardua, mediante el estimador puntual X.
72
AUTOEVALUACIÓN
Los resultados que debiste obtener son los siguientes, si alguno no coincide, entonces
revisa tus cálculos, localiza el error y corrígelo.
4) = 64.2 5) = 9.04
6) TABLA DE FRECUENCIAS
966.5
60-62 61 5 5 305 13.9 193.21 1188.1
57-59 58 10 15 580 10.9 118.81 936.2
54-56 55 15 30 825 7.9 62.1 432.2
51-53 52 18 48 936 4.9 24.01 72.2
48-50 49 20 68 980 1.9 3.61 20.6
45-47 46 17 85 782 -1.1 1.21 235.3
42-44 43 14 99 602 -4.1 16.81 504.1
39-41 40 10 109 400 -7.1 50.41 816.1
36-38 37 8 117 296 -10.1 102.01 1029.7
33-35 34 6 123 204 -13.1 171.61 1036.8
30-32 31 4 127 124 -16.1 259.21 1094.4
27-29 28 3 130 84 -19.1 364.81 8332.2
6118
ΣXmfi 6118
X= = = 47.1
n 130
σ = 64.590698 = 8.04
2 6
Mo = 47.5 + 3 = 47.5 + = 48.7
2 + 3 5
130
- 48
Md = 48 + 3 2 = 48 + 51 = 50.6
20 20
73
POLÍGONO DE FRECUENCIAS
Z=
CLASE fi Ls. ∆X = Xi - ∆X I DEBAJO ENCIMA fe Fe. red.
X σ
60-62 5 62.5 15.4 1.92 0.9726 0.0344 4.47 4.5
57-59 10 59.5 12.4 1.54 0.9382 0.0696 9.05 9.1
64-56 15 56.5 9.4 1.12 0.8686 0.0805 10.47 10.5
51-53 18 53.5 6.4 0.80 0.7881 0.1253 16.29 16.3
48-50 20 50.5 3.4 0.42 0.6628 0.1429 18.58 18.6
45-47 17 47.5 0.4 0.05 0.5199 0.1454 18.90 18.9
42-44 14 44.5 -2.6 -0.32 0.3745 0.1325 17.23 17.2
39-41 10 41.5 -5.6 -0.70 0.2420 0.0997 12.96 13.0
36-38 8 38.5 -8.6 -1.07 0.1423 0.0674 8.76 8.8
33-35 6 35.5 -11.6 -1.44 0.0749 0.0405 5.27 5.3
30-32 4 32.5 -14.6 -1.82 0.0344 0.0201 2.61 2.6
27-29 3 29.5 -17.6 -2.19 0.0143 0.0143 1.86 1.9
X = 47.1
σ = 8.04
N = 130
74
A) POLÍGONO DE FRECUENCIAS (A)
B) Curva NORMALIZADA (B)
a) Para estimar la media µ de una población, hay varios estimadores puntuales, los
más conocidos son: media, mediana y moda.
27 + 14 + 24 + 32 + 25 + 30 + 24 + 29 + 19 + 32 259
X= = = 25.9
10 10
∴ X = 25.69
Esto significa que el incremento promedio real del pulso cardiaco es 25.9
pulsaciones por minuto.
75
Este error que se comete al estimar a través de X se determina mediante la
fórmula:
σ
E = t ∝/2 ⋅
n
Donde:
E= error
t ∝/2 = área bajo la curva a la derecha de ∝/2
σ= desviación estándar de la población
n= N° de datos
t(0.025) = 2.262
∴ E = 3.89
Esto significa que podemos asegurar con un grado de confianza del 95% que el
error que se comete al estimar a través de X es menor de 3.89 pulsaciones por
minuto.
b) Para estimar el alejamiento promedio de las pulsaciones por minuto con respecto
al incremento promedio real existen varios estimadores. Los más usuales son: la
desviación media, varianza y desviación estándar.
76
X f X2 fix2 Para determinar s se utiliza la fórmula
14 1 196 196
19 1 361 361
24 1 576 576 Σ fx 2 2
S= -X
25 1 625 625 N
27 2 729 1458
29 1 841 841 donde N = N° de datos
30 1 900 900 f = frecuencia de cada dato
32 2 1024 2048 X = media de la muestra
5252 7005
7005
∴s= − ( 25.9) 2 = 700.5 - 670.81 = 29.69 = 5.44
10
∴ s = 5.44
Esto significa que en promedio el incremento promedio del pulso cardiaco se aleja
5.44 pulsaciones por minuto de la media.
c) g. l. = n – 1 ∴ g. l. = 10 – 1 = 9
∴ g. l. = 9
µ = X ± error muestral
e) Para determinar el tamaño que deberá tener la muestra con un nivel de confianza
del 95% para tener un error máximo de 2.5 pulsaciones por minuto se utiliza la
fórmula:
σ
E = t ∝/2 ⋅ despejando n se tiene
n
t ∝ /2 • σ
n=
E
( 2.262) (5.44) 2
n= = (4.922112)2 = 24.22
2.5
77
redondeando se tiene n = 24
Esto Significa que el tamaño de la muestra debe ser 24 para cometer un error
menor de 2.5 pulsaciones por minuto al estimar a través de X .
σ
∴µ = X ± E pero E = t ∝/2 ⋅
n
σ
∴µ = X ± = t ∝/2 ⋅ intervalos de confianza para estimar µ
n
donde
∝ = nivel de confianza
5.44
∴ µ = 25.9 ± 4.032
10
21.934
µ = 25.9 ±
3.162
µ = 25.9 ± 6.936
18.96 ≤ µ ≤ 32.83
Esto significa que se puede asegurar con un 99% de confianza que la verdadera
muestra poblacional está entre 18.96 y 32.83 pulsaciones por minuto.
78
APÉNDICES
APÉNDICE A
ÁREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIÓN NORMAL EN FUNCIÓN DE ∆X/σ
79
APÉNDICE A
ÁREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIÓN NORMAL EN FUNCIÓN DE ∆X/σ
80
APÉNDICE A
ÁREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIÓN NORMAL EN FUNCIÓN DE ∆X/σ
81
APÉNDICE A
ÁREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIÓN NORMAL EN FUNCIÓN DE ∆X/σ
82
APÉNDICE A
ÁREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIÓN NORMAL EN FUNCIÓN DE ∆X/σ
83
APÉNDICE A
ÁREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIÓN NORMAL EN FUNCIÓN DE ∆X/σ
2.69
84
APÉNDICE A
ÁREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIÓN NORMAL EN FUNCIÓN DE ∆X/σ
85
APÉNDICE A
ÁREAS Y ORDENADAS DE LA CURVA
DE DISTRIBUCIÓN NORMAL EN FUNCIÓN DE ∆X/σ
86
APÉNDICE B
∝
t2
87
NÚMEROS ALEATORIOS
APÉNDICE C
88
NÚMEROS ALEATORIOS
89
APÉNDICE C
NÚMEROS ALEATORIOS
90
APÉNDICE C
NÚMEROS ALEATORIOS
91
BIBLIOGRAFÍA CONSULTADA
92