Parámetro Estadístico
=media poblacional x =media muestral
=Desviación poblacional s =desviación muestral
2 =Varianza poblacional s 2 =varianza muestral
x
p (Proporción muestral) Cota de error de la proporción:
n
Pq Pq
E P E n 2
2 n
2
E2
Problemas:
¿Qué porcentaje de autos compactos recorre 30 millas por galón o más? P=?
xM 30 25.5
Z Z 1
4.5
0.5 0.5
68% 30
M 25.5 Z 1
0.341 0.341
3 3
Z 1 Z 1
Área de Z: A(Z ) A(1) 0.5 0.3413 0.158
3
2. Se toma como muestra aleatoria de n=36 de una distribución de con una M=75 y
con una =12.
USO DE LA t DE STUDENT
n 30 Z
x
(x ) 2
N
n
n 30 t
x
s
(x ) 2
x N n
Z np npq 2 npq
N 1
x
n
pP N n
Z
pq N 1
p
n
4
Problemas:
? ?
np 100(0.3) 30 (400)(0.1) 40
Sugerencia
Problemas:
promedio de las 6 CPU es menor de 50 min. Al mes. ¿Dado cualquier mes cual es la
probabilidad se sienta satisfecho con la red de servicio?
x 50 41
Z 2.755 area 0.497 0.5 0.997 99 .7%
8
n 6
Datos:
3. Utilizar las tablas de áreas bajo la curva normal entre los valores dados:
a) Z 0.3 y Z 1.56
=0.1179 =0.4406----------0.4406-0.1179=0.3227= 32.27%
b) Z 1.3 y Z 1.74
=0.4032 =0.4591-----------0.4032+0.4591=0.8623=86.23%
Numero de motores
2905 2895
2725 3005
2835 2835
3065 2605
Datos:
n 8 0.05 0.025 3000 gl n 1 7
2
x 2859 3000
t 2.7172
s 146 .76
n 8
0.05
t 1.9
t 2.7172
7
5. Los costos variables, principalmente de la mano de obra, hacen que los precios de la
construcción varíen de una con respecto a otra.
Un constructor necesita tener una ganancia media arriba de 8500 DLL para alcanzar
una ganancia mensual establecida como meta. Las ganancias por cada una de las 5
construcciones más recientes del constructor, son de 8760 DLL, 6370 DLL, 9620 DLL,
8200DLL y 10350DLL, respectivamente.
¿Proporcionan los datos evidencia que indique que el constructor estaba trabajando al
nivel de ganancia deseado con un nivel de significancia de 0.05 ?
Datos:
x 8660 8500
t 0.2353
s 1520 .148
n 5
0.95
El nivel de significancia
t 0.2353
Z
x1 x 2
x x
1 2
1 2
2
S1
2
S2
2
2
n1 n2 n1 n2
(n1 1) s (n2 1) s
2 2 ( xi x1 ) 2 ( xi x 2 ) 2
1 2
i 1 i 1
n1 n2 2 n1 n2 2
n n
( xi x1 ) 2 ( xi x 2 ) 2
1 i 1
2 i 1
n1 1 n2 1
Problemas:
Observe los datos y por intuición diga si los datos proporcionan Suficiente
evidencia para que M 1 M 2 y realice la prueba utilizando un nivel de
significación de 0.10 y sacar conclusiones:
Condición: 1 2
Z
x x
1 2
11 .6 9.7 2.087
0.90
2
S1 S 22 27 .9 38 .4
n1 n2 80 80
z 1.29
z 2.08
p1 p 2 x1 x2 x1 x2 p1 p 2
Z p1 p2 P Z
p1 q1 p2 q2 n1 n2 n1 n2 1 1
p q
n1 n2 n1 n2
Problemas:
Datos:
n1 1284 n2 1002
x1 48 x2 48
x1 48 x2 34
p1 0.037 p2 0.034 q 1 p 0.965
n1 1284 n2 1002
x1 x2 48 34
P 0.035
n1 n2 1284 1002
0.90
0.037 0.034
Z 0.387
1 1
(0.035)(0.965)
1284 1002 Z 1.29
La significancia aumento, por lo tanto los datos no son suficientes para indicar que la
proporción de cuentas excede al % correspondiente al año anterior.
10
Datos:
x1 21 x2 14
p1 0.0525 p2 0.035
Z 1.65
x1 x2 21 14
P 0.04375 q 0.95625 Z 1.2
n1 n2 400 400
0.0525 0.035
Z 1.2
(0.0525 )( 0.9475 ) (0.035 )( 0.965 )
400 400
Problemas:
26
p 0.13
200
1 Z 1.29
p1 0.10
10
p p 0.13 0.10 Z 1.4142
Z 1.4121
pq (0.10)(0.10)
n 200
Conclusión:
Significancia disminuyo:
Hay suficiente evidencia.
n1 10 gl n 1 9 2 10
(10 1)(95)
c2 17.55
100
Problemas:
s12
Formulas: Fc s 2 s 22 (numerador) s 22 s12
2 (razón de varianzas) (numerador) 1
s2
v1 gl n1 1 gl 25
1.70 (Teórica)
v2 gl n2 1 gl 24
1.04
Fc 2.03
0.05
UNIDAD 2: INTERVALOS
FORMULAS A UTILIZAR:
S S
x Z x Z x Z x Z
2
n 2
n 2
n 2
n
S S
x t x t
2
n 2
n
pq pq pq pq
p Z P p Z p t P p t
2
n 2
n 2
n 2
n
12 22 12 22
x1 x 2 Z 1 2 x1 x 2 Z
2
n1 n2 2
n1 n2
S12 S22 S2 S2
x1 x 2 t 1 2 x1 x 2 t 1 2 Varianza diferente
2
n1 n2 2
n1 n2
1 1 1 1
x1 x 2 t Sp 1 2 x1 x 2 t Sp Varianza igual
2 n1 n2 2 n1 n2
p q p q2 p1 q1 p 2 q 2
p1 p 2 t Sp 1 1 2 P1 P2 p1 p 2 t Sp
2 n1 n2 2 n1 n2
n 1S 2 2
n 1S 2 Para la varianza
X 2h sup erior X 21h inf erior
n 1S 2
n 1S 2 Para la desviación
X 2h X 21hi
14
Pq
E Z E Z
2
n 2
n
Z 2
2
n 2
E2
Z 2h Pq
n
E2
1. Encuentre un intervalo de confianza (1 ) 100% para una media poblacional en los
siguientes casos:
x Z x Z
2
n 2
n
3.46 3.46
34 (2.58 ) 34 (2.58 ) 32 .55 35 .44
38 38
b) 0.10 n 65 x 1049 s 2 51
7.1414 7.1414
1049 (1.65 ) 1049 (1.65 ) 1047 .49 1050 .5
61 61
15
c) 0.05 n 89 x 63 .3 s 2 2.48
1.548 1.548
63 .3 (1.96 ) 63 .3 (1.96 ) 62 .97 63 .627
89 89
2. Una muestra aleatoria de n=6 observaciones de una población normal generó los
siguientes datos: 3.7, 6.4, 8.1, 8.8, 4.9, 5.0
S S
x t x t
2
n 2
n
1.98 1.98
6.15 (2.02 ) 6.15 (2.02 ) 0.90
6 6
4.5 7.78
t 2.02 t 2.02
2 2
3. Se encuentra que la concentración promedio de Zinc que se saca del agua a partir de
una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6g/ml, encuentre los
intervalos de confianza de 95% y 99% para la concentración media de zinc en el sitio.
Su póngase que 0.3
a. 0.3
b. ¿Qué tan grande se requiere una muestra si queremos tener 95% de confianza
de que nuestra estimación de difiera al menos de 0.05
Datos:
x Z x Z
2
n 2
n
0.95
Al 95% con área de 0.475 z 1.96
2
z 1.96 z 1.96
2 2
0.3 0.3
2.6 (1.96 ) 2.6 (1.96 ) 2.50 2.69
36 36
16
Al 99% z 2.58
2
0.3 0.098
Calcular: E Z 1.96 0.098 0.5
2 n 36 pero al ser intervalo-- 2
Z
2
1.96 (0.3) 2
De: E Z n 2 36
2 n despejar E 0.098
Método 1
103 94 110 87 98
Método 2
97 82 123 92 175 88 118
Calcule un intervalo de confianza del 90% para la diferencia entre los tiempos de proporción
de duración promedio de los 2 métodos.
Metodo 1 Metodo 2
n1 5 n2 7
gl 7 5 12
x 98.4 x 110.7
gl 12 2 10
S1 8.73 S 2 32.18
76.21 103.5
2 2
S 1 21
17
S12 S 22 S12 S 22
x1 x 2 t 1 2 x 1 x 2 t
2
n1 n2 2
n1 n2
98 .4 110 .7 1.81 76 .21 1035 .55 1 2 98 .4 110 .7 1.81 76 .21 1035 .55
5 7 5 7
x 12.25 x 9 .5
S 1
2.36 S 2
1.29
5 .5 1.66
2 2
S 2 S 2
S12 S22 S2 S2
x1 x 2 t 1 2 x1 x 2 t 1 2
2
n1 n2 2
n1 n2
1. En una muestra aleatoria de 500 familias que se tienen televisiones en una ciudad
“x” se encuentran que 340 están suscritas en mega cable, se encuentra un intervalo de
confianza de 99% para la proporción real en familias que están suscritas a mega cable.
n 500
x 300
x 340
p 0.68
n 500
99%
pZ
pq
p 0.68 2.58
0.680.32
2 n 500
0.626 p 0.7338
¿Qué tan grande se sugiere que sea una muestra si queremos tener un 99% de confianza de
que muestra estimación “P” este entre 0.02?
E Z
2
pq
2.58 0.68 0.32 0.05 E
0.05
0.2
n 500 2
p 0.73 p 0.67
n 0.73
1 n 1
850
x 620.5
1 x 1
569.5
19
p q p q2 p1 q1 p 2 q 2
p1 p 2 t Sp 1 1 2 P1 P2 p1 p 2 t Sp
2 n1 n2 2 n1 n2
0.016 p1 p2 0.104
n 1
10
n 8
2
90%
v n 1 10 1 9
1
2
1.04
v n 1 8 1 7
2 2
S 1
0.51
2
S 0.05
2
S12 1 12 S12
fV V 0.95
S 22 f V1V2 22 S 22 1 2
1.04 1 1 1.04
2
2 3.29 0.5541
0.51 3.68 2 0.51
6.70
20
n 10 gl 9 s 2 195 0.05
Al 95% X 19
2
2
0.99
n 1S 2
2
n 1S 2
X 2 2 19
2
X h sup erior X 21h inf erior
X 2 (1 2) 2.7
10 1195 2 10 1195 92.3 2 650
19 2.7
21
No existe
No hay riesgo
No hay verificación
0.95
I (B)
Región
Si hay evidencia
aceptada
Si hay significación
-1.96 ≠ +1.96
Si hay riesgo
(-) Región de rechazo (+)
1ra 2do
0.95 0.95
I (∞) ∞=0.05
0.5000 0.4500 0.4500 0.5000
1.65 -1.65
(+) I (-)
Una hipótesis estadística: es una aseveración o conjetura con respecto a una o más
poblaciones.
22
Debe quedar claro que el diseño de un procedimiento que decisión se debe hacer con
la idea en mente de la probabilidad de una conclusión errónea.
Hipótesis Nula: Esta se refiere a cualquier hipótesis que deseamos probar y se denota
(Ho). El rechazo de la hipótesis nula conduce a la aceptación de una hipótesis
alternativa, que se denota (HA). Una hipótesis nula con respecto a un parámetro
poblacional siempre se establecerá de modo que especifique un valor exacto del
parámetro mientras que la hipótesis alternativa permite la probabilidad de varios
valores.
Estadístico de prueba.
X M X M
ParaƵ Ƶc= Ƶ= =
O S
Para=t t=
n n
Ƶc>Ƶ∞/2 Ƶc>Ƶ∞/2
tc>t∞/2 tc>t∞/2
tc<t∞/2 tc<t∞/2
Problemas:
1. Una empresa eléctrica fabrica focos que tienen una duración que se distribuyen de
forma aproximadamente con una media de 800 hrs, 0=40 hrs. Pruebe la hipótesis de
que la Mo= 800 contra la M≠800 si una muestra aleatoria de 30 focos tiene una
duración promedio de 788 hrs. Utilice un nivel de significancia de ∞=.04
Datos
O: 40 hrs
Ho: M=800
HA: M≠800
n: 30
0.96
0.04 0.04
= =0.02 = =0.02
2 2 0.4800 0.4800 2 2
0.04
= =-0.02 2.06
2 2 2
Ƶc=-1.64 1.64
X M 788 800
Zc= = = -1.64
O 40
n 30 12
7.302967
Regla de decisión
Zc > Z
2
1.64 >2.06 NO
Zc < Z
2
-1.64<-2.06 NO
Se acepta Ho
N ≤ 30
X =10.06
S=0.24
25
0.01
∞=0.01 = = 0.005
2 2
0.99
=0.005
2
t t
-3.25 3.25
2 2
X M 10.06 10 0.06
tc= = = 0.79 =0.79
S 0.24 0.075894
n 10
4- Tc > t 0.79>3.25
2
tc> t -0.79<-3.25 SE ACEPTA : Ho
2
Datos Datos
n=12 n=10
X = 85 unidades X = 81 unidades
S=4 S=5
∞=0.05
n1=12 n2=10
X 1=85 X 2=81
26
S1=4 S2=5
RESOLVER
gl= n1+n2-2
Para sacar gl REAL
0.95 S12 S 22
2
gl=
n1 n 2
S12 S 2
2
2
n1 n2
1.04 1.72
n1 1 n 2 1
85 81 2
t= = 1.04
1 1
4.478
12 10
Tc>t∞
1.04>1.725 NO Se acepto Ho
Como son las predicciones en el incremento del producto nacional bruto en estados
unidos para el próximo año hechas por ejecutivos de corporaciones y analistas del
mercado accionario. Se muestran las predicciones en porcentajes de 5 ejecutivos de
corporaciones y de 5 analistas de mercados, seleccionados aleatoriamente.
Ejecutivos de empresas
3.4 2.8 3.9 3.7 3.4
Analista de mercado
3.3 3.9 3.4 3.8 4.0
Ejecutivos Analistas
27
n1=5 n2=5
X =3.44 X =3.68
S= 0.41 0.31
HA: HA M1-M2<Do
Sp
n 1S12 n2 1S12
n1 n 2 2
Sp
5 10.1681 5 10.0961
552
∞= 0.10
Sp= 0.36
t∞= -1.40
28
X 1 X 2 Do 3.44 3.68 0
t= = = 1.05
1 1 1 1
Sp 0.36
n1 n2 5 5
tc<t∞
-1.05<-1.40 NO
Se acepta Ho ó No se rechaza
gl=8 0.20
1.40 .889
P= 0.889
B) 0.10<P<0.20
1 1 1 1
C) X 1 X 2 t Sp M1 M 2 X1 X 2 t
2 n1 n 2 2 n1 n 2
1 1 1 1
3.44-3.68-(1.86)(0.36) <M1-M2<3.44-3.68+(1.86) (0.36)
5 5 5 5
-0.66<M1-M2<0.18
Muestra 1 12 3 8 5
Muestra 2 14 7 7 9 6
Pruebe la Ho vs HA
Muestra 1
X=7 X=8.6
n=4 n=5
29
∞=0.05
4.-
∞=0.05 t1 ( X 1 X 2) 0 (7 8.6) 0 1.6
0.66
S12 S 22 (15.28) 10.24
∞=0.05
t∞=-1.90 n1 n2 4 5
5.-Regla de decisión
Tc=-0.06
∞=0.05 -tc<-t∞
-0.66<1.90 No Se Acepta Ho
-6.20<M1-M2<3
gl=7
0.10
0.05
2 2
1. Ho: P=Po
Un extremo 2 colas
Unilateral Bilateral
HA: P<Po
3.-
+ Ƶ∞ Ƶ ∞/2 Ƶ∞-
Ƶ ∞/2
ESTADISTICO DE PRUEBA
P Po
4.- Ƶ=
Poqo
n
P Po
tc=
Poqo
n
Zc > Z Zc Z
2
Tc > t Zc Z
2
Zc < -Z
31
Problemas:
Datos
n= 200
1
P= 0.10
10
26
P= 0.13
200
∞= 0.05 0.95
∞=0.05
0.5000 0.4500
1.65
REGLA DE DECISION
Zc > Z∞
Se Acepta Ho 0.92
∞= 0.08
0.5000 0.4200
Z= 1.41
32
Datos Ho : P 0.4
Ha : P 0.4
N= 1400
X= 529
529
p 0.37
1400
p 2 0 .4
0.90
0.10
0.05 0.05
-1.65 1.65
p p 0.37 0.4
Zc 2.3
p0 q0 0.40.62
n 1400
Zc Z
2 Zc 1.65 Se rechaza hipótesis nula
2.3 1.65
33
– – –
̂
√ √ ̂ ̂( )
Estadístico y parámetro 1 2
Tamaño de la muestra 140 140
No exitosos 74 81
Parámetro Binomial P1 P2
a) Supóngase que no tiene una medida preconcedida acerca de cuál de los parámetros P1
o bien P2 es el mayor, y que solamente quiere detectar una diferencia entre los dos
parámetros si existe.
n1 = 140 n2 = 140
X1 = 74 X2 = 81
– –
-1.96 1.96
Regla de decisión
Zc Z
2
0.84 1.96 Se acepto hipótesis nula
0.84 1.96
-0.84 0.84
34
Ho : 2 2
Ha : 2 2 2 2
2 2
Un extremo Dos extremos
x1
x2 1
2
x
2
2
Estadístico de prueba
c
2n 1S 2
2
Regla de decisión
Región de Rechazo
o bien o bien
Cuando la
Donde y son los
2
HA: < donde y
valores de la cola superior e
son los valores de la cola inferior, respectivamente de
superior e inferior que ponen en las áreas de las
respectivamente de , que ponen
colas y los gl=(n-1).
en las áreas de las colas.
35
Problemas:
Gl= n-1
Ho : 2 15 = 36.41
Gl = 25 – 1= 24
Ha : 2 15
c
2 n 1S 2 25 121.4 34.24
2
15
0.95
0.05
2 2
34 .24 36 .41 NO
36
La hipótesis más sencilla acerca de las probabilidades multinomiales de las celdas es la que
especifica los valores numéricos para cada una de ellas.
Ho:P1=0.2
Ho:P2=0.4
Ho:P3=0.1
Ho:P4=0.3
Teorema
Una prueba de bondad de ajuste entre las frecuencias observadas y esperadas se basa
en la cantidad de las 5 frecuencias observadas menos las observadas al cuadrado.
∑ ∑
Ejemplo: supóngase que los clientes pueden escoger entre 3 marcas de leche en un
supermercado. En un estudio para determinar si hay preferencia para una marca, se
registran los resultados de una muestra de n=300 compras de leche. Se muestran los
datos en la tabla siguiente:
¿Con los datos hay evidencia suficiente que indique preferencia por una a más marcas?
Ho:P1= P2 = P3
HA:P1≠ P2
FE=np = ( )
0.95
µ=np
P= 0.05
5.99
Se acepta Ho
Es esta suficiente evidencia para indicar que la distribución de los ingresos por familia de la
ciudad difieren e la distribución nacional. α=0.05
Se rechaza Ho
Si existe suficiente evidencia a α=0.05 que los ingresos difieren de los de la ciudad.
A= 0.5
12.6
Análisis de
Donde
[ ̂ ]
Estadistica de prueba ∑ ∑ ̂
∑∑
̂
Donde: ̂
nij= Es la frecuencia para la celda del renglón
i y columnas j.
Ri= Total para renglón i.
Cj: Total para columna j.
N= Total de todas las observaciones.
Áreas
¿Proporciona los datos evidencia suficiente para indicar que existe una diferencia
entre las áreas en las fracciones de constructores de casas que prefieren alfombras?
α=0.05.
HO: Pij=PiPj [ ̂ ]
HA: Pij≠PiPj ∑∑
̂ ̂
GL:(r-1)(c-1)
Gl=2
0.025
7.38
Estadístico de Prueba:
Ejercicio: Suponga que se desee determinar si existe diferencia entre tres diferentes
mercados de productos respecto de sus actitudes acerca de una manera particular de
la publicidad de los productos. Supongamos que tuviéramos que muestrear
aleatoriamente a 600 personas como se muestra en la tabla siguiente.
Opinión: FO FE FO FE FO FE Total
Ofrece los datos de la tabla evidencia suficiente para indicar que las proporciones de
las respuestas en las categorías “a favor”, “en contra” y “sin opinión”, ¿difieren entre
los tres mercados de productos? α=0.05.
Ho:Pij=PiPj
HA:Pij≠PiPj
α=0.05
Regla de decisión.
16.8
Se rechaza Ho.
*Hay suficiente evidencia para indicar que las respuestas de los consumidores difieren en los 3
mercados a un α=0.05
42
Estadística No paramétrica.
Por fortuna, los estadísticos recientemente han desarrollado técnicas útiles que no
hacen suposiciones restrictivas respecto a la forma de las distribuciones de las
poblaciones. Estas se conocen como pruebas sin distribución o más comúnmente,
pruebas no paramétricas.
1.- La prueba de signos: para datos apareados, en la que los signos positivos o
negativos se sustituyen por valores cuantitativos.
3.- Otra prueba de suma de rangos es la prueba de Kruskal Wallis que generaliza el
análisis de varianza discutido en temas anteriores, para permitirnos prescindir de
la suposición de que las poblaciones están normalmente distribuidas.
6.- Otro método para la bondad de ajuste entre una muestra observada y una
distribución de probabilidad teórica (Kolmogorov-Smirnov).
Los métodos no paramétricos tienen un número de ventajas claras sobre los métodos
paramétricos:
1.- no requieren que hagamos la suposición de que una población está distribuida de
forma de curva normal u otra forma específica.
1.- Ignoran una cierta cantidad de información. Ej. Conversión de valores paramétricos
a rangos no paramétricos.
2.- a menudo no son tan eficientes o “agudos” como las pruebas paramétricas. La
estimación de un intervalo de confianza al 95%usando una prueba no paramétrica
puede ser el doble del tamaño de la estimación al utilizar una prueba paramétrica vista
anteriormente. Cuando usamos pruebas no paramétricas, efectuamos un trueque.
Perdemos agudeza al estimar intervalos, pero ganamos la habilidad de usar menos
información y calcular más rápidamente.
PRUEBA DE SIGNOS
44
Use la prueba de signos para ver si hay una diferencia entre el número de días requeridos para
saldar una cuenta por cobrar antes y después de una nueva política de cobro. α= 0.05.
Antes 33 36 41 32 39 47 34 29 32 34 40 42 33 36 29
Después 35 29 38 34 37 47 36 32 30 34 41 38 37 35 28
- + + - + 0 - - + 0 - + - + +
Límites:
*Se acepta HO
Nota: las pruebas no paramétricas son muy convenientes cuando el mundo real presenta
datos sin distribución a partir de los cuales se deben tomar una decisión. Pero observe la
prueba de signos es solo otra aplicación de la familiar aproximación normal a la binomial,
usando un signo positivo y un signo negativo, en vez de éxito o fracaso.
.95
Ejemplo: Los siguientes datos muestran las índices de trabajos defectuosos de los
empleados antes y después de un cambio de en el plan de un incentivo de sueldos.
45
Compare los siguientes dos conjunto de datos para ver si el cambio disminuyó las
unidades defectuosas producidas. . α=0.10.
Antes 8 7 6 9 7 10 8 6 5 8 10 8
Después 6 5 8 6 9 8 10 7 5 6 9 5
+ + - + - + - - 0 + + +
Número de signos -: 4 P=
Tamaño total 12
Límites:
-1.65 1.65
Las pruebas de suma de rangos son una familia completa de pruebas. Solo nos
concentraremos en dos miembros de estas familias, la prueba de U. Mann Whitney y la
prueba de Kruskal Wallis. Usaremos la prueba de U. Mann Whitney cuando solo estén
involucradas dos poblaciones y la prueba de Kruskal Wallis cuando se trate de más de
dos poblaciones.
El uso de estas pruebas nos permitirá determinar si las muestras independientes han
sido extraídas de la misma población (o de distintas poblaciones con la misma
distribución).
Media de la Estadística
Ho: µ1= µ2
HA: µ1≠µ2
Límites
Ejercicio: Supongamos que la junta de regentes de una institución estatal desea probar la
hipótesis de que las calificaciones medias en dos planteles de la universidad son iguales. La
47
junta mantiene estadísticas de todos los estudiantes en todos los planteles del sistema. Una
muestra aleatoria de 15 estudiantes de cada plantel ha producido los datos que se muestran a
continuación:
1 500 B 17 1050 A
2 550 B 18 1100 A
3 600 A 19 1120 B
4 650 B 20 1140 B
5 725 B 21 1150 A
6 750 A 22 1200 A
7 775 A 23 1240 B
8 800 A 24 1250 A
9 830 B 25 1300 A
10 850 A 26 1360 B
11 890 B 27 1400 A
12 900 B 28 1500 A
13 920 B 29 1550 B
14 925 B 30 1600 B
15 950 A
Plantel A: ∑
48
Plantel B: ∑
Límites:
112.5+1.44(24.10)=147.2
112.5-1.44(24.10)=77.8
Kruskal Wallis
Formulación de la Hipótesis
H0 : μ1 = μ2 = μ3
HA : μ1, μ2, μ3
Sugerencia: A menudo ocurren empates al clasificar los datos para realizar una prueba de U.
Mann Whitney o una prueba de Kruskal Wallis. Siempre que se encuentre tales empates
recuerde que cada valor empatado obtiene un rango promedio, por lo tanto, si los elementos
49
octavo y noveno etan empatados cada uno obtienen un rango de 8.5 y si esto sucede con el
cuarto, quinto y sexto, cada uno obtiene un rango de 5.
Video casete 74, 88, 82, 93, 55, 70. R1=61 n1=6
Audio casete 78, 80, 65, 57, 89. R2=42 n2=5
Salón 68, 83, 50, 91, 84, 77, 94, 81, 92 R3=107 n3=9
H0 : μ1 = μ2 = μ3
HA : μ1, μ2, μ3 ( )
α = 0.10
N=20
Se acepta La Ho.
*no hay diferencia en el resultado de las 3 pruebas en sus medias.
Pruebe la hipótesis de no diferencia entre las edades de los empleados dentro de una
empresa, masculinos y femeninos, utilizando la prueba de U. Mann Whitney para los datos de
la muestra se utiliza α=0.10.
Hombres 31, 25, 38, 33, 42, 40, 44, 26, 43, 35.
mujeres 44, 30, 34, 47, 35, 32, 35, 47, 48, 34.
Rango Edad H0 : μ1 = μ2
1 25 H HA : μ1 μ2
2 26 H
3 30 M
4 31 H
5 32 M
6 33 H
7.5 34 M
7.5 34 M
10 35 H
10 35 M √
10 35 M
12 38 H Limites:
13 40 H Límite superior: 50+(1.65)(13.22)=71.8
14 42 H Límite inferior: 50-(1.65)(13.22)=28.22
15 43 H
16.5 44 H
16.5 44 M
18.5 47 M 0.90
18.5 47 M
20 48 M 0.05
R1=93.5
R2=116.5
-1.73 50 1.73
Ejercicio: Una compañía de artículos que atiende sus pedidos por internet tiene los
siguientes datos de muestras de ventas en dólares, separados de acuerdo con la forma
51
Pedidos con tarjeta de crédito 78, 64, 75, 45, 82, 69, 60 n1=7
Pedidos con cheque. 110, 70, 58, 51, 61, 68 n2=6
Pedidos en efectivo 90, 68, 70, 54, 74, 65, 59 n3=7
rango Cantidad H0 : n1 = n2 = n3
1 45 T HA : n1, n2, n3
2 51 C
3 53 C
4 54 E ∑
5 59 E
6 60 T
7 61 C ( )
8 64 T k-1
9 65 E gL:3-1=2
10 68 E
11 68 C
12 69 T
13 70 E
14 70 C
15 74 E
16 75 T 0.05 *Se rechaza
17 78 T HA.
18 82 T *Se Acepta Ho.
19 90 E 5.99
0.3415
20 110 C
RT=78
RE=76
RC=56
Media de La estadística r.
ABAAABBABBAABABAABBBBABB
AAABABAABBABBAAABBAABAAA
N1= 26(A)
N2= 22(b)
Número de corridas:27 [ ]
√
0.95
Se acepta Ho.
Ejercicio: Una secuencia de productos o artículos de vidrio fue inspeccionada para detectar
daños ocasionados en el envío. La secuencia de estos artículos aceptables y dañados fue la
siguiente:
DAAADDDDDAADDAAAADAADDDDD
N1= 11
N2= 14
Número de corridas:9 [ ]
√
54
0.95
0.025 0.025
Se acepta Ho.
CORRELACIÓN DE RANGOS
Esta es una medida de la correlación que existe entre los dos conjuntos de rangos, una
medida del grado de asociación entre las variables que no podríamos calcular de otra
manera.
Una ventaja del uso de la correlación de rangos es la razón para aprender el método
de la correlación de rango es la posibilidad de simplificar el proceso de cálculo de un
coeficiente de correlación a partir de un conjunto de datos muy grande para cada una
de las dos variables.
Spearman.
∑
Coeficiente de correlación de rangos:
Nota: Si el coeficiente de correlación de rangos es igual a 1 muestra que existe una asociación
perfecta o correlación perfecta entre las 2 variables. Y si tenemos un coeficiente de relación de
-1 representa una correlación inversa perfecta.
Ejercicio:
A 4 5 -1 1
B 7 4 3 9
C 9 7 2 4
D 1 3 -2 4
E 2 1 1 1
F 10 11 -1 1
G 3 2 1 1
H 5 10 -5 25
I 6 8 -2 4
J 8 6 2 4
K 11 9 2 4
∑
=
La distribución apropiada de .
Si el tamaño de la muestra es mayor de 30, ya no podemos utilizar la tabla 7 del apéndice. Sin
embargo, cuando , la distribución de muestreo de rs es aproximadamente normal, con
una μ de 0 y una por lo tanto para calcular el error estándar del coeficiente de
√
correlación de rangos:
Error rs=
√
Sugerencia: La correlación de rango es útil cuando los datos están distribuidos anormalmente.
57
Cantidad de horas
5.0 8.0 2.0 4.0 3.0 7.0 1.0 6.0
Años de empleo
1.0 6.0 4.5 2.0 7.0 8.0 4.5 3.0
668 .5
Rs 1 0.815
864 1
La prueba por consiguiente otra medida de ajuste de una distribución teórica como lo es la
prueba de CHI- CUADRADA. Sin embargo, la prueba de K-S tiene varias ventajas sobre la
prueba de chi- cuadrada es una prueba mas poderosa y mas fácil de utilizar, pues que no
quiere que los datos se agrupan de alguna manera.
Una ventaja especial de la estadística K-S Dn es particularmente útil para juzgar que tan cerca
esta la distribución de frecuencia observada de la distribución de frecuencia esperada, por que
la distribución de probabilidad “Dn” depende del tamaño de muestra “n” pero es
independiente de la distribución de frecuencia esperada (Dn es una estadística de distribución
libre)
Ejemplo: La central telefónica de “x” estado ha estado llevando un registro del número
de transmisores, usados en un instante dado. Las observaciones se hicieron en 3754
ocasiones distintas. Para propósitos de planeación de inversión de capital, el
funcionario de presupuestos de esta compañía piensa que el patrón de uso sigue una
distribución de poisson con una media de 8.5. Si desea aprobar esta hipótesis con un
nivel de significancia de 0.01 pueden emplear la prueba K-S
8.5
Ho: Una distribución de poisson, es una buena descripción del patrón de uso.
P O
8.50 e 8,5 2
Fo Fe 2
0! Fe
x
e x M xeM
Px
x! x!
59
Calcular el valor de una prueba de K-S siempre debe ser una prueba de un extremo. Los valores
críticos para “Dn” serán tabulados y pueden encontrarse en la tabla 8 de la pendiente que dice
valores críticos de “D” para la prueba de bondad de ajuste de K-S.
1.63 1.63
Formula 0.026
n 3754
60
Nuestra conclusión: El siguiente paso es comparar el valor calculado de “Dn” con el valor
crítico de “Dn” que se encuentra en la tabla. Si el valor de la tabla para el nivel de significancia
elegido es mayor que el valor calculado de “Dn” entonces aceptamos la hipótesis nula
Al nivel de significancia de 0.05 ¿Podemos concluir que los siguientes datos provienen de una
distribución de poisson con 3
Ejercicio: En una empresa se tiene un registro del sexo de las personas que llamaban a la
oficina de circulación para quejarse de los problemas de entrega en el boletín de dicha
información de la empresa y si estos datos fueran los siguientes:
M,FFF,MM,F,M,FFFF,MMM,F,M,F,M,FFFF,MMMMM
Con un nivel de significancia de 0.05, pruebe esta secuencia para aleatoriedad. ¿Hay algo
respecto a la naturaleza de este problema que lo indujera a creer que una secuencia
semejante no fuera aleatoria?
N1 =14 2n1 n2
r 1
N2= 14 n1 n 2
Corridas = 13
61
21414
r 1 15
14 14
2141421414 14 14
r 2.59
14 142 14 14 1
Ejercicio: Una gran empresa en el área de Ingeniería Industrial contrata a la mayoría de sus
empleados de 2 importantes instituciones. Durante el año pasado, han estado haciendo un
examen a los empleados recién graduados que entran a la empresa para determinar que
escuela, si a caso, parece preparar mejor a sus empleados basándose en las siguientes
calificaciones (de 100 puntos posibles) ayude a la oficina del personal del hospital a determinar
si las escuelas difieren en calidad. Use la prueba de Mann Whitney, con un nivel de
significancia de 0.6 %
Calificaciones de Exámenes
Escuela A Escuela B
97 2.5 88 1
69 5 99 2.5
73 6 65 4
84 8 69 8
76 8 97 10
92 11.5 84 11.5
90 13.5 85 13.5
88 16.5 89 15
84 20 91 16.5
87 21 90 18.5
93 22.5 87 18.5
91 22.5
72 24.5
62
134.5 165.5
U R 2 n1 n2
n1 1 R
2
U R1 1113
1111 1 134.5 74.5
2
U R2 1113
1111 1 165.5 43.5
2
n1 n 2 n1 n 2 1
u
12
u
1113 11 13 1 17 .26 1113 71.5
MU
12 2
Limites
0.3
38.87 104.12