Anda di halaman 1dari 35

UNIDAD IV

PREUBAS CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA


Como ya se ha visto varias veces, los resultados obtenidos de muestras no
siempre concuerdan exactamente con los resultados tericos esperados, segn
las reglas de probabilidad. Por ejemplo, aunque consideraciones tericas
conduzcan a esperar 50 caras y 50 cruces cuando se lanza 100 veces una
moneda bien hecha, es raro que se obtengan exactamente estos resultados.
Supngase que en una determinada muestra se observan una serie de posibles
sucesos E1, E2, E3, . . . , EK , que ocurren con frecuencias o1 , o2, o3, . . .,
oK, llamadas frecuencias observadas y que, segn las reglas de probabilidad,
se espera que ocurran con frecuencias e1, e2, e3 , . . . ,e K llamadas
frecuencias tericas o esperadas.
A menudo se desea saber si las frecuencias observadas difieren
significativamente de las frecuencias esperadas. Para el caso en que solamente
son posibles dos sucesos E1 y E2 como, por ejemplo, caras o cruces,
defectuoso, etc., el problema queda resuelto satisfactoriamente con los mtodos
de las unidades anteriores. En esta unidad se considera el problema general.
Definicin de X 2
Una medida de la discrepancia existente entre las frecuencias observadas y
esperadas es suministrada por el estadstico X 2, dado por:
2
2
2
K o
ej
o1 e 1
ok eK
2
o2 e2
j
X
...
e1
ej
e2
eK
j 1
donde si el total de frecuencias es N,
oj

ej

Si X2 = 0, las frecuencias observadas y esperadas concuerdan exactamente,


mientras que si X2>0, no coinciden exactamente. A valores mayores de X2,
mayores son las discrepancias entre las frecuencias observadas y esperadas.
Si las frecuencias esperadas son al menos iguales a 5, la aproximacin mejora
para valores superiores.
El nmero de grados de libertad

est dado por:


=k1m

en donde:
K = nmero de clasificaciones en el problema.
m = nmero de parmetros estimados a partir de los datos muestrales para
obtener los valores esperados.
Ensayo de Hiptesis

En la prctica, las frecuencias esperadas se calculan de acuerdo con la


hiptesis Ho. Si bajo esta hiptesis el valor calculado de X 2 dado es mayor que
algn valor crtico, se deduce que las frecuencias observadas difieren
significativamente de las esperadas y se rechaza Ho al nivel de significacin
correspondiente. En caso contrario, no se rechazar. Este procedimiento se
llama ensayo o prueba de chi-cuadrado de la hiptesis.
Debe advertirse que en aquellas circunstancias en que X2 est muy prxima a
cero debe mirarse con cierto recelo, puesto que es raro que las frecuencias
observadas concuerden demasiado bien con las esperadas. Para examinar tales
situaciones, se puede determinar si el valor calculado de X 2 es menor que las
X2 crticas o de tabla (ensayo unilateral izquierdo), en cuyos casos se decide que
la concordancia es bastante buena.
Ejemplos:
1. La siguiente tabla muestra las frecuencias observadas al lanzar un dado
120
veces. Ensayar la hiptesis de que el dado est bien hecho al nivel de
significacin del 0.05.
Cara
Frecuencia Observada

1
25

2
17

3
15

4
23

5
24

6
16

Solucin:
Ensayo de Hiptesis:
Ho; Las frecuencias observadas y esperadas son significativamente
iguales
(dado bien hecho)
H1; Las frecuencias observadas y esperadas son diferentes (dado
cargado).
Primero se procede a calcular los valores esperados. Como es bien sabido por
todos la probabilidad de que caiga cualquier nmero en un dado no cargado es
de 1/6. Como la suma de los valores observados es de 120, se multiplica este
valor por 1/6 dando un resultado de 20 para cada clasificacin.
Cara
Frecuencia Observada
Frecuencia esperada

1
25
20

2
17
20

3
15
20

4
23
20

5
24
20

6
16
20

Total
120

Grados de libertad = k-1-m = 6-1-0 = 5


No se tuvo que calcular ningn parmetro para obtener las frecuencias
esperadas.
Ho

H1
Regin de
rechazo

Regla de decisin:

Regin de
aceptacin
2

Si X

11.1 no se rechaza H .

Si X 2R >11.1 se rechaza Ho .
Clculos:
X

K
j 1

e
ej

2
j

25

20
20

17

20
20

15

20
20

23

20
20

24

20
20

16

20
20

Justificacin y decisin:
Como 5 es menor a 11.1 no se rechaza Ho y se concluye con una significacin
de 0.05 que el dado est bien hecho.
2. En los experimentos de Mendel con guisantes, observ 315 lisos y amarillos,
108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes. De
acuerdo con su teora, estos nmeros deberan presentarse en la proporcin
9:3:3:1. Hay alguna evidencia que permita dudar de su teora al nivel de
significacin del 0.01?
Solucin:
Ensayo de Hiptesis:
Ho; La teora de Mendel es acertada.
H1; La teora de Mendel no es correcta.
El nmero total de guisantes es 315+108+101+32=556. Puesto que los nmeros
esperados estn el la proporcin 9:3:3:1 (9+3+3+1=16), se esperara:
9 556 312.75 lisos y amarillos
16
3 556 104.25 lisos y verdes
16
3 556 104.25 rugosos y amarillos
16
1
556
16

34.75 rugosos y verdes

Grados de libertad = k-1-m = 4-1-0 = 3


No se tuvo que calcular ningn parmetro para obtener las frecuencias
esperadas.
Ho

H1
Regin de
rechazo
Regin de
aceptacin
2

Regla de decisin:
2
Si X
11.3 no se rechaza H .

Si X 2R >11.3 se rechaza Ho .
Clculos:
K
X

oj

2
j 1

ej
ej

315 312.75
312.75

108 104.25
104.25

101 104.25
104.25

32

34.75
34.75

0.470

Justificacin y decisin:
Como 0.470 es menor que 11.3 no se rechaza Ho y se concluye con un nivel de
significacin de 0.01 que la teora de Mendel es correcta.
Como el valor de 0.470 est cercano a cero, se procede a hacer un ensayo
unilateral izquierdo:
Ensayo de Hiptesis:
Ho; La teora de Mendel es acertada.
H1; La teora de Mendel es muy acertada.
Ho

H1
Regin de
rechazo
Regin de
aceptacin

a=0.01
2

Regla de decisin:
2
Si X R 0.115 no se rechaza Ho .
2
Si X R < 0.115 se rechaza Ho.
Como el valor de 0.470 no es menor a 0.115 se concluye que el experimento o
la teora de Mendel solo es buena.
3. Una encuesta sobre 320 familias con 5 nios dio la distribucin que aparece
en la siguiente tabla. Es el resultado consistente con la hiptesis de que el
nacimiento de varn y hembra son igualmente posibles? Use = 0.05.
Nmero de nios
Nmero de nias
Nmero de familias

5
0
18

4
1
56

3
2
110

2
3
88

1
4
40

0
5
8

Solucin:
Ensayo de hiptesis:
H0; El nacimiento de nios y nias es igualmente probable.
H1; El nacimiento de nios y nias no es igualmente probable.
Este experimento tiene un comportamiento binomial, puesto que se tienen dos
posibles resultados y la probabilidad de xito se mantiene constante en todo el
experimento.

Se le llamar xito al nacimiento de un varn o nio. Por lo que la variable


aleatoria x tomar valores desde 0 hasta 5.
Como se quiere ver si es igualmente probable el nacimiento de nios y nias, la
probabilidad de xito ser de 0.5.
Utilizando la frmula de la distribucin binomial se calcularn las probabilidades,
que multiplicadas por el nmero total de familias nos darn los valores
esperados en cada clasificacin.
Recordando la frmula de la distribucin binomial:
n

Cx p x

(n x)

en donde n = 5 y x es el nmero de nios .


5
(5
(0.5)
Probabilidad de 5 nios y 0 nias = 5 C5 (0.5)
)

C 4(0.5) 4 (0.5) ( 5

C3
3
(5
( 0.5) (0.5)

3)

1
32
5
32
10

2
(5
Probabilidad de 2 nios y 3 nias = 5 C 2(0.5) (0.5)

2)

32
10

Probabilidad de 4 nios y 1 nia =

Probabilidad de 3 nios y 2 nias =

Probabilidad de 1 nio y 4 nias =

1
(5
C
5 1 (0.5) (0.5)
1)

Probabilidad de 0 nios y 5 nias = 5 C 0

(0.5) (0.5)

(5 0

32
5
32
1
32

Si cada una de estas probabilidades se multiplican por 320 se obtienen los


valores esperados:
Nmero de nios
Nmero de nias
Nmero de familias
Frecuencias esperadas

5
0
18
10

4
1
56
50

3
2
110
100

2
3
88
100

1
4
40
50

Grados de libertad: k-1-m = 6-1-0 = 5


Ho

H1
Regin de
rechazo
Regin de
aceptacin
X

Regla de decisin:
2
Si X R 11.1 no se rechaza Ho .

0
5
8
10

Total
320

Si X 2R >11.1 se rechaza Ho .
Clculos:
K
2

X2

oj

j 1

ej
ej

18 10
10

56

50
50

110 100
100

88

100
100

40

50
50

Justificacin y decisin:
Como el 12 es mayor a 11.1, se rechaza H0 y se concluye con un
nacimiento de hombres y mujeres no es igualmente probable.

8 10
10

12

= 0.05 que el

4. Una urna contiene 6 bolas rojas y 3 blancas. Se extraen al azar dos bolas de
la urna, se anota su color y se vuelven a la urna. Este proceso se repite un
total de 120 veces y los resultados obtenidos se muestran en la siguiente
tabla. Determinar al nivel de significacin del 0.05 si los resultados obtenidos
son consistentes con los esperados.

Bolas blancas
Nmero de extracciones

2
6

1
53

0
61

Solucin:
Este experimento tiene las caractersticas de una distribucin hipergeomtrica,
por lo cual se calcularn los valores esperados con el razonamiento de esta
distribucin.
Se llamara x a la variable aleatoria de inters que en este caso sern las bolas
rojas. Por lo tanto x puede tomar valores desde 0 hasta 2.
La frmula de la distribucin hipergeomtrica es:
a C x .( N a) C ( n x )
N

Cn
x

Se tiene:

a = 6 Rojas
N =9

n=2
n-x

N-a = 3 Blancas

Probabilidad de extraer 0 rojas y 2 blancas:

P( x

( 6 C0 )( 3 C2 )

0)

3
36

C2
Probabilidad de extraer 1 roja y 1 blanca:
( C )( C ) 18
P( x 1) 6 1 3 1
C
36
9 2
Probabilidad de extraer 2 rojas y 0 blancas:
( C )( C ) 15
P( x 2) 6 2 3 0
C
36
9 2
Con las probabilidades anteriores se obtendrn los valores esperados
multiplicando por 120.
9

Bolas blancas
Nmero de extracciones
Frecuencias esperadas

2
6
10

1
53
60

0
61
50

Grados de libertad: k-1-m = 3-1-0 = 2


Ho

H1
Regin de
rechazo
Regin de
aceptacin
X

Regla de decisin:
2
Si X R 5.991 no se rechaza Ho .
2
Si X R >5.991 se rechaza Ho .
Clculos:
K
X

oj

2
j 1

ej
ej

6 10
10

Justificacin y decisin:

53 2 60
60

61 2 50
50

4.832

Como el 4.83 no es mayor a 5.991, no se rechaza H0 y se concluye con


un
= 0.05 que los resultados son los mismos que los esperados.
PRUEBA CHI-CUADRADA PARA LA BONDAD DEL AJUSTE
A lo largo de este curso nos ocupamos de la prueba de hiptesis estadsticas
acerca de parmetros de una poblacin como
y P. Ahora se considera una
prueba para determinar si una poblacin tiene una distribucin terica
especfica. La prueba se basa en qu tan buen ajuste se tiene entre la
frecuencia de ocurrencia de las observaciones en una muestra observada y las
frecuencias esperadas que se obtienen a partir de la distribucin hipottica.
La formula que se utilizar para calcular el valor de chi-cuadrada es igual a la de
la seccin anterior, con el mismo concepto de grados de libertad.
Ejemplo:
1. Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se
observ el nmero de caras de cada serie. El nmero de series en los que se
presentaron 0, 1, 1, 3, 4 y 5 caras se muestra en la siguiente tabla.
Nmero de
caras
0
1
2
3
4
5

Nmero de series
(frecuencia observada)
38
144
342
287
164
25
1000

Total
Ajustar una distribucin binomial a los datos con un

= 0.05.

Solucin:
H0; Los datos se ajustan a una distribucin binomial.
H1; Los datos no se ajustan a una distribucin binomial.
Para obtener los valores esperados se tiene que utilizar la formula de la
distribucin binomial:

Cx p x

x)

, donde n en este ejercicio vale 5, p y q son

las probabilidades respectivas de cara y sello en un solo lanzamiento de la


moneda. Para calcular el valor de p, se sabe que =np en una distribucin
binomial, por lo que = 5p.
Para la distribucin de frecuencias observada, la media del nmero de caras
es:
fx
38 0
144 1
342 2
287 3
164 4
25 5 2470 2.47
m
f
1000
1000

Por lo tanto p

m
5

viene dada por p(x) =

2.47
5
5

0.494 . As pues, la distribucin binomial ajustada

C 0.494

0.506

(5 x )

Al seguir esta frmula se calcula la probabilidad de obtener caras, segn el valor


de la variable aleatoria. La probabilidad multiplicada por 1000 nos dar el valor
esperado. Se resumen los resultados en la tabla siguiente:
Nmero de caras
(x)
0
1
2
3
4
5

Frecuencia
esperada

P(x caras)
0.0332
0.1619
0.3162
0.3087
0.1507
0.0294

Frecuencia
observada

33.2
161.9
316.2
308.7
150.7
29.4

38
144
342
287
164
25

Para los grados de libertad el valor de m ser uno, ya que se tuvo que estimar la
media de la poblacin para poder obtener el valor de p y as poder calcular los
valores esperados.
Grados de libertad: k-1-m = 6-1-1 = 4
Ho

H1
Regin de
rechazo
Regin de
aceptacin
X

Regla de decisin:
2
Si X R 9.49 no se rechaza Ho .
2
Si X R >9.49 se rechaza Ho .
Clculos:
X2

K
2
j 1

oj

ej 2
ej

38 33.2
33.2

144 161.9 342 316.2


161.9
316.2

287 308.7
308.7

164 150.7
150.7

25 29.4

7.54

29.4

Justificacin y decisin:
Como el 7.54 no es mayor a 9.49, no se rechaza H0 y se concluye con un
= 0.05 que el ajuste de los datos a una distribucin binomial es bueno.
2. Se propone que el nmero de defectos en las tarjetas de circuito impreso
sigue una distribucin Poisson. Se rene una muestra aleatoria de 60 tarjetas

de circuito impreso y se observa el nmero de defectos. Los resultados


obtenidos son los siguientes:
Nmero de
defectos
0
1
2
3 ms

Frecuencia
observada
32
15
9
4

Muestran estos datos suficiente evidencia para decir que provienen de una
distribucin Poisson?. Haga la prueba de la bondad del ajuste con un = 0.05.
Solucin:
H0; La forma de la distribucin de los defectos es Poisson.
H1; La forma de la distribucin de los defectos no es Poisson.
La media de la distribucin Poisson propuesta en este ejemplo es desconocida y
debe estimarse a partir de los datos contenidos en la muestra.
32 0 15 1 9 2
4
0.75
m l
3
60
A partir de la distribucin Poisson con parmetro 0.75, pueden calcularse las
probabilidades asociadas con el valor de x. Esto es la frmula de la Poisson es:
e l lx e 0.75 0.75x
x!
x!
Con esta frmula se calculan las probabilidades, mismas que se multiplican
por 60 para obtener los valores esperados.
P( x)

Nmero de
defectos
0
1
2
3 ms

Probabilidad
0.472
0.354
0.133
0.041

Frecuencia
esperada
28.32
21.24
7.98
2.46

Frecuencia
observada
32
15
9
4

Puesto que la frecuencia esperada en la ltima celda es menor que 5, se


combinan las dos ltimas celdas.
Nmero de
defectos
0
1
2 ms

Frecuencia
esperada
28.32
21.24
10.44

Frecuencia
observada
32
15
13

Los grados de libertad seran 3-1-1=1, debido a que la media de la distribucin


Poisson fue estimada a partir de los datos.
Ho

H1
Regin de
rechazo
Regin de
aceptacin
X

Regla de decisin:
2
Si X R 3.84 no se rechaza Ho .
Si X 2R >3.84 se rechaza Ho .
Clculos:
X

K
2
j 1

2
j

32

28.32
2

ej

28.32

15

21.24
21.24

13 10.44
10.44

2.94

Justificacin y decisin:
Como el 2.94 no es mayor a 3.84, no se rechaza H0 y se concluye con un
= 0.05 que la distribucin de defectos en las tarjetas de circuito impreso es
Poisson.
3. Pruebe la hiptesis de que la distribucin de frecuencia de las duraciones de
bateras dadas en la siguiente tabla, se puede aproximar mediante una
distribucin normal con media = 3.5 y desviacin estndar =0.7. Utilice un
= 0.05.
Lmites
clase
1.45
1.95
2.45
2.95
3.45
3.95
4.45

1.95
2.45
2.95
3.45
3.95
4.45
4.95

de

Frecuencias
observadas
2
1
4
15
10
5
3

Solucin:
Se procede a elaborar el histograma, para visualizar los datos:

Frecuencia

Histograma
16
14

1.45 1.95
1.95 2.45

10
8
6

2.45 2.95
2.95 3.45
3.45 3.95

2
0

3.95 4.45
4.45 4.95

1
Lmites de clase

Como se puede observar el histograma tiene una forma que aparenta ser
normal, se probar esta hiptesis.
H0; Los datos provienen de una distribucin normal.
H1; Los datos no provienen de una distribucin normal.
En este ejercicio en particular se cuenta con la media y desviacin estndar de
la poblacin, por lo que no se tiene que estimar. En caso de que no se tuviera,
se estimaran a partir de los datos agrupados con las frmulas que se vieron en
la Unidad III del curso de probabilidad y estadstica, tomando en cuenta que
para los grados de libertad el valor de m sera 2, ya que se estimara la media y
la desviacin estndar.
Se proceder a calcular los valores de z para encontrar las probabilidades en la
x m
, se sustituye el valor de x por los lmites de
tabla. Recordando que z
s
clase comenzando con el lmite de 1.95
Lmite real
1.95
2.45
2.95
3.45
3.95
4.45

x 3.5
0.7
-2.21
-1.50
-0.79
-0.07
0.64
1.36

P(x)
P(x
P(x
P(x
P(x
P(x
P(x

1.95)
2.45)
2.95)
3.45)
3.95)
4.45)

=
=
=
=
=
=

0.01355
0.06680
0.21476
0.47210
0.26109
0.08691

La razn por la cual se comienza con el lmite de 1.95 y se termina con el


lmite de 4.45, es porque la suma de todas las probabilidades debe ser 1,
bajo la curva normal.
A continuacin se muestra la curva normal con sus respectivas
probabilidades, segn los limites reales. Las probabilidades que no se

muestran en la tabla anterior y estn en la curva se calcularon por


diferencias.
0.26681
0.23891

0.0279

0.05325
0.01355

0.25734

0.17417

0.14795
0.08691

1.95

2.45

2.95

3.45

3.95

4.45

Z -2.21

-1.50

-0.79

-0.07

0.64

1.36

m = 3.5
P(1.95
P(2.45
P(2.95
P(3.45
P(3.50
P(3.95

x
x
x
x
x
x

2.45) = 0.0668-0.013553 = 0.053254


2.95) = 0.21476-0.0668 = 0.147953
3.45) = 0.4721-0.21476 = 0.25734
3.50) = 0.50-0.4721 = 0.0279
3.95) = 0.50-0.26109= 0.23891
4.45) = 0.26109-0.086915 = 0.17417

Con estas probabilidades se calcularn los valores esperados, multiplicando


cada probabilidad por 40.
Lmites
clase
1.45
1.95
2.45
2.95
3.45
3.95
4.45

1.95
2.45
2.95
3.45
3.95
4.45
4.95

de

Frecuencias
observadas
7

Probabilidad
2
1
4
15
10
5
3

Frecuencia
esperada

0.01355
0.05325
0.14795
0.25734
0.26681
0.17417
0.08691

0.54212
2.13016
5.91812
10.29360
10.67240
6.96680
3.47660

Grados de libertad: k-1-m = 4-1-0 = 3


Ho

H1
Regin de
rechazo
Regin de
aceptacin
X

8.5905

10.4434

Regla de decisin:
2
Si X R 7.815 no se rechaza Ho .
Si X 2R >7.815 se rechaza Ho .
Clculos:
X

K
j 1

oj

ej

ej

7 8.5904
8.5904

15 10.2936
10.2936

10 10.6724
10.6724

8 10.4434
10.4434

3.06

Justificacin y decisin:
Como el 3.06 no es mayor de 7.815, no se rechaza H0 y se concluye con
un
= 0.05 que el ajuste de los datos a una distribucin normal es bueno.
TABLAS DE CONTINGENCIA
En muchas ocasiones, los n elementos de una muestra tomada de una
poblacin pueden clasificarse con dos criterios diferentes. Por tanto, es
interesante saber si los dos mtodos de clasificacin son estadsticamente
independientes. Supngase que el primer mtodo de clasificacin tiene r
niveles, y que el segundo tiene c niveles. O sea O ij la frecuencia observada para
el nivel i del primer mtodo de clasificacin y el nivel j del segndo mtodo de
clasificacin. En general, los datos aparecern como se muestra en la siguiente
tabla. Una tabla de este tipo usualmente se conoce como tabla de contingencia
r x c.
Columnas

Renglones

1
2
.
.
.
r

1
O11
O21
.
.
.
Or1

2
O12
O22
.
.
.
Or2

...
...
...
.
.
.
...

c
O1c
O2c
.
.
.
Orc

El inters recae en probar la hiptesis de que los dos mtodos de clasificacin


rengln-columna son independientes. Si se rechaza esta hiptesis, entonces se
concluye que existe alguna interaccin entre los dos criterios de clasificacin.
Los procedimientos de prueba exactos son difciles de obtener, pero puede
obtenerse un estadstico de prueba aproximado vlido para n grande.
Sea pij la probabilidad de que un elemento seleccionado al azar caiga el
la
ij-sima celda, dado que las dos clasificaciones son independientes. Entonces,

pij=ui vj, donde ui es la probabilidad de que un elemento seleccionado al azar


pertenezca al rengln de la clase i, y vj es la probabilidad de que un elemento
seleccionado pertenezca a la columna de la clase j. Ahora bien, si se supone
independencia, los estimadores de ui y vj son:
c Oij
u i 1
n j1
1 r
v j
Oij
ni1
Por lo tanto, la frecuencia esperada de la celda es:
r O
nu i
ij
1 c Oij
Eij
v j
i 1
n j1
Entonces, para n grande, el estadstico
r

O ij

i 1 j 1

E ij

Eij

tiene una distribucin aproximada ji-cuadrada con (r-1)(c-1) grados de libertad si


la hiptesis nula es verdadera. Por consiguiente, la hiptesis de independencia
debe rechazarse si el valor del estadstico de prueba X2 calculado es mayor que
X2 crtico o de tabla.
Ejemplos:
1. Una asociacin de profesores universitarios quiere determinar si la
satisfaccin en el trabajo es independiente del rango acadmico. Para ello
realiz un estudio nacional entre los acadmicos universitarios y encontr los
resultados mostrados son la tabla siguiente. Con =0.05, haga una prueba
para saber si son dependientes la satisfaccin en el trabajo y el rango.
Rango
Profes
Profesor
Instructor
Profesor
or
asociado
Satisfaccin
en el trabajo

Mucha
Regular
Poca

40
78
57

asistente
60
87
63

52
82
66

Solucin:
Ho; La satisfaccin en el trabajo y el rango son
independientes. H1; La satisfaccin en el trabajo y el rango
son dependientes.
Grados de libertad: (r-1)(c-1) = (3-1)(4-1)=(2)(3) = 6
Ho

H1
Regin de
rechazo
Regin de
aceptacin

63
88
64

Regla de decisin:
2
Si X R 12.592 no se rechaza Ho .
2
Si X R > 12.592 se rechaza Ho .
Se proceder a calcular los valores esperados de cada celda. Como los grados
de libertad son 6, esto quiere decir que necesitamos calcular nicamente 6
frecuencias esperadas, y las faltantes se encuentran por diferencia.
Se calcularn los valores esperados E 11, E12, E13, E21, E 22 y
E 23.
Como se necesitan los totales de rengln y columna se mostrarn en la
tabla:
Rango
Satisfaccin
en el trabajo

Eij

nu i
v j

1
n

Mucha
Regular
Poca
Total
O r
c

ij

i 1

j 1

11

Oij

E13

335 210
800

E22

40
78
57
175
E

56.44

215 210
800

E12

Profe
sor

Instructor

87.94

Profesor
asociado

Profesor

Total

63
88
64
215

215
335
250
800

asistente
60
52
87
82
63
66
210 47.03 200

215 175
800

53.75

E21

335 200
800

83.75

215 200
800
E23

335 175
800

73.28

Rango

Profe
sor

Instructor

Satisfaccin

asistente
60
(56.44)
87
(87.94)
63
(65.62)
210

40
(47.03)
78
(73.28)
57
(54.69)
175

Mucha
Regular
Poca
Total

Profesor
asociado

Profesor

52
(53.75)
82
(83.75)
66
(62.50)
200

63
(57.78)
88
(90.03)
64
(67.19)
215

Total
215
335
250
800

Los valores entre parntesis son los esperados, los que no se calcularon por
frmula se obtuvieron por diferencia con respecto a los totales.
X2

i 1 j 1

O ij

E ij
Eij

40

47.03

60 56 .44

47 .03

56 .44

52

53.75
53.75

...

64

67.19
67.19

2.75

Decisin y justificacin:
Como el valor de 2.75 es menor que el de tabla 12.592, por lo tanto no se
rechaza Ho y se concluye con un =0.05 que la satisfaccin en el trabajo y el
rango son independientes.
2. En un estudio de un taller, se rene un conjunto de datos para determinar si
la proporcin de defectuosos producida por los trabajadores es la misma
para el turno matutino, vespertino o nocturno. Se reunieron los siguientes
datos:
Matutino

Defectuoso
s
No defectuosos

Turno
Vespertino

Nocturno

45

55

70

905

890

870

Utilice un nivel de significancia de 0.025 para determinar si la proporcin de


defectuosos es la misma para los tres turnos.
Solucin:
Ho; La proporcin de artculos defectuosos es la misma para los tres turnos.
H1; La proporcin de artculos defectuosos no es la misma para los tres turnos.
Grados de libertad: (r-1)(c-1) = (2-1)(3-1)=(1)(2) = 2
Ho

H1
Regin de
rechazo
Regin de
aceptacin
2

Regla de decisin:
2
Si X R 7.378 no se rechaza Ho .
2
Si X R > 7.378 se rechaza Ho.
Se proceder a calcular los valores esperados de cada celda. Como los grados
de libertad son 2, esto quiere decir que necesitamos calcular nicamente 2
frecuencias esperadas, y las faltantes se encuentran por diferencia.
Se calcularn los valores esperados E 11, y E22.
Como se necesitan los totales de rengln y columna se mostrarn en la
tabla:
Matutino

Defectuoso
s
No defectuosos

Vespertino

Nocturno

45

55

70

905

890

870

Total
170
2665

Total

Eij

nu i
v j

950

1
n

Oij

r
i 1

j 1

Oij

E11

170 950
2835

Matutino

Defectuoso
s
No defectuosos
Total

i 1 j 1

O ij
E

2
ij

Eij

45 57. 0
57.0

945

57

940

E22

Vespertino
55
(56.7)

Nocturno
70
(56.3)

905
(893.0)
950

890
(888.3)
945

870
(883.7)
940

70 56. 3
56.3

...

888.33

2665 945
2835

45
(57.0)

55 56. 7
56.7

2835

870 883. 7
883 .7

Total
170
2665
2835
2

6 .29

Decisin:
Si se busca este valor dentro de la tabla de ji-cuadrada con 2 grados de libertad
nos dar un valor de P aproximado a 0.04. Si se observa el valor de la jicuadrada calculada de 6.29 con el valor de tabla de 7.378, se llega a la decisin
de no rechazar Ho. Sin embargo sera riesgoso concluir que la proporcin de
defectuosos producidos es la misma para todos los turnos por tener un valor de
P de 0.04.
Tablas de Contingencia para probar Homogeneidad
El uso de la tabla de contingencia de dos clasificaciones para probar
independencia entre dos variables de clasificacin en una muestra tomada de
una poblacin de inters, es slo una de las aplicaciones de los mtodos de
tablas de contingencia. Otra situacin comn se presenta cuando existen r
poblaciones de inters y cada una de ellas est dividida en las mismas c
categoras. Luego se toma una muestra de la i-sima poblacin, y los conteos se
introducen en las columnas apropiadas del i-simo rengln. En esta situacin se
desea investigar si las proporciones son o no las mimas en las c categoras de
todas las poblaciones. La hiptesis nula de este problema establece que las
poblaciones son homogneas con respecto a las categoras (como el ejemplo
pasado de los diferentes turnos), entonces la prueba de homogeneidad es en
realidad una prueba sobre la igualdad de r parmetros binomiales. El clculo de
las frecuencias esperadas, la determinacin de los grados de libertad y el clculo
de la estadstica ji-cuadrada para la pruebe de homogeneidad son idnticos a los
de la prueba de independencia.

ESTADISTICA NO PARAMETRICA
La mayor parte de los procedimientos de prueba de hiptesis que se presentan
en las unidades anteriores se basan en la suposicin de que las muestras
aleatorias se seleccionan de poblaciones normales. Afortunadamente, la mayor
parte de estas pruebas an son confiables cuando experimentamos ligeras
desviaciones de la normalidad, en particular cuando el tamao de la muestra es
grande. Tradicionalmente, estos procedimientos de prueba se denominan
mtodos paramtricos. En esta seccin se consideran varios procedimientos
de prueba alternativos, llamados no paramtricos mtodos de distribucin
libre, que a menudo no suponen conocimiento de ninguna clase acerca de las
distribuciones de las poblaciones fundamentales, excepto que stas son
continuas.
Los procedimientos no paramtricos o de distribucin libre se usan con mayor
frecuencia por los analistas de datos. Existen muchas aplicaciones en la ciencia
y la ingeniera donde los datos se reportan no como valores de un continuo sino
mas bien en una escala ordinal tal que es bastante natural asignar rangos a los
datos.
Un ejemplo donde se aplica una prueba no paramtrica es el siguiente, dos
jueces deben clasificar cinco marcas de cerveza de mucha demanda mediante
la asignacin de un grado de 1 a la marca que se considera que tiene la mejor
calidad global, un grado 2 a la segunda mejor, etctera. Se puede utilizar
entonces una prueba no paramtrica para determinar donde existe algn
acuerdo entre los dos jueces.
Se debe sealar que hay varias desventajas asociadas con las pruebas no
paramtricas. En primer lugar, no utilizan la informacin que proporciona la
muestra, y por ello una prueba no paramtrica ser menos eficiente que el
procedimiento paramtrico correspondiente, cuando se pueden aplicar ambos
mtodos. En consecuencia, para lograr la misma potencia, una prueba no
paramtrica requerir la correspondiente prueba no paramtrica.
Como se indic antes, ligeras divergencias de la normalidad tienen como
resultado desviaciones menores del ideal para las pruebas paramtricas
estndar. Esto es cierto en particular para la prueba t y la prueba F . En el
caso de la prueba t y la prueba F, el valor P citado puede ser ligeramente
errneo si existe una violacin moderada de la suposicin de normalidad.
En resumen, si se puede aplicar una prueba paramtrica y una no paramtrica al
mismo conjunto de datos, debemos aplicar la tcnica paramtrica ms eficiente.
Sin embargo, se debe reconocer que las suposiciones de normalidad a menudo
no se pueden justificar, y que no siempre se tienen mediciones cuantitativas.

PRUEBA DEL SIGNO


La prueba del signo se utiliza para probar la hiptesis sobre la mediana m~
de una distribucin continua. La mediana de una distribucin es un valor de
la
variable aleatoria X tal que la probabilidad de que un valor observado de X sea
menor o igual, o mayor o igual, que la mediana es 0.5. Esto es,
PX
P X
0.5 .
~
~
m
m
Puesto que la distribucin normal es simtrica, la media de una distribucin
normal es igual a la mediana. Por consiguiente, la prueba del signo puede
emplearse para probar hiptesis sobre la media de una poblacin normal.
Suponga que las hiptesis son:
H 0 ; m~ m ~o
H ; m~ m ~
1

Supngase que X 1, X2, . . . , X n es una muestra aleatoria tomada de la


poblacin de inters. Frmense las diferencias
X i m~ , 1,2,...n
io
Ahora bien si la hiptesis nula
m~o es verdadera, cualquier diferencia
H 0;
m~
X m~ tiene la misma probabilidad de ser negativa o positiva. Un estadstico de
i

prueba apropiado es el nmero de estas diferencias que son positivas, por


ejemplo R+ . Por consiguiente, la prueba de la hiptesis nula es en realidad una
prueba de que el nmero de signos positivos es un valor de una variable
aleatoria binomial con parmetro P = . Puede calcularse un valor P para el
nmero observado de signos positivos r+ directamente de la distribucin
binomial. Al probar la hiptesis que se muestra al principio, se rechaza H0 en
favor de H1 slo si la proporcin de signos positivos es suficientemente menor
que ( o de manera equivalente, cada vez que el nmero observado de signos
positivos r+ es muy pequeo). Por tanto, si el valor P calculado
P = P(R + r + cuando p = 1/2)
es menor o igual que algn nivel de significancia seleccionado
previamente, entonces se rechaza H0 y se concluye que H1 es verdadera.
Para probar la otra hiptesis unilateral
H 0 ; m~m
~
o

H1 ; m~m
~
o

se rechaza H0 en favor de H1 slo si el nmero observado de signos ms, r+, es


grande o, de manera equivalente, cada vez que la fraccin observada de signos
positivos es significativamente mayor que . En consecuencia, si el valor P
calculado P = P(R+ r + cuando p = 1/2) es menor que , entonces H0 se rechaza
y se concluye que H1 es verdadera.
Tambin puede probarse la alternativa bilateral. Si las hiptesis son:

H 0 ; m~m
~
o
H1 ; m~m
~
o

se rechaza H0 si la proporcin de signos positivos difiere de manera significativa


de (ya se por encima o por debajo). Esto es equivalente a que el nmero
observado de signos r+ sea suficientemente grande o suficientemente pequeo.
Por tanto, si r+ >n/2 el valor P es + +
P=2P(R r cuando p = )
+
+
+
Y si r >n/2 el valor P es P=2P(R r cuando p = )
Si el valor P es menor que algn nivel preseleccionado
H0 y se concluye que H1 es verdadera.

, entonces se rechaza

Ejemplos:
1. Un artculo informa cerca de un estudio en el que se modela el motor de un
cohete reuniendo el combustible y la mezcla de encendido dentro de un
contenedor metlico. Una caracterstica importante es la resistencia al
esfuerzo cortante de la unin entre los dos tipos de sustancias. En la
siguiente tabla se muestran los resultados obtenidos al probar 20 motores
seleccionados al azar. Se desea probar la hiptesis de que la mediana de la
resistencia al esfuerzo cortante es 2000 psi, utilizando = 0.05.
Solucin:
Se mostrar la tabla del ejercicio y es funcin del investigador poner los signos
con respecto a la mediana.
H 0;
2000 psi
m
2000 psi
H1 ;
m

Observacin
1
2
3
4
5
6
7
8
9
10

Resistencia
al esfuerzo
cortante
xi
2158.70
1678.15
2316.00
2061.30
2207.50
1708.30
1784.70
2575.10
2357.90
2256.70

Signo de la
diferencia
x i -2000
+
+
+
+
+
+
+

Observacin
11
12
13
14
15
16
17
18
19
20

Resistencia
al esfuerzo
cortante
xi
2165.20
2399.55
1779.80
2336.75
1765.30
2053.50
2414.40
2200.50
2654.20
1753.70

De la tabla se puede observar que el estadstico de prueba r+ =


14. Regla de decisin:

Signo de la
diferencia
x i -2000
+
+
+
+
+
+
+
-

Si el valor de P correspondiente a r+ =14 es menor o igual que


se rechaza H0.

=0.05

Clculos:
Puesto que r+=14 es mayor que n/2=20/2=10, el valor de P se calcula de
+
P=2P(R 14 cuando p = )
La P se calcula con la frmula de la distribucin binomial:
20

20

Cr 0.5 0.5

20 r

0.1153

r 14

Conclusin:
Como P=0.1153 no es menor que =0.05, no es posible rechazar la hiptesis
nula de que la mediana de la resistencia al esfuerzo constante es 2000
psi.
Otra manera de resolver el problema es con Aproximacin normal:
Cuando p=0.5, la distribucin binomial esta bien aproximada por la distribucin
normal cuando n es al menos 10. Por tanto, dado que la media de la distribucin
binomial es np y la varianza es npq, la distribucin de R+ es aproximadamente
normal con media 0.5n y varianza 0.25n, cada vez que n es moderadamente
grande. Por consiguiente las hiptesis pueden probarse con el estadstico:
r
0.5n
Z
0.5 n
Las reglas de decisin se establecern como cualquier ensayo en una
distribucin muestral en donde se utiliza la distribucin normal.
Para resolver el problema anterior:
H 0;
2000 psi
m
2000 psi
H1 ;
m
Como la es mayor que 10 se utilizar la aproximacin normal.
Ho

H1

H1
Regin de
rechazo

Regin de
Rechazo

/2 = 0.025

/2 = 0.025
Regin de aceptacin

ZL = -1.96

Regla de Decisin:
Si 1.96 ZR 1.96 No se rechaza Ho
Si ZR < -1.96 si Z R > 1.96 Se rechaza Ho
Clculos:

= 2000

ZL = 1.96

Z
0.5n

r
0.5 n

14

0.5 20

1.789

0.5 20

Decisin y Conclusin:
Como 1.789 esta entre 1.96 y 1.96, no se rechaza H0 y se concluye con un
=0.05 que la mediana es de 2000 psi.
Prueba del Signo para Muestras Pareadas
Tambin se puede utilizar la prueba de signo para probar la hiptesis nula
~ m
~
m
d 0 para observaciones pareadas. Aqu se reemplaza cada diferencia,
1
2
di, con un signo ms o menos dependiendo si la diferencia ajustada, di -d0, es
positiva o negativa. A lo largo de esta seccin suponemos que las poblaciones
son simtricas. Sin embargo, aun si las poblaciones son asimtricas se puede
llevar a cabo el mismo procedimiento de prueba, pero las hiptesis se refieren a
las medianas poblacionales en lugar de las medias.
Ejemplo:
1. Una compaa de taxis trata de decidir si el uso de llantas radiales en
lugar
de llantas regulares con cinturn mejora la economa de combustible. Se
equipan 16 automviles con llantas radiales y se manejan por un recorrido de
prueba establecido. Sin cambiar de conductores, se equipan los mismos
autos con llantas regulares con cinturn y se manejan una vez ms por el
recorrido de prueba. Se registra el consumo de gasolina, en kilmetros por
litro, de la siguiente manera:
Automvil
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Llantas radiales
4.2
4.7
6.6
7.0
6.7
4.5
5.7
6.0
7.4
4.9
6.1
5.2
5.7
6.9
6.8
4.9

Llantas con cinturn


4.1
4.9
6.2
6.9
6.8
4.4
5.7
5.8
6.9
4.9
6.0
4.9
5.3
6.5
7.1
4.8

Se puede concluir en el nivel de significancia de 0.05 que los autos


equipados con llantas radiales obtienen mejores economas de
combustible que los equipados con llantas regulares con cinturn?
Solucin:
H 0 ; R m~ C
m~

H ;
1
m~

m~ C

0
H1

Ho

Regin de
rechazo

= 0.05
Regin de aceptacin

ZL = 1.645

Regla de decisin:
Si zR 1.645 no se rechaza Ho.
Si zR> 1.645 se rechaza Ho.
Se procede ha realizar las diferencias entre de los kilmetros por litro entre
llantas radiales y con cinturn:
Automvil
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Llantas radiales
4.2
4.7
6.6
7.0
6.7
4.5
5.7
6.0
7.4
4.9
6.1
5.2
5.7
6.9
6.8
4.9

Llantas con cinturn


4.1
4.9
6.2
6.9
6.8
4.4
5.7
5.8
6.9
4.9
6.0
4.9
5.3
6.5
7.1
4.8

d
+
+
+
+
0
+
+
0
+
+
+
+
+

Al observar las diferencias se ve que slo existe una n=14, ya que se descartan
los valores de cero. Se tiene r+ = 11
r
0.5n 11 0.5 14 2.14
Z
0.5 n
0.5 14
Decisin y conclusin:
Como 2.14 es mayor a 1.645 se rechaza H0 y se concluye con un = 0.05 que
las llantas radiales mejoran la economa de
combustible.
PRUEBA DE RANGO CON SIGNO DE WILCOXON
Se puede notar que la prueba de signo utiliza slo los signos ms y menos de
las diferencias entre las observaciones y 0 en el caso de una muestra, o los
signos ms y menos de las diferencias entro los pares de observaciones en el
caso de la muestra pareada, pero no toma en consideracin la magnitud de
estas diferencias. Una prueba que utiliza direccin y magnitud, propuesta en

1945 por Frank Wilcoxon, se llama ahora comnmente prueba de rango con
signo de Wilcoxon. Esta prueba se aplica en el caso de una distribucin
continua simtrica. Bajo esta condicin se puede probar la hiptesis nula
0.
Primero se resta
de cada valor muestral y se descarta todas las diferencias
iguales a cero. Se asigna un rango de 1 a la diferencia absoluta ms pequea,
un rango de 2 a la siguiente ms pequea, y as sucesivamente. Cuando el valor
absoluto de dos o ms diferencias es el mismo, se asigna a cada uno el
promedio de los rangos que se asignaran si las diferencias se distinguieran. Por
ejemplo, si la quinta y sexta diferencia son iguales en valor absoluto, a cada una
se le asignara un rango de 5.5. Si la hiptesis
0 es verdadera, el total de los
rangos que corresponden a las diferencias positivas debe ser casi igual al total
de los rangos que corresponden a las diferencias negativas. Se representan
esos totales como w+ y w- , respectivamente. Se designa el menor de w+ y wcon w.
Al seleccionar muestras repetidas esperaramos que variaran w+ y w-, y por
tanto w. De esta manera se puede considerar a w+ y w-, y w como valores de
las correspondiente variables aleatorias W+, W-, y W. La hiptesis nula
0
se puede rechazar a favor de la alternativa
0 slo si w+ es pequea y wes grande. Del mismo modo, la alternativa
0 se puede aceptar slo si w+
es grande y w- es pequea. Para una alternativa bilateral se puede rechazar
H0 a
favor de H1 si w+ o w- y por tanto w son suficientemente pequeas. No
importa
cul hiptesis alternativa puede ser, rechazar la hiptesis nula cuando el valor
de la estadstica apropiada W+ , W-, o W es suficientemente
pequeo.
Dos Muestras con Observaciones Pareadas
Para probar la hiptesis nula de que se muestrean dos poblaciones simtricas
continuas con
para el caso de una muestra pareada, se clasifican las
diferencias de las observaciones paradas sin importar el signo y se procede
como en el caso de una muestra. Los diversos procedimientos de prueba para
los casos de una sola muestra y de una muestra pareada se resumen en la
siguiente tabla:
Para probar H0

Contra H1

Calcular
w+
ww
w+
ww

No es difcil mostrar que siempre que n<5 y el nivel de significancia no exceda


0.05 para una prueba de una cola 0.10 para una prueba de dos colas, todos
los valores posibles de w+ , w-, o w conducirn a la aceptacin de la
hiptesis nula. Sin embargo, cuando 5
n
30, la tabla A.16 muestra
valores crticos

aproximados de W+ y W- para niveles de significancia iguales a 0.01, 0.025


y
0.05 para una prueba de una cola, y valores crticos de W para niveles de
significancia iguales a 0.02, 0.05 y 0.10 para una prueba de dos colas. La
hiptesis nula se rechaza si el valor calculado w+, w-, o w es menor o igual
que el valor de tabla apropiado. Por ejemplo, cuando n=12 la tabla A.16 muestra
que se requiere un valor de w+
17 para que la alternativa unilateral
sea
significativa en el nivel 0.05.
Ejemplos:
1. Los siguientes datos representan el nmero de horas que un compensador
opera antes de requerir una recarga: 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0,
1.2 y 1.7. Utilice la prueba de rango con signo para probar la hiptesis en el
nivel de significancia de 0.05 que este compensador particular opera con una
media de 1.8 horas antes de requerir una recarga.
Solucin:
H0;
H1;
Se proceder a efectuar las diferencias y a poner rango con signo a los
datos.
Dato
1.5
2.2
0.9
1.3
2.0
1.6
1.8
1.5
2.0
1.2
1.7

di = dato - 1.8
-0.3
0.4
-0.9
-0.5
0.2
-0.2
0
-0.3
0.2
-0.6
-0.1

Rangos

5.5
7
10
8
3
3
Se anula
5.5
3
9
1

Regla de decisin:
Para una n = 10, despus de descartar la medicin que es igual a 1.8, la tabla
A.16 muestra que la regin crtica es w 8.
Clculos:
w+ = 7 + 3 + 3 = 13
w- = 5.5 + 10 + 8 + 3 + 5.5 + 9 + 1 = 42
por lo que w = 13 (menor entre w+ y
w-).
Decisin y Conclusin:
Como 13 no es menor que 8, no se rechaza H0 y se concluye con un = 0.05
que el tiempo promedio de operacin no es significativamente diferente de 1.8
horas.

2. Se afirma que un estudiante universitario de ltimo ao puede aumentar su


calificacin en el rea del campo de especialidad del examen de registro de
graduados en al menos 50 puntos si de antemano se le proporcionan
problemas de muestra. Para probar esta afirmacin, se dividen 20
estudiantes del ltimo ao en 10 pares de modo que cada par tenga casi el
mismo promedio de puntos de calidad general en sus primeros aos en la
universidad. Los problemas y respuestas de muestra se proporcionan al azar
a un miembro de cada par una semana antes del examen. Se registran las
siguientes calificaciones del examen:

Par
1
2
3
4
5
6
7
8
9
10

Con
problemas
de
muestra
531
621
663
579
451
660
591
719
543
575

Sin
problemas
de
muestra
509
540
688
502
424
683
568
748
530
524

Pruebe la hiptesis nula en el nivel de significancia de 0.05 de que los


problemas aumentan las calificaciones en 50 puntos contra la hiptesis
alternativa de que el aumento es menor a 50 puntos.
Solucin:
La prueba de rango con signo tambin se puede utilizar para probar la hiptesis
nula
d0. En este caso las poblaciones no necesitan ser simtricas. Como
con la prueba de signo, se resta d0 de cada diferencia, se clasifican las
diferencias ajustadas sin importar el signo y se aplica el mismo procedimiento.
En este caso d0 = 50, por lo que se procede a calcular las diferencias entre las
muestras y luego restarles el valor de 50. Se representara con
y
la
calificacin media de todos los estudiantes que resuelven el examen en cuestin
con y sin problemas de muestra, respectivamente.
H0;
H1;
Regla de decisin:
Para n=10 la tabla muestra que la regin crtica es w+
Clculos:

11.

Par
1
2
3
4
5
6
7
8
9
10

Con
problemas
de
muestra
531
621
663
579
451
660
591
719
543
575

Sin
problemas
de
muestra
509
540
688
502
424
683
568
748
530
524

di

d i d0

22
81
-25
77
27
-23
23
-29
13
51

Rangos

-28
31
-75
27
-23
-73
-27
-79
-37
1

5
6
9
3.5
2
8
3.5
10
7
1

w+ = 6 + 3.5 + 1 = 10.5
Decisin y Conclusin:
Como 10.5 es menor que 11 se rechaza H0 y se concluye con un = 0.05 que
los problemas de muestra, en promedio, no aumentan las calificaciones de
registro de graduados en 50 puntos.
Aproximacin Normal para Muestras Grandes
Cuando n

15, la distribucin muestral de W + W- se aproxima a la distribucin


n n 4 y varianza s w 2 n n 1 2n 1
normal con media m w
.
24
4
Por tanto, cuando n excede el valor ms grande en la tabla A.16, se puede
utilizar la estadstica
w
mw
z
sw
para determinar la regin crtica de la prueba.
Ejercicios para la Unidad IV
1. Se lanza 180 veces un dado con los siguientes resultados:
X
f

1
28

2
36

3
36

Es un dado balanceado? Utilice un

4
30

= 0.01.

5
27

6
23

2. Se supone que una mquina mezcla cacahuates, avellanas, anacardos y


pacanas a razn de 5:2:2:1. Se encuentra que una lata que contiene 500 de
estas nueces mezcladas tiene 269 cacahuates, 112 avellanas, 74 anacardos
y 45 pacanas. Al nivel de significancia de 0.05 pruebe la hiptesis de que la
mquina mezcla las nueces a razn de 5:2:2:1.
3. Se seleccionan tres canicas de una urna que contiene cinco canicas rojas y
tres verdes. Despus de registrar el nmero x de canicas rojas, las canicas

se reemplazan en la urna y el experimento se repite 112 veces. Los


resultados que se obtienen son los siguientes:
x
f

0
1

1
31

2
55

3
25

Pruebe la hiptesis con un nivel de significancia de 0.05, de que los datos


registrados se pueden ajustar a una distribucin hipergeomtrica.
4. Se lanza una moneda hasta que sale cara y se registra el nmero de
lanzamientos x. Despus de repetir el experimento 256 veces, se obtuvieron
los siguientes resultados:
X
f

1
136

2
60

3
34

4
12

5
9

6
1

7
3

8
1

Pruebe la hiptesis con un nivel de significancia de 0.05 de que la


distribucin observada de x se puede ajustar por una distribucin
geomtrica
g(x;1/2), x = 1, 2, 3,
5. Con los siguientes datos, pruebe la bondad de ajuste entre las frecuencias
de clase que se observan y las frecuencias esperadas correspondientes de
una distribucin normal con
= 65 y
= 21, utilice un nivel de
significancia de
0.05.
Lmite de clase
10 - 19
20 29
30 39
40 49
50 59
60 69
70 79
80 89
90 - 99

Frecuencia
3
2
3
4
5
11
14
14
4

6. En un experimento para estudiar la dependencia de la hipertensin de los


hbitos de fumar, se tomaron los siguientes datos de 180 individuos:
Con hipertensin
Sin hipertensin

No
fumadores
21
48

Fumadores
moderados
36
26

Fumadores
empedernidos
30
19

Pruebe la hiptesis de que la presencia o ausencia de hipertensin es


independiente de los hbitos de fumar. Utilice un nivel de significancia de
0.05.
7. Una muestra aleatoria de 200 hombres casados, todos retirados, se clasifica
de acuerdo con la educacin y el nmero de hijos:

Educacin
Elemental
Secundaria
Universidad

0-1
14
19
12

Nmero de hijos
2-3
37
42
17

Ms de 3
32
17
10

Pruebe la hiptesis, con un nivel de significancia de 0.05, de que el tamao


de la familia es independiente del nivel de instruccin del padre.
8. Se comparan dos tipos de instrumentos para medir la cantidad de monxido
de azufre en la atmsfera en un experimento de contaminacin atmosfrica.
Se registraron las siguientes lecturas diarias en un perodo de dos semanas:
Da
1
2
3
4
5
6
7
8
9
10
11
12
13
14

Instrumento A
0.96
0.82
0.75
0.61
0.89
0.64
0.81
0.68
0.65
0.84
0.59
0.94
0.91
0.77

Instrumento B
0.87
0.74
0.63
0.55
0.76
0.70
0.69
0.57
0.53
0.88
0.51
0.79
0.84
0.63

Con el uso de la aproximacin normal a la distribucin binomial, realice una


prueba de signo para determinar si los diferentes instrumentos conducen a
diferentes resultados. Utilice un nivel de significancia de 0.05.
9. Los siguientes datos representan el tiempo, en minutos, que un paciente
tiene que esperar durante 12 visitas al consultorio de una doctora antes de
ser atendido por sta:
17
15
20
20
32
28
12
26
25
25
35
24
Utilice la prueba de rango con signo al nivel de significancia de 0.05 para
probar la afirmacin de la doctora de que la media del tiempo de espera para
sus pacientes no es mayor que 20 minutos antes de entrar al consultorio.
10. Los pesos de cuatro personas antes de que dejan de fumar y cinco
semanas despus de dejar de fumar, en kilogramos, son los siguientes:
Individuo
1
2
3
4
5
Antes
66
80
69
52
75
Despus
71
82
68
56
73
Utilice la prueba de rango con signo para observaciones pareadas para
probar la hiptesis, en el nivel de significancia de 0.05, de que dejar de fumar

no tiene efecto en el peso de una persona contra la alternativa del que el


peso aumenta si deja de fumar.
11. Los siguientes son los nmeros de recetas surtidas por dos farmacias en un
perodo de 20 das:
Da
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Farmacia A
19
21
15
17
24
12
19
14
20
18
23
21
17
12
16
15
20
18
14
22

Farmacia B
17
15
12
12
16
15
11
13
14
21
19
15
11
10
20
12
13
17
16
18

Utilice la prueba de rango con signo al nivel de significancia de 0.01 para


determinar si las dos farmacias, en promedio, surten el mismo nmero de
recetas contra la alternativa de que la farmacia A surte ms recetas que la
farmacia B.
12. Se afirma que una nueva dieta reducir el peso de una persona
4.5 kilogramos, en promedio, en un perodo de dos semanas. Se registran
los pesos de 10 mujeres que siguen esta dieta antes y despus de un
perodo de dos semanas, y se obtienen los siguientes datos:
Mujer
1
2
3
4
5
6
7
8
9
10

Peso antes
58.5
60.3
61.7
69.0
64.0
62.6
56.7
63.6
68.2
59.4

Peso despus
60.0
54.9
58.1
62.1
58.5
59.9
54.4
60.2
62.3
58.7

Utilice la prueba de rango con signo al nivel de significancia de 0.05 para


probar la hiptesis de que la dieta reduce la mediana del peso en 4.5

kilogramos contra la hiptesis alternativa de que la mediana de la diferencia


en pesos es menor que 4.5 kilogramos.
13. Se toman 10 muestras de un bao de cultivo sobre placa utilizado en
un proceso de fabricacin de componentes electrnicos, y se mide el pH del
bao. Los valores de pH medidos son 7.91, 7.85, 6.82, 8.01, 7.46, 6.95, 7.05,
7.35, 7.25, 7.42. Los ingenieros creen que el valor de la mediana del pH es
7.0. La muestra indica que esta proposicin es correcta? Utilice la prueba
del signo con = 0.05 para investigar esta hiptesis. Encuentre el valor P de
esta prueba.
14. Se mide de manera rutinaria el nivel de impurezas (en ppm) en un producto
qumico intermedio. En una prueba reciente se observan los datos
siguientes:
2.4
2.3

2.5
2.0

1.7
1.8

1.6
1.3

1.9
1.7

2.6
2.0

1.3
1.9

1.9
2.3

2.0
1.9

2.5
2.4

2.6
1.6

Puede afirmarse que la mediana del nivel de impureza es menor que 2.5
ppm? Establezca y pruebe la hiptesis apropiada utilizando la prueba de
signo con = 0.05. Cul es el valor P de esta prueba?
Respuestas a los Ejercicios de la Unidad IV
1. Regin crtica X2 > 15.086, X2 = 4.47 por lo tanto no rechazar H0, el
dado est balanceado.
2. Regin crtica X2 > 7.815,
X2 = 10.14, rechazar H0 . Las nueces no estn
mezcladas en la proporcin 5:2:2:1.
3. Regin crtica X 2 > 5.991,
X 2 = 1.67, no rechazar H0. Los datos se
ajustan a una distribucin hipergeomtrica.
4. Regin crtica X 2 > 11.07,
X 2 = 2.57, no rechazar H0. Los datos se ajustan
a una distribucin geomtrica.
5. Regin crtica X2 > 12.592,
X2 = 12.78, rechazar H0 . Los datos no
se ajustan a una distribucin normal.
6. Regin crtica X2 > 5.991,
X2 = 14.6, rechazar H0. La presencia o
ausencia de hipertensin y hbitos de fumar no son independientes.
7. Regin crtica X2 > 9.488,
X2 = 7.54, no rechazar H0. El tamao de
la familia es independiente del nivel se educacin del padre.
8. Regin crtica 1.96 z 1.96, z= 2.67, rechazar H0 .
9. Regin crtica w- 11 para una n=10, w- = 12.5, no rechazar H0.
10. Regin crtica w+ 1 para n = 5, w+ = 3.5, no rechazar H0.
11. Regin crtica z>2.575.
z= 2.80, rechazar H0, la farmacia A surte ms
recetas que la farmacia B.
12. Regin crtica w+ 11 para una n = 10. w+ = 17.5, no rechazar H0.
13. 2P(R+ 8 / p = 0.5) = 0.109 , como no es menor a 0.05, no se rechaza H0.
14. H0;
2.5 H1;
2.5 P(R+ 2/ p = 0.5) = 0.0002, se rechaza H0.
m~
m~

Bibliografa
Devore, J.L. (2000). Probabilidad y Estadstica para Ingeniera y Ciencias,
Quinta Edicin, Thomson Learning.
Mendenhall, W. (1998). Estadstica para Administradores, Segunda Edicin,
Grupo Editorial Iberoamrica.
Montgomery, D.C. y Runger G.C. (1996). Probabilidad y Estadstica Aplicadas a
la Ingeniera , Primera Edicin, Mc Graw Hill.
Sheaffer, R. L. y McClave, J.T. (1990). Probabilidad y Estadstica para
Ingeniera , Primera Edicin, Grupo Editorial Iberoamrica.
Spiegel, M.R. (1970). Estadstica, Primera Edicin, Serie Schaum, Mc Graw Hill.
Walpole, R. E., Myers, R.H., y Myers, S.L. (1998). Probabilidad y Estadstica
para Ingenieros, Sexta Edicin, Prentice Hall.
Weimer, R.C. (1996). Estadstica, Segunda Edicin, CECSA.