Anda di halaman 1dari 42

UNIVERSIDAD NACIONAL

JOSE FAUSTINO SANCHEZ

CARRION

FACULTAD DE INGENIERA

Prcticas de
DE INFERENCIA ESTADSTICA

f ( x) 1.0
i

MOISES E. ARMAS
< emiarin@gmail.com >

Huacho, Noviembre del 2009

Seccin 3
Frases para meditar:
La teora es asesinada tarde o
temprano por la experiencia
La belleza es una carta de
presentacin a corto plazo
La protesta y la queja son el
refugio de la gente que desconfa
en s mismo
El trabajo arduo embrutece la
mente y lleva a cometer errores
Independientemente de su grado de
brillantez, nunca es conveniente
apostar con un perdedor.

Otras pruebas de hiptesis


Con las pruebas de hiptesis podemos estimar un parmetro
poblacional, para ello tomamos muestras estadsticas, y segn la naturaleza
del problema, podemos estimar su media o varianza poblacional; tambin
podemos estimar las diferencias de las medias poblacionales, las
proporciones poblacionales, o las razones de dos varianzas; en esta seccin
tambin estudiaremos otras pruebas que pueden hacerse con las hiptesis
estadsticas; estas son bsicamente las pruebas de bondad de ajuste y las
pruebas de contingencia.

3.1 Pruebas de Bondad de Ajuste


Cuando se construye un histograma de frecuencias de una
situacin observada y es necesario conocer su curva de tendencia, para
describir su comportamiento terico y es preciso saber si sta curva de

tendencia podr ser considerada como vlida para estimaciones futuras, se


utiliza la prueba de la chi-cuadrado para validar la curva de tendencia, lo
cual nos permitir aceptar o desechar la curva estimada.
En temas precedentes, buscamos curvas de tendencia tericas o
modelos de comportamiento tericos que podran ajustarse a las
observaciones empricas; estos modelos tericos ms conocidos son: la
distribucin triangular, la rectangular, la trapezoidal, la binomial, la
Poisson, la normal, etc. Para ver si las observaciones reales que hemos
observado pueden ser explicadas dentro de una de estas curvas tericas, o
cualquier otra curva terica, se concibe la hiptesis nula de que la curva
de frecuencias observadas con la curva de frecuencias tericas, coinciden
frente a la hiptesis alternativa de que la curva de frecuencias tericas es
mayor que la curva de frecuencias reales; en el mejor de los casos, las
frecuencias observadas debern de coincidir con las frecuencias tericas,
esto es que cada oi = ei; sin embargo, en la vida real, es muy difcil que esto
suceda, porque siempre habr un o i ei, de donde la diferencia en valor
absoluto, entre ei - oi ser mayor de cero. En el mejor de los casos
desearamos que la suma de los valores absolutos de esta diferencia sea lo
ms prximo a cero, ya que cuanto ms grande sea esta suma, habr mayor
desconfianza de que las frecuencias tericas coincidan con las frecuencias
observadas, por lo que deberemos buscar otras ecuaciones que permitan
describir el comportamiento de las observaciones.
Para poder aceptar o rechazar el modelo encontrado se formula el
contraste de hiptesis en los siguientes trminos:
H0: oi = ei (las frecuencias observadas coinciden con las tericas)
H1: ei > oi (las frecuencias tericas no coinciden con las observadas)
Situacin que deber aceptarse o rechazarse de acuerdo a un .
n

El estadstico

2
r

=
i 1

(oi ei )2
define una distribucin chiei

cuadrado con = n p 1 grados de libertad, donde n representa el


nmero de clases y p el nmero de parmetros utilizados para calcular la
funcin terica; es obvio que si la suma de las diferencias: oi - ei se hagan
iguales a cero, la curva de frecuencias reales con la curva de frecuencias
tericas sern exactamente iguales, lo cual es difcil de creer que eso
suceder, porque no hay fenmenos sociales que pueden describirse
exactamente por modelos matemticos; en la prctica suceder que siempre

habr una pequea diferencia entre lo estimado y lo observado, el cual ser


cuantificado para determinar el 2 r.
Para aceptar o rechazar la curva de tendencia con la curva de
frecuencias reales, el 2 r debe confrontarse con una expresin terica, 2
(, ), que se obtiene de la tabla de la chi-cuadrado para un determinado
nivel de significancia y grados de libertad; si el valor de 2 r es mayor
que el 2(, ), deber rechazarse la hiptesis nula en el sentido que la curva
de tendencia terica no se aproxima a la real, dado que es obvio cuanto ms
grande sea esta diferencia, significar que entre el ajuste esperado y la
realidad hay mucho trecho, de otro modo se podr aceptarlo.
En el caso de que las frecuencias esperadas ei sean menores o
iguales a cinco, se combinan con la frecuencia terica de la clase anterior, o
posterior, segn sea el caso, debiendo en consecuencia, disminuir n en un
nmero igual a los ajustes.
El grfico ilustra lo manifestado; la lnea quebrada indica las
frecuencias reales observadas, y la lnea continua, las frecuencias tericas.
Fig. 3.1 Frecuencias reales y frecuencias tericas.
Cantidad de platos demandados

35000
30000
25000
20000
15000
10000
5000
0
1

Aos observados

Ejemplo 3.1 Un estudio desarrollado con respecto a la distribucin de


edades de un grupo de alumnas de un instituto superior de belleza mostr
las siguientes cifras:

79

Tabla de distribucin de edades


#

Edad de las
alumnas

1
2
3
4
5
6

[14 17[
[17 20[
[20 23[
[23 26[
[26 29[
[29 32[

Cantidades
observadas

32
40
45
38
39
31

Podra considerarse que las distribuciones de edades de las alumnas se


ajusta a
una distribucin rectangular, considerando un nivel de
significancia del 5%?
Solucin: Decir que la distribucin de edad de las alumnas es una funcin
constante es lo mismo que decir que sigue una distribucin uniforme o
rectangular; por lo tanto para cada valor observado de o i, existe un valor
esperado ei nico; en la siguiente tabla se muestra las columnas
correspondientes a ei y las expresiones individuales de las sumatorias; los
ei se obtienen totalizando los oi y dividindoles entre n.
Distribucin de edades para la prueba de bondad de ajuste
#
Edad de las
Cantidad
Cantidad (oi - ei )2/ ei
alumnas en observada esperada
I
aos
oi
ei
1
[14 17[
32
38
0,9474
2
[17 20[
41
38
0,2368
3
[20 23[
47
38
2,1316
4
[23 26[
38
38
0,0000
5
[26 29[
39
38
0,0263
6
[29 32[
31
38
1,2895
La hiptesis nula es que el comportamiento de las edades de las
alumnas estn distribuidas rectangularmente, frente a la alternativa de que
estas no siguen esa distribucin.
Haciendo clculos de la tabla, obtenemos que el 2 r es igual a
4,6316, este valor se contrasta 2 , con = n-0-1 = 5 grados de libertad,
donde p = 0, dado que no hay ningn parmetro en una distribucin

80

rectangular, y = 0,05; de una tabla del chi-cuadrado, se obtiene que


2
(0,05; 5), = 11,07: por lo tanto, debera aceptarse la hiptesis nula, el
sentido que el comportamiento de la edad de las alumnas se pueden
aproximar a una distribucin rectangular.

Ejemplo 3.2 Los niveles de ingreso, en miles de soles, obtenidos por una
empresa dedicada a la comercializacin de software estn en funcin a los
niveles de gastos en publicidad segn se muestra en la siguiente tabla:
Gastos Publicidad. S/
Ingresos en miles S/

15 18 20 17 25 22 26 28 30 19
50 56 60 52 65 62 60 85 90 61

A fin de conocer el comportamiento terico de esta relacin, un analista


formula una ecuacin que permite explicar una relacin entre estas dos
variables del siguiente modo:
Ingreso = 13,1524 + 2,3158*Gasto, donde Gasto es la variable
independiente e ingreso la variable dependiente; podra afirmarse que esta
ecuacin es confiable para fines de estimacin, considerando un probable
error de equivocacin de en un 5%?
Solucin: Este es un problema que consiste en aproximar el
comportamiento de las observaciones reales a un comportamiento
terico o esperado; en este caso, el comportamiento terico es una
funcin lineal de la forma Y = a + b*X; con la finalidad de estar
seguros si la ecuacin es aceptable o no, debe validarse haciendo la
prueba del Chi-cuadrado, con un nivel de significancia del 5%. Para
ello formulamos la hiptesis nula de que el ajuste es correcto frente a
la alternativa de que este no es el ms indicado. En la tabla se
compara las frecuencias reales con las frecuencias tericas, de acuerdo
a la ecuacin indicada.

81
Observ.

I
1
2
3
4
5
6
7
8
9
10

Gastos

15
18
20
17
25
22
26
28
30
19

Ingreso real

oi
50
56
60
52
65
62
60
85
90
61

Ingreso Terico

ei
48
55
59
52
71
64
73
78
83
57

El chi-cuadrado se obtiene aplicando la relacin

2
r

=
i 1

(oi ei )2
=
ei

4,50; este valor se confronta con lo proporcionado en la tabla del chi para
= n p 1 grados de libertad, donde p = 2 y al 5% de nivel de
significancia, correspondindole al nivel de significancia del 5% un chicrtico: 2(0,05; 7)= 14,07. Como el valor real es menor que ste, entonces
podemos decir que o existen suficientes evidencias para
rechazar la
hiptesis nula, por lo que debera aceptarse el ajuste.
Ejemplo 3.3 En horas de mayor afluencia de llegada de cliente a un cajero
automtico de un banco, se registran sus llegadas cada, en un intervalo de
cada tres minutos. El nmero de llegadas se contabilizan durante un
determinado nmero de veces, obtenindose los siguientes resultados:
Tabla: Llegada de clientes al cajero automtico de un banco:
# clientes que llegan
al cajero

Nmero de veces
registrado

0
5
1
15
2
32
3
20
4
10
5
7
Formule un modelo de llegada de clientes a este cajero; validndole al
1%.

82

Solucin. Este problema puede estar asociado a una distribucin de


Poisson, dado que se trata del nmero de eventos ocurridos en un intervalo
de tiempo; la hiptesis nula tendr las siguientes caractersticas: Las
llegadas de los clientes al cajero automtico de un banco se ajustan a una
distribucin de Poisson, frente a la alternativa, que estas llegadas no se
ajustan a esta distribucin.
Con los datos de la tabla determinamos el promedio de llegadas de
clientes al cajero automtico, esto es:
= E(x) = 214/89 = 2,404 clientes
llegan en promedio cada tres minutos; la funcin de probabilidad asociado
x -2,404
a este comportamiento ser: P(x) = 2,404 e
/x!, siendo x la variable
aleatoria, llegada de clientes; con estos datos se obtiene los ei:
0
1
2
3
4
5
X
5
15
32
20
10
7
oi
8,0 19,3 23,2 18,6 11,2 5,3
ei
Deber contrastarse el chi cuadrado real frente al chi cuadrado terico y
formular la respuesta.
Ejemplo 3.4 Una empresa dedicada a la venta de equipos de cmputo,
lleva el registro de los clientes que acuden a su local, y anota el nmero de
veces que compr un artculo durante un cierto perodo de tiempo; de este
modo los registros histricos le permiten configurar la siguiente tabla:
Nmero de veces que el
cliente compra artculos de
cmputo

Cantidad de
clientes que
compran

0
20
1
92
2
150
3
134
4
73
5
24
6
5
7
2
Los directivos de la empresa estn interesados en formular un
modelo de distribucin de probabilidad del comportamiento de compra de
estos clientes, con la finalidad de conocer su comportamiento terico y
prever en el futuro; proponga un modelo de distribucin adecuado a estas
caractersticas, y valdelo con un nivel de significancia del 5%.

83

Solucin. La hiptesis nula es que las frecuencias observadas con las


frecuencias tericas deberan coincidir, frente a la alternativa, de que la
terica no concuerda con la emprica proporcionando un alto margen de
error. La situacin observada hace intuir que el comportamiento del modelo
de distribucin de probabilidad debera ajustarse a una binomial, ya que el
cliente puede comprar o no los artculos de cmputo. El promedio de veces
en que un cliente compra es E(x) = (0*20 + + 7*2)/500 = 2,50 donde x
es la variable aleatoria nmero de veces que compra; como estamos
interesados en ajustarlo a una binomial, = E(x) = np; donde n es igual a 7,
de esta ecuacin extraemos que la probabilidad de que el cliente puede
comprar es p =

E(x )
= 0,3571, y de que no puede comprar es q = 0,6429.
n

La funcin de probabilidad de la binomial est definido por:


f(x) = 7Cx 0,3571x0,64297-x, con x = 0, 1, 2..,7 clientes. Con estos
resultados se obtiene los valores esperados de clientes que acudirn a
comprar al local comercial; la siguiente tabla proporciona esta informacin:
0
1
2
3
4
5
6
7
x
20
92 150
134 73
24
5
2
oi
22,7
88,2 147,1 136,1 75,6 25,2 4,7 0,4
ei

Las columnas 6 y 7 se integran en una sola, dado que la


frecuencia esperada de la ltima es menor de 5; los grados de libertad
se determinan: = 6-1-1 = 4.
n
(oi ei )2
El chi cuadrado real es: 2r =
= 2,59, el cual
ei
i 1
contrastado con el proporcionado por tabla a un nivel de significancia del
5% se obtiene: 2(0,05; 4) = 9,49; con estas confrontaciones podemos extraer
la conclusin de que la curva de tendencia del comportamiento de compra
de estos clientes se puede ajustar a una distribucin binomial, por lo tanto
no deberamos rechazar la hiptesis nula.

84

3.2 Pruebas de Contingencia


Cuando queremos saber si dos variables con diferentes categoras,
estn asociadas o son independientes, se utiliza la prueba de contingencia;
se dice que una variable tiene diferentes categoras, cuando tiene un
conjunto de componentes; as la variable color, puede tener los siguientes
componentes: rojo, verde, blanco, amarillo, etc.; la variable gusto puede
tener las siguientes categoras: aceptable, no aceptable, desagradable,
inspido, etc. Los siguientes casos ilustran la necesidad de desarrollar este
tipo de pruebas:
a) Un determinado candidato presidencial, podra estar interesado en
saber si los diferentes grados de aceptacin, estn relacionados entre
los diferentes grupos socioeconmicos de la sociedad.
b) Nos interesara saber, si los diferentes incentivos ofrecidos a los
trabajadores de una empresa, como vacaciones pagadas, remuneracin
extra, promocin a nuevas plazas o reconocimiento especial, en los
diferentes turnos de trabajo, tienen relacin directa con los niveles de
productividad lograda dentro de un perodo de tiempo observado.
c) Podramos estar interesados en saber si la asistencia a los conciertos
peridicamente en los teatros estn asociados a los grupos de edad de
los asistentes y su formacin acadmica.
d) Podramos estar interesados en saber si el rendimiento acadmico de
los alumnos est relacionado con el horario de los cursos ofrecidos, sea
maana, tarde o noche.
e) Podramos estar interesados en saber si la compra de un determinado
producto, est relacionado con la forma de su presentacin y el grupo
ocupacional del cliente, etc.
En cada uno de estos casos se trata de saber si ambas variables son
independientes o son dependientes; si son independientes, diremos que uno
no tienen nada que ver con el otro; sin embargo en el caso de ser
dependientes, entonces diremos que hay una relacin entre ellas; el conocer
esta relacin nos permitir tomar las decisiones respectivas.
Para resolver esta duda se construyen dos matrices rectangulares,
una para los valores observados y otra para los valores esperados; en la
fila se representa a una variable con sus respectivas categoras y en la
columna a la otra variable con sus respectivas categoras, tambin; en las
celdas de cada una de las matrices se contabilizan los valores observados y
los valores esperados. La siguiente tabla proporciona la matriz planteada.

85

Tabla: Matriz de contingencia, observada, para evaluar la


relacin de dependencia entre dos variables.
Variable A
Elem 1 Elem 2 Elem 3
Elem k
Variable B
Valor 1
O11
O12
O13
..
O1k
Valor 2
O21
O22
O23
..
O2k
..
.
.
.
..
.
Valor c
Oi1
Oi2
Oi3
..
Oik
Los Oij, donde j = 1, 2, , k; i = 1, 2, .r, representan los valores
observados para cada categora de las variables; en el caso de esta tabla, la
variable A tiene como categoras hasta los Elem k, y la variable B, tiene
como categoras hasta Valor c.
Para hacer la prueba de independencia de las dos variables, se
concibe el contraste de hiptesis en los siguientes trminos: H 0 = Ambas
variables son independientes, frente a H1 = Ambas variables no son
independientes; la matriz de valores esperados tendr las mismas
configuraciones, con las siguientes caractersticas:
Tabla: Matriz de contingencia, esperada, para evaluar la
relacin de dependencia entre dos variables.
Variable A
Variable B
Elem 1 Elem 2 Elem 3
Elem k
Valor 1
e11
e12
e13
..
E1k
Valor 2
e21
e22
e23
..
e2k
..
.
.
.
..
.
Valor c
ei1
ei2
ei3
..
eik
Donde cada elemento

esperado eij se determina del siguiente

modo:
eij =

Total _ Fila _ i * Total _ columna _ j


; se entiende que estos
Gran _ total

totales, para filas y columnas, corresponden a los valores observados;


c

oij

adems, Gran_total =
i 1 j 1

86
c

El estadstico

2
r

=
i 1 j

(oij eij )2
sigue una distribucin chi
eij
1

cuadrado con
= (k-1)*(c-1) grados de libertad; este valor deber ser
contrastado con lo proporcionado de una tabla del Chi cuadrado, 2c( , ) a
un nivel de significancia y
grados de libertad. La relacin de
dependencia de ambas variables deber ser aceptada si el estadstico es
mayor que el obtenido de la tabla; de otro modo, es de prever que las dos
variables son independientes; es decir que los valores obtenidos nada tienen
que ver con las categoras de ambas variables.

Ejemplo 3.5 Un grupo de inversionistas estn interesados en saber si


existe una relacin entre los platos tpicos ofrecidos en un restaurante
campestre, con el grupo ocupacional de las personas, de modo que ello le
permitir ampliar o no sus instalaciones actuales; para ello toma una
muestra de un grupo de clientes, y anota los platos seleccionados segn en
concordancia a su grupo ocupacional; encontrndose los siguientes
resultados:
Nmero de personas, clasificados en su grupo ocupacional, que
consumieron los platos tpicos en el restaurante campestre
Platos tpicos consumidos
Grupo
Ocupacional

Pachamanca

Ceviche
de pato

Sopa
Huachana

Cuy
picante

Comerciante
10
6
15
17
Empresario
8
12
11
10
Profesional
14
18
4
9
Estudiante
3
13
8
5
Podra asegurarse que los platos tpicos consumidos por los clientes,
estn relacionados con su grupo ocupacional?, asumiendo un riesgo de
equivocarse del 5%, y del 1%.
Solucin: El contraste de hiptesis deber hacerse en los siguientes
trminos:
Hiptesis Nula: La preferencia por los platos tpicos de los clientes, nada
tiene que ver con su grupo ocupacional (Ambas variables son
independientes).
Hiptesis Alternativa: La preferencia por los platos tpicos de los clientes
est relacionada con su grupo ocupacional.

87
2

Para rechazar o aceptar la hiptesis nula, deber calcularse el


r para ello
se necesita primeramente obtener su matriz esperada:
Matriz esperada de clientes que consumieron los platos tpicos,
clasificados segn su grupo ocupacional, en el restaurante
campestre.
Platos tpicos consumidos
Grupo
Ocupacional

Pachamanca

Comerciante
Empresario
Profesional
Estudiante

10,3
8,8
9,7
6,2

Ceviche
de pato

14,4
12,3
13,5
8,7

Sopa
Huachana

11,2
9,6
10,5
6,8

Cuy
picante

12,1
10,3
11,3
7,3

Donde cada elemento eij de la celda se obtuvo aplicando la relacin eij =

Total _ Fila _ i * Total _ columna _ j


; con el conjunto de los datos de
Gran _ total
c
k
(oij eij )2
2
ambas matrices, desarrollando la sumatoria r =
se
eij
i 1 j 1
2

obtiene que es igual a: r = 21,09.


2
Al contrastar con = 5%, c(0,95,9) = 16,92; significa que deberamos
aceptar la hiptesis nula, de que el consumo de los platos tpicos no
depende del grupo ocupacional de la persona.
2
Al contrastar con = 1%, c(0,99,9) = 21,67; en este caso, observamos que
2
el r est dentro de la zona de rechazo de la hiptesis nula, por lo que
deberamos rechazarlo, en el sentido que deberamos aceptar la hiptesis
alternativa de que el consumo de los platos tpicos, est asociado al grupo
ocupacional del cliente. Explique las razones de estas dos aparentes
contradicciones.

Problemas de ajustes de curvas y pruebas de contingencia


3.1
3.2

De qu manera pueden aproximarse observaciones empricas a


comportamientos tericos?
Puede considerarse que una observacin real, coincide exactamente
con una distribucin terica; sustente su respuesta?

88

3.3

Suponiendo que una serie de observaciones sean ajustadas a una


distribucin normal, cuntos parmetros debern utilizarse para
dicho ajuste?
3.4
Una empresa cuenta con una plana heterognea de personal en
cuanto a su experiencia laboral; de este modo ha clasificado la
siguiente tabla experiencia laboral en aos, dentro y fuera de la
institucin:
Ex. Aos 0 5 5 10 10 15 15 20 20 25 25 30 30 35
# Traba.
50
40
32
24
16
12
7
Ajuste estas observaciones a una distribucin triangular validndolo
al 5%.
3.5
El servicio de emergencia de un hospital presenta un resumen de
llegada de personas accidentadas por causas de trnsito segn se
muestra en la tabla:
Nmero de personas ingresados 0
1 2 3 4 5
por emergencia
Nmero de veces observado

6 25 36 21 15 7
Determine el nmero promedio de pacientes ingresados por
da, as como su desviacin estndar.
b) Encuentre una curva de tendencia del comportamiento de
llegada de pacientes, y valdelo al 5%
Con la finalidad de conocer la distribucin de edad de los alumnos
de un centro educativo de nivel superior se confecciona la siguiente
tabla:
a)

3.6

Cuadro de distribucin de edad de los alumnos del CE

Edad de los alumnos en


aos

3.7

N de alumnos

14 17
35
17 20
39
20 23
50
23 26
42
26 29
38
29 32
30
Existe suficiente evidencia como para decir que la edad de estos
alumnos sigue una distribucin uniforme?
R: 20,05; 5 = 11,07
2 r = 5,8462
Un alumno est tratando de construir un modelo de distribucin de
probabilidades del comportamiento de llegada de clientes al cajero

89

automtico de un banco de la localidad; para ello se pone a observar


la llegada de estos al cajero cada cinco minutos, lo cual le permite
confeccionar el siguiente cuadro de llegadas:
Llegadas de clientes al cajero automtico del Banco XXX
Llegan clientes cada Cantidad de clientes que
cinco minutos
llegaron

0
12
1
45
2
34
3
21
4
13
5
8
Ayude a construir al alumno un modelo de distribucin de
probabilidad de llegadas, validndole respectivamente; considera
un nivel de significancia del 5%.
3.8 El promedio de notas de los alumnos de ingeniera, obtenidos en el
curso de Lenguaje de Programacin durante el ciclo pasado, estn
tabulados en la siguiente tabla:
Notas
obtenidas Nmero de alumnos
por los alumnos
observados

[ 0 4[
8
[ 4 8[
13
[ 8 12[
20
[12 16[
10
[16 20[
4
Encuentre una curva de comportamiento terico del comportamiento
de estas notas, y valdelo al 1%.
3.9 Para qu se desarrolla una prueba de contingencia?
3.10 Qu significa decir que las variables son independientes, en una
prueba de contingencia?
3.11 De qu manera se puede validar una prueba de contingencia?
3.12 Explique el significado de que dos variables son dependientes, luego
de desarrollar la prueba de contingencia.
3.13 Una compaa de seguros tiene que optar por escoger dentro de cuatro
planes de seguros de vida que actualmente ofrece a sus clientes; para
ello desea conocer si la preferencia por algn plan de seguros de sus
clientes est asociada al nivel ocupacional en ejercicio. Se toma una
muestra aleatoria de un grupo de clientes usuarios de este plan,
obtenindose los siguientes resultados:

90
Nivel ocupacional
Obreros
Comerciantes
Profesionales
Independientes

Plan de seguros optados por los clientes


A
B
C
D

30
45
35
70
48
39
47
65
59
46
52
60
20
15
10
22
a) Podra asegurarse que el plan de seguros optado por los clientes
nada tiene que ver con los tipos de clientes?, considere un riesgo
de equivocarse del 1%.
b) Qu debera pasar para decir que el plan de seguros optados por
los clientes, est asociado a su nivel ocupacional, considerando un
riesgo de equivocarse del 5%?
3.14 Un canal de televisin est interesado en saber si los programas que
transmite da a da influyen en el grado de conducta de su tele
audiencia; para tales fines selecciona una muestra aleatoria de un
grupo de televidentes de diferentes grupos de edades, y los somete a
una prueba psicolgica, despus de un perodo de observacin,
encontrndose los siguientes resultados:
Nivel de conducta observada en una muestra de televidentes, como
resultado de sus programaciones, de la Empresa Televisiva XXXX
Grupo de
Muy
Agresivo
Normal Hiperactivo
personas
agresivo
Nios
15
28
22
20
Jvenes
24
14
20
17
Adultos
10
12
24
14
Tercera edad
6
16
14
9

Podra asegurarse que existe una relacin entre el nivel de conducta


de los grupos de edades de las personas y la programacin emitida por
la empresa televisiva, asumiendo un riesgo de equivocarse del 5%?
3.15 Una empresa textil trabaja a tres turnos, en razn de que debe
satisfacer fuertes pedidos de sus clientes provenientes del exterior; sin
embargo el departamento de control de calidad alega que este sistema
de trabajos no es conveniente dado que frecuentemente encuentran
fallas de calidad en las prendas confeccionadas por sus trabajadores, lo
cual puede perjudicar la imagen de la empresa ante sus clientes. A fin
de determinar si realmente existe este tipo de problemas como lo alega
control de calidad, se toman muestras aleatorias de un grupo de
trabajadores de loa diferentes turnos y se les evala sus respectivos

91

trabajos, y determinar el nmero de fallas encontradas en las prendas


producidas; los resultados de estos se encuentran en la siguiente tabla:
Resultados del muestreo hecho a una muestra de trabajadores, para
determinar el nmero de fallas encontrados en las prendas
confeccionadas
Estado de las prendas
Maana
Tarde
Noche
confeccionadas
Mal
5
3
11
Regular
4
12
6
Aceptable
16
9
7
Ninguna
7
5
3

Podra asegurarse que lo manifestado por el departamento de control


de calidad es vlido y no trabajarse con este sistema de turnos, o es
que estos problemas pueden deberse a otros factores?; considere un
riesgo de equivocarse del 5%.
3.16 Ante el advenimiento de las prximas elecciones para elegir al nuevo
presidente de la repblica, los tres partidos polticos ms voceados por
las empresas encuestadoras, deciden implementar un nuevos spot
publicitario a travs de la TV, con la finalidad de influir en el nimo de
la poblacin electoral que an se mantienen indecisos o no les interesa
el proceso electoral. Despus de una semana de lanzado este spot se
encarga a una encuestadora desarrollar un estudio sobre los efectos de
ste en el nimo de los electores; la empresa selecciona una muestra de
electores y recoge sus opiniones acerca del spot, obteniendo los
siguientes resultados:
Estado de nimo de los electores, respecto a los partidos polticos A, B, y
C, como resultado del lanzamiento del nuevo spot publicitario .
PARTIDOS
ESTADO DE
A
B
C
ANIMO
Muy a gusto
10
12
9
Gustoso
7
8
12
No le gusta
6
9
6
No le interesa
13
10
12

Podra asegurarse que el spot publicitario, influy en el estado de


nimo de los electores, o es que esto nada tiene que ver con ese estado
de cosas? Sustente su respuesta considerando una probabilidad de
equivocarse con el 5%.

92

3.17 Se quiere establecer si existe una relacin entre la duracin de los


discos duros y los distintos lugares donde son utilizados, dado que
por parte de los clientes que los utilizan, sobre todo en la sierra,
donde hace mucho fro, dicen que estos discos, despus de un
perodo corto de vida, empiezan a tener problemas en sus pistas,
debindose hacer continuas reparaciones, con el Scan Disk; para
descartar las afirmaciones de los clientes quejosos, se decide hacer
pruebas de confiabilidad de los discos duros de las marcas
Quantum, Maxtor, Fireball o Seagate, en diferentes lugares que
presentan climas propios, como climas fros, muy fros, templados,
clidos, y muy calurosos; estos discos duros, despus de un tiempo
de uso, deber registrarse el nmero de veces que fue reparado con
el Scan Disk. Los resultados de este ensayo se muestran en la
siguiente tabla:
Nmero de veces que fueron sometidos a un proceso de Scan Disk los
discos duros, en concordancia al clima donde fueron expuestos:
Quantum Maxtor
Fireball
Seagate
Tipo de clima
Fro
12
10
8
13
Muy fro
15
9
13
10
Templado
9
11
12
12
Clido
11
9
9
13
Muy clido
13
13
12
8

Con estos resultados, podra darse la razn a los clientes quejosos, o es


que estos casos solo son problemas provenientes de la casualidad?
Considere un nivel de significancia del 1%
3.18 Analizando el problema de la contaminacin del medio ambiente,
realizado por las personas en la provincia de Huaura, los alumnos del
V ciclo de Ing. Informtica de la Universidad se abocan a averiguar si
la manera cmo las personas que contaminaban el medio ambiente
estaban relacionados con su nivel cultural; para ello muestrearon a un
grupo de personas, de diferentes grados de instruccin y los
relacionaron con las diversas modalidades de contaminar el medio
ambiente, contabilizando el nmero de veces que contaminaban, en un
determinado perodo de tiempo; los resultados de esta investigacin se
muestran en la siguiente tabla:
Tabla. Nmero de veces que contaminaban el medio ambiente de
acuerdo a sus diferentes niveles culturales.
Diversas modalidades de contaminar

93

Nivel
Cultural

Escupe

Tira
papeles u
otros
8
10
15

Orina en
la calle

Fuma

13
7
5
Primaria
15
3
11
Secundaria
9
4
10
Superior
Incompleta
5
12
2
16
Profesional
Universitario
A la luz de estos resultados, formlese una teora y generalcese para
la poblacin de la provincia, asumiendo un riesgo de equivocarse del
5%.
3.19 ldll

94

Seccin 4
Frases para meditar:
Nunca soplarn vientos favorables
para el que no sabe a dnde va.
La esencia de su problema es el
reconocimiento exterior. Dedique
gran parte de su tiempo a buscar
un experto externo que pueda
certificar su creatividad.
Si uno quiere salir adelante en una
sociedad grande, tiene que ser
poltico, tiene que hacer amistades,
pero nunca olas.
Hay que cuidar del maana por
todos los medios, meditando,
proyectando, y preparndose pero
sin ansiedades.

Anlisis de Varianza
Diseos experimentales.
Consideremos el siguiente caso: Por lo general, en el sistema
educativo de nuestro medio, tenemos problemas de bajo rendimiento
acadmico de los alumnos, al margen de que en algunas instituciones se las
maquille con otros tipos de formalidades, esto es una constante que ao tras
ao agobia a nuestra educacin nacional, cuyos resultados de la mala
educacin peruana son manifestadas negativamente
el contexto
internacional; se podra ensayar una serie de respuestas que expliquen el
comportamiento de estas actitudes, as como tambin proponer una serie
de medidas con la finalidad de elevar el bajo rendimiento acadmico de los
alumnos; ahora vaymonos a un lugar ms especfico, una universidad,
supongamos que las autoridades universitarias son conscientes de esta
problemtica y desean elevar el nivel acadmico de sus alumnos, para ello
proponen otorgarles una serie de premios de modo que les estimule a ser
cada vez mejor y lograr los premios establecidos; se plantean lo siguientes

95

premios estmulos a los estudiantes: Comedor universitario, Estipendio


econmico, Viajes promocionales, Reconocimiento pblico, Bolsas de
trabajo; como no se sabe si stos premios tendrn efecto positivo en la
elevacin del rendimiento acadmico, se desea probar durante un ciclo,
primero con una muestra seleccionada al azar de una poblacin estudiantil,
y sin que stos sepan la naturaleza de la investigacin, a cada alumno se le
asigna un nmero entre uno y treinta, y se le otorga un solo premio de lo
ofrecido; finalizado el ciclo se evalan estos resultados, que debern
reflejarse en el rendimiento acadmico de cada uno de ellos y el promedio
general por cada premio ofrecido; la evaluacin y contraste de estos
resultados permitirn confirmar o desechar las suposiciones de las
autoridades universitarias; los resultados de la investigacin, podran
mostrarse como en la siguiente tabla:
Tabla 4.1 Promedio del rendimiento acadmico de la muestra de
alumnos, de acuerdo a los premios ofrecidos por la universidad XXX.
Comedor Estipendio Viajes
Reconoc. Bolsa t.
A12
A7
A22
A1
A18
A29
A11
A3
A14
A2
A15
A25
A6
A10
A17
A8
A13
A12
A27
A4
A5
A24
A19
A28
A30
A26
A23
A9
A21
A20
1
2
3
4
5
Los sub ndices de la variable A, indican los promedios de notas
por cada alumno seleccionado al azar y asignado tambin al azar a cada uno
de los premios ofrecidos; es preciso indicar que cada alumno es
beneficiario de un solo premio, as como que tampoco interesa que cada
uno de los premios ofrecidos contengan iguales cantidades de alumnos. Al
final de cada columna se tienen los promedios generales i por el grupo de
premios ofrecidos.
Este ejemplo constituye un tipo de experimento donde intervienen
una serie de variables independientes que pueden ser controlados y
manipulados por el investigador, en este caso diferentes premios ofrecidos
por la universidad, el cual, cuyos resultados finales nos interesar conocer

96

para decidir por una opcin; para seguir adelante, es necesario conocer la
terminologa utilizada en este tipo de diseos experimentales.
Un experimento consiste de una serie de actividades que se
desarrolla con la finalidad de producir un conocimiento u obtener alguna
informacin; para ello se utilizan variables independientes que el
investigador puede manipular a su antojo, a cada uno de ellos se les llama
tratamiento; para nuestro caso, las variables independientes estn
constituidos por los diferentes premios que la universidad ofrece como
estmulo para elevar el rendimiento acadmico; una variable dependiente
es el resultado del manejo de la variable independiente, y es lo que se busca
conocer; una unidad experimental es el elemento individual al que se le
aplica al tratamiento; en este caso la unidad experimental viene a constituir
el alumno, cuyo resultado o valor dependiente ser expresada en una cierta
unidad de medida; si continuamos con el ejemplo, entonces podemos
manifestar que el resultado de la medicin, se expresar en una nota.
A continuacin veremos algunos modelos de diseos
experimentales ms conocidos; stos son el diseo completamente
aleatorizado, diseo de bloques al azar, diseo factorial, y cuadrado latino.

Diseo completamente aleatorizado


En un diseo de este tipo, las unidades experimentales son
distribuidas al azar a solo un tratamiento, y lo que se busca es saber si los
resultados del tratamiento permitieron mejorar el estado actual de las cosas;
si nos referimos al ejemplo del caso anterior, es evidente que nos interesar
saber, si como efecto de los diferentes premios estmulos ofrecidos a los
alumnos, al finalizar el perodo de evaluacin, por lo menos, con uno de los
tratamientos, el promedio de notas ser mayor que con las de los otros
tratamientos; si as lo fuese, entonces diremos que el experimento vali la
pena, por lo que debera implementarse el premio que permiti que con ello
se mejorara el rendimiento acadmico de los alumnos; en trminos de
contraste de hiptesis, esto se puede plantear del siguiente modo:
H0: Todos los promedios seguirn siendo iguales, por lo tanto es
indiferente ofrecer uno u otro premio, dado que el rendimiento
acadmico de los alumnos seguir siendo el mismo.
H1: Por lo menos uno de los promedios ser mayor que los otros, lo
cual significar que es conveniente ofrecer este tipo de premios
para mejorar el rendimiento acadmico de los alumnos.

97

Para construir un modelo matemtico, consideremos el caso general


de tener k tratamientos, donde se eligen al azar las unidades experimentales
y son distribuidas, tambin, al azar a cada uno de los tratamientos; estas
unidades experimentales generarn un resultado yij, tal como el que se
muestra a continuacin:
Tabla 4.2 Diseo completamente aleatorizado para un
experimento consistentes de k tratamientos.
Tratamientos:
1 2
3
...
j
... k
y11 y12
y13
. . . y1j
. . . y1k
y21 y22
y21
. . . y2j
. . . y2k
. .
.
... .
...
.
. .
.
... .
...
.
yi1 yi2
yi3
. . . yij
. . . yik
. .
.
... .
...
.
yn1 yn2
yn3
. . . ynj
. . . ynk
. . T.K
T.1
T.2
T.3
. . . T.J
Total
.

Media
Varianza

y.1
S.12

y.2.
S.22

y.3
S.32

...
...

y.j
S.j2

...

y.k
S.k2

Donde: yij es la medida isima para el tratamientoj


i = 1, 2, 3, . . . , n.
j = 1, 2, 3, . . . , k.
T.j = suma de todas las medidas del tratamiento j.
.j = Promedio de las medidas del tratamiento j.
S.j2 = Varianza de las medidas del tratamiento j.
T.. = total de las medidas de los yij.
.. = promedio de todas las medidas de los yij.
S2 = varianza de todas las medidas de los yij.
Por cada tratamiento obtenemos su total, su promedio y su
respectiva varianza, as como tambin obtenemos por el conjunto el gran
total T.., la media general .., y la varianza general S2.
Si continuamos analizando estos datos, podramos darnos cuenta
que la variabilidad total de los datos, depender de la variacin de datos
entre los tratamientos y la variacin de datos dentro de cada tratamiento; de
hecho, cuanto mayor sean los tratamientos, y dependiendo cmo estos
datos se distribuyen dentro de los tratamientos, la variacin general estar
influenciada por estos comportamientos.

98

La variabilidad entre los tratamientos determina la forma cmo las


medias de las muestras de estos tratamientos difieren entre s, y la
variabilidad dentro de los tratamientos, determina la manera en que las
observaciones varan respecto a las medias de cada tratamiento; estas
expresiones se demuestran analticamente del siguiente modo:
yij y.. = desviacin de los datos respecto a la media total.
yij y.j = desviacin de los datos respecto a la media del tratamiento j.
Restando las dos expresiones:
(yij ..) (yij y.j); el resultado de esta resta ser:
(yij ..) (yij y.j) = (y.j ..), o sea:
(y.j ..) = (yij ..) + (yij y.j)
Elevando al cuadrado ambos miembros:
(y.j ..)2 = ((yij ..) + (yij .j))2 , desarrollando los cuadrados:
SCT = SCTR + SCF + SCE
Donde:
SCT =
C; siendo C =
SCTR =

-C

SCF =
-C
SCE = SCT (SCTR + SCF)
Su tabla ANVA, contar con la siguiente informacin:
Fuente
Tratamiento
Error
TOTAL

SC
SCTR
SCE

g.l
k-1
n-k

SCT

n-1

CM
CMTR
CME

Fr
Fr =

Donde CMTR =
CME =
Este Fr calculado deber contrastarse con un Fc(, c-1, (k-1)*(c-1)); donde
es el nivel de significancia, y de acuerdo a ello, tomar la decisin
respectiva.

99

Ejemplo 4.1 Consideremos que el rendimiento acadmico de los alumnos


en el curso de Matemtica es bajo; las autoridades acadmicas consideran
que ese bajo rendimiento se debe a que el dictado del curso se hace en un
horario inadecuado, y para mejorarlo se hace un nuevo planteamiento
replanteando el horario; para ello se propone cinco nuevos horarios, como
los siguientes: 08:00 11:00, 10:00 13:00, 14:00 17:00, 16:00 19:00,
y 18:00 21:00; para ver la efectividad de esta nueva reprogramacin, se
selecciona una muestra de alumnos que llevarn el curso, a los cuales se les
asigna aleatoriamente uno de los horarios establecidos; finalizado el dictado
del curso se evalan las notas obtenidas, encontrndose los siguientes
resultados.

08:00
11:00

10:00
13:00

14:00
17:00

16:00
19:00

18:00
21:00

Problemas de Anlisis de Varianza: diseo completamente


aleatorizado.
4.1
4.2

4.3

4.4

Nombre y explique las tres fuentes principales de datos de que


puede disponer un investigador.
Describa un proyecto de investigacin dentro del campo de su
carrera profesional, de modo que pueda utilizar los datos generados
por las actividades de la organizacin, en un diseo experimental.
Describa un proyecto de investigacin en el rea de la informtica,
donde requiera el diseo de un experimento completamente
aleatorizado y determine el objetivo de este tratamiento.
En qu consiste un diseo completamente aleatorizado?

100

4.5

4.6

4.7

4.8

Defina los siguientes trminos: a) Experimento


b) Variable
independiente
c) Variable dependiente
d) Tratamiento
e)
Unidad experimental.
Describa un diseo completamente aleatorizado en los siguientes
campos del desarrollo social: a) Educativo
b) Social
c)
Agronmico d) Nutricional e) Ing. informtica
El gerente de produccin de una empresa est preocupado por el
bajo rendimiento de sus trabajadores; con la finalidad de elevarlos,
propone introducir algunas medidas correctivas tendientes a
incentivar el mejor desempeo laboral, y por ende, mejorar la
produccin; estas medidas correctivas son sometidas a un grupo de
trabajadores seleccionadas aleatoriamente, y sin que stos sepan la
naturaleza de la investigacin, son tambin distribuidos al azar a
solo uno de los incentivos ofrecidos; despus de un tiempo
determinado evala los resultados y en base a ello adopta las
respectivas medidas. Formule un modelo matemtico para este
experimento, considerando las medidas correctivas necesarias a
introducirse e indicando los pasos a desarrollar para obtener la
conclusin.
Una nueva empresa vinculada al negocio informtico
est
interesada en abrir nuevas sucursales en los diferentes mbitos del
pas, con la finalidad de impartir enseanza en ciencias de la
computacin; los posibles lugares donde se abriran estos negocios
son: Arequipa, Trujillo, Cajamarca, Chiclayo, Cusco y Huancayo;
en vista de que carece de informacin sociocultural de cada uno de
los lugares, selecciona muestras aleatorias de posibles candidatos de
cada lugar a fin de someterlos a una prueba de percepcin de
conocimientos, los cuales son cuantificados en notas que van de cero
a veinte, cuyos resultados se muestran en la siguiente tabla:
Tabla: Calificativos obtenidos por los candidatos seleccionados por
una Prueba de percepcin, desarrollada durante el perodo..
Lugares
Arequipa
Trujillo
Cajamarca
Chiclayo
Cusco
Huancayo

12,6
11,5
09,2
14,2
15,1
13,3

08,5
12,2
13,1
11,6
12,3
10,7

12,4
10,2
13,2
10,1
12,5
11,2

13,2
07,7
09,8
10,2
11,8
10,9

07,2
11,5
11,7
14,4
16,2
12,8

10,7

13,6

11,6

13,4
05,5
11,5

12,2
07,5

10,3

08,7

101

4.9

Podra asegurarse, que los potenciales candidatos, mantienen


diferentes percepciones de conocimientos, asumiendo un riesgo de
equivocarse del 5%?
Con la finalidad de reducir los niveles de colesterol en la sangre de
las personas mayores de los treinta aos, se disean cinco tipos de
dietas con diferentes formulaciones, los cuales son sometidas a un
grupo de personas que tenan altos niveles de colesterol, durante un
perodo de cuatro meses; pasado este tiempo se les vuelve a medir y
se encuentra los siguientes resultados:
Niveles de colesterol en la sangre de una muestra personas, seleccionadas al
azar, sometidos a base de las principales dietas:

Verduras
203
263
205
222
299
201
242

4.10

Pescado
Carne
Granos
217
205
200
220
231
204
198
233
245
234
198
210
250
210
216
200
216
205
201
208
205
238
242
212
240
217
Constituyen estos resultados, suficiente evidencia como para
manifestar que los niveles de colesterol en la sangre de las personas
son iguales, pese a la diversidad de dietas; considere un nivel de
significancia del 5%?
Se quiere verificar la eficiencia de tres tipos de abonos qumicos
como la rea, el nitrato y el fosfato, en el rendimiento del cultivo de
la papa; para ello se selecciona diferentes tipos de parcelas con las
mismas dimensiones, y se les somete a un tipo de tratamiento, a
cada parcela con un solo abono de los mencionados; al finalizar la
cosecha, los rendimientos de papa en kilos obtenidos por cada
parcela fueron:
Abono
Urea
Nitrato
Fosfato

Rendimiento de papa por parcelas en Kilos

100 120 116 98


120 98
103 100
97
100 94 121
Use un nivel de significancia del 1%
diferencia entre los rendimientos de
fertilizantes utilizados en la cosecha.

95
107 118
110
para poner a prueba si hay
parcela segn los tipos de

102

4.11

4.12

4.13

Un profesor de Inferencia Estadstica ensea el mismo curso en las


escuelas acadmicas profesionales de Ing. de Sistemas, Ing.
Informtica e Ing. Industrial. El decano de la facultad cree que el
profesor tiene diferentes criterios de evaluacin a los alumnos de
estas escuelas ya que manifiesta que en unas de estas se observa
mayores calificativos que en las otras; el mencionado profesor en su
defensa manifiesta que las diferencias de notas se deben al inters de
los alumnos por el curso.
Con la finalidad de desvirtuar malos entendidos, se muestrea a un
grupo de alumnos que llevaron el curso obtenindose los siguientes
calificativos:
Ing. Sistemas
13 11
09
10
14
12
Ing. Informtica 10 14
15
08
12
10
Ing. Industrial
11 09
13
12
12
13
Reftese la opinin del decano, o en su defecto, confrmelo;
considere un riesgo de equivocarse del 5%.
Una empresa educativa seleccionar un tipo de chisguete de tinta
para sus impresoras de inyeccin de tinta, para ello recibe una
cotizacin de cuatro casas comercializadoras que distribuyen
diferentes marcas (Epson, Canon, LexMark, y HP); a la empresa le
interesa aquella marca que le proporciona mayor durabilidad en las
impresiones; para ello selecciona una muestra aleatoria de un grupo
de chisguetes y los prueba hasta que se agoten las tintas, para ello
establece como parmetro de referencia la cantidad
de hojas
impresas, encontrndose los siguientes resultados:
Cantidad de hojas impresas con las mismas caractersticas de la
muestra de chisguetes obtenida
HP
206
200
184
199
230
EPSON
187
198
208
217
205
LEXMARK
230
185
198
200
199
CANON
195
215
215
207
195
Con los actuales conocimientos que posee, qu sugerencias
proporcionara a los directivos de la empresa a la luz de estos
resultados?; considere un nivel de significacin del 1%.
Se est tratando de averiguar si los efectos de la altitud influyen en
la presin sangunea de un grupo de personas que gustan viajar a las
partes ms altas de la sierra de Lima. Los resultados en muestras en

103

un grupo de personas, segn grupos de edades, indicaron las


siguientes presiones:
Presin sistlica de una muestra de personas, que viajan a la sierra,
segn grupo de edades:
Jvenes

4.14

Adultos

Adultos mayores

90
123
90
110
100
104
105
115
118
108
110
100
120
90
105
115
95
Demuestre si las presiones sistlicas logradas por estas personas,
pueden estar influenciadas por la altitud.
Generalmente en la poca de los exmenes, los alumnos de una
universidad afrontan ciertos comportamientos fuera de lo comn;
para poder estudiar si este tipo de actitud les afecta su presin
arterial, se decide hacer un estudio; previo a ello el departamento de
bienestar universitario determina que hay cuatro categoras de
conducta de los alumnos, como: los relajados, los tensos, los muy
tensos, y los normales; los resultados obtenidos se muestran a
continuacin:
Nivel de presin arterial de los alumnos de la universidad YYY, dentro
de la semana de exmenes, de acuerdo al tipo de conducta mostrado.
Conducta
Relajado
110
118
120
125
Normal
120
120
115
130
121
120
Tenso
125
130
125
135
140
Muy tenso
130
140
140
125

4.15

Explique las conclusiones que podran obtenerse como resultado de


este trabajo, considerando un riesgo de equivocarse del 2,5%
Una entidad financiera est interesado en determinar si el nivel
acadmico de los postulantes, que anualmente se presentan al
concurso de prcticas pre profesionales que la entidad ofrece como
un paso previo a la incorporacin de los futuros profesionales a su
staff, depende de la procedencia de la universidad. Para ello,
selecciona una muestra de postulantes que se presentaron a la ltima
convocatoria, procedentes de las universidades: La Catlica, UNI,
San Martn de Porres, y San Marcos; a dichos postulantes se les

104

somete a una prueba de conocimientos con calificativos de 0 a 100,


obteniendo los siguientes resultados:
Calificativo de los postulantes segn procedencia de la universidad.
PUC
87
54
66
78
50
UNI
67
65
89
58
80
UNMSM
45
56
85
92
64
SMP
78
70
85
76
74

4.16

Es posible afirmar que estos puntajes, estn asociados a la


universidad de donde provienen? Considere un nivel de
significacin del 5%.
Una empresa multinacional desea contar con nuevo pool de
ingenieros en las especialidades de industriales, informticos y de
sistemas, a fin de entrenarlos y enviarlos a sus diferentes filiales; sin
embargo el Administrador de Personal considera que estos
profesionales no tienen el mismo grado de responsabilidad y
puntualidad en el desempeo de sus funciones, debido a que cuenta
con una base de datos que permite sustentar su posicin. La gerencia
decide averiguar si es correcto lo que manifiesta el Administrador,
para ello extrae aleatoriamente de la base de datos, el historial de un
grupo de ingenieros correspondientes a estas especialidades,
encontrndose los siguientes resultados:
Nmero de faltas y observaciones en el desempeo de sus funciones de
los ingenieros asignados a la empresa XXX, entre los aos a
Industriales
Informticos
De Sistemas

3
11
2
6
3
8
5
4
6
10
5
5
4
2
3
3
a) Determine el nmero total de ingenieros seleccionados de la base de
datos.
b) Tiene razn en manifestar el Administrador que la formacin del
ingeniero, influye en el buen desempeo de sus funciones, dentro de
la organizacin?, considere un nivel de significancia del 5%.

105

Diseo de bloques aleatorizados


En el diseo completamente aleatorizado, los sujetos observados
son seleccionados al azar, y al azar son asignados a un solo tratamiento,
pudiendo tener cada tratamiento un nmero diferente de observaciones; en
este caso no se toma en cuenta la heterogenidad de los individuos
observados; en el diseo de bloques al azar, se toma en cuenta esta
heterogenidad, y para reducir los efectos que podran ocasionar en el diseo
experimental, se los agrupa en grupos homogneos; de este modo si
queremos evaluar el rendimiento de los trabajadores cuando ensayamos con
diferentes mtodos de trabajo, nos podra interesar agruparlos segn su
grado de instruccin, o su estado civil, o su procedencia, etc.; de este modo
estaramos tratando de reducir un factor que podra perturbar los resultados
del diseo experimental; a este factor se le denomina BLOQUE, y una
forma de representarlo, es el modelo siguiente:
Tratamiento
Total
1
2
3
.j.. c
Bloque
Fila

1
2
.
i
.
k
Total
Columna

y11
Y21

Y12
y22

y13
Y23

....
....

y1c
Y2c

T1.
T2.
.
Ti.
.

T.c

T..

....
. yij .
....
T.1

T.2

T.3

. T.j .

Donde:
Tratamiento: j = 1, 2, 3, . Tiene c elementos
Bloques
: i = 1, 2, 3, . Tiene k elementos
Nmero total de observaciones: n = k*r
El contraste de hiptesis ser en los siguientes trminos:
H0 = Los rendimientos seguirn siendo los mismos, pese a haberlos
agrupados a los elementos observados, en una caracterstica comn.
H1 = Por lo menos, uno de los rendimientos ser superior a los dems.
Agrupndoles a las observaciones, segn una de sus caractersticas
comunes.

106

Para aceptar o rechazar la hiptesis nula, deber, construirse su tabla de


anlisis de varianza, para ello, la suma de los cuadrados del total del
experimento estar conformado por:
SCT = SCTR + SCF + SCE
Donde:
SCT =
C; siendo C =
SCTR =

-C

SCF =
-C
SCE = SCT (SCTR + SCF)
Su tabla ANVA, contar con la siguiente informacin:
Fuente
Tratamiento
Fila
Error
TOTAL

SC
SCTR
SCF
SCE
SCT

g.l
c-1
k-1
(k-1)*(c-1)
ck-1

CM
CMTR

Fr
Fr =

CME

Este Fr calculado deber contrastarse con un Fc(, c-1, (k-1)*(c-1)); donde


es el nivel de significancia, y de acuerdo a ello, tomar la decisin
respectiva.

Ejemplo. La provincia de Huaura se est convirtiendo en un destino


turstico, dado que se est observando que mes a mes, la afluencia de
turistas viene incrementndose; dado que los grupos ocupacionales de los
turistas son diferentes, estos tambin buscan desarrollar diferentes prcticas
tursticas (aventura, gastronoma, arqueolgico, playa). Despus de que el
turista decide retornar a su destino, se decide entrevistarlo a fin de conocer
el grado de satisfaccin percibida de acuerdo a la prctica realizada; este
grado de satisfaccin se califica por medio de un puntaje como lo indica la
siguiente tabla:

107

Grado de satisfaccin del turista, por la prctica


desarrollada en Lima provincias, sector norte
Aventura Gastronoma Arqueolgico Playa

Grupo
Ocupacional
Comerciante
18
26
35
16
Empresario
8
42
20
19
Profesional
25
18
40
28
Estudiante
44
10
48
35
Considerando estos resultados, podra asegurarse que el grupo ocupacional
del turista, es determinante para desarrollar una prctica turstica,
asumiendo un riesgo de equivocarse del 5%?
Ejemplo. El gerente de crdito de un banco supone que una referencia para
proporcionar crdito a una persona, es la de ser poseedor o no una cuenta
de ahorro, o ser buen cliente de otro banco; de acuerdo a ello selecciona
una muestra de 200 clientes registrados en INFOCOR y los clasifica de
acuerdo a los atrasos en los pagos:
Sin Atrasos
Con atrasos
Tienen cuenta de ahorro
63
12
No tienen cuenta de ahorro
36
15
Es buen cliente de otro banco
41
33
Basndose en esta afirmacin, es correcta la afirmacin del gerente de
crdito?; considere un riesgo de equivocarse del 5%.

Problemas de Anlisis de Varianza: diseo de bloques


aleatorizado.
4.17

Describa un experimento donde se utilice el diseo de bloques


aleatorizado.

4.18

Demuestre que:

- C;

donde C =
4.19

Se est estudiando la resistencia a la comprensin de un tipo de


concreto para ser empelado en la futura ciudadela de Mi techo

108

propio; para ello se utiliza cuatro tipos diferentes de tcnicas de


mezclado, obtenindose los siguientes resultados:
Resistencia a la comprensin del concreto
Tcnicas de Mezclado
Kg/cm2

I
II
III
IV

4.20

102
114
107
95
116
106
120
115
108
113
106
121
110
100
98
106
Pruebe la hiptesis de que las tcnicas de mezclado no afectan la
resistencia del concreto, usando = 5%.
Se hace un estudio para saber si el nivel de gasto por da que
desarrollan los turistas extranjeros en el Per, provenientes de USA,
Inglaterra, Alemania y Francia, depende de su procedencia; para ello
se toman muestras aleatorias de nueve turistas de cada pas, con la
finalidad de conocer el promedio de gasto por da en US$,
encontrndose los siguientes resultados:
Promedio de gasto por
extranjeros
Pas
1
2
USA
120 90
Alemania 133 110
Inglaterra 100 130
Francia
102 118

4.21

da en el pas, en US$, de los turistas


3

110 99 105 129 118 130 100


95
95 100 110 100 125 130
130 127 105 95 97
99 102
115 112 100 100 106 118 115
Encuentre la respuesta para este caso, asumiendo un nivel de
significancia del 5%.
La siguiente tabla proporciona las notas promocionales de
Estadstica y Matemtica, de un grupo de estudiantes de ingeniera
cursados el ciclo anterior.
Calificativo
Matemtica
00 05
05 10
10 15
15 20

00 05

Calificativo en Estadstica
05 10
10 - 15 15 20

23
15
24
8
17
14
19
16
12
8
26
5
6
4
5
2
Podra asegurarse que las notas obtenidas por los alumnos, tanto en
Estadstica como en Matemtica, guardan una relacin entre s, o es
que son totalmente independientes? Sea = 5%.

109

4.22

Un casa comercial, especializada en el ensamblaje de equipos de


cmputo, est por potar qu tipo de marca de discos duros (HD) de
las marcas Quantum, Maxtor, Fireball o Seagate, deber adoptarse, a
fin de incorporar a los nuevos modelos de PC, que piensa lanzar al
mercado; para ello es preciso conocer el promedio de vida de estos
HD, que se cree, mucho depender del lugar donde sea llevado la
PC. Como los productos de la empresa son comercializados en todo
el Per, en cuatro regiones del pas, se le somete a un proceso de
simulacin del perodo de vida en aos, encontrndose los siguientes
resultados:
Duracin simulada, en aos, de los discos duros en las cuatro regiones
del pas:
Quantum Maxtor
Fireball
Seagate
Lima
5,2
5,1
4,8
4,9
Arequipa
5,3
5,8
5,2
5,4
Huancavelica
4,7
5,2
5,1
5,3
Cerro de Pasco
4,4
4,6
4,7
4,9
Puno
4,8
5,0
4,8
4,9

4.23

Los tcnicos que hicieron la prueba de duracin de estos HD,


manifiestan que el promedio de vida de estos discos duros, es el
mismo, pese a que trabajan en diferentes lugares del pas, usted,
con los conocimientos que posee al presente, podra darles la razn?
Considere un riesgo de equivocarse del 5%.
La Municipalidad de Huaura est investigando acerca del perodo de
pago trimestral en el cumplimiento de pagos por concepto del
impuesto predial, en todos sus clientes, conformados por
contribuyentes de los siguientes tipos: Rural, Residencial, Comercial
e Industrial. Para ello toma una muestra aleatoria entre todos los
clientes que pagaron oportunamente sus impuestos el pasado ao,
obteniendo la siguiente informacin:
Nmero total de clientes que pagaron sus respectivos impuestos prediales en
los trimestres correspondientes
Tipo de cliente
I
II
III
IV

Rural
Residencial
Comercial
Industrial

21
16
19
21
32
21
27
30
16
12
17
21
5
7
8
6
Despus de eliminar los efectos, pagos por tipo de cliente, podran
las autoridades municipales, concluir que los trimestres del ao,

110

4.24

tienen diferentes efectos en el pago del impuesto predial?; considere


= 0,025.
Se est estudiando el peso logrado en los cerdos que la granja Mis
Porcinos cra, para ser introducidos a los mercados de Huaura,
Barranca y Paramonga; para ello se elabora cuatro tipo de raciones
alimenticias en base a harina de pescado, melaza, afrecho y maz
amarillo; los pesos en kilos recabados en un muestra de estos cerdos,
despus de un perodo de observacin de dos meses son los
siguientes:
Tabla .
Tipos de raciones Pesos
alimenticias

1
2
3
4

4.25

4.26

obtenidos en kg.

150,5
148,5
167,2 154,2
147,6
153,2
140,2 153,9
152,3
144,1
141,5 140,7
160,2
140,2
144,4 140,5
Podra asegurarse que las diferentes raciones alimenticias
proporcionados a estos animales, influyeron en los pesos obtenidos?
Considere = 5%.
El departamento de ventas de una casa comercial dedicada a la venta
de ropas exclusivas de hombres, est interesado en conocer si existe
diferencias en las comisiones de ventas que perciben sus cinco
vendedores en los das de atencin al pblico; los resultados de estos
ingresos en S/ se indican en la siguiente tabla:
Tabla. Ingreso de los vendedores por comisin de ventas en los
das de la semana.
A
B
C
D
E
Lunes
20
12
11
45
18
Martes
21
17
30
12
17
Mircoles
15
20
12
10
23
Jueves
10
12
15
10
23
Viernes
23
17
15
12
28
Sbado
30
18
30
15
16
Podra asegurarse que existe diferencia en las comisiones de los
vendedores, o es que esta diferencia solo se debe al azar?, asuma un
nivel de significancia del 5%.
Se hace un estudio para saber si la estatura de las personas estaba
ligado al lugar de donde provenan; para ello, en la ciudad de

111

Huacho se toman muestras aleatorias de un grupo poblacional, de


diferentes edades, quienes provenan de Huaraz, Oyn, Hunuco,
Celendn y Sihuas, a quienes se les toma sus respectivas medidas en
metros, encontrndose los siguientes resultados:
Estatura promedio, en metros, de las personas segn procedencia de
origen y rango de edades
Rango
Huarz
Oyn
Hunuco Celendn Sihuas
edad, aos
8 11
1,34
1,28
1,36
1,42
1,45
11 14
1,42
1,41
1,43
1,44
1,46
14 17
1,67
1,70
1,58
1,65
1,73
17 20
1,70
1,69
1,62
1,72
1,71
20 23
1,68
1,69
1,66
1,70
1,72

A raz de estos datos, formule su contraste de hiptesis y explique


sus conclusiones, asumiendo un riesgo de equivocarse del 5%.
4.27 En un centro de experimentacin agrcola se va estudiar los efectos
de cuatro tipo de fertilizantes en el rendimiento de un tipo de
tomate; para ello se dividen cinco parcelas de igual tamao y forma,
se los codifica y se les asigna al azar un tipo de fertilizante, de tal
manera que esto se hace una sola vez. La siguiente tabla muestra los
resultados de la cosecha segn parcela y fertilizante empleado:
Rendimiento de tomate en kilos por parcela, segn tipo de fertilizante
utilizado
Tipo de fertilizante
Parcela
A
B
C
D
1
50
45
44
51
2
55
56
44
52
3
45
45
56
41
4
48
43
58
40
5
40
41
47
44

4.28

Proporcionan estos datos, suficiente evidencia como para concluir


que el rendimiento de tomate, est asociado al tipo de fertilizante y l
parcela utilizada, considerando un nivel de significancia del 1%
Se sospecha que la eleccin por una carrera universitaria por parte
de los postulantes a la UNJFSC est en funcin a los niveles de
ingresos familiares; para salir de especulaciones se toman muestras a
un grupo de postulantes de diferentes grupos socioeconmicos,
quienes optaban por postular a las carreras de Medicina, Ingeniera,

112

Derecho, Economa y Enfermera, encontrndose los siguientes


resultados:
Grupos
socioecon.

A
B
C
D
E

4.29

Cantidad de postulantes que eligieron las carreras de:


Medicina Ingeniera Derecho Economa Enferm.

23
15
7
6
5

11
13
20
8
11

8
12
16
17
9

6
13
10
9
15

Los grupos socioeconmicos de los alumnos influyeron en la


carrera elegida?
Un ingeniero informtico est probando diferentes formatos de
presentacin en pantalla de un nuevo tipo de software,
recientemente desarrollado en su empresa; la efectividad debe
analizarse en funcin a las compras desarrolladas por los clientes;
como tal durante un perodo de observacin, se obtuvo los siguientes
resultados:
Tipo
de Cantidad de software
presentacin

4.30

10
23
7
6
11

comprados

23
14
24
11
A
21
23
20
9
B
16
15
16
25
C
28
16
11
21
D
12
18
16
16
E
Existe alguna diferencia en la cantidad de software comprado
debido al formato de presentacin desarrollado? Considere un nivel
de significancia del 5%.
Se est tratando de averiguar si los turistas que vienen a Huacho
tienen tendencia a hacer gastos de acuerdo a la poca del ao en que
nos visitan; para ver ello se averigua en los lugares donde ms lo
frecuentan, siendo estos: La Campia, o visitando los diferentes
restos arqueolgicos, o simplemente pernoctando en la ciudad, para
ello se muestran a estos visitantes, y se les pregunta el promedio de
gasto que desarrolla durante en cada uno de estos lugares,
encontrndose los siguientes:

113

4.31

4.32

Promedio de gasto en S/ del turista en los lugares visitados.


Campia
Restos
Pernoctando
Estacin
de
Huacho
arqueolgicos
la ciudad
del ao
65
41
60
Verano
43
39
40
Otoo
52
55
45
Invierno
60
48
50
Primavera
Podra asegurarse que los niveles de gasto de los turistas estn
influenciados por las estaciones del ao?
Para mejorar el rendimiento acadmico de los alumnos, en el curso
de Inferencia estadstica, el dictado del curso, se ofrece en diferentes
horarios: 08:00, 11:00, 14:00, 17:00, y 20:00 horas; pero como
tambin se cree que este rendimiento puede estar influenciado por el
nivel socioeconmico de sus padres, se los agrupa en los cinco
grupos ocupacionales A, B, C, D, y E, y se los somete a una
evaluacin durante un cierto perodo de tiempo; los resultados
obtenidos, con una muestra de estudiantes se presentan en la
siguiente tabla:
Tabla. Nota de los alumnos obtenidos en el curso de Inferencia
Estadstica, segn horario dictado, y clasificados por su grupo
econmico.
Grupo socioeconmico al que pertenecen los alumnos
Horario del
A
B
C
D
E
curso
08:00 ->
14,2
10,8
11,4
14.1
08,3
11:00 ->
11,6
12,4
10,7
12,2
14,1
14:00 ->
13,8
10,7
12,7
14,1
10,8
17:00 ->
12,3
10,2
10,3
09,6
13,7
20:00 ->
10,5
14,2
07,8
13,6
10,8
Analice las caractersticas de este experimento, y presente sus
conclusiones finales, asumiendo un riesgo de equivocarse del 5% en
sus conclusiones.
Sobre la conducta social de las personas de nuestra sociedad, es
frecuente observar que por lo general, la gran mayora anda
escupiendo o ensuciando en las calles de la ciudad; con la finalidad
de introducir medidas correctivas tendientes a superar este mal
vicio, se disea cuatro programas incentivadores con la finalidad de

114

4.33

que las personas que andan escupiendo en las calles, dejen de


hacerlo; para ello se selecciona cinco personas por programa a
quienes se les agrupa en grupos homogneos, eliminando el efecto
de su procedencia, y se les somete a observacin para ver si la
tendencia a seguir escupiendo sigue con la misma, o a aumentado;
los resultados de estas observaciones se muestra en la siguiente
tabla:
Nmero de escupitajos de las personas observadas durante un
tiempo observado, de acuerdo a programas incentivadores y
procedencia.
Programas incentivadores
Procedencia
A
B
C
D
4
5
8
7
Huaura
4
8
5
2
Barranca
3
4
5
3
Lima
7
3
7
6
Huaral
7
6
2
4
Paramonga
Podra concluirse que los programas incentivadores tienen efectos
diferentes en este experimento?; asuma un riesgo de equivocarse del
5%.
Una compaa est interesado en probar con cuatro mtodos de
promocin, el grado aceptacin de un software de inventarios;
dichos mtodos son: a) Publicidad en el lugar de venta, b)
Publicidad a travs de los diarios, c) Publicidad a travs de una
demostracin en tienda, d) Publicidad a travs de la TV. Para
evaluar la efectividad de estos cuatro mtodos, tambin se prueba en
cuatro establecimientos comerciales, asegurndose si estos mtodos
publicitarios estarn influenciados por las formas de presentacin
del software; esto es: 1) En forma interactiva, dirigida, y avanzada;
los resultados de este experimento se reflejan en la cantidad de
software vendida, segn se muestra en la siguiente tabla:
Ventas de software en cuatro tiendas segn mtodos de
promocin y formas de presentacin.
Mtodos de promocin para el consumo del producto

Interactiva
Dirigida

Publicidad
lugar de
venta

Publicidad
en
peridicos

Demostracin
en tienda

20
4

11
13

22
25

Publicidad
en la TV

8
7

115

Avanzada
10
9
17
5
Evalese los efectos de la promocin del producto en estas tiendas,
con = 5%.
4.34 Se hace un estudio para saber si el nivel de gasto diario de US$, que
desarrollan los turistas extranjeros que arriban a un destino turstico
del Per, est asociado con su procedencia; para ello se los clasifica
de acuerdo a su procedencia, y de acuerdo al nivel de gasto logrado
por da, se va configurando la informacin proporcionada en la
siguiente tabla:
Nivel de gasto en US $ registrado por da
Procedencia
20 50
50 - 80 80 -110 110 - 140
Europa
5
12
6
5
Africa
10
6
4
3
Asia
7
13
15
16
Oceana
8
15
10
3
Norte
13
15
7
10
Amrica
Podra asegurarse que los gastos obtenidos por los turistas,
dependen del lugar de donde provienen? Considere un riesgo de
equivocarse del 5%.
4.35 Una gran empresa desea contar con nuevo pool de ingenieros en
las especialidades de industriales, informticos y de sistemas, a fin
de entrenarlos y enviarlos a sus diferentes filiales; sin embargo el
Administrador de Personal considera que debera tenerse cuidado
con la seleccin de los profesionales, porque dependiendo de su
procedencia, estos tres tipos de profesionales no muestran el mismo
grado de responsabilidad e inters en el desempeo de sus
funciones; esta afirmacin se basa en los registros histricos de los
profesionales que tuvieron la oportunidad de participar en esos
programas de capacitacin, quienes fueron observados y anotados en
los respectivos registros. Con la finalidad de tomar una posicin al
respecto, la gerencia decide averiguar si es correcto lo que
manifiesta el Administrador, para ello extrae aleatoriamente de la
base de datos, el historial de un grupo de ingenieros que participaron
en los programas de capacitacin y entrenamiento, anotndose las
cantidades de fallos y observaciones, segn se muestra en el
siguiente:

116

Nmero de faltas y observaciones en el desempeo de sus


funciones de los ingenieros que participaron en el programa de
capacitacin
Ingenieros
Universidad Industriales Informticos De Sistemas
procedencia
UNJFSC
3
11
2
UNI
6
3
8
UNFV
5
4
6
UNMSM
10
5
5
UNASAM
4
2
3

4.36

Debera darse la razn al Administrador, en el sentido que no todos


los ingenieros tienen el mismo sentido de responsabilidad en el
programa de entrenamiento; considere un nivel de significancia del
5%?
Un ingeniero estaba interesado en determinar el efecto de utilizar
cuatro marcas de aceites, para conocer el rendimiento en kilmetros
de los nuevos vehculos que hacan viajes interprovinciales. Asign
al azar los aceites a diez lotes de vehculos seleccionados tambin al
azar, cuyos resultados se muestran en la tabla:
Aceite
Rendimiento en kilmetros
A
50 56 53 48 55 55 53 59 55 57
B
54 51 54 49 48 46 47 51 46 48
C
56 49 45 53 47 56 47 47 55 53
D
52 54 48 50 51 57 56 49 51 52
El ingeniero desea saber si los datos indicaban que los aceites tenan
efectos diferentes sobre el rendimiento de los vehculos.

Anda mungkin juga menyukai