CARRION
FACULTAD DE INGENIERA
Prcticas de
DE INFERENCIA ESTADSTICA
f ( x) 1.0
i
MOISES E. ARMAS
< emiarin@gmail.com >
Seccin 3
Frases para meditar:
La teora es asesinada tarde o
temprano por la experiencia
La belleza es una carta de
presentacin a corto plazo
La protesta y la queja son el
refugio de la gente que desconfa
en s mismo
El trabajo arduo embrutece la
mente y lleva a cometer errores
Independientemente de su grado de
brillantez, nunca es conveniente
apostar con un perdedor.
El estadstico
2
r
=
i 1
(oi ei )2
define una distribucin chiei
35000
30000
25000
20000
15000
10000
5000
0
1
Aos observados
79
Edad de las
alumnas
1
2
3
4
5
6
[14 17[
[17 20[
[20 23[
[23 26[
[26 29[
[29 32[
Cantidades
observadas
32
40
45
38
39
31
80
Ejemplo 3.2 Los niveles de ingreso, en miles de soles, obtenidos por una
empresa dedicada a la comercializacin de software estn en funcin a los
niveles de gastos en publicidad segn se muestra en la siguiente tabla:
Gastos Publicidad. S/
Ingresos en miles S/
15 18 20 17 25 22 26 28 30 19
50 56 60 52 65 62 60 85 90 61
81
Observ.
I
1
2
3
4
5
6
7
8
9
10
Gastos
15
18
20
17
25
22
26
28
30
19
Ingreso real
oi
50
56
60
52
65
62
60
85
90
61
Ingreso Terico
ei
48
55
59
52
71
64
73
78
83
57
2
r
=
i 1
(oi ei )2
=
ei
4,50; este valor se confronta con lo proporcionado en la tabla del chi para
= n p 1 grados de libertad, donde p = 2 y al 5% de nivel de
significancia, correspondindole al nivel de significancia del 5% un chicrtico: 2(0,05; 7)= 14,07. Como el valor real es menor que ste, entonces
podemos decir que o existen suficientes evidencias para
rechazar la
hiptesis nula, por lo que debera aceptarse el ajuste.
Ejemplo 3.3 En horas de mayor afluencia de llegada de cliente a un cajero
automtico de un banco, se registran sus llegadas cada, en un intervalo de
cada tres minutos. El nmero de llegadas se contabilizan durante un
determinado nmero de veces, obtenindose los siguientes resultados:
Tabla: Llegada de clientes al cajero automtico de un banco:
# clientes que llegan
al cajero
Nmero de veces
registrado
0
5
1
15
2
32
3
20
4
10
5
7
Formule un modelo de llegada de clientes a este cajero; validndole al
1%.
82
Cantidad de
clientes que
compran
0
20
1
92
2
150
3
134
4
73
5
24
6
5
7
2
Los directivos de la empresa estn interesados en formular un
modelo de distribucin de probabilidad del comportamiento de compra de
estos clientes, con la finalidad de conocer su comportamiento terico y
prever en el futuro; proponga un modelo de distribucin adecuado a estas
caractersticas, y valdelo con un nivel de significancia del 5%.
83
E(x )
= 0,3571, y de que no puede comprar es q = 0,6429.
n
84
85
modo:
eij =
oij
adems, Gran_total =
i 1 j 1
86
c
El estadstico
2
r
=
i 1 j
(oij eij )2
sigue una distribucin chi
eij
1
cuadrado con
= (k-1)*(c-1) grados de libertad; este valor deber ser
contrastado con lo proporcionado de una tabla del Chi cuadrado, 2c( , ) a
un nivel de significancia y
grados de libertad. La relacin de
dependencia de ambas variables deber ser aceptada si el estadstico es
mayor que el obtenido de la tabla; de otro modo, es de prever que las dos
variables son independientes; es decir que los valores obtenidos nada tienen
que ver con las categoras de ambas variables.
Pachamanca
Ceviche
de pato
Sopa
Huachana
Cuy
picante
Comerciante
10
6
15
17
Empresario
8
12
11
10
Profesional
14
18
4
9
Estudiante
3
13
8
5
Podra asegurarse que los platos tpicos consumidos por los clientes,
estn relacionados con su grupo ocupacional?, asumiendo un riesgo de
equivocarse del 5%, y del 1%.
Solucin: El contraste de hiptesis deber hacerse en los siguientes
trminos:
Hiptesis Nula: La preferencia por los platos tpicos de los clientes, nada
tiene que ver con su grupo ocupacional (Ambas variables son
independientes).
Hiptesis Alternativa: La preferencia por los platos tpicos de los clientes
est relacionada con su grupo ocupacional.
87
2
Pachamanca
Comerciante
Empresario
Profesional
Estudiante
10,3
8,8
9,7
6,2
Ceviche
de pato
14,4
12,3
13,5
8,7
Sopa
Huachana
11,2
9,6
10,5
6,8
Cuy
picante
12,1
10,3
11,3
7,3
88
3.3
6 25 36 21 15 7
Determine el nmero promedio de pacientes ingresados por
da, as como su desviacin estndar.
b) Encuentre una curva de tendencia del comportamiento de
llegada de pacientes, y valdelo al 5%
Con la finalidad de conocer la distribucin de edad de los alumnos
de un centro educativo de nivel superior se confecciona la siguiente
tabla:
a)
3.6
3.7
N de alumnos
14 17
35
17 20
39
20 23
50
23 26
42
26 29
38
29 32
30
Existe suficiente evidencia como para decir que la edad de estos
alumnos sigue una distribucin uniforme?
R: 20,05; 5 = 11,07
2 r = 5,8462
Un alumno est tratando de construir un modelo de distribucin de
probabilidades del comportamiento de llegada de clientes al cajero
89
0
12
1
45
2
34
3
21
4
13
5
8
Ayude a construir al alumno un modelo de distribucin de
probabilidad de llegadas, validndole respectivamente; considera
un nivel de significancia del 5%.
3.8 El promedio de notas de los alumnos de ingeniera, obtenidos en el
curso de Lenguaje de Programacin durante el ciclo pasado, estn
tabulados en la siguiente tabla:
Notas
obtenidas Nmero de alumnos
por los alumnos
observados
[ 0 4[
8
[ 4 8[
13
[ 8 12[
20
[12 16[
10
[16 20[
4
Encuentre una curva de comportamiento terico del comportamiento
de estas notas, y valdelo al 1%.
3.9 Para qu se desarrolla una prueba de contingencia?
3.10 Qu significa decir que las variables son independientes, en una
prueba de contingencia?
3.11 De qu manera se puede validar una prueba de contingencia?
3.12 Explique el significado de que dos variables son dependientes, luego
de desarrollar la prueba de contingencia.
3.13 Una compaa de seguros tiene que optar por escoger dentro de cuatro
planes de seguros de vida que actualmente ofrece a sus clientes; para
ello desea conocer si la preferencia por algn plan de seguros de sus
clientes est asociada al nivel ocupacional en ejercicio. Se toma una
muestra aleatoria de un grupo de clientes usuarios de este plan,
obtenindose los siguientes resultados:
90
Nivel ocupacional
Obreros
Comerciantes
Profesionales
Independientes
30
45
35
70
48
39
47
65
59
46
52
60
20
15
10
22
a) Podra asegurarse que el plan de seguros optado por los clientes
nada tiene que ver con los tipos de clientes?, considere un riesgo
de equivocarse del 1%.
b) Qu debera pasar para decir que el plan de seguros optados por
los clientes, est asociado a su nivel ocupacional, considerando un
riesgo de equivocarse del 5%?
3.14 Un canal de televisin est interesado en saber si los programas que
transmite da a da influyen en el grado de conducta de su tele
audiencia; para tales fines selecciona una muestra aleatoria de un
grupo de televidentes de diferentes grupos de edades, y los somete a
una prueba psicolgica, despus de un perodo de observacin,
encontrndose los siguientes resultados:
Nivel de conducta observada en una muestra de televidentes, como
resultado de sus programaciones, de la Empresa Televisiva XXXX
Grupo de
Muy
Agresivo
Normal Hiperactivo
personas
agresivo
Nios
15
28
22
20
Jvenes
24
14
20
17
Adultos
10
12
24
14
Tercera edad
6
16
14
9
91
92
93
Nivel
Cultural
Escupe
Tira
papeles u
otros
8
10
15
Orina en
la calle
Fuma
13
7
5
Primaria
15
3
11
Secundaria
9
4
10
Superior
Incompleta
5
12
2
16
Profesional
Universitario
A la luz de estos resultados, formlese una teora y generalcese para
la poblacin de la provincia, asumiendo un riesgo de equivocarse del
5%.
3.19 ldll
94
Seccin 4
Frases para meditar:
Nunca soplarn vientos favorables
para el que no sabe a dnde va.
La esencia de su problema es el
reconocimiento exterior. Dedique
gran parte de su tiempo a buscar
un experto externo que pueda
certificar su creatividad.
Si uno quiere salir adelante en una
sociedad grande, tiene que ser
poltico, tiene que hacer amistades,
pero nunca olas.
Hay que cuidar del maana por
todos los medios, meditando,
proyectando, y preparndose pero
sin ansiedades.
Anlisis de Varianza
Diseos experimentales.
Consideremos el siguiente caso: Por lo general, en el sistema
educativo de nuestro medio, tenemos problemas de bajo rendimiento
acadmico de los alumnos, al margen de que en algunas instituciones se las
maquille con otros tipos de formalidades, esto es una constante que ao tras
ao agobia a nuestra educacin nacional, cuyos resultados de la mala
educacin peruana son manifestadas negativamente
el contexto
internacional; se podra ensayar una serie de respuestas que expliquen el
comportamiento de estas actitudes, as como tambin proponer una serie
de medidas con la finalidad de elevar el bajo rendimiento acadmico de los
alumnos; ahora vaymonos a un lugar ms especfico, una universidad,
supongamos que las autoridades universitarias son conscientes de esta
problemtica y desean elevar el nivel acadmico de sus alumnos, para ello
proponen otorgarles una serie de premios de modo que les estimule a ser
cada vez mejor y lograr los premios establecidos; se plantean lo siguientes
95
96
para decidir por una opcin; para seguir adelante, es necesario conocer la
terminologa utilizada en este tipo de diseos experimentales.
Un experimento consiste de una serie de actividades que se
desarrolla con la finalidad de producir un conocimiento u obtener alguna
informacin; para ello se utilizan variables independientes que el
investigador puede manipular a su antojo, a cada uno de ellos se les llama
tratamiento; para nuestro caso, las variables independientes estn
constituidos por los diferentes premios que la universidad ofrece como
estmulo para elevar el rendimiento acadmico; una variable dependiente
es el resultado del manejo de la variable independiente, y es lo que se busca
conocer; una unidad experimental es el elemento individual al que se le
aplica al tratamiento; en este caso la unidad experimental viene a constituir
el alumno, cuyo resultado o valor dependiente ser expresada en una cierta
unidad de medida; si continuamos con el ejemplo, entonces podemos
manifestar que el resultado de la medicin, se expresar en una nota.
A continuacin veremos algunos modelos de diseos
experimentales ms conocidos; stos son el diseo completamente
aleatorizado, diseo de bloques al azar, diseo factorial, y cuadrado latino.
97
Media
Varianza
y.1
S.12
y.2.
S.22
y.3
S.32
...
...
y.j
S.j2
...
y.k
S.k2
98
-C
SCF =
-C
SCE = SCT (SCTR + SCF)
Su tabla ANVA, contar con la siguiente informacin:
Fuente
Tratamiento
Error
TOTAL
SC
SCTR
SCE
g.l
k-1
n-k
SCT
n-1
CM
CMTR
CME
Fr
Fr =
Donde CMTR =
CME =
Este Fr calculado deber contrastarse con un Fc(, c-1, (k-1)*(c-1)); donde
es el nivel de significancia, y de acuerdo a ello, tomar la decisin
respectiva.
99
08:00
11:00
10:00
13:00
14:00
17:00
16:00
19:00
18:00
21:00
4.3
4.4
100
4.5
4.6
4.7
4.8
12,6
11,5
09,2
14,2
15,1
13,3
08,5
12,2
13,1
11,6
12,3
10,7
12,4
10,2
13,2
10,1
12,5
11,2
13,2
07,7
09,8
10,2
11,8
10,9
07,2
11,5
11,7
14,4
16,2
12,8
10,7
13,6
11,6
13,4
05,5
11,5
12,2
07,5
10,3
08,7
101
4.9
Verduras
203
263
205
222
299
201
242
4.10
Pescado
Carne
Granos
217
205
200
220
231
204
198
233
245
234
198
210
250
210
216
200
216
205
201
208
205
238
242
212
240
217
Constituyen estos resultados, suficiente evidencia como para
manifestar que los niveles de colesterol en la sangre de las personas
son iguales, pese a la diversidad de dietas; considere un nivel de
significancia del 5%?
Se quiere verificar la eficiencia de tres tipos de abonos qumicos
como la rea, el nitrato y el fosfato, en el rendimiento del cultivo de
la papa; para ello se selecciona diferentes tipos de parcelas con las
mismas dimensiones, y se les somete a un tipo de tratamiento, a
cada parcela con un solo abono de los mencionados; al finalizar la
cosecha, los rendimientos de papa en kilos obtenidos por cada
parcela fueron:
Abono
Urea
Nitrato
Fosfato
95
107 118
110
para poner a prueba si hay
parcela segn los tipos de
102
4.11
4.12
4.13
103
4.14
Adultos
Adultos mayores
90
123
90
110
100
104
105
115
118
108
110
100
120
90
105
115
95
Demuestre si las presiones sistlicas logradas por estas personas,
pueden estar influenciadas por la altitud.
Generalmente en la poca de los exmenes, los alumnos de una
universidad afrontan ciertos comportamientos fuera de lo comn;
para poder estudiar si este tipo de actitud les afecta su presin
arterial, se decide hacer un estudio; previo a ello el departamento de
bienestar universitario determina que hay cuatro categoras de
conducta de los alumnos, como: los relajados, los tensos, los muy
tensos, y los normales; los resultados obtenidos se muestran a
continuacin:
Nivel de presin arterial de los alumnos de la universidad YYY, dentro
de la semana de exmenes, de acuerdo al tipo de conducta mostrado.
Conducta
Relajado
110
118
120
125
Normal
120
120
115
130
121
120
Tenso
125
130
125
135
140
Muy tenso
130
140
140
125
4.15
104
4.16
3
11
2
6
3
8
5
4
6
10
5
5
4
2
3
3
a) Determine el nmero total de ingenieros seleccionados de la base de
datos.
b) Tiene razn en manifestar el Administrador que la formacin del
ingeniero, influye en el buen desempeo de sus funciones, dentro de
la organizacin?, considere un nivel de significancia del 5%.
105
1
2
.
i
.
k
Total
Columna
y11
Y21
Y12
y22
y13
Y23
....
....
y1c
Y2c
T1.
T2.
.
Ti.
.
T.c
T..
....
. yij .
....
T.1
T.2
T.3
. T.j .
Donde:
Tratamiento: j = 1, 2, 3, . Tiene c elementos
Bloques
: i = 1, 2, 3, . Tiene k elementos
Nmero total de observaciones: n = k*r
El contraste de hiptesis ser en los siguientes trminos:
H0 = Los rendimientos seguirn siendo los mismos, pese a haberlos
agrupados a los elementos observados, en una caracterstica comn.
H1 = Por lo menos, uno de los rendimientos ser superior a los dems.
Agrupndoles a las observaciones, segn una de sus caractersticas
comunes.
106
-C
SCF =
-C
SCE = SCT (SCTR + SCF)
Su tabla ANVA, contar con la siguiente informacin:
Fuente
Tratamiento
Fila
Error
TOTAL
SC
SCTR
SCF
SCE
SCT
g.l
c-1
k-1
(k-1)*(c-1)
ck-1
CM
CMTR
Fr
Fr =
CME
107
Grupo
Ocupacional
Comerciante
18
26
35
16
Empresario
8
42
20
19
Profesional
25
18
40
28
Estudiante
44
10
48
35
Considerando estos resultados, podra asegurarse que el grupo ocupacional
del turista, es determinante para desarrollar una prctica turstica,
asumiendo un riesgo de equivocarse del 5%?
Ejemplo. El gerente de crdito de un banco supone que una referencia para
proporcionar crdito a una persona, es la de ser poseedor o no una cuenta
de ahorro, o ser buen cliente de otro banco; de acuerdo a ello selecciona
una muestra de 200 clientes registrados en INFOCOR y los clasifica de
acuerdo a los atrasos en los pagos:
Sin Atrasos
Con atrasos
Tienen cuenta de ahorro
63
12
No tienen cuenta de ahorro
36
15
Es buen cliente de otro banco
41
33
Basndose en esta afirmacin, es correcta la afirmacin del gerente de
crdito?; considere un riesgo de equivocarse del 5%.
4.18
Demuestre que:
- C;
donde C =
4.19
108
I
II
III
IV
4.20
102
114
107
95
116
106
120
115
108
113
106
121
110
100
98
106
Pruebe la hiptesis de que las tcnicas de mezclado no afectan la
resistencia del concreto, usando = 5%.
Se hace un estudio para saber si el nivel de gasto por da que
desarrollan los turistas extranjeros en el Per, provenientes de USA,
Inglaterra, Alemania y Francia, depende de su procedencia; para ello
se toman muestras aleatorias de nueve turistas de cada pas, con la
finalidad de conocer el promedio de gasto por da en US$,
encontrndose los siguientes resultados:
Promedio de gasto por
extranjeros
Pas
1
2
USA
120 90
Alemania 133 110
Inglaterra 100 130
Francia
102 118
4.21
00 05
Calificativo en Estadstica
05 10
10 - 15 15 20
23
15
24
8
17
14
19
16
12
8
26
5
6
4
5
2
Podra asegurarse que las notas obtenidas por los alumnos, tanto en
Estadstica como en Matemtica, guardan una relacin entre s, o es
que son totalmente independientes? Sea = 5%.
109
4.22
4.23
Rural
Residencial
Comercial
Industrial
21
16
19
21
32
21
27
30
16
12
17
21
5
7
8
6
Despus de eliminar los efectos, pagos por tipo de cliente, podran
las autoridades municipales, concluir que los trimestres del ao,
110
4.24
1
2
3
4
4.25
4.26
obtenidos en kg.
150,5
148,5
167,2 154,2
147,6
153,2
140,2 153,9
152,3
144,1
141,5 140,7
160,2
140,2
144,4 140,5
Podra asegurarse que las diferentes raciones alimenticias
proporcionados a estos animales, influyeron en los pesos obtenidos?
Considere = 5%.
El departamento de ventas de una casa comercial dedicada a la venta
de ropas exclusivas de hombres, est interesado en conocer si existe
diferencias en las comisiones de ventas que perciben sus cinco
vendedores en los das de atencin al pblico; los resultados de estos
ingresos en S/ se indican en la siguiente tabla:
Tabla. Ingreso de los vendedores por comisin de ventas en los
das de la semana.
A
B
C
D
E
Lunes
20
12
11
45
18
Martes
21
17
30
12
17
Mircoles
15
20
12
10
23
Jueves
10
12
15
10
23
Viernes
23
17
15
12
28
Sbado
30
18
30
15
16
Podra asegurarse que existe diferencia en las comisiones de los
vendedores, o es que esta diferencia solo se debe al azar?, asuma un
nivel de significancia del 5%.
Se hace un estudio para saber si la estatura de las personas estaba
ligado al lugar de donde provenan; para ello, en la ciudad de
111
4.28
112
A
B
C
D
E
4.29
23
15
7
6
5
11
13
20
8
11
8
12
16
17
9
6
13
10
9
15
4.30
10
23
7
6
11
comprados
23
14
24
11
A
21
23
20
9
B
16
15
16
25
C
28
16
11
21
D
12
18
16
16
E
Existe alguna diferencia en la cantidad de software comprado
debido al formato de presentacin desarrollado? Considere un nivel
de significancia del 5%.
Se est tratando de averiguar si los turistas que vienen a Huacho
tienen tendencia a hacer gastos de acuerdo a la poca del ao en que
nos visitan; para ver ello se averigua en los lugares donde ms lo
frecuentan, siendo estos: La Campia, o visitando los diferentes
restos arqueolgicos, o simplemente pernoctando en la ciudad, para
ello se muestran a estos visitantes, y se les pregunta el promedio de
gasto que desarrolla durante en cada uno de estos lugares,
encontrndose los siguientes:
113
4.31
4.32
114
4.33
Interactiva
Dirigida
Publicidad
lugar de
venta
Publicidad
en
peridicos
Demostracin
en tienda
20
4
11
13
22
25
Publicidad
en la TV
8
7
115
Avanzada
10
9
17
5
Evalese los efectos de la promocin del producto en estas tiendas,
con = 5%.
4.34 Se hace un estudio para saber si el nivel de gasto diario de US$, que
desarrollan los turistas extranjeros que arriban a un destino turstico
del Per, est asociado con su procedencia; para ello se los clasifica
de acuerdo a su procedencia, y de acuerdo al nivel de gasto logrado
por da, se va configurando la informacin proporcionada en la
siguiente tabla:
Nivel de gasto en US $ registrado por da
Procedencia
20 50
50 - 80 80 -110 110 - 140
Europa
5
12
6
5
Africa
10
6
4
3
Asia
7
13
15
16
Oceana
8
15
10
3
Norte
13
15
7
10
Amrica
Podra asegurarse que los gastos obtenidos por los turistas,
dependen del lugar de donde provienen? Considere un riesgo de
equivocarse del 5%.
4.35 Una gran empresa desea contar con nuevo pool de ingenieros en
las especialidades de industriales, informticos y de sistemas, a fin
de entrenarlos y enviarlos a sus diferentes filiales; sin embargo el
Administrador de Personal considera que debera tenerse cuidado
con la seleccin de los profesionales, porque dependiendo de su
procedencia, estos tres tipos de profesionales no muestran el mismo
grado de responsabilidad e inters en el desempeo de sus
funciones; esta afirmacin se basa en los registros histricos de los
profesionales que tuvieron la oportunidad de participar en esos
programas de capacitacin, quienes fueron observados y anotados en
los respectivos registros. Con la finalidad de tomar una posicin al
respecto, la gerencia decide averiguar si es correcto lo que
manifiesta el Administrador, para ello extrae aleatoriamente de la
base de datos, el historial de un grupo de ingenieros que participaron
en los programas de capacitacin y entrenamiento, anotndose las
cantidades de fallos y observaciones, segn se muestra en el
siguiente:
116
4.36