FEDERICO VILLARREAL
Facultad de Ciencias Econmicas
ESTADSTICA INFERENCIAL
JORGE L. PASTOR PAREDES
DEFINICIN DE ESTADSTICA
MTODOS CUANTITATIVOS
PARAMTRICA
DESCRIPTIVA
Dist. de Frecuencias
Med. de Tendencia Central
Med. de Dispersin
Med. de Localizacin
INFERENCIAL
Probabilidad
Distribucin Discreta
Distribucin Normal
Muestreo
Prueba de Hiptesis
ANOVA
Regresin Simple
Regresin Mltiple
Series de Tiempo
ARIMA (Box Jenkins)
NO PARAMTRICA
Contrastes:
Homogeneidad
Chi-X2 de Independencia
de Bondad de Ajuste
Mltiples de Bondad de Medias
Mltiples de Homogeneidad :
Kruskal Wallis
1-4
TIPOS DE ESTADSTICAS
I. ESTADSTICA PARAMTRICA
Se basa en parmetros poblacionales en la que se trabaja con
informacin obtenida con una escala de medida intervalar o de razn.
1. Estadstica Descriptiva: mtodos para organizar, resumir y
presentar datos de manera informativa.
Ejemplo 1: Un sondeo de opinin encontr que 49% de las personas en una
encuesta no saban el nombre del primer libro de Vargas Llosa.
La estadstica 49 describe el nmero de cada 100 personas que no saben la
respuesta.
Ejemplo 2: Segn el Consumer Reports, los dueos de lavadoras de ropa
Whirlpool reportaron 9 problemas por cada 100 mquinas durante el 2012. La
estadstica 9 describe el nmero de problemas por cada 100 mquinas.
1-5
1-7
TIPOS DE VARIABLES
1. Variable Cualitativa o Categrica: expresa una cualidad o
categora de un determinado suceso; no es numrica. Su
medicin es nominal u ordinal. Son mutuamente excluyentes.
Atributos o porcentajes.
Ejemplos: sexo, afiliacin religiosa, tipo de automvil que se
posee, lugar de nacimiento, color de los ojos, V o F, Si o No.
2. Variable Cuantitativa: expresan cantidades numricas de
datos; la variable se puede registrar numricamente.
Ejemplo: saldo en una cuenta de cheques, minutos que faltan
para que termine la clase, nmero de nios en una familia.
Jorge L. Pastor Paredes
1-9
NIVELES DE MEDICIN
1. NOMINAL
Referidos a etiquetas o
nombres que se usan
para identificar un
atributo del elemento.
Solamente se pueden
clasificar o contar datos.
No existe algn orden
especfico entre las
clases.
2. ORDINAL.
Es cuando los datos se
organizan de acuerdo a
un orden. Ordena los
datos por jerarquas.
Jorge L. Pastor Paredes
Empresa
Beneficios
Volcan SA
1250,000
Alicorp
1100,000
Telefnica
800,000
Bco. Crdito
650,000
Saga
400,000
TOTAL
Calificacin
4200,000
Frecuencia
Excelente
Bueno
28
Regular
25
Malo
12
Muy malo
Total
74
BASE DE DATOS
1. Dato Estadstico:
Son las observaciones efectuadas en un momento determinado,
estn asociados al estudio de una o mas variables. Son los
valores que componen las variables. Ejemplo: ventas diarias de
menestras efectuadas por un Supermercado.
2. Datos Transversales
Son aquellos en el cual se rene en el mismo o aproximadamente en
el mismo punto del tiempo. Ejemplo: extraer una muestra de 1.000
empresas de un sector econmico al azar de esa poblacin,
identificar su volumen de ventas y calcular el porcentaje de la
muestra que la clasifica como PYME. Por ejemplo, el 30% de
nuestra muestra fueron clasificados como PYMEs.
2-12
Histogramas
Polgonos de Frecuencia
2-13
Histogramas:
2-14
2-15
Polgono de frecuencias
para las horas de estudio
2-16
2-19
2-22
ESTADSTICA INFERENCIAL
Tamao = N
Poblacin
Muestra
Media
DS
Tamao = n
Media
= X
DS
= s
Distribucin de Probabilidad
3/8
2/8
1/8
0
1
2
3
Nmero de Caras
6-3
Variables Aleatorias
SSC
SSS CSC
Entonces, los valores posibles
CSS
2, 3.
SCC
SCS CCC
de
CCSX (nmero de caras) son x = 0, 1,
6-5
Explicacin:
6-8
6-9
6-10
= E ( x) =
[ x * P( x)]
6-12
[( x ) P( x)]
2
Ejemplo:
La siguiente distribucin de
probabilidad corresponde a los
autos vendidos con sus
respectivas probabilidades,
encontrar la media y la varianza
de la distribucin
X
0
1
2
3
4
P(x)
0.10
0.20
0.30
0.30
0.10
XP(x)
0
0.20
0.60
0.90
0.40
= 2.10
X-
-2.1
-1.1
-0.1
0.9
1.9
No. Autos
Vendidos
X
0
1
2
3
4
Prob.
P(x)
0.10
0.20
0.30
0.30
0.10
6-14
Distribuciones de Probabilidad
Distribucin
Discreta
Binomial
Hipergeomtrica
Poisson
Distribucin
Continua
Normal
Exponencial
Uniforme
6-18
Distribucin de Probabilidad
Binomial
6-20
n!
P( x)
x (1 ) n x
x !(n x )!
n el nmero de ensayos
x el nmero de xitos
observados
la probabilidad de xito en
cada ensayo (no es pi=3.1416)
n (1 )
Desviacin
n (1 )
6-21
Ejemplo:
La respuesta a una pregunta de verdadero/falso es correcta o incorrecta.
Considere que 1) un examen consiste en cuatro preguntas de
verdadero/falso, y 2) un estudiante no sabe nada a cerca de la materia. La
probabilidad de que el alumno adivine la respuesta correcta a la primera
pregunta es 0.50, Asimismo, la probabilidad de acertar en cada una de las
preguntas restantes vale 0.50.
Cul es la probabilidad de:
a) No obtener exactamente ninguna de las cuatro en forma correcta.
b) Obtener exactamente una de las cuatro.
c) Encontrar la media y la varianza.
4!
a) P (0)
0.500 (1 0.50) 4 0 0.0625
0!(4 0)!
4!
b) P (1)
0.501 (1 0.50) 4 1 0.2500
1!(4 1)!
Jorge L. Pastor Paredes UBA, UNFV, UNSA
6-22
n 4(0.50) 2
Varianza = 2 = n (1 - ) = (4)(0.50)(1-0.50) =1
Desv. Estndar = 1 1
2
6-27
Distribucin Hipergeomtrica
Caractersticas:
a)
b)
c)
(S C x )( N S C n x )
P(x)
N Cn
Jorge L. Pastor Paredes UBA, UNFV, UNSA
Donde:
N es el tamao de la poblacin,
S es la cantidad de xitos en la poblacin,
x es el nmero de xitos de inters,
n es el nmero de ensayos o muestra, y
C es una combinacin.
6-28
Ejemplo:
Durante la semana se fabricaron 50 juegos de PayStation (N=50).
Operaron 40 sin problemas (S=40) y 10 tuvieron al menos un defecto.
Se selecciona una muestra al azar de 5 (n=5). Cul es la probabilidad
de que 4 (x=4) de las 5 funcionen perfectamente? Observe que el
muestreo se hace sin reposicin y que el tamao de la muestra de 5 es
10% de la poblacin (esto es mayor que la condicin de 5%).
Solucin:
( 40 C 4 )(50 40 C5 4 )
P(4)
50 C 5
40! 10!
(
)(
)
4!36! 1!9! (91,390)(10)
P(4)
0.431
50!
2'118,760
5!45!
6-30
Distribucin de Poisson
e
P( x )
x!
x
Donde:
es la media aritmtica del nmero de
ocurrencias (xitos) en un intervalo
especfico de tiempo.
e es la constante 2.71828
x es el nmero de ocurrencias (xitos).
Ejemplo:
Una muestra aleatoria de 1000 viajes areos revela un total de 300
maletas perdidas. La media aritmtica del nmero de maletas perdidas
por vuelo es 0.3 (300/1000). Si la cantidad de maletas perdidas por
viaje areo sigue una distribucin de Poisson con = 0.30 Calcular la
probabilidad de no perder ninguna maleta y la probabilidad de perder
una maleta.
x e u
P( x)
x!
0.30 e 0.30
P ( 0)
0.7408
0!
0.31 e 0.30
P(1)
0.2222
1!
7-3
Distribucin de
Probabilidad Normal
En teora, la curva se
extiende hasta el
infinito.
Cola +
Cola -
Me=Md=Mo
Jorge L. Pastor Paredes UBA, UNFV, UNSA
= 1.6
= 1.6
=283
=310
h
i
h
i
=321
=52
=26
h
i
=41
=283
Y
i
=310
Y
i
=321
7-6
X
z
-z
Jorge L. Pastor Paredes UBA, UNFV, UNSA
1.91
+z
7-7
Ejemplo:
La media de un grupo de ingresos semanales con distribucin normal para un gran conjunto de gerentes
de nivel medio, es $1000 cul es el desvo normal o valor z para un ingreso x de 1100? para uno de
900? DS=100
Solucin:
para x = 1100
para x = 900
0.3413
1100 1000
Z
1.00
El desvo Z=1.00
100 indica que
900 1000
Z
1.00
100 de $1100 para
ingreso semanal
un
un gerente de nivel medio est una
desviacin estndar por en cima de la media; asimismo Z=-1 indica que un ingreso de $900 se encuentra
una desviacin estndar por debajo de la media.
El 34.13% de los ingresos semanales estn entre 1100 y 1000 o existe una probabilidad
0 de1 34.13% que el
ingresos especfico se halle entre 1100 y 1000.
1000
1100
7-8
2 1
2 3
68.26%
95.44%
99.74%
3
-3
2 1 1
-2
-1
2 3
2
7-11
Muestreo Probabilstico
8-4
Muestreo Probabilstico
Mtodo Probabilstico:
Es una muestra seleccionada de manera que cada integrante de la poblacin
que se estudia tenga una probabilidad conocida (no igual a cero) de ser
incluida en la muestra.
Caracterstica: el azar determina los integrantes de la muestra.
Mtodo No Probabilstico:
Muestra en que no todos los integrantes de la poblacin tienen probabilidad
de ser incluidos en la muestra.
Los resultados pueden ser sesgados y no representativos de la poblacin.
Ejemplo, muestreo por panel o por accin directa: la seleccin de los
miembros del panel se basa en el juicio del investigacdor, y por lo tanto los
resultados de la muestra pueden no ser representativos de toda la poblacin.
8-5
8-6
El error de muestreo:
Es la diferencia entre un estadstico muestral y su
parmetro poblacional.
12,14
12,16
14,12
14,14
14,16
16,12
16,14
16,16
N
n
N
N!
=
n!(N-n)!
n
3
3!
3 x 2!
3
2!(3 2)! 2!1!
2
Las muestras son: 2,4; 2,6; 4,6 Cada de estas muestras tienen 1/3 de
probabilidad de ser escogida
Distribucin de Muestreo
Media
X
j 1
Varianza
2
(
x
j 1
N
N
Desviacin
Estndar
2
(
x
j 1
8-8
X (X-)2
14
15
16
17
18
= 80
-2
-1
0
1
2
0
4
1
0
1
4
10
80
16
5
10
2
5
1.4142
14,14
15,14
16,14
17,14
18,14
X
14.0
14.5
15.0
15.5
16.0
Muestra
Muestra
14,15
15,15
16,15
17,15
18,15
14.5
15.0
15.5
16.0
16.5
14,16
15,16
16,16
17,16
18,16
X
15.0
15.5
16.0
16.5
17.0
Muestra
14,17
15,17
16,17
17,17
18,17
X Muestra
15.5 14,18
16.0 15,18
16.5 16,18
17.0 17,18
17.5 18,18
X
16.0
16.5
17.0
17.5
18.0
8-9
fX
f (X )
fX 400
16
f
25
f
(
X
)
5.
X
f
25
1
25
2
X 1
8-10
X
14.0
14.5
15.0
15.5
16.0
16.5
17.0
17.5
18.0
1
2
3
4
5
4
3
2
1
25
Se ha obtenido
2
X
fX
14
29
45
62
80
66
51
35
18
400
4.00
2.25
1.00
0.25
0.00
0.25
1.00
2.25
4.00
4.0
4.5
3.0
1.0
0.0
1.0
3.0
4.5
4.0
25.0
1/25
2/25
3/25
4/25
5/25
4/25
3/25
2/25
1/25
25/25
2 2 2
2
; X
X
2
2 n
n
n
Error Muestral de
la distribucin de
Probabilidad.
8-11
1.4142
X
1
n
2
Las probabilidades de 25 medias muestrales se presentan en la ltima
columna de la tabla anterior. Cuando las 25 muestras se seleccionan al
azar, cada muestra tendr la probabilidad de 1/25 de ser seleccionada.
Puesto que hay cuatro muestras con 15.5, por ejemplo, y el total de
medias es 25, la probabilidad de que una muestra seleccionada tenga
media de 15.5 ser 4/25.
Jorge L. Pastor Paredes UBA, UNFV, UNSA
10
n
2! 5 2 !
C n n! N n !
n
2
Muestra
Muestra
14,15
14,16
14,17
14,18
15,16
14.5
15.0
15.5
16.0
15.5
15,17
15,18
16,17
16,18
17,18
16.0
16.5
16.5
17.0
17.5
4.
5.
14.5
15.0
15.5
16.0
16.5
17.0
17.5
1
1
2
2
2
1
1
10
fX
14.5
15.0
31.0
32.0
33.0
17.0
17.5
160
fX 160
16
f
10
f ( X ) 2
7.5
0.866
X
f
10
2.25
1.00
0.25
0.00
0.25
1.00
2.25
2.25
1.00
0.50
0.00
0.50
1.00
2.25
7.50
1/10
1/10
2/10
2/10
2/10
1/10
1/10
10/10
El mustreo sin reemplazo genera poblaciones finitas, de tal manera que para
calcular la desviacin estndar de la distribucin muestral de medias, es decir
el error estndar de las medias, en muestreo sin reemplazo, se tiene que
introducir el factor de correccin finita:
N n
N 1
N n
x
N 1
n
1.4141 5 2
x
0.866
1.4141 5 1
8-12
X
n
X si
Para muestras aleatorias de poblaciones finitas,
es la
media de una muestra aleatoria de tamao n de una
poblacin finita con la media y la desviacin estndar y
n es grande, entonces:
Es el valor Z de una variable aleatoria que tiene
X
z
aproximadamente
la
distribucin
normal
X
s
n
Ejemplo:
Cul es la probabilidad de que el error sea menor que 5, cuando se
usa una muestra aleatoria de tamao n= 64 para estimar la media de
una poblacin infinita con =20? Solucin:
0.4772 + 0.4772= 0.9544
5
z
2
20
64
z
5
20
0.4772
0.4772
-5
z=-2
+5
z=2
2
64
PARMETRO DE LA POBLACIN
Madia:
Diferencias de medias de dos poblaciones: 1 - 2
Proporcin:
Diferencias de proporciones de dos poblaciones: 1 - 2
Varianza: 2
Desviacin Estndar:
ESTIMADOR
X1 -X 2
p
p1-p2
s2
s
Estimadores Puntuales
Error Estndar de la Media:
Cuando se conoce la desviacin
estndar de la poblacin:
Error Estndar de la Media:
Con base en la desviacin estndar
de la muestra, por que en la mayora
de los casos se desconoce la
desviacin estndar de la poblacin:
s
sX
n
X z
s
n
s
X 1.96
n
2.
s
X 2.58
n
Caso Prctico:
Una empresa multinacional desea conocer el ingreso promedio de sus
gerentes de mando medio, con un nivel de confianza del 95%. En una
muestra aleatoria de 256 gerentes, la media es $45,420 y la DS es $2,050.
Se pregunta:
a)Cul es la media poblacional?
b)Cul es un intervalo razonable para la media poblacional?
c)Cmo se interpretan los resultados?
Solucin:
a)No se conoce. En este caso la media muestral puede considerarse como
estimador puntual de la media poblacional.
b)Al 95% de nivel de confianza:
s
2, 050
45, 4201.96
45, 420 251
n
256
45, 420 251 45,169
45, 420 251 45, 671
X z
Intervalo de Confianza
para una Proporcin de la Poblacin
Se obtiene dividiendo el nmero de xitos en la muestra, entre el
nmero total muestrado.
Intervalo de Confianza
para una Proporcin de
la Poblacin:
p z p
Error Estndar
de la Proporcin
Muestral:
Intervalo de Confianza
para una Proporcin
Muestral:
p (1 p)
pz
n
p(1 p)
n
N n
.
n N 1
p (1 p )
n
N n
N 1
z.s
n
z
n p (1 p )
n = tamao de la muestra
z = valor normal estndar segn el NC deseado
s = estimador de la DS de la poblacin
E = mximo error permisible
p = proporcin muestral
La Prueba de Hiptesis
9-3
Qu es una Hiptesis?
Es un proposicin afirmativa acerca de una poblacin
elaborada con el fin de ponerse a prueba.
Ejemplos:
El crecimiento de la economa permitir reducir la
morosidad bancaria en 20%.
El precio del kg. de limones bajar de 2.00 a 1.50 si las
reas de cultivo se incrementara en 20%.
El mercado de valores en el Per podr ser ms profundo
si se creara una mayor cantidad de instrumentos de
inversin.
La tasa de rentabilidad del mercado de capitales peruano
ha originado un mayor ingresos de dlares ocasionando
una mayor apreciacin del nuevo sol.
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
9-4
La Prueba de Hiptesis
P a s o 1 : p la n t e a r la s h ip t e s is n u la y a lt e r n a
Procedimiento basado en
la evidencia muestral y en
la teora de proba-bilidad.
Se emplea para determinar si la hiptesis es un
enunciado razonable y
debe aceptarse o si no es
razonable y debe ser
rechazado.
P a s o 2 : s e le c c io n a r u n n iv e l d e s ig n if ic a n c ia
P a s o 3 : id e n t i f ic a r e l v a lo r e s t a d s t ic o d e p r u e b a
P a s o 4 : f o r m u la r u n a r e g la d e d e c is i n
P a s o 5 : t o m a r u n a m u e s t r a , lle g a r a u n a d e c is i n
N o r e c h a z a r la
h ip t e s is n u la
R e c h a z a r la h i p t e s is n u la
y a c e p t a r l a a lt e r n a
9-6
Definiciones
1. Hiptesis Nula H0:
Afirmacin acerca del valor de un parmetro
poblacional.
Hiptesis Alterna H1:
Afirmacin que se aceptar si los datos
muestrales proporcionan evidencia de que la
hiptesis nula es falsa.
2. Nivel de Significancia:
Probabilidad de rechazar la hiptesis nula cuando
es verdadera.
Error Tipo I:
Rechazar la hiptesis nula cuando en realidad es
verdadera.
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
9-7
Hiptesis
Se acepta
Nula
H0
H0 verdadera Decisin
correcta
H0 falsa
Se rechaza
H0
Error
Tipo I
Error
Tipo II
X
z
/ n
Decisin
correcta
Estadstico de
prueba para la
media poblacional.
Valor
Crtico
No se rechaza
Se acepta
H0
0
Prob. 0.95
Zona de
Rechazo
1.65 escala de Z
Prob. 0.05
9-8
H0 :
que
H1 :
que
Aceptacin
H0
-1.65
escala de Z
Dr.Jorge L. Pastor Paredes-UBA,
9-10
-1.96
Valor Crtico
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
Aceptacin H0
0.95
0
Zona de
Rechazo
0.025
1.96
escala de Z
Valor Crtico
9-12
X
z
/ n
Donde:
X = media muestral
= media poblacional
= desviacin de la poblacin
n = nmero en la muestra
9-14
Caso:
Una empresa fabrica y ensambla escritorios para oficina. La produccin
semanal de escritorios modelo A325 en la planta del Cuzco, se distribuye
normalmente con una media de 200 y una desviacin estndar de 16.
Recientemente, debido a la expansin del mercado, se han introducido
nuevos mtodos de produccin y se han contratado nuevos empleados. El
gerente quiere saber si ha habido un cambio total en la produccin semanal
del citado mueble, es decir si el nmero medio de escritorios producidos en
la planta del Cuzco es diferente de 200 para un nivel de significancia de
0.01 (n=50 semanas y media de escritorios producidos en el ltimo ao es
203.5)
Solucin:
Paso 1: Se establece la hiptesis nula y alterna: no se
visualiza una direccin, es una hiptesis de dos colas:
H 0 : 200
H1 : 200
Paso 2: Se establece la regla de decisin para un nivel de
significancia de 0.01.
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
Zona de
Rechazo
0.01/2=0.005
Aceptacin H0
0.4950
-2.58
Valor Crtico
-1.55
Ver Tabla
Apndice D
Zona de
Rechazo
0.01/2=0.005
0.4950
0
1.55
2.58
escala de Z
Valor Crtico
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
9-17
Caso:
X
z
s/ n
9-18
Solucin:
Paso 1:
Paso 2:
Paso 3:
H0 : 400
H1: 400
H0 se rechaza si z > 1.65
407 400
z
2.42
38 / 172
1.65 2.42
Valor Crtico
escala de Z
9-20
1 , 2 , 1 y 2
X1 X 2
2
s1
s2
n1
n2
9-22
Caso:
Una compaa realiz un estudio para comparar los
aos promedio de servicio de las personas que se
jubilaron en 1979 con los que se jubilaron el ao
anterior. Con un nivel de significancia de 0.01 Podra
concluirse que los trabajadores que se retiraron el ao
anterior trabajaron ms aos segn la siguiente
muestra?
Caracterstica
1979
Ao anterior
Media de la muestra
Desviacin estndar
de la muestra
Tamao de la muestra
25.6
2.9
30.4
3.6
40
45
9-23
H0 : 2 1
H1: 2 1
Paso 4:
30.4 25.6
2
6.80
3.6 2.9
402.33, H0 se rechaza.
Como z =45
6.80 >
Distribucin t Student
Distribucin t de Student
X
t
s
n
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
donde:
X = media muestral
= media poblacional
s = desviacin estndar muestral
n = nmero de datos
-3 -2.58 -2
-5.84
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
-1
0
0
2 2.58 3
5.84
Caso:
La experiencia en la investigacin de demandas por accidente en una
institucin aseguradora revela que en promedio cuesta $60 la realizacin
de todos los trmites. Este costo se consider exorbitante comparado con
el de otras compaas aseguradoras y se instauraron medidas para
reducir los costos. A fin de evaluar el impacto de estas nuevas medidas
se seleccion aleatoriamente una muestra de 26 demandas recientes y se
realiz un estudio de costos. Se encontr que la media muestral X y la
desviacion estndar s, de la muestra fueron $57 y $10, respectivamente.
En el nivel 0.01 de significacion, hay una reduccin en el costo
promedio, o la diferencia de $3(57-60) puede atribuirse al azar?
Solucin:
Paso1: Plantear la hiptesis nula y la hiptesis alternativa. La hiptesis
nula, H0, es que la media poblacional vale $60. Esto se expresa como
sigue:
H0: = $60
H1: < $60
Paso 2: Seleccin del nivel de significacin: Se usar el nivel 0.01
Paso 3: Identificar el estadstico de prueba. Tal estadstico es la
distribucin t estudent, ya que 1) no se conoce la desviacin estndar de
la poblacin, y 2) el tamao de muestra es pequeo (n<30).
Paso 4: Los valores crticos de t se encuentran en la tabla. La columna del
extremo izquierdo de la tabla se titula grados de libertad, gl. Para esta
prueba hay (n-1) grados de libertad. Se recorre hacia abajo esa columna
hasta 25( n-1, o sea 26-1=25). El valor critico para gl=25, una prueba de
una cola, y el nivel 0.01 es 2.485
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
Parte de la distribucin t
Valores crticos de t
Grados de
libert
ad g.l
0.5
0.025
0.01
0.005
0.0005
0.10
0.05
0.02
0.01
0.001
21
1.323
1.721
2.080
2.518
2.831
3.819
22
1.321
1.717
2.074
2.508
2.819
3.792
23
1.319
1.714
2.069
2.500
2.807
3.767
24
1.318
1.711
2.064
2.492
2.797
3.745
25
1.316
1.708
2.060
2.485
2.787
3.725
26
1.315
1.706
2.056
2.479
2.779
3.707
27
1.314
1.703
2.052
2.473
2.771
3.690
28
1.313
1.701
2.048
2.467
2.763
3.674
Paso 5: calcular t:
X 57 60
t
1.53
s
10
n
26
Zona
Aceptacin
-2.485
-1.53
Valor crtico t calculado
Caso:
La tasa actual para producir fusibles de 5 amp. en GE Co. es 250 por
hora. Se compr e instal una mquina nueva que, segn el proveedor,
aumentar la tasa de produccin. Una muestra de 10 horas
seleccionadas al azar el mes pasado, indica que la produccin media
por hora en la nueva mquina es 256, con desviacin estndar muestral
de 6 por hora. Con 0.05 de nivel de significancia, Puede la empresa
concluir que la nueva mquina es ms rpida?
Solucin:
H1: 250
Paso 1: H0 : 250
Paso 2: H0 se rechaza si t >1.833, gl = 9
Paso 3:
Paso 4:
NC = 0.05
gl = 9
1.83
Valor crtico
3.16
t calculado
Caso:
La longitud promedio de un tornillo es 43mm. Se cree que los ajustes en
la mquina, que producen los tornillos, hayan cambiando la longitud. La
hiptesis nula, que se probar al nivel 0.02, es que no hay cambios en la
longitud media =43. La hiptesis alternativa es que ha ocurrido un
cambio 43.
Se seleccionaron aleatoriamente doce tornillos (n=12) y se registr su
longitud. Las medidas son (en milimetros) 42, 39, 42, 45, 43, 40, 39, 41,
40, 42, 43 y 42. Ha habido un cambio estadsticamente significativo en
la longitud media de los tornillos?
Solucin:
Las hiptesis nula y alternativa son:
H0 : = 43
H1 : 43
La hiptesis alternativa no indica una direccin, por lo que se trata de
una prueba de dos colas. Hay gl=11, que se obtienen por n-1=12-1=11.
Por lo que, consultando el Apendice F para una prueba de dos colas en
el nivel 0.02, el valor crtico es 2.718. Los valores crticos para el nivel
0.02 se muestran en el diagrama. Por tanto, la regla de decisin es
rechazar la hiptesis nula si el valor t no se encuentra entre +2.718 y
-2.718. De otra manera se acepta H0, que expresa que la longitud
media de los tornillos es 43mm.
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
n 1
Con los cuadros de los valores reales
X2
n 1
X 41.5 43.0
t
2.92
s
1.78
n
12
La hiptesis nula de que la media poblacional es 43mm se rechaza al
nivel de significacin 0.02(ya que el valor t calculado de -2.92 se
encuentra en el rea de la cola mas all del valor critico de -2.718).
La hiptesis alternativa de que la media no es 43mm se acepta.
Aparentemente la maquina esta desajustada y esto debe informarse al
ingeniero de control de calidad
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
(X-X)2
X(mm)
X2
42
0.5
0.25
1764
39
-2.5
6.25
1521
42
0.5
0.25
1764
45
3.5
12.25
2025
43
1.5
2.25
1849
40
-1.5
2.25
1600
39
-2.5
6.25
1521
41
-0.5
0.25
1681
40
-1.5
2.25
1600
42
0.5
0.25
1764
43
1.5
2.25
1849
42
0.5
0.25
1764
498
35
20702
498
41.5mm
12
X X
n 1
35
1.78
12 1
X 2
n 1
498 2
20702
12 1
12
1.78
H0: u = 43
H1: u = 43
gl = 11
H1 se acepta
H0 se rechaza
H0 se rechaza
-2.718
Valor
crtico
2.718
Valor
crtico
10-10
2
2
(
n
1
)
s
(
n
1
)
s
1
2
2
s2p 1
n1 n2 2
X1 X 2
1
1
s
n1 n2
2
p
10-12
H0 : 2 1
H1: 2 1
Paso 1:
Paso 2:
Paso 3:
Paso 4:
t = -1.64 (verifique)
H0 no se rechaza.
11-3
Anlisis de VarianzaANOVA
El Anlisis de Varianza-ANOVA
Caractersticas de la Distribucin F
11-4
S12
F 2
S2
son las varianzas muestrales para las dos
2
2
S
y
S
1
2
muestras.
Regla de decisin:
Para un nivel de significancia , la hiptesis nula se
rechaza si F (calculada) es mayor que F (en tablas) con
grados de libertad en el numerador y en el denominador.
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
5744699.8
1281720.9
7026420.7
gl
6
88
94
Media
cuadrtica
957450.0
14565.010
F
65.736
Sig.
.000a
11-6
Caso:
Credibolsa SAB en el mercado de valores, report que la tasa media
de rentabilidad de una muestra de 10 acciones del ISBVL fue 12.6%
con una desviacin estndar de 3.9%. La tasa media de retorno en
otra muestra de 8 acciones de compaas de servicios fue 10.9% con
desviacin estndar de 3.5%. Para un 0.05 de nivel de significancia,
puede la sociedad agente de bolsa concluir que hay mayor
variacin en las acciones del ISBVL?
Solucin:
Paso 1:
Paso 2:
H0 : s u
H1: s u
gl = (9, 7),
= 0.05
F ( 3.9) 2 / ( 3.5) 2 1.2416
Paso 3:
Paso 4: H0 no se rechaza. No hay evidencia suficiente para
asegurar que hay mayor variacin en las acciones de
servicio.
11-10
NOTA
Correlacin Mltiple
Coeficiente de Correlacin
Para una
poblacin
Para una
muestra
ZX
N XY ( X)( Y)
N X 2 ( X)2 N Y 2 ( Y)2
n XY ( X)( Y)
n X 2 ( X)2 n Y 2 ( Y)2
Coeficiente de
Correlacin
AB = +1 perfectamente positiva
AB = 0 no existe correlacin
AB = -1 perfectamente negativa
WA.WB. AB A B
WA.WC. AC A C
WB.WA. BA B A
W2B . 2B
WB.WC. BC B C
WC.WA. CA C A
WC.WB. CB C B
W2C . 2C
Coeficientes de Correlacin
RA
RA
RB
AB = +1
perfectamente
positiva
AB = 0
no existe
correlacin
RA
RB
RB
AB = -1
perfectamente
negativa
6 d i2
1 3
N N
n( XY) ( X)( Y)
n( X 2 ) ( X) 2 n( Y 2 ) ( Y) 2
Coeficiente de Determinacin R2
(Y Y )
_
_2
Y 2 nY
Modelo
1
R
.904a
R
cuadrado
.818
R
cuadrado
corregida
.805
Error tp.
de la
estimacin
120.6856
Durbin-Watson
2.206
Correlaciones Bivariadas
Correlaciones Parciales
Matriz de Correlacin
La matriz de correlacin se usa para mostrar todos los
posibles coeficientes de correlacin simple entre todas las
variables.
La matriz tambin se til para localizar la correlacin
de las variables independientes.
En
la matriz se muestra qu tan fuerte est
correlacionada la variable independiente con la
variable dependiente.
Correlaciones
Correlacin
de Pearson
Sig.
(unilateral)
DF
D
LS
MS
SS
XS
LAGS(DF,1)
DF
D
LS
MS
SS
XS
LAGS(DF,1)
DF
D
LS
MS
SS
XS
LAGS(DF,1)
DF
1.000
-.108
.808
-.154
-.558
.486
.886
.
.148
.000
.068
.000
.000
.000
95
95
95
95
95
95
95
D
-.108
1.000
-.203
.117
.204
-.324
-.074
.148
.
.024
.130
.023
.001
.239
95
95
95
95
95
95
95
LS
.808
-.203
1.000
-.216
-.748
.593
.799
.000
.024
.
.018
.000
.000
.000
95
95
95
95
95
95
95
MS
-.154
.117
-.216
1.000
-.040
.010
-.171
.068
.130
.018
.
.351
.460
.048
95
95
95
95
95
95
95
SS
-.558
.204
-.748
-.040
1.000
-.546
-.550
.000
.023
.000
.351
.
.000
.000
95
95
95
95
95
95
95
XS
.486
-.324
.593
.010
-.546
1.000
.547
.000
.001
.000
.460
.000
.
.000
95
95
95
95
95
95
95
LAGS(DF,1)
.886
-.074
.799
-.171
-.550
.547
1.000
.000
.239
.000
.048
.000
.000
.
95
95
95
95
95
95
95
13-3
Regresin
Multivariable
13-4
Y b 0 b1 X 1 b 2 X 2 b3 X 3 i
b0 es la intercepcin en Y.
13-5
13-12
Heteroscedasticidad.
Existe heteroscedasticidad cuando los errores o
residuos no tienen una varianza constante a travs de
un nivel completo de valores.
Y
X
Homoscedasticidad
Heteroscedsticidad
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
Homoscedasticidad
Heteroscedasticidad
Colinealidad
Autocorrelacin-DW
(et et 1)
d
2
et
Modelo
1
R
.904a
R
cuadrado
.818
R
cuadrado
corregida
.805
Error tp.
de la
estimacin
120.6856
Durbin-Watson
2.206
Determinar:
1. El coeficiente de correlacin mltiple R, permite evaluar el grado
de asociacin entre la variable dependiente y el conjunto de
variables independientes.
2. El coeficiente de determinacin R2, evala la proporcin
(porcentaje) de la variacin total de la variable dependiente Y que
es explicada por el modelo de regresin utilizado.
Coeficientes no
estandarizados
Modelo
1
(Constante)
LS
SS
D
MS
XS
LAGS(DF,1)
B
-346.192
3.275E-02
57.970
-10.382
.177
-.267
.689
a. Variable dependiente: DF
Error tp.
333.217
.010
114.581
12.894
.201
.199
.080
Coeficient
es
estandari
zados
Beta
.338
.037
-.040
.044
-.083
.686
t
-1.039
3.308
.506
-.805
.880
-1.338
8.657
Sig.
.302
.001
.614
.423
.381
.184
.000
Intervalo de confianza
para B al 95%
Lmite
Lmite
inferior
superior
-1008.391
316.007
.013
.052
-169.735
285.675
-36.005
15.242
-.222
.576
-.663
.129
.531
.847
18-3
Conceptualizacin
Correlacin Serial
Caractersticas Importantes
Las mediciones de series de tiempo no pueden considerarse muestras probabilsticas por lo que en vez de ello,
estn sujetas a:
1. Tendencias:
Componente a largo plazo que constituye la base del crecimiento (o declinacin) de una serie histrica, se ve
afectada por cambios en la poblacin, inflacin, cambio tecnolgico e incremento en la productividad.
2. Variacin Cclica:
Conjunto de fluctuaciones en forma de ondas o ciclos, producidos por cambios en las condiciones econmicas,
representa la diferencia entre los valores esperados de una variable (tendencia) y los valores reales.
3. Variacin Estacional:
Se refiere a un patrn de cambio regularmente recurrente a travs
del tiempo. Se encuentran tpicamente en los datos clasificados
por trimestre, mes o semana; el movimiento se completa dentro
de la duracin de un ao y se repite a s mismo ao tras ao.
4. Fluctuacin Irregular:
Compuesto por fluctuaciones causadas por sucesos impredecibles
o no peridicos, como un clima poco usual, huelgas, guerras,
elecciones y cambios en las leyes.
18-5
Tendencia lineal
La ecuacin de la tendencia a largo plazo (lineal) se estima con
la ecuacin de mnimos cuadrados para el tiempo t:
Y a bt
tY (Y )(t ) / n
b
t 2 ( t ) 2 / n
Y
t
a
b
n
n
Dr.Jorge L. Pastor Paredes-UBA, UNFV, UNSA
18-8
18-9
Tendencias No Lineales
Si la tendencia es no lineal pero los
incrementos tienden a ser un porcentaje
constante, los valores de Y se convierten en
logaritmos y la ecuacin de mnimos cuadrados
se determina con ellos.
18-10
Variacin Estacional
El mtodo de mayor uso para calcular el patrn
estacional tpico se llama mtodo de razn a
promedio mvil
1. Elimina las componentes de tendencia,
cclica e irregular de los datos originales (Y).
2. Los nmeros que resultan se denominan
ndices estacionales tpicos.
18-11
18-12
Desestacionalizacin de Datos
Pronsticos Economtricos.