Anda di halaman 1dari 72

Ejemplo.

En una investigacin de los efectos de dietas con densidad baja en colesterol


lipoproteco se estudi una muestra aleatoria de 12 personas medianamente
hipercolesterolmicos . Los niveles de colesterol en mmol/l para estos individuos fueron:
individuo Nivel colesterol
1 6
2 6.4
3 7.0
4 5.8
5 6.0
6 5.8
7 5.9
8 6.7
9 6.1
10 6.5
11 6.3
12 5.8
Si se asume una distribucin normal para la variable aleatoria en la poblacin, estime la
varianza de los niveles de colesterol en la poblacin con un nivel de confianza del 95%.
1
Estadstica QFB Dr. Ramiro Quijano
Estadstica QFB Dr. Ramiro Quijano
2

3
Estadstica QFB Dr. Ramiro Quijano
Ejemplo. Se elabor un estudio para determinar si una dosis de dextroanfetaminas
podra tener efectos positivos sobre las emociones de pacientes esquizofrnicos. En
dicho estudio se midieron diversas variables. Hubo n2= 4 pacientes que respondieron al
tratamiento con una desviacin estndar de 3.4. Para n1=11 pacientes no respondieron a
la anfetamina y presentaron una desviacin estndar de 5.8.

Elabore un intervalo de confianza del 95 % para la razn de las varianzas en ambas
poblaciones.
Estadstica QFB Dr. Ramiro Quijano
4
Estadstica QFB Dr. Ramiro Quijano
5
Estadstica QFB Dr. Ramiro Quijano
Pruebas de hiptesis
Introduccin
Considere el problema de la rapidez de combustin de un nuevo propelente.
Suponga que se cree que (hiptesis nula) la rapidez promedio de combustin
es 50 cm/s, (la hiptesis alternativa es que sta no es igual a 50 cm/s).








Cmo comprobamos la hiptesis?
Estadstica QFB Dr. Ramiro Quijano
6
Estadstica QFB Dr. Ramiro Quijano
Podemos concluir que:

1. Un valor de la media de la muestra prximo al valor hipottico = 50
cm/s es una evidencia de que el verdadero valor de la media es
realmente 50 cm/s (apoya la hiptesis nula H
o
).


2. Una media muy diferente de 50 cm/s es una evidencia que apoya la
hiptesis alternativa. Por tanto, en este caso, la media muestral es el
estadstico de prueba.
Pero Cmo indicamos un criterio? Supngase que si 48.551.5, entonces no se
rechaza la hiptesis nula H
o
; = 50 cm/s, y que si <48.5 >51.5, entonces se
acepta la hiptesis alternativa H
1
; 50 cm/s.

La estadstica nos da herramientas para resolver problemas de este tipo.
Supngase que se realiza una prueba sobre una muestra de 100
especmenes, y que se calcula la rapidez de combustin promedio.
7
Estadstica QFB Dr. Ramiro Quijano
En las pruebas de hiptesis estadsticas se trabajan con dos tipos de
hiptesis:

1. La hiptesis nula (H
o
).

2. La hiptesis alternativa (H
A
)

Si H
o
se rechaza entonces H
A
se acepta dentro de un cierto nivel de
confianza. Si H
o
no se rechaza no se puede concluir que es verdadera.
Para rechazar o no rechazar la
hiptesis nula necesitamos una
estadstica de prueba que pueda
calcularse con los datos del problema.
Esto nos permite cuantificar el nivel
de confianza de nuestros resultados.
Estadstica QFB Dr. Ramiro Quijano
8
Estadstica QFB Dr. Ramiro Quijano
Para toma la decisin dividimos la grfica de la distribucin en dos partes

1. Zona de aceptacin.

2. Zona de rechazo.

Se rechaza la hiptesis nula si el estadstico de prueba calculado con los
datos del problema caen la regin de rechazo.
Como dividir la regin? Lo hacemos
usando el nivel de significancia ().
Como determina el tamao de la
regin de rechazo se debe elegir
pequea.

=0.01,.0.05, 0.10.
En los ejercicios las distintas regiones se dividirn como se muestra a
continuacin.
Estadstica QFB Dr. Ramiro Quijano
9
Estadstica QFB Dr. Ramiro Quijano
1. De una cola, unilateral derecho
H
o
: parmetro x

H
A

H
A
:

parmetro > x

1-
Z
(1-/2)
10
Estadstica QFB Dr. Ramiro Quijano
De una cola, unilateral izquierdo
H
o
: parmetro x

H
A
H
A
H
A
:

parmetro < x

1-
Z
/2
11
Estadstica QFB Dr. Ramiro Quijano
De dos colas, bilateral
H
o
: parmetro = x

H
A
H
A

H
A
:

parmetro x
/2
/2
Z
/2
Z
(1-/2)
12
Estadstica QFB Dr. Ramiro Quijano
Cmo resolver ejercicios de pruebas de hiptesis?

1. Se establece la hiptesis nula y alternativa.

2. Se anotan los datos disponibles.

3. Con base en los datos disponibles se elige la distribucin estadstica
de prueba.

4. Con se divide la grfica de la distribucin en zona de rechazo y de
aceptacin.

5. Se calcula la estadstica de prueba con los datos del problema y se
comprueba si cae en la regin de rechazo o no rechazo.

6. Se concluye.
Estadstica QFB Dr. Ramiro Quijano
13
Estadstica QFB Dr. Ramiro Quijano
Prueba de hiptesis para la media de una poblacin
La primer prueba de hiptesis que veremos es en torno a la media de una
poblacin.
1. Poblacin con distribucin normal y varianza conocida
/
o
x
z
n

o

=
Estadstica QFB Dr. Ramiro Quijano
14
Estadstica QFB Dr. Ramiro Quijano
Un grupo de investigadores est interesado en conocer si la edad media de
una poblacin es diferente de 30 aos. Para ello toma una muestra aleatoria
de 10 personas los cuales tienen una media de 27 aos. Adems, los
investigadores saben que la poblacin presenta una distribucin normal con
una varianza de 20. Realice una prueba de hiptesis con un nivel de
significancia de 0.05.
Solucin:
: 30
: 30
o o
o o
H
H

=
=
Hiptesis
Datos
2
27
30
20
10
0.05
o
x
n

o
o
=
=
=
=
=
Prueba de dos colas
15
Estadstica QFB Dr. Ramiro Quijano
A
0.05 0.025
2
o
o = =
Z
/2
Z
1-/2
Z
0.025
=-1.96

Z
0.975
=1.96

16
Estadstica QFB Dr. Ramiro Quijano
Clculo del estadstico de prueba
27 30
2.12
/ 20 / 10
o
x
z
n

o

= = =
Z=-2.12 cae en la regin de rechazo
17
Estadstica QFB Dr. Ramiro Quijano
Por tanto la hiptesis nula debe ser
rechazada
Sin embargo se deba hacer una prueba final, hallar el valor de p de la prueba.
Para ello debe hallar el valor del rea bajo la curva antes de Z=-2.12
Estadstica QFB Dr. Ramiro Quijano
18
Estadstica QFB Dr. Ramiro Quijano
El rea bajo la curva antes de Z=-2.12 es 0.017, como es una prueba de dos
colas y por simetra, el rea bajo la curva despus de Z=2.12 tambin es 0.17
As el valor de p se calcula como p=0.017+0.017=0.034
Como el valor de p=0.034 es menor que el valor de =0.05
se confirma que se debe rechazar la hiptesis nula.
Estadstica QFB Dr. Ramiro Quijano
19
Estadstica QFB Dr. Ramiro Quijano
Supongamos que los investigadores se preguntan Es posible concluir que la
media de la poblacin es menor que 30?
Solucin:
: 30
: 30
o o
o o
H
H

>
<
Hiptesis
Datos
2
27
30
20
10
0.05
o
x
n

o
o
=
=
=
=
=
Prueba de una cola
Estadstica QFB Dr. Ramiro Quijano
20
Estadstica QFB Dr. Ramiro Quijano
A
0.05 o =
Z

Z
0.05
=-1.645

Estadstica QFB Dr. Ramiro Quijano
21
Estadstica QFB Dr. Ramiro Quijano
Clculo del estadstico de prueba
27 30
2.12
/ 20 / 10
o
x
z
n

o

= = =
Por tanto la hiptesis nula debe ser
rechazada
Z=-2.12

Z
0.05
=-1.645

Estadstica QFB Dr. Ramiro Quijano
22
Estadstica QFB Dr. Ramiro Quijano
El rea bajo la curva antes de Z=-2.12 es 0.017, como es una prueba de una
cola
As p=0.017
Como el valor de p=0.017 es menor que el valor de =0.05
se confirma que se debe rechazar la hiptesis nula.
Estadstica QFB Dr. Ramiro Quijano
23
Estadstica QFB Dr. Ramiro Quijano
2. Poblacin con distribucin normal y varianza desconocida
/
o
x
t
s n

=
Si la muestra es mayor a 30 se puede hacer uso
del teorema del lmite central, as la estadstica
de prueba es :
3. Poblacin con distribucin no normal o desconocida y varianza
desconocida
Estadstica de prueba:
/
o
x
z
s n

=
Estadstica QFB Dr. Ramiro Quijano
24
Estadstica QFB Dr. Ramiro Quijano
Un grupo de investigadores esta interesado en saber si la media del ndice de
masa corporal de un poblacin, con distribucin normal, dada no es 35
kg/m
2
. Para ello se toma una muestra que consiste en 14 individuos y los
resultados se muestran en la siguiente tabla:
Realice una prueba de hiptesis a un nivel de significancia del 0.05.
Primero hallemos la media y la desviacin estndar de la muestra. Las cuales
son
6391 . 10
5 . 30
=
=
s
x
Solucin:
Estadstica QFB Dr. Ramiro Quijano
25
Estadstica QFB Dr. Ramiro Quijano
Hiptesis Datos
Prueba de dos colas
35
35
0
=
=
o
o
:
:

A
H
H
13 1
14
6391 . 10
5 . 30
=
=
=
=
n
n
s
x
/
o
x
t
s n

=
Como no se conoce la
varianza de la poblacin y
esta tiene una distribucin
normal, la estadstica de
prueba es:
Estadstica QFB Dr. Ramiro Quijano
26
Estadstica QFB Dr. Ramiro Quijano
0.05 0.025
2
o
o = =
Hallemos los valores de t
0.025
con 13 grados de libertad.
Estadstica QFB Dr. Ramiro Quijano
27
Estadstica QFB Dr. Ramiro Quijano
0.05 0.025
2
o
o = =
t
/2
t
1-/2
t
0.025
=-2.160 (por simetra)

t
0.975
=2.160

Estadstica QFB Dr. Ramiro Quijano
28
Estadstica QFB Dr. Ramiro Quijano
Clculo del estadstico de prueba
Por tanto la hiptesis nula no puede ser
rechazada
t=-1.58

t
0.05
=-2.160

58 . 1
14 / 6391 . 10
30 5 . 30
/
=

=
n s
x
t
o

Estadstica QFB Dr. Ramiro Quijano


29
Estadstica QFB Dr. Ramiro Quijano
Prueba de Hiptesis para la diferencia
entre la medias de dos poblaciones
Cuando las prueba de hiptesis involucra la diferencia entre las medias de dos
poblaciones, anlogo a las pruebas con la media de una poblacin, se pueden
generar las siguientes hiptesis:
El procedimiento es anlogo al caso de pruebas de hiptesis con la media de
una poblacin.
Estadstica QFB Dr. Ramiro Quijano
30
Estadstica QFB Dr. Ramiro Quijano
Muestreo a partir de poblaciones que siguen una distribucin normal con
varianza desconocida pero iguales.
Muestreo a partir de poblaciones que siguen una distribucin normal con
varianza conocida
Donde el sub-ndice 0 indica que la diferencia es un parmetro supuesto.
Estadstica QFB Dr. Ramiro Quijano
31
Estadstica QFB Dr. Ramiro Quijano
0
Muestreo a partir de poblaciones que siguen una distribucin normal con
varianza desconocida pero diferentes.
Estadstica QFB Dr. Ramiro Quijano
32
Estadstica QFB Dr. Ramiro Quijano
Muestreo a partir de poblaciones que no siguen una distribucin normal
pero el tamao de las muestras es mayor a 30.
Cuando no se conoce la varianza de ambas poblaciones se utiliza la varianza de
las dos muestras.
Estadstica QFB Dr. Ramiro Quijano
33
Estadstica QFB Dr. Ramiro Quijano
Un equipo de mdicos desea saber si los datos que han recolectado
proporcionan evidencia para determinar si existe una diferencia entre las
concentraciones medias de cido rico en el suero de individuos
normales e individuos con sndrome de Down aun nivel de significancia
de 0.05. Los datos consiste en los datos de 12 individuos con sndrome de
Down y 15 individuos sanos. Las medias son 4.5 mg/100 ml y 3.4 mg/100
ml y las varianzas de ambas poblaciones son 1 y 1.5, respectivamente.
Datos

1
= 4.5

2
= 3.4

1
= 1

2
= 1.5

1
=12

2
=15
Hiptesis
H
o
:
1

2
=0

H
A
:
1

2
0

Nivel de significancia
=0.05
La hiptesis nula se
acepta si

-1.96 < z < 1.96
Clculo de la estadstica de prueba
z=
(4.53.4)0
1
12
+
1.5
15
=2.57
Por tanto, se rechaza la
hiptesis nula y las medias de
ambas poblaciones son
distintas
34
Estadstica QFB Dr. Ramiro Quijano
Se realizaron mediciones de ndices de destruccin pulmonar de
personas mayores de 60 aos que no fumaban y en personas fumadoras
que murieron repentinamente por causas no respiratorias. Una
calificacin alta indica un mayor dao pulmonar. Para el estudio se eligi
aleatoriamente a nueve personas no fumadoras y a 16 fumadores. El
promedio de los no fumadores fue 12.4 con una desviacin estndar de
4.8492, mientras que el promedio de los fumadores fue 17.5 con una
desviacin estndar de 4.4711. Se pretende saber si es posible concluir
que los fumadores tienen los pulmones mas daados que las personas
no fumadoras a un nivel de significancia de 0.05. Se sabe que las
varianzas son iguales.
Datos

1
= 12.4

2
= 17.5 (F)
s
1
= 4.8492
s
2
= 4.4711

1
=9

2
=16
Hiptesis
La hiptesis nula es lo contrario a lo que
se quiere probar
Estadstica QFB Dr. Ramiro Quijano
35
Estadstica QFB Dr. Ramiro Quijano
Prueba de Hiptesis para la proporcin en
poblaciones
La prueba de hiptesis para la proporcin de una poblacin se realiza de la
misma manera que las pruebas de hiptesis para la media de una poblacin
(laterales, unilaterales).
Cuando las pruebas de hiptesis es para diferencia entre las proporciones de
dos poblaciones, el caso de mayor aplicacin es cuando queremos probar que
son iguales (p
1
-p
2
=0). La estadstica de prueba es:
Estadstica QFB Dr. Ramiro Quijano
36
Estadstica QFB Dr. Ramiro Quijano
donde
Donde n
1
y n
2
son el tamao de las muestras y
Con x
1
y x
2
representan el nmero de las muestras que poseen las
caractersticas de inters en las muestras.
Estadstica QFB Dr. Ramiro Quijano
37
Estadstica QFB Dr. Ramiro Quijano
Se realiz una investigacin en consumidores de drogas intravenosas encontrando a 18 de 423
individuos con VIH positivo. Se pretende saber si es posible concluir que menos del 5 % de la
poblacin de los consumidores de drogas intravenosas tienen VIH a un nivel de significancia del
0.05.
Datos
=0.05
p=18/423=0.0426

Hiptesis
H
0
: p 0.5
H
A
: p<0.5
Una cola

Nivel de significancia
=0.05 (Z
0.05
=-1.645)
La hiptesis nula se
acepta si
z < -1.645
Clculo de la estadstica de prueba
La hiptesis nula no se rechaza -0.70 > -1.645
Estadstica QFB Dr. Ramiro Quijano
38
Estadstica QFB Dr. Ramiro Quijano
Prueba de Hiptesis para la varianza de
poblaciones
Los principios generales para prueba de hiptesis de varianzas poblacionales
son exactamente los mismo que hemos estudiados. La estadstica de prueba en
este caso es:
De tal forma que cuando H
0
es verdadera, sigue una distribucin
2
con n-1
grados de libertad.
Estadstica QFB Dr. Ramiro Quijano
39
Estadstica QFB Dr. Ramiro Quijano
Se investig la respuesta a un alrgica de un grupo de 12 macacos adultos machos. Entre los
datos reportados esta la varianza de la muestra de 1.92. El equipo investigacin necesita saber
si es posible concluir que la varianza de la poblacin es diferente de 4 aun nivel de significancia
de 0.05.
Datos
=0.05
s
2
=1.92
n=12

Hiptesis
H
0
:
2
= 4
H
A
:
2
4
Dos colas

Nivel de significancia
=0.05
Para hallar las zonas de aceptacin y de rechazo debemos hallar y
con 11 grados de libertad.

2
025 . 0
_
2
975 . 0
_
Estadstica QFB Dr. Ramiro Quijano
40
Estadstica QFB Dr. Ramiro Quijano
As las zonas de aceptacin y de rechazo:
Clculo de la estadstica de prueba
28 . 5
4
) 92 . 1 ( 11
2
= = _
La hiptesis nula no se rechaza!!!
Estadstica QFB Dr. Ramiro Quijano
41
Estadstica QFB Dr. Ramiro Quijano
Anlisis de la varianza
ANOVA
Estadstica QFB Dr. Ramiro Quijano
42
Estadstica QFB Dr. Ramiro Quijano
Estadstica QFB Dr. Ramiro Quijano
43
Estadstica QFB Dr. Ramiro Quijano
Anlisis de la varianza es:
El anlisis de la varianza (ANOVA) se utiliza para cumplir dos objetivos:

1. Estimar y probar hiptesis respecto a las varianza de las poblaciones.
2. Estimar y probar hiptesis respecto a las medias de las poblaciones.

En particular, en este curso nos enfocaremos en el punto dos.
Pero Cul es la diferencia con las pruebas de hiptesis?
El anlisis de la varianza (ANOVA) permite probar hiptesis nulas para la comparacin
entre tres o ms medias.
Estadstica QFB Dr. Ramiro Quijano
44
Estadstica QFB Dr. Ramiro Quijano
Tpicamente, en la aplicacin de la ANOVA existen tres variables
Variable tratamiento
Variable respuesta
Variables extraas
La pregunta a responder es Las diferentes categoras en la variable tratamiento
producen diferencias, en promedio, en la variable respuesta?
Para comenzar un anlisis de la varianza es conveniente ordenar los datos en la
siguiente forma:
Estadstica QFB Dr. Ramiro Quijano
45
Estadstica QFB Dr. Ramiro Quijano
Con los datos as ordenados procedemos a obtener las siguientes cantidades
Estadstica QFB Dr. Ramiro Quijano
46
Estadstica QFB Dr. Ramiro Quijano
Y la tabla ANOVA puede calcularse:
Grados de libertad numerador
Grados de libertad denominador
Hiptesis nula: Medias iguales
Hiptesis alterna: Medias distintas
Regla de decisin: Si RV > F
k-1, N-K
se rechaza la hiptesis nula.

Estadstica QFB Dr. Ramiro Quijano
47
Estadstica QFB Dr. Ramiro Quijano
El objetivo de un estudio fue investigar si el calcio consumido en la dieta diaria como
tratamiento no farmacolgico de la presin sangunea tiene efecto en el peso de los
individuos. Para ello los investigadores formaron cuatro grupos de un total de 61
ratas macho Wistar-Kioto de siete semanas de edad con igual promedio en la presin
sangunea. Los cuatro grupos fueron los siguientes

1. Ratas sin tratamiento con dieta normal (WKY).
2. Ratas sin tratamientos con dieta rica en calcio (WKY-Ca).
3. Ratas tratadas con deoxicorticosterona y NaCl con dieta normal (DOC) .
4. Ratas con dieta rica en calcio y con tratamiento con deoxicorticosterona y NaCl
(DOC-Ca)
Se asume que los cuatro grupos siguen una distribucin normal con varianzas
iguales.


Identifican los tres
tipos de variable?
Estadstica QFB Dr. Ramiro Quijano
48
Estadstica QFB Dr. Ramiro Quijano
Con los datos preparemos la tabla
Estadstica QFB Dr. Ramiro Quijano
49
Estadstica QFB Dr. Ramiro Quijano
Hiptesis
Clculo de la tabla ANOVA
4-1
61-4
50
Estadstica QFB Dr. Ramiro Quijano
Regla de decisin
Suponga una =0.05 (/2=0.025) debemos hallar primero la F con 3 grados de libertad
en el numerador y 57 grados de libertad en denominador. Como en RV pusimos la
varianza mayor en el numerador, aunque la prueba es bilateral, slo nos preocupamos
por la cola superior
Estadstica QFB Dr. Ramiro Quijano
51
Estadstica QFB Dr. Ramiro Quijano
Regla de decisin
El valor de F
1-0.025
=F
0.975
con 3 g.l del numerador y 57 g.l del denominador es
Estadstica QFB Dr. Ramiro Quijano
52
Estadstica QFB Dr. Ramiro Quijano
Como RV (11.99) es mayor que el valor de F de
3.34 se rechaza la hiptesis nula y la hiptesis
alterna debe ser cierta.
53
Estadstica QFB Dr. Ramiro Quijano
54
Regresin Lineal
55
El anlisis de regresin es usadas para averiguar la forma mas probable de relacin
entre variables. Esto permite llegar a una decisin respecto a la poblacin de la que la
muestra fue extrada.
La forma de regresin ms simple es la regresin lineal.
56

La variable independiente (X). La cual se encuentra bajo el
control del investigador.
La variable dependiente (Y). Para cada valor de X existe
una sub poblacin de valores de Y relacionados.
En el modelo de regresin lineal simple se tienen dos tipos de variables:
EL objetivo es hallar la ecuacin de regresin de la poblacin que describe la
relacin entre la variable dependiente Y y la variable independiente X.
57
a: interseccin con el eje de las y.
b: pendiente de la recta (grado de inclinacin)
Usando la metodologa de los mnimos cuadrados se obtiene:
58
Despus de obtener la ecuacin de la recta de regresin debemos evaluarla
para ver si describe adecuadamente la relacin entre las variables. Esto con
el fin de cuantificar su utilidad.
Para ello utilizaremos herramientas de la tcnica ANOVA usando la
pendiente de la recta de regresin (b).
Cmo obtener los datos de la tabla?
59
Si y
i
representan a los datos disponibles del problema, a la media de los datos y
son los datos calculador con la recta de regresin, tenemos:
60
Si sumamos los tres tipos de desviaciones:
As la tabla ANOVA:
Entre
muestras
Dentro
muestras
61
Si la hiptesis nula no es rechazada:
Lo cual no tiene valor estadstico
62
Si la hiptesis nula se rechaza:
99
Lo cual tiene valor estadstico. Sin embargo, no implica que ajuste lineal sea el
mejor para los datos analizados. Falta evaluar la eficiencia del ajuste lineal. Para
ello usaremos el coeficiente de indeterminacin.
63
El coeficiente de determinacin representa:
El mximo valor que r
2
puede alcanzar es 1:
El cul es el caso ideal. En la prctica mientras r
2

est ms cercano a 1, mejor es el ajuste.
64
Ejemplo
65
66
67
Solucin. Se trasladan los datos a una hoja de excel.
68
69
70
Nivel de significancia al
0.05
71
Valor de F hallado con el
nivel de significancia y
los grados de libertad
72
De la tabla ANOVA vemos que, el valor de F de los datos es mayor que el valor crtico
de F, entonces rechazamos la hiptesis nula y podemos concluir que la recta de
regresin lineal describe adecuadamente la relacin entre las variables.
Debido a que el coeficiente de determinacin es 0.66, el modelo explica el 66 % de las
variancias de los datos. ARCHIVO EXCEL
0
50
100
150
200
250
300
0 20 40 60 80 100 120 140
Y

Variable X 1
Variable X 1 Curva de regresin ajustada
Y
Pronstico para Y

Anda mungkin juga menyukai