Anda di halaman 1dari 57

Pruebas de hipótesis

Introducción a la Estadı́stica

Magdalena Cornejo
mcornejo@utdt.edu
Maestrı́as en Economı́a Aplicada y Econometrı́a, UTDT

1
Pruebas de hipótesis
Motivación

Una parte muy útil de la estadı́stica son las pruebas de hipótesis.

Una hipótesis estadı́stica es una afirmación respecto a alguna


caracterı́stica desconocida de una población (generalmente
parámetros como la media o la proporción). Ejemplos:

• Un legislador afirma que el ingreso medio de la población


supera los $8000 mensuales.

2
Motivación

Una parte muy útil de la estadı́stica son las pruebas de hipótesis.

Una hipótesis estadı́stica es una afirmación respecto a alguna


caracterı́stica desconocida de una población (generalmente
parámetros como la media o la proporción). Ejemplos:

• Un legislador afirma que el ingreso medio de la población


supera los $8000 mensuales.
• La proporción de ciudadanos dispuestos a seguir apoyando al
gobierno de turno en las próximas elecciones a mayor al 50 %.

2
Motivación

Buscamos evaluar estas hipótesis para decidir si la afirmación se


encuentra apoyada por la evidencia que se obtiene a través de
una muestra.

Entonces, las pruebas de hipótesis:

• se realizan respecto a los parámetros poblacionales


(desconocidos): µ o p,
• utilizamos información muestral para evaluar si la evidencia
empı́rica valida dichas hipótesis.

3
Motivación

Tienen una estructura de pasos lógicos:


(1) Definir dos alternativas que cubran todos los resultados
posibles.

4
Motivación

Tienen una estructura de pasos lógicos:


(1) Definir dos alternativas que cubran todos los resultados
posibles.
(2) A partir de una muestra aleatoria se computan estadı́sticos
que permitan seleccionar una de las dos alternativas.

4
Motivación

Tienen una estructura de pasos lógicos:


(1) Definir dos alternativas que cubran todos los resultados
posibles.
(2) A partir de una muestra aleatoria se computan estadı́sticos
que permitan seleccionar una de las dos alternativas.
(3) Como los estadı́sticos tienen una distribución muestral, la
decisión se toma en un contexto de variación aleatoria.

4
Motivación

Tienen una estructura de pasos lógicos:


(1) Definir dos alternativas que cubran todos los resultados
posibles.
(2) A partir de una muestra aleatoria se computan estadı́sticos
que permitan seleccionar una de las dos alternativas.
(3) Como los estadı́sticos tienen una distribución muestral, la
decisión se toma en un contexto de variación aleatoria.
(4) Se necesitan reglas de decisión para elegir entre ambas
alternativas.
(5) Recordar: los estadı́sticos muestrales no pueden usarse para
probar con “certeza” que una de las hipótesis en verdadera.
Pero sı́, podemos encontrar que una de esas alternativas tiene
una muy baja probabilidad de ser correcta.
4
Motivación

Tienen una estructura de pasos lógicos:


(1) Definir dos alternativas que cubran todos los resultados
posibles.
(2) A partir de una muestra aleatoria se computan estadı́sticos
que permitan seleccionar una de las dos alternativas.
(3) Como los estadı́sticos tienen una distribución muestral, la
decisión se toma en un contexto de variación aleatoria.
(4) Se necesitan reglas de decisión para elegir entre ambas
alternativas.
(5) Recordar: los estadı́sticos muestrales no pueden usarse para
probar con “certeza” que una de las hipótesis en verdadera.
Pero sı́, podemos encontrar que una de esas alternativas tiene
una muy baja probabilidad de ser correcta.
4
Algunos conceptos

Para ello, es necesario introducir primero algunos conceptos...

• Hipótesis nula y alternativa


• Errores de tipo I y II
• Potencia del test
• Nivel de significación
• p-valor

5
Hipótesis nula y alternativa

• Hipótesis nula (mantenida): realizamos una hipótesis


(conjetura o suposición) sobre un parámetro poblacional
(desconocido): µ o p.
• Esta hipótesis se mantendrá salvo que exista evidencia
suficiente para rechazarla.
• En el caso de rechazar la hipótesis nula, hay evidencia en favor
de la segunda hipótesis (hipótesis alternativa).

Advertencia: si no rechazamos la hipótesis nula, no quiere decir


que la hipótesis nula es correcta, sino que el test no permite
rechazar la hipótesis nula.

6
Hipótesis nula y alternativa

La especificación de las hipótesis nula (H0 ) y alternativa (H1 )


depende del problema.

Ejemplos:

(1) El CEO de una compañı́a de autos afirma en una reunión de


directorio que cada concesionaria está vendiendo al menos 50
autos por mes en promedio. Se desea evaluar la validez de
dicha afirmación.
(2) La proporción de alumnos de la UTDT nunca falta a clase
durante el trimestre es menor al 20 %. Se desea evaluar la
validez de dicha afirmación.

7
Hipótesis nula y alternativa

• Hipótesis Nula: H0
• Hipótesis Alternativa: H1

Posibles decisiones que pueden tomarse respecto a la hipótesis nula:

Decisión respecto a la H0
Rechazar No rechazar
α decisión correcta
verdadera
Error de Tipo I 1−α
decisión correcta β
falsa
potencia = 1 − β Error de Tipo II

• No pueden cometerse ambos errores a la misma vez.


• Generalmente se achica uno, pero se agranda el otro.
• Entonces se fija α en 1 %, 5 % y 10 %.
8
9
Algunos conceptos básicos

Una prueba de hipótesis con respecto a una caracterı́stica


desconocida de cualquier población de interés es una regla para
decidir si se rechaza o no la hipótesis nula.

10
Algunos conceptos básicos

Una prueba de hipótesis con respecto a una caracterı́stica


desconocida de cualquier población de interés es una regla para
decidir si se rechaza o no la hipótesis nula.

La decisión se basa en un estadı́stico que depende solo de


información muestral. Para ciertos valores de este estadı́stico la
decisión será rechazar la hipótesis nula. Estos valores se conocen
como los valores crı́ticos y determinan una región crı́tica.

10
Regiones crı́ticas

Si la H0 sobre el parámetro de interés θ es del tipo:


H0 : θ = θ 0
y si la H1 es de la forma,
H1 : θ > θ 0 o H1 : θ < θ 0
se dice que es una hipótesis alternativa unilateral. La región
crı́tica también recibe el nombre de región de rechazo unilateral.
De otro modo, debe establecerse una hipótesis alternativa
bilateral:
H1 : θ 6= θ0
Una hipótesis alternativa bilateral implica la existencia de una
región crı́tica bilateral (la cual es simétrica: las dos partes de la
región se seleccionan de tal forma que el área bajo la curva de
cada una de las regiones sea igual). 11
Regiones crı́ticas

En resumen,

12
Prueba de hipótesis para la µ con σ 2 conocida

Caso 1: (Z)
Suponemos que observamos una variable aleatoria que proviene de
una población normal con varianza conocida, σ 2 . Para cualquiera
de los siguientes conjuntos de hipótesis:

H0 : µ = µ 0 H0 : µ ≥ µ 0 H0 : µ ≤ µ 0
H1 : µ 6= µ0 H1 : µ < µ0 H1 : µ > µ0

El estadı́stico que usamos es:

X − µ0
Z= √ ∼ N(0, 1)
σ/ n

13
Prueba de hipótesis para la µ con σ 2 conocida

Si α = 0,05 es el nivel de significatividad considerado, las regiones


de rechazo en cada caso estarán dadas por:

14
Prueba de Hipótesis para la Media (µ)

Reglas de decisión:

(1) Calcular el valor del estadı́stico de contraste (Z) y compararlo


contra el valor crı́tico (de tabla de la normal estándar).

(2) Calcular el p-valor (o p-value) y comprarlo contra el α (1 %,


5 % o 10 %).

15
p-valor o p-value

El p-valor es el nivel de significatividad más pequeño a partir del


cual la hipótesis nula puede ser rechazada. En otras palabras, es la
zona crı́tica que corresponderı́a al valor del estadı́stico.

• Prueba bilateral: P(|Z | ≥ z|H0 ) = p−value


• Prueba unilateral (derecha): P(Z ≥ z|H0 ) = p−value
• Prueba unilateral (izquierda): P(Z ≤ z|H0 ) = p−value

16
Para resolver

Una panaderı́a suministra pan lactal a los supermercados. El peso


de venta mı́nimo requerido es µ =2 kg. Sin embargo, no todos los
paquetes pesan exactamente 2kg porque existe variabilidad en el
peso del pan. Por lo tanto, resulta importante evaluar si el peso
promedio de los panes es significativamente menor a 2kg.

17
Para resolver

Una panaderı́a suministra pan lactal a los supermercados. El peso


de venta mı́nimo requerido es µ =2 kg. Sin embargo, no todos los
paquetes pesan exactamente 2kg porque existe variabilidad en el
peso del pan. Por lo tanto, resulta importante evaluar si el peso
promedio de los panes es significativamente menor a 2kg.

Se supone que el peso de los panes (X , medido en kg) se


distribuye normalmente y suponemos que la varianza es σ 2 = 0,12
(conocida a partir de experiencias pasadas).

17
Para resolver

Una panaderı́a suministra pan lactal a los supermercados. El peso


de venta mı́nimo requerido es µ =2 kg. Sin embargo, no todos los
paquetes pesan exactamente 2kg porque existe variabilidad en el
peso del pan. Por lo tanto, resulta importante evaluar si el peso
promedio de los panes es significativamente menor a 2kg.

Se supone que el peso de los panes (X , medido en kg) se


distribuye normalmente y suponemos que la varianza es σ 2 = 0,12
(conocida a partir de experiencias pasadas).

Se toma una muestra de n = 20 panes y se los pesa. El peso


promedio es de 1.97 kg. ¿Existe evidencia suficiente para probar
que el peso medio de los panes no es inferior a 2kg? Utilice un
nivel de significación del 5 %
17
Evaluando la potencia de un test

Consideren un test tal que:

H0 : µ ≤ µ 0
H1 : µ > µ0

Vamos a rechazar H0 si:

X − µ0
√ > zα
σ/ n

Es decir, si:

X > Xc = µ0 + zα σ/ n

18
Evaluando la potencia de un test

Ahora, imaginemos que lo que se está planteando en H0 es falso y


entonces queremos calcular β (error de tipo II) y 1 − β (potencia).

¿Cómo habı́amos definido a β y 1 − β?

19
Evaluando la potencia de un test

Ahora, imaginemos que lo que se está planteando en H0 es falso y


entonces queremos calcular β (error de tipo II) y 1 − β (potencia).

¿Cómo habı́amos definido a β y 1 − β?

Si la verdadera media fuera µ = µ∗ tal que µ∗ > µ0 , entonces,


 
X c − µ∗
β = P(X < X c |µ = µ∗) = P z < √
σ/ n

Y la potencia será 1 − β.

¿Por qué?

19
Evaluando la potencia de un test

Vuelva al ejemplo anterior de la panaderı́a y el supermercado,


grafiquen en R cómo varı́a la potencia del test para µ∗ < 2

0.8
potencia

0.4
0.0

1.5 1.6 1.7 1.8 1.9 2.0

mu*

¿Qué conclusiones saca?


20
Prueba de hipótesis para la µ con σ 2 desconocida

Caso 2: (T)
Cuando σ 2 es desconocida, es razonable reemplazando por la
varianza muestral S 2 . Entonces,

X − µ0
T = √ ∼ tn−1
S/ n

En R:

• t.test()

21
Para resolver

A fin de decidir la compra de un comercio, se desea confirmar el


supuesto que el nivel promedio de ventas es de por lo menos $580
diarios. Con tal propósito se observaron las ventas de 50 dı́as
obteniendo un promedio de $565 y una dispersión de $23,8.
Verificar la hipótesis del vendedor con un α del 10 %.

22
En STATA

• Caso 1: ztest variable==#


• Caso 2: ttest variable==#

23
Prueba de Hipótesis para la Varianza (σ 2 )

H0 : σ 2 = σ02
H1 : σ 2 6= σ02

Estadı́stico:
(n − 1)S 2
χ2 = ∼ χ2n−1
σ02
Si α es el nivel de significación considerado, la región de rechazo
será:

24
Ejemplo

Para llegar a los estándares establecidos, es importante que la


varianza del porcentaje de nivel de impurezas en un litro de agua
potable no exceda 4. Una muestra aleatoria de 20 observaciones en
cierto barrio arrojó una varianza muestral de 5.62. Verificar si la
varianza poblacional en el nivel de impurezas del agua potable de
este barrio cumple o no con los estándares establecidos. Considere
α = 0,10.

25
Ejemplo

Para llegar a los estándares establecidos, es importante que la


varianza del porcentaje de nivel de impurezas en un litro de agua
potable no exceda 4. Una muestra aleatoria de 20 observaciones en
cierto barrio arrojó una varianza muestral de 5.62. Verificar si la
varianza poblacional en el nivel de impurezas del agua potable de
este barrio cumple o no con los estándares establecidos. Considere
α = 0,10.
H0 :σ 2 ≤ 4
H1 :σ 2 > 4
(19)(5,62)
χ2 = = 26,695 χ2n−1,α = χ219,0,10 = 27,20
4
Con un nivel de confianza del 90 % no se rechaza la H0 . No hay
evidencia suficiente contra la hipótesis de que la varianza
poblacional no cumple con los estándares establecidos. 25
Prueba de hipótesis para la p

Bajo las mismas condiciones que en el IC para la proporción:

H0 : p = p 0
H1 : p 6= p0

El estadı́stico que usamos es:

pb − p0
Z=q ∼ N(0, 1)
pb(1−bp)
n

En STATA:

• prtest variable==#

26
Para resolver

En una encuesta realizada sobre 871 adultos, el 53 % de los


entrevistados estuvieron a favor de un apoyo decidido al gobierno.
Con una confianza del 95 %, ¿se podrı́a asegurar que la mayorı́a de
los adultos está a favor de un apoyo decidido del gobierno?

27
Grupo de Tratamiento vs. Grupo de Control

28
Grupo de Tratamiento vs. Grupo de Control

Las pruebas de comparación de medias son MUY utilizadas y son


la base sobre la cual se realizan los estudios en los que se quiere
evaluar el efecto de un “tratamiento” a partir de dividir a la
población en dos grupos:

• Grupo de Tratamiento: es el grupo experimental al cual se


aplica el tratamiento (ej: participan en un proyecto de
conexión a la red de gas natural)
• Grupo de Control: es el grupo que no participa del
tratamiento, pero tiene caracterı́sticas similares al grupo de
tratamiento

29
Grupo de Tratamiento vs. Grupo de Control

La idea básica cuando se evalúa un programa es medir el efecto


causal de una intervención (ej. un subsidio). Idealmente
quisiéramos comparar como se comporta un grupo con ese
tratamiento comparado a otro grupo de caracterı́sticas idénticas en
todos los aspectos, pero que no recibieron el tratamiento.
Los experimentos controlados que son comunes dentro de un
laboratorio, son más limitados en economı́a y negocios.

30
Prueba de hipótesis para la diferencia de medias

Primero veremos distintas pruebas de diferencia de medias entre


dos poblaciones, pero para:

• muestras dependientes o apareadas


• muestras independientes.

31
Prueba de hipótesis para la diferencia de medias

Dos Medias, Muestras Apareadas:

La principal caracterı́stica de las muestras apareadas es que para


cada observación del primer grupo (las X ), hay una observación
relacionada en el segundo grupo (las Y ).

Las muestras apareadas se obtienen cuando se realizan


comparaciones sobre una misma unidad experimental. Ejemplo:

• se estudia un mismo individuo antes y después de un


tratamiento

32
Prueba de hipótesis para la diferencia de medias

Dos Medias, Muestras Apareadas:

Llamemos d a la diferencia entre las medias de x e y (p.ej., el


rendimiento académico de los alumnos antes y después del
examen):
d = µX − µY
Entonces, la diferencia de las medias muestrales es:

d =x −y

La varianza muestral de d es:


Pn
2 (di − d)2
Sd = i=1
n−1

33
Prueba de hipótesis para la diferencia de medias

Dos Medias, Muestras Apareadas:

H0 : d = 0 ⇔ µ X − µ Y = 0
H1 : d 6= 0 ⇔ µX − µY 6= 0

d
T = √ ∼ tn−1
Sd / n

En STATA:

• ttest variable1==variable2

34
Para resolver

Antes de lanzar una promoción muy agresiva de cierto producto en


los grandes hipermercados, la directora de marketing de la empresa
quiere realizar una prueba piloto. Para ello selecciona al azar 50
hipermercados sobre los cuales lleva a cabo la promoción y recoge
los datos de ventas (expresadas en millones de pesos) antes y
después de la promoción:

n Promedio Desvı́o Estándar


Antes 50 15.4 3.8
Después 50 17.2 4.5

Se sabe que el coeficiente de correlación entre las ventas antes y


después de la promoción es de 0,8.
• Con un α de 5 %, ¿considera que la promoción es efectiva
para incrementar el nivel de ventas de la empresa? 35
Prueba de hipótesis para la diferencia de medias

Ahora veremos los casos donde hay muestras aleatorias para dos
poblaciones independientes entre sı́ y lo que queremos evaluar es
la diferencia entre las medias de ambas poblaciones. Esto es,
H 0 : µX − µY = 0 o H 0 : µ X − µY ≤ 0 o H0 : µX − µY ≥ 0
H1 : µX − µY 6= 0 o H 1 : µ X − µY > 0 o H1 : µX − µY < 0
El estadı́stico dependerá de si conocemos o no la varianza
poblacional, podemos encontrarnos en alguno de los estos casos:

• Caso 1: las varianzas poblacionales, σX2 y σY2 , son conocidas.


• Caso 2: las varianzas poblacionales, σX2 y σY2 , son
desconocidas, pero iguales.
• Caso 3: las varianzas poblacionales, σX2 y σY2 , son
desconocidas y distintas.
36
Prueba de hipótesis para la diferencia de medias

Caso 1: cuando las varianzas poblaciones, σX2 y σY2 , son conocidas.


Es el caso normal, en el cual el estadı́stico de contraste es:

X − Y − (µX − µY )0
Z= q ∼ N(0, 1)
σX2 /nX + σY2 /nY

37
Prueba de hipótesis para la diferencia de medias

Caso 2: cuando las varianzas poblacionales, σX2 y σY2 , son


desconocidas, pero iguales usamos la t de Student y el estadı́stico
es: 
X − Y − (µX − µY )0
T = p ∼ tnX +nY −2
sp 1/nX + 1/nY
(n −1)s 2 +(nY −1)sY2
q
donde sp2 = X nX X+nY −2 , sp = sp2

En R:

• t.test() indicando las dos variables x e y y la opción


var.equal=TRUE

38
Prueba de hipótesis para la diferencia de medias

Caso 3: σX2 y σY2 son desconocidas y distintas:

(X − Y ) − (µX − µY )0
T = q ∼ tη0
SX2 /nX + SY2 /nY

donde 2
SX2 SY2

nX + nY
η0 =
SX4 SY4
2 (n −1)
nX
+ 2 (n −1)
nY
X Y

Este test también es conocido como el Test de Welch.

39
En STATA

• Caso 1: ztest variable, by(groupvar)


• Caso 2: ttest variable, by(groupvar)
• Caso 3: ttest variable, by(groupvar) welch

40
Prueba de hipótesis para la diferencia de varianzas o Test F

Si queremos contrastar dos varianzas:


H0 : σX2 = σY2 =⇒ H0 : σX2 /σY2 = 1
H1 : σX2 6= σY2 =⇒ H1 : σX2 /σY2 6= 1
El estadı́stico de contraste es:
SX2
F = SY2
∼ F (nX − 1, nY − 1)

sigue una distribución F con (nX − 1, nY − 1) grados de libertad,


la cual es asimétrica y adopta valores no negativos:

41
Prueba de hipótesis para la diferencia de varianzas o Test F

Nota: la varianza muestral más grande debe estar en el


numerador, de esta manera existe una única región de rechazo para
probar la hipótesis de igualdad de varianzas poblacionales.

42
Prueba de hipótesis para la diferencia de proporciones

Nuevamente, para muestras lo suficientemente grandes


(np0 (1 − p0 ) > 5):

H0 :px − py = 0
H1 :px − py 6= 0
(p̂x − p̂y )
Z=s
p̂0 (1 − p̂0 ) p̂0 (1 − p̂0 )
+
nx ny
donde:
nx p̂x + ny p̂y
p̂0 =
nx + ny
En STATA:

• prtestvariable, by(groupvar)
43
Para hacer en STATA

Usen la base de datos: pizza delivery.csv.


Se pide:
(1) El objetivo del manager es entregar las pizzas en menos de 30
minutos. Use una prueba de hipótesis apropiada para evaluar
si es razonable alcanzar dicho objetivo.
(2) Un segundo objetivo del manager es entregar las pizzas con
una temperatura mayor a los 65C. Use una prueba de hipótesis
apropiada para evaluar si es razonable alcanzar dicho objetivo.
(3) El manager sospecha que la operadora Laura logra facturar
más que Melissa. ¿Hay evidencia suficiente para sostener
dicha afirmación?
(4) ¿Se puede considerar que la cantidad de pizzas entregadas por
la sucursal East es equivalente a la de la sucursal West?
44
Material de consulta
Links y recursos útiles

Bibliografı́a:

• Newbold et al. (2013) - Cap. 9 y 10

45