Anda di halaman 1dari 51

Prueba de Hiptesis

Tipos de inferencias (2)

PRUEBA DE HIPOTESIS: busca responder a


una pregunta sobre el valor de un parmetro en
la poblacin (siempre utilizando los resultados
de la muestra)

Esta pregunta sobre el valor del parmetro en la

poblacin se plantea utilizando hiptesis

El procedimiento cuantifica en que medida los


datos de la muestra apoyan la hiptesis
planteada

En el ejemplo anterior, la pregunta


es si hay menos resistencia con el
nuevo antimalrico

En Estadstica

Los mtodos estadsticos son herramientas de


la ciencia para el contraste formal de hiptesis.

Las hiptesis para ser contrastadas con


mtodos estadsticos deben ser formuladas de
modo particular

Elementos necesarios

Las hiptesis

Un procedimiento para responder a la


pregunta o hiptesis utilizando los datos
de la muestra

Criterios para interpretar los resultados

Hiptesis

Son enunciados formulados como


respuestas tentativas a preguntas de
investigacin.
Pregunta de investigacin Hiptesis

Mtodo Cientfico

Cmo funciona la Ciencia:


1.
2.
3.

4.

Se formula una hiptesis.


Se obtienen datos (muestra)
La hiptesis es contrastada con la
evidencia de la muestra.
Conclusin

La evidencia proviene de la informacin


de las observaciones del fenmeno que se
estudia.

Las observaciones se obtienen de unidades


de estudio (individuos), usualmente de una
muestra.

Porqu hiptesis?

La pregunta de investigacin debe tratar


de expresarse en forma de hiptesis

El mtodo cientfico no permite determinar


que una hiptesis es verdadera, solamente
puede determinar si es falsa

Por lo tanto debe plantearse una hiptesis


que al ser rechazada d respuesta a la
pregunta de investigacin

Las dos hiptesis

Hiptesis nula, H0
Hiptesis de no diferencia o no asociacin, es
planteada en forma opuesta a la pregunta de
investigacin de inters, definida para ser
rechazada: la tasa de resistencia a ambos
antimalricos es similar

Hiptesis alternativa o alterna, Ha


Es la pregunta cientfica de inters. Aceptaremos
que Ha es verdadera si los datos sugieren que
H0 es falsa: la tasa de resistencia difiere entre
ambos antimalricos

Ejemplos
Ho

Ha

Riesgo relativo = 1

Riesgo relativo 1

Resistencia 50%

Resistencia < 50%

XCD4-intervencin = XCD4-estndar

XCD4-intervencin XCD4-estndar

Sensibtest1 Sensibtest2

Sensibtest1 > Sensibtest2

Xint1 = Xint2 = Xint3 = Xint4

Algn Xi es diferente

En una regresin, 1 = 0

1 0

Curaanalgsico1 < Curaanalgsico2 Curaanalgsico1 Curaanalgsico2

Las hiptesis se plantean como:

De existencia del EFECTO (de un tratamiento).


De una DIFERENCIA (de las medias del peso
al nacer las proporciones del bajo peso al
nacer entre dos poblaciones).
De la ASOCIACIN (entre el tipo de
construccin de las casas y la distribucin del
Dengue).

Ejemplos adicionales:

La Altura produce incremento en la frecuencia de


nacimientos prematuros: Existe DIFERENCIA entre
las Edades gestacionales de neonatos en la Altura vs.
a Nivel del Mar.

La sustancia X incrementa la posibilidad de


malformaciones congnitas: Existe DIFERENCIA en
la prevalencia de malformaciones congnitas entre
gestantes expuestas a X vs. No expuestas.

Que los alumnos formulen sus preguntas de


investigacin y las conviertan en hiptesis

Formulacin de Hiptesis
(continuacin)

Hiptesis Nula (Ho) :


Enunciado formal para el contraste de
hiptesis con mtodos estadsticos: No hay
asociacin, No hay diferencia, No hay
efecto.

Hiptesis alternativa (H1):


Hiptesis complementaria a Ho: Si hay
asociacin, Si hay diferencia, Si hay
efecto.

La Hiptesis nula y la Hiptesis alternativa


habitualmente (p. ej. en Epidemiologa) se
plantean en funcin de una Medida del

Efecto.

Medidas del efecto son:

Diferencias de medias,
Diferencias de prevalencias
Razones de riesgo (Riesgos relativos)
Razones de chances (Odds ratios)

Hiptesis de dos colas

Un clnico trata de demostrar que la reaccin


al tratamiento es diferente entre el frmaco
A y el frmaco B

Hiptesis:

Ho: A = B (Nula)
Ha: A B (Alterna)

Hiptesis de una cola

Inters especfico en una sola direccin

No existe inters/relevancia cientfica si el


efecto se presenta en la otra direccin

Ejemplo: se quiere demostrar que el frmaco


A tiene mayor efecto que el frmaco B

Hiptesis:

Ho: A B (Nula)
Ha: A > B (Alterna)

Cul hiptesis es verdadera


(o falsa)?

Con los datos de la muestra se calcula un valor


(llamado estadstico de prueba) que sirve para
decidir si Ho es falsa y debe ser rechazada
(nica y exclusivamente para eso)

Si los resultados sugieren que se debe


rechazar Ho, entonces automticamente se
acepta que Ha es verdadera

Si los resultados no indican que se rechaze Ho


tampoco se puede concluir nada sobre Ha

Usando el estadstico de prueba

Con el estadstico de prueba y una frmula


matemtica (distribucin de probabilidades,
que vara segn el tipo de hiptesis evaluada),
se calcula una probabilidad, el famoso valor p

El valor p, p, o p-value puede interpretarse


como la probabilidad de que Ho sea verdadera

Por convencin se acepta que si p < 0.05 (5%),


entonces es muy probable que Ho sea falsa y
por lo tanto debe ser rechazada

Ejemplo

Queremos determinar si el promedio de peso


en varones es bajo (<70k)

Ho: Peso 70,

En 30 personas, promedio 50kg y D.E. 10 kg

Ha: Peso > 70

El Valor P y la evidencia

El Valor P Significancia estadstica es una


medida (cuantitativa) de la fuerza de la evidencia
en contra de la Hiptesis nula.
Escala de grises

Mientras ms pequeo sea el valor P, ms fuerte


es la evidencia en contra de la hiptesis nula.

El Valor P como una probabilidad

Utilizando el valor crtico


Zobservado = -10.96

Regin de
rechazo:
2.5% bajo
la curva

Tcrtico = -1. 70

Clculo de probabilidad exacta


Zobservado = -10.96
p exacto
= rea
bajo la
curva

Una

interpretacin prctica (aunque


no exacta) del valor P es:

P es la probabilidad de que la
Hiptesis nula sea cierta

Valor P (continuacin)

Si las observaciones en la muestra


soportan la Hiptesis nula. Entonces es
ms probable que esta Hiptesis sea
cierta.

Reglas de Decisin

Para tomar una decisin sobre rechazar o no


rechazar la hiptesis nula hay que
especificar una Regla de decisin.
Hay que especificar un punto de corte
punto crtico:
Si P es menor que Alfa (), se rechaza Ho
Si P es mayor que Alfa (), se rechaza Ho

Para cada prueba, el clculo


de p puede diferir
Prueba sobre

Distribucin

Una proporcin

Binomial o normal (Z)

Razn de momios

Chi cuadrado

Diferencia de 2 proporciones

Z o chi cuadrado

Diferencia de 2 medias

ZoT

Regresin lineal

La frmula del estadstico de prueba tambin cambia!

Normal/Large Sample Data?

Yes
Inference on means?

Yes

No

Independent?

Inference on variance?

No

Yes
Variance
known?

Yes

Yes

Paired t

F test for
variances

No

Variances equal?

Yes

Z test

T test w/
pooled
variance

No
T test w/
unequal
variance

Normal/Large Sample Data?


No
Yes

Binomial?

No

Independent?

Nonparametric test
No

Yes
McNemars test

Expected 5
No

Yes
2 sample Z test for
proportions or
contingency table

Fishers Exact
test
4

Ahora, recordemos que estamos


usando una muestra para
concluir sobre la poblacin
Es posible (poco probable, ojal)
que la decisin tomada de
rechazar o no Ho sea errnea

Qu error podramos cometer?

Escenarios posibles
ESTADO REAL (LA VERDAD)
H0 es falsa y
H0 es verdadera,
Ha es verdadera
No hay diferencia
Hay diferencia

EVIDENCIA/

No diferencia
(No rechaza H0))

NO HAY
ERROR

Error Tipo II
()

Hay diferencia
(Rechazar H0 y
aceptar Ha)

Error Tipo I
()

NO HAY
ERROR

DATOS DE LA

MUESTRA

Posibles escenarios
ESTADO REAL (VERDAD)
desconocido
Hay Diferencia

EVIDENCIA
( DATOS)
observados

No hay diferencia

Diferencia
(Rechazar H0)

NO HAY
ERROR

Error Tipo I

No diferencia
(No rechazar H0)

Error Tipo II

NO HAY
ERROR

()

()

Errores en la toma de decisiones

Al tomar una decisin basados en un


punto de corte se pueden cometer uno de
dos errores:
1.

Rechazar Ho siendo esta cierta


(Error tipo I).

2.

No rechazar Ho siendo esta falsa


(Error tipo II)

Error Tipo I ()

PUEDE ocurrir cuando la evidencia (datos de


la muestra) sugiere NO RECHAZAR Ho

El error consiste en reportar una diferencia o


asociacin que realmente no existe

Puede deberse a un tamao de muestra muy


grande que detecta diferencias no biolgicas

Tambin puede darse por azar, estimndose


que puede ocurrir con una probabilidad p

Error Tipo II ()

PUEDE ocurrir cuando la evidencia sugiere


RECHAZAR Ho

El error consiste en reportar que no hay una


diferencia o asociacin cuando si la hay

Puede deberse a tener una muestra pequea


que no permite detectar diferencias reales

Tambin puede darse por azar, aunque el


clculo de la probabilidad () es muy complejo

Habitualmente (Tradicionalmente) se
especifica a priori un punto de corte () de
0.05. Esto trasladado a nuestra regla de
decisin, significa que el Error tipo I de la
prueba estadstica ser del 5%.
Una vez especificado el valor de , tenemos
controlada la magnitud del Error tipo I. El
Error tipo II () se controla modificando el
tamao de la muestra.
En general y se minimizan con tamaos
de muestra grandes.

Cmo determinar el tamao de los errores y


? :Debiera depender de las consecuencias de
cometer uno u otro error ?
EJEMPLOS:
Al investigar una nueva Droga en un estudio in
vitro: Si el resultado es significativo se
continua investigando; caso contrario se
abandona el estudio. En este caso tiene ms
sentido minimizar (abandonar para siempre
el estudio de una droga efectiva).

En un ensayo clnico de una Droga para tratar


una enfermedad (que tiene varios otros
tratamientos efectivos). Si el resultado es
significativo, la droga entra al mercado; caso
contrario el trabajo en esta droga cesar.
El error (abandonar el estudio de una droga
efectiva para la que existen varias opciones) no
es tan importante como cometer un error que
implicara sacar al mercado una droga intil.
En este caso tendra prioridad en ser
minimizada

Errores conceptuales comunes

Las inferencias son vlidas slo para las


muestras donde se tomaron los datos

Si no rechazamos H0 eso significa que H0 es


verdadera

Una diferencia estadsticamente significativa


tiene relevancia biolgica

El valor p mide que tan diferentes son los


promedios/proporciones

Supuestos ms comunes

Todas las observaciones son independientes


entre s

Tamao de muestra grande para que se


cumpla el teorema del lmite central

En variables numricas, no deben haber


valores extremos o sesgos que limiten la
representatividad del promedio como medida
de tendencia central

Ejemplo: Prueba de Hiptesis

Un Clnico compara la proporcin de


pacientes con Hepatitis crnica que
responde favorablemente a dos
tratamientos: A y B.

Hiptesis:

Ho: A B =0 (Nula)
H1: A B 0 (Alterna)

Se llev a cabo un Ensayo clnico asignando


de manera aleatoria (y ciega) la droga A y la
droga B a 300 pacientes con Hepatitis crnica.
Se observ que en el grupo que recibi la
droga A, 30% tuvieron respuesta favorable.
En contraste con el grupo que recibi la droga
B (17% respondieron favorablemente).

Especificando un punto de corte para


significancia: Alfa () = 0.05

Prueba estadstica para comparar proporciones


(30% versus 17%): P=0.015

Conclusin: La diferencia en las respuestas al


tratamiento entre los grupos (droga A vs. droga
B) es significativa.

Dependiendo de la Medida del efecto


empleada (diferencias, odds ratios [OR],
riesgos relativos [RR]) y del tipo de
variables a analizar (promedios,
proporciones, tiempo hasta un evento,
etc...) las hiptesis varian, as como los
mtodos estadsticos que se deben usar.

Significancia estadstica vs. Significancia


biolgica.
La significancia estadstica no dice nada acerca de la
verdadera magnitud o la importancia de un efecto.

En muestras grandes, las diferencias muy pequeas


que tienen poca o ninguna importancia biolgica
pueden resultar significativas.

Las Implicancias de un resultado significativo


deben ser juzgados en otro terreno [el Biolgico],
adems del estadstico.

Ejemplos con Stata (1)

Pregunta de investigacin: El sexo influye


en la edad de inicio del consumo de
cigarrillos?

Ho: Edadinicio consumo(varones-mujeres)=0


H1: Edadinicio consumo(varones-mujeres)0

Datos: Encuesta de drogas

Variables: p59 (Edad de inicio del consumo de


cigarrillos) e inf_sexo (Sexo)
Prueba estadstica: Prueba t para dos medias
independientes

Ejemplos con Stata (2)

Pregunta de investigacin: Existen


diferencias entre sexos en la prevalencia de
consumo de cigarrillos?

Ho: P(varones) P(mujeres)=0


H1: P(varones) P(mujeres)0

Datos: Encuesta de drogas

Variables: fuma (generada de p58) e inf_sexo (Sexo)


Prueba estadstica: Prueba Z para dos proporciones

Anda mungkin juga menyukai