Anda di halaman 1dari 20

The null hypothesis significance test in

health sciences research (1995-2006):


statistical analysis and interpretation
Silva-Aycaguer Luis Carlos
Suarez-Gil Patricio
Fernandez-Somoano Ana

BMC Medical Research Methodology 2010, 10:44


Indexada en: PubMed, MEDLINE, CAS, EMBASE, Scopus, Current Contents, Thomson Reuters (ISI) and
Google Scholar

Factor de impacto: ISI: 2,30

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
VALOR DE P
10 pacientes con Otosclerosis.
Ronald Fisher Ho= Técnica convencional = técnica
novedosa

Si resulta mas eficiente la técnica novedosa


Prueba de significancia de la hipótesis para los 10 pacientes
nula (NHST) ¿Cual es la probabilidad de que la técnica
novedosa produzca mejores resultados
para todos los pacientes bajo el supuesto
Hipótesis Nula –Ho-
que es valida la hipótesis que afirma que
ambas técnicas son igualmente eficientes ?
P = 0,00098.
Valor P
Si se repite el estudio 100.000 veces y Ho
fuera verdadera, solo en 98 ocasiones
obtendríamos 10 éxitos consecutivos.

P = 0,03 Ho tiene una probabilidad de sólo


índice para medir la fuerza de la un 3% de ser cierta
evidencia contra la hipótesis nula La investigación biomédica y sus laberintos: En defensa de la racionalidad
para el siglo XXI(2209)

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Jerzy Neyman y Egon Pearson

Prueba de hipótesis estadísticas

Aceptar la hipótesis nula de tomar


la decisión como una referencia
basada en la información
proporcionada o rechazarla en
favor de una alternativa

Error Tipo 1 Error Tipo 2

Decisión: La máxima frecuencia de


los errores que sería admisible

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Fisher + Neyman y Pearson
Dada una hipótesis nula

Se obtiene una estimación del


parámetro o parámetros

Se calcula el Valor de P

La hipótesis nula es rechazada cuando el valor


P obtenido es menor que un cierto umbral
comparativo (normalmente 0,05) y no es
rechazada si P es mayor que el umbral

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Legitimidad epistemológica y valor práctico del
Valor P
Se utiliza como una herramienta para
tomar decisiones a favor o en contra de
una hipótesis.

Las conclusiones dependen de un factor


completamente ajeno a la realidad
estudiada (tamaño de la muestra)

La NHST no garantiza la objetividad.


Se vuelve una decisión dicotómica.

No exige una interpretación razonable de los


resultados.

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
A pesar de las debilidades y
deficiencias de la NHST, es enseñada
como si fuera la clave del método
inferencial estadístico o el más
adecuado, incluso el único
incuestionable.

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Intervalos de
NHST Vs confianza

"When possible, quantify findings and present


them with appropriate indicators of
measurement error or uncertainty (such as
confidence intervals). Avoid relying solely on
statistical hypothesis testing, such as P-values,
which fail to convey important information
about effect size"

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Intervalos de confianza
Es un recorrido de valores, basados en una muestra tomada de una
población, en el que cabe esperar que se encuentre el verdadero
valor de un parámetro poblacional con cierto grado de confianza.

Nivel de confianza: 95%

Noventa y cinco de cada cien veces obtendría intervalos que


contendrían el verdadero parámetro poblacional y cinco veces
obtendría intervalos que no lo contendrían.

Hay una probabilidad de 95% de que el verdadero valor se


encuentre dentro del intervalo

Si solo miramos si el intervalo de confianza pasa por cero o no.


Hay entonces alguna diferencia con las pruebas de significancia ?????
O
B Evaluate the extent and quality of use of NHST
and CI, both in English- and in Spanish-
J language biomedical publications, between
1995 and 2006 taking into account the
E International Committee of Medical Journal
Editors recommendations, with particular focus
T on accuracy regarding interpretation of
statistical significance and the validity of
I conclusions.
V
O
Adriana Giraldo Villa.
Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Revista
Obstetrics & Gynecology
Española de Cardiología
M
International Journal of
Atención Primaria
É Epidemiology

T British Medical Journal Medicina Clínica

O
(1995-1996, 2000-2001, 2005-2006)
D
O Factor de impacto 1.337 (MC) y 9.723 (BMJ)

S 60 documentos para cada


Igual probabilidad
bienio y revista

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Estudios descriptivos Estudios analíticos

M Teóricos, metodológicos o
conceptuales
É
Valor de P
T Resultados : “Significativo”
falacia de significancia

O Valor P + IC
Conclusiones : significancia
D Intervalos de confianza
estadística

O
S - Abstract y cuerpo del articulo, observadores, revisores, estudio piloto (20)
- Porcentajes, junto con sus intervalos de confianza correspondientes.
-Programa EPIDAT

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
R Proceso de selección de los Artículos

E
Artículos inicialmente seleccionados
S n=1092
Eliminados: Artículos originales
U n=49

Artículos recuperados para la evaluación


L n=1043
Eliminados: Teóricos, metodológicos
T descriptivos
n=169

A Artículos incluidos en el análisis


n=874
No usan valor P o IC
D n=5

O Artículos con información útil


n=869

S
Adriana Giraldo Villa.
Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Adriana Giraldo Villa.
Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
El coeficiente kappa: 0,78 (IC 95%: 0,62 a 0,93)

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Adriana Giraldo Villa.
Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Adriana Giraldo Villa.
Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
Innovación
D
I Resultados como potencialmente
elocuentes
S
Los resultados no mostraron una
C diferencia significativa entre
"Una diferencia significativa
entre los grupos se ha
grupos, sin embargo, con un detectado, sin embargo, tal
U tamaño de muestra más grande, vez con una muestra de menor
esta diferencia probablemente tamaño, esta diferencia que se
S habría resultado ser ha demostrado no es
"significativa” significativa".
I
Ó
Aplicación equivocada de NHST.
N

Adriana Giraldo villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
D
I - Artículos en el área clínica todavía consideran la NHST
como el árbitro final del proceso de investigación.
S
- El porcentaje de los artículos que caen en la falacia de
C la significancia es enorme.
U - La resistencia inherente al cambio de los viejos
paradigmas.
S - Los investigadores que desean aparecer en la
I impresión y sobrevivir en un entorno de publicar o
perecer son motivados por la fuerza, el miedo y la
Ó conveniencia en el uso de NHST.
N

Adriana Giraldo villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010
C Se observan algunas mejoras en el manejo estadístico de
O los resultados.

N Esfuerzos de los estudiosos y editores de revistas son


evidentemente requeridos para mover la comunicación
C hacia las advertencias de ICMJE, sobre todo en el ámbito
clínico, y entre las publicaciones en español.
L
U
Se limita a sólo seis revistas específicas y a tres bienios.
S
I Estudio del problema de una manera más detallada
(sobre todo mediante la revisión de más revistas con
O perfiles diferentes) y continuar con la revisión de las
pautas y tendencias.
N
La actividad científica no puede limitarse a
rechazar o no rechazar Ho en pruebas de
hipótesis, o a establecer si existe diferencia o no
en IC, la generación de conocimiento exige una
interpretación razonable de los resultados

Adriana Giraldo Villa.


Maestría en Epidemiología, Facultad Nacional de Salud Pública, 2010