Anda di halaman 1dari 30

MEDICINA BASADA EN LA EVIDENCIA

I.- QU ES LA MEDICINA BASADA EN LA EVIDENCIA (MBE)?


II.- PASOS A SEGUIR EN LA PRCTICA DE LA MBE
II.1.- PRIMER PASO: Formular una PREGUNTA clara a partir del problema clnico a analizar:
II.2.- SEGUNDO PASO: BUSQUEDA sistemtica de las MEJORES EVIDENCIAS disponibles en la bibliografa
para identificar los trabajos relevantes:
II.2.1.- COLABORACIN COCHRANE
II.2.2.- PUBLICACIONES SECUNDARIAS
II.2.3.- BASES DE DATOS
II.2.4.- INTERNET
II.2.5.- REVISTAS MDICAS donde encontrar la mejor evidencia peditrica para la prctica clnica.
II.3.- TERCER PASO: VALORACION CRITICA de las evidencias cientficas encontradas: Talleres CASP

II.3.1.- REVISIN CRTICA DE PUBLICACIONES SOBRE TRATAMIENTO


II.3.2.- REVISIN CRTICA DE PUBLICACIONES SOBRE PRUEBAS DIAGNSTICAS
II.3.3.- REVISIN CRTICA DE PUBLICACIONES SOBRE EFECTOS DE INTERVENCIONES Y/O EXPOSICIONES
II.3.4.- REVISIN CRTICA DE PUBLICACIONES SOBRE PRONSTICO
II.4.- CUARTO PASO: APLICABILIDAD de los resultados de nuestra valoracin a nuestra prctica clnica:
II.4.1.- APLICACIN
II.4.2.- APLICACIN
II.4.3.- APLICACIN
EXPOSICIONES
II.4.4.- APLICACIN

PRCTICA DE PUBLICACIONES SOBRE TRATAMIENTO


PRCTICA DE PUBLICACIONES SOBRE PRUEBAS DIAGNSTICAS.
PRCTICA DE PUBLICACIONES SOBRE EFECTOS DE INTERVENCIONES Y/O
PRCTICA DE PUBLICACIONES SOBRE PRONSTICO

III.- NIVELES DE CALIDAD DE LA EVIDENCIA CIENTIFICA


III.1.- VALORACIN DE LOS PRINCIPALES TIPOS DE ESTUDIOS EPIDEMIOLGICOS:
* Epidemiologa descriptiva
* Epidemiologa analtica
* Epidemiologa experimental
III.2- SESGOS
IV.- LAS MEJORES EVIDENCIAS (O PRUEBAS) CIENTFICAS
IV.1.- ENSAYO CLNICO
IV.1.1.-METODOLOGA DEL ENSAYO CLINICO
IV.1.2.-EL PAPEL DE LAS LISTAS-GUA EN LOS ENSAYOS CLINICOS
IV.1.3.- ESTN LOS ENSAYOS CLNICOS EN CRISIS ?
IV.2.- REVISIN SISTEMTICA
IV.2.1.-METODOLOGA DE LA REVISION SISTEMATICA
IV.2.2.- QU ES EL SESGO DE PUBLICACIN ?
IV.3.- METANLISIS
IV.3.1.-METODOLOGA DEL METANLISIS
IV.3.2.-MS ALL DEL METANLISIS

II.1.- PRIMER PASO: Formular una PREGUNTA clara a partir del problema clnico a analizar:
Es el paso ms importante y clave de la MBE. Se deben formular preguntas clnicas bien construidas y susceptibles de
respuesta. Los cuatro elementos bsicos en la formulacin de la pregunta son:
- el paciente o problema de inters;
- la intervencin que se va a considerar (un tratamiento, un mtodo diagnstico, un efecto perjudicial, un factor
pronstico, etc);
- la intervencin con la que se va a comparar, cuando sea pertinente;
- la variable o variables que valoran el resultado de inters clnico.
Aunque parezca un paso fcil, no es as, y conviene ejercitarse en la ciencia de formular preguntas clnicas
susceptibles de respuesta.
De acuerdo a la pregunta enunciada se plantear un tipo de diseo cientfico diferente:
- si la pregunta es cunto, cundo, dnde y quines, necesitamos un diseo descriptivo;
- si la pregunta es qu dao produce determinada exposicin, se requiere un diseo de caso-control;
- si la pregunta es qu exposicin produce un determinado dao, se requiere un diseo de cohorte;
- si la pregunta es cunto disminuye el dao con la aplicacin de un tratamiento, se requiere de un diseo
experimental, preferible un ensayo clnico controlado aleatorizado;
- si se necesita evaluar la capacidad operativa de una prueba diagnstica, se necesita conocer sobre sensibilidad,
especificidad, valores predicitivos y razones de verosimilitud.
El tipo de pregunta orientar en la bsqueda bibliogrfica: las palabras clave tiles sern el paciente o problema de
inters, la intervencin, los resultados relevantes y el tipo de diseo cientfico.
Es mejor hacer preguntas amplias o restringidas? Las revisiones de datos que sean relevantes para las preguntas
amplias resulta ms lenta y costosa, y las revisiones para las preguntas restringidas quiz no sean generalizables a
entornos diversos.
Aunque las preguntas deben plantearse antes de iniciar la revisin, es importante que estas preguntas no se conviertan
en un cors que evite la exploracin de aspectos inesperados. Las preguntas a posteriori son ms proclives al sesgo
que aquellas que han sido formuladas previamente.

II.2.- SEGUNDO PASO: BUSQUEDA sistemtica de las MEJORES EVIDENCIAS disponibles en la bibliografa
para identificar los trabajos relevantes:
Una de las revoluciones en la investigacin mdica es el auge de la documentacin cientfica, y la necesidad de crear
sistemas eficaces para recuperar la informacin cientfica. Cmo manejar esta sobrecarga de informacin para extraer
la informacin ms relevante es un punto clave en la prctica de la MBE.
El orden de validacin de las fuentes de informacin en medicina, en general, y en Pediatra, en particular, es el
siguiente (de mayor a menor importancia):
1) Colaboracin Cochrane
2) Publicaciones secundarias
3) Bases de datos
4) Consulta a expertos
5) Libros

6) Internet
Como se observa, la Colaboracin Cochrane y las publicaciones secundarias (revistas con resmenes estructurados)
constituyen las fuentes ms importantes; por contra Internet ocupa el ltimo lugar, pues aunque es una fuente
inagotable de datos, no toda la informacin se encuentra validada ni sometida a un panel de expertos. Sin embargo
cabe recordar que la mayora de las fuentes de informacin reseadas pueden ser consultadas va on-line, por lo el
uso de Internet es fundamental en la prctica de la MBE. De hecho se han propuesto estrategias de bsqueda de las
fuentes de informacin disponibles en Internet, y consideramos interesante resear la propuesta por Jos Cristobal
Buuel en su web de Pediatra basada en la evidencia):
-primer paso--> el metabuscador TRIP (se analizar ms adelante), que genera una bsqueda ordenada por
apartados: artculos basados en la evidencia (Cochrane, publicaciones secundarias), revistas revisadas por pares,
guas de prctica clnica y otros documentos.
-segundo paso--> bases de datos de MBE: Cochrane, publicaciones secundarias, bancos de temas valorados
crticamente (CATs, que se analizar ms adelante). No es necesario realizar la valoracin crtica de los artculos
seleccionados, pues ya se ha efectuado por parte de personal experto que asegura su validez.
-tercer paso--> bases de datos que contienen referencias de artculos de revistas primarias (MEDLINE, EMBASE,...).
Aqu es necesario realizar la valoracin crtica de los artculos seleccionados.
Podemos estructurar las fuentes de informacin en cuatro grupos fundamentales: Colaboracin Cochrane,
publicaciones secundarias, bases de datos e Internet, que pasamos a analizar:
1.- COLABORACIN COCHRANE
2.- PUBLICACIONES SECUNDARIAS
3.- BASES DE DATOS (BD)
4.- INTERNET
5.- REVISTAS MEDICAS
II.2.1.- COLABORACIN COCHRANE (CC)
La CC es una organizacin internacional, independiente y sin nimo de lucro, que busca ayudar a quienes necesitan
tomar decisiones sanitarias bien informadas mediante la preparacin, actualizacin y divulgacin de revisiones
sistemticas sobre los efectos de la atencin sanitaria.
Archie Cochrane fue un epidemilogo britnico que en 1972 public en su libro Effectiveness and Efficiency: Random
Reflections on Health Services el siguiente cuerpo de pensamiento: dado que los recursos sanitarios son limitados,
solo deberan aconsejarse aquellos tratamientos cuya eficacia hubiera sido demostrada de forma clara; y considera
que la evidencia proveniente de los ensayos clnicos controlados (y globalmente las revisiones sistemticas) son la
base para la toma de decisiones en la asistencia sanitaria. Para ello propuso la creacin de una red internacional de
revisores que colaborasen en la elaboracin de revisiones sistemticas de ensayos clnicos; desde 1992 este proyecto
lleva su nombre.
El objetivo de la CC es analizar, mantener y divulgar revisiones sistemticas de los efectos de la asistencia sanitaria
por medio de ensayos clnicos controlados (y si no estuvieren disponibles ensayos clnicos, revisiones de la evidencia
ms fiable derivada de otras fuentes), para contribuir al impulso de una medicina basada en la evidencia (o pruebas).
La CC fue una idea surgida para resolver el manejo y extraccin relevante de toda la bibliografa biomdica. Los
esfuerzos de la CC se centran en la diseccin de la evidencia cientfica disponible, de todos los temas relacionados con
la biomedicina y la salud, para hacerla revertir despus, en formas de revisiones sistemticas, en una mejora de las
decisiones clnicas y sanitarias. Por tanto, supone un esfuerzo mantenido para acceder primero a los datos a travs de
las principales fuentes de informacin y, despus, transformarlos en conocimiento objetivo, sinttico, accesible y
basado en la evidencia cientfica. Sin duda, la CC constituye una de las bases fundamentales de la MBE. Contribuye a
democratizar el conocimiento cientfico, amplindolo de manera interactiva y compartindolo con todos aquellos que
pueden necesitarlo, devolviendo a la sociedad lo que invirti y sigue invirtiendo en formacin y desarrollo, en
investigacin y en servicios sanitarios en general.
La CC la forman personas de todo el mundo dispuestas a trabajar en la organizacin y difusin de la evidencia
cientfica resultante de aplicar los mtodos consensuados para la revisin de la literatura. Cada revisor es miembro de
un Grupo Colaborador de Revisin (Collaborative Review Group), el cual est constituido por individuos que
comparten un inters especfico sobre un tema determinado. La CC ofrece abundante informacin en el campo de la
Pediatra; existen algunos grupos colaboradores de especial inters, destacando el grupo de Perinatologa:

- Cochrane Pregnancy and Childbirth Group: se pueden obtener resmenes (http://www.cochrane

2.- PUBLICACIONES SECUNDARIAS


Las publicaciones secundarias (revistas con resmenes estructurados) son un nuevo tipo de revistas que seleccionan
resmenes estructurados de artculos cientficamente importantes (las mejores evidencias) y se incorporan
comentarios clnicos (la maestra clnica). Estas publicaciones someten la literatura cientfica a un doble filtro: 1) en
primer lugar un equipo de bibliotecarios y epidemilogos rastrean a mano distintas revistas biomdicas de calidad
cientfica, utilizando un tema preestablecido y criterios metodolgicos, y seleccionan aquellos artculos vlidos desde el
punto de vista cientfico, que cumplan unos criterios mnimos(*); 2) a continuacin estos artculos pasan a un grupo de
mdicos clnicos, especialistas en cada tema en concreto, que filtran los que, a su juicio, son clnicamente importantes.
(*) Criterios mnimos que deben cumplir los artculos incluidos:
-Estudios que valoran intervenciones teraputicas, preventivas o rehabilitadoras: aleatorizacin de los sujetos en los
grupos de comparacin, seguimiento de al menos un 80% de los sujetos hasta el final del estudio, determinacin de
una variable de respuesta que tenga una relevancia clnica.
-Estudios de diagnstico: los pacientes en los que se solicita la prueba diagnstica de estudio deben presentar un
amplio espectro de la enfermedad, interpretacin de la prueba de referencia sin el conocimiento del resultado de la
prueba diagnstica objeto del estudio e interpretacin de la prueba diagnstica en estudio sin el conocimiento del
resultado de la prueba de referencia.
-Estudios de pronstico: seguimiento de al menos un 80% de los sujetos hasta el final del estudio o hasta que
presentan la respuesta de inters.
-Estudios de etiologa: debe existir un grupo de comparacin claramente identificado para los pacientes con riesgo de
padecer o que padecen la enfermedad de inters; el evaluador de la respuesta debe desconocer el estado de
exposicin en los estudios de cohortes, y el evaluador de la exposicin debe desconocer si los participantes son casos
o controles en los estudios con este tipo de diseo.
-Revisin sistemtica: ha de definir claramente el problema de inters y especificar el mtodo de seleccin y bsqueda
de los artculos que la componen.
Estos rigurosos filtros de las publicaciones secundarias rechazan el 98% de la literatura y es el restante 2% el que
aparece en forma de resmenes estructurados (dada su validez cientfica y su importancia clnica) y se acompaan de
comentarios de expertos clnicos. Se puede acceder a estas revistas (generalmente mediante suscripcin) a travs de
Internet, en CD-ROM y en formato papel.

Las revistas con resmenes estructurados ms importantes son:


a) En ingls:
* ACP Journal Club, que empez a ser publicada en 1991 a travs de la revista An Intern Med por el American College
of Physicians; est enfocada para mdicos internistas.
* Evidence-Based Medicine, que empez a ser publicada en 1995 en un esfuerzo conjunto del American College of
Physicians y el British Medical Journal Publications Group; est enfocada para mdicos internistas, pediatras,
gineclogos, cirujanos y psiquiatras.
Estas dos revistas con resmenes estructurados son una excelente fuente de informacin, y actualmente forman una
sola base de datos denominada Best Evidence, pero tienen el inconveniente de que los temas de pediatra constituyen
actualmente un porcentaje mnimo de su contenido.
* The PedsCCM Evidence-Based Journal Club es una publicacin secundaria peditrica dedicada exclusivamente a la
valoracin crtica de artculos relacionados con los cuidados intensivos, , e incluye tambin algunos artculos sobre
cuidados intensivos neonatales.
* La revista J Pediatr publica, en su seccin "Current literature and clinical issues"
(http://www.harcourthealth.com/scripts/om.dll/serve?action=searchDB&searchDBfor=home&id=pd) , una valoracin
crtica de aquellos artculos publicados en revistas biomdicas con grandes posibilidades de contener informacin
vlida e importante en Pediatra, acompaado de un comentario clnico.

b) En espaol:
* Revista Atencin Primaria Basada en la Evidencia es una publicacin secundaria de Espaa, suplemento trimestral
de la revista Formacin Mdica Continuada (de la Sociedad de Medicina Familiar y Comunitaria).
* Evidencia en Atencin Primaria es una publicacin secundaria de la Sociedad de Medicina Familiar de Argentina.
Ambas revistas contienen algunos artculos de pediatra.
* Revista Pediatra de Atencin Primaria no es propiamente una publicacin secundaria, pero contiene temas valorados
crticamente en pediatra, as como traducciones y comentarios de revisiones Cochrane.
La estructura de estas revistas es la siguiente: un resumen estructurado del artculo valorado, precedido de su
referencia; despus del resumen aparecer un comentario crtico donde se analizarn posibles limitaciones
metodolgicas as como la importancia clnica de los resultados para el mdico y su posible aplicacin en la prctica
clnica.
II.2.3.- BASES DE DATOS (BD)
Una de las principales fuentes de informacin en medicina son las BD de informacin bibliogrfica, que constituye un
instrumento rpido y preciso para recuperar artculos cientficos relevantes.
En una BD se almacena informacin referente a miles de documentos. Esta informacin est contenida en registros
(records) que se definirn como el conjunto de datos relativos al documento. Dentro del registro la informacin se
agrupa en varios campos (fields); uno de estos campos es especialmente til: el resumen del contenido del documento
en s, si bien no est presente en todos los registros.
La seleccin de revistas y de artculos realizada para las BD, automatizadas o impresas, es una labor subjetiva cuya
secuencia es la siguiente: 1)los responsables de las BD (Index Medicus, Excerpta Medica, etc) seleccionan las
revistas que a su juicio deben ser examinadas y "vaciadas" o recensadas; 2)a su vez, los expertos determinan la
calidad de los trabajos publicados por las revistas seleccionadas, calidad que no se refiere exclusivamente al nivel
cientfico de aqullos, sino tambin a su idoneidad con la orientacin temtica de la propia BD; y 3)las reseas
bibliogrficas de los trabajos "aprobados" por los expertos pasan a engrosar los archivos de las BD automatizadas o las
pginas de las BD impresas.
Aunque la situacin va experimentando una lenta pero progresiva mejora, lo cierto es que el peso especfico de las
publicaciones espaolas en la ciencia biomdica mundial todava es bastante escaso. A ello contribuye el hecho de que
slo un nmero limitado de revistas espaolas estn includas en los ndices bibliogrficos internacionales. La inclusin
de revistas espaolas en bases informticas de bsqueda bibliogrfica es errtica (pocas revistas aparecen en todas o
casi todas las bases), irregular (en ciertos casos slo se incluyen artculos seleccionados) y escasa.
Las principales bases de datos son las siguientes:
a) Medline (soporte magntico) / Index Mdicus (soporte en papel) / PubMed (consultas on-line): Es la BD de la
Biblioteca Nacional de Medicina de los EE.UU, que adquiere diferentes denominaciones segn la forma de difusin.
Indiza los artculos de aproximadamente 4000 revistas desde 1966 hasta la actualidad, con actualizacin mensual, y se
dispone de resmenes en CD-ROM (Medline) de muchos de los artculos publicados despus de 1975. Es la BD con
mayor difusin y ms utilizada por los mdicos, especialmente a partir de finales de 1997, cuando su acceso se ha
hecho gratuito desde Internet: PubMed e Internet GratefulMed.
Actualizacin semanal (consultas on-line) o mensual (CD-ROM y papel). Utiliza el tesaurus MESH (medical subject
headings).
Las citas de revistas en ingls constituyen el 80% del total; incluye 33 ttulos de publicaciones espaolas de las cuales
dos son peditricas (An Esp Pediatr y Cir Pediatr).
El proyecto PubMed da acceso a la base de datos de informacin bibliogrfica formada por MEDLINE (MEDlars
onLINE) y preMEDLINE (introducido en 1996 por la National Library Medicine, aporta diariamente referencias y
resmenes de los artculos antes que stos se publiquen en formato papel y antes que los registros se incluyan en
MEDLINE).
PubMed permite tres tipos de bsqueda:
1) Bsqueda bsica: tras introducir las palabras de bsqueda se especifica el tiempo de bsqueda a 30,60,90 o 180
das, 1,2,5 aos atrs o sin lmite (es decir, desde 1966 aproximadamente). La bsqueda se realiza en los 18 campos
de bsqueda de que dispone cada registro de PubMed. Tras pulsar el botn bsqueda (search) o la tecla enter aparece
el resultado de la bsqueda en la pgina resumen de documentos, con el nmero de referencias halladas, y por orden

cronolgico con los artculos ms recientes al principio. Pulsando sobre el autor de alguna referencia se accede a la
pgina de informacin del documento, similar a la disponible en Medline. Cada referencia dispone la posibilidad de
conexin con artculos relacionados con el primero, de forma que se obtiene un segundo listado con aquellos artculos
que tienen conexin con el que elegimos inicialmente.
2) Bsqueda avanzada: se accede desde la pgina principal de PubMed marcando advanced search, de forma que se
puede controlar lo que se busca en base a dos aspectos:
a)Campos de bsqueda (search field): de forma que el trmino introducido no se enfrente a los 18 campos de
bsqueda, sino al que nos interese: nombre del autor (AU,AUTH), afiliacin (AD, AFFL), ttulo de la revista (TA,JOUR),
idioma (LA), trmino clave (MeSH), fecha de publicacin (DP,PDAT), tipo de publicacin (PT,PTYP), palabras del texto
(TW,WORD), palabras del ttulo (TI,TITL), etc.
b)Modo de bsqueda: bien por listado de trminos o de modo automtico, y se combina con los operadores booleanos.
Permite depurar la bsqueda en tres niveles: bsqueda actual, aadir trmino(s) a la bsqueda y modificar la bsqueda
actual.
3) Bsqueda clnica: Se basa en unos filtros metodolgicos propuestos por Haynes, en base a 4 categoras con una
metodologa determinada: tratamiento o prevencin, diagnstico, etiologa y pronstico. Adems la bsqueda se puede
hacer ms sensible (incluye artculos menos relevantes) o ms especfica (incluye artculos ms relevantes, aunque
pudiendo omitir alguno).
Quien quiera profundizar en la gua de uso de PubMed puede recurrir a la siguiente direccin de la pgina sobre
Herramientas tiles en Atencin Primeria de salud en http://www.fisterra.com
(http://www.fisterra.com/recursos_web/no_explor/pubmed.htm), en el que se encontrarn los pasos a seguir para iniciar
una bsqueda en PubMed, cmo aplicar los lmites de bsqueda, cmo usar el index, el portapapeles, el histrico y los
distintos servicios de PubMed (MeSH Browser, Journal Browser, Single Citation Matcher, Clinical Queries).
Ventajas de PubMed sobre otras BD:
- ms democrtico: el acceso a la bsqueda de informacin es personal y universal en las mismas condiciones para
todo profesional, pues permite el acceso libre desde Internet;
- ms actualizado: se tiene conocimiento de los artculos ms recientes incluso antes de ser publicados en soporte de
papel (preMedline); con Index Mdicus las referencias se encontraban entre 3 y 12 meses despus de publicarse los
artculos;
- ms amplio: se dispone de ms de 10 millones de referencias desde antes de 1966; no es preciso disponer de los
CD-ROM;
- ms interconectado: la funcin de artculos relacionados permite hallar un listado de artculos conectados con el que
hemos seleccionado previamente, lo cual no exista con otras formas de bsqueda anteriores; el navegador de revistas
permite que, si la revista est on line en Internet, se pueda leer, imprimir o grabar el artculo completo;
- mayor potencia de bsqueda: se pueden disear perfiles de bsqueda personalizada y especfica; la bsqueda clnica
ofrece los artculos ms importantes que cumplan la metodologa cientfica clnica, ganando en relevancia y rapidez de
bsqueda.
b) Embase (soporte magntico: http://www.embase.com/) / Excerpta mdica (soporte en papel): Realizada por
iniciativa de una empresa privada con sede en Holanda (Elsevier Science Publishers). Indiza aproximadamente 3600
revistas, con una mayor cobertura de publicaciones europeas que Medline e incluyendo ms publicaciones espaolas
(91), de las cuales seis son peditricas (Acta Pediatr Esp, An Esp Pediatr, Pediatr Cat, Pediatr Integral, Pediatrika y Rev
Esp Pediatr). Ahora bien, debe tenerse en cuenta que indiza las revistas seleccionando principalmente los artculos que
hacen referencia a frmacos. Por ello esta BD es especialmente til para informacin sobre frmacos y toxicologa,
cuya serie de resmenes en CD-ROM (Embase) es ms amplia que la de Medline, aunque este aspecto es
responsable de una mayor demora en su indizacin.
Actualizacin quincenal (consultas on-line y en papel) o trimestral (CD-ROM). Utiliza el tesaurus EMTREE (Embase
tree).
Medline y Embase son las dos BD ms conocidas, y contienen entre ambas casi la mayora de las publicaciones de
medicina y reas afines. Aunque se habla mucho de sus diferencias y puntos en comn, en realidad parecen
complementarse; de hecho, del total de revistas biomdicas indizadas entres ambas BD slo alrededor del 35 % estn
presentes en ambas.
c) Current Contents: Lo edita el Institute for Scientific Information (ISI) de los EE.UU, y es una BD pluridisciplinar
(ciencia, tecnologa, artes y humanidades, ciencias sociales). Se publican siete ediciones, dos de las cuales
corresponden a medicina: Clinical Medicine (incluye 1000 revistas, cinco de ellas espaolas) y Life Sciences (incluye

1370 revistas, una de ellas espaola), pero en ellos no se incluye ninguna publicacin peditrica de nuestro pas. Es
una BD muy actualizada (periodicidad semanal).
d) Science Citation Index (SCI): Lo edita el ISI de los EE.UU (al igual que Current Contents). Fue creado en por
Eugene Garfield en 1964, que es un ndice que recoge las referencias bibliogrficas que figuran en todos los artculos
publicados en ms de 3.300 revistas multidisciplinarias sobre ciencia y tecnologa, mayoritariamente de lengua inglesa.
A travs del citado ndice introdujo un sistema de valoracin de las revistas cientficas en funcin de la inmediatez,
visibilidad y vida media de los artculos en ellas publicados. A cada revista se adjudic un factor de impacto, que se
calcula dividiendo el nmero total de referencias bibliogrficas de dicha revista incluidas en el SCI correspondientes a
los dos aos anteriores al clculo por el nmero total de artculos publicados en dicha revista (originales, notas clnicas
y revisiones) en el mismo perodo de tiempo. En el ltimo decenio se ha valorado cada vez ms el factor de impacto,
elaborado por el ISI y publicado anualmente, en lo que a revistas se refiere, en la seccin Journal Citation Reports
(JCR) del SCI. Pese a sus indudables limitaciones, supone la primera medida objetiva, cuantificable y estable de la
valoracin de lo que una revista supone en el mbito cientfico y, por ello, ha ido ganando aceptacin por parte de la
comunidad cientfica, siendo el indicador bibliomtrico ms utilizado en la evaluacin cientfica. El factor de impacto se
calcula a travs del SCI, de ah la importancia de pertenecer a esta BD. En la actualidad slo diez revistas cientficas
espaolas se encuentran incluidas en el SCI (Histol Hitopathol, Int J Dev Biol, J Invest Allerg Clin Immunol, Med Clin,
Method Find Exp Clin Pharmacol, Nefrol, Rev Clin Esp, Rev Esp Enf Dig, Rev Esp Fisiol, Rev Neurol), entre las cuales
no se incluye ninguna revista peditrica nacional.
Actualizacin quincenal (consultas on-line) o mensual (CD-ROM).
e) Inside Science Plus: Editada por la British Library, indiza 13.000 ttulos de revistas pluridisciplinares (ciencia,
tecnologa, negocios). En esta BD se incluyen las revistas en base a la demanda solicitada en el servicio de
documentacin de la British Library. Indiza 64 publicaciones espaolas, de las cuales cinco son peditricas (Acta
Pediatr Esp, An Esp Pediatr, Pediatrika, Rev Esp Pediatr y Rev Psiquiatr Inf-Juv). Actualizacin mensual.
f) ndice Mdico Espaol (IME) (http://www.cindoc.csic.es/principal.html): Editado por el Centro de Informacin y
Documentacin Cientfica del CSIC. Es el repertorio de revistas biomdicas espaolas con un perodo de cobertura
desde 1971, cuyo productor es el Instituto de Estudios Documentales e Histricos sobre la Ciencia, de la Universidad
de Valencia. Indiza 115 revistas de las aproximadamente 320 existentes, de los cuales nueve pertenecen a revistas
peditricas (Acta Pediatr Esp, An Esp Pediatr, Arch Pediatr, Cir Pediatr, Pediatr Cat, Pediatr Integral, Pediatrika, Rev
Esp Pediatr, Rev Psiquiatr Inf-Juv). Actualizacin mensual. Presenta algunos inconvenientes: aparece con cierto retraso
y no es de acceso gratuito.
7) BD especializadas en temas especficos, como toxicologa (TOXLINE), biotica (BIOETHICSLINE), sida
(AIDSLINE), oncologa (CANCERLIT), etc., muchos de ellos accesibles desde Internet GratefulMed.
Metodologa de bsqueda en un base de datos:
Es necesario disear una estrategia de bsqueda eficaz para obtener los mejores resultados, cuyo dominio permite
conformar filtros metodolgicos, con el fin de conseguir bsquedas bibliogrficas altamente especficas, que den lugar
a unas pocas citas muy pertinentes y de alta calidad.
Frente a las copias en papel, las ventajas ms importantes que ofrece el CD-ROM y el acceso en lnea (Internet) es la
mayor comodidad, rapidez y precisin de bsqueda. En la metodologa de bsqueda en las BD informatizadas
conviene conocer tres apartados:
-Palabras de bsqueda: Una BD se consulta principalmente usando el campo de palabras clave (keywords) o
descriptores. Para ello puede utilizarse el texto libre (free-text searching) o seleccionar trminos del ndice electrnico
(thesaurus o tesauro).
El texto libre es el lenguaje natural, no indexado. La bsqueda se realiza en cualquier parte del documento, con lo que
son ms exhaustivas: se obtienen ms referencias pero menos adecuadas (bsquedas con mayor sensibilidad). En
este tipo de bsqueda es importante aadir los sinnimos, as como los posibles derivados del trmino que se
consiguen mediante el truncamiento de la palabra, aadiendo un asterisco (*) o un interrogante (?); por ejemplo
pediatr* incluira peditrico, pediatra, etc. Es preciso tener en cuenta el idioma de la BD.
El tesauro es el vocabulario generado por el productor de la BD, en la que se establecen relaciones jerrquicas de un
trmino con otros, indicando sinnimos y palabras relacionadas. La bsqueda slo se hace en las palabras clave del
artculo, por lo que se obtienen menos referencias pero ms precisas (bsquedas con mayor especificidad). En
medicina, la gran mayora de las BD tienen su propio "tesauro", cosa que, aunque prctica, provoca el desarrollo de
diferentes estrategias de bsqueda en caso de que un mismo tema precise de la utilizacin de varias BD. MEDLINE,
CANCERLIT, AIDSLINE Y HEALTHSTAR, por ser del mismo productor, utilizarn el mismo tesauro: MESH.
- Operadores booleanos: es la forma de interrogar a la BD, que permite combinar palabras o frases. El trmino procede
del lgebra de Boole, que permite interseccin (AND/Y), sumacin (OR/O) y exclusin (NOT/NO) de palabras.

- Limitadores de bsqueda: casi todas las BD nos permite limitar el idioma, el tipo de artculo (revisin, ensayo clnico,
metanlisis, etc), la temtica (etiologa, diagnstico, tratamiento, etc), el ao de publicacin,...

- Gua prctica para las mejores estrategias de bsqueda en MEDLINE para buscar los artculos ms relevantes en:
- TRATAMIENTO: clinical trial (publication type)
estrategia de bsqueda ms sensible: randomized controlled trial (publication type), OR drug therapy (MeSH), OR
therapeutic use (MeSH), OR all random (textword)
estrategia de bsqueda ms especfica: all double blind (textword), OR all placebo (textword)
- DIAGNSTICO: sensitivity (textword)
estrategia de bsqueda ms sensible: explode sensitivity AND specificity (MeSH), OR all sensitivity (textword), OR
diagnosis (pre-exploded subheading), OR diagnostic use (subheading), OR specificity (textword)
estrategia de bsqueda ms especfica: explode sensitivity AND specificity (MeSH), OR predictive value (textword).
- ETIOLOGA: risk (textword)
estrategia de bsqueda ms sensible: explode cohort studies (MeSH), OR risk (MeSH), OR odds ratio (textword), OR
relative risk (textword), OR case control (textword)
estrategia de bsqueda ms especfica: case-control studies (MeSH), OR cohort (textword)
- PRONSTICO: cohort series (MeSH)
estrategia de bsqueda ms sensible: incidence (MeSH), OR mortality (MeSH), OR follow-up studies (MeSH), OR
mortality (subheading), OR prognos: (textword), OR predict: (textword), OR course (textword)
estrategia ms especfica: prognosis (MeSH), OR survival analysis (MeSH)

II.2.5.- REVISTAS MDICAS donde encontrar la mejor evidencia peditrica para la prctica clnica:
Se ha comprobado que una gran proporcin (entre el 40 y el 60 %) de la mejor evidencia cientfica en Pediatra puede
encontrarse en un reducido nmero de revistas biomdicas, tal como se concluye en el estudio de Birken y Parkin
(Pediatrics 1999; 103:941-947). Estos autores hipotetizaron que las revisiones sistemticas constituyen una buen punto
de partida para realizar el estudio de las revistas que pueden proporcionar la mejor evidencia cientfica. Analizaron las
revisiones sistemticas peditricas de tres importantes fuentes de informacin (Cochrane, Informes sanitarios de la
American Academics of Pediatrics e Informes sanitarios de la Canadian Paediatric Society), y en cada uno de los
artculos que cumplan los criterios de inclusin analizaron qu revistas mdicas se citaban en la bibliografa, que por
orden decreciente en nmero de citaciones son:
1) Pediatrics: acceso gratuito al texto completo en su edicin electrnica y a los resmenes en la edicin en papel.
2) Journal of Pediatrics: acceso gratuito slo a resmenes y al contenido ntegro de las editoriales.
3) New England Journal of Medicine: acceso gratuito slo a resmenes.
4) Lancet: acceso gratuito slo a resmenes y al texto completo de algn artculo aislado.
5) Journal of the American Medical Association (JAMA): acceso gratuito a los resmenes.
6) British Medical Journal (BMJ): acceso gratuito al texto completo, y que marc toda una revolucin en este materia.
7) Archives of Diseases in Childhood: acceso gratuito a los resmenes y al contenido completo de los artculos una vez
transcurrido un ao de su publicacin.

8) Pediatric Infectious Diseases Journal: acceso gratuito a los resmenes.


9) Journal of Infectious Diseases
Del conjunto de las 10 revistas ms tiles para obtener la mejor evidencia cientfica en la prctica peditrica, 5
corresponden a revistas peditricas (Pediatrics, J Pediatr, Arch Dis Child, Pediatr Infect Dis J, AJDC) y 5 a revistas de
medicina general (N Engl J Med, Lancet, JAMA, BMJ, J Infect Dis).
Cabe considerar como limitacin del anterior estudio el hecho de que se excluan las citas que no fueran en ingls. En
cualquier caso cabe considerar la conveniencia de aadir a la lista anterior, ciertas revistas representativas de aquellos
pases no anglosajones (as, en Espaa se recomienda incluir An Esp Pediatr) y de alguna subespecialidad peditrica.
Cabe destacar las revistas ms especficas sobre Neonatologa y Medicina Perinatal:
-American Journal of Perinatology
-Biology of the Neonate
-Clinics in Perinatology
-Journal of Perinatal Medicine
-Journal of Perinatology
-Pediatrics & Perinatal Epidemiology

II.3.- TERCER PASO: VALORACION CRITICA de las evidencias cientficas encontradas:


La valoracin crtica, entendida como la capacidad para verificar la validez y aplicabilidad de las evidencias publicadas
con el fin de poder incorporarlas al cuidado de los pacientes, es un proceso fundamental para el cual el neonatlogo
debe adquirir las destrezas y habilidades necesarias.
La valoracin crtica de la evidencia disponible consta de dos etapas: juzgar si son vlidas (prximas a la verdad y con
rigor cientfico) y decidir sin son importantes (y, en consecuencia, valiosas en potencia para el lector en su condicin de
clnico). En MBE es prioritaria la significacin clnica de los resultados ms que la significacin estadstica. Este paso
nos remite al conocimiento de los temas metodolgicos de la evidencia cientfica, lo que implica al menos un pequeo
esfuerzo, necesario para poder entender y juzgar lo que se publica. Cuanta metodologa debe saber un clnico para
responder a esas preguntas? En la Tabla se resumen los diez conceptos metodolgicos y epidemiolgicos
fundamentales necesarios para realizar la valoracin crtica en MBE y una adecuda compresin de los resultados.
- RIESGOS:
Medidas de fuerza de asociacin: Odds ratio (OR)
Riesgo relativo (RR)
Medidas de impacto: Reduccin de riesgo relativo (RRR) y absoluto (RRA)
Nmero necesario de pacientes a tratar (NNT)
- PRUEBAS DIAGNOSTICAS:
Sensibilidad y especificidad
Cociente de probabilidad (likehood ratio)
Odds preprueba y odds postprueba
Probabilidad preprueba y probabilidad postprueba
- CONCORDANCIA:
Indice Kappa
- PRECISION DE LOS ESTIMADORES:
Intervalo de confianza

Sin duda este apartado entronca con la VALORACIN CRTICA DE DOCUMENTOS, en donde ha tenido una labor
fundamental el programa CASP (Critical Appraisal Skills Programme), que es un programa del Servicio de Salud Ingls
que intenta ayudar a adquirir habilidades para hacer lectura crtica y obtener as la evidencia cientfica necesaria para
las decisiones clnicas; trabaja con programas locales de promocin de cuidados de salud basados en la evidencia y
colabora con el Centro de la Medicina Basada en la Evidencia de la Universidad de Oxford. En Espaa existe un grupo
CASP que se denomina CASPe (Programa de habilidades en lectura crtica: http://www.hrc.es/CASPe.html), que forma
parte de una organizacin internacional llamada CASP internacional (CASPi) ( http://www.phru.org/caspinternational), ,
en donde podemos encontrar la CASP inglesa, noruega, canadiense, francesa, rumana, argentina,....El objetivo de este
programa es ayudar a los decisores sanitarios, en particular, y a los mdicos, en general, a desarrollar habilidades para
la lectura crtica sobre la mejor evidencia de la literatura. Las habilidades en lectura crtica permiten evaluar
sistemticamente los resultados de los trabajos publicados, su validez, su importancia y su aplicabilidad.
El logotipo de la CASP son tres flechas consecutivas con las palabras BUSCAR--> VALORAR--> ACTUAR, que
representan los tres pasos necesarios a seguir para usar la evidencia en el trabajo:
- Lo primero es BUSCAR la evidencia.
- Lo segundo es VALORAR la evidencia que se ha identificado; esto implica valorar sistemticamente la evidencia para
comprobar: 1) cun vlidos son los resultados; 2) cules son los resultados; 3) cun relevantes son los resultados para
mi trabajo. Es el ncleo fundamental del CASP.
- Lo tercero, si la evidencia es vlida y relevante, ACTUAR en funcin de la misma.
En realidad estos son los mismos pasos propuestos por la MBE (ver apartado II) y que estamos analizando.
La aproximacin pedaggica del programa CASP se desarrolla en los talleres de lectura crtica, cuyas fundamentos
se basan en los siguientes puntos:
- aprender debe ser divertido y participativo; las habilidades deben difundirse en cascada;
- el trabajo se llevar a cabo sobre problemas (escenarios) concretos relacionados con la prctica diaria;
- los materiales docentes debern ser de la mxima calidad conceptual y formal;
- los talleres deben ser prefentemente multidisciplinarios; se usarn las tcnicas de trabajo en pequeos grupos;
- los talleres deben ser sometidos a evaluacin y mejora continua.
El programa CAPSe consta de varias sedes (actualmente en Madrid, Catalua, Pas Vasco, Comuniad Valenciana,
Galicia y Castilla La Mancha), y un coordinador nacional en Alicante.
- Coordinador nacional:
Juan B. Cabello Lpez. E-mail:cabello_jua@gva.es
Servicio de Cardiologa
Hospital General de Alicante. Alicante.
- Coordinadores locales:
Madrid:
Victor Abraira Santos. E-mail: victor.abraira@hcr.es
Unidad de Bioestadstica
Hospital Ramn y Cajal. Madrid
Catalua:
Joan Marti E-mail: jmarti@siberia.chpt.es
Colaboracin Cochrane Espaola
Hospital de la Santa Cruz y San Pablo. Barcelona
Pas Vasco:
Jos I.Emparanza Knrr. E-mail: jemparan@chdo.osakidetza.net
Unidad de Epidemiologa
Hospital Virgen de Arnzazu. San Sebastin
Comunidad Valenciana:
Jaime Latour Prez E-mail: jlatour@wanadoo.es

Unidad de Cuidados Intensivos


Hospital General de Elche. Alicante
Galicia:
Javier Muiz Garca E-mail: javmu@udc.es
Instituto de Ciencias da Saudade
Hospital de Oza-Pabelln 6. La Corua.
Castilla La Mancha:
Fernando Carballo E-mail: fcarballo@doymanet.es
Hospital de Guadalajara

A continuacin se expone, en base a las guas del Evidence Based Medicine Working Group, cmo realizar la
valoracin crtica de los tipos de documentos cientficos ms comunes: artculos sobre tratamiento, sobre pruebas
diagnsticas, sobre efectos perjudiciales de una exposicin y sobre pronstico.
Se puede encontrar las guas para leer crticamente artculos, publicadas en JAMA, en versin texto completo (PDF) en
la web de la Universidad de California (http://medicine.ucsf.edu/resources/guidelines/users.html#19b).
Se recomienda revisar el glosario de trminos epidemiolgicos de MBE en las siguientes webs:
- Centre of Evidence Based Medicine: http://cebm.jr2.ox.ac.uk/docs/glossary.html
- CASPe: http://www.hrc.es/caspe/mbe_glosario.html
- Hospital Monte Sinai: http://www.library.utoronto.ca/medicine/ebm/glossary/

3.1.- REVISIN CRTICA DE PUBLICACIONES SOBRE TRATAMIENTO


1.a) ANALIZAR LA VALIDEZ:corresponden los resultados del estudio a una estimacin no sesgada del efecto del
tratamiento, o se han visto influidos de forma sistemtica para conducir a una conclusin falsa?. Cabe contestar a una
serie de preguntas:
- Criterios principales:
* Se ha realizado de forma aleatoria la asignacin de los tratamientos a los pacientes?: la aleatorizacin se define
como el procedimiento sistemtico y reproducible por el que los sujetos participantes en un ensayo clnico son
distribuidos al azar en los distintos grupos de tratamiento, por lo que evita el sesgo de seleccin y as, la unica causa
que pudiera justificar las diferencias encontradas, si existe, sera el tratamiento recibido; existen distintos mtodos de
distribucin aleatoria: simple, balanceada o restrictiva, estratificacin, minimizacin, ...
* Se han tenido en cuenta adecuadamente todos los pacientes incluidos en el ensayo y se los ha considerado a la
conclusin del mismo?, se ha realizado seguimiento completo?: las prdidas prealeatorizacin, es decir la de los
sujetos elegibles producidas antes de su inclusin en el ensayo clnico (por la negativa de los pacientes a entrar en el
estudio o por ser considerados no elegibles de acuerdo a los criterios de inclusin/exclusin), condicionan
fundamentalmente la capacidad de generalizacin de los resultados (como norma se considera que si un estudio
incluye entre el 80 y el 90% de los sujetos elegibles es representativo de la poblacin estudiada); las prdidas
postaleatorizacin (abandonos -drop out- y retiradas -withdrawal- de paciente durante el estudio) tienen un significado
diferente; en principio las retiradas o abandonos no deben suponer ms del 20% de los sujetos puesto que podran
alterar la certeza de los resultados, y en todo caso deben estar previstos cuando se calcula el nmero de pacientes
necesarios para demostrar la hiptesis de trabajo. Lo correcto es reemplazarles, elaborando una lista de aleatorizacin
que contemple estas posibles prdidas; en cualquier caso es aconsejable realizar el seguimiento de todos los sujetos
hasta finalizar el ensayo clnico.
* Se han analizado los pacientes en los grupos a los que fueron asignados aleatoriamente, segn anlisis por
intencin de tratar?: incluye a todos los sujetos que han sido aleatorizados a los grupos de tratamiento,
independientemente de que hayan recibido o no alguna dosis del tratamiento asignado o se haya producido algn error
en la administracin; es por intencin de tratamiento, no por tratamiento administrado; su importancia reside en que
nos da una idea de lo que suceder en la prctica clnica habitual (efectividad) por comparacin con lo que ocurre en
las condiciones de un ensayo clnico (eficacia), que es lo que determina el anlisis por tratamiento (o por casos vlidos
o por protocolo).

El anlisis por intencin de tratar tiene dos ventajas fundamentales: 1) es la nica estrategia que conserva las ventajas
que se adquieren mediante la asignacin aleatoria de los participantes; y 2) se aproxima a la realidad de la prctica
clnica diaria: en un ensayo clnico controlado las condiciones de administracin de un tratamiento son demasiado
rigurosas y los controles de seguimiento muy estrictos, lo que resulta algo artificial en la prctica diaria, donde muchos
pacientes no cumplen de manera ntegra el tratamiento o lo rechazan.
El anlisis por tratamiento, al excluir a los pacientes perdidos, no preserva las ventajas de la aleatorizacin e implica
una disminucin de la potencia del estudio. Una manera de intentar resolver las prdidas en un EC es la estrategia de
anlisis del peor de los casos: consiste en suponer que todos los pacientes perdidos del grupo donde la mayor parte de
los miembros han registrado un resultado favorable han presentado un resultado desfavorable, y todos los pacientes
del grupo donde la mayor parte de sus miembros han obtenido un resultado desfavorable evolucionan de forma
favorable. Tras hacer esta suposicin se vuelven a calcular los resultados del estudio; si tras realizar dicho supuesto,
los resultados no varan podemos concluir que las prdidas no han sido lo suficientemente numerosas como para
introducir un sesgo que invalide los resultados de la investigacin (si las prdidas son > 20% es difcil que los
resultados superen la estrategia de anlisis del peor de los casos).
- Criterios secundarios:
* Se ha mantenido un diseo ciego respecto al tratamiento aplicado, en cuanto a los pacientes, los clnicos y el
personal del estudio?: el enmascaramiento o carcter ciego es toda una serie de precauciones que se toman con el
fin de que, a lo largo del estudio, bien el paciente, el mdico o ambos, desconozcan la asignacin de los tratamientos;
el objetivo perseguido al enmascarar los tratamientos utilizados es evitar los sesgos de valoracin por parte de todos
los implicados en el ensayo, pero principalmente en el paciente (efecto placebo, efecto nocivo, sesgo de retirada) y el
investigador (sesgo de evaluacin, sesgo de retirada). Los tipos de enmascaramiento son: simple ciego (el sujeto
desconoce el grupo de tratamiento al que pertenece, aunque es a veces el investigador quien desconoce la asignacin
aleatoria de tratamientos), doble ciego (sujeto e investigador desconocen el tratamiento administrado), triple ciego
(tambin el monitor del ensayo clnico), cuadruple ciego (tambin el anlisis estadstico se realiza sin revelar los
cdigos de los tratamientos); pero se debe tener en cuenta que tratar de conseguir un enmascaramiento perfecto
nunca debe suponer un aumento de riesgo para los sujetos.
* Eran similares los grupos al inicio del ensayo?: se aporta esta informacin al presentar las caractersticas
pronsticas iniciales o basales de los grupos de tratamiento y de control; la aleatorizacin no siempre produce grupos
bien equilibrados en cuanto a los factores pronsticos conocidos, y si la magnitud de estas diferencias es grande puede
comprometer la validez del estudio (en este caso, comprobar que los investigadores hayan realizado un anlisis en el
que se haya incluido el ajuste para estas diferencias).
* Se han tratado a los grupos de la misma forma, aparte de la intervencin experimental?: las intervencions distintas
del tratamiento en estudio, cuando se aplican de manera distinta a los grupos de tratamiento y de control, se
denominan cointervenciones; las cointervenciones consituyen un problema ms grave cuando no se utiliza un diseo
a doble ciego o cuando se autoriza el uso de tratamientos muy eficaces, que no son los investigados.
1.b) ANALIZAR LA IMPORTANCIA: considera la magnitud y la precisin del efecto del tratamiento.
* Cul ha sido la magnitud del efecto de tratamiento?: La fuerza de la asociacin es la principal medida que indica la
validez de una evidencia, y existen dos conceptos segn el tipo de estudio: el riesgo relativo (RR), que es la medida
epidemiolgica que se utiliza principalmente en el ensayo clnico y en el estudio de cohortes, y la odds ratio (OR), que
se utiliza principalmente en el estudio de casos-control y en los metanlisis.
Qu es el RR?: cociente entre el riesgo de sufrir un determinado evento en el grupo expuesto a un determinado
tratamiento o factor de riesgo y el riesgo de sufrir el mismo evento en el grupo control (no expuesto al tratamiento o
factor de riesgo).
Qu es el OR?: cociente entre la odds (razn entre la probabilidad de que un evento suceda y la probabilidad de que
no suceda) de exposicin observado en el grupo tratado (o expuesto) y la odds de exposicin en el grupo de controles
(o no expuesto).
Cmo interpretar el RR y OR?: si 1 indica que no existe asociacin; si >1 indica que existe una asociacin positiva y si
<1 indica que existe una asociacin negativa. Pero las estimaciones puntuales son poco informativas, por lo que deben
ir acompaadas de su intervalo de confianza; aunque todo RR u OR cuyo intervalo de confianza no comprenda el 1 se
considera estadsticamente significativo, su importancia clnica depende del tipo de estudio de donde proceda. Debido
a los sesgos en los estudios casos-control es deseable que la OR alcance un valor >=4; puesto de que los estudios de
cohortes son menos propensos a los sesgos el clnico puede quedar convencido con RR >=3; debido a que los
ensayos clnicos aleatorizados estn relativamente exentos de sesgos, cualquier RR cuyo intervalo de confianza
excluya 1 es convincente.
- La reduccin del riesgo relativo (RRR) es la diferencia entre el porcentaje de eventos en el grupo control y el
porcentaje de eventos en el grupo experimental, dividido por el porcentaje de eventos en el grupo control. Tiene una
limitacin: no es capaz de diferenciar entre los grandes efectos absolutos de un tratamiento de los efectos ms
pequeos; para solventar este problema est la reduccin del riesgo absoluto (RRA), que es la diferencia entre el
porcentaje de eventos en el grupo control y el porcentaje de eventos en el grupo experimental. La RRA s que tiene en

cuenta la susceptibilidad basal de los pacientes y da ms informacin detallada que la RRR; sin embargo, a diferencia
de la RRR que pueden ser tomados como nmeros enteros, la RRA son nmeros decimales y por tanto son difciles de
memorizar y no los recordamos fcilmente a la cabecera del paciente.
- Una vez que el clnico est convencido tanto de la validez como de la fortaleza de la asociacin, necesita convertir
estos datos en alguna medida de impacto clara en la prctica clnica, siendo la medida principal el Nmero necesario
de pacientes a tratar (NNT), que se obtiene como el inverso de la RRA. El NNT mide el "esfuerzo" teraputico que
debe realizarse para prevenir un suceso indeseable adicional. En el caso de ser un nmero decimal, usualmente
redondeamos este nmero hacia arriba.
Pero el NNT obtenido es grande o pequeo? como en muchas otras cuestiones en medicina la respuesta est
relacionada con el significado clnico (depende del precio, facilidad de cumplimiento e inocuidad del tratamiento) y no
con el significado estadstico, y debern emplearse intervalos de confianza en torno al NNT. El NNT para prevenir un
evento es una medida muy til del esfuerzo clnico que nosotros y nuestros pacientes deberemos hacer para ayudar a
evitar un resultado adverso. Por ello se deben mostrar (o calcular) los NNT en los resultados de los artculos sobre
tratamiento, siempre que sea posible.
Otra caracterstica til del NNT es la facilidad con la que los lectores los pueden convertir a NNT para su paciente
especfico en su prctica clnica habitual usando una aritmtica muy simple. Todo lo que los lectores necesitan hacer es
estimar la susceptibilidad, a veces llamado riesgo basal, de su propio paciente, en relacin con el paciente control
promedio del ensayo clnico estudiado, y expresar esta estimacin como una fraccin decimal, que llamaremos F: si el
lector juzga que su paciente es dos veces ms susceptible que el paciente control promedio de la publicacin,
entonces F= 2, y si su paciente le parece solamente la mitad de susceptible, entonces F= 0.5, y si su paciente es tan
susceptible como los pacientes de la publicacin, entonces F= 1. Si el tratamiento produce una RRR constante en todo
el espectro de susceptibilidades el NNT de su paciente es calculado dividiendo el NNT entre F. En este sentido
deberemos aprender a distinguir situaciones en las cuales podemos (generalmente tratamientos medicamentosos), y
no podemos (a veces con tratamientos quirrgicos) asumir RRR constantes a lo largo de todos los rangos de
susceptibilidades que encontramos habitualmente, y cmo integrar esta informacin con el resto de los hallazgos
clnicos y nuestro juicio clnico.
- Las expresiones RRR, RRA y NNT valoran la magnitud de una intervencin para producir un efecto beneficioso. De
forma similar, las expresiones que valoran la magnitud de una intervencin para producir un efecto indeseable son el
incremento del riesgo relativo (IRR), incremento del riesgo absoluto (IRA) y nmero necesario de pacientes a daar
(NND).
* Con qu precisin se ha estimado el efecto del tratamiento?: El intervalo de confianza (IC) nos ofrece una medida
de la precisin (o de la incertidumbre) con la que se ha estimado el parmetro poblacional a partir la simple estimacin
puntual obtenida a partir de una muestra de pacientes. El enfoque del IC pone el acento en la cuantificacin, en
contraste directo con los valores de p, que se derivan del enfoque de las pruebas de significacin. Por consiguiente, el
IC es especialmente adecuado para el ejercicio de la MBE. Los dos valores que definen el IC se llaman lmites de
confianza, y se suele utilizar arbitrariamente el valor del 95%; un IC es tanto ms preciso cuanto ms estrecho es. El
valor de p est en desuso: un valor significativo de p slo indica la existencia de una diferencia significativa desde el
punto de vista estadstico, pero en s no nos dice nada sobre la magnitud de una diferencia, ni sobre el sentido de esa
diferencia. Los resultados no significativos (es decir, los que tienen un valor p> 0.05) son especialmente idneos para
una interpretacin errnea; aqu los IC resultan particularmente tiles, ya que indican si los datos son compatibles con
efectos reales clnicamente tiles. Pueden elaborarse IC para la mayora de las estimaciones o comparaciones
estadsticas (OR, RR, RRR, RRA, NNT, sensibilidad, especificidad,...), y si los autores no aportan los IC, a menudo
estos pueden obtenerse a partir de los resultados expuestos en el estudio.
Qu podemos hacer si en el artculo no se indica el IC? Hay tres formas de abordar esta situacin, por orden
creciente de complejidad: examinar el valor de p; si se incluye el valor del error estndar, considerar los lmites del IC al
95% como la estimacin puntual ms-menos el doble de este error estndar; calcular el IC por un mismo, a travs de
frmulas matemticas.
En la pgina de la AEPap se ofrece un ejemplo prctico sobre los conceptos bsicos para interpretar publicaciones
sobre tratamiento (http://www.AEPap.org/pedev-1-interv.htm).

II.3.2.- REVISIN CRTICA DE PUBLICACIONES SOBRE PRUEBAS DIAGNSTICAS


2.a) ANALIZAR LA VALIDEZ: Cabe contestar a una serie de preguntas:
- Criterios principales:
* Existi una comparacin ciega, independiente, con un patrn de referencia adecuado?: para saber si una prueba
diagnstica es til sus resultados deberan compararse con la "verdad" (presencia o ausencia de enfermedad), que en
la prctica se compara con otra prueba que acta como patrn de referencia (gold standard), el cual debe estar
reconocida como tal por la comunidad cientfica, se debe aplicar a toda la serie de casos estudiados y no tiene que

incorporar informacin procedente de la prueba diagnstica que se evala (sesgo de incorporacin: evitar que el
resultado de una de las pruebas pueda influir sobre la interpretacin de los resultados de la otra). Si no se puede
aceptar el estndar de referencia dentro de lo razonable, es poco probable que el artculo proporcione resultados
vlidos para sus objetivos.
* Incluy la muestra de pacientes a un espectro adecuado de pacientes a los cuales en la prctica clnica se aplicar
el examen diagnstico?: el valor real de una prueba diagnstica slo se establece en un estudio que es lo ms
parecido a la prctica clnica, por lo que es conveniente que incluya pacientes enfermos (con distinta gravedad) y
pacientes sanos. El artculo debe definir explcitamente los criterios de seleccin ya que, si bien la sensibilidad y
especificidad son relativamente constantes independientemente de la prevalencia de la enfermedad, lo valores
predictivos, y por tanto la utilidad de la prueba para el lector, estn muy influidos por ella.
- Criterios secundarios:
* Influyeron los resultados del examen objetivo de la evaluacin en la decisin de realizar el estndar de referencia?:
conviene evitar los sesgos de secuencia y de revisin.
Evitar el sesgo de secuencia (verificacin diagnstica o verification bias): todos los sujetos deben haber sido
sometidos tanto a la nueva prueba como a la de referencia; sin embargo, en algunos estudios (sobre todo cuando el
patrn de referencia es una prueba invasiva) solamente se aplica a los sujetos en los que se ha obtenido un resultado
positivo de la prueba que se estudia; en los estudios de cohortes se aceptaba el criterio si a todos los sujetos se les
practicaba la prueba diagnstica y el patrn de referencia; en los estudios de caso-control en los que la prueba
diagnstica preceda a la prueba de referencia, se cumpla el estndar si la verificacin de la enfermedad se realizaba
en una serie consecutiva de pacientes con independencia del resultado de la prueba diagnstica; en aquellos estudios
de caso-control en los que la prueba de referencia preceda a la prueba diagnstica, el crdito se obtena cuando los
resultados de sta eran estratificados de acuerdo con los factores clnicos que potencialmente condicionaban la
indicacin de la prueba de referencia.
Evitar el sesgo de revisin (valoracin ciega o review bias): para estudios de cohortes prospectivos en los que el
paciente reciba primeramente la prueba diagnstica, el estndar era aceptado si la prueba de referencia se evaluaba
independientemente, es decir, sin conocer el resultado de la prueba diagnstica; en estudios prospectivos donde la
prueba de referencia preceda a la prueba diagnstica y en los estudios de caso-control, se cumpla el estndar si
figuraba una afirmacin de la independencia de interpretacin de los datos.
* Se describieron los mtodos para realizar el examen con el suficiente detalle para permitir su reproduccin?:
descripcin adecuada del procedimiento de realizacin de la prueba diagnstica, el estudio de su reproductibilidad y la
definicin del trmino normal y/o anormal, as como la justificacin del criterio de normalidad elegido, y el anlisis e
interpretacin de sus resultados.
2.b) ANALIZAR LA IMPORTANCIA: El proceso diagnstico es en esencia un clculo de probabilidades. La utilidad de
una prueba diagnstica depende de su validez y de su fiabilidad. La finalidad del anlisis es cuantificar la capacidad de
una prueba diagnstica para clasificar correcta o incorrectamente a una persona segn la presencia o ausencia de una
enfermedad.
* Se han presentado los cocientes de probabilidad o los datos para calcularlos?
- Para poder evaluar la validez de una prueba diagnstica se requiere un patrn de referencia; el grado de acuerdo
entre la prueba diagnstica y el patrn de referencia puede ser representado en una tabla de contingencia, de donde
se obtiene la sensibilidad (S), especificidad (E), valor predictivo positivo (VPP), valor predictivo negativo (VPN).
Patrn de referencia

Verdaderos positivos (a)

Falsos positivos (b)

(a+b)

Falsos negativos (c)

Verdaderos negativos (d)

(c+d)

Prueba diagnstica

(a+c)

(a) Verdaderos positivos(VP): enfermos con la prueba positiva


(b) Falsos positivos(FP): no enfermos con la prueba positiva

(b+d)

(c) Falsos negativos(FN): enfermos con la prueba negativa


(d) Verdaderos negativos(VN): no enfermos con la prueba negativa
a+c Casos con patrn de referencia positivo (enfermos)
b+d Casos con patrn de referencia negativo (no enfermos)
a+b Casos con la prueba diagnstica positiva
c+d Casos con la prueba diagnstica negativa
Sensibilidad(S)= a/a+c
Especificidad(E)=d/b+d
Valor predictivo positiva(VPP)= a/a+b
Valor predictivo negativo(VPN)= d/c+d
La S considera la validez de la prueba entre los enfermos y la E la validez de la prueba entre los sanos. S y E son
propiedad intrnseca de las pruebas diagnsticas, que presentan una relacin recproca entre ambas y cuyos
resultados son independientes de la prevalencia de la enfermedad, a diferencia de los valores predictivos: as, cuanto
mayor sea la prevalencia de la enfermedad mayor ser el VPP y menor el VPN; los valores predictivos tienen una
utilidad postprueba. Una forma ms global de conocer la calidad de la prueba es mediante el uso de curvas ROC que
es un grfico en el que se observan todos los pares S/E resultantes de la variacin continua de los puntos de corte; las
curvas ROC permiten explorar la capacidad diagnstica de la prueba en sus distintos valores, de manera que podamos
conocer su validez global y seleccionar el punto o puntos de corte ms adecuados.
- Una forma alternativa de describir el comportamiento de una prueba diagnstica son los cocientes de probabilidad
(CP), definido como la probabilidad de dicho resultado en presencia de enfermedad dividida por la probabilidad de
dicho resultado en ausencia de enfermedad, y puede ser de dos tipos: cociente de probabilidad de un resultado
positivo (CP+)= S/1-E, y cociente de probabilidad de un resultado negativo (CP-)= 1-S/E. Dado que los CP relacionan
la S y la E, no varan con la prevalencia. Los CP adoptan valores entre 0 e infinito, siendo el valor nulo el 1, y cuya
interpretacin se valora en la Tabla.
CP+ >10 CP- <0.1 generan cambios amplios y a menudo concluyentes desde una probabilidad preexamen hasta una
probabilidad postexamen
CP+ 5-10 y CP- 0.1-0.2 generan cambios moderados desde la probabilidad preexamen hasta la postexamen
CP+ 2-5 y CP- 0.5-0.2 generan cambios pequeos (pero en ocasiones importantes) de la probabilidad
CP+ 1-2 y CP- 0.5-1 alteran la probabilidad en un grado insignificante (y rara vez importante)
La principal utilidad de los CP es que permiten calcular la probabilidad postprueba (Ppost= probabilidad de que un
sujeto tenga la enfermedad si obtiene un resultado positivo en la prueba) a partir de cualquier probabilidad preprueba
(Ppre= probabilidad de que un sujeto tenga la enfermedad antes de aplicarle la prueba) o prevalencia, y de esta forma
evaluar cunto puede ganarse si se realiza.
Los pasos a seguir son: 1)transformar la Ppre en odds preprueba= Ppre/1-Ppre; 2)obtener la odds postprueba= CP+ x
odds preprueba; 3)obtener la Ppost= odds postprueba/1 + odds postprueba. La diferencia que exista entre la Ppre y
Ppost informa de la utilidad que tiene una determinada prueba diagnstica; a mayor diferencia entre una y otra
probabilidad mayor contribucin de la prueba al proceso diagnstico. Existe un modo ms simple de realizar estos
clculos (nomograma de Fagan). El nomograma nos permite de forma muy simple progresar desde la Ppre hasta la
Ppost (la primera columna de este normograma representa la Ppre, la segunda representa el cociente de probabilidad
y la tercera muestra la Ppost). Para profundizar en este tema se puede consultar JAMA 1994, 271, 389-391 y 703-707.
El problema de este enfoque radica en la dificultad de estimar adecuadamente la Ppre o prevalencia; debera hacerse
a partir de la propia experiencia acumulada, de forma que sea especfica del entorno de trabajo; sin embargo,
habitualmente se dispone de poca informacin sobre estos aspectos; cuando no se est muy seguro de la fiabilidad de
la estimacin, puede ser conveniente analizar las implicaciones sobre la prctica que puede tener el considerar
diferentes valores plausibles de las Ppre.
* Cun fiables son los resultados?: La fiabilidad de una prueba viene determinada por la estabilidad de sus
mediciones cuando se repite en condiciones similares; tiene especial importancia distinguir las variaciones de

interpretacin intraobservador e interobservador, mediante el ndice kappa (IK). El IK nos ofrece una estimacin del
grado de acuerdo no debido al azar a partir de la proporcin de acuerdo observado (Po) y la proporcin de acuerdo
esperado (Pe)= Po-Pe/ 1-Pe.
El IK puede adoptar valores entre -1 y + 1: es 1 si existe un acuerdo total, 0 si Po es igual a Pe y menor de 0 si el Po es
inferior al Pe por azar. La interpretacin ms aceptada de los rangos de valores del IK son: 0.81-1= excelente, 0.610.80= buena, 0.41-0.60= moderada, 0.21-0.40= ligera, <0.20= mala.
* Cun precisos son los resultados?: mediante el intervalo de confianza (ver apartado II.3.1).
En la pgina de la AEPap se ofrece un ejemplo prctico sobre los conceptos bsicos para interpretar publicaciones
sobre pruebas diagnsticas (http://www.AEPap.org/pedev/pedev-1-diagn.htm).

II.3.3.- REVISIN CRTICA DE PUBLICACIONES SOBRE EFECTOS DE INTERVENCIONES Y/O EXPOSICIONES


Cuando el objetivo es investigar posibles efectos perjudiciales de un tratamiento o los riesgos de determinadas
exposiciones, la pregunta relacin causa-efecto que se evala puede haberse abordado con diferentes tipos de
estudio.
3.a) ANALIZAR LA VALIDEZ: Cabe contestar a una serie de preguntas para identificar los artculos que merecen ser
ledos con ms detalle, dependiendo del nivel calidad de la evidencia que proporcionan.
- Criterios principales:
* Se han utilizado grupos de comparacin similares en cuanto a otros factores determinantes del efecto diferentes a la
exposicin?: si bien el ensayo clnico aleatorizado es el diseo que proporciona la evidencia de mayor calidad sobre
una relacin causa-efecto, rara vez puede utilizarse para evaluar una posible exposicin perjudicial por los problemas
ticos que comportara (sin embargo, si un ensayo clnico observa una asociacin entre una exposicin y un efecto
adverso, el resultado tiene una gran credibilidad). Como alternativa suelen utilizarse los estudios de cohortes, en los
que es de la mxima importancia que se haya evaluado la comparabilidad de las cohortes, para que los sujetos que
estn expuestos al factor presuntamente perjudicial sean similares a los sujetos no expuestos; si se detectan
diferencias en variables relacionadas con el pronstico se deber realizar un anlisis estratificado o multivariante, para
evitar que se produzca un fenmeno de confusin debido a la influencia de dichas variables; pero no debe olvidarse
que pese a este ajuste puede existir un fenmeno de confusin debido a algn factor desconocido o no controlado, por
lo que siempre hay que ser prudente al interpretar los resultados de los estudios de cohortes. Cuando el efecto
perjudicial es muy raro o tarda mucho en producirse, se puede recurrir a los estudios de caso-control, que es ms
sensible a la introduccin de sesgos y a la presencia de factores de confusin, por lo que sus resultados deben ser
interpretados todava con mayor cautela. Tambin se puede informar de efectos perjudiciales a partir de casos aislados
o series de casos, cuya evidencia es muy dbil.
* Se han valorado de la misma forma en todos los grupos de comparacin las exposiciones y los efectos?: en los
estudios caso-control la valoracin de la exposicin previa es clave, por lo que el lector debe buscar si se ha utilizado
alguna estrategia destinada a evitar los sesgos de memoria o los sesgos asociados al entrevistador. En cambio, en los
estudios de cohortes y en los ensayos clnicos debe prestarse atencin a las estrategias seguidas para asegurar que
su aparicin se ha medido de la misma forma y con la misma probabilidad en ambos grupos.
* El seguimiento ha sido suficientemente largo y completo?: en los ensayos clnicos y en los estudios de cohortes el
seguimiento debe ser lo suficientemente prolongado para permitir que se desarrolle y detecte el efecto; y tambin debe
ser un seguimiento exhaustivo, ya que la prdida de pacientes por cualquier motivo puede afectar a la validez del
estudio y conducir a una estimacin sesgada del riesgo.
- Criterios secundarios: Se debe evaluar si se cumplen los criterios de causalidad.
* Precede la exposicin al efecto?: debe asegurarse de que la exposicin realmente precede a la aparicin del efecto
adverso, as como que existe una explicacin biolgicamente plausible de la relacin observada, compatible con los
conocimientos existentes sobre los efectos biolgicos del factor exposicin.
* Existe gradiente dosis-respuesta?: es decir, a mayor intensidad o duracin de la exposicin se produce un
incremento del riesgo del efecto adverso; la evidencia tambin aumenta si existe documentacin segn la cual el efecto
adverso desaparece o disminuye si se retira la exposicin, y reaparece o se incrementa cuando se reinstaura.
Cuando se dispone de diferentes estudios, la causalidad tambin se refuerza si los resultados son coherentes entre
ellos, a pesar de haberse realizado en lugares y con poblaciones diferentes.

* Se ha tratado de forma idntica a los grupos de pacientes, aparte de la intervencin experimental?: las
intervenciones distintas del tratamiento en estudio, cuando se aplican de manera distinta a los grupos de tratamiento y
de control, se denominan cointervenciones; las cointervenciones constituyen un problema ms grave cuando no se
utiliza un diseo a doble ciego o cuando se autoriza el uso de tratamientos muy eficaces, que no son los investigados.
3.b) ANALIZAR LA IMPORTANCIA:
* Cul es la fuerza de la asociacin exposicin-resultado?: la medida de la asociacin ms utilizada es el RR, que
indica el nmero de veces que es ms probable que el resultado adverso se desarrolle en el grupo expuesto en
relacin al grupo no expuesto. Un RR de 1 indica que no existe asociacin entre la exposicin y el resultado adverso; si
es >1 indica que existe asociacin positiva (aumento del riesgo) y si es <1 indica una asociacin negativa (disminucin
del riesgo). En los estudios de cohortes y en los ensayos clnicos el RR se estima directamente, ya que se conocen las
incidencias del resultado adverso en los grupos. En cambio, en los estudios caso-control no se pueden calcular las
incidencias, porque los sujetos se han seleccionado cuando ya se ha desarrollado el resultado; en estos estudios, la
medida de asociacin que se utiliza es OR, que suele interpretarse como equivalente del RR, aunque en realidad slo
es una buena aproximacin del RR bajo determinadas condiciones: cuando el riesgo basal (frecuencia del resultado de
inters en la poblacin de referencia) es baja (< 10%), ambas medidas son muy similares; cuanto mayor es el riesgo
basal, la OR ms exagera la magnitud del efecto en relacin al RR, es decir, ms lo sobrestima cuando es >1 y ms lo
infraestima cuando es <1. En cualquier caso, grandes discrepancias entre OR y RR slo se observan en efectos de
gran tamao y riesgos basales elevados; por ello, en la gran mayora de ocasiones, la interpretacin de OR como RR
no conduce a cambios en la interpretacin cualitativa de los resultados, aunque debe tenerse en cuenta que puede
existir cierta sobrestimacin de la magnitud del efecto.
Dado que la regresin logstica permite obtener OR ajustadas por diferentes factores de confusin, la OR se utiliza
cada vez con ms frecuencia como medida de la magnitud de un efecto o asociacin, no slo en los estudios de casocontrol, sino tambin en los de cohortes y ensayos clnicos, as como en las revisiones sistemticas.
Otra medida que puede utilizarse en los estudios de cohortes y ensayos clnicos es la diferencia de riesgo o de
incidencias (DR), que cuantifica en trminos absolutos el exceso de riesgo de los expuestos en relacin a los no
expuestos. Su valor inverso es una medida similar al NNT, que indica el nmero de personas que es necesario que
estn expuestas para que se produzca un dao o resultado adverso (NND); si la exposicin es un frmaco, el NND
indica el nmero de sujetos que es necesario tratar con l para que aparezca un determinado efecto adverso. Otra
medida, similar a la RRR, es el riesgo atribuible en los expuestos (RAE), que es la fraccin del riesgo observado en los
expuestos que puede atribuirse a la exposicin.
* Qu precisin tiene la estimacin del riesgo?: es el intervalo de confianza (ver apartado II.3.1).

REVISIN CRTICA DE PUBLICACIONES SOBRE PRONSTICO


El concepto de pronstico se refiere a los posibles acontecimientos que pueden desarrollarse durante el curso de una
enfermedad. En ocasiones pueden utilizarse determinadas caractersticas de un paciente (que se denominan factores
pronsticos) para intentar predecir los eventuales desenlaces, tanto un buen resultado (curacin o supervivencia) como
uno malo (complicacin o muerte). Los factores pronsticos no han de ser necesariamente causa de dichos resultados,
pero han de estar asociados con ellos con la suficiente fuerza como para predecir su desarrollo; suelen distinguirse de
los factores de riesgo, que son aquellas caractersticas de los pacientes asociadas con el desarrollo y aparicin de la
enfermedad.
Los estudios que tienen por objetivo identificar factores pronsticos no suelen utilizar un diseo experimental, ya que
habitualmente la asignacin es imposible o no es tica, sino que recurren a diseos observacionales.
4.a) ANALIZAR LA VALIDEZ: Cabe contestar a una serie de preguntas.
- Criterios primarios:
* La muestra de pacientes est bien definida y es representativa de pacientes en un momento similar del curso de la
enfermedad?: se debe especificar los criterios utilizados para establecer que los sujetos incluidos tienen la enfermedad
cuyo pronstico se desea estudiar as como la forma en que ha sido seleccionada la muestra, ya que los resultados
pueden estar distorsionados por sesgos cometidos en este proceso. Adems los sujetos seleccionados deben estar en
un mismo momento del curso de la enfermedad, claramente definido en el artculo (aunque habitualmente suele
tratarse de un momento precoz en la evolucin de la enfermedad, en ocasiones se puede estar interesado en el
pronstico en una fase posterior).
* El seguimiento ha sido suficientemente largo y completo?: el seguimiento debe ser suficientemente prolongado para
dar tiempo a que aparezca el desenlace de inters y suficientemente exhaustivo en todos los pacientes; sin embargo,
es frecuente que existan prdidas por diferentes motivos, especialmente cuando el seguimiento es largo. Adems de
su nmero, que puede afectar a la precisin con que se realiza la estimacin del riesgo, hay que tener en cuenta
tambin su relacin con la proporcin de pacientes que han presentado el desenlace de inters. Por lo tanto, el artculo

debe incluir informacin sobre las caractersticas de los sujetos que se han perdido y los motivos por los que se han
producido. Si los motivos no estn relacionados con el fenmeno en estudio y sus caractersticas son similares a las de
los sujetos que han finalizado el seguimiento, probablemente el resultado ser vlido.
- Criterios secundarios:
* Los parmetros utilizados para medir los resultados han sido objetivos y no sesgados?: los autores deben haber
definido claramente los desenlaces de inters antes del inicio del estudio; estos resultados pueden ser objetivos y
fcilmente medibles o subjetivos y de difcil medicin. Es importante que la medicin de los resultados se lleve a cabo a
ciegas, es decir, de tal manera que no se sepa si el individuo tiene algn factor pronstico, con la finalidad de evitar el
sesgo de informacin debido al observador.
* Se ha ajustado por todos los factores pronsticos importantes?: en ocasiones, se presentan datos sobre el
pronstico de subgrupos de pacientes; en este caso, debemos asegurarnos que la estimacin no est distorsionada y
que se han realizado ajustando por el resto de factores pronsticos relevantes.
Dado que al evaluar mltiples factores pronsticos potenciales el anlisis estadstico puede haber identificado algunos
simplemente por azar, sera conveniente que los investigadores hubieran confirmado los hallazgos en un grupo de
sujetos independientes, denominado grupo de validacin, lo que dara mayor fuerza a la evidencia.
4.b) ANALIZAR LA IMPORTANCIA:
* Se ha especificado la probabilidad de que ocurran los eventos en perodos de tiempo determinados?: la
cuantificacin de los resultados de los estudios sobre pronstico se basa en el nmero de sucesos que se presentan
durante el seguimiento de una cohorte, y suele expresarse como una frecuencia acumulada en un momento de tiempo
determinado, o bien como mediana de supervivencia (que indica la duracin del seguimiento en la que ha muerto la
mitad de los sujetos de la cohorte). Las curvas de supervivencia permiten conocer cmo se modifica la probabilidad de
desarrollar el suceso a lo largo del tiempo.
* Cul es la precisin de las estimaciones de probabilidad?: es el intervalo de confianza (ver apartado II.3.1).

.4.- CUARTO PASO: APLICABILIDAD de los resultados de nuestra valoracin a nuestra prctica clnica:
Tras demostrar que la mejor evidencia externa encontrada en la literatura es vlida e importante, nos encontramos ante
la pregunta decisiva y fin ltimo de la MBE: se puede integrar esta evidencia cientfica con nuestra maestra clnica e
incorporarla en la asistencia de nuestro paciente?. Este paso puede tanto realizarse con un paciente concreto como
constituir la base para el desarrollo de guas de prctica clnica.
Una de las preguntas bsicas a responder es si la diferencia entre su paciente y los pacientes del estudio es
demasiado significativa para que sus resultados puedan ser de utilidad. El resto de conocimientos a considerar vara en
funcin del objetivo del estudio.
II.4.1.- APLICACIN PRCTICA DE PUBLICACIONES SOBRE TRATAMIENTO
* Son aplicables los resultados a nuestro pacientes?: no se trata simplemente de determinar si las caractersticas de
los sujetos del ensayo clnico y los de nuestra consulta son diferentes, sino si estas diferencias pueden hacer
sospechar que se obtendran resultados distintos. Algunos aspectos a tener en cuenta para valorar la aplicabilidad de
los resultados de un ensayo clnico son:
- aspectos biolgicos: existen diferencias fisiopatolgicas en la enfermedad que puedan conducir a una menor
respuesta al tratamiento?, ?existen diferencias en algunas caractersticas del paciente que puedan disminuir la
respuesta al tratamiento?;
- aspectos sociales y econmicos: existen diferencias importantes en el cumplimiento por parte del paciente que
puedan disminuir la respuesta al tratamiento?, existen diferencias importantes en el cumplimiento por parte del
profesional que puedan disminuir la respuesta al tratamiento?;
- aspectos epidemiolgicos: el paciente tiene otros problemas de salud concomitantes que puedan alterar
significativamente los riesgos y beneficios del tratamiento?
Por ello los ensayo clnico debe indicar claramente el procedimiento que han seguido para seleccionar a los sujetos; los
estudios con criterios de seleccin restrictivos tienen mayores limitaciones para la extrapolacin, mientras que los
estudios pragmticos, que utilizan criterios ms laxos, son ms fcilmente generalizables.

Puede ocurrir que se presenten anlisis de subgrupos de sujetos, alguno de los cuales sea similar a los pacientes a
los que se desea aplicar el resultado, por lo que se estara tentado a extrapolarlo directamente; sin embargo, el anlisis
de subgrupos puede ser peligroso, ya que la realizacin de mltiples comparaciones aumenta la probabilidad de
encontrar un resultado estadsticamente significativo simplemente por azar; por otro lado, si los subgrupos son de
reducido tamao, el anlisis puede ser incapaz de detectar diferencias relevantes. Cuando un estudio presenta anlisis
de subgrupos hay que ser muy cauteloso al interpretarlos, y evaluar detenidamente si el efecto es de gran magnitud, si
el tamao del subgrupo es grande, si responde a una hiptesis establecida previamente al inicio del estudio, si se han
analizado pocos subgrupos, si se han observado los mismo resultados en otros estudios y si existe un mecanismo
plausible que lo explique (si no se cumplen estas circunstancias, hay que ser escptico sobre la posibilidad de aplicar
los resultados).
* Cul sera el beneficio potencial de la aplicacin de la intervencin en este paciente?: para que decidamos aplicar
una determinada intervencin se debe estar convencido de que producir un beneficio para el paciente. Este aspecto
es importante cuando los estudios utilizan una variable intermedia para evaluar el efecto de la intervencin; no basta
con demostrar que un tratamiento tiene un efecto fisiolgico potencialmente beneficioso para asumir que su
administracin tambin lo ser; de hecho, solamente debera recomendarse un tratamiento en funcin de su efecto
sobre una variable intermedia cuando el riesgo del paciente es elevado, el paciente valora en alto grado evitar el
suceso adverso y no existen intervenciones alternativas satisfactorias. Cuando la intervencin que se evala es la
deteccin precoz de una enfermedad, debe asegurarse que existe un tratamiento eficaz para la enfermedad que se
detecta.
* Se han considerado todos los posibles resultados clnicamente importantes?: no es necesario evaluar slo la
respuesta adecuada, sino todas las otras posibles respuestas o efectos de relevancia clnica que puede producir el
tratamiento, como su impacto sobre la calidad de vida de los sujetos.
* Compensan los beneficios del tratamiento, los costes y riesgos del mismo?: cuando se trata de una intervencin
sanitaria sencilla, sin riesgos y que es muy eficaz en la reduccin de la mortalidad o la prevencin de una enfermedad
grave, la decisin es fcil; pero en otras ocasiones, se requiere una discusin detallada de todos los aspectos
relacionados con la intervencin, su cumplimiento y sus potenciales efectos beneficiosos y perjudiciales previamente a
la toma de decisiones.
* La intervencin y sus consecuencias satisfacen los valores y preferencias de los pacientes?: cada da se da mayor
importancia a este aspecto, pues hemos asistido a un cambio importante en las relaciones mdico-paciente,
consecuencia del enfoque de la relevancia de los consumidores en la sociedad. Los pacientes han pasado a ser
considerados coproductores de los cuidados de salud y, como tales, han adoptado un papel diferente, considerndose
ahora necesario contar con su opinin y promover en ellos decisiones responsables sobre su salud.
II.4.2.- APLICACIN PRCTICA DE PUBLICACIONES SOBRE PRUEBAS DIAGNSTICAS.
* La prueba est disponible y es reproducible, tanto en la realizacin como en la interpretacin, para los pacientes de
mi mbito?: las propiedades de la prueba pueden cambiar segn se apliquen a grupos de sujetos con una distribucin
diferente de estadios de la enfermedad o de otras enfermedades concomitantes que puedan interferir en el diagnstico.
Cuando se aplica a pacientes con la enfermedad en estadios avanzados el CP positivo se aleja de 1 (aumenta la
sensibilidad), mientras que si son de estadios menos avanzados, el CP positivo se aproxima a 1 (disminuye la
sensibilidad). Si los pacientes de mi mbito cumplen los criterios de inclusin y exclusin de los sujetos del estudio, los
resultados de la prueba sern aplicables; pero si no los cumplen, deben valorarse los motivos por los que podra
pensarse que los resultados no son aplicables; para la generalizacin de los resultados siempre es til disponer de
alguna revisin que interprete la informacin de diferentes estudios.
Obviamente, no puede aplicarse en la prctica una prueba que no est disponible ni sea asequible en el propio
entorno. Pero aunque lo sea, es conveniente evaluar su reproductibilidad, de la que depende en gran medida su
utilidad. Debe constar la reproductibilidad de la prueba en el artculo, especialmente cuando sta comporte cierto grado
de subjetividad en su realizacin o interpretacin. Pero si la prueba discrimina bien entre sujetos sanos y enfermos ser
til en la prctica, aunque la reproductibilidad no sea elevada y sea frecuente el desacuerdo entre observadores.
* Puede generarse una estimacin clnicamente razonable de la Ppre de este paciente?: ya ha sido comentado que la
utilidad del CP depende de que pueda disponerse de una estimacin adecuada de la Ppre del paciente concreto. La
situacin ideal es aquella en la que se dispone de datos del propio centro, pero en otras ocasiones esta estimacin
puede obtenerse de la propia experiencia o de la especulacin clnica, o valorando las diferencias entre las
caractersticas de nuestro paciente y la de los sujetos estudiados (en este ltimo caso es conveniente realizar anlisis
de sensibilidad, aplicando varias Ppre clnicamente razonables y determinando su impacto sobre la utilidad de la
prueba).
* La Ppost resultante puede hacer cambiar la actuacin en la prctica clnica y ayudar a nuestro paciente?: Si la
prueba fuera negativa o se obtuviera un CP positivo sensiblemente inferior a 1, la Ppost podra ser tan reducida que
hiciera descartar el diagnstico y no realizar ms pruebas; o si condujera a un CP positivo muy elevado, la Ppost podra
ser tan elevada que se considerara diagnstica y tampoco sera necesario realizar ms pruebas; si la prueba
condujera a una situacin intermedia entre las dos anteriores, debera plantearse la necesidad de realizar nuevas
pruebas. Este clculo es adecuado siempre que las pruebas sean independientes, hecho que suele ser difcil de asumir
en la prctica, por lo que el lector deber ser ms exigente a la hora de interpretar los valores de la Ppost.

A la hora de decidir qu prueba diagnstica se va a utilizar, es conveniente tener en cuenta los valores y preferencias
del paciente, ya que algunas pruebas implican una cierta invasividad o molestias, por lo que bsico que el paciente
est informado y dispuesto a colaborar.
El objetivo de aplicar una nueva prueba diagnstica es obtener informacin diferente a la ya conocida que sea
beneficiosa para mi paciente. La utilidad de una prueba es indiscutible cuando la enfermedad, si no se diagnostica,
comporta un peligro para la vida del paciente, la prueba no produce efectos adversos importantes y existe un
tratamiento efectivo para esa enfermedad.
II.4.3.- APLICACIN PRCTICA DE PUBLICACIONES SOBRE EFECTOS DE INTERVENCIONES Y/O
EXPOSICIONES
* Son aplicables los resultados a nuestros pacientes?: como siempre la primer cuestin clave es evaluar si los
pacientes son diferentes de los estudiados con respecto a morbilidad, edad, raza, intervenciones o exposiciones
previas u otras caractersticas importantes, para conocer si los resultados pueden extrapolarse a nuestra prctica
clnica.
* Cul es la magnitud del riesgo?: determinar el riesgo del paciente concreto de presentar el resultado negativo; una
forma sencilla de hacerlo es expresarlo como fraccin del riesgo de los sujetos del estudio, indicando si tiene el doble
de riesgo (F= 2), la mitad (F=0.5), etc y dividiendo despus el NND por el valor de F.
* Se debera evitar la exposicin?: una vez que se dispone de toda la informacin, debe decidirse cul es la actuacin
que debe seguirse; esta decisin debe tomarse basndose en la fuerza de la inferencia, la magnitud del riesgo si la
exposicin contina, la existencia de alternativas y, obviamente, los valores y preferencias del paciente. Cuando la
inferencia es fuerte y la magnitud del riesgo es elevada, la recomendacin es fcil; cuando existe una alternativa
teraputica que evita el riesgo, la recomendacin tambin es fcil, aunque no exista una gran evidencia; por el
contrario, puede existir una evidencia relativamente elevada, pero no una alternativa igualmente eficaz y ms segura.
II.4.4.- APLICACIN PRCTICA DE PUBLICACIONES SOBRE PRONSTICO
* Son aplicables los resultados a nuestros pacientes?: como siempre, la primera cuestin es valorar el grado de
similitud entre los propios pacientes y los incluidos en el estudio, y evaluar si las diferencias son tan importantes como
para dudar que los resultados permitan hacer pronsticos adecuados a los propios sujetos.
* Son tiles los resultados para decidir si dar un tratamiento y para aconsejar o tranquilizar a los pacientes o sus
familiares?: la informacin sobre el pronstico puede ser de gran ayuda a la hora de tomar decisiones sobre el
tratamiento pero, aunque no lo sea, tambin puede tener utilidad clnica. As, resultados vlidos, precisos y
generalizables que indican el buen pronstico de un proceso pueden ser muy tiles para tranquilizar a los pacientes
que lo padecen; por contra, si los resultados indican un mal pronstico, los datos pueden ser un buen punto de partida
para intercambiar informacin con el paciente y planificar la atencin sanitaria.

NIVELES DE CALIDAD DE LA EVIDENCIA CIENTIFICA


Las escalas de clasificacin de la evidencia cientfica diferencian de forma jerrquica los distintos niveles en funcin del
rigor cientfico del diseo del estudio. Los aspectos del diseo que estn asociados a una mayor calidad y rigor
cientfico son:
- el sentido prospectivo del estudio;
- la asignacin aleatoria a los grupos experimental y control de la intervencin sanitaria a evaluar;
- la existencia de un grupo control concurrente en el tiempo;
- el enmascaramiento de los pacientes e investigadores participantes respecto al objeto de estudio;
- la inclusin en el estudio de un nmero suficiente de pacientes como para detectar diferencias estadsticamente
significativas en la determinacin del efecto verdadero del procedimiento que se evala.
Hay diferentes escalas de gradacin de la evidencia cientfica, todas ellas muy similares entre s: Canadian Task Force
on the Periodic Health Examination, U.S. Preventive Services Task Force, The Swedish Council on Technology
Assessment in Health Care,... En nuestro pas la Agencia de Evaluacin de Tecnologa Mdica, del Servicio Cataln de
Salud, propone un esquema de graduacin de los niveles de calidad de la evidencia cientfica que se exponen en la
Tabla, y cuyas diferencias fundamentales son dos: considera las condiciones de rigurosidad cientfica en los tipos de
diseo, y presenta el metaanlisis como el diseo de mayor rigor cientfico.

Calidad de la evidencia cientfica

Tipo de diseo

Condiciones de rigurosidad
cientfica
No heterogeneidad

BUENA

Metaanlisis de EC controlados y
aleatorizados

Diferentes tcnicas de anlisis


Metarregresin Megaanlisis Calidad
de los estudios
Evaluacin del poder estadstico

EC controlado y aleatorizado de
muestra grande

Multicntrico
Calidad del estudio

Evaluacin del poder estadstico


EC controlado y aleatorizado de
muestra pequea (enfermedad poco
prevalente)
Calidad del estudio

REGULAR

EC controlado y aleatorizado de
muestra pequea (enfermedad
prevalente)

Evaluacin del poder estadstico


Calidad del estudio
Controles coincidentes en el tiempo

EC controlado no aleatorizado

Multicntrico
Calidad del estudio
Controles histricos

EC controlado no aleatorizado
Calidad del estudio
Multicntrico
Estudios de cohorte

Apareamiento
Calidad del estudio
Multicntrico

Estudios de casos y controles


Calidad del estudio
Series clnicas
Estudios transversales
MALA

Conferencia de consenso
Comits de expertos
Ancdotas o casos nicos

Distingue el mayor rigor cientfico de los diseos que presentan una mejor combinacin de validez interna y de validez
externa. La validez interna se apoya en el poder estadstico que avale la significacin estadstica de los resultados, la
asignacin aleatoria de la intervencin a evaluar y la presencia de un grupo control concurrente, con lo que existe un
mayor control del sesgo y del error sistemtico en el diseo del estudio. La validez externa se apoya en el carcter
multicntrico del estudio, que incluya la participacin de mltiples instituciones sanitarias, de pacientes de diversas
procedencias y de diferentes estilos de prctica clnica.
A partir del anlisis y clasificacin de la evidencia cientfica descrita, puede formularse recomendaciones en torno a la
idoneidad de las condiciones de adopcin de un procedimiento mdico o tecnologa sanitaria. La calidad de la
evidencia cientfica se clasifica en tres grados:

- Buena (grado A): existe adecuada evidencia cientfica para recomendar o desaconsejar la adopcin del procedimiento
mdico;
- Regular (grado B): existe cierta evidencia cientfica (no concluyente) para recomendar o desaconsejar la adopcin del
procedimiento mdico;
- Mala (grado C): existe insuficiente evidencia cientfica para recomendar o desaconsejar la adopcin del procedimiento
mdico.
Esta clasificacin de la evidencia cientfica es especialmente til para artculos sobre tratamiento/prevencin y sobre
efectos de intervenciones y/o exposiciones. Se ha profundizado menos en MBE en los estudios sobre diagnstico y
pronstico. El Center for Evidence-Based Medicine ha clasificado los niveles de evidencia cientfica y grados de
recomendacin para todos los tipos de estudio (tratamiento, diagnstico, efectos secundarios y pronstico), lo que
podemos consultar en la siguiente direccin: http://cebm.jr2.ox.ac.uk/docs/levels.html

III.1.- VALORACIN DE LOS PRINCIPALES TIPOS DE ESTUDIOS EPIDEMIOLGICOS:


Desde un punto de vista convencional, las ciencias se pueden clasificar en dos grandes grupos: formales y fcticas.
Las ciencias formales son las "ciencias a priori", como las matemticas y la lgica, y sus objetos son mentales o
ideales. En ellas el mtodo de investigacin es el deductivo (va del todo a las partes, de lo general a lo particular), y el
criterio de verdad es la consistencia o no contradiccin.
Las ciencias fcticas son las "ciencias a posteriori", como la biologa y la medicina, y sus objetos son reales o
materiales. En ellas el mtodo de investigacin es el inductivo (va de las partes al todo, de lo particular a lo universal), y
el criterio de verdad es la verificacin. Se distinguen 5 etapas en el mtodo de investigacin de las ciencias fcticas y,
de forma particular, en la investigacin en poblaciones humanas (estudios epidemiolgicos):
1)observacin del fenmeno epidemiolgico;
2)tabulacin y comparacin de los datos observados;
3)formulacin de la hiptesis;
4)experimentacin y verificacin de la hiptesis;
5)informe o formulacin de la ley.
La Epidemiologa descriptiva comprende las etapas 1 y 2, y el prototipo son los estudios transversales. La
Epidemiologa analtica comprende tambin la etapa 3, y son ejemplos los estudios de caso-control y los estudios de
cohorte. La Epidemiologa experimental engloba la etapa 4, y el prototipo son los ensayos clnicos.
1.-EPIDEMIOLOGA DESCRIPTIVA:
Los estudios descriptivos ofrecen la frecuencia y las caractersticas ms importantes de un problema de salud, que son
esenciales para los administradores sanitarios, as como para los epidemilogos y clnicos. Puede ser estudios
descriptivos en individuos (estudios transversales, series de casos, a propsito de un caso) o en poblaciones (estudios
ecolgicos).
* Estudios transversales (cross-sectional study): Tambin llamados estudios de corte o de prevalencia, estudian
simultneamente la exposicin y la enfermedad en una poblacin bien definida en un momento determinado. Se
utilizan fundamentalmente para conocer la prevalencia de una enfermedad o de un factor de riesgo; tambin sirven,
como todos los estudios descriptivos, para formular hiptesis etiolgicas.
-Ventajas: til para el estudio de enfermedades de larga duracin (crnicas) y frecuentes en la colectividad; resultados
ms fcilmente generalizables al estar basados en una muestra representativa de la poblacin a la que se pretende
dirigir la inferencia (principal ventaja sobre el estudio de caso-control); menor coste y tiempo (principal ventaja sobre el
estudio de cohorte); gran utilidad en planificacin sanitaria (identifican el nivel de salud, los grupos vulnerables y la
prevalencia).
-Inconvenientes: el propio diseo, al determinar en el mismo momento la exposicin y la enfermedad, no distingue
entre factor de riesgo y factor pronstico y no permite conocer la secuencia temporal de los acontecimientos; no son
tiles en enfermedades raras ni de corta duracin; posibilidad de sesgos de informacin y seleccin.

* Series de casos: describen las caractersticas de un paciente o un grupo de pacientes con un diagnstico similar.
-Ventajas: til para formular hiptesis
-Inconvenientes: no sirven para evaluar la presencia de una asociacin estadstica (pues la gran limitacin es la
ausencia de un grupo control), por lo que la presencia de una asociacin puede ser un hecho fortuito.
* Estudios ecolgicos: utilizan datos agregados de toda la poblacin, y son el primer paso, en muchas ocasiones, en
la investigacin de una posible relacin entre una enfermedad y un exposicin determinada.
-Ventajas: se realiza rpidamente, prcticamente sin coste y con informacin que suele estar disponible.
-Inconvenientes: no pueden determinar si existe asociacin entre una exposicin y una enfermedad a nivel individual (la
falacia ecolgica consiste precisamente en obtener conclusiones inadecuadas a nivel individual basados en datos
poblacionales); incapacidad para controlar variables potencialmente confusoras.
2.-EPIDEMIOLOGA ANALTICA:
* Estudios de caso-control (case-control study): Tambin llamados estudios retrospectivos (pero no siempre es as),
dado que lo define su sentido hacia atrs: partiendo de la enfermedad se estudian sus antecedentes, en el que se
seleccionan dos grupos de sujetos llamados casos y controles (segn tengan o no la enfermedad). La medida de
asociacin utilizada es la odds ratio, que admite mltiples traducciones en nuestro idioma: razn de productos
cruzados, razn de disparidad, razn de predominio, proporcin de desigualdades, cociente de probabilidades
relativas, oportunidad relativa,...
-Ventajas: permite el estudio de enfermedades raras y con periodo de latencias prolongados; fciles de disear y
llevarse a cabo; relativamente econmicos y en poco tiempo; no riesgo para los sujetos participantes; permiten el
estudio de la multicausalidad; fcilmente repetibles.
-Inconvenientes: dificultad de constituir un grupo adecuado de comparacin; mayor posibilidad de sesgos de
informacin y seleccin; cuando se estudian enfermedades raras, la eleccin del grupo de casos no suele ser aleatoria
y se toma la que existe; la validacin de la informacin obtenida sobre la exposicin es difcil; el control de los factores
de confusin puede ser incompleto; no conviene cuando el diagnstico de la enfermedad no est lo suficientemente
claro; imposible el estudio de la multiefectividad.
* Estudios de cohortes (cohort study): Tambin llamados estudios de incidencia (pero no es su fin principal) y estudios
prospectivos (pero no siempre es as, y algunos histricos son retrospectivos), dado que lo define su sentido hacia
delante: partiendo del factor de riesgo se dirige hacia la enfermedad. La medida de asociacin utilizada es el riesgo
relativo.
-Ventajas: completa descripcin de la historia natural y mejor planificacin; se obtienen estimaciones directas; mejor
valoracin del estado de exposicin y posibilita el estudio de la multiefectividad de una exposicin; menos posibilidad
de cometer sesgos en comparacin con otros estudios y mayor control de calidad en la recogida de la informacin.
-Inconvenientes: coste elevado y mayor consumo de tiempo; difcil reproductibilidad; no sirve para estudiar
enfermedades raras; la participacin de los individuos hace que tenga influencia sobre sus propios hbitos y
costumbres; no adecuado para la formulacin de nuevas hiptesis etiolgicas; por su larga duracin hace que el
avance paralelo de otro tipo de investigaciones haga que los resultados obtenidos sean irrelevantes; dificultad de
uniformidad y problema de prdidas.
3.-EPIDEMIOLOGA EXPERIMENTAL:
En los estudios experimentales el investigador manipula las condiciones de la investigacin. Como en los estudios de
cohortes, los individuos son identificados en base a su exposicin, pero a diferencia de stos, en los estudios
experimentales es el investigador el que decide la exposicin. Los estudios experimentales puede ser:
- teraputicos (o prevencin secundaria): se realizan en enfermos, y determinan la capacidad de una intervencin
sanitaria para disminuir sntomas, prevenir la recurrencia o reducir el riesgo de muerte por dicha enfermedad;
- preventivos (o prevencin primaria): se realizan en sanos, y determinan la capacidad de una intervencin sanitaria
para reducir el riesgo de desarrollar una enfermedad.
* Ensayos clnicos (clinical trial): Son los estudios experimentales ms frecuentes, en los que el investigador provoca
y controla las variables, y los pacientes son asignados de forma aleatoria a los distintos tratamientos que se comparan,
que anunci una revolucin fundamental en la forma de establecer las bases clnicas del diagnstico, tratamiento y
pronstico en medicina, de forma que se ha convertido en el "patrn oro" de las mejores evidencias externas de la
literatura (ver apartado IV.1).

-Ventajas: mayor control en el diseo; menos posibilidad de sesgos debido a la aleatorizacin de los grupos; repetibles
y comparables con otras experiencias.
-Inconvenientes: coste elevado; limitaciones de tipo tico y responsabilidad en la manipulacin de la exposicin;
dificultades en la generalizacin debido a la seleccin y/o a la propia rigidez de la intervencin.
* Ensayos de campo (field trial): Son estudios experimentales en los que los sujetos an no han adquirido la
enfermedad o bien estn en riesgo de adquirirla y se estudian factores preventivos.
* Ensayos comunitarios (community intervention trial): Incluyen intervenciones sobre bases comunitarias amplias;
este tipo de diseos suelen ser cuasiexperimentales (existe manipulacin pero no aleatorizacin), en los que una o
varias comunidades recibirn la intervencin, mientras que otras servirn como control.

III.2.-SESGOS
La meta fundamental que todo estudio epidemiolgico debe perseguir es la agudeza en la medicin. Por ello, se deben
identificar los elementos que amenacen esta correcta medicin, y que son: el error aleatorio y el error sistemtico.
La carencia de error aleatorio es lo que se conoce como precisin, y se corresponde con la reduccin del error
debido al azar. Qu se puede hacer para reducir el error aleatorio y, por tanto, aumentar la precisin?: el elemento
ms importante es incrementar el tamao muestral (con lo que se reduce el error estndar y los intervalos de
confianza), y tambin al modificar el diseo del estudio para aumentar la eficiencia de la informacin que se obtiene de
los sujetos.
La carencia de error sistemtico es lo que se conoce como validez, que tiene dos componentes: la validez interna
(validez de las inferencias a los sujetos reales del estudio muestral) y la validez externa (generalizacin de los
resultados a la poblacin a partir del estudio muestral). La validez interna es, por tanto, un prerrequisito para que pueda
darse la validez externa.
La validez interna se ve amenazada por varios tipos de sesgos, que son los errores sistemticos de un estudio
epidemiolgico que producen una estimacin incorrecta de asociacin entre la exposicin y la enfermedad (es decir,
producen una estimacin equivocada del efecto). Los principales sesgos son los sesgos de seleccin e informacin (u
observacin).
* Sesgo de seleccin: cualquier error sistemtico que deriva del proceso de identificacin de la poblacin a estudiar,
principalmente de la forma en que los sujetos han sido seleccionados.
Es un problema fundamental en los estudios casos-control y de cohortes retrospectivos, en donde la exposicin y el
resultado final ya han ocurrido en el momento en que los individuos son seleccionados para el estudio. Este sesgo de
seleccin es poco probable en los estudios de cohortes prospectivos.
Cmo evitar el sesgo de seleccin en los estudios casos-control? Se recomienda, al menos tericamente (ya que
desde el punto de vista prctico es muy costoso), utilizar dos grupos control; tambin se recomienda utilizar muchas
patologas como grupo control.
Cmo evitar el sesgo de seleccin en los estudios de cohortes? Se debe asegurar un seguimiento completo en
ambos grupos.
* Sesgo de informacin (u observacin): cualquier error sistemtico que deriva de las diferencias en la que los datos
sobre exposicin o resultado final han sido obtenido.
Las fuentes de sesgo de informacin ms frecuentes son: instrumento de medida no adecuado, criterios diagnsticos
incorrectos, omisiones, imprecisiones en la informacin, errores en la clasificacin, errores introducidos por los
cuestinarios o los encuestadores.
Los sesgos, el azar y la presencia de variables confusoras deben tenerse en cuenta siempre, como explicacin posible
de cualquier asociacin estadstica ya sea esta positiva, negativa o no existente.

LAS MEJORES EVIDENCIAS (O PRUEBAS) CIENTFICAS


El predominio del ensayo clnico aleatorizado anunci una revolucin fundamental en la forma de establecer las bases
clnicas del tratamiento y pronstico en medicina, de forma que se ha convertido en el "patrn oro" de las mejores

evidencias externas de la literatura. Una metodologa ms reciente denominada revisin sistemtica (que cuando
utiliza procedimientos estadsticos se conoce como metanlisis) ha permitido extraer conclusiones ms firmes, al
combinar todos los ensayos clnicos aleatorizados (y, con menor frecuencia, otros estudios con menor evidencia
cientfica) llevados a cabo sobre un problema de salud especfico. Se trata de una metodologa sistemtica (en cuanto
que pretende acceder a toda la informacin disponible), estructurada (al estar definida por diferentes etapas) y explcita
(ya que determina los diferentes tipos de diseos que constituyen cada una de las fases).
Estos mtodos exigentes (ensayos clnicos, revisiones sistemticas y metanlisis) han permitido incrementar la validez
cientfica y la importancia clnica de los resultados aplicados sobre nuevos tratamientos, pruebas diagnsticas, efectos
secundarios y marcadores pronsticos. Como vemos en la Figura, estos tres tipos de estudios estn ntimamente
relacionados entre s, y nos proporcionan las mejores evidencias (o pruebas) cientficas para nuestra prctica clnica.

ENSAYOS CLNICOS

metodologa sistemtica,
estructurada y explcita
REVISIN SISTEMTICA

procedimientos estadsticos

METANLISIS

Aunque hay autores que restringen la MBE a estos tipos de estudios, existen determinadas preguntas mdicas que, en
principio, slo se pueden responder con otros tipos de diseo (estudios de cohorte, de caso-control, transversales,...).
Es decir, la MBE es una estrategia de pensamiento y trabajo que busca la mejor evidencia cientfica disponible para
una pregunta mdica; por tanto, se puede aplicar en todo tipo de estudio cientfico, si bien variar en cada caso la
calidad de su evidencia cientfica.

IV.3.- METANLISIS (MA)


Los MA son proyectos de investigacin por s mismos, en los que las unidades de observacin son los estudios
originales. Los MA requieren una adecuada planificacin y una dedicacin considerable de recursos humanos, en la
que se debera constituir un equipo investigador formado por investigadores con experiencia en el tema objeto de
estudio, epidemilogos y/o bioestadsticos con experiencia en la realizacin de MA y documentalistas expertos en la
realizacin de bsquedas bibliogrficas exhaustivas.
IV.3.1.- METODOLOGA DEL MA
Como premisa conviene recordar que no existe un mtodo correcto nico en la elaboracin del MA, pero s unas
etapas definidas, que analizamos a continuacin.
1.-Definir el objetivo (s): El primer paso para la realizacin de un MA es formular la pregunta concreta que se
pretende responder, y es preferible que se trate de responder a una pregunta y no a muchas. En este ltimo caso
deben quedar claramente expuestos los objetivos generales y secundarios en el protocolo de trabajo, lo que permite
observar el mximo rigor y evitar aquellos sesgos inherentes a todo diseo retrospectivo cual es el MA. Por tanto, se
debe intentar definir a priori la hiptesis principal que nos impulsa a la revisin para que el posterior anlisis estadstico
sea ms til e interpretable.
2.-Identificar la informacin: En el MA los casos son los diferentes estudios originales que aportan informacin
relevante sobre la hiptesis previamente definida. Por tanto un estudio es en el MA lo que un caso en un estudio
original. Se utiliza una metodologa similar a la RS.
La bsqueda de EC no publicados entronca con lo que se denomina sesgo de publicacin. Bsicamente consiste en
que si slo utilizamos trabajos publicados podemos incurrir en un sesgo a favor de los resultados significativos y en
detrimento de los estudios negativos. Dado que la prevencin de dicho sesgo no siempre es posible, se puede
cuantificar su importancia calculando el nmero de estudios no publicados necesarios para convertir en no significativa
la diferencia de efecto encontrada con los estudios publicados en el MA: as, la conclusin de un MA es tanto ms
slida cuanto mayor es el nmero de estudios negativos no publicados necesarios para refutarla. No existen reglas

aceptadas para manejar los estudios inditos publicados solo como comunicaciones a congresos (abstracts), pero para
algunos autores en el anlisis inicial del MA solo debera incluir estudios publicados en forma de artculos.
Otro aspecto de inters es el lenguaje del artculo cientfico. Existe una clara tendencia en los MA a considerar en la
bsqueda electrnica slo los artculos publicados en ingls, lo que puede ser motivo de sesgo, tal como ha sido
comprobado en la literatura: la exclusin sistemtica de EC aleatorizados en idiomas diferentes del ingls puede
cambiar las conclusiones del MA.
3.-Seleccionar los datos: Los criterios de inclusin y exclusin de los estudios originales debern concretarse en el
protocolo de acuerdo con los objetivos propuestos y antes de iniciar la bsqueda de los posibles estudios a combinar.
Es deseable que la primera revisin se haga separadamente por varios observadores entrenados para evitar posibles
sesgos debidos a la subjetividad que entraan. Se debe valorar el grado de concordancia interobservadores, y en caso
de discrepancias deben discutirse y llegar a un acuerdo.
Como base para los criterios de inclusin pueden escogerse aspectos tales como el diseo del estudio, el tamao
muestral, el tipo de tratamiento o exposicin, que el estudio est publicado o no, expresin del resultado de inters,
contexto asistencial, gravedad de los pacientes, tiempo de evolucin de la enfermedad, etc. Si se establecen criterios
de inclusin liberales, como parte del anlisis se puede estudiar el efecto de la ampliacin o restriccin de criterios,
subdividiendo los estudios segn una o ms caractersticas (anlisis de sensibilidad). Correlacionar las diversas
caractersticas del diseo de los estudios con la magnitud de las medidas individuales y combinadas de efecto
mostrar explcitamente el efecto de ampliar o estrechar los criterios de inclusin y puede as fortalecer el anlisis.
No conocemos criterios estndar para la inclusin de estudios en el MA, ya que el MA puede ampliarse a una amplia
gama de temas. As pues, los criterios de inclusin y exclusin son una decisin arbitraria del autor y pueden ser
responsables de diferencias en los resultados del MA.
4.-Recogida de la informacin: Una vez recopilados y seleccionados los estudios originales (segn los criterios de
inclusin y exclusin) se revisan y se resume la informacin descriptiva. Se ha de tener cuidado para no incluir datos
del mismo grupo de pacientes ms de una vez: en el caso de que un trabajo se presente en varias publicaciones,
cuyos resultados no son independientes dado que se basan en los mismos pacientes, slo se escoger la presentacin
ms completa para el MA, ya que sino aumentara falsamente la homogeneidad entre los resultados de los estudios
combinados.
No existe un modelo universalmente vlido para codificar la informacin de los estudios a combinar. Las principales
variables que deben extraerse de los estudios originales en la realizacin de un MA son:
- Identificacin del estudio: autores y pas, fuente de financiacin
- Fecha de publicacin del estudio
- Fecha de inicio y final del trabajo
- Problema estudiado o hiptesis puesta a prueba
- Caractersticas de los individuos: edad, sexo, diagnsticos, duracin del seguimiento, evolucin.
- Diseo del estudio: experimental (con aleatorizacin o no), observacional (prospectivo o restrospectivo)
- Exposicin o tratamiento estudiado: dosis, pauta, duracin,
- Co-exposicin o co-tratamiento
- Resultados que permiten medir los efectos principales y secundarios: resultados brutos y medida de efecto ajustada
con sus intervalos de confianza o valores p asociados e interacciones representativas.
- Valoracin de la calidad o validez de los estudios
- Susceptibilidad del estudio a posibles sesgos, aspectos destacables y limitaciones del estudio, y explicaciones que los
autores presentan de los resultados.
Esta etapa de recogida de la informacin puede tener una considerable influencia sobre la conclusin final, en el que
pueden surgir dos problemas: 1)diferencias en el proceso y calidad de recogida de la informacin, lo que explica en
parte que existan MA sobre un mismo tema que obtienen conclusiones opuestas; para evitar estos sesgos de
observacin, se intenta que la extraccin de datos la realicen al menos dos personas; y 2)la falta de informacin
relevante que se obtiene a veces en las publicaciones originales; de ah lo importante que puede resultar que el autor
del MA contacte con los autores de los estudios primarios, por si fuera preciso solicitarles informacin adicional.

5.-Valorar la calidad de los estudios: Los padres del MA proponen utilizar todos los estudios disponibles, sin
excepcin, sobre un tema. Este principio de inclusin exhaustiva, sin considerar la calidad de los estudios combinados
es la principal crtica que se hace a este mtodo. La alternativa consiste en dar una mayor atencin a las
caractersticas metodolgicas de los diferentes estudios combinados para dar ms "peso" a los mejores. Existen varios
sistemas para valorar la calidad de los ensayos clnicos, de los estudios caso-control y de los estudios de cohorte, de
forma que cada estudio se puede calificar con una puntuacin que oscila de 0,0 a 1,0. Los ndices de calidad obtenidos
pueden utilizarse como criterio de inclusin (definiendo previamente una puntuacin mnima necesaria) o para
ponderar el peso de cada estudio en el resultado global (dando a cada estudio un peso proporcional a su ndice de
calidad).
Se conoce como MA "ponderado" el que considera la calidad de los estudios incluidos en el anlisis, con una validez
cientfica mayor que el MA "exhaustivo". El principal problema de esta alternativa es que las puntuaciones de calidad
son el resultado de agregar numerosos criterios heterogneos en una puntuacin final, cuya relacin con los resultados
del trabajo no siempre es directa.
6.-Procedimientos estadsticos: En el MA los procedimientos estadsticos tienen el objetivo de describir los
resultados y cuantificar la incertidumbre, una vez que el buen juicio y el sentido comn (los elementos ms
importantes) han clarificado los temas cualitativos. De hecho este apartado sobre procedimientos estadsticos es lo que
caracteriza al MA en comparacin con la revisin sistemtica.
a) Valorar la homogeneidad de los estudios combinados: El supuesto que subyace a la combinacin de resultados de
estudios individuales en una estadstica descriptiva es que sus diferencias son solo casuales (variacin de muestreo) y
que, por tanto, los resultados de todos los estudios son homogneos, es decir, que reflejan el mismo efecto
"verdadero". La falta de uniformidad de los resultados medidos en los estudios puede reflejar el hecho de que el efecto
del tratamiento vara en funcin de las caractersticas particulares de los estudios, por ejemplo, las dosis y/o la edad de
los pacientes. No solo es importante saber la efectividad teraputica, tambin es importante la cuestin de en qu
pacientes y bajo qu circunstancias el tratamiento funciona mejor.
Un cierto grado de heterogeneidad entre los estudios combinados puede ser saludable para aumentar la capacidad de
generalizacin (validez externa), pero, no obstante, una notable heterogeneidad estadstica de efectos no es deseable.
El lmite de homogeneidad en los efectos que debemos aceptar nos vendr dado por los procedimientos estadsticos
habituales para probar que las diferencias entre las medidas de los efectos en los estudios primarios no son mayores
de lo que cabra esperar por la influencia del azar. Tambin ser til una representacin grfica de los efectos de los
estudios primarios (que nos permitir detectar los valores extremos y/o los patrones relacionados con las
caractersticas clnicas) y sobre todo el uso de la lgica clnica, que deber prevalecer sobre un criterios
exclusivamente matemticos. Desde un punto de vista global cabe recordar que el test de homogeneidad aplicado a un
MA tendr escaso poder cuando se comparan menos de 10 EC.
Un problema estadstico importante relacionado con la agrupacin de datos de procedencia heterognea es el que
puede surgir cuando todos o la mayora de los estudios individuales dan resultados favorables a uno de los
tratamientos ensayados, mientras que del MA global de datos se obtiene el resultado opuesto: esta sorprendente
situacin se conoce como paradoja de Simpson, y para solucionar este problema se han ideado diversas
aproximaciones matemticas.
Cuando se juzga que hay una relativa homogeneidad puede obtenerse una medida sumaria del resultado final
combinando los resultados de los estudios primarios. Todos los lectores deberan buscar en la publicacin de un MA
una discusin del tema de la homogeneidad (mediante pruebas grficas y estadsticas) previa al uso de procedimientos
de combinacin que la dan por supuesta. Se estima el punto de corte de la "ji" cuadrado de la homogeneidad en 0.1: si
p> 0.1= heterogeneidad, si p< 0.1= homogeneidad.
El gran problema del MA es la heterogeneidad; cmo combatirla?: 1)restringir objetivos; 2)plantear anlisis de
subgrupos; 3)y si no es posible evitarla, se deben investigar los resultados para identificar las fuentes de
heterogeneidad: anlisis de la sensibilidad (estudios de mayor calidad vs estudios de menor calidad, estudios ciegos vs
no ciegos, etc), meta-regresin,...
b) Combinacin de los efectos de los estudios primarios revisados para llegar a una medida de efecto global: El primer
paso es calcular en cada uno de los estudios combinados las medidas del efecto que nos interesa (reduccin del riesgo
absoluto, reduccin del riesgo relativo, nmero de pacientes a tratar,...) de una variable (tratamiento, exposicin,...)
sobre otra (mejora, curacin, supervivencia,...), controlando si es necesario los potenciales factores confusores (sexo,
edad, gravedad,...).
Estas medidas de efecto pueden obtenerse a partir de los datos individuales, si se detallan en los estudios, o tomarse
los efectos presentados. Tambin es posible estimar el efecto a partir de los estadgrafos t de Student, F de Snedecor,
"ji" cuadrado, coeficiente de correlacin de rangos de Sperman, o incluso de los valores de p. Una exposicin detallada
de los diferentes mtodos utilizables para combinar resultados de diferentes estudios est fuera de nuestro objetivo,
pero pueden clasificarse en dos grandes grupos: los modelos de efectos fijos (fixed effects) y los modelos de efectos
aleatorios (random effects).
Los modelos de efectos fijos asumen que todos los estudios estiman el mismo efecto, es decir, que las diferencias que
se observan entre los estudios se deben nicamente a variabilidad aleatoria. Los principales mtodos de efectos fijos

son el Mantel-Haenszel (el ms atractivo y de eleccin en los MA realizados a partir de EC con variables de efecto
dicotmica), el de Woolf (menos eficiente que el anterior, pero tiene la ventaja que puede aplicarse a los MA de EC en
los que se combinan riesgos relativos, odds ratios, diferencias de medias, etc) y el de Yusuf-Peto (poco utilizado, dado
que es bastante intuitivo y puede llevar a resultados paradjicos).
Los modelos de efectos aleatorios se aplican cuando los estudios tienen un grado de heterogeneidad superior al
esperado por simple variabilidad aleatoria. Se utiliza el mtodo de DerSimonian y Laird que incorpora la variabilidad
interestudio en el estimador combinado, y cuyo uso es controvertido. Ciertos autores argumentan que deberan ser
habituales en los MA, ya que es frecuente la existencia de heterogeneidad residual no explicada. Es frecuente, por otro
lado, encontrar MA que presentan tanto los resultados de modelos de efectos fijos como los de efectos aleatorios.
Siempre habr opiniones distintas sobre cul es el mtodo ms apropiado para hacer un MA particular, de manera que
el investigador debe preguntarse en todos los casos en qu medida sus resultados metanalticos son sensibles a la
manera en que se realiz el MA. Nunca est absolutamente claro si usar modelos de efectos fijos o de efectos
aleatorios: en el caso de estudios homogneos se obtienen resultados similares con ambos modelos (vara algo el
intervalo de confianza), en el caso de estudios heterogneos se obtienen resultados diferentes con ambos modelos, y
en el caso de estudios con gran heterogeneidad no realizar MA.
El anlisis de la sensibilidad puede utilizarse como herramienta para analizar por qu dos MA sobre un mismo tema
obtienen conclusiones diferentes.
c) Presentacin grfica de los resultados: Es un mtodo complementario de anlisis de los resultados combinados y del
resultado global del MA que tiene la ventaja de ser intuitivo y fcil de visualizar, pero en el que debe cuidarse la
eleccin de las escalas para conseguir una impresin visual no distorsionada. Cada lnea horizontal representa el
resultado de un EC (cuanto ms corta es la lnea, ms cierto es el resultado, pues menor es el intervalo de confianza),
cuya autora y ao de realizacin del EC se indica al margen. Tambin se representa en un lnea horizontal el resultado
global de la combinacin de todos los EC. La lnea vertical indica la posicin alrededor de la cual las lneas horizontales
se concentrarn si los dos tratamientos comparados en los EC tuviesen efectos similares. La posicin del punto a la
izquierda de la lnea vertical indica que el tratamiento estudiado es beneficioso, y su posicin a la derecha que es
perjudicial. Si una lnea horizontal toca la lnea vertical, significa que aquel EC concreto no encontr diferencias
significativas entre los tratamientos.
La virtud de esta presentacin grfica es que consigue hacer visualmente sencillo toda la complejidad metodolgica del
MA. Tal es as, que el logotipo de la Colaboracin Cochrane ilustra la presentacin grfica de una revisin sistemtica
de siete EC aleatorizados sobre el tratamiento con corticosteroides dados a madres con riesgo de parto prematuro.
d) Valoracin del impacto de la estrategia de anlisis elegida: Como ha sido comentado, no existe un nico
procedimiento estadstico correcto para combinar los resultados procedentes de varios estudios y el resultado puede
variar en funcin del tipo de anlisis. Por ello es interesante comprobar si las conclusiones se mantienen al cambiar la
estrategia de anlisis elegida. Y finalmente discernir entre los resultados estadsticamente significativos del MA y los
resultados clnicamente importantes.
7.-Conclusiones y recomendaciones para futuros estudios: Las conclusiones estn justificadas solo cuando el
proceso de recogida, anlisis e integracin de la informacin se aplica de forma completa y sistemtica, con los
procedimientos estadsticos adecuados que es lo que caracteriza al MA sobre la revisin sistemtica. Tan importante
como extraer conclusiones (obtener la respuesta a la pregunta concreta que se intenta responder), es sugerir futuros
estudios. Es importante conocer lo que se sabe de un tema, pero ms importante es reconocer lo que no se sabe. Es
decir, el MA tambin detecta los puntos de partida a partir de los que abrir nuevas lneas de investigacin sobre un
determinado tema mdico.
En la siguiente Tabla se presenta una lista de preguntas clave para valorar un MA, lo que puede ser til tanto al posible
autor como al lector. La evaluacin sistemtica de estas preguntas ayudan a interpretar de forma crtica y objetiva los
MA.
GUA PARA LA REVISIN DE UN METANLISIS: DECLOGO DE PREGUNTAS CLAVE PARA EL AUTOR Y/O EL
LECTOR
1.-Est suficientemente justificada la realizacin del MA? Estn descritos los objetivos del MA de forma clara y
precisa? Son relevantes los objetivos?
2.-Se especifica desde el principio la poblacin diana, la exposicin o intervencin en estudio y el resultado de
valoracin estudiado?
3.-Se utilizaron mtodos sistemticos para la localizacin exhaustiva de los estudios relevantes? Se describen los
mtodos de bsqueda bibliogrfica con suficiente detalle? Se han utilizado estrategias de bsqueda complementaria?
Se han intentando localizar trabajos en literatura "opaca"? Se han intentado localizar trabajos no publicados para
evitar el sesgo de publicacin?

4.-Se especifican los criterios de inclusin/exclusin de los artculos orginales en el MA? Estos criterios son
especficos, detallados y reproducibles? Se establecieron a priori?
5.-Se tiene en cuenta la calidez y validez de los artculos originales? Se siguieron criterios explcitos y reproducibles
para evaluar la calidad de los estudios? Se establecieron a priori?
6.-Se describen los mtodos para la extraccin de los datos de los estudios originales? Se evalu la
reproductibilidad de la extraccin de los datos?
7.-Se describen los mtodos utilizados para el anlisis estadstico? Se describen los mtodos utilizados para evaluar
la heterogeneidad de los resultados y las fuentes de heterogeneidad? Con qu mtodos se combinan los estudios
originales? Se realizan anlisis de sensibilidad de los resultados del MA?
8.-Se presentan los resultados de los estudios originales y del MA de forma objetiva e imparcial?
9.-Se discuten los resultados del MA de forma equilibrada? Se discuten las limitaciones del MA? Se analizan las
posibles discrepancias con otros trabajos publicados? Se discute la solidez de las inferencias segn criterios de
causalidad relevantes? Se concretan las consecuencias para la prctica clnica o de salud pblica de los resultados?
10.-Los resultados del MA justifican las conclusiones alcanzadas? Existen "otros" factores que puedan influir en las
conclusiones que alcanzan los investigadores, como conflictos de inters, fuentes de financiacin, etc?
IV.3.2.-MS ALL DEL MA
A medida que hay ms y ms EC publicados y no publicados sobre un tema aumenta la necesidad de sntesis
sistemtica de sus resultados. La principal ventaja del MA respecto a la revisin narrativa consiste en un control
sistemtico de los procedimientos empleados en cada paso, lo cual protege la validez y reproductibilidad de las
conclusiones obtenidas, as como tambin su capacidad de generalizacin y un mayor poder estadstico para concluir.
A diferencia de la revisin narrativa clsica, en el MA la razn de la discrepancia no est en la opinin del autor sobre el
tema revisado, ya que pueden identificarse los pasos del proceso responsables de la diferencia. Pero el MA no est
exento de limitaciones.
Pese a la elevada calidad cientfica del diseo en el MA, ste puede ser menos convincente que un solo EC
aleatorizado, de gran tamao y de "alta calidad". Sin embargo, en la prctica, puede que no se haya hecho tal tipo de
estudio, lo que obliga a evaluar las publicaciones existentes. Adems, el tamao muestral o el tiempo necesario para
llevar a cabo un EC aleatorizado a gran escala puede ser prohibitivo. As pues, sigue en pie la cuestin de cundo los
resultados del MA son suficientes para resolver una controversia clnica y cundo se necesita un estudio prospectivo a
gran escala para obtener una respuesta definitiva.
Aunque los MA de EC tienen una larga tradicin y su metodologa sigue unos pasos sistematizados, su aplicacin a
estudios observacionales se ha consolidado tan slo en los ltimos aos. En el terreno metodolgico tambin son
objeto de debate el establecimiento de criterios de seleccin (inclusin/exclusin) de los artculos originales, el papel
que la calidad de los artculos originales debe tener en el MA, la seleccin de los modelos estadsticos ms apropiados
para la combinacin de los resultados y la interpretacin del MA cuando se presenta una marcada heterogeneidad de
los artculos originales.
Los procedimientos estadsticos descritos en el MA tienen por objeto sintetizar la informacin disponible en forma
eficiente, dando ms peso a aquellos estudios que proporcionan informacin ms precisa, al tiempo que se evala el
grado de discrepancia (heterogeneidad) de los resultados. Sin embargo existen mtodos de sntesis de resultados que
pueden llevar fcilmente a conclusiones errneas y cuyo uso se desaconseja: los mtodos basados en votaciones
(cada estudio representa un voto y se compara el nmero de estudios estadsticamente significativos a favor o en
contra de la hiptesis de estudio), los mtodos basados en la prueba del signo (que calcula el valor p de encontrar
estudios a favor de la hiptesis evaluada) y los mtodos basados en la combinacin de los resultados de pruebas
estadsticas (valores p).
Aunque en los MA los estudios combinados son del mismo tipo (normalmente EC aleatorizados y con menos
frecuencia estudios observacionales), existen propuestas ms recientes, con una clara visin integradora de los
distintos diseos de investigacin. Algunas de estas propuestas, como las denominadas "sntesis de estudios de
diseos cruzados" (cross design synthesis) y "mtodos del perfil de confianza" (confidence profile method), plantean la
combinacin de los resultados de estudios experimentales (EC) y no experimentales (realizados a partir de bases de
datos obtenidos por medio de sistemas electrnicos de registro de pacientes).
El punto fuerte de los EC es la aplicacin de la asignacin aleatoria y su principal limitacin su falta de potencial para la
generalizacin. Por otra parte, la principal ventaja de la base de datos de pacientes es la posibilidad de recoger
informacin sobre la prctica mdica en condiciones reales, mientras que su principal limitacin es la posible falta de
comparabilidad de los diferentes grupos de tratamiento. Parece lgico, entonces, que haya surgido un mtodo, la
sntesis de estudios con diseos cruzados, que propone, en una primera fase, mejorar la informacin obtenida a partir
de EC aleatorizados y de bases de datos de pacientes para, posteriormente, combinando sus resultados, aprovechar
las ventajas de cada uno de ellos y minimizar sus inconvenientes.

Sin embargo la sntesis de estudios con diseos cruzados es un metodologa compleja, lo que limitar su realizacin.
Otra alternativa es lo que se podra denominar "estudios aleatorizados en bases de datos", que es la aplicacin de la
asignacin aleatoria en la prctica clnica diaria, utilizando los nuevos sistemas electrnicos de registros de pacientes.
Se tratara de utilizar simultneamente "lo mejor" de los estudios experimentales y observacionales.
La prctica de la MBE (o pruebas) significa la integracin de la experiencia clnica individual con la mejor evidencia
externa clnica disponible obtenida mediante la investigacin sistemtica. Hasta ahora la mejor evidencia disponible era
la basada en los EC aleatorizados que medan la eficacia, pero no permitan medir lo que suceda en la prctica clnica,
que no es ms que una parte integrante de la efectividad. Si el camino iniciado por la Medicina Basada en la Evidencia
puede suponer un acercamiento de la investigacin a la medicina, la propuesta de estudiar los efectos de las
intervenciones mediante asignacin aleatoria en la prctica clnica permitira acercar la medicina a la investigacin y
empezar a hablar tambin de una efectividad basada en la medicina o, mejor an, de una Evidencia Basada en la
Medicina.

Anda mungkin juga menyukai