Anda di halaman 1dari 7

Estudios de precisin diagnstica (STARD)

y pronstica (REMARK)

Douglas G. Altmana y Patrick M.M. Bossuytb


a
Centre for Statistics in Medicine. Wolfson College. Oxford. Reino Unido.
b
Department of Clinical Epidemiology & Biostatistics. Academic Medical Center.
University of Amsterdam. Amsterdam. Pases Bajos.

Existen deficiencias manifiestas en la comunicacin de los estudios esta preocupacin ha generado una serie de iniciativas para
de investigacin, que abarcan todas las especialidades y todos los di- definir los aspectos que deben recogerse en la publicacin
seos. Aunque los ensayos clnicos efectuados con asignacin aleato- de un estudio.
ria han sido los que han recibido mayor atencin, han surgido preocu-
paciones similares en otros tipos de estudios, como los de carcter Hasta hace relativamente poco, las iniciativas para el esta-
diagnstico y epidemiolgico. blecimiento de recomendaciones respecto a la comunica-
Si el artculo publicado describe con suficiente detalle la metodologa cin de los estudios de investigacin se han referido, casi
aplicada en cada fase, el lector recibe suficiente informacin para de- exclusivamente, a los ensayos clnicos efectuados con asig-
cidir por s mismo sobre la solidez de los resultados obtenidos. El
fundamento cientfico del desarrollo de directrices sobre la comunica-
nacin aleatoria y control, sobre todo la Declaracin CON-
cin de los estudios de investigacin se basa en esta sencilla idea. SORT1. Sin embargo, la comunicacin de los resultados de
Las recomendaciones para las directrices sobre los informes de inves- cualquier otro tipo de investigacin mdica presenta defi-
tigaciones han evolucionado a lo largo de los aos, a travs de la pre- ciencias similares, de manera que varios grupos de estudio
paracin de una serie de directrices de comunicacin que se iniciaron han ampliado la idea del desarrollo de directrices de comu-
con los proyectos CONSORT y QUOROM en la dcada de los noventa.
En este artculo se describen las iniciativas desarrolladas para el esta- nicacin para abarcar tambin a estos otros tipos de estu-
blecimiento de directrices de comunicacin sobre los estudios de pre- dio. En este artculo se describen las distintas iniciativas
cisin de pruebas diagnsticas (STARD) y del valor pronstico de los para la elaboracin de directrices para la comunicacin de
marcadores tumorales (REMARK). los estudios relativos a la precisin de las pruebas diagnsti-
cas (STARD) y a los marcadores pronsticos (REMARK)
Palabras clave: Comunicacin de la investigacin. Directrices.
Diagnstico. Pronstico. STARD. REMARK.
Estudios relativos a la precisin de las pruebas
diagnsticas
Diagnostic (STARD) and prognostic (REMARK) studies
Contexto
Deficiencies in how research studies are reported are both well-docu-
mented and widespread across all medical specialties and study de- Durante las ltimas dcadas, el nmero de pruebas mdi-
signs. Although randomised trials have received the most attention in cas se ha incrementado de manera rpida, tanto en lo que
this regard, similar concerns have been expressed about reporting of se refiere a las nuevas pruebas como a la tecnologa de las
other types of research including diagnostic and epidemiological stu-
dies. pruebas ya introducidas, que mejoran de manera continua.
If a journal article describes in enough detail what was done at each Las pruebas mdicas no slo se utilizan para facilitar el
stage of a study, readers will have enough information to allow them diagnstico, sino tambin para la toma de decisiones res-
to decide on the merits of the results for themselves. From this sim- pecto al tratamiento, a la respuesta a ste y a la deteccin
ple idea comes the scientific rationale of developing guidelines on
how to report research.
de posibles trastornos subclnicos, as como para la deter-
Recommended processes to produce reporting guidelines have evol- minacin de la salud futura del paciente2,3.
ved over several years during the preparation of a sequence of repor- Al igual que ocurre con las nuevas tecnologas mdicas, las
ting guidelines starting with CONSORT and QUOROM in the 1990s. nuevas pruebas diagnsticas deben evaluarse con detalle
We describe initiatives to develop reporting guidelines for diagnostic antes de su introduccin en la prctica clnica. El proceso
accuracy studies (STARD) and tumour marker prognostic studies (RE-
MARK). riguroso de evaluacin de las pruebas diagnsticas antes de
su introduccin no slo reduce el nmero de consecuencias
Key words: Reporting research. Guidelines. Diagnosis. Prognosis. clnicas no deseadas, secundarias a las estimaciones err-
STARD. REMARK. neas de la precisin diagnstica de la prueba, sino que tam-
bin limita los costes sanitarios, ya que evita la realizacin
de pruebas innecesarias.
Por desgracia, la evaluacin de la precisin diagnstica de
Introduccin
las pruebas mdicas va con retraso respecto a la evaluacin
La comunicacin precisa y transparente de la investigacin de los tratamientos2,3. Los resultados exagerados y sesgados
se ha convertido en una cuestin cada vez ms relevante a que se obtienen en estudios diagnsticos mal diseados y
medida que se acumulan pruebas de que muchos de los pobremente comunicados dan lugar a una difusin antici-
estudios de investigacin publicados no ofrecen informacin pada del valor de las pruebas diagnsticas y hacen que los
clave respecto a su metodologa y sus resultados. A su vez, clnicos tomen decisiones teraputicas incorrectas. Adems,
es necesario tener en cuenta que los fondos de financiacin
Douglas G. Altman ha recibido una ayuda econmica de Cancer Research UK.
de la investigacin no suelen cubrir la realizacin de estu-
dios fundamentados en sntomas o pruebas diagnsticas.
Correspondencia: Dr. Douglas G. Altman
Centre for Statistics in Medicine. Wolfson College. En la evaluacin de las pruebas mdicas, tanto de las nue-
Linton Road, Oxford OX2 6UD, Reino Unido. vas como de las ya existentes, un paso esencial es el esta-
Correo electrnico: doug.altman@cancer.org.uk blecimiento de la precisin de la prueba diagnstica. En los

Med Clin (Barc). 2005;125(Supl. 1):49-55 49


ALTMAN DG, ET AL. ESTUDIOS DE PRECISIN DIAGNSTICA (STARD) Y PRONSTICA (REMARK)

estudios de precisin diagnstica, se comparan los resultados Working Group) de la propia Colaboracin Cochrane expuso
de una o ms pruebas con los obtenidos mediante la prueba la escasa calidad metodolgica y las deficiencias en la co-
diagnstica de referencia sobre el mismo grupo de pacientes en municacin de estudios de este tipo. El grupo consider
los que se considera que hay un proceso patolgico concreto. que el primer paso para corregir estos problemas era mejo-
El trmino prueba se refiere a cualquier mtodo utilizado rar la calidad de la comunicacin de los estudios diagnsti-
para obtener informacin adicional sobre el estado de salud cos. Entonces se constituyeron los Estndares para el Informe
de un paciente. Incluye la informacin conseguida a travs de Estudios de Precisin Diagnstica (STARD, Standards for
de la historia clnica, la exploracin fsica, las pruebas anal- Reporting of Diagnostic Accuracy), cuyo objetivo fue mejo-
ticas, de imagen, funcionales y el estudio anatomopatolgi- rar la calidad de la comunicacin de los estudios de preci-
co. La enfermedad objetivo o el proceso patolgico de inte- sin de pruebas diagnsticas. Tras el xito de la Declaracin
rs son un trastorno concreto, una fase de la enfermedad o CONSORT, el grupo STARD se propuso como objetivo el de-
cualquier otro proceso patolgico identificable que obligue a sarrollo de una lista de puntos que se deberan abordar en
acciones clnicas, como la realizacin de nuevas pruebas cualquier estudio relativo a la precisin de las pruebas diag-
diagnsticas o el inicio, la modificacin o la interrupcin de nsticas.
un tratamiento. En este contexto, la prueba diagnstica de El Comit de direccin STARD realiz una bsqueda detalla-
referencia se considera el mejor mtodo para establecer la da de la bibliografa y elabor una lista de 75 puntos posibles.
presencia o la ausencia de un proceso patolgico. La prueba Esta bsqueda se llev a cabo en las bases de datos Medline,
de referencia puede ser un mtodo nico o una combinacin Embase y BIOSIS, y en la base de datos metodolgica de la
de mtodos, y permite establecer la presencia de la enferme- Colaboracin Cochrane, hasta julio de 2000. Adems, los
dad objetivo. Puede ser una prueba analtica, un estudio de miembros del comit de direccin STARD examinaron las lis-
imagen o un estudio anatomopatolgico, pero tambin un tas de bibliografa de los artculos seleccionados, efectuaron
mtodo concreto de seguimiento clnico de los pacientes. El bsquedas en sus archivos bibliogrficos personales y esta-
trmino precisin se refiere al grado de concordancia entre blecieron contactos con otros expertos en el campo de la in-
la informacin ofrecida por la prueba diagnstica evaluada vestigacin diagnstica. Revisaron todas las publicaciones
(denominada prueba ndice) y la ofrecida por la prueba de relevantes y efectuaron una ampliacin de la lista de posi-
referencia. La precisin diagnstica se puede expresar de bles puntos.
muchas maneras, como los niveles de sensibilidad y especifi- Hay dos consideraciones generales que son tiles para de-
cidad, los cocientes de probabilidad, el cociente de posibili- terminar el contenido y el formato de la lista. En primer lu-
dades diagnsticas y el rea bajo la curva de eficacia diag- gar, el grupo STARD considera que el uso de una sola lista
nstica (ROC, receiver operator characteristic). tiene ms posibilidades de ser conocida y aceptada por au-
Hay varios factores que amenazan la validez interna y exter- tores, revisores y editores de revistas mdicas que el uso de
na de los resultados obtenidos en un estudio de precisin varias listas distintas. A pesar de que la evaluacin de una
diagnstica de una prueba. Algunos de estos factores se re- prueba de imagen es diferente de la evaluacin de una
lacionan con el diseo de este tipo de estudios, otros con la prueba analtica, estas diferencias pueden ser ms de for-
forma de seleccin de los pacientes, con el mtodo de reali- ma que de fondo. La segunda consideracin se refiere al
zacin de las pruebas o con el anlisis de los datos obteni- desarrollo de una lista dirigida especficamente hacia los es-
dos4. Un estudio basado en varios metaanlisis ha demos- tudios sobre la precisin de las pruebas diagnsticas. El
trado que la apreciacin excesivamente optimista de la grupo STARD no incluy aspectos generales en la comuni-
precisin de las pruebas diagnsticas puede deberse a di- cacin de los resultados de los estudios de investigacin,
versas deficiencias en el diseo de su estudio5. como las recomendaciones del documento de Requisitos de
El nmero de estudios relativos a la precisin de las prue- Uniformidad de los Originales Remitidos a las Revistas de
bas diagnsticas publicados es cada vez mayor, pero la cali- Biomedicina (Uniform Requirements for Manuscripts sub-
dad es, en general, escasa. En una encuesta relativa a los mitted to Biomedical Journals).
estudios de precisin diagnstica publicada entre 1978 y Posteriormente, el comit de direccin STARD, en una reu-
1993 en cuatro importantes revistas de medicina se demos- nin de consenso de 2 das de duracin (16 y 17 de sep-
tr que la calidad metodolgica de esos estudios era, como tiembre de 2001) en Amsterdam, y a la que fueron invitados
mucho, mediocre6. En encuestas ms recientes se han ob- expertos investigadores, editores, especialistas en metodolo-
servado deficiencias similares7. ga y organizaciones profesionales, evaluaron todos los temas
En esta revisin tambin se demostr que la publicacin de propuestos y elaboraron una lista final de 25 puntos.
los estudios no contena informacin esencial sobre puntos Adems, el grupo STARD desarroll un esfuerzo considera-
clave, como su diseo, sus mtodos de realizacin y los ble para el establecimiento de un diagrama de flujo relativo
anlisis de sus resultados. La ausencia de informacin clave a los estudios de precisin de las pruebas diagnsticas. Este
respecto al diseo y a la realizacin de los estudios diagns- diagrama de flujo informa sobre el mtodo de seleccin de
ticos ha sido confirmada por los autores de diversas revisio- los pacientes, el orden de realizacin de las pruebas y el
nes sistemticas (metaanlisis). ste es un problema impor- nmero de pacientes que deben evaluarse mediante la
tante, ya que la comunicacin completa y precisa permitira prueba ndice y la prueba de referencia. El diagrama de flu-
que el lector pudiera detectar los posibles sesgos que aque- jo comunica de manera transparente informacin clave res-
jan a un estudio, as como juzgar la posibilidad de generali- pecto al diseo de un estudio y el flujo de los participantes.
zacin y aplicacin de los resultados. Diversos grupos de usuarios potenciales evaluaron la primera
versin de la lista y del diagrama de flujo. Esta lista se ofreci
en el sitio web de CONSORT (www.consort-statement.org),
Desarrollo de directrices para la comunicacin
con una solicitud de comentarios. El grupo STARD recibi
de los estudios relativos a la precisin de las pruebas
comentarios y observaciones muy tiles durante las diversas
diagnsticas (Declaracin STARD)
fases de evaluacin, y elabor una lista final de puntos de
En la reunin de la Colaboracin Cochrane que tuvo lugar una sola pgina. La tabla 1 muestra la lista de directrices
en 1999 en Roma, el grupo de trabajo sobre mtodos diag- STARD, y la figura 1, un diagrama de flujo prototpico relati-
nsticos y pruebas de deteccin (Screening Test Methods vo a un estudio de precisin diagnstica.

50 Med Clin (Barc). 2005;125(Supl. 1):49-55


ALTMAN DG, ET AL. ESTUDIOS DE PRECISIN DIAGNSTICA (STARD) Y PRONSTICA (REMARK)

TABLA 1
Lista de elementos STARD para la publicacin de estudios relativos a la precisin diagnstica
Punto Informado en
Descriptor
n pgina nmero

Ttulo/Resumen/Palabras clave 1 Identifica el artculo como un estudio de precisin diagnstica (epgrafe MeSH
recomendado sensibilidad y especificidad)
Introduccin 2 Especifica los objetivos del estudio, como estimacin de la precisin diagnstica
o comparacin de la precisin entre distintos grupos
Mtodos
Participantes 3 Poblacin estudiada; criterios de inclusin y exclusin, contexto y centros en que
se obtuvieron los datos
4 Proceso de seleccin de los participantes: el proceso de seleccin estuvo fundamentado
en los sntomas iniciales, en los resultados obtenidos en pruebas previas o en el hecho
de que los participantes se hubiesen evaluado mediante la prueba ndice o
estndar de referencia?
5 Seleccin de los participantes: la poblacin de pacientes estudiada constituy una serie
consecutiva segn los criterios de seleccin de los puntos 3 y 4?
En caso negativo, especifique el mtodo de seleccin empleado
6 Recogida de los datos: se haba planificado antes (estudio prospectivo) o bien
despus (retrospectivo) de la realizacin de las pruebas ndice y de referencia?
Realizacin de la prueba 7 Prueba estndar de referencia y su fundamento
8 Especificaciones de carcter tcnico sobre materiales y mtodos para la realizacin
de las pruebas, incluyendo tipo, momento y referencias bibliogrficas
9 Definicin y fundamento de las unidades, valores umbral y categoras de los resultados
de las pruebas ndice y de referencia
10 Nmero y formacin de las personas que realizan las pruebas. Coste econmico
11 Especifique si los investigadores que interpretan todas las pruebas permanencen cegados.
Describa toda informacin clnica relevante
Mtodos estadsticos 12 Mtodos para el clculo o la comparacin de la precisin diagnstica y para cuantificar
la incertidumbre (p. ej., intervalos de confianza del 95%)
13 Si procede, mtodos para el clculo de la reproducibilidad y fiabilidad de la prueba
Resultados
Participantes 14 Fechas de realizacin del estudio, incluyendo las de comienzo y de finalizacin
de la recogida de datos
15 Caractersticas clnicas y demogrficas de los participantes en el estudio (p. ej., edad,
sexo, espectro de sntomas iniciales, comorbilidad, tratamientos actuales, centros)
16 Nmero de pacientes que cumplen los criterios de participacin en el estudio y que se
evalan o no mediante las pruebas ndice y de referencia; descripcin de las razones
por las que los pacientes no se evaluaron mediante alguna de estas pruebas
(se recomienda el uso de un diagrama de flujo)
Resultados de la prueba 17 Intervalos de tiempo transcurridos entre la realizacin de las pruebas ndice y estndar,
as como descripcin de cualquier tratamiento utilizado entre ambas
18 Descripcin de la gravedad de la enfermedad (definir los criterios) en los pacientes que
la presentan y descripcin de otros diagnsticos en aquellos que no la presentan
19 Tabla de resultados obtenidos con la prueba ndice (incluyendo los indeterminados
y los no obtenidos) segn los resultados de la prueba estndar. Para variables contnuas,
la distribucin de los resultados segn los valores del estndar de referencia
20 Todo evento adverso observado durante la realizacin de las pruebas
Estimaciones 21 Estimaciones de la precisin diagnstica y de la incertidumbre estadstica
(p. ej., intervalos de confianza del 95%)
22 Mtodos para considerar los resultados extremos o no determinados y los datos ausentes
23 Si procede, estimacin de la heterogeneidad de la precisin diagnstica entre grupos
de participantes, de investigadores o de centros
24 Si procede, estimacin de la reproducibilidad o fiabilidad de la prueba
Discusin 25 Discusin de la aplicabilidad clnica de los resultados del estudio

Publicacin la evidencia respecto a estos. Los documentos tambin se


La Declaracin STARD se public en los primeros ejempla- recogieron en varios sitios web, como el de Clinical Che-
res de 2003 de siete importantes revistas mdicas genera- mistry y el del grupo CONSORT.
les y de especialidad, como Annals of Internal Medicine, La publicacin de los documentos STARD se acompa de va-
Radiology, The British Medical Journal y Clinical Chemistry8, rios editoriales en los que se recomendaba su aceptacin por
y posteriormente en algunas otras revistas biomdicas. La parte de los editores de revistas y de los comits de revisin.
declaracin y la lista se acompaaban de un documento ex- En un estudio de evaluacin que ha finalizado recientemen-
plicativo9, en el que se exponan la significacin y el funda- te y que se ha referido a los estudios sobre la precisin de
mento de cada uno de los puntos, y se revisaba brevemente las pruebas diagnsticas publicados en 2000 (antes de la

Med Clin (Barc). 2005;125(Supl. 1):49-55 51


ALTMAN DG, ET AL. ESTUDIOS DE PRECISIN DIAGNSTICA (STARD) Y PRONSTICA (REMARK)

Nios con sospecha de apendicitis


n = 177

Enviados a casa Directamente al quirfano


n=4 n = 34

Apendicitis Sin apendicitis Apendicitis Sin apendicitis


n=0 n=4 n = 30 n=4

Ultrasonografa
n = 139

Enviados a casa Apendicectoma


n = 11 n = 20

Apendicitis Sin apendicitis Apendicitis Sin apendicitis


n=1 n = 10 n = 20 n=0

TCCR
n = 108

Enviados a casa Apendicectoma


n = 52 n = 31

Apendicitis Sin apendicitis Apendicitis Sin apendicitis


n=0 n = 52 n = 28 n=3

Admitidos para observacin


n = 25

Apendicitis Sin apendicitis


n = 24 n=1 Fig. 1. Diagrama de flujo prototpico
de un estudio de precisin diagns-
tica. TCCR: tomografa computari-
zada con contraste renal.

Declaracin STARD) y en 2004 (despus de la Declaracin Estudios sobre el valor pronstico de los marcadores
STARD) en revistas de gran impacto, se demuestra que la tumorales
calidad de la comunicacin en los artculos relativos a la
Contexto
precisin diagnstica ha mejorado tras la publicacin de la
Declaracin STARD, pero queda todava camino por reco- A lo largo de muchos aos, la publicacin de millares de estu-
rrer10. Como promedio, en los artculos publicados en 2004 dios sobre marcadores tumorales en oncologa ha culminado
se han recogido 14 de los 25 puntos esenciales de la lista. con la demostracin de la utilidad clnica real para slo unos
El grupo STARD tiene planificada la actualizacin de la pocos11. Los estudios iniciales sobre un marcador dan lugar, a
Declaracin STARD cuando aparezcan nuevas evidencias menudo, a resultados muy prometedores, pero en los estudios
sobre el origen de los sesgos o de la variabilidad. Si las re- siguientes sobre ese marcador o sobre otros marcadores rela-
vistas mdicas, los autores, los editores y los revisores cionados se obtienen conclusiones contradictorias o clara-
adoptaran con mayor inters tanto la lista de puntos como mente incongruentes con los prometedores resultados inicia-
el diagrama de flujo, mejorara la calidad de la publicacin les. Se han citado muchos problemas para explicar esta
de los estudios relativos a la precisin diagnstica de las discrepancia, como las diferencias metodolgicas, la baja cali-
pruebas para beneficio tanto de los clnicos como de los in- dad del diseo de los estudios, la variabilidad y la falta de defi-
vestigadores, los revisores, las revistas y la sociedad en ge- nicin de los criterios de participacin de los pacientes, y la
neral. inexistencia de posibilidades de reproducibilidad del estudio

52 Med Clin (Barc). 2005;125(Supl. 1):49-55


ALTMAN DG, ET AL. ESTUDIOS DE PRECISIN DIAGNSTICA (STARD) Y PRONSTICA (REMARK)

efectuado. Tambin puede haber un sesgo o una variabilidad El hecho de que hayan transcurrido dos aos antes de su
importantes de manera inherente al uso de muchos mtodos publicacin puede atribuirse a varios factores. El principal,
de determinacin distintos12. Los anlisis estadsticos inade- la intencin frustrada de desarrollar un documento con una
cuados son habituales, como los estudios en los que la poten- arquitectura similar a la de los documentos de las declara-
cia estadstica del mtodo utilizado es insuficiente y en los que ciones CONSORT y STARD9,24. Finalmente, se decidi la pu-
se obtienen resultados excesivamente optimistas respecto a la blicacin de las recomendaciones solas, antes de que sta
magnitud del efecto o el nivel de significacin a consecuencia se retrasara todava ms. El documento explicativo va a in-
de la realizacin de mltiples pruebas, anlisis de subgrupos cluir las justificaciones especficas de la necesidad de cada
u optimizacin de los valores umbral13-16. uno de los puntos contenidos en las recomendaciones. Ac-
Los lectores de las publicaciones de estos estudios necesitan tualmente, el documento conjunto est en fase de desarro-
saber con precisin qu es lo que se ha realizado, con objeto llo y se espera que sea publicado en 2006.
de que puedan juzgar la fiabilidad de los resultados. Por La tabla 2 muestra la lista de directrices REMARK, relativa a
desgracia, los estudios sobre marcadores tumorales presen- las recomendaciones para la publicacin de los estudios so-
tan una baja calidad de publicacin; muchos de los artculos bre marcadores tumorales. Los puntos especficos aparecen
publicados carecen de la informacin suficiente como para agrupados bajo epgrafes (Introduccin, Materiales y mto-
que el lector pueda valorar de manera adecuada los mto- dos, Resultados y Discusin) que reflejan las secciones de
dos utilizados o la posibilidad de generalizacin de sus resul- los artculos cientficos publicados.
tados. Las deficiencias en la publicacin de los estudios de Tal como se puede observar en el elemento 12, el diagrama
carcter pronstico (as como su heterogeneidad metodolgi- debe ser til para que sea posible determinar el nmero de
ca) quedan en evidencia a travs de las revisiones sistemti- participantes en cada una de las distintas fases de un estu-
cas de la bibliografa sobre marcadores o tumores malignos dio. Como mnimo, este diagrama debe incluir el nmero de
concretos17-22. Incluso la presentacin de los resultados rea- pacientes de la muestra original, el nmero de pacientes
les tiene generalmente una calidad muy baja18. que permanecen en el estudio tras la aplicacin de los crite-
Una recomendacin importante de la NCI-EORTC First In- rios de exclusin y el nmero de pacientes evaluados a tra-
ternational Meeting on Cancer Diagnostics (From Discovery vs de los anlisis uni y multivariados.
to Clinical Practice: Diagnostic Innovation, Implementation, Las directrices REMARK estn centradas, principalmente, en la
and Evaluation), celebrada en Nyborg, Dinamarca, en julio publicacin de los estudios de evaluacin de un nico marca-
de 2000, fue el desarrollo de directrices para la publicacin dor tumoral de inters, incluyendo a menudo su ajuste respec-
de los estudios relativos a los marcadores tumorales. En esa to a las variables pronsticas clnicas estndar. Estas directrices
reunin se consider que algunas de las barreras principa- son especialmente relevantes para los estudios en los que se
les para el progreso en esta rea eran la baja calidad del di- evala ms de un marcador, pero no abordan las consideracio-
seo y el anlisis de los estudios, la variabilidad en las prue- nes estadsticas relativas al desarrollo de modelos pronsticos
bas utilizadas y la comunicacin deficiente de los estudios. para un nmero elevado de marcadores candidato.
El subcomit de estadstica qued encargado de abordar los
problemas estadsticos relativos a las deficiencias en el dise- Publicacin y otras cuestiones
o y en el anlisis de los estudios sobre marcadores tumora-
Las recomendaciones REMARK se publicaron en septiem-
les pronsticos. Se acord que la prioridad deba ser la elabo-
bre de 2005 en cinco revistas de oncologa: British Journal
racin de un documento de directrices para la publicacin.
of Cancer, European Journal of Cancer, Journal of Clinical
Oncology, Journal of the National Cancer Institute25 y Nature
Desarrollo de directrices para la comunicacin Clinical Practice Oncology. Como ya se ha sealado, en ese
de los resultados obtenidos en estudios sobre el valor momento todava no se haba completado el documento ex-
pronstico de los marcadores tumorales (REMARK) plicativo complementario en el que se recogen la significa-
cin y el fundamento de cada uno de los puntos con una
Los 9 miembros del comit, pertenecientes a Estados Uni-
revisin breve de la evidencia respecto a stos; no obstante,
dos y a Europa, constituan un grupo heterogneo de clni-
se espera que este documento se publique lo antes posible.
cos, especialistas en estadstica y cientficos de laboratorio.
La lista de directrices REMARK se puede conocer a travs
Algunos de ellos realizaban editoriales para revistas de on-
de internet en la direccin http://www.cancerdiagnosis.nci.
cologa, pero ninguno era editor.
nih.gov/assessment/progress/clinical.html
Las ideas iniciales respecto a los puntos clave del documen-
Las directrices REMARK se desarrollaron especficamente
to de directrices se extrajeron a partir de la bibliografa so-
para su aplicacin en los estudios pronsticos sobre marca-
bre la evidencia emprica relativa a las deficiencias en la pu-
dores tumorales, aunque la mayor parte de las recomenda-
blicacin o a los mtodos de anlisis problemticos, las
ciones se pueden aplicar de la misma manera a los estudios
sugerencias previas relacionadas con la publicacin de es-
pronsticos de carcter general. Ciertamente, aunque estos
tos estudios y las diversas publicaciones de tipo educativo.
estudios son especialmente frecuentes en el mbito de la
Tambin se generaron ideas a travs de la revisin de las
oncologa, tambin son muy habituales en todas las ramas
directrices de publicacin similares elaboradas respecto a
de la medicina; en ambos casos, hay pruebas de la escasa
otros tipos de estudios de investigacin mdica, como los
calidad de los estudios pronsticos26,27.
documentos CONSORT1, QUOROM23 y STARD9. Tres de los
miembros de este grupo escribieron un primer borrador que
Comentarios
sirvi como base para la discusin de todo el grupo. Los co-
mentarios al borrador se realizaron a travs de una video- Los grupos STARD y REMARK se han fundamentado en los
conferencia de todo el grupo, y mediante numerosos inter- objetivos y procedimientos correspondientes al Grupo CON-
cambios por correo electrnico, pero no se llev a cabo SORT. Sin embargo, ha habido algunas diferencias entre
ninguna reunin presencial. Tras otras revisiones efectua- estos grupos, por ejemplo, en lo relativo a la falta de recurs-
das por el grupo y por expertos externos, la versin de fe- os o a la existencia de innovaciones de carcter genuino
brero de 2003 se remiti a todo el grupo para su comentario que podran influir en la forma con que se lleve a cabo la
final. prxima revisin CONSORT.

Med Clin (Barc). 2005;125(Supl. 1):49-55 53


ALTMAN DG, ET AL. ESTUDIOS DE PRECISIN DIAGNSTICA (STARD) Y PRONSTICA (REMARK)

TABLA 2
Recomendaciones para la publicacin de los estudios realizados sobre el valor pronstico de los marcadores tumorales
(REMARK, REporting recommendations for tumour MARKer prognostic studies)25
Punto Desriptor Informado en
n pgina nmero
Introduccin 1 Indique el marcador evaluado, los objetivos del estudio y cualquier hiptesis preespecificada
Mtodos 2 Describa las caractersticas (p. ej., fase de la enfermedad, cuadros de comorbilidad)
Participantes de los pacientes que participan en el estudio
3 Describa los tratamientos aplicados y las razones de su aplicacin
(p. ej., asignacin aleatorizada o sistemtica)
Caractersticas de la muestra 4 Describa los materiales biolgicos utilizados (incluyendo los controles), as como los mtodos
de conservacin y almacenamiento
5 Especifique el tipo de ensayo utilizado y aporte (o cite) un protocolo detallado, incluyendo
reactivos o dispositivos, procedimientos de control de calidad, evaluaciones de la reproducibilidad,
los mtodos cuantitativos y protocolos de evaluacin y publicacin de los resultados.
Especifique si las determinaciones se efectuaron manteniendo enmascarada la variable respuesta

Diseo del estudio 6 Especifique los mtodos de seleccin de pacientes (prospectivo o retrospectivo) y los de estratificacin
o apareamiento empleados (p. ej., segn la fase de la enfermedad, la edad, etc.).
Especifique el perodo de seleccin de los casos, la fecha final y el tiempo de seguimiento medio
7 Defina con precisin todos los criterios de valoracin clnica evaluados
8 Especifique todas las variables inicialmente evaluadas o consideradas para su inclusin
en los modelos
9 Justifique el tamao de la muestra. Si el estudio fue diseado para detectar cierto tamao
del efecto, cuantifquelo y describa la potencia deseada
Anlisis estadstico 10 Especifique los mtodos estadsticos, incluyendo los criterios de seleccin de variables
en la elaboracin de modelos, los mtodos de valoracin de las premisas implcitas
y el control de los datos ausentes
11 Especifique cmo han sido tratados los marcadores. Si es relevante, describa los mtodos
utilizados para determinar los valores umbral (cutpoint)
Resultados 12 Describa el flujo de pacientes (puede ser til un diagrama), incluyendo el nmero que particip
Datos en cada fase y las razones para el abandono del estudio. Mencione el nmero de pacientes
evaluados y el nmero de episodios detectados tanto en conjunto como en cada subgrupo
13 Describa las variables demogrficas (al menos edad y sexo) y pronsticas de la enfermedad
estudiada, as como el marcador tumoral. Incluya las cifras de datos ausentes
Anlisis y presentacin 14 Muestre la relacin entre el marcador y las variables pronsticas
15 Presente anlisis univariados entre el marcador y la respuesta, mostrando la relacin y el efecto
estimado (p. ej., riesgo relativo y probabilidad de supervivencia). En lo posible, aporte anlisis
similares en todas las variables evaluadas. Para la relacin entre el marcador tumoral
y una variable de tipo tiempo hasta..., se recomienda el uso de curvas de Kaplan-Meier
16 Sobre los anlisis multivariados ms importantes, presente los efectos estimados
(p. ej., riesgo relativo) con sus intervalos de confianza entre el marcador y las restantes
variables, al menos, las del modelo final
17 Con independencia de su significacin, aporte los efectos estimados y sus intervalos
de confianza en un anlisis que considere todas las variables pronsticas estndar
18 Si procede, informe del anlisis de las premisas, sensibilidad y validez interna
Discusin 19 Interprete los resultados de acuerdo con las hiptesis preespecificadas y las resultantes
de otros anlisis exploratorios
20 Discuta el valor clnico de los resultados y las implicaciones para la investigacin futura

Es destacable el hecho de que las directrices de estos dos REFERENCIAS BIBLIOGRFICAS


grupos, as como de CONSORT, QUOROM y otros, han ne- 1. Moher D, Schulz KF, Altman D. The CONSORT statement: revised re-
cesitado aos desde su inicio hasta su realizacin. Los in- commendations for improving the quality of reports of parallel-group ran-
domized trials. JAMA. 2001;285:1987-91.
tentos de mejora de la calidad de las publicaciones son im- 2. Guyatt GH, Tugwell PX, Feeny DH, Haynes RB, Drummond M. A frame-
portantes, pero a menudo son procesos lentos. work for clinical evaluation of diagnostic technologies. CMAJ. 1986;134:
Como ya se ha sealado, las directrices de publicacin 587-94.
3. Knottnerus JA, Muris JW. Assessment of the accuracy of diagnostic
como las sealadas en este artculo no representan algo fijo, tests: the cross-sectional study. J Clin Epidemiol. 2003;56:1118-28.
sino que deben revisarse peridicamente a la vista de las 4. Whiting P, Rutjes AW, Reitsma JB, Glas AS, Bossuyt PM, Kleijnen J.
nuevas evidencias. Esperamos que ambas directrices sean Sources of variation and bias in studies of diagnostic accuracy: a syste-
revisadas en los aos venideros. matic review. Ann Intern Med. 2004;140:189-202.
5. Lijmer JG, Mol BW, Heisterkamp S, Bonsel GJ, Prins MH, Van der Meu-
len JH, et al. Empirical evidence of design-related bias in studies of diag-
nostic tests. JAMA. 1999;282:1061-6.
Agradecimientos 6. Reid MC, Lachs MS, Feinstein AR. Use of methodological standards in
Las declaraciones STARD y REMARK no se podran haber publica- diagnostic test research. Getting better but still not good. JAMA.
1995;274:645-51.
do sin el importante esfuerzo realizado por muchas personas, espe- 7. Smidt N, Rutjes AW, Van der Windt DA, Ostelo RW, Reitsma JB, Bossuyt
cialmente por las que aparecen en las listas de autores de las pu- PM, et al. Quality of reporting of diagnostic accuracy studies. Radiology.
blicaciones. 2005;235:347-53.

54 Med Clin (Barc). 2005;125(Supl. 1):49-55


ALTMAN DG, ET AL. ESTUDIOS DE PRECISIN DIAGNSTICA (STARD) Y PRONSTICA (REMARK)

8. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, 18. Riley RD, Abrams KR, Sutton AJ, Lambert PC, Jones DR, Heney D, et al.
et al. Towards complete and accurate reporting of studies of diagnostic Reporting of prognostic markers: current problems and development of
accuracy: the STARD initiative. Clin Chem. 2003;49:1-6. guidelines for evidence-based practice in the future. Br J Cancer.
9. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, 2003;88:1191-8.
et al. The STARD statement for reporting studies of diagnostic accuracy: 19. Riley RD, Heney D, Jones DR, Sutton AJ, Lambert PC, Abrams KR, et al.
explanation and elaboration. Clin Chem. 2003;49:7-18. A systematic review of molecular and biological tumor markers in neuro-
10. Smidt N, Rutjes AWS, Van der Windt DAWM, Ostelo RWJG, Reitsma JB, blastoma. Clin Cancer Res. 2004;10:4-12.
Bossuyt PM, et al. Does the STARD Statement improve the quality of re- 20. Burton A, Altman DG. Missing covariate data within cancer prognostic
porting of diagnostic accuracy studies? Fifth International Congress on studies: a review of current reporting and proposed guidelines. Br J Can-
Peer Review and Biomedical Publication. Chicago: September 16-18 cer. 2004;91:4-8.
2005. 21. Popat S, Matakidou A, Houlston RS. Thymidylate synthase expression
11. Schilsky RL, Taube SE. Tumor markers as clinical cancer tests are we and prognosis in colorectal cancer: a systematic review and meta-analy-
there yet? Semin Oncol. 2002;29:211-2. sis. J Clin Oncol. 2004;22:529-36.
12. McShane LM, Aamodt R, Cordon-Cardo C, Cote R, Faraggi D, Fradet Y, 22. Brundage MD, Davies D, Mackillop WJ. Prognostic factors in non-small
et al. Reproducibility of p53 immunohistochemistry in bladder tumors. cell lung cancer: a decade of progress. Chest. 2002;122:1037-57.
National Cancer Institute, Bladder Tumor Marker Network. Clin Cancer 23. Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF. Improving
Res. 2000;6:1854-64. the quality of reports of meta-analyses of randomised controlled trials:
13. Altman DG, Lausen B, Sauerbrei W, Schumacher M. Dangers of using the QUOROM statement. Quality of Reporting of Meta-analyses. Lancet.
optimal cutpoints in the evaluation of prognostic factors. J Natl Cancer 1999;354:1896-900.
Inst. 1994;86:829-35. 24. Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al.
14. Simon R, Altman DG. Statistical aspects of prognostic factor studies in The revised CONSORT statement for reporting randomized trials: expla-
oncology. Br J Cancer. 1994;69:979-85. nation and elaboration. Ann Intern Med. 2001;134:663-94.
15. Biganzoli E, Boracchi P, Marubini E. Biostatistics and tumor marker stu- 25. McShane LM, Altman DG, Sauerbrei W, Taube SE, Gion M, Clark GM.
dies in breast cancer: design, analysis and interpretation issues. Int J Reporting recommendations for tumor marker prognostic studies (RE-
Biol Markers. 2003;18:40-8. MARK). J Natl Cancer Inst. 2005;97:1180-4.
16. Hall PA, Going JJ. Predicting the future: a critical appraisal of cancer 26. Marx BE, Marx M. Prognosis of idiopathic membranous nephropathy: a
prognosis studies. Histopathology. 1999;35:489-94. methodologic meta-analysis. Kidney International. 1997;51:873-9.
17. Mirza AN, Mirza NQ, Vlastos G, Singletary SE. Prognostic factors in 27. Carson CA, Fine MJ, Smith MA, Weissfeld LA, Huber JT, Kapoor WN.
node-negative breast cancer: a review of studies with sample size more Quality of published reports of the prognosis of community-acquired
than 200 and follow-up more than 5 years. Ann Surg. 2002;235:10-26. pneumonia. J Gen Intern Med. 1994;9:13-9.

Med Clin (Barc). 2005;125(Supl. 1):49-55 55

Anda mungkin juga menyukai