BIOMDICA
1 Esta traduccin del artculo A classification for biomedical research reports (The Nau EngfandJournal ojMedmne
1984; 311(23):1482- 1487) se publica con autorizacin de la revista y de los autores. El trabajo original fue realizado
con financiacin procedente de un fondo (RF 79026) de la Fundacin Rockefeller.
2 Los autores pertenecen al Departamento de Bioestadstica de la Escuela de Salud Pblica de Harvard y al Departamento de lsiqulatra de la Escuela de Medicina de Harvard y el Hospital General de Massachusetts, Boston,
Massachusetts. Las separatas de la versin original en ingls pueden solicitarse al Dr. Bailar, ala siguiente diiectin: Department of Biostatistics, Harvard School of Public Health, 677 Huntington Ave., Boston, MA 02115, Estados
Unidos de Amrica.
Una clasificacin de informes de investigacin basada en los aspectos relativos a la inferencia cientfica tiene varias clases de usos. En primer lugar,
puede llamar la atencin, incluso de los lectores avezados, respecto a aspectos crticos
de la investigacin en campos de la literatura cientfica que les sean poco familiares. Por
ejemplo, un epidemilogo entiende bien las implicaciones que tiene usar un mtodo de
cohorte en vez de un mtodo de casos y controles, pero puede que no ocurra lo mismo
con alguien especializado en enfermedades metablicas que tiene que usar resultados
epidemiolgicos. En segundo lugar, tiene un aspecto didctico para personas que no
estn familiarizadas con el alcance, la potencia y las fallas potenciales de los distintos
procedimientos cientficos. En tercer lugar, la clasificacin puede favorecer una notificacin ms completa de los componentes principales del plan de la investigacin. Adems, una clasificacin puede poner de manifiesto caractersticas no sospechadas de los
estudios o de los datos, que echen luz sobre problemas habituales expuestos de forma
ambigua. Por ejemplo, nuestra clasificacin ya se ha utilizado para determinar la prevalencia de uso de varios procedimientos estadsticos (4), para aislar y estudiar las investigaciones prospectivas con intervenciones deliberadas (5-8) (categorfa IA1 del cuadro 1) y para seleccionar un subconjunto de estaspara un estudio de calidad de notificacin
(9). Nuestra deteccin de estudios seudolongitudinales surgi de esta manera; y esos
estudios parecen no haber sido discutidos anteriormente como clase general. Por ltimo, una clasificacin puede usarse para determinar la frecuencia relativa de distintos
diseos en el tiempo o en los distintos campos de la medicina. La informacin puede
ser til para identificar la subutilizacin de mtodos poderosos de investigacin, para
evaluar y mejorar la situacin en las diversas especialidades mdicas o zonas geogrficas, para asesorar en la seleccin de revistas a bibliotecas y otras entidades que compran
en gran cantidad y para llevara cabo estudios bibliomtricos y cliomtricos sobre la evolucin de las nuevas ciencias mdicas.
MTODOS
La clasificacin que aqu se presenta surgi al estudiar los 332 informes de investigacin publicados en la seccin de articulos originales del NezuEngland
]ournal of Medicine durante 1978y 1979. Cada articulo original fue revisado y asignado a
una categorfa general de un esquema inicial muy sencillo. Luego, cada articulo fue estudiado, clasificado, reestudiado y reclasificado por otros lectores sobre la base de un
esquema de clasificacin que se desarroll gradualmente, con la intencin de agrupar
artculos con componentes similares de inferencia cientfica, independientemente de la
enfermedad estudiada, la especialidad mdica o el contexto de investigacin.
Al menos tres de los autores clasificamos independientemente cada
trabajo en cada vuelta. Despus de cada ronda de clasificacin examinamos los grupos
de artculos con varios objetivos: evaluar y posiblemente redefinir los lfmites de cada
categotia; identificar subgrupos de trabajos que podran ser utilizados en el nivel siguiente, ms detallado, de la clasificacin; y detectar problemas de la clasificacin cuya
resolucin pudiera clarificar conceptos o aspectos importantes. Este proceso se repiti
muchas veces durante varios meses hasta que consideramos que se haba llegado a cierto
537
equilibrio y que podrfa haber pocos cambios importantes ulteriores tanto en el esquema
de clasificacin mismo como en nuestra categorizacin de los trabajos individuales.
Abordamos todo el proceso con el propsito consciente de permitir que los materiales
del estudio determinaran la clasificacin, de manera que se evitaran los prejuicios basados en otros estudios o en nuestros conocimientos comunes respecto a la estructura
de la investigacin cientfica.
538
s En este artculo son frecuentes las expresiones inglesas que no tienen una traduccin
se dan los trminos ingleses originales entre parntesis (IV. del t.).
bien establecida.
Por ello
CLASIFICACIN
539
CUADRO1. Clasificacin de 332 trabajos como artlculos originales en The New England
of Medicine, 1978- 1979
Juma/
540
lo que se examina es el cambio de uso a lo largo del perodo, quiz como resultado de
alguna actividad educativa o de otro tipo.) En nuestra muestra, la mayor parte de los
estudios de laboratorio de mecanismos biolgicos fueron estudios transversales, mientras que la mayor parte de los estudios de efectos de factores externos sobre seres humanos (como el tratamiento de la enfermedad) fueron estudios longitudinales.
Hay que reconocer que en muy pocos informes de investigacin
faltan elementos de cambio durante el perodo de observacin, de manera que decidir
entre las categoras longitudinal y transversal a veces puede ser difcil si el fenmeno
estudiado tiene una dimensin temporal importante. Lo esencial es la diferencia entre
el cambio utilizado solamente como instrumento en el estudio (transversal) y el cambio
como objeto del estudio (longitudinal). Cuando se entiende esta idea, casi todos los problemas para decidir si un trabajo es longitudinal o transversal disminuyen o desaparecen. Por ejemplo, una prueba de tolerancia a la glucosa implica cambios durante un perodo de varias horas, pero si la tolerancia ala glucosa se usa para determinar la prevalencia
de diabetes entre las personas que trabajan con una sustancia txica, el estudio ser
transversal en nuestro esquema; el objeto real de estudio es la prevalencia de enfermedad, no el ascenso y disminucin de la glucemia a lo largo del tiempo. A veces puede
usarse el mismo conjunto de datos para ambos propsitos, pero encontramos pocos
ejemplos de esa dualidad en los 332 artculos que examinamos.
La dicotoma longitudinal-transversal especifica consideraciones
clave de diseo, realizacin y anlisis. Generalmente, los diseos longitudinales exigen
seguimiento de los pacientes, registro de los sucesos que tienen lugar y anlisis de una
serie de determinaciones. Estas caractersticas son menos importantes en los estudios
transversales, de manera que otras clases de problemas -errores de medicin, interpretacin de los efectos transitorios y definiciones de estados de enfermedad- adquieren mayor inters.
5 Case-control studies en el original. Esta expresin tambin puede traducirse como estudios
A veces se ve tambin traducida de forma demasiado literal como estudios caso-control
controlados (N. del t.).
de casos y testigos.
o estudios de casos
541
Como ejemplos de seleccin muestral basada en variables de entrada pueden citarse los clsicos estudios de seguimiento de tratamientos (con variables
de salida determinadas luego durante un perodo variable de minutos a aos); los estudios a corto plazo de tasas de mortalidad poblacional (como los destinados a elaborar
tablas nacionales de mortalidad, en los que las personas son observadas individualmente durante un breve perodo pero su experiencia agregada se usa para crear sntesis
a largo plazo en aspectos tales como la esperanza de vida); y el uso de registros antiguos
para definir (hoy) una cohorte completa de personas cuya evolucin puede seguirse desde
algn momento en el pasado. As, un estudio de cohorte de 20 aos puede idearse, llevarse a cabo y completarse en meses cuando se dispone de los tipos adecuados de registros. Por ejemplo, la determinacin de las tasas de incidencia de cncer entre 1955y
1975del personal militar que se saba haba sido expuesto en 1952a radiacin ionizante
por explosiones atmicas puede llevarse a cabo como estudio de cohorte, incluso inicindolo en 1982. Por supuesto, la calidad de los datos disponibles para estudios de cohorte puede plantear problemas cuando se intenta basar la investigacin en informacin recopilada hace aos, y con otros fines.
La distincin entre cohorte y casos y controles, tal como nosotros y otros usamos estas expresiones, es a veces confusa porque en los estudios de
cohorte se usan a veces controles apareados (matchedccrztrols),aunque el apareamiento
no se basa en la variable de salida. Por ejemplo, podramos hacer un grupo con todos
los pacientes que tuvieron, digamos, litiasis biliar y fueron vistos en cierto hospital desde
1950, seleccionar controles apareados por el momento del diagnstico de esa dolencia
(y quiz otras variables) y comparar el nmero de infartos de miocardio en ambos grupos desde aquel momento hasta el presente. En un estudio as se comparan casos con
controles apareados a ellos, pero el estudio se clasifica como de cohorte porque la seleccin se basa en la presencia (casos) o en la ausencia (controles) de litiasis biliar, no en el
resultado final (la incidencia de infartos miocrdicos).
Un estado de enfermedad u otra caracterstica o aspecto que determine la elegibilidad para el estudio tanto de los casos como de los controles no debe
confundirse con una variable de entrada o de salida. Por ejemplo, en una comparacin
de tratamientos para la diabetes, la diabetes no es una variable de entrada ni de salida
sino que, por el contrario, define el universo del estudio. Parece que los autores tienen
dudas a veces respecto a este tema, especialmente en estudios observacionales prospectivos con comparaciones entre subgrupos de pacientes (pertenecientes a la categora
L42), en los que estar sometidos aun tratamiento determinado es una condicin de admisin. A veces los investigadores intentan usar los datos para evaluar ese tratamiento,
lo cual no es adecuado.
543
Estudios seudolongitudinales
544
Usamos el trmino seudolongitudinal para referirnos a investigaciones que de hecho fueron transversales, aunque los investigadores trataron los datos como si el estudio fuera longitudinal. Llamaremos a esos estudios seudoprospectivos o seudon-etrospectivos porque, aunque todos los datos fueron recogidos en un mismo
momento, los conceptos subyacentes de anlisis e inferencia eran esencialmente los
mismos que en los estudios habituales de casos y controles. Un ejemplo de estudio seudorretrospectivo es un informe sobre la relacin entre la toxicidad por plomo y los problemas de comportamiento escolar (26), en el que los investigadores utilizaron las concentraciones de plomo en los dientes deciduales (perdidos aproximadamente en el
momento en el que se recogan los datos sobre comportamiento) para inferir las exposiciones a plomo en la niez (cuando se formaron los dientes).
La caracterstica definidora de este y otros estudios seudolongitudinales es que los datos se recogieron durante un perodo de tiempo tan breve que ocurrieron cambios escasos o muy poco relevantes, y a partir de esos datos los autores infirieron los valores de una o varias variables de entrada en un momento del pasado.
No se plantean problemas respecto a variables tales como el sexo
y la raza (que no cambian) y la edad (que cambia de manera conocida). Los estudios
basados en inferencias tan slidamente basadas como estas no los clasificamos como
seudolongitudinales. Sin embargo, cuando los investigadores hacen suposiciones
similares respecto a otras clases de variables, el pasado puede ser mucho menos
cierto. Aqu se han considerado seudolongitudinales los estudios basados en datos referentes al pasado y al presente obtenidos de un cuestionario aplicado en un momento
determinado.
En ciertos aspectos, los estudios seudolongitudinales pueden ser
considerados transversales, o quiz sea mejor considerarlos una categora en s mismos. Tras considerar este tema cuidadosamente, decidimos agruparlos con los estudios
longitudinales, porque en todos los casos que encontramos, la intencin del investigador, los mtodos de anlisis y, por tanto, los temas cientficos son los de un estudio longitudinal. El mtodo implcito de seleccin muestra1 sigui determinando si un estudio
era seudoprospectivo o seudorretrospectivo. En el primero, los individuos se admiten
al estudio basndose en variables de entrada predeterminadas, mientras que en los segundos lo determinante son variables finales (conocidas).
Informes transversales
Los estudios transversales se dividieron en tres categoras: los que
se centran en la descripcin de nuevas entidades patolgicas, los que evalan mtodos
de diagnstico o estadiaje y los que estudian procesos patolgicos y sus mecanismos.
Aqu tambin los aspectos de inferencia cientfica parecieron ir paralelos a los aspectos
generales del tema de estudio.
Encontramos 26 artculos originales que describan nuevas enfermedades o variantes de enfermedades y nos sorprendimos al ver que 15 de los 26 eran
al parecer descriptivos de enfermedades familiares. Encontrar tantos estudios sobre enfermedades familiares en una revista mdica general parece indicar que se necesitan
perspectivas generales y artculos de revisin, como las revisiones recientes sobre teraputicas (5-8), tanto de la prctica actual como de los criterios deseables para investigar y notificar enfermedades familiares.
La coleccin de 34 artculos sobre la presencia y gravedad de la enfermedad (diagnstico y estadiaje) incluy 6 que establecan intervalos de valores
normales para diversas mediciones fsicas y de laboratorio; los otros 28 eran de entomos
muy diversos.
El grupo final de 70 artculos incluy 19 sobre observaciones de
procesos patolgicos especficos, otros 35 en los que se intentaba investigar y explicar
tales procesos, y 16 sobre investigaciones ms detalladas de uno ovarios pacientes con
trastornos de especial inters (informes de casos).
INTENCIN
DEL
INVESTIGADOR
545
546
Dos ejemplos ilustran la importancia de la intencin del investigador incluso en el primer nivel de la clasificacin, donde se agrupan los estudios longitudinales por un lado y los transversales por otro. El primero es un informe en el que
cierta caracterfstica de la enfermedad se relacionaba con el pronstico (29). Un estudio
de este tipo es longitudinal si el principal objetivo del autor fue mejorar la prediccin de
la evolucin de casos especficos. Sin embargo, si los mismos datos e idnticos mtodos
analfticos se vieran primariamente como definidores de categoras de enfermedad previamente no conocidas pero relevantes, el estudio serfa transversal.
El segundo ejemplo es un informe sobre tcnicas para detectar antes de su aparicin clnica usual recidivas tumorales en pacientes tratados de cncer (20).
Esta clase de informe deberfa considerarse longitudinal si se interesa en la relacin entre
deteccin precoz de las recidivas y resultado final (jtiene la deteccin alguna ventaja
para el paciente?) o transversal si se centra en las evaluaciones continuadas de la exactitud diagnstica del procedimiento. Si se considera longitudinal, hay que valorar en el
estudio el manejo de ciertos sesgos en la evaluacin del impacto de diagnsticos anteriores (los habitualmente denominados sesgo de duracin (Zengthbius) y sesgo de
tiempo de ganancia (Ie&-time bks) (21-23)), temas que tendran una menor importancia relativa en un estudio transversal.
La clasificacin de algunos de los estudios seudoprospectivos y
seudorretrospectivos fue difcil porque hay cierta superposicin entre esos artculos y
los artculos transversales habituales. Como est implicado un juicio individual, tuvimos que hacer lo mejor que pudimos para interpretar la intencin de los autores. Tambin haba algunos artculos claramente seudo-X, pero no estaba claro qu era X.
Los hemos puesto de manera algo arbitraria en un grupo u otro segn lo que pareciera
la intencin dominante de los autores respecto a la interpretacin, no al muestreo.
Nuestro sistema de clasificacin se desarroll basndose en una
sola clase de informes de investigacin, los publicados como artculos originales en 7he
New England Journal ofMedicine durante un bienio reciente. Pensamos que debera ser
aplicable en general a los estudios de laboratorio, clnicos o epidemiolgicos en sujetos
humanos, aunque las frecuencias relativas de los diversos tipos de estudios probablemente variarn mucho respecto a los aqu mencionados. Pensamos que el sistema tambin puede ser relevante para los informes de investigacin en educacin, sociologa o
economa, por ejemplo. Es claramente inadecuado para muchos artculos importantes,
como revisiones sobre los conocimientos actuales de un tema, informes sobre nuevos
mtodos de educacin mdica o anlisis de temas actuales de poltica mdico-sanitaria.
No hemos llevado a cabo un estudio formal de la reproducibilidad
de nuestro desarrollo de la estructura misma (lo que habra requerido grupos independientes de investigadores desarrollando clasificaciones de novo) ni de la clasificacin de
los artculos individuales en la estructura, pero pensamos que esquemas similares tenderfan a traer a la luz aspectos similares de inferencia estadstica. Como en algunos casos fue necesario hacer juicios subjetivos, otros podran no haber aplicado la clasificacin de la misma manera que nosotros y no haber agrupado los 332 trabajos en las mismas
ramas terminales del rbol clasificatorio que nosotros. Esto es as en parte porque en
algunos casos faltaba informacin esencial en el informe publicado y distintos lectores
podrfan interpretar la informacin incompleta de diferentes maneras. Tambin se debe
en parte al hecho de que el sistema de clasificacin se desarroll para ser aplicado como
un todo, no paso a paso, y los usuarios no experimentados en su uso podran no tener
en cuenta todos los matices clasificatorios en el momento en que tuvieran que clasificar
un trabajo determinado. No pensamos que estos interrogantes no resueltos respecto a
la reproducibilidad sean importantes.
Dentro de su campo de aplicacin, el sistema de clasificacin requiere el conocimiento de ciertos aspectos que los lectores necesitarn de todas formas
para comprender la naturaleza e implicaciones de una investigacin. Un estudio que no
pueda ser clasificado en nuestro esquema o en un esquema similar probablemente
ha sido objeto de un informe incompleto. Recomendamos que los autores revisen cada
manuscrito antes de enviarlo a publicacin para asegurar que no se omiten aspectos
esenciales.
Para acabar diremos que, en nuestra opinin, el presente trabajo
(a pesar de que no aparece como articulo original) es anlogo a un estudio transversal,
descriptivo del diagnstico (intervalos de valores normales), en el que las unidades bsicas de estudio son trabajos publicados, no pacientes, roedores o muestras de suero.
REFERENCIAS
1. Feinstein AR. CIinicaI biostatistics. XLIV A survey of the research architecture
tions in general medical journals. Clin Pharwzrcol Ther 1978; 24:117-25.
2. Fletcher RH, FIetcher SW. CIinicaI research in general medical journals: a 3Gyear perspective.
N En@] Med 1979; 301:180-3.
3. Makrides L, Richman J. Writing the research proposal. In Research methodology
statistics: a sevenpart senes. P&siofher Can 1981; 33:163-g.
and applied
4. Emerson JD, Colditz GA. Use of staiistical analysis in The New EnglandJoutxal OfMedicine. N Engl]
Med 2983; 309:709-13.
5. Lavori PW, Louis TA, Bailar JC III, Polansky M. Designs for experiments treatment. N Eng/ ] Med 1983; 309:1291-9.
paraBe comparisons of
6. Louis TA, Lavori PW, Bailar JC III, Polansky M. Crossover and self-controIIed
research. N ErzglJ Med 1984; 310:24-31.
designs in cI.inicaI
7. Bailar JC III, Louis TA, Lavori PW, Polansky M. Studies without internaI controls. N Engl J Med 1984;
311:156-62.
8. Louis TA, Bailar JC III, Lavori PW. Experimental designs for cIinicaI investigations. In: Lemberger
L, Reidenberg MM, eds. Proceedmgsof fhe Second World Confererzceon Clinicul Pharmacology and lkrapartics, Washmgfon, D.C., ]tdy31-August.5,2983. Bethesda, Md. Ameritan Society for Pharmacology
and Experimental Therapeutics, 1984~19-30.
9. DerSimonian R, Charette LJ, McPeek B, MosteIIer E Reporting on methods in cIinicaI trials. N Engl
] Med 1982; 3061332-7.
10. Diamond GA, Forrester JS. AnaIysis of probability
artery disease. N En@] Med 1979; 300:1350-8.
11. Horwitz RI, Feinstein AR. AItemative analytic methods for case-control studies of estrogens and
endomehial cancer. N Engl J Med 1978; 299:1089-94.
12. White C, Bailar JC III. Retrospective and prospective methods of studying association in medicine.
Am J Public lfenlth 1956; 46:35-44.
13. Feinstein AR, WeIIs CK. Randomized iriaIs VS.historicaI controls: the scientific plagues of both houses.
Trans Assoc Am Phyiciuns 1977; 90:239-44.
14. Foster RS Jr, Lang SE Costanza MC, Worden JK, Haines CR, Yates JW Breast self-examination
practices and breast-cancer stage. N Engl] Med 1978; 299:265-70.
547
15. Greenwald P, Nasca PC, Lawrence CE, et al. Estimated effect of breast self-examination
physician examinations on breast-cancer mortality. N Engl] Med 1978; 299271-3.
and routine
16. NeedIeman HL, Gunnoe C, Leviton A, et al. Deficits in psychologic and classroom performance of
children with elevated dentine lead levels. N Engl J Med 1979; 300:689-95.
17 Gugler R, Lindstaedt H, Miederer S, et al. Cimetidine for anastomotic ulcers after partial gastrectomy: a randomized controIIed trial. N Eng2]Med 1979; 301:1077-80.
18. Ingelfinger JA, MosteIIer E Thibodeau LA, Ware JH. Biostatistics in cIinica1 medicine. New York:
MacmiIIan. 1983.
19. BIoomBeId CD, GajI-Peczalska KJ, Fiizera G, Kersey JH, Goldman AI. CIinical utiIity of lymphocyte
surface markers combined with the Lukes-CoIIins histologic classification in adult lymphoma.
N Engl J Med 1979; 301:512-g.
20. Goldenberg DM, DeLand F, Kim E, et al. Use of radiolabeled antibodies to carcinoembryonic antigen for the detection and Iocabzation of diverse cancers by externa1 photoscanning. N Eng21 Med
1978; 298:1384-8.
21. Shapiro S, Goldberg JD, Hutchison GB. Lead time in breast cancer detection and implications for
periodicity of screening. Am ] Epidemial 1974;100:357-66.
22. Albert A, Gertman PM, Louis TA. Screening for the early detection of cancer. 1. The temporal
natural history of a progressive disease state. Mufh Biosci 1978; 40~1-59.
23. FeinIeib M, Zelen M. Some pitfaUs in the evaluation of screening programs. An% Environ Healfh 1969;
19:412-5.
9 Conferencia