El PGH, enunciado en sus términos más simples, significa el intento de secuenciar los tres
mil millones de pares de bases que componen el genoma sensu lato de la especie humana. Es
decir, utilizando el lenguaje analógico del astrofísico George Gamow, equivaldría a poder
escribir lo que es la esencia genética de un ser humano como un larguísimo número de tres mil
millones de cifras escrito con cuatro dígitos: las cuatro bases nitrogenadas (adenina, guanina,
timina y citosina) del ADN.
2
Dentro de la Genómica se pueden distinguir ya dos fases diferenciadas: una primera en la que
solamente se buscaba el conocimiento de las secuencias de los genomas – la GENÓMICA
ESTRUCTURAL- y otra posterior en la que se planteó acertadamente la cuestión de que lo
verdaderamente importante era saber cuál era la función de las secuencias previamente
conocidas; es decir, había nacido la GENÓMICA FUNCIONAL.
2. ORGANISMOS LIBRES
EUCARIONTES
Al considerar los aspectos científicos del PGH es obligado hacer referencia a su pasado,
a su presente y a su futuro.
Antes de hacer referencia a la cronología histórica del proyecto, puede ser interesante
señalar como antecedentes cientificos las tres revoluciones tecnológicas sin las cuales el
desarrollo del proyecto hubiera sido prácticamente imposible: en primer lugar, la tecnología
molecular de los ácidos nucleicos (fragmentación, hibridación, secuenciación y amplificación)
desarrollada a partir de 1975; en segundo lugar, el descubrimiento a partir de 1983 de los
"cromosomas artificiales de levadura" (YACs) que, al ser utilizados como vectores en la
construcción de las genotecas o bibliotecas de ADN humano, permiten incorporar grandes
fragmentos de ADN de cientos de miles, e incluso millones (MegaYACs), de pares de bases de
longitud (es decir, se pasó de un tamaño de los "libros" de la "biblioteca" humana de 15.000-
40.000 pb a 105-106 pb); en tercer lugar, la revolución de la informática de los años ochenta que
permite analizar y comparar las secuencias obtenidas.
1. MAPA GENÉTICO
2. MAPA FÍSICO
Como es bien sabido, fue Estados Unidos el país promotor e impulsor del PGH. Como
escribía Watson en 1990, la nación norteamericana estableció como un objetivo nacional la
construcción del mapa genético y secuenciación del genoma humano. El orgullo nacional
norteamericano estaba en juego: del mismo modo que en 1961 el Presidente Kennedy tomó la
decisión de enviar un hombre a la luna, ahora la nacion se ha comprometido a sí misma en un
objetivo altamente visible e importante, añadiendo que, aunque el costo global de la
secuenciación total del ADN humano (estimado en principio, en tres mil millones de dólares)
será inferior en un orden de magnitud al de enviar al hombre a la luna, las repercusiones serán
mucho más grandes.
El proyecto encontró inicialmente ciertos obstáculos en los Estados Unidos por parte de la
propia comunidad científica (por ejemplo, la Academia de Ciencias) porque no se veía mucho
sentido a la secuenciación del ADN humano de "un extremo a otro" sin más ni más. Sin
embargo, al final el proyecto original se modificó, ampliándolo a otras especies clásicas en
estudios genéticos. Así pues, el proyecto aprobado por las autoridades científicas (Academia de
6
El plan básico del PGH en los Estados Unidos fue establecido por una comisión del Consejo
Nacional de Investigación presidida por Bruce Alberts (National Research Council, 1988),
estimando una duración del proyecto de quince años y un costo de 200 millones de dólares por
año. En Estados Unidos el proyecto depende institucionalmente de los Institutos Nacionales de la
Salud (NIH) y del Departamento de Energía (DOE).
En Japón, el PGH es uno de los tres prioritarios junto con los del cáncer y el SIDA,
dependiendo institucionalmente del Ministerio de Educación y del Ministerio de Sanidad. En
principio, a diferencia del proyecto USA, no incluía estudios comparativos con los genomas de
otros organismos piloto. Dentro del proyecto japonés cabría destacar la línea de investigación
sobre "tecnología de ácidos nucleicos", incluyendo la automatización del proceso de
secuenciación.
Posteriormente, otros países han ido incorporándose en mayor o menor medida al proyecto.
Así, en 1992, Canadá decidió subvencionar con 18 millones de dólares USA a lo largo de cinco
años la investigación sobre la construcción de mapas y secuenciación del genoma humano.
7
Por otro lado, dada la envergadura del Proyecto Genoma Humano es obvia la necesidad de
una coordinación y cooperación internacionales. Ello llevó a crear en 1988 una organización
conocida como HUGO (Human Genome Organization) que estuvo presidida incialmente por el
norteamericano Victor A. McKusick (un "clásico" en los estudios de Genética Humana) y al que
han sucedido ya diversos científicos. La comisión científica de HUGO está constituida por 42
miembros de varias nacionalidades, incluyendo a varios premios Nobel (Dausset, Dulbecco,
Gilbert, Jacob, Watson).
Desde el principio quedó de manifiesto que el desarrollo del proyecto podía llevarse a
cabo desde dos enfoques diferentes. Por un lado estaban los científicos -como el premio Nobel
J.D.Watson- partidarios de la aplicación de alta tecnología (Big Science) a gran escala en grandes
centros de investigación para tratar de construir los mapas y secuenciar grandes fragmentos de
ADN del genoma humano y de otras especies piloto, mientras que, por otro lado, estaban los
científicos partidarios de concentrar la investigación en la secuenciación -al menos al principio-
del ADNcopia (ADNc) correspondiente a genes expresados y en el modo de acción de los genes.
Además, estos últimos preferían también que aumentara el número de los centros de
investigación de tamaño intermedio (ni muy grandes ni muy pequeños). Con la dimisión de
Watson como director del Center for Human Genome Research, NIH, la balanza pareció haberse
inclinado en favor de los partidarios de secuenciar el ADNc correspondiente a genes expresados
y no cualquier fragmento de ADN del genoma independientemente de si es o no portador de
genes funcionales. Como exponente más caracterizado dentro de los Estados Unidos en la
defensa de la secuenciación del ADNc puede citarse al Dr. J. Craig Venter.
Sin embargo, ante esta aproximación inicial al PGH había que plantearse cuáles son las
limitaciones técnicas para obtener la secuencia completa del genoma humano y si no habría otros
métodos más rápidos, eficientes y baratos que permitieran obtener la misma información. Habría
que establecer la estrategia para logar la mejor ordenación de prioridades y la distribución de los
recursos para caracterizar el genoma humano con la mayor eficacia.
Desde el punto de vista de la técnica de secuenciación hay que mencionar el avance que
supuso la modificación basada en la fluorescencia del método "didesoxi" o de "terminación de
8
cadena" de Sanger (Sanger et al., 1977) introducida por Hood y colaboradores (Smith et al.,
1986) que condujo a la completa automatización de las etapas de secuenciación del ADN y al
análisis computarizado de los geles obtenidos.
Una vez creada la biblioteca de megaYACs con ADN genómico humano, el paso siguiente
consistió en la localización de gran número de marcadores genéticos altamente polimórficos
basados en secuencias repetidas en tándem de tipo microsatélite (las denominadas sedes
etiquetadas por su secuencia, STS) que podrían ser amplificadas mediante la técnica de la
reacción en cadena de la polimerasa (PCR), proporcionando así un medio directo de ligar un
mapa físico de segmentos solapantes (contigs) con el mapa genético. La utilización de las STS
como marcadores genéticos tiene la ventaja de que no tienen que ser mantenidas como un stock
de laboratorio sino simplemente almacenadas en el ordenador y generadas cuando interese
manejarlas. En resumen, la metodología consiste en producir en primer lugar mapas megaYACs
9
de "baja resolución" (o de "primera generación") a partir de los cuales se generan mapas de "alta
resolución" (o de "segunda generación") constituidos por segmentos solapantes (contigs) sobre
los cuales se localizan las STS como marcadores genéticos. La meta ideal en el desarrollo del
PGH es lograr un promedio de una STS cada 100 kb a lo largo de todo el genoma humano.
El primer éxito notable de Généthon fue conseguir en 1992 a partir de una genoteca
megaYAC la ordenación continua de clones solapantes de ADN (contigs) que cubren por
completo el brazo largo del cromosoma 21 (21q), utilizando como marcadores genéticos STSs
espaciadas entre sí unas 220kb por término medio. Con posterioridad se obtuvieron los mapas
físicos (contigs) y genéticos prácticamente completos del cromosoma Y con un marcador
genético cada 220kb, del cromosoma 12 con un marcador cada 248kb, del cromosoma 16 con un
marcador cada 160kb y del cromosoma 22 con un marcador cada 70kb. Podría decirse que el
Généthon parecía inclinar de nuevo la balanza hacia el planteamiento de la "Big Science"
llevando el mapeo genómico humano a una escala industrial.
En este contexto hay que destacar también el grupo de trabajo que dirige el Dr. Eric Lander
en el Whitehead Institute for Biomedical Research, MIT, en Estados Unidos. De la colaboración
del grupo francés y el norteamericano surgió en 1995 la construcción mediante cromosomas
artificiales de levadura de una biblioteca de ADN genómico humano constituida por 33.000
clones portadores de insertos de un tamaño medio de un millón de pares de bases (1Mpb). El
análisis de los solapamientos y de la información posicional les permitió construir un mapa de
225 fragmentos solapantes (contigs) de una longitud media de 10 Mpb que cubren el 75% del
genoma humano.
Como última etapa de este periodo del PGH hay que destacar la investigación realizada por
el grupo que dirige el Dr. J. Craig Venter en The Institute for Genomic Research (TIGR) en
10
“El desarrollo de un ser humano está dirigido por 750 megabytes de información digital. Esta información, que
está almacenada como moléculas de ADN en los gametos de cada persona, podría ser almacenada en un simple
CD-ROM del ordenador personal de un biólogo. El reto del futuro del Proyecto Genoma Humano consiste en
producir ese CD-ROM en el tiempo y al costo previstos”.
11
Secuencia 80 Mb para todos los organismos 180 Mb humano y 111 Mb Finalizado 1/3 del genoma
ADN no humanos humano para 2001 y
completado para el 2003
Tecnología de Mejoras y tecnologías innovadoras 90 Mb/año a un costo de 0,50 Automatización 500 Mb/año
secuenciación US $/base. Electroforesis por a un costo de 0,25 US$/base
capilaridad
12
A la vista del cuadro anterior queda patente, en primer lugar, que los objetivos planificados
para el quinquenio pasado (1993-1998) se han cubierto holgadamente y, en segundo lugar, que el
desarrollo total del Proyecto Genoma Humano, que parecía una utopía difícilmente alcanzable,
será una realidad el año 2003.
Resultan asimismo muy ilustrativos los gráficos presentados por Collins y colaboradores en
relación con los fondos destinados al PGH por los National Institutes of Health (NIH) y el
Department of Energy (DOE) de los Estados Unidos, así como el progreso exponencial de la
secuenciación del genoma humano, tal como se recogen en las figuras adjuntas.
3. BIBLIOGRAFÍA
ADAMS, M.D....VENTER, J.C.1995. Initial assessment of human gene diversity and expression
patterns based upon 83 million nucleotides of cDNA sequence. Nature, 377 Suppl.: 3-174
13
COLLINS, F.S. et al. 1998. New goals for the U.S. Human Genome Project: 1998-2003. Science,
282: 682-689.
HUDSON, T.J. et al.1995. An STS-based map of the human genome. Science, 270: 1945-1954
WATSON, J.D. 1990. The Human Genome Project. Past, present, and future. Science, 248: 44-49
14