Anda di halaman 1dari 14

1

EL PROYECTO GENOMA HUMANO


(Parte I: Aspectos científicos)
1. GENÓMICA
Tal como se señalaba en la página de presentación de este web, la última etapa cronológica de la
ciencia Genética -iniciada hacia 1995 y que abarca hasta nuestros días- se conoce ya con el
nombre de GENÓMICA, estando caracterizada por la disección molecular del genoma de los
organismos; es decir, el conocimiento de la secuencia total de bases que lo componen y cuya
expresión máxima es el PROYECTO GENOMA HUMANO (PGH).

El concepto de genoma en sentido amplio se refiere a todo el ADN contenido en un juego


cromosómico expresado en forma de secuencia de bases, independientemente de que
corresponda o no a genes que codifiquen para moléculas funcionales (proteínas o diversas clases
de ARN: ribosomal, transferente, etc.). En un sentido estricto, por genoma se entiende el
conjunto de genes que especifican todos los caracteres potencialmente expresables de un
organismo. En los organismos eucarióticos, como es la especie humana, hay una mayor o menor
proporción de ADN que no codifica para gen alguno y cuyo significado genético es desconocido
en muchos casos.

En la especie humana, la información genética de cada individuo está organizada en dos


juegos equivalentes de 23 cromosomas cada uno. Cada juego cromosómico en estado de un
cromatidio contiene una cantidad de ADN de unos 2,8 picogramos (1pg=10-12g), equivalentes a
unos tres mil millones de pares de bases. Se estima que el genoma humano sensu stricto tiene de
50.000 a 100.000 genes (hoy en día se suelen manejar más las cifras en torno a 70.000), que
suponen un porcentaje minoritario del ADN total.

El PGH, enunciado en sus términos más simples, significa el intento de secuenciar los tres
mil millones de pares de bases que componen el genoma sensu lato de la especie humana. Es
decir, utilizando el lenguaje analógico del astrofísico George Gamow, equivaldría a poder
escribir lo que es la esencia genética de un ser humano como un larguísimo número de tres mil
millones de cifras escrito con cuatro dígitos: las cuatro bases nitrogenadas (adenina, guanina,
timina y citosina) del ADN.
2

Dentro de la Genómica se pueden distinguir ya dos fases diferenciadas: una primera en la que
solamente se buscaba el conocimiento de las secuencias de los genomas – la GENÓMICA
ESTRUCTURAL- y otra posterior en la que se planteó acertadamente la cuestión de que lo
verdaderamente importante era saber cuál era la función de las secuencias previamente
conocidas; es decir, había nacido la GENÓMICA FUNCIONAL.

GENÓMICA: DISECCIÓN MOLECULAR DE LOS GENOMAS

1. ANTECEDENTES (virus y ADN mitocondrial)

Fago X174 : 5.386 b (Sanger et al., 1977)


ADNmt humano : 16.569 pb (Anderson, ... Sanger, 1981)
Fago  : 48.502 pb (Sanger et al., 1982)
Virus Epstein-Barr : 172.281 pb (Baer et al., 1984)
3

2. ORGANISMOS LIBRES

PROCARIONTES (Genomas secuenciados totalmente)

Mycoplasma genitalium : 580.070 pb (Fraser, ... Venter, 1995


Haemophilus influenzae : 1.830.137 pb (Fleischmann, ... Venter, 1995)
Methanococcus jannaschii : 1.660.000 pb (Bult, ..., Venter, 1996)
Helicobacter pylori : 1.667.867 pb (Tomb, ... Venter, 1997)
Escherichia coli : 4.639.221 pb (Blattner et al., 1997)
Bacillus subtilis : 4.214.810 pb (Kunst et al., 1997)
Treponema pallidum : 1.138.006 pb (Fraser, ... Venter, 1998)

EUCARIONTES

Saccharomyces cerevisiae : 12.052.000 pb (completo, Goffeau y col., 1996)


Caenorhabditis elegans : 80.000.000 pb (80 % del total en 1998)
Arabidopsis thaliana :  30.000.000 pb ( 25 % del total, 1998)
Homo sapiens : 180.000.000 pb ( 6 % del total, 1998)

2. EL PROYECTO GENOMA HUMANO: ASPECTOS CIENTÍFICOS

Al considerar los aspectos científicos del PGH es obligado hacer referencia a su pasado,
a su presente y a su futuro.

2.1. EL PASADO DEL PGH


4

Antes de hacer referencia a la cronología histórica del proyecto, puede ser interesante
señalar como antecedentes cientificos las tres revoluciones tecnológicas sin las cuales el
desarrollo del proyecto hubiera sido prácticamente imposible: en primer lugar, la tecnología
molecular de los ácidos nucleicos (fragmentación, hibridación, secuenciación y amplificación)
desarrollada a partir de 1975; en segundo lugar, el descubrimiento a partir de 1983 de los
"cromosomas artificiales de levadura" (YACs) que, al ser utilizados como vectores en la
construcción de las genotecas o bibliotecas de ADN humano, permiten incorporar grandes
fragmentos de ADN de cientos de miles, e incluso millones (MegaYACs), de pares de bases de
longitud (es decir, se pasó de un tamaño de los "libros" de la "biblioteca" humana de 15.000-
40.000 pb a 105-106 pb); en tercer lugar, la revolución de la informática de los años ochenta que
permite analizar y comparar las secuencias obtenidas.

En el pasado histórico del PGH (1984-1990) se pueden distinguir tres fases:

- PRIMER PERIODO (1984-1986): La comunidad científica se plantea la necesidad de


llevar a cabo el proyecto, cuyo objetivo inicial es la secuenciación "pura y dura" de los tres mil
millones de pares de bases que constituyen el genoma humano "de un extremo a otro".

- SEGUNDO PERIODO (1986-1988): Se caracteriza por una redefinición del proyecto,


incorporando nuevos objetivos y dándole una mayor racionalidad: ya no se trata de una
secuenciación sin más, sino de partir de los mapas genéticos para obtener los mapas físicos y
proceder en primer lugar a la secuenciación de los fragmentos de ADN que contengan
información de interés. Esquemáticamente sería:

1. MAPA GENÉTICO

- Obtención de marcadores genéticos

- Ordenación de los grupos de ligamiento (cada cromosoma constituye un


grupo de ligamiento)

- Saturar los cromosomas (o grupos de ligamiento) con marcadores genéticos


situados a distancias de 5cM (el centimorgan, cM, es la unidad genética para
medir la distancia entre dos genes. 1 cM equivale a una distancia física de
106pb en la molécula de ADN)
5

- Localización de genes causantes de enfermedades

2. MAPA FÍSICO

- Clonar el ADN humano utilizando genotecas construidas con fagos,


cósmidos o YACs

- Solapamiento de los clones contiguos (contigs)

- Construcción del mapa físico integrándolo con marcadores genéticos como


son las sedes etiquetadas por su secuencia (STS)

3. SECUENCIACIÓN DEL ADN

- Fragmentos específicos por su interés médico

- ADNc correspondiente a etiquetas de secuencias expresadas (EST) (genes


funcionales)

- TERCER PERIODO (1988-1990): Corresponde al lanzamiento del proyecto en algunos


países individuales: Estados Unidos, Japón, Gran Bretaña, Francia y su posterior
internacionalización (Human Genome Organization, HUGO, Comunidad Europea).

Como es bien sabido, fue Estados Unidos el país promotor e impulsor del PGH. Como
escribía Watson en 1990, la nación norteamericana estableció como un objetivo nacional la
construcción del mapa genético y secuenciación del genoma humano. El orgullo nacional
norteamericano estaba en juego: del mismo modo que en 1961 el Presidente Kennedy tomó la
decisión de enviar un hombre a la luna, ahora la nacion se ha comprometido a sí misma en un
objetivo altamente visible e importante, añadiendo que, aunque el costo global de la
secuenciación total del ADN humano (estimado en principio, en tres mil millones de dólares)
será inferior en un orden de magnitud al de enviar al hombre a la luna, las repercusiones serán
mucho más grandes.

El proyecto encontró inicialmente ciertos obstáculos en los Estados Unidos por parte de la
propia comunidad científica (por ejemplo, la Academia de Ciencias) porque no se veía mucho
sentido a la secuenciación del ADN humano de "un extremo a otro" sin más ni más. Sin
embargo, al final el proyecto original se modificó, ampliándolo a otras especies clásicas en
estudios genéticos. Así pues, el proyecto aprobado por las autoridades científicas (Academia de
6

Ciencias y los NIH) y el Gobierno y refrendado por el Congreso de la Nación no es ya sólo un


proyecto sobre el genoma humano sino un proyecto más amplio sobre "Organización del genoma
de organismos complejos", incluyendo como especies piloto la bacteria Escherichia coli, la
levadura Saccharomyces cerevisiae, el nematodo Caenorhabditis elegans, la mosca de la fruta
Drosophila, el ratón Mus musculus y el hombre.

El plan básico del PGH en los Estados Unidos fue establecido por una comisión del Consejo
Nacional de Investigación presidida por Bruce Alberts (National Research Council, 1988),
estimando una duración del proyecto de quince años y un costo de 200 millones de dólares por
año. En Estados Unidos el proyecto depende institucionalmente de los Institutos Nacionales de la
Salud (NIH) y del Departamento de Energía (DOE).

En Japón, el PGH es uno de los tres prioritarios junto con los del cáncer y el SIDA,
dependiendo institucionalmente del Ministerio de Educación y del Ministerio de Sanidad. En
principio, a diferencia del proyecto USA, no incluía estudios comparativos con los genomas de
otros organismos piloto. Dentro del proyecto japonés cabría destacar la línea de investigación
sobre "tecnología de ácidos nucleicos", incluyendo la automatización del proceso de
secuenciación.

En la Comunidad Europea, al principio la investigación no se abordó como un Proyecto


Genoma Humano al estilo de los Estados Unidos y Japón, sino que sólo existía un Programa
Europeo de Medicina Predictiva enfocado hacia la construcción de mapas genéticos humanos
basados en el análisis genético familiar y el polimorfismo de los fragmentos de restricción
(RFLP). Posteriormente se aprobó un nuevo Programa de Análisis del Genoma Humano para
desarrollar durante el periodo 1990-1992 con un presupuesto de 15 millones de ecus. En dicho
programa se trataba de mejorar el mapa genético humano y de establecer una "biblioteca
ordenada" de ADN humano (cartografía de secuencias con extremos superpuestos: contigs), así
como el desarrollo de nuevos y mejores métodos para el estudio del genoma humano, incluyendo
nuevos métodos de tratamiento de datos (software).

Posteriormente, otros países han ido incorporándose en mayor o menor medida al proyecto.
Así, en 1992, Canadá decidió subvencionar con 18 millones de dólares USA a lo largo de cinco
años la investigación sobre la construcción de mapas y secuenciación del genoma humano.
7

Por otro lado, dada la envergadura del Proyecto Genoma Humano es obvia la necesidad de
una coordinación y cooperación internacionales. Ello llevó a crear en 1988 una organización
conocida como HUGO (Human Genome Organization) que estuvo presidida incialmente por el
norteamericano Victor A. McKusick (un "clásico" en los estudios de Genética Humana) y al que
han sucedido ya diversos científicos. La comisión científica de HUGO está constituida por 42
miembros de varias nacionalidades, incluyendo a varios premios Nobel (Dausset, Dulbecco,
Gilbert, Jacob, Watson).

2.2. EL PRESENTE DEL PGH

Desde el principio quedó de manifiesto que el desarrollo del proyecto podía llevarse a
cabo desde dos enfoques diferentes. Por un lado estaban los científicos -como el premio Nobel
J.D.Watson- partidarios de la aplicación de alta tecnología (Big Science) a gran escala en grandes
centros de investigación para tratar de construir los mapas y secuenciar grandes fragmentos de
ADN del genoma humano y de otras especies piloto, mientras que, por otro lado, estaban los
científicos partidarios de concentrar la investigación en la secuenciación -al menos al principio-
del ADNcopia (ADNc) correspondiente a genes expresados y en el modo de acción de los genes.
Además, estos últimos preferían también que aumentara el número de los centros de
investigación de tamaño intermedio (ni muy grandes ni muy pequeños). Con la dimisión de
Watson como director del Center for Human Genome Research, NIH, la balanza pareció haberse
inclinado en favor de los partidarios de secuenciar el ADNc correspondiente a genes expresados
y no cualquier fragmento de ADN del genoma independientemente de si es o no portador de
genes funcionales. Como exponente más caracterizado dentro de los Estados Unidos en la
defensa de la secuenciación del ADNc puede citarse al Dr. J. Craig Venter.

Sin embargo, ante esta aproximación inicial al PGH había que plantearse cuáles son las
limitaciones técnicas para obtener la secuencia completa del genoma humano y si no habría otros
métodos más rápidos, eficientes y baratos que permitieran obtener la misma información. Habría
que establecer la estrategia para logar la mejor ordenación de prioridades y la distribución de los
recursos para caracterizar el genoma humano con la mayor eficacia.

Desde el punto de vista de la técnica de secuenciación hay que mencionar el avance que
supuso la modificación basada en la fluorescencia del método "didesoxi" o de "terminación de
8

cadena" de Sanger (Sanger et al., 1977) introducida por Hood y colaboradores (Smith et al.,
1986) que condujo a la completa automatización de las etapas de secuenciación del ADN y al
análisis computarizado de los geles obtenidos.

Como se mencionaba antes, la estrategia alternativa al desarrollo del PGH es la


secuenciación a gran escala del ADNc humano propuesta por Venter, cuyo fundamento científico
consiste en aislar los ARN mensajeros producidos en distintos tipos de células y obtener a partir
de ellos por transcripción inversa el ADNc que obviamente corresponderá a exones de genes que
se han expresado en dichas células. El siguiente paso es obtener secuencias parciales del ADNc,
denominadas etiquetas de secuencias expresadas (EST). Así, en 1991, el grupo de Venter en los
NIH obtuvo 348 ESTs y 2.375 más en 1992, procedentes todos ellos de células del cerebro.
Posteriormente, el Dr. Venter dejó los NIH y pasó a dirigir The Institute for Genomic Research
(TIGR) en Gaithersburg, Maryland, donde trabajan un centenar de científicos que disponen de
gran número de secuenciadores automáticos (con rendimiento de 5000 b/día, cada uno) y la
correspondiente infraestructura informática para analizar los datos obtenidos.

En la carrera de competitividad cienrtífica que supone el PGH es también digno de mención


el planteamiento hecho en Francia por el Centre d'Etude du Polymorphisme Humaine (CEPH),
fundado en 1983 por el premio Nobel Jean Dausset y Daniel Cohen, quienes crearon en
colaboración con Jean Weissenbach un gran centro tecnológico -el Généthon- donde de forma
robotizada y automatizada tratan de manejar el genoma completo produciendo al azar fragmentos
grandes de ADN que son clonados por medio de los megaYACs desarrollados por científicos del
CEPH.

Una vez creada la biblioteca de megaYACs con ADN genómico humano, el paso siguiente
consistió en la localización de gran número de marcadores genéticos altamente polimórficos
basados en secuencias repetidas en tándem de tipo microsatélite (las denominadas sedes
etiquetadas por su secuencia, STS) que podrían ser amplificadas mediante la técnica de la
reacción en cadena de la polimerasa (PCR), proporcionando así un medio directo de ligar un
mapa físico de segmentos solapantes (contigs) con el mapa genético. La utilización de las STS
como marcadores genéticos tiene la ventaja de que no tienen que ser mantenidas como un stock
de laboratorio sino simplemente almacenadas en el ordenador y generadas cuando interese
manejarlas. En resumen, la metodología consiste en producir en primer lugar mapas megaYACs
9

de "baja resolución" (o de "primera generación") a partir de los cuales se generan mapas de "alta
resolución" (o de "segunda generación") constituidos por segmentos solapantes (contigs) sobre
los cuales se localizan las STS como marcadores genéticos. La meta ideal en el desarrollo del
PGH es lograr un promedio de una STS cada 100 kb a lo largo de todo el genoma humano.

El primer éxito notable de Généthon fue conseguir en 1992 a partir de una genoteca
megaYAC la ordenación continua de clones solapantes de ADN (contigs) que cubren por
completo el brazo largo del cromosoma 21 (21q), utilizando como marcadores genéticos STSs
espaciadas entre sí unas 220kb por término medio. Con posterioridad se obtuvieron los mapas
físicos (contigs) y genéticos prácticamente completos del cromosoma Y con un marcador
genético cada 220kb, del cromosoma 12 con un marcador cada 248kb, del cromosoma 16 con un
marcador cada 160kb y del cromosoma 22 con un marcador cada 70kb. Podría decirse que el
Généthon parecía inclinar de nuevo la balanza hacia el planteamiento de la "Big Science"
llevando el mapeo genómico humano a una escala industrial.

En este contexto hay que destacar también el grupo de trabajo que dirige el Dr. Eric Lander
en el Whitehead Institute for Biomedical Research, MIT, en Estados Unidos. De la colaboración
del grupo francés y el norteamericano surgió en 1995 la construcción mediante cromosomas
artificiales de levadura de una biblioteca de ADN genómico humano constituida por 33.000
clones portadores de insertos de un tamaño medio de un millón de pares de bases (1Mpb). El
análisis de los solapamientos y de la información posicional les permitió construir un mapa de
225 fragmentos solapantes (contigs) de una longitud media de 10 Mpb que cubren el 75% del
genoma humano.

Posteriormente, el 22 de Diciembre de 1995, ambos grupos publicaban un mapa físico basado


en 15.086 STS con un espaciamiento medio de 199 kb que cubre el 94% del genoma humano,
proporcionando un material de partida adecuado para iniciar ya -por fin- el proceso de
secuenciación a gran escala. Además, decían los autores que aquel mapa representaba también el
comienzo de un proyecto internacional para generar un mapa de transcritos (mapa de genes
expresados) del genoma humano con más de 3235 secuencias expresadas (ESTs) localizadas.

Como última etapa de este periodo del PGH hay que destacar la investigación realizada por
el grupo que dirige el Dr. J. Craig Venter en The Institute for Genomic Research (TIGR) en
10

colaboración con Human Genome Sciences, Inc, en Maryland. En un trabajo publicado el 28 de


Septiembre de 1995 en la revista Nature, Venter y colaboradores describían 174.472 secuencias
parciales de ADNc (ESTs), totalizando más de 52 millones de bases de ADN humano,
procedentes de 37 tejidos y órganos diferentes obtenidos en distintos momentos del desarrollo.
En su estudio, Venter y colaboradores analizaron 30 tejidos con más de 1000 ESTs cada uno de
ellos, encontrando que sólo 8 genes aparecían representados por ESTs en los 30 tejidos y 227
genes estaban representados en más de 20 tejidos. Aproximadamente, un 40% de los genes
humanos identificados están asociados con el metabolismo energético básico y la homeostasis,
estructura y división de las células, un 22% de genes relacionados con la síntesis y
procesamiento de ARN y proteínas y un 12% con las señales y comunicación celulares. Todos
estos datos constituyeron el comienzo de un Proyecto de Anatomía Génica Humana destinado a
proporcionar una visión a gran escala de la expresión génica diferencial que rodea a la anatomía
y desarrollo del ser humano. Se podría decir que este proyecto encontró su competidor científico
en el Proyecto internacional de construcción del Mapa de transcritos o Mapa de genes
expresados iniciado por los grupos dirigidos por Lander en Estados Unidos y Cohen en Francia,
tal como se ha hecho referencia anteriormente. Se trata del comienzo de la aplicación de la
Genómica funcional dentro del PGH y que deberá ser enmarcada dentro de una Genómica
comparada. De ahí la importancia del desarrollo de los Proyectos Genoma de organismos tales
como la bacteria Escherichia coli, la levadura Saccharomyces cerevisiae, el nematodo
Caenorhabditis elegans, el insecto Drosophila melanogaster o el ratón Mus musculus.

De lo expuesto anteriormente se deduce que el PGH entró ya a partir de 1995 en su


etapa definitiva de secuenciación, ya sea a partir de los mapas físicos (contigs) integrados con
marcadores genéticos adecuados (STS), como preconizan Cohen y Lander, ya sea a partir de las
secuencias expresadas (ESTs) según la estrategia de Venter. Como señalaba Olson (1995), a
partir de entonces la tarea central del Proyecto Genoma Humano quedaba circunscrita a uno de
los hechos más notables de toda la ciencia:

“El desarrollo de un ser humano está dirigido por 750 megabytes de información digital. Esta información, que
está almacenada como moléculas de ADN en los gametos de cada persona, podría ser almacenada en un simple
CD-ROM del ordenador personal de un biólogo. El reto del futuro del Proyecto Genoma Humano consiste en
producir ese CD-ROM en el tiempo y al costo previstos”.
11

2.3. EL FUTURO DEL PGH

Recientemente, el 23 de Octubre de 1998, el Dr. Francis S. Collins, Director del Proyecto


Genoma Humano en los Estados Unidos, publicaba en la revista Science un artículo en el que
hacía un balance del progreso del PGH en los Estados Unidos y una prospección de futuro
para el periodo 1998-2003, tal como se indica en el cuadro adjunto:

El PGH en los Estados Unidos: Pasado y futuro (basado en Collins et al.,1998)

AREA OBJETIVOS PERIODO ESTADO AL MES DE OBJETIVOS PERIODO


1993-1998 OCTUBRE DE 1998 1998-2003

Mapa genético Resolución 2-5 cM Mapa de 1cM publicado en Completado


Septiembre 1994

Mapa físico Mapa 30.000 STSs Mapeados 50.000 STSs Completado

Secuencia 80 Mb para todos los organismos 180 Mb humano y 111 Mb Finalizado 1/3 del genoma
ADN no humanos humano para 2001 y
completado para el 2003

Tecnología de Mejoras y tecnologías innovadoras 90 Mb/año a un costo de 0,50 Automatización 500 Mb/año
secuenciación US $/base. Electroforesis por a un costo de 0,25 US$/base
capilaridad
12

Variación de la No prevista ---- 100.000 SNPs mapeadas


secuencia
humana

Identificación Desarrollo de la tecnología 30.000 ESTs mapeadas ADNc en toda su longitud


de genes

Análisis No previsto ---- Desarrollar tecnologías a


funcional escala genómica

Organismos E.coli, completar secuencia Publicada Sept. 1997 ----


modelo S.cerevisiae, completar secuencia Publicada Abril 1996 ----
C.elegans, avanzar en la secuencia Secuenciado un 80% Completado finales de Dic.
Drosophila, iniciar secuenciación Secuenciado un 9% 1998 Completado en 2002
Ratón, Mapear 10.000 STSs Mapeadas 12.000 STSs Completado en 2005

A la vista del cuadro anterior queda patente, en primer lugar, que los objetivos planificados
para el quinquenio pasado (1993-1998) se han cubierto holgadamente y, en segundo lugar, que el
desarrollo total del Proyecto Genoma Humano, que parecía una utopía difícilmente alcanzable,
será una realidad el año 2003.

Resultan asimismo muy ilustrativos los gráficos presentados por Collins y colaboradores en
relación con los fondos destinados al PGH por los National Institutes of Health (NIH) y el
Department of Energy (DOE) de los Estados Unidos, así como el progreso exponencial de la
secuenciación del genoma humano, tal como se recogen en las figuras adjuntas.

3. BIBLIOGRAFÍA

ADAMS, M.D....VENTER, J.C. 1991. Complementary DNA sequencing: Expressed sequence


tags and Human Genome Project. Science, 252: 1651-1656

ADAMS, M.D....VENTER, J.C.1995. Initial assessment of human gene diversity and expression
patterns based upon 83 million nucleotides of cDNA sequence. Nature, 377 Suppl.: 3-174
13

COLLINS, F.S. et al. 1998. New goals for the U.S. Human Genome Project: 1998-2003. Science,
282: 682-689.

HUDSON, T.J. et al.1995. An STS-based map of the human genome. Science, 270: 1945-1954

LACADENA, J.R. 1996. El Proyecto Genoma Humano: Ciencia y Etica. Jornadas


Iberoamericanas de Ciencias Farmacéuticas, Real Academia de Farmacia, pp.5-41

OLSON, M.V. 1995. A time to sequence. Science, 270: 394-396

WATSON, J.D. 1990. The Human Genome Project. Past, present, and future. Science, 248: 44-49
14

Anda mungkin juga menyukai