BIOINFORMÁTICA
La bioinformática es un campo interdisciplinar que está revolucionando la
comprensión en las ciencias biológicas, donde se emplea el computador como
herramienta experimental. La bioinformática está contribuyendo al proceso de
innovación tecnológica así como a descifrar la historia origen del ser humano
gracias a la utilización de tecnologías computacionales que permiten ampliar la
comprensión del mundo en el que vivimos.
Especial agradecimiento al promotor del proyecto
y a los compañeros de Ingeniería Telemática,
que con el paso de cada semestre han ido enriqueciendo el presente libro.
Para definir bioinformática es necesario tener en cuenta algunas palabras claves, que
serán de ayuda a lo largo del contenido de este libro.
¿Sabías Que?
Aunque todos tenemos la idea del
ADN de doble hélice, lo cierto es que existen
muchos tipos de ADN con formas variadas y
extrañas: desde una triple hélice hasta cualquier
forma que se te pueda ocurrir.
1
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
• PROTEINA
• GEN
Un gen es un trozo de ADN que lleva la
información para que se fabrique una proteína.
Desde el punto de vista de la genética, podemos
decir que un gen es una porción de cromosoma
que lleva la información para que se manifieste
un carácter.
¿Sabías Que?
Compartimos el 99.9% de nuestros genes
Cada ser humano comparte el 99.9% de su ADN
con cualquier otro ser humano, mientras que con los
chimpancés compartimos el 98% de los genes. Un
dato básico para los amantes de la discriminación.
2
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
• GENOMICA
• SECUENCIA
• ESTRUCTURA
La estructura tridimensional de una proteína es un factor determinante en su
actividad biológica. Tiene un carácter jerarquizado, es decir, implica unos
niveles de complejidad creciente que dan lugar a 4 tipos de estructuras:
primaria, secundaria, terciaria y cuaternaria.
3
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
• ALINEAR
Comparar dos secuencias para ver similitudes y diferencias entre ellas.
BIOINFORMATICA
La bioinformática es una ciencia muy joven, si miramos a través del tiempo algunos
descubrimientos fueron de la siguiente manera:
Año Hechos
1933 Tiselius introduce una nueva técnica (electroforesis) para la separación
de proteínas.
1951 Pauling y Corey proponen la estructura para la α-hélice y las hojas-β. Se
reporta la secuencia de la proteína de la insulina.
4
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
5
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
Breve historia
En 1865 Gregor Mendel llevo a cabo su famoso experimento con flores, aunque por
muchos años, este trabajo fue ignorado. El experimento fue muy simple pero de un gran
significado. Mendel registro los diferentes colores de flores en varias generaciones, noto
como algunos colores pasaban de una generación a la siguiente, mientras que otros no.
De allí empezó a desarrollar la idea de la herencia.
En el lenguaje de los primeros años del siglo XX, los científicos eran capaces de explicar
el trabajo de Mendel. Se describía a través de los llamados “factores controlados” que
pasan de generación a generación.
Obviamente, con estos números asombrosos, existe una cantidad asombrosa de datos
que se producen día a día y que requieren análisis. En los últimos años el desarrollo
de las ciencias y tecnologías computacionales y en particular, la tecnología de Internet,
han permitido que el trabajo de análisis se pueda desarrollar a través de software de
Internet. Aquí es donde la ciencia de la bioinformática empieza a crecer rápidamente
en los últimos años, sin signos de que este crecimiento se detenga.
Definición:
Es la disciplina científica que combina biología, computación y tecnologías de la
información.
Objetivo:
El objetivo de esta disciplina es facilitar nuevas percepciones biológicas y crear una
perspectiva global que permita identificar los principios unificadores de la biología.
Inicialmente, la bioinformática se ocupaba sobre todo de la creación de bases de datos
de información biológica, especialmente secuencias, y del desarrollo de herramientas
para la utilización y análisis de los datos contenidos en esas bases de datos.
6
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
7
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
1er
1er bacteria pluricelular
Secuencia masiva
100mb.
1.83mb y paralela
1er eucariota
12 mb.
8
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
9
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
10
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
¿Sabías que?
Los átomos se combinan entre sí para formar
distintas sustancias. Por ejemplo, dos átomos de
hidrógeno con uno de oxígeno son agua.
11
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
12
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
Bioquímica: Química relacionada con los seres vivos. Los átomos que componen
nuestro cuerpo fundamentalmente son cuatro:
➢ Hidrógeno
➢ Carbono
➢ Nitrógeno
➢ Oxígeno
¿Sabías que?
Las moléculas más grandes de la Naturaleza viven
dentro del cuerpo. Se trata del cromosoma 1. De entre
los 23 pares de cromosomas que existen en los núcleos
de nuestras células, el 1 es el más grande, pues contiene
10 mil millones de átomos.
13
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
➢ ¿Se pueden entender la estructura y las propiedades de las cosas antes de hacer
experimentos?
➢ ¿Puede una simulación matemática predecir comportamientos de la realidad
material?
14
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
1. Universalidad: Las reacciones químicas básicas son las mismas en todos los
seres vivos.
2. Evolución: Todos los organismos se evolucionaran de un único ancestro común.
¿Sabías que?
Aunque son minoría, hoy abundan quienes tienen ojos
claros. Muchas personas tienen ojos de distintas tonalidades
de azules, sin embargo, esto no siempre fue así. Según el
trabajo del genetista Hans Eiberg, el origen de los ojos
celestes en humanos estaría en una extraña mutación del gen
OCA2 hace miles de años, entre 6.000 y 10.000
aproximadamente.
15
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
Las células hacen parte de dos clases de organismos: Pluricelulares y Mono celulares
por ejemplo la célula animal es pluricelular y las bacterias mono celulares.
Funciones de la célula.
Célula: La célula es la estructura más pequeña capaz de realizar por sí misma las tres funciones
vitales: nutrición, relación y reproducción.
17
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
➢ Diferenciación: La diferenciación
celular es el proceso por el cual las células de
un linaje celular concreto (el linaje celular se
determina en el momento de la formación del
embrión) sufren modificaciones en su expresión
génica, para adquirir la morfología y las
funciones de un tipo celular específico y
diferente al resto de tipos celulares del
organismo.
¿Sabías que?
Cuando una célula se vuelve demasiado vieja, es capaz de
destruirse a sí misma.
Al final del ciclo vital de una célula, cuando esta ya no puede
reproducirse más, esta inicia un proceso mediante el cual
fagocita, es decir, se come, sus propios orgánulos, incluyendo
mitocondrias y cloroplastos. Aunque esto produce la muerte
celular, las moléculas de esta célula pueden servir como
nutrientes a las de alrededor. 18
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
1.5.1 Genética
La genética (del griego antiguo γενετικός, genetikos genetivo y este de γένεσις génesis,
"origen") es el campo de la biología que busca comprender la herencia biológica que se
transmite de generación en generación.
La genética estudia los genes que determinan nuestras características. Hay cuatro (4)
tipos de genética:
¿Sabías que?
2.1 de cada 180 niños nace con una enfermedad provocada
por defectos genéticos
✓ Genética Evolutiva: Estudia como los genes se vuelven a través del tiempo
en determinada población.
20
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
21
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
22
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
La replicación consiste en la copia del ADN de una célula, antes de la división celular,
para que la célula hija tenga el mismo ADN que la madre.
La traducción es el mecanismo por el que el mensaje que lleva el ARN se utiliza para
sintetizar proteínas.
Con estos tres mecanismos conseguimos extraer de la información genética (ADN) los
materiales (proteínas) necesarios tanto funcional como estructuralmente para que una
célula funcione. La copia de trabajo es sobre un gen (de un archivo a la vez). El sistema
es universal.
23
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
El ADN es una doble hélice de 2 cadenas de núcleo y nucleótidos y cada uno contiene:
1. Grupo fosfato
2. Pentosa (azúcarde 5 carbonos)
3. Bases nitrogenadas ya sean Adenina, Guanina, Citosina y Timina
Hay 4tipos de nucleótidos ya que hay 4 tipos de bases nitrogenadas, estas diferencian a cada uno de los
nucleótidos.
Adenina Timina
Citosina Guanina
Nuestro ADN codifica nuestra información en cuatro (4) bits. El ADN codifica la
información en ATCG.
Encontramos que el ADN cuando codifica tiene una regla básica es ahí donde se habla
de Bases Complementarias estos son:
El ADN tiene mecanismos de Reparación Recuperación, por esto debemos saber tres
niveles de Estructura que son:
25
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
¿Sabías que?
Las bases llamadas adenina, citosina, guanina y timina,
siempre están en pares y solo hay dos tipos de pares:
adenina-timina, y citosina-guanina. EL ser humano tiene
entre 2.8 y 3.5 millones de pares de bases.
Las proteínas de los seres vivos se fabrican en los RIBOSOMAS, orgánulos celulares
que se encuentran en el citoplasma de los eucariotas, asociados al retículo
26
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
endoplásmico.
Los ribosomas son nucleoproteínas, algo similar a la propia cromatina nuclear, con la
particularidad de que están formados por una asociación de proteínas y un ARN
especial que es el llamado ARN-ribosómico
27
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
28
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
➢ El ARN tiene una sola hebra, si bien el ARNt puede formar una estructura
de forma de trébol debido a la complementariedad de sus pares de bases.
La ARN polimerasa abre la parte del ADN a ser transcripta. Solo una de las hebras del
ADN (la hebra codificante) se transcribe. Los nucleótidos de ARN se encuentran
disponibles en la región de la cromatina (este proceso solo ocurre en la interface) y se
unen en un proceso de síntesis similar al del ADN.
El ARN está en el núcleo y se hace la transcripción dentro del núcleo, luego el ARNm
sale al citoplasma.
Etapas de la transcripción
29
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
1. Pre-iniciación
2. Iniciación
Primero, una Helicasa separa las hebras de ADN en estas denominadas cajas
TATA, ya que entre adenina y timina se establecen dos enlaces de hidrógeno,
mientras que entre citosina y guanina se forman tres. Posteriormente se unen
los factores y las proteínas de transcripción (TBP, TF2D, TF2B) permitiendo, de
esta manera, el acceso de la ARN polimerasa al molde de ADN de cadena
simple, siendo esta la última en posicionarse.
30
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
Una vez sintetizado el primer enlace se debe deshacer el complejo del promotor
para que quede limpio para volver a funcionar de nuevo. Durante esta fase hay
una tendencia a desprenderse el transcrito inicial de ARN y producir transcritos
truncados, dando lugar a una iniciación abortada, común tanto en procariontes
como eucariontes.
31
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
4. Elongación
32
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
Fue un astrónomo quien señaló que el código que representa a los aminoácidos debía
consistir en grupos de al menos tres de las cuatro bases del ADN.
Si uno considera las posibilidades de arreglo de cuatro letras agrupadas de a tres (43)
resulta que tenemos 64 posibilidades de palabras a codificar, o 64 posibles codones
(secuencia de tres bases en el ARNm que codifica para un aminoácido específico o una
secuencia de control). El código genético fue "roto" por Marshall Nirenberg y Heinrich
Matthaei (del NIH), 10 años después que Watson y Crick "rompieran" el misterio de la
estructura del ADN.
Adicionando poli-U (un ARNm sintético) a cada uno de 20 tubos de ensayo (cada uno de
los cuales tenía un aminoácido diferente) Nirenberg y Matthaei determinaron que el
codón UUU, el único posible en elpoli-U, codificaba para el aminoácido fenilalanina.
33
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
¿Sabías que?
Los perros y los seres humanos compartimos el 75% de
nuestro código genético.
34
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
1. Es universal, pues lo utilizan casi todos los seres vivos conocidos. Solo existen
algunas excepciones en unos pocos tripletes en bacterias.
3. Es degenerado, pues hay varios tripletes para un mismo aminoácido, es decir hay
codones sinónimos.
La siguiente tabla inversa indica qué codones codifican cada uno de los aminoácidos.
35
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
36
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
1.5.6 Proteínas
Las proteínas son moléculas formadas por cadenas lineales de aminoácidos.
Las proteínas desempeñan un papel fundamental para la vida y son las biomoléculas
más versátiles y más diversas.
Clasificación y Estructura
37
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
38
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
complejo proteico. Cada una de estas cadenas poli peptídicas recibe el nombre de
protómero.
Clasificación
Glicina, alamina, valina, leucina, isoleucina, fenil, alanina, triptófano, serina, treonina,
tirosina, prolina, hidroxiprolina, metionina, cisteína, cistina, lisina, arginina, histidina,
ácido aspártico y ácido glutámico.
Según su composición
Las "simples" o "Holo proteínas" son aquellas que al hidrolizarse producen únicamente
aminoácidos, mientras que las "conjugadas" o "Heteroproteínas" son proteínas que al
hidrolizarse producen también, además de los aminoácidos, otros componentes orgánicos
o inorgánicos. La porción no proteica de una proteína conjugada se denomina grupos
prostético". Las proteínas conjugadas se subclasifican de acuerdo con la naturaleza de
sus grupos prostéticos.
39
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
http://www.ncbi.nlm.nih.gov/gquery/
40
CAPITULO I - INTRODUCCIÓN A LA BIOINFORMÁTICA
41
CAPITULO II - SECUENCIAS DE ADN
42
CAPITULO II - SECUENCIAS DE ADN
Sí la secuencia
es de Símbolo Significado
nucleótidos el
formato permite A ADENINA
los siguientes
símbolos: C CITOSINA
T TIMINA
G GUANINA
U URACILO
R PURINA
Y PIRIMIDINA
K GoT
N A,C,G o T
- Hueco
43
CAPITULO II - SECUENCIAS DE ADN
Alinear: Comparar dos (2) secuencias. Resaltar sus similitudes y diferencias. Cuando se
analizan secuencias es común utilizar los términos similitud y homología de forma
indiscriminada, pero estos dos términos hacen referencia a conceptos distintos.
Para poder cuantificar el grado de similitud de dos secuencias lo primero que hay que
hacer es alinearlas.
44
CAPITULO II - SECUENCIAS DE ADN
➢ Pareado: (==2)
➢ Múltiple: (>2) Es más complicado.
Para estos tipos de alineamiento encontramos dos (2) tipos de algoritmos, pero antes
debemos explicar algunas características que pueden tener como son:
45
CAPITULO II - SECUENCIAS DE ADN
A = GAATTCAGTTA
46
CAPITULO II - SECUENCIAS DE ADN
Alineamiento:
[x=1 1,y=7], [x=1 0,y=6], [x=9,y=6], [x=8,y=6], [x=7,y=5], [x=6,y=5], [x=5,y=4] [x=4,y=4],
[x=3,y=3], [x=2,y=3], [x=1,y=2], [x=1,y=1], [x=0,y=0]
G¬AATTCAGTTA GGA¬T¬C¬G¬¬A
2.5.1 FASTA
FASTA es un programa para alineamiento de secuencias de ADN y de proteínas.
Fue descripto por primera vez (como FASTP) por David J. Lipman y William R. Pearson
en 1985 en el artículo "Rapid and sensitive protein similarity searches". El programa
original fue diseñado para buscar similitudes de secuencias proteicas. FASTA, descrito
en 1988, agregó la posibilidad de hacer búsquedas de ADN contra ADN, ADN contra
proteínas traducidas y un programa más sofisticado de aleatorización para evaluar la
significancia estadística de los resultados. El nombre FASTA viene de "FAST-ALL"
porque busca con cualquier alfabeto, es una extensión de "FAST-P" (proteínas) y
"FAST-N" (nucleótido).
47
CAPITULO II - SECUENCIAS DE ADN
2.5.2 BLAST
48
CAPITULO II - SECUENCIAS DE ADN
ETAPAS
FAMILIA DE BLAST
➢ *BlastP: Busca una proteína en una base de datos de proteínas. *BlastX: Busca
nucleótidos (ADN) en la base de datos de proteínas.
49
CAPITULO II - SECUENCIAS DE ADN
Variantes De BLAST
➢ Gapped BLAST: Esta es una mejora al algoritmo original del BLAST.2 También
se lo conoce como BLAST 2.0. Se trata de un BLAST que contempla la existencia
de pequeñas inserciones o eliminaciones en las secuencias que se están
comparando, permitiendo así alinear uno o varios nucleótidos o aminoácidos con
huecos vacíos llamados gaps.
➢ PsiBLAST: Esta variante de BLAST2 es usada para buscar posibles homólogos
en organismos muy lejanos entre ellos, filogenéticamente hablando. Está
disponible sólo para secuencias de aminoácidos.
PRECAUCIÓN: BLAST no garantiza que las secuencias que alinea sean homólogas y
mucho menos que tengan la misma función, simplemente provee posibles candidatos.
Se debe recordar que el programa es heurístico y por lo tanto puede que no encuentre
la solución óptima.
50
CAPITULO - III GENES
51
CAPITULO - III GENES
52
CAPITULO - III GENES
➢ *Lazo del anti codón: lugar de reconocimiento de los codones del mensajero.
Normalmente el ARN-t adopta una estructura de hoja de trébol plegada en forma
de L o forma de boomerang.
53
CAPITULO - III GENES
54
CAPITULO - III GENES
Splicing
55
CAPITULO - III GENES
Este cADN solo se puede hacer en el Laboratorio o por un retrovirus, y se utiliza para
leer el ADN que finalmente se va a utilizar en el ADNm y posteriormente en la Proteína.
Es una secuencia de información genética que contiene datos que pueden ser utilizados
para codificar aminoácidos; Los marcos de lectura se encuentran en el ADN y ARN. En
el caso de ADN, el ADN contiene conjuntos de nucleótidos conocida como tripletes o
codones. Cada codón puede ser transcrito por el ARN en otro triplete.
El marco de lectura es la sección de ADN o ARN que contiene instrucciones para hacer
una proteína completa. En el ADN, hay seis marcos de lectura posibles, ya que el inicio
de un marco de lectura depende de donde uno empieza a leer, y el ADN es de doble
cadena. Con el ARN, existen tres posibles marcos de lectura. Una sección de lectura
comienza con un codón de inicio (AUG) y uno de parada (UAA, UAG o UGA).
Un marco abierto de lectura puede contener un gen completo, o los genes que se
solapan; el código genético no siempre es tan ordenada como uno podría imaginar. De
56
CAPITULO - III GENES
Existen 6 sentidos en los que se puede aparecer un marco de lectura: +1, +2, +3, -1, -
2, -3.
Si una secuencia se empieza a leer desde el 1er carácter, entonces el marco de lectura
es +1; si se empieza desde la 2da, entonces el marco de lectura es +2; Y si se comienza
desde la 3era, entonces el marco de lectura es +3.
Para la secuencia complementaria, si se empieza a leer desde el 1er carácter, entonces
el marco de lectura es -1; si se empieza desde la 2da, entonces el marco de lectura es
-2; Y si se comienza desde la 3era, entonces el marco de lectura es -3.
El proceso anteriormente descrito se puede observar en el siguiente gráfico:
Para complementar se puede concluir que el Marco abierto de lectura es una porción
de una molécula de ADN que cuando se traduce a los aminoácidos, no contiene
codones de terminación. El código genético lee secuencias de ADN en grupos de tres
pares de bases, esto significa que, en una molécula de ADN de doble hebra, hay 6
posibles sentidos en los que pueden abrirse marcos de lectura -tres en dirección hacia
adelante y tres en reverso. Un marco abierto de lectura larga es probable que sea parte
de un gen.
57
CAPITULO - III GENES
ORF Finder busca marcos abiertos de lectura (ORF) en la secuencia de ADN que Ud.
introduzca. El programa devuelve el rango de cada ORF, junto con la traducción de la
proteína correspondiente. ORF Finder soporta el alfabeto IUPAC y varios códigos
genéticos. Utilice ORF Finder para buscar posibles segmentos de codificación de
proteínas en nuevas secuencias de ADN.
http://www.ncbi.nlm.nih.gov/gorf/gorf.html
58
CAPITULO - III GENES
59
CAPITULO - III GENES
60
CAPITULO - III GENES
61
CAPITULO - III GENES
Un método de previsión muy fiable sería aquel que analizase la evolución de distintos
desarrollos teniendo en cuenta las interrelaciones entre dichos desarrollos e introdujese
la variable tiempo.
A partir de un estudio del tipo Delphi, se obtienen como conclusiones las probabilidades
y las fechas estimadas de ocurrencia de los eventos del cuestionario. Sin embargo, no
se consideran las interrelaciones entre los distintos desarrollos.
62
CAPITULO - III GENES
➢ En el modelo de Markov normal los estados son visibles. (a son los únicos
parámetros)
➢ Cada estado tiene una distribución de probabilidad sobre los posibles símbolos
de salida.
63
CAPITULO - III GENES
Estados ocultos -> la supuesta secuencia ancestral desde la cual las secuencias del
conjunto problema se presume han descendido.
El éxito de un HMM (HiddenMarkovModels) depende de tener un buen modelo “a priori”.
El HMM comienza con un alineamiento al azar -> construye un modelo -> mejora las
probabilidades en base a un entrenamiento iterativo -> se detiene cuando los
alineamientos no cambian.
Desventajas:
3.4 GENSCAN
64
CAPITULO - III GENES
Los modelos del sitio de empalme se describen en más detalle en: Burge, CB (1998) las
dependencias de modelado de señales de empalme pre-ARNm. En Salzberg, S., Searls,
D. y Kasif, S., eds. Métodos Computacionales en Biología Molecular, ElsevierScience,
Amsterdam, pp 127-163.
Lo primero que hacemos es buscar en entrez una secuencia del ser humano para que
pueda ser analizada por Genscan.
Lo primero que hacemos es buscar en entrez una secuencia del ser humano para que
pueda ser analizada por Genscan.
65
CAPITULO - III GENES
66
CAPITULO V - BASES DE DATOS
Pero no existe un método computacional que pueda realizar esto en tiempo razonable
para más de 3 secuencias cortas.
67
CAPITULO V - BASES DE DATOS
Confronta una secuencia con otra completa. Los primeros programas que se
desarrollaron para el alineamiento de secuencias fueron diseñados para tratar de crear
alineamientos globales, es decir para detectar similaridades utilizando las proteínas
enteras. Un alineamiento que se extiende a lo largo de toda la longitud de las secuencias
utilizadas se denomina alineamiento GLOBAL, como en los ejemplos que acabamos de
ver anteriormente. Este tipo de alineamientos son buenos para proteínas globulares
(que carecen de dominios definidos) y en el caso de que las dos secuencias sean muy
parecidas a lo largo de toda su longitud (secuencias que han divergido poco a lo largo
de la evolución).
68
CAPITULO V - BASES DE DATOS
➢ cada solución parcial de estados posteriores puede ser calculada por iteración
sobre un número fijo de soluciones parciales de los estados anteriores
69
CAPITULO V - BASES DE DATOS
En los siguientes gráficos podemos ver como se realiza la alineación de secuencias con
las dos más cercanas y la siguiente:
70
CAPITULO V - BASES DE DATOS
Árbol Filogenético
71
CAPITULO V - BASES DE DATOS
Todos los seres vivos comparten su origen: todos provienen del reino móneras. Este
reino abarca los seres unicelulares procariotas, que carecen de núcleo celular. Son las
arqueo bacterias y las eubacterias.
De las móneras surgieron los protoctistas. Este reino reúne seres eucariotas
unicelulares heterótrofos y con digestión interna (protozoos), y eucariotas unicelulares
o pluricelulares sin tejidos, autótrofos fotosintéticos (algas).
Los tres dominios propuestos por Carl Woese (1990) son: Archaea, que reúne a las
arqueo bacterias; Bacteria, que comprende a las eubacterias; y Eucarya, que incluye a
todos los seres eucariotas.
Los árboles filogenéticos son una representación gráfica de las similitudes y diferencias
entre unas secuencias determinadas. Habitualmente, las secuencias de los genes y las
proteínas son más parecidas entre organismos más cercanos evolutivamente. Los
organismos que hace más tiempo que se separaron en la evolución suelen tener más
diferencias en las secuencias de sus respectivos genes, y, por lo tanto, cuando se
realiza un árbol filogenético, aparecen más alejados entre sí.
4.2.1 Clustal
72
CAPITULO V - BASES DE DATOS
Al igual que BLAST, también hay servidores web para correr CLUSTALW sin necesidad
de instalar software, pero asimismo tiene ventajas instalarlo localmente, sobre todo para
correr trabajos de alineamiento múltiple a gran escala y tener todo el proceso bajo
control.
73
CAPITULO V - BASES DE DATOS
74
CAPITULO V - BASES DE DATOS
75
CAPITULO V - BASES DE DATOS
4.2.2 Jalview
➢ Ver
Lee y escribe en las alineaciones en una variedad de formatos (Fasta, PFAM, MSF,
Clustal, BLC, PIR).
Guarda las alineaciones y los árboles asociados en JalView formato XML.
➢ Editar
➢ Análisis
➢ Anotar
➢ Publicar
77
CAPITULO V - BASES DE DATOS
4.3.1 Proteínas
78
CAPITULO V - BASES DE DATOS
4.3.2 Proteóma
Es el conjunto de todas las proteínas producidas por una célula en un instante de tiempo.
El término proteóma se utilizó por primera vez en 1995 y ha sido aplicado a diferentes
escalas en los sistemas biológicos. El proteoma celular es la totalidad de proteínas
expresadas en una célula particular bajo condiciones de medioambiente y etapa de
desarrollo, (o ciclo celular) específicas, como lo puede ser la exposición a estimulación
hormonal.
79
CAPITULO V - BASES DE DATOS
También se puede hablar del proteoma completo de un organismo que puede ser
conceptualizado como las proteínas de todas las variedades de proteomas celulares.
Es aproximadamente, el equivalente proteínico del genoma.
80
CAPITULO V - BASES DE DATOS
4.3.3 Proteómica
En la primera dimensión las proteínas se separan por isoelectroenfoque, que separa las
proteínas con base en su carga eléctrica.
En la segunda dimensión, las proteínas se separan por peso molecular utilizando SDS-
PAGE.
El análisis de estos cambios está siendo cada vez más utilizado en la moderna
81
CAPITULO V - BASES DE DATOS
Significa tomar una proteína compararla con otras proteínas conocidas para ver
fundamentalmente su función. La proteínas al estudiar su estructura se pueden dividir
por Familias esta clasificación es jerárquica: Superfamilias, familias y subfamilias.
82
CAPITULO V - BASES DE DATOS
83
CAPITULO V - BASES DE DATOS
4.5.1 PROSITE
PROSITE es una base de datos de familias y dominios de proteínas creada por Amos
Bairoch en 1988. Consiste en entradas que describen dominios, familias y sitios
funcionales así como patrones de aminoácidos. Estos son manualmente verificados por
un equipo del Instituto Suizo de Bioinformática e integrado con la base de datos de
Swiss-Prot.
En PROSITE existe un patrón para describir la superfamilia de las proteínas que unen
ATP/GTP, que es enorme. En Pfam, sin embargo, existen diversos dominios para las
distintas familias que unen ATP/GTP: la familia ras, la familia de factores de elongación
de la traducción, etc.
Cogeremos una secuencia de una proteína prueba en este caso será de Miosina de
Arabidopsisthaliana. Entonces lo primero que haremos es seleccionarla si ya la hemos
buscado, en nuestro caso la tomaremos de la plataforma moodle:
84
CAPITULO V - BASES DE DATOS
85
CAPITULO V - BASES DE DATOS
86
CAPITULO V - BASES DE DATOS
4.5.2 PRINTS
87
CAPITULO V - BASES DE DATOS
88
CAPITULO V - BASES DE DATOS
89
CAPITULO V - BASES DE DATOS
90
CAPITULO V - BASES DE DATOS
91
CAPITULO V - BASES DE DATOS
4.5.3 Pfam
92
CAPITULO V - BASES DE DATOS
Nótese que una única proteína puede pertenecer a varias familias Pfam.
1.
93
CAPITULO V - BASES DE DATOS
2.
3.
94
CAPITULO V - BASES DE DATOS
4.
5.
95
CAPITULO V - BASES DE DATOS
96
CAPITULO V - BASES DE DATOS
5.1 Introducción
El término base de datos fue acuñado por primera vez en 1963, en un simposio
celebrado en California.
De forma sencilla podemos indicar que una base de datos no es más que un conjunto
de información relacionada que se encuentra agrupada o estructurada.
El archivo por sí mismo, no constituye una base de datos, sino más bien la forma en que
está organizada la información es la que da origen a la base de datos. Las bases de
datos manuales, pueden ser difíciles de gestionar y modificar. Por ejemplo, en una guía
de teléfonos no es posible encontrar el número de un individuo si no sabemos su
apellido, aunque conozcamos su domicilio.
Los problemas expuestos anteriormente se pueden resolver creando una base de datos
informatizada.
Desde el punto de vista informático, una base de datos es un sistema formado por un
conjunto de datos almacenados en discos que permiten el acceso directo a ellos y un
conjunto de programas que manipulan ese conjunto de datos.
Desde el punto de vista más formal, podríamos definir una base de datos como un
conjunto de datos estructurados, fiables y homogéneos, organizados
independientemente en máquina, accesibles a tiempo real, compartibles por usuarios
concurrentes que tienen necesidades de informaciones diferentes y no predecibles en
el tiempo.
La idea general es que estamos tratando con una colección de datos que cumplen las
siguientes propiedades:
97
CAPITULO V - BASES DE DATOS
Al igual que cuando se habla, p.ej., de coches no existe un único modelo, ni una sola
marca, ni siquiera una sola tecnología sobre su funcionamiento, cuando se trabaja con
bases de datos ocurre una cosa parecida: no existe una sola marca, sino varias, y
además cada marca puede tener diferentes productos cada uno de ellos apropiado a un
tipo de necesidades.
Sin embargo, la división que vamos a hacer aquí de las bases de datos será en función
de la tecnología empleada en su funcionamiento. Hablando de coches tenemos los
tradicionales de motor a gasolina, los de gasóleo, los turbo diesel, los que funcionaban
con gasógeno, y mucho menos frecuentes los coches solares o incluso los de propulsión
a chorro; pues bien, hablando de bases de datos tenemos que las más utilizadas son la
bases de datos relacionales, las más antiguas son las jerárquicas y en red, y las más
avanzadas son las orientadas a objetos, y las declarativas. Estas se diferencian como
hemos dicho, en la forma de trabajar con los datos y en la concepción o mentalidad que
el usuario debe adoptar para interactuar con el sistema.
98
CAPITULO V - BASES DE DATOS
➢ Registro: Viene a ser como cada una de las fichas almacenadas en un fichero
convencional.
➢ Campos o elementos de datos. Son cada uno de los apartados de que se
compone una ficha.
➢ Conjunto: Es el concepto que permite relacionar entre sí tipos de registro
distintos.
Podemos imaginar los registros simplemente como fichas de un fichero. Para ilustrar el
99
CAPITULO V - BASES DE DATOS
100
CAPITULO V - BASES DE DATOS
Las bases de datos relacionales han sido y siguen siendo ampliamente utilizadas para
una extensa gama de aplicaciones. Sin embargo, el aumento de potencia de los
ordenadores personales, ha hecho aparecer nuevas aplicaciones potentes que
requieren la utilización de datos complejamente relacionados o con necesidades de
consultas muy particulares, como puedan ser p.ej., los sistemas de información
geográficos, el diseño de circuitos electrónicos por ordenador, etc.
Una base de datos orientada a objetos es una base de datos donde los elementos son
objetos. Estos pueden ser bases de datos multimedia (videos, imágenes y sonidos),
donde la herencia nos permita una mejor representación de la información, estas bases
de datos tienen una identidad de ser un Todo, y no solo una parte de una gran base,
por ejemplo una base de secuencias de ADN.
El objetivo de una base de datos orientada a objetos son los mismos que los de las
bases de datos tradicionales, pero con la ventaja de representar las modelos de datos
con un marco mucho más eficiente, manteniendo la integridad y relación entre ellos.
➢ Clase. Cuando hay varios objetos semejantes, pueden agruparse en una clase.
De hecho, todo objeto debe pertenecer a una clase, que define sus
características generales.
➢ Estado. Son las características propias de cada objeto. Siguiendo con el caso de
los engranajes, su estado puede ser el número de dientes, el tamaño, etc. El
estado se utiliza especialmente para guardar la situación del objeto que varía con
el tiempo. En nuestro caso almacenaríamos la situación en un espacio
tridimensional, y la posición o postura en que se encuentra.
102
CAPITULO V - BASES DE DATOS
Antes de comenzar, aclararemos que, cuando se vea el lenguaje SQL sobre las bases
de datos relacionales, diremos que este es un lenguaje no procedural, en el sentido de
que el usuario especifica qué es lo que quiere, pero no cómo. No se debe confundir este
aspecto del SQL con un lenguaje puramente declarativo, ya que éstos, amplían la
filosofía de la base de datos, de manera que el usuario no es consciente de los métodos
de búsqueda que se realizan internamente, y la forma en que se manejan los datos
también es muy distinta; además, en el caso de las funcionales, es necesario complicar
soberanamente los métodos utilizados si se quiere mantener la pureza de la
metodología funcional. Además, la teoría que subyace en ambos modelos difiere
radicalmente.
103
CAPITULO V - BASES DE DATOS
Siempre que un analista de sistemas de base de datos arma una base de datos, queda
a su cargo descomponer dicha base en grupos y segmentos de registros. Este proceso
es la descomposición; el mismo es necesario independientemente de la arquitectura de
la base de datos - relacional, red o jerárquica.
Sin embargo, para la base de datos relacional, la acción correspondiente puede dividirse
y expresarse en términos formales y se denomina normalización a la misma.
5.3.2 Normalización
¿Qué es normalización?
104
CAPITULO V - BASES DE DATOS
105
CAPITULO V - BASES DE DATOS
106
CAPITULO V - BASES DE DATOS
Una base de datos biológica es una biblioteca de información sobre ciencias de la vida,
recogida de experimentos científicos, literatura publicada, tecnología de
experimentación de alto rendimiento, y análisis computacional.1 Contiene información
de áreas de investigación incluyendo genómica, proteómica, metabolómica, expresión
génica mediante microarrays, y filogenética.2 La información contenida en bases de
datos biológicas incluye funciones, estructura y localización (tanto celular como
cromosómica) de genes, efectos clínicos de mutaciones, así como similitudes de
secuencias y estructuras biológicas.
Una base de datos biológica es un almacén de datos para información derivada de los
datos obtenidos experimentos biológicos, ni más ni menos. Y una base de datos
bioinformática es un almacén de datos para información derivada de datos biológicos y
de programas bioinformáticos. Si bajamos al nivel más técnico, las bases de datos
biológicas y bioinformáticas están disponibles generalmente como un conjunto de
ficheros planos, cuyo tamaño suele ser enorme. Para que os hagáis una idea, os incluyo
un gráfico público de crecimiento de la base de datos GenBank desde 1982 hasta 2008.
➢ PDB
➢ MMDB
➢ SCOP
108
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
109
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
Aproximadamente el 8%
del ADN deriva de virus
que en algún minuto
entraron al cuerpo de
nuestros ancestros.
110
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
111
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
Veamos el siguiente cuadro comparativo que nos podrá aclarar las dudas en cuanto a
la diferencias con el ADN:
112
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
113
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
Al igual que el ADN, se refiere a la secuencia de las bases nitrogenadas que constituyen
sus nucleótidos.
Alguna vez, en una misma cadena, existen regiones con secuencias complementarias
capaces de aparearse.
114
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
115
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
La palabra proteína proviene del griego protop (lo primero, lo principal, lo más
importante). Las proteínas son las responsables de la formación y reparación de los
tejidos, interviniendo en el desarrollo corporal e intelectual.
116
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
Una cadena polipeptídica consiste en una cadena lineal de aminoácidos unidos por
enlaces peptídicos. El primer puesto de la cadena corresponde al grupo amino terminal,
y la estructura primaria es la secuencia en la que están situados todos los constituyentes
hasta llegar al carboxilo terminal. Esta secuencia está codificada genéticamente.
Existen cadenas poli peptídicas de cualquier número de aminoácidos, sin que exista una
solución de continuidad entre péptidos y proteínas. Por convención, se suele considerar
proteína aquellos poli péptidos con un peso molecular del orden de 10.000 o más.
117
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
118
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
119
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
Las proteínas determinan la forma y la estructura de las células y dirigen casi todos los
procesos vitales. Las funciones de las proteínas son específicas de cada una de ellas y
permiten a las células mantener su integridad, defenderse de agentes externos, reparar
daños, controlar y regular funciones.
Todas las proteínas realizan su función de la misma manera: por unión selectiva a
moléculas. Las proteínas estructurales se agregan a otras moléculas de la misma
proteína para originar una estructura mayor. Sin embargo, otras proteínas se unen a
moléculas distintas: los anticuerpos, a los antígenos específicos; la hemoglobina, al
oxígeno; las enzimas, a sus sustratos; los reguladores de la expresión genética, al ADN;
las hormonas, a sus receptores específicos.
120
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
Crecimiento
Cuando se fundó, el PDB contenía tan sólo 7 estructuras de proteínas. Desde entonces
ha experimentado un crecimiento aproximadamente exponencial en el número de
estructuras y nada parece indicar que el ritmo vaya a decaer.
http://www.rcsb.org/pdb/home/home.do
Interfaz: podemos navegar dependiendo el organismo que queremos examinar, así que
seleccionamos entre las diferentes opciones brindadas.
121
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
122
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
123
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
Las proteínas para llevar a cabo sus funciones deben alcanzar una forma determinada,
conocida como “Pliegue”, en otras palabras, antes de realizar su trabajo tienen que
ensamblarse así mismas. Este proceso de auto ensamblaje se le llama “Plagamiento”.
Para esto las células tienen sistemas que reducen las posibilidades de que las proteínas
estén mal plegadas, además cualquier proteína de este tipo son degradados por grupos
celulares especializados del sistema de eliminación.
Por lo general, todas las moléculas de proteína de cualquier especie adoptan una
conformación única, llamada Cadena Nativa. Para la gran mayoría de las proteínas, el
estado natural es la forma más estable plegada de la molécula.
124
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
Chaperonas Moleculares
De particular importancia son las chaperonas presentes en todos los tipos de células y
en los compartimentos celulares. Algunas chaperonas interactúan con las cadenas
recién formadas que emergen de los ribosomas. En tanto que otras guían en las etapas
posteriores del plegado. Las chaperonas moleculares frecuentemente trabajan en
conjunto asegurando que los diferentes estadios en el plegado de cada sistema sean
completamente eficientes. Muchos de los detalles del funcionamiento de las chaperonas
moleculares han sido determinados en estudios realizados in Vitro.
125
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
Chaperoninas
126
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
todos los organismos, y en realidad son mucho mayores, pues son grandes oligómeros
compuestos por subunidades de esa masa molecular que forman siempre la misma
estructura, un doble anillo dispuesto espalda contra espalda.
Las chaperoninas se clasifican en dos grupos, las de tipo I que se encuentran en las
eubacterias y en organelos endosimbiontes, y las de tipo II que se localizan en las
arqueo bacterias y en el citosol de eucariotas. Las de tipo II son más complejas que las
de tipo I, pero todas ellas funcionan como chaperonas generales, capaces de plegar
casi cualquier proteína desnaturalizada en cualquier conformación, mediante
interacciones hidrófobas entre los residuos de las proteínas desnaturalizadas y los que
se encuentran en la entrada de la cavidad de la chaperonina.
El alineamiento estructural puede usarse, por lo tanto, para sugerir relaciones evolutivas
entre proteínas que comparten una secuencia común muy corta. Sin embargo, el uso
127
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
de los resultados como evidencia de un ancestro evolutivo común debe realizarse con
cautela dados los posibles efectos de confusión con la evolución convergente, según la
cual múltiples secuencias de aminoácidos sin relación filogenética entre si convergen a
una misma estructura terciaria."
128
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
Cuando se alinean estructuras con secuencias muy diferentes, los átomos de la cadena
lateral, generalmente, no se toman en cuenta, ya que sus identidades difieren en
muchos de los residuos alineados. Por esta razón, en los métodos de alineamiento
estructural es común usar por defecto solo los átomos del esqueleto incluidos en el
enlace peptídico. Solo cuando las estructuras a alinear son altamente similares, e
incluso idénticas, es significativo alinear posiciones de átomos de la cadena lateral, en
cuyo caso la RMSD refleja no solo la conformación del esqueleto de la proteína
129
CAPÍTULO VI - ESTRUCTURAS BIOLÓGICAS
130
CONCLUSIONES
➢ La bioinformática es una ciencia en continuo desarrollo, tiene que ver con cada
aspecto del vida cotidiana desde lo que consumimos en el desayuno, la cura de
enfermedades, hasta el desarrollo de modelos genéticos de cómo puede
cambiar un organismo debido al cambio en el medio ambiente.
131
DICCIONARIO DE TERMINOS.
A específico de ADN. Puede producirse
• ADN: Un ácido nucleico compuesto de in vivo o in vitro.
dos cadenas polinucleotídicas que se Ver clonación, reacción en cadena de
disponen alrededor de un eje central la polimerasa.
formando una doble hélice, capaz de
autorreplicarse y codificar la síntesis de • Anabolismo (del griego ana =
ARN. sobre, metabole = cambio): en un
organismo el conjunto de reacciones
• ADN complementario (cADN): ADN biosintéticas o sea las reacciones en
sintetizado a partir de un molde de que moléculas pequeñas forman
ARN; esta cadena no apareada suele moléculas más grandes.
utilizarse como sonda (probe)
en mapeos físicos. • Anticuerpos (del griego anti = contra)
Proteínas producidas por las células
• Aminoácidos (del griego Ammon = del sistema inmune (linfocitos B) que se
dios egipcio cerca de cuyo templo se combinan específicamente con
prepararon por primera vez las sales de moléculas extrañas al organismo
amonio a partir de estiércol de (antígenos) con la finalidad de
camello): Las subunidades inactivarlas.
(monómeros) que forman
las proteínas (polímeros). Cada • Antígenos (del griego anti =
aminoácido posee por lo menos un contra; genos = origen): Moléculas,
grupo funcional amino (básico) y un generalmente extrañas al organismo
grupo funcional carboxilo (ácido) y receptor, que inician la producción
difiere de otros aminoácidos por la de anticuerpos, generalmente son
composición de su grupo R. proteínas o combinaciones de
proteínas con polisacáridos.
• Actina (del griego aktis = rayo):
Proteína compuesta por subunidades • ARN (ácido ribonucleico): Ácido
globulares que forma filamentos. nucleico formado por una cadena
polinucleotídica. Su nucleótido,
• Adaptación (del latín adaptare = consiste en una molécula del azúcar
acomodar): Tendencia de un ribosa, un grupo fosfato, y una de estas
organismo a "adecuarse" a su medio cuatro bases nitrogenadas: adenina,
ambiente; uno de los principales uracilo, citosina y guanina.
puntos de la teoría de la evolución por
la selección natural de Charles Darwin: • ARN mensajero: "Molde" para la
los organismos se adaptan a su medio síntesis proteica que es copiado de una
ambiente. Aquellos organismos mejor de las hebras de ADN y que se traduce
adaptados tendrán mayor probabilidad en los ribosomas en una secuencia
de sobrevivir y pasar sus genes a la proteica. Se abrevia ARNm.
siguiente generación.
• ARN ribosómico: Uno de los tres tipos
• Amplificación: Un aumento del de ARN, el ARNr es un componente
número de copias de un fragmento estructural de los ribosomas. Son el
"core" (parte principal) de los
132
ribosomas y posiblemente la clave del compuesto de neutrones y protones, y
mecanismo de traducción de las en electrones que se mueven
proteínas. Su estudio comparativo llevó alrededor de mismo.
a postulación de un Árbol Filogenético
Universal. • ATP: (adenosín trifosfato): El principal
producto químico utilizado por los
• ARNs satélites: ARN similar a sistemas vivientes para almacenar
los viroides empaquetados energía, consiste en un una base
en capsides de determinadas cepas (adenina) unida a un azúcar (ribosa) y
de virus, se replican en presencia del a tres fosfatos. Fórmula.
virus "colaborador" específico,
modificando su patogenicidad.
137
Los genes expresados incluyen a
• Eustela: tipo de estela o cilindro aquellos que han sido transcriptos a
vascular más evolucionado, hueco y ARNm y luego traducidos a proteínas
formado por hacecillos vasculares y aquellos que han sido transcriptos a
colaterales en un solo círculo. ARN pero no traducidos a proteínas
(p.ej. ARNt y ARNr).
• Evolución (del latín e- =
fuera; volvere = girar): Cambio de los • Expresión: En genética, proceso por el
organismos por adaptación, variación, cual la información codificada en
sobrerreproducción y reproducción / los genes se convierte en estructuras
sobrevivencia diferencial, proceso al operacionales presentes en la célula.
que Charles Darwin y Alfred Wallace se
refirieron como selección natural. • Expresividad y penetrancia: El grado
de expresión de un gen puede variar
• Exina (del latín ex = fuera): Cubierta como resultado de su interacción con el
externa de los granos de polen, a ambiente o con otros genes.
menudo compuesta por Esta EXPRESIÓN VARIABLE se ve
esporopolenina, unpolisacárido ácido en la polidactilia (presencia de dedos
resistente que facilita la fosilización de supernumerarios en manos o pié),
los granos de polen. causada por una alelo dominante.
Existe una gran variabilidad en la
• Exocitosis: El proceso en el cual una expresión entre los integrantes de la
vesícula primero se fusiona con la familia algunos tienen dedos
membrana plasmática y luego se abre supernumerarios en pies y manos y
y libera su contenido al exterior. otros, solo en el pié.
139
• Fosas: en geografía se denomina así a parenquimáticas con algunas
las grandes profundidades marinas. de colénquima yesclerénquima, ocupa
el espacio entre la epidermis y el
• Fosfolípidos (del griego lipos = sistema vascular; interviene en
grasa): moléculas lipídicas asimétricas, la fotosíntesis, almacenamiento de
con una "cabeza" hidrofílica y una agua y alimentos. También tiene
"cola"hidrofóbica. Posee un grupo funciones de soporte.
fosfato en lugar de uno de los tres En hojas, raíces y tallos jóvenes todo
ácidos grasos que esterifican a la lo que no sea o vascular.
glicerina en las grasas.
El grupo fosfato además se une a
bases orgánicas como la colina. G
• Galaxias (del griego galaxias =
• Fósiles (del latín fossilis = "que se relativo a la leche, de allí "vía láctea"):
saca cavando la tierra", enterrado): cada una de las grandes agrupaciones
Los vestigios o restos de vida del tipo de nuestra "vía láctea”, que
prehistórica preservadas en las rocas aisladas en los espacios siderales
de la corteza Terrestre.Cualquier constituyen los elementos que
evidencia de vida pasada. conforman el universo.
• Fotosíntesis (del griego photos = • Gameto (del griego gamos = "unión de
luz, syn = juntos, tithenai = ubicar): los sexos", esposa): Célula
Conversión de energía lumínica en reproductora haploide(n) que cuando
energía química. Síntesis de su núcleo se fusiona con otro gameto
compuestos orgánicos a partir de (n) del sexo opuesto origina un cigoto
anhídrido carbónico y agua utilizando (2n), que por mitosis desarrolla un
la energía lumínica captada por individuo con células somáticas
laclorofila. diploides (2n), en algunos hongos y
protistas puede, por meiosis, producir
• Fotosistema: 1) Unidad compuesta células somáticas haploides (n).
por cientos de moléculas de clorofila y
otras moléculas accesorias embebidas • Gametofítica: generación que se inicia
en los tilacoides de los cloroplastos e con la meiosis y termina en la
implicada en reacciones fotosintéticas fecundación, en las plantas con flores
que requieren luz. está representada por la micróspora
Los eucariotas poseen dos tipos de (gametofito masculino) y el saco
fotosistemas: el I y el II. embrionario (gametofito femenino)
2) La serie de pigmentos verdes
relacionados con la absorción de la
• Gametofito (del griego gamos =
energía luminosa, que en eucariotas
"unión de los sexos", esposa; phyton =
ocurre en los tilacoides de los
plantas): En las plantas que presentan
cloroplastos.
alternancia de generaciones, el
La energía de la luz es pasada a los
estadio haploide que
electrones a medida que ellos se
produce gametos por mitosis.
mueven a través de los pigmentos del
fotosistema.
• Gametofito masculino: grupo de dos
a cuatro células que se encuentran
• Fundamental: tejido compuesto
constituyendo el grano de polen.
principalmente por células
140
Plantas con semillas desnudas; las
• Generación: período de desarrollo en primeras plantas con semillas.
el ciclo biológico de un organismo, Entre los actuales grupos vivientes
originado a partir de una estructura tenemos a las coníferas (p. ej.Pinus).
reproductiva y que termina en otra
estructura reproductiva luego de una • Gineceo (del griego gyne =
serie de mitosis sucesivas. hembra, oikos = casa): Termino
colectivo aplicado a todos los carpelos
• Género (del latín genus = raza, (o pistilos) de una planta. Algunas
orígen): Subcategoría taxonómica plantas tienen varios pistilos parciales
dentro de la Familia, se compone de o totalmente fusionados.
uno o más especies.
• Glicerina (del griego glykeros =
• Genes (del griego genos = "sabor dulce"): propanotriol,
nacimiento, raza; del latín genus = polialcohol de tres átomos de carbono.
raza, origen): segmentos específicos
de ADN que controlan las estructuras • Glicólisis: El proceso metabólico
y funciones celulares; la unidad universal del mundo celular en el cual
funcional de la herencia. la glucosa (6 carbonos) se rompe en
Secuencia de bases de ADN que dos moléculas de piruvato (tres
usualmente codifican para una carbonos) y en el proceso se produce
secuencia polipeptídica de ATP y NADH.
aminoácidos.
• Glucosa: Azúcar común, con seis
átomos de carbono
• Genética : el estudio de la herencia de (C6H12O6), monosacárido más
los caracteres. frecuente en la mayoría de los
organismos.
• Genoma 1.Conjunto de genes de un
individuo.2.Conjunto de genes • Gónada (del griego gone= semilla ):
compartidos por los miembros de una Órgano productor de gametos de los
unidad reproductiva tales como una animales pluricelulares, ovario o
población o especie.Todo el material testículo.
genético de los cromosomas de un
organismo en particular, su tamaño se
da generalmente como el número total
de bases apareadas. H
• Genotipo: La totalidad de los alelos de
un organismo.
• Halófilas (del griego halos = sal,
mar; philios= amigo): bacterias que
• Geotropismo: fenómeno trópico en el
medran en ambientes salinos.
que el factor estimulante es la
gravedad.
• Haploide (del griego haploos =
simple, ploion = nave): Célula que
• Gimnospermas (del griego gymnos =
contiene solo un miembro de
desnudo, sperma = semilla):
cada cromosomahomólogo (número
literalmente, semillas desnudas.
haploide = n).
141
En la fecundación, homólogos.
dos gametos haploides se fusionan Cuando los dos alelos son diferentes,
para formar una sola célula con un el alelo dominante es el que se
número diploide (por oposición, 2n) de expresa.
cromosomas.
• Heterogamético (del griego heteros =
• Hemofilia (del otro): El sexo que posee
griego haima, haimatos = dos cromosomas sexuales diferentes,
sangre; philos = amigo): desorden como los machos en el caso humano y
genético humano recesivo, ligado al de la Drosophila.
sexo , resultante de la ausencia de
determinados factores que intervienen • Heteropolímero (del griego heteros =
en la coagulación de la sangre, otro, diferente; polys =
generalmente Factor VIII. muchos, meros = parte): Polímero
Los hemofílicos tienen dificultades en cuyas subunidades son diferentes.
la coagulación de su sangre.
• Heterótrofos (del griego heteros =
• Herbáceas (del latín herba = pasto): otro, diferente; trophe = nutrición, que
término utilizado para nombrar a las se alimenta de): Organismos que
plantas sin madera en el tronco (no obtienen sus alimentos rompiendo
leñosas), tienen un crecimiento moléculas orgánicas sintetizadas por
secundario mínimo. otros organismos para obtener
energía, opuesto a autótrofo.
• Herbicida: Sustancia que destruye o Incluyen a muchas bacterias, hongos y
inhibe el crecimiento de las plantas. animales.
142
Compuesto orgánico en el cual por mueve desde la de menor
cada átomo de carbono se encuentra concentración hacia la de mayor
hidrógeno y oxígeno en una proporción concentración.
2:1, p.
ej. • Histonas: Grupo de cinco proteínas
el azúcar. básicas asociadas con el ADN de
los eucariotas.
• Hidrocarburo: compuesto orgánico
formado solo por carbono e hidrógeno. • HIV (del ingles, VIH, en
castellano, Virus de
• Hidrófila: polinización efectuada por el la Inmunodeficiencia Humana).
agua. El retrovirus que ataca a las células T
del sistema inmunitario, destruyendo
• Hidrofílico (del latín hydro = las defensas y permitiendo el
agua, philios = amigo): Término desarrollo del síndrome de
aplicable a las moléculas polares que inmunodeficiencia adquirida (SIDA).
pueden formar puentes hidrógeno con
el agua. • "Homebox" genes: Corta secuencia
de nucleótidos virtualmente idéntica
• Hidrofóbico (del latín hydro = agua, en todos los genes de los organismos
del griego phobeo = "yo temo") que la contienen. Se la ha encontrado
Término aplicable a las moléculas en numerosos organismos, desde la
apolares que no pueden formar mosca de la fruta a los seres
puentes hidrógeno con el agua. humanos.
En la mosca de la fruta parecen
• Hidrólisis (del latín hydro = agua; del determinar los grupos particulares de
griego lysis = disolución): Ruptura de genes que se expresan durante el
una molécula por la adición de agua. desarrollo.
143
los encuentra en células diploides. desarrolla métodos para la búsqueda
rápida en bases de datos, analizar la
• Homoxilo: leño uniforme, información proveniente de las
homogéneo. secuencias de ADN y para predecir la
secuencia de las proteínas a partir de
• Hormona (del griego hormaein = la secuencia de ADN.
excitar): cualquier producto químico de
naturaleza orgánica producido en una
parte de un organismo que tiene como • Inserción (del latín insertare=
"blanco" otra parte del mismo. intercalar): Tipo de mutación en la cual
Sus funciones son reguladoras, se intercalan una o más bases
generalmente se producen en de ADN en una secuencia de bases de
pequeñas cantidades. ADN preexistente.
Esto produce un corrimiento del marco
• Hormona vegetal: Compuesto de lectura en el proceso de síntesis
orgánico que se sintetiza en alguna proteica dando, por lo general, como
parte de la planta y se transloca a otra resultado una proteína alterada.
parte, en donde a concentraciones
muy bajas causan una respuesta • Interfase: la parte más larga del ciclo
fisiológica. celular, ocurre antes de la mitosis o
meiosis; comprende a las
• Horquilla de replicación: La fases G1, S, G2.
estructura en forma de Y que se forma
en el punto donde se separan las • Intrón: La secuencia de bases de ADN
hebras del ADN al momento de que interrumpe la secuencia de un gen
la replicación y donde se sintetizan las que codifica para una proteína, esta
dos cadenas complementarias. secuencia se transcribe al ARNm pero
en un proceso de "corte y empalme" se
separa del mismo antes que el ARN
• Inversión: Alteración en un segmento
del cromosoma que tiene como
consecuencia que los genes queden
ordenados de manera inversa a la
I original.
• Idioblasto: célula que difiere Ocurre por una doble ruptura y giro de
marcadamente por su forma, tamaño 180 grados del segmento.
o contenido de las otras células del
mismo tejido. • "in vitro": del latín literalmente "en
vidrio", se usa para indicar
• Imperfectas: flores con un solo sexo, experimentos realizados fuera de un
femeninas o pistiladas y flores organismo vivo.
masculinas o estaminadas.
• Isodiamétrico: de forma regular, con
• Informática: El estudio de la todos los diámetros igualmente largos
aplicación de la computadora y • Isótopo (del griego isos =
técnicas estadísticas al manejo de la igual, topos = lugar): átomos con el
información. mismo número atómico pero con un
En el proyecto genoma la informática diferente número de neutrones; se los
144
nombra agregando el número de masa más próximos se encuentren los
al nombre del elemento, p.ej.carbono marcadores menores son las
12 o 12C; carbono 14 o14C. posibilidades que se separen durante
los procesos de división celular y por lo
tanto mayor la posibilidad de que se
J hereden juntos.
• Jurásico: Período que aconteció
• Lípidos (del griego lipos = grasa):
alrededor de la mitad de la era
Intervienen en el almacenamiento a
Mezosoica (ver Figura), hace unos 185
largo plazo de la energía celular,
- 135 millones de años.
aislamiento, forman parte de
Caracterizado por ser el momento del
estructuras (p.ej.membranas) y en
posible origen de las Angiospermas y
ciertos casos en funciones de control.
la continuación de la ruptura del
Este grupo incluye a las grasas,
supercontinente Pangea.
aceites, los esteroides (p.ej.
el colesterol), los fosfolípidos y los
carotenoides.Moléculas orgánicas no
polares insolubles en agua y soluble en
K solventes orgánicos (también no
• Kilobase (kb): Unidad de longitud del polares).
ADN equivalente a 1000 (1k)
nucleótidos.
M
L • Madera: la parte central del tallo
• Látex: emulsión acuosa de sustancias (compuesta de xilema) de las plantas
insolubles, resinas y caucho, con leñosas.
azúcares, gomas y alcaloides, que
circulan por tubos laticíferos en el • Magnetita: Las magnetitas fósiles se
cuerpo de algunas plantas. consideran de origen bacteriano.
Curiosamente cadenas de magnetizas
se encontraron en el meteorito
• Leño: (del latín, lignum: madera) marciano ALH84001 con un patrón
conjunto de elementos conductores semejante al de las bacterias
lignificados. Tejidos secundarios terrestres.
producidos por el cámbium hacia el
interior del mismo. • Mapa comosómico: Diagrama que
muestra las posiciones relativas en un
• Librería: una colección desordenada cromosoma de los loci de los genes,
de clones (por ejemplo ADN clonado de basado en la frecuencia en que
un organismo particular) cuyas heredan conjuntamente.Las distancias
interrelaciones pueden establecerse se miden en centimorgans (cM).
por mapeo físico.
• Mapa Físico: mapa de la localización
• Ligamiento (del inglés linkage): La de marcas identificables en el ADN (p.
proximidad de dos o más (genes) ej.genes, sitios de corte de enzimas de
marcadores en un cromosoma; cuanto restricción, bandas) que se
145
confecciona prescindiendo de los encuentra por encima de los 200
fenómenos hereditarios.Las distancias micrones.
se miden en pares de bases.En el
genoma humano el mapa físico de • Meiosis (del griego meio = menor;
menor resolución lo constituye los meiosis = reducción): División celular
patrones de bandeo de los 24 en la cual la copia de los cromosomas
cromosomas diferentes (22 es seguida por dos divisiones
autosómicos, el X y el Y).El de mayor nucleares.
resolución lo constituirá la secuencia Cada uno de los
completa de nucleótidos de los cuatro gametos resultantes recibe la
cromosomas. mitad del número de cromosomas
(número haploide) de la célula original.
• Mapeo genético: Determinación de la
posición relativa de los genes en la • Melanina (del griego melan= negro):
molécula de ADN (plásmido o pigmento que da color a la piel y
cromosoma) y las distancias (unidades protege a la capas subyacentes de la
de "unión") entre ellos. radiación ultravioleta.
148
• NIH: (National Institute of Health) proteica (ARN) y transferencia de
Instituto Nacional de la Salud de los energía, como nucleótidos simples
Estados Unidos ATP, GTP, UTP.
• Nomenclatura binomial: Sistema de .
clasificación ideado por Linneo a .
comienzos del siglo 18.Cada especie (fórmulas) o dobles NADH y NADPH
de planta o animal recibe un nombre (fórmulas).
compuesto de dos términos, el primero
corresponde al genero y el segundo a • Nudo (del griego nodus = nudo): La
la especie; p.ej.Homo sapiens, el región de la planta adonde se
leguaje utilizado es el latín. implantan una o más hojas.
155
• Sinérgidas: Células en saco pasivos del protoplasto, tales
embrionario de las angiospermas que como almidón, glóbulos lipídicos,
flanquean la ovocélula. El tubo polínico cristales.
crece a través de una de ellas
(generalmente la más pequeña).
156
• Teoría celular: Uno de los conceptos • Transgénico: organismo portador de
unificadores en biología. La teoría material genético perteneciente a
celular sostiene que todos los seres especies no emparentadas transferido
vivos están compuestos por lo menos a él mediante ingeniería genética.
por una célula y que la célula es la
unidad fundamental y funcional de los • Translocación: fenómeno por el cual
organismos. La composición química un fragmento de un cromosoma se
de la célula es fundamentalmente transfiere a un cromosoma no
similar; toda célula se origina de una homólogo.
célula preexistente por división celular.
• Teoría cromosómica de la herencia:
propuesta en1903 por Walter Sutton y • Transporte activo: Transporte de
Teodoro Boveri, sostiene que los moléculas contra un gradiente de
cromosomas son los componentes concentración (de regiones de baja
físicos que contienen los genes. concentración a regiones de alta
concentración) con ayuda de proteínas
• Terapia génica (del de la membrana celular y energía
griego therapeuo = "yo cuido"): proveniente del ATP.
Inserción de ADN normal en una célula
para corregir un defecto genético. • Transporte de electrones: 1) Una
serie de reacciones de
• Timina: Una de las oxidación/reducción en las cuales los
bases pirimidínicas del ADN, la timina electrones son pasados como "papas
es reemplazada por el uracilo en calientes" de una proteína/enzima
el ARN. ligada a membrana a otra hasta que
finalmente son cedidos al aceptor final,
• Traducción: 1) La síntesis de una generalmente oxígeno. Durante este
proteína sobre un "molde" de ARNm, proceso se forma ATP 2) serie de
consiste en tres etapas: iniciación, reacciones acopladas durante las
elongación y terminación. cuales se genera ATP a partir de la
energía generada por los electrones
• Transcriptasa reversa: Enzima que se mueven de un estado altamente
utilizada para su replicación por los reducido a otro de menor reducción.
retrovirus; copia • Transporte pasivo: Difusión a través
el ARN del retrovirus en una hebra de la membrana plasmática sin gasto
complementaria de ADN. energético por parte de la célula.
159
BIBLIOGRAFÍA E INFOGRAFÍA
160