Anda di halaman 1dari 4

Bioinformática 2018: examen

Nicolas Soler, Ana Medina

25/10/2018

Los siguientes ejercicios son para realizarse en casa. Las preguntas están diseñadas para que tengáis más
práctica en lo que hemos visto en clase a la vez que conseguís información útil para vuestra futura investigación
científica. Por lo tanto sois libre de usar cualquier recurso que deséis, disponibles tanto en libros como en la
web pero las respuestas tienen que ser formuladas con vuestras propias palabras, dado que vuestro
objetivo es haber aprendido algo al final de este curso.
Note: Las preguntas (n) y (q) son opcionales y contarán como nota extra.
Una vez hayáis terminado, por favor enviar vuestras respuestas en un documento de Word, PDF o fichero de
texto antes de las 23:59 del día 9 de noviembre de 2018 al campus virtual o vía email a
bioinfoexamgpb@gmail.com

Pregunta 1: Estudio de las serinas hidroximetiltransferasas (6.5


puntos)
Estás interesado en las serinas-hidroximetiltransferasas (SHMT) por su potencial uso como dianas clínicas
en cáncer y malaria. Tu objetivo es mirar el sitio activo de estas enzimas para ver si se podrían desarrollar
inhibidores potenciales.

Obtener información sobre la secuencia

Usando la base de datos apropiada en la web, busca información sobre las versiones humanas de la enzima.
(a) ¿Cuántas isoformas de la SHMT humanas hay y en qué criterio se basa su clasificación? [0.5]
Vamos a obtener ahora información sobre la isoforma mitocondrial de la SHMT humana
(b) ¿Cuál es la reacción química que cataliza esta enzima? [0.5]
(c) ¿En qué contexto biológico ocurre esta reacción? [0.5]
Guarda la secuencia proteica en formato fasta para más adelante.

Búsqueda de homólogos

Usando la secuencia que has guardado, realiza una búsqueda en BLAST de la web del ncbi contra la SHMT2
mitocondrial humana, cambiando el parámetro “database” a "Model Organisms (landmark).
(d) Mirando a los diferentes resultados en términos de identidad de secuencia y tamaño, ¿qué puedes decir
sobre la conservación general de la SHMT en las especies? [0.5]

1
(e) Uno de los resultados (ABC transporter [Streptomyces coelicolor A3(2)]) al final de la lista tiene un
E-value de 1.6, ¿qué significa? [0.5]

Realizar un alineamiento de secuencia múltiple (MSA)

De tu resultado en BLAST, selecciona 10 secuencias de las diferentes especies listadas abajo (5 procariotas
y 5 eucariotas) además de las dos primeras secuencias SHMT humanas (por lo que serán 12 secuencias en
total). Puedes elegir cualquier isoforma pero asegúrate de elegir serina hidroximetiltransferasas y no otro
tipo de enzima.
Lista de eucariotas:
• Ratón (Mus musculus)
• Pez zebra (Danio rerio)
• Planta Arabidopsis (Arabidopsis thaliana)
• Gusano (Caenorhabditis elegans)
• Parásito de la malaria (Plasmodium falciparum)
Lista de procariotas:
• Deinococcus radiodurans
• Clostridioides difficile
• Mycobacterium tuberculosis
• Escherichia coli str. K-12
• Streptococcus pmeumoniae
Guarda estas secuencias en formato FASTA para hacer un alineamiento múltiple con T-coffee. No incluyas
secuencias PREDICHAS (PREDICTED).
Abre el fichero de texto que contiene estas secuencias (con un buen editor de texto como Notepad++ para
Windows o Textedit para Mac, los usuario de Linux pueden usar gedit o mousepad). Reemplaza el encabezado
de cada secuencia por una palabra (sin espacios) para que sea más fácil visualizarlo en el alineamiento. Por
ejemplo:
>SMHT1_human
MLYFSLFWAARP. . .
>SMHT2_human
MLYFSLFWAARP. . .
>SMHT1_Mouse
MVSFSLLRTTRP. . . etc
Alinea todas las 12 secuencias juntas (guardando las secuencias humanas como las dos primeras) con T-coffee
simple MSA
(f) Del resultado de T-coffee puedes ver que hay bloques de regiones conservadas separadas por partes mas
variables en secuencias y tamaño, ¿qué puede significar esto en términos de organización tridimensional
de la estructura? [0.5]
(g) ¿Cómo difieren las dos secuencias humanas (SHMT1 and SHMT2)? [0.5]
(h) ¿Cómo difieren las secuencias entre eucariotas y procariotas? [0.5]
(i) Da formato al alineamiento usando el link a ESPript en la página de resultados de T-coffee y envíala
junto a tus respuestas del examen. [0.5]
NOTA: Para que ESPript funcione, tienes que desactivar los bloqueadores de popups de tu navegador. Si no
sabes cómo hacerlo, envíanos un email a bioinfoexamgpb@gmail.com y te explicaremos.

2
Inspección de la estructura en 3D.

Examinaremos la estructura de la enzima mitocondrial humana (SHMT2). Busca en la PDBe información


sobre esta estructura (código PDB: 5v7i), en particular, para ver la unión a ligandos.
(j) ¿Cuáles son los ligandos presentes en la estructura además de la proteína? (No tienes que mencionar
su nombre químico completo pero dar una idea general de su rol (ej: agente cristalizante, inhibidor,
sustratro, cofactor, producto) [0.5]
(k) Carga la estructura en PYMOL. Jugando con los diferentes esquemas de colores (by chain, spectrum) y
representaciones (cartoon, ribbons, etc), ¿cómo describirías la arquitectura de esta estructura proteica?
(¿qué tipo de estructura secundaria es la más abundante?) ¿Cuántas subunidades son visibles y cuántos
dominios contiene cada subunidad? [0.5]
Mira el sitio activo (click de la rueda del ratón en el ligando LLP de una de las cadenas, o si no se visualiza,
escribe select LLP, resn LLP). Usando shift + click izquierdo puedes hacer una selección local de los
residuos contenidos en el cuadrado que dibujes. Puedes renombrar la selección y representarla en sticks para
ver las cadenas laterales. LLP es un intermediario de la lisina catalítica de la enzima y del cofactor piridoxal
fosfato (normalmente llamado PLP o vitamina B6).
(l) Mirando a los residuos anteriores y posteriores de esta lisina catalítica, ¿dónde está este residuo catalítico
en tu alineamiento de secuencia? ¿Observas algún motivo conservado aquí? [0.5]
(m) Después de representar los residuos que rodean la lisina catalítica en sticks, guarda y envia una imagen
en formato png del sitio catalítico [0.5]
(opcional) Examinaremos también la estructura de la enzima de la bacteria Streptococcus thermophilus. El
código PDB es 4WXF, cárgalo en pymol y superponlo con el humano escribiendo align 4WXF, 5v7i. La
lisina catalítica cercana al piridoxdal fosfato debería ser más fácil de ver aunque la numeración es diferente.
(n) (opcional) Esta estructura muestra otro paso intermedio en la reacción catalizada por la SHMT, ¿crees
que este paso ocurre antes o despues del mostrado en la proteína humana 5v7i? ¿Por qué? (Pista: mira
qué son los sustrato, productos y cofactores de cada PDB). [0.5]

Pregunta 2: Programación en Python (3.5 puntos)


(o) Escribe un script que analice la composición de una secuencia proteica. Hemos visto durante el curso
que los residuos aminoacídicos pueden clasificarse en cuatro categorias (cargados, polares, hidrofóbicos
y especiales). Este script debe contener una función que tome como argumento la secuencia proteica
en formato de una letra y imprimir el porcentaje de aminoacidos que pertenecen a cada una de estas
categorias. [3]
• Pista: Tendrás que usar bloques if/elif/else junto con el operador ‘or’ para evaluar diferentes condiciones
al mismo tiempo. Ejemplo: if a == 0 or a == 1 or a == 2:
• Enseña todo el código que has escrito, no olvides de añadir comentarios que expliquen lo que has hecho.
En el programa principal de tu script, la función debe ser utilizada con la secuencia de la insulina humana, la
cual es la siguiente:
insulin_seq = "MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHLVEALYLVCGERGF\
FYTPKTRREAEDLQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN"
• Nota: en un script de Python, la barra invertida \ sirve para escribir una cadena de múltiples lineas
cuando ésta es demasiado grande.
(p) Enseña la salida de la ejecución de tu script. [0.5]

3
(q) (opcional) ¿Puedes ver alguna forma de contar el número de cada aminoácido (A, C, G etc) usando un
diccionario? ¿Cómo? [0.5]

Anda mungkin juga menyukai