Anda di halaman 1dari 18

Fecha de Entrega:

DD/MM/2014
Equipo:
Alvarado Nez Ignacio Daniel
Rivero Alcal Vctor Daniel


Asesoras:
M. C. Maritere Domnguez Rojas
pBQD. Larisa Andrea Gonzlez Salcedo
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln
Seccin de Bioqumica y Farmacologa Humanas
Bioinformtica
TUTORIAL UNIPROT




La recin llegada de los avances en las tcnicas de Biologa Molecular,
as como la elevada cantidad de informacin protomica, fue
promoviendo el acumulamiento de secuencias de diversas protenas,
creando la necesidad de almacenar dicha informacin de tal manera,
que sta se encontrara disponible para todo y cada uno de los cientficos
que decidiera consultarla. Fue de esta necesidad de los cientficos, lo que
llevo a la creacin de una base de datos universal denominada
UNIPROT, en la cual se empezaron a recabar las primeras secuencias
proteicas y los hallazgos encontrados, creando as una entrada con ms
de 22, 000 secuencias hasta la fecha, incluyendo todos los aspectos que
engloban a una protena, desde su secuencia en varios formatos, hasta
su relacin con diversas enfermedades.

El consorcio UniProt fue formado en 2002 por grupos de investigadores
del InstitutoSuizo de Bioinformtica (SIB), el EBI y el PIR en la
Universidad de Georgetown, y poco despus el sitio web se estableci
como el punto central de entrada para los recursos presentes en
UniProt.
UniProt es una base de datos central, que abarca toda la informacin
general de una protena, incluyendo informacin como: su secuencia,
enfermedades relacionadas, oncologas, etc.
Esta base de datos se compone por cuatro componentes optimizados
para diferentes usos :
UniProt Knowledgebase (UniProt KB), base de datos experta en
conservacin, es un punto de acceso central para integrar la
informacin de protenas con referencias cruzadas de diferentes
fuentes.

UniProt Archive (UniParc), central de depsito de secuencias
muy completa, reflejando la historia de todas las secuencias
proteicas.

UniProt Reference Clusters (UniRef) fusiona secuencias
relacionadas basndose en la identidad de la secuencia para
incrementar la velocidad de la bsqueda.

UniProt Metagenomic and Enviromental Sequences database
(UniMES), creadapara responder a la expansin del rea de
informacinmetagenomica.
UniProt es un portal de carcter pblicoque permite el ingreso a
cualquiercientifico que requiera la informacin de algntipo de
protena. Dentro de UniProt, encontramosdiversasreferencias y ligas,
acerca de informacinvariadarelacionada con la proteina de intres, por
ejemplo, podemosencontrar enlaces de GenBank, DBJJ y EMBL en los
cuales nos proporcionaninformacin de la secuencia de nucleotidos que
codificapara la proteina, indicandonos el tipo de molcula, organismo,
clasificacintaxonomica y muchosotrosdatos que son de muchaayuda a
la hora de realizar una investigacincompleta. Asmismo,
encontramosligas de visualizacin en 3D en PDB /RCBS que nos
ofrecenunvisualizacin y manipulacin de la estrutura, cambiandole la
estrutura, el color, etc.
UniProt, nos ofrece la siguiente informacinproteica:
Funcin de la protena.
Actividadenzimaticaespecifica (actividadcatalitica, cofactors,
vasmetabolicas, mecanismo de regulacin).
Dominios y sitios de relevanciabiologica.
Modificacionespostraduccionales (glucosilaciones, metilaciones,
etc).
Locacinsubcelular.
Expresinespecifica de la proteina en los tejidos
Estructurasecundaria y cuaternaria.
Interacciones
Isoformas formadas por splicing alternativo.
Al realizar la entrada a UniProt: http://www.uniprot.org/, se encuentra
lo siguiente:






Herramientas para la bsqueda.
Actualizaciones y nueva
informacin acerca de
UniProt
Tutorial detallado de
cmo hacer el uso de la
base.








UniProtcontienediversasherramientas que nosayudarn en la bsqueda,
a continuacin se abarcarandichasherramientas, mencionando la
funcin de cada una:
Search: Opcin de bsquedaparaproteinas

Blast: Bsqueda de similitude con secuencias en BLAST

Align: Es una opcin, que nos permite realizar un alineamiento
con dos o ms secuencias proporcionando la secuencia FASTA,
por medio del programa Clustal Omega.

Retrieve: Descarga de entradas a UNIPROT


ID Mapping: Asigna una lista de identificadores de una base de
datosexternaparaUniProt KB o viceversa.
Barra de bsqueda , indicndonos en
qu lugar se desea buscar.
Definiciones dentro de
UniProt
Tutorial rpido para
realizar una bsqueda.


El uso del tutorial que ofrece la plataforma ayuda a la comprensin del
uso de la misma. Adems existen tutoriales en YouTube subidos por
usuarios que pueden ayudar al uso de estas plataformas. Uno de los
tutoriales que mejor ayudan al principiante en el uso de sta base de
datos se encuentra en esta liga
http://www.youtube.com/watch?v=X93rfdNm_48

Para iniciar la bsqueda de la protena de inters slo debe escribirse el
nombre, las siglas o el gen que la codifica, o en, realizar una bsqueda
avanzada similar a la que realizan otras bases. Con el fin de seguir el
estudio del gen AUTS2, se ha escrito el nombre de dicho gen en esta
parte. Dentro de UniProt, existen secuencias revisadas por expertos
en el rea (sealadas con ) y otras que no lo son ( ). La bsqueda de
la protena de susceptibilidad al autismo 2, UniProt ofrece 231
resultados de los cuales slo 5 estn revisados.

Adems la protena permite hacer una bsqueda clasificando por
taxonoma, por palabras clave, clase enzimtica o vas en las que se
encuentra involucrado. Asimismo permite eliminar secuencias
redundantes. Para afinar la bsqueda de afinar, se har uso del filtro de
datos revisados. Como resultado de la solicitud, la plataforma ofrece 5
resultados, pero, para el fin de la investigacin slo interesa el primero.

El resultado se encuentra dividido en diferentes secciones y contiene
enlaces que pueden ser de utilidad que ayudan al estudio de la protena
Names and Origin. Ofrece el nombre, organismo del cual se aisl,
adems de la identificacin taxonmica de la protena. La protena que
codifica el gen AUTS2 es llamada la protena de susceptibilidad al
autismo 2 fue secuenciada de humano.

Protein Atribute Tamao y el tipo de secuencia. La protena de
susceptibilidad al autismo 2 se encuentra totalmente secuenciada
contando de 1259 aminocidos.

General annotation (Comments) Contiene informacin general del
gen que puede ser de importancia para el investigador, como tejido
especifico o secuencias similares o de peligro. La protena de
susceptibilidad al autismo 2 se localiza en cerebro, musculo y rion en
gran manera, poco en leucocitos, placenta y pulmn. Perteneciente a la
familia de las protenas AUTS2 no debe confundirse con una secuencia
que codifica a otraproteina diferente.

Ontologies Este apartado nos proporciona una serie de palabras claves
que estn estrechamente relacionadas donde se encuentran los
procesos en los que interfier, algunas caractersticas del gen o la
protena, etc. Por ejemplo, el gen AUTS2 sufre varios polimorfismos, de
reordenamiento cromosomal (causante de repeticiones) y splicing
alternativo. Adems de constituir una fosfoprotena involucrada en
varios procesos.

Alternative products Muestra las diferentes estrucuras similaes a la
protena (isoformas). Como resultado del splicing alternativo, la
protena de susceptibilidad a autismo 2 puede tener 3 isoformas
probables, la larga (isoforma 1), la corta, (isoforma 2) y la isoforma 3,
pues no sea corroborado en el laboratorio.

Sequence annotation (Features) Esta seccin nos ofrece algunos
datos importantes de la protena en cuestin, algunas situaciones
estructurales, etc. Para la codificada por AUTS2 indica que se constituye
por 1259 aminocidos donde hay dos regiones ricas en histidina y una
en serina casi inicial. Cuenta con residuos forforilados de serina y
estructuras similares a ellas.

Sequences Nos permite observar la secuencia de las diferentes
isoformas de la protena en un formato propio de la plaaforma, o bien en
fomato FASTA.


References Muestra Articulos de inters para la consulta de la protena
analizada.

Cross-references Brinda ligas necesarias para el estudio a fondo del
gen o la protena objetivo. Existen plataformas de inters como
GenBank, EMBL, GenAtlas, etc.

Entry information Brinda la informacin de acceso en esta plataforma

Adems de las secciones, UniProt cuenta con los fotmatos ms usados
patra el manejo de informacin Bioinformtica, siendo FASTA y TEXT
los ms populares

Otras plataformas
Existen otras herramientas que ayudan al estudio de las protenas.

Compute pI / Mw es una herramienta que permite el clculo de la pI
terico (punto isoelctrico) y Mw (peso molecular) para una protena
con solo ingresar el numero de acceso de la protena en UniProt.

A continuacin aparecer una pantalla donde pide identificar lo que se
desea observar. Si se est de acuerdo con lo que indica se le da clic en
SUBMIT

Automticamente se calculara el peso y el punto isoelctrico de la
protena para posibles usos para purificacin de la misma. Para el
polipptido de 1259 residuos calcula un peso promedio de 138982.16
Da y un pI teorico de 9.41


Protein Stats. Permite analizar la composicin de la protena slo al
ingresar el cdigo FASTA de la protena. La plataforma indica que la
protena de susceptibilidad al autismo est constituida principalmente
por aminocidos alifticos y que consta en mayor porcentaje de prolina
(14.22%) que es interesante, pues se hablaban de regiones ricas en
histidina y serina.




ProtParam Ayuda al entendimiento de la estructura de la molcula a
partir de su estructura bsica, es decir, desde su conformacin primaria.
Muestra el nmero de tomos por elementos con los que cuenta, el
porcentaje de aminocidos que lo conforman, estimado de vida media,
coeficiente de extincin y a que frecuencia absorbe. El mtodo de
bsqueda es sumamente similar al que usa su plataforma hermana
Compute pI / Mw. Para el inters de esta bsqueda, la protena de
susceptibilidad a autismo 2 (C6069H9493N1875O1839S26) de 1259
aminoacidos, rica en prolina, que dura ms de 20 horas en un organismo
vivo, absorbe a 280 nm con un punto isoelctrico teorico de 9.41.




Anexo
Plataformas de trancripsin y traduccin
Con fin de ofrecer ms herramientas, es de gran importancia
comprender el uso de otras, las cuales utilizan algoritmos especificvos
para el uso de las secuencias. Se analizara la funcion de estas
plataformas siguinedo con el estudio de la proteina de susceptibilidad al
autismo

Transcription and Traslation Tool Herramienta que permite observar
el paso del dogma central slo reconociendo secuencias. Para la
secuencia nucleotidica del gen AUTS2, se ingreso la secuencia del
RNAm, obtenida de EBI en formato FASTA, obteniendo as la retro
transcripcin del gen, y la secuencia de a.a para este gen.


Secuence editor De utilidad ciuando secuencias nucleotidicas se
requiere. Permite observar la secuencia complementaria, la antiparalela
y el cambio entre RNA y DNA.



Traslate Herramienta que ayuda en el analisis de la traduccin, es decir,
de RNAm a proteinia. Muestra los posibles marcos de lectura adems
dela secuencia



ENBOSS Transeq Permite la observacion de la traduccin con tan solo
ingresar la secuencia de RNA o DNA. Mustra la secuencia de
aminoacidos indicada por colores especificos.

Anda mungkin juga menyukai