Anda di halaman 1dari 8

Interacciones proteína-proteína:

REVISIÓN
bases de datos y métodos teóricos de predicción
Victor de la Torre Russis1,2, Alfredo Valles1,2, Raúl Gómez1, Glay Chinea1, @ Tirso Pons1
1
Centro de Ingeniería Genética y Biotecnología (CIGB), PO Box 6162, Habana 10600, Cuba.
Tel.: +(537)-271 60 22, ext. 1133; Fax: +(537)-271 47 64 or +(537)-33 60 08;
E-mail: tirso.pons@cigb.edu.cu 2Centro Nacional de Bioinformática (BIOINFO), Habana 10200, Cuba.
RESUMEN
Las interacciones proteína-proteína son eventos críticos para muchos procesos celulares que se extienden desde la
formación de estructuras macromoleculares y complejos enzimáticos, hasta la regulación y la transducción de
señales. Comprender estas interacciones en detalle, proporciona información útil sobre el mecanismo molecular de
funcionamiento de la célula, y ayuda en el diseño de fármacos más específicos y en la ingeniería de procesos
celulares. En el presente artículo se revisaron los avances recientes en el estudio de las interacciones entre proteínas,
la creación de bases de datos, la utilización combinada de sus anotaciones y el desarrollo de métodos teóricos de
predicción. El período revisado abarcó desde el año 1975 hasta el 2003.
Palabras claves: bases de datos, doble-híbrido, micro-arreglo de ADN,
micro-arreglo de proteínas, espectrometría de masas
Biotecnología Aplicada 2003;20:201-208

ABSTRACT
Protein-protein interactions: databases and prediction methods. Protein-protein interactions are critical for
virtually every cellular process, ranging from the formation of macromolecular and enzymatic complexes to the
protein regulation and signal transduction. Detailed knowledge of the protein interaction networks should provide
new insights into the structure and properties of the cellular systems, and it might enable the design of specific
drugs and the engineering of cellular processes. In the present article we review the experimental techniques
available for the study of protein-protein interaction, the development of new databases, the combined use of
their complementary information, and the different computational methods for the prediction of protein interactions.
Keywords: databases, yeast two-hybrid, DNA microarray, protein chips, mass spectrometry

Introducción
Las interacciones entre proteínas desempeñan un pa- define la función de la proteína como su enrejado de
pel fundamental en varios aspectos de la organiza- interacciones con otras moléculas (Figura 1). El térmi-
ción estructural y funcional de la célula [1, 2]. Estas no más utilizado para describir este punto de vista es
interacciones pueden ser clasificadas en tres tipos: i) función contextual o función celular.
las que ocurren entre dominios de una misma cadena Del análisis combinado de los datos experimentales
polipeptídica, ii) las que ocurren entre dominios de sobre interacciones entre proteínas, se ha comprendi-
diferentes cadenas polipeptídicas en proteínas do que la complejidad de los organismos no depende
multiméricas, y iii) las que ocurren de manera del número de proteínas codificadas en sus genomas,
transiente en complejos formados entre proteínas in- sino del número de interacciones entre ellas [10]. Por
dependientes [3]. ejemplo, la planta Arabidopsis thaliana, el nemátodo
En la actualidad se dispone de las secuencias de C. elegans, la mosca Drosophila melanogaster y el
aminoácidos codificadas por 130 genomas secuenciados hombre poseen un número similar de genes (25,498;
completamente (http://igweb.integratedgenomics.com/ 19,099; 14,100 y 30,000-35,000; respectivamente).
GOLD/; http://www.expasy.ch/sprot/), de un gran nú- Por ello, constituye un desafío el desarrollo de méto-
mero de datos obtenidos a través de micro-arreglos de dos teóricos para predecir los detalles a cerca de las
ADN (del inglés “DNA microarray”), e información de
gran valor sobre interacciones proteína-proteína obteni- U+P V
da mediante los métodos doble-híbrido (del inglés “yeast X
two-hybrid”), espectrometría de masas, micro-arreglo A Y
de proteínas, cristalografía, inmunoprecipitación y me- S P
diciones por BIAcore. La combinación de estos métodos A
experimentales y su utilización a gran escala en U+Z W
Caenorhabditis elegans [4], Saccharomyces cerevisiae
[5-8] y Helicobacter pylori [9] ha dado lugar a la creación La función La función A depende
de un amplio conjunto de bases de datos, al tiempo que la de la proteína A de sus interacciones
es su acción sobre S con otras proteínas
visión sobre la función de las proteínas ha evolucionado. para formar P en la célula
Desde el punto de vista clásico, la función de una
proteína, denominada frecuentemente función molecu- Figura 1. Evolución del significado de la función de las
lar, está determinada por la acción local de una sola proteínas. La visión clásica se muestra a la izquierda y la visión
molécula proteica; mientras que la visión post-genómica post-genómica a la derecha.

@ Autor de correspondencia
Victor de la Torre Russis y cols. Interacciones proteína-proteína

interacciones específicas entre proteínas a nivel ató- Tabla 1. Métodos experimentales para el estudio de las interacciones entre proteínas.
mico, y la aplicación de dichos métodos a escala Nivel de resolución
genómica [11, 12]. Una vez dilucidadas las redes de Método atómico directo complejos celular
interacciones o “interactoma” en sistemas celulares Rayos-X y RMN X X
modelos, será posible el diseño de fármacos más espe- Ensayos de competencia X
cíficos y la ingeniería de procesos celulares. ELISA X X
En conexión con esta problemática, se celebró en Ju- Ensayos de retardación en gel X X
nio del 2001 en Charleston, Carolina del Sur, la primera Doble-híbrido X X
conferencia sobre modelación de interacciones entre pro- Cromatografía de afinidad X X
teínas a escala genómica (http://reco3.ams.sunysb.edu/ BIAcore X X
conference/). Esta conferencia incluyó sesiones sobre el micro-arreglo de proteínas X X
acoplamiento proteína-proteína (del inglés “protein- Resonancia paramagnética electrónica X X X
protein docking”), la relación estructura-función, las in- Cromatografía de filtración en gel X X
Espectrometría de masas (TAP) X X
teracciones proteína-moléculas pequeñas, y la
Enlazamiento molecular (cross-linking) X X
identificación de interacciones en vías metabólicas [13].
Co-inmunoprecipitación X X
Adicionalmente, al igual que los experimentos para la
Co-sedimentación X X
evaluación a ciegas de los métodos de predicción de
Sedimentación en gradiente de sacarosa X X
estructura tridimensional de proteínas (CASP y Co-purificación X
CAFASP), se ha creado un nuevo experimento denomi- Microscopía electrónica X
nado CAPRI (del inglés “Critical Assessment of Inmunofluorescencia X
Predicted Interactions”) para evaluar los métodos de Inmunolocalización X
acoplamiento proteína-proteína. Más información so- Inmunotinción X
bre CAPRI puede encontrarse en el sitio de internet FRET X X X X
http://capri.ebi.ac.uk. Ensayos de bloqueo con anticuerpos X X
Este artículo revisa los avances alcanzados en el monoclonales
estudio de las interacciones proteína-proteína, y presta Ensayos de adhesión X
especial atención a las anotaciones en las bases de Knock-out X
datos, su utilización, y el desarrollo de métodos teóri- Co-expresión transiente X
cos para su predicción. FRET: energía fluorescente transferida por resonancia; ELISA: ensayo enzimático de inmunoabsorción; RMN:
resonancia magnética nuclear; Knock-out: experimentos de deleción de genes.
Métodos experimentales
para el análisis de interacciones El uso eficiente de los datos sobre la interacción
proteína-proteína: entre proteínas requiere de una evaluación crítica de
Niveles de confianza su exactitud, redundancia (cuando se describe la
Los métodos experimentales disponibles para detectar interacción entre un par específico de proteínas, utili-
interacciones entre las proteínas tienen distintos nive- zando iguales condiciones experimentales) y comple-
les de resolución (Tabla 1) y pueden clasificarse en mentariedad (cuando se describe la interacción entre
cuatro categorías [14]. La primera categoría comprende un par específico de proteínas, por varios métodos
el análisis atómico, donde la interacción es detectada con enfoques diferentes o por un solo método utili-
por métodos muy sensibles como la difracción de ra- zando diferentes condiciones experimentales). Desdi-
yos-X (DRX) que aporta información específica sobre chadamente, la correspondencia entre un conjunto
los átomos y residuos que participan en la interacción. amplio de anotaciones de interacciones proteína-pro-
La segunda categoría agrupa a los métodos que detectan teína, sólo se ha investigado recientemente [19]. Una
la interacción de forma directa, por ejemplo, experi- posible explicación es que la comparación de los datos
mentos de doble-híbrido y mediciones por BIAcore. La experimentales es difícil pues se obtienen en diferen-
tercera categoría agrupa a los métodos de detección de tes condiciones, poseen diferentes formatos y se re-
complejos mediante técnicas de inmunoprecipitación o quiere de un sistema de anotaciones como referencia.
de espectrometría de masas. La cuarta categoría com- Según estimados de von Mering y colaboradores, más
prende bioensayos realizados a escala celular, por ejem- de la mitad de las interacciones informadas por los
plo, la proliferación celular estimulada por la interacción métodos de análisis masivos (análisis realizados para
ligando-receptor. La segunda y tercera categorías, a di- todas las proteínas codificadas en un genoma) son
ferencia de la primera, indican cuales proteínas están ilegítimas o falsos-positivos [19].
formando parte del complejo en un instante de tiempo Es importante notar, además, que las proteínas
pero no revelan el detalle químico de la interacción. interactúan entre ellas con un amplio intervalo de afini-
Algunos métodos experimentales abarcan más de un dades y escalas de tiempo. Algunas interacciones fisio-
nivel de resolución como se observa en la Tabla 1. lógicas son transientes y débiles, por consecuencia, la
Además, recientemente se ha descrito en la literatu- detección de dichas interacciones está frecuentemente
ra científica el uso de la tecnología de micro-arreglo de en el margen de error de la observación, lo cual provoca
proteínas para el estudio de las interacciones proteí- que puedan aparecer interacciones no fisiológicas como
na-proteína de levaduras [15-17] y la metodología de falsos-positivos [8, 9]. Por otro lado, muchas de las
purificación por afinidad en “tandem” (TAP, del in- interacciones experimentales informadas en la literatu-
glés “tandem affinity purification”) [5, 6, 18]. Ambas ra científica son inconsistentes con los datos
técnicas detectan interacciones físicas entre proteí- tridimensionales (3D) obtenidos para complejos
nas, de manera directa, y según la Tabla 1, ellas pue- macromoleculares, por ejemplo, RNA-polimerasa, Arp2/
den ser incluidas en las categorías dos y tres. 3 y proteasoma, o con información adicional [11, 20].

202 Biotecnología Aplicada 2003; Vol.20, No.3


Victor de la Torre Russis y cols. Interacciones proteína-proteína

Para aumentar el nivel de confianza en las interac- Medline. DIP permite la representación visual de las
ciones detectadas experimentalmente, y documenta- interacciones así como navegar a través de la red de
das en diferentes bases de datos, se debe observar la interacciones proteicas mediante una interfase WWW
misma interacción por diferentes métodos [21]. Nóte- [24, 25]. En el momento de escritura de este manus-
se que de alrededor de 80,000 interacciones descritas crito, el número de proteínas descritas en DIP ascen-
para proteínas de levadura, por métodos diferentes, día a 6,978 y el número de interacciones a 18,260.
solamente 2,400 son descritas por más de un método
[19]. Otro enfoque para validar la interacción combina BIND (Biomolecular Interaction Network
la información que brindan métodos experimentales Database), http://bind.ca
independientes con datos 3D obtenidos por DRX [11]. Documenta interacciones moleculares que incluyen
Una lista de interfases proteína-proteína presentes en proteína-proteína, proteína-RNA, proteína-DNA,
estructuras resueltas por DRX está disponible en la proteína-moléculas pequeñas, complejos molecula-
base de datos SPIN-PP, accesible en el sitio http:// res, y vías metabólicas. Los datos experimentales
trantor.bioc.columbia.edu/cgi-bin/SPIN/. obtenidos por doble-híbrido, espectrometría de ma-
Siguiendo esta línea de razonamiento, la integración sas, cristalografía, bibliotecas de fagos, y las anota-
de diferentes bases de datos y/o diferentes métodos, ciones complementarias se encuentran almacenadas
contribuirá a validar las anotaciones en las bases de en forma de objetos en el formato ASN.1 (Abstract
datos [22]. Un ejemplo de ello lo constituye el méto- Syntax Notation.1; http://www.oss.com/asn1/
do propuesto por Tong et al. [23] que consiste en index.html), utilizado por el Centro Nacional para la
combinar la metodología de las bibliotecas de fagos Información Biotecnológica (NCBI), y pueden ser
(del inglés “phage display”) con la metodología de interrogados a través de una interfase WWW [26].
doble-híbrido. Primeramente, realizan una búsqueda Actualmente, BIND documenta 15,141 interaccio-
de secuencias consenso en proteínas de levadura ca- nes, y 1,306 complejos.
paces de unir dominios de reconocimiento de péptidos
mediante una biblioteca de fagos. Como resultado de InterDom (Database of interacting domains),
esta búsqueda se obtiene un enrejado de interacciones http://InterDom.lit.org.sg
que conecta a proteínas que poseen una secuencia con- InterDom combina datos sobre fusiones de domi-
senso con aquellas que poseen dominios de reconoci- nios, interacciones entre proteínas, complejos
miento específico para esas secuencias consenso, a la proteicos, e información de la literatura científica.
vez, define sitios de unión en algunas de las proteínas. Esta base de datos es una compilación de interaccio-
Un segundo enrejado de interacciones se obtiene de la nes tentativas entre dominios de proteínas, obteni-
búsqueda de proteínas que interaccionan con los do- das por métodos teóricos, que puede ser utilizada
minios de reconocimiento de las secuencias consenso, para la anotación y validación “in silico” de las inte-
utilizando el método de doble-híbrido. Este método racciones detectadas experimentalmente. La estrate-
ha sido aplicado en la búsqueda de proteínas que gia fundamental es utilizar múltiples métodos teóricos
interactúan con dominios SH3. y datos experimentales independientes, para prede-
cir interacciones entre dominios de proteínas y asig-
Bases de datos sobre interacciones nar mayor puntuación a aquellas donde coincida la
entre proteínas mayor cantidad de evidencias. Los datos están orga-
Para documentar y describir las interacciones entre nizados en una base de datos relacional en el sistema
proteínas, se ha desarrollado un grupo de bases de MySQL, y puede ser interrogada con una combina-
datos que incluyen toda la información obtenida por ción de Perl, PHP, Java, y HTML. InterDom contie-
los diferentes métodos experimentales descritos en ne anotadas 15,058 posibles interacciones entre
la Tabla 1 [14], y de la información publicada en la dominios, en su versión 1.1 con fecha 15 de febrero,
literatura científica. A continuación se expone una 2002. Los autores de esta base de datos sugieren
revisión de las bases de datos, centrando la atención además, un sistema de puntuación para inferir las
en el tipo de datos que contienen y cómo acceder a interacciones entre dominios de proteínas [27].
ellas. En algunos casos se hacen comentarios sobre el
volumen de información contenido en la base de da- KDBI (Kinetic Data of Bio-molecular
tos, en el momento en que se escribe el presente Interactions database),
manuscrito. http://xin.cz3.nus.edu.sg/group/kdbi/kdbi.asp
Documenta datos experimentales sobre la cinética
DIP (Database of Interacting Proteins), de interacción entre proteínas, proteína-ARN, pro-
http://dip.doe-mbi.ucla.edu teína-ADN, proteína-ligando, ARN-ligando, ADN-
Documenta interacciones moleculares, proteína-pro- ligando, y reacciones descritas en la literatura. KDBI
teína, determinadas experimentalmente por los mé- contiene actualmente 8,273 entradas, que involucran
todos de doble-híbrido, inmunoprecipitación, 1,380 proteínas, 143 ácidos nucleicos, y 1,395 mo-
ensayos de bloqueo con anticuerpos monoclonales y léculas pequeñas. Además, posee enlaces a referen-
anotaciones extraídas de la literatura científica, entre cias en MEDLINE y a estructuras 3D depositadas
otros. DIP está implementada como una base de da- en las bases de datos PDB y NDB. Los parámetros
tos relacional formada por cuatro tablas. Una prime- cinéticos anotados incluyen constantes de asocia-
ra con información sobre las proteínas, una segunda ción, disociación, orden de la reacción, constantes
sobre interacciones proteína-proteína, una tercera que de inhibición, de afinidad, constante catalítica, to-
describe detalles sobre los experimentos, y la cuarta dos ellos pueden ser interrogados mediante una
tabla contiene la lista de todas las referencias en interfase WWW [28].

203 Biotecnología Aplicada 2003; Vol.20, No.3


Victor de la Torre Russis y cols. Interacciones proteína-proteína

MINT (Molecular INTeraction database), de hipertexto y puede ser interrogada a través de una
http://cbm.bio.uniroma2.it/mint/index.html interfase WWW [34].
MINT contiene información sobre complejos molecu-
lares, interacción entre dominios, modificaciones BioKnowledge Library,
enzimáticas de las proteínas interactuantes, constantes http://www.proteome.com
de unión y otros datos cinéticos. Toda la información BioKnowledge es una base de datos relacional que con-
contenida en MINT es curada de manera manual por tiene información específica sobre las proteínas. La in-
expertos, y está organizada en una base de datos formación es recopilada de la literatura científica e incluye:
relacional en el sistema SQL [29]. Actualmente, MINT función bioquímica, función y localización celular, inte-
tiene documentadas 4,568 interacciones que pueden ser racciones genéticas y con otras proteínas, regulación,
interrogadas mediante una interfase WWW escrita en dominios y patrones de secuencia característicos. Todas
lenguaje HTML codificado (PHP; http://www.php.net). estas características; concernientes a los organismos
modelos S. cerevisiae, C. elegans, Schizosaccharomyces
WISTdb (Worm Interaction Sequence Tag pombe; y otros organismos como Candida albicans y
database) Homo sapiens. BioKnowledge es curada manualmente
Contiene el mapa de las interacciones proteicas del por expertos, y la información sobre cada proteína está
nemátodo C. elegans obtenidas por doble-híbrido; organizada en formato HTML, con una página WWW
proyecto guiado por el Dr. Marc Vidal del Instituto para cada molécula [35].
Dana Farber, de la escuela de medicina de Harvard en
Boston, Massachussets [4]. Las anotaciones han sido PRONET, http://pronet.doubletwist.com
organizadas utilizando el sistema de manipulación Es un proyecto no-académico fundado por DoubletwistTM
de bases de datos orientado a objetos, ACEDB [30], y MyriadTM. Esta base de datos contiene información
y puede ser interrogada mediante su interfase sobre interacciones proteína-proteína y datos produci-
ACEBrowser [31]. dos por métodos propios [24].
ASEdb (Alanine Scanning Energetics CURAGEN, http://www.curagen.com
Database), http://www.asedb.org Contiene información sobre interacciones proteicas
Contiene mediciones experimentales de la afinidad en levadura, obtenidas en los laboratorios del Dr. S
con que se unen dímeros de proteína-proteína, pro- Field y de la compañía Curagen. Posee herramientas
teína-ácido nucleico, y proteína-pequeñas molécu- para visualizar la red de 957 interacciónes descritas, y
las, en los que se ha mutado una cadena lateral por los datos están accesibles en el sitio Web de la compa-
alanina. En casos en que la estructura 3D esta dispo- ñía para usuarios con objetivos académicos [7].
nible, contiene áreas de superficies de la cadena late-
ral mutada y enlaces a la base de datos PDB. ASEdb PIM, http://www.hybrigenics.fr
es una base de datos relacional útil para el análisis de Contiene los resultados del análisis por doble-híbrido
la contribución de un aminoácido a la energética de la del genoma de H. pylori. En el estudio se describieron
interacción. ASEdb contiene 2,919 mutantes, 1,953 1,465 interacciones proteicas anotadas en la base de
poseen datos estructurales para el monómero y 580 datos [9].
para el dímero [32].
BRITE (Biomolecular Relations in Information
FlyNets, Transmisión and Expression),
http://gifts.univ-mrs.fr/GIFTS_home_page.html http://www.genome.ad.jp/brite/
Contiene las interacciones proteína-ADN, proteína- Es una base de datos de relaciones binarias y compa-
ARN y proteína-proteína, descritas en la mosca D. ración de grafos que involucran genes y proteínas.
melanogaster [33]. FlyNets está compuesta por dos Contiene interacciones proteína-proteína obtenidas por
partes: i) FlyNets-base es una base de datos especia- doble-híbrido en S. cerevisiae y H. pylori, y por otras
lizada en interacciones moleculares que ocurren du- extraídas de la literatura científica; interacciones en
rante el proceso de formación del patrón embriogénico; vías metabólicas; información sobre similitud de se-
ii) FlyNets-list es una base de datos más general que cuencia; y relaciones obtenidas a través de micro-arre-
documenta cualquier interacción molecular publicada, glo de ADN. BRITE, puede ser interrogada a través de
que ocurra en la mosca. Todos los datos están organi- una interfase WWW.
zados en una colección de ficheros con formato de
hipertexto, semejante a la estructura de la base de da- INTERACT,
tos GenBank, y pueden ser interrogados a través de http://www.cl.cam.ac.uk/~wb204/GD99/
una interfase WWW. Es una base de datos orientada a objetos, que contiene
información sobre las interacciones entre proteínas
MYGD (MIPS Yeast Genome Database), descritas para los organismos S. cerevisiae, C. elegans,
http://mips.gsf.de Human, y Escherichia coli. Cada interacción es repre-
MYGD contiene información detallada sobre el sentada como un grafo, con las proteínas individuales
genoma de S. cerevisiae, y las secuencias aminoacídi- en los vértices y la interacción entre pares de ellas
cas codificadas. Además, contiene información com- formando los bordes [36]. La información contenida
plementaria sobre la función de los genes y proteínas, en esta base de datos puede ser interrogada a través de
complejos proteicos, fenotipo de los mutantes, inte- una interfase WWW, que incluye lenguaje para mode-
racciones proteína-proteína, y vías metabólicas. Toda lado en realidad virtual (VRML; del inglés “Virtual
la información está anotada en ficheros con formato Reality Modelling Language”).

204 Biotecnología Aplicada 2003; Vol.20, No.3


Victor de la Torre Russis y cols. Interacciones proteína-proteína

Métodos teóricos de predicción de evolución de proteínas que interactúan, dicho de otra


interacciones entre proteínas manera presencia-ausencia de genes ortólogos en
En el análisis funcional de un genoma, un paso crítico genomas diferentes. Si el patrón de proteínas ortólogas
es la comprensión de las interacciones entre las pro- (presencia-ausencia) se conserva en organismos de la
teínas codificadas [37]. Por ello se ha desarrollado un misma especie, se debe probablemente a que una de
conjunto de métodos teóricos para abordar el proble- las proteínas no puede ejercer su función sin la otra.
ma de la predicción de interacciones entre proteínas a Huynen et al. [65] aplicaron este método al genoma de
partir del análisis de sus secuencias aminoacídicas, de Mycoplasma genitalium, prediciendo 34% de los pa-
información de los genomas y de datos cristalográficos res como interactuantes y un 29% adicional pertene-
de complejos macromoleculares. De manera general, cientes a la misma vía metabólica o proceso funcional.
todos los investigadores utilizan como hipótesis que Marcotte et al. [66, 67] y Enright et al. [68] desarro-
si se conoce el modo de interacción entre dos proteí- llaron métodos basados en la fusión de dominios (del
nas o dos dominios de proteínas, cualquier interacción inglés “fused domain approach”). Los métodos utili-
que pueda ocurrir entre proteínas homólogas involucra zan la hipótesis de que cuando dos proteínas A y B
contactos del mismo tipo [3]. Sin embargo, existen contienen dominios homólogos a dominios diferentes
casos en los que proteínas homólogas poseen diferen- de una tercera proteína en otro organismo, pero A y B
tes modos de interacción. Por ejemplo, la enzima no son homólogas entre sí, entonces A y B interaccio-
nucleótido difosfato quinasa (EC 2.7.4.6) se presenta nan. Enright y colaboradores utilizan BLAST [69]
en la naturaleza en forma de hexámero o tetrámero para determinar ortología entre proteínas y encuen-
dependiendo de la especie [38]. Las sialidasas (EC tran 64 casos de genes fusionados en cuatro genomas
3.2.1.18) virales forman tetrámeros, mientras que las procariotas. El método desarrollado por Marcotte y
bacterianas y de tripanosoma aparecen como colaboradores, conocido como “Rosetta stone method”,
monómeros de proteínas multidominio [39]. Una re- utiliza la información anotada en las bases de datos
visión reciente sobre el tema de predicción de interac- Pfam [70] y ProDom [71] para determinar homología
ciones entre proteínas fue publicada por Valencia y entre dominios de proteínas individuales.
Pazos [40]. La limitación de los métodos descritos radica en que
El reconocimiento proteína-proteína está determi- sólo son aplicables a genomas secuenciados completa-
nado por las propiedades físicas y químicas de la mente, para tener la certeza de la ausencia de genes
interfase, la cual ha sido caracterizada en términos de específicos; por otro lado son aplicables solamente en
su geometría (tamaño, forma y complementariedad) y bacterias, donde el orden de los genes es una caracterís-
de su naturaleza química (tipo de grupo químico y tica relevante; y por último dependen de la calidad del
aminoácido, hidrofobicidad, interacciones electrostá- alineamiento múltiple de las proteínas en estudio.
ticas y enlaces por puente de hidrógeno). El análisis Gallet y colaboradores [72] desarrollaron un méto-
de las superficies de contacto entre proteínas o interfase do simple de predicción que identifica secuencias de
tuvo sus inicios con el trabajo de Chothia y Janin en aminoácidos, denominadas dominios de unión al re-
1975 [41]. A partir de ese año y hasta el 2002, han ceptor, basado en el análisis de sus propiedades
aparecido diferentes trabajos sobre el tema, de varios hidrofóbicas. Las secuencias de aminoácidos más pro-
autores [42-58]. De estos trabajos se ha derivado un pensas a interactuar, se obtuvieron de un análisis esta-
conjunto de regularidades útiles para los métodos de dístico de las frecuencias de aparición de los
predicción de interacción proteína-proteína. aminoácidos en sitios de interacción conocidos. El
La utilización de los métodos de acoplamiento pro- método identificó el 95% de los residuos involucrados
teína-proteína, para predecir las regiones de interacción en la interacción ADN-proteína y el 83% en los domi-
y la estructura de complejos proteicos, es un tema que nios de unión a calcio. Sprinzak y Margalit [73] utili-
merece una descripción detallada y se aleja del objeti- zaron un enfoque similar para identificar patrones de
vo del presente artículo. Revisiones recientes sobre secuencia característicos, observados como regulari-
este tema fueron publicadas por Halperin et al. [59], y dad, en pares de proteínas cuya interacción ha sido
Smith y Sternberg [60]. comprobada de forma experimental. Una de las pro-
Varios investigadores han utilizado la información teínas posee un patrón de secuencia característico de-
contenida en los genomas (la fusión de dominios, la finido en la clasificación InterPro [74], y la otra
conservación del orden génico, la distribución proteína que interacciona un segundo patrón caracte-
filogenética), para predecir interacciones entre proteí- rístico. A este conjunto de pares de patrones caracte-
nas. Si dos cadenas polipeptídicas son sub-unidades rísticos se les denominaron patrones de secuencia
de una misma proteína o complejo, sus genes están correlacionados. El método fue probado en una base
frecuentemente adyacentes en el genoma, y se expre- de datos de interacciones, comprobadas de manera
san y regulan de manera conjunta al nivel de ADN. experimental, en la levadura S. cerevisiae.
Dandekar et al. [61] utiliza la información que brinda Bock y Gough [75] utilizan la información conteni-
la conservación del orden de genes ortólogos y la ar- da en 70 hetero-complejos extraídos de la base de datos
quitectura de los operones en 6 genomas de procariotas PDB, para entrenar un algoritmo de clasificación deno-
y 3 de archaeas. Con este criterio, se identificaron minado “Support Vector Machine (SVM)” capaz de
para cada genoma alrededor de 100 proteínas reconocer y predecir interacciones, basado solamente
involucradas en interacciones físicas. Overbeek et al. en la identidad de secuencia de aminoácidos. Wojcik y
[62] y Lathe et al. [63] aplicaron este criterio a genomas Schächter [76] combinan métodos de búsqueda de si-
poco relacionados. El método desarrollado por militud de secuencia aminoacídica y agrupamiento de
Pellegrini et al. [64], denominado perfiles filogenéticos secuencias (del inglés “clustering”) con la información
(del inglés “phylogenetic profiles”), se basa en la co- contenida en las bases de datos acerca de dominios en

205 Biotecnología Aplicada 2003; Vol.20, No.3


Victor de la Torre Russis y cols. Interacciones proteína-proteína

proteínas que interactúan, para predecir mapas de utilizando las anotaciones sobre las interacciones en
interacción proteína-proteína. Este método se ha em- S. cerevisiae.
pleado para predecir el mapa de interacción de proteí- Una lista de métodos de predicción con sitios
nas en la bacteria Escherichia coli, utilizando la WWW, se muestra a continuación:
información previa del mapa de interacción de H. pylori. - http://www.biochem.ucl.ac.uk/bsm/PP/server/ [47].
Pazos y Valencia [77, 78] combinan información de - maine.ebi.ac.uk:8000/services/allfuse/ [68].
secuencias aminoacídicas e información de genomas - http://www.sanger.ac.uk/Software/Pfam/ [70].
para calcular las distancias evolutivas entre proteínas - gpcr.biocomp.unibo.it/predictors [83].
que pertenecen a familias relacionadas y para calcular - www.russell.embl.de/interprets [84, 85].
la correlación de mutaciones entre posiciones de un - http://cbm.bio.uniroma2.it/iSPOT [87].
alineamiento múltiple de secuencias. Esta idea se basa Los autores de esta revisión han desarrollado un
en observaciones previas que indican una correspon- método para la inferencia de interacciones entre pro-
dencia entre los árboles filogenéticos de proteínas aso- teínas que utiliza el modelo de cadenas ocultas de
ciadas (ejemplo: ligando-receptor); para una revisión Markov (HMM) y la combinación de las anotaciones
sobre este tema, vea el artículo de Fraser et al. [79]. El contenidas en las bases de datos PFAM, DIP y SWISS-
método propuesto por Pazos y Valencia se ha aplica- PROT/TrEMBL. Este método permite además, una
do a gran escala, utilizando 67,000 pares de proteínas anotación automática acerca de la función contextual o
de E. coli, de los cuales 2,742 fueron predichos correc- función celular de las proteínas en estudio, así como
tamente [77]. Un método similar al propuesto por de los dominios funcionales que las componen, lo que
Pazos y Valencia, ha sido desarrollado por Ramani y resulta de gran utilidad para complementar y enrique-
Marcotte [80], quienes alinean árboles filogenéticos, cer experimentos de análisis funcional de genomas,
representados por matrices, para definir proteínas proteómica y proyectos de secuenciación. El método
específicas involucradas en la interacción. Este méto- con todas sus particularidades conformó la Tesis de
do se ha aplicado a más de 18 familias de proteínas. Diploma de Victor de la Torre Russis, defendida en la
Lu et al. [81] desarrollaron un método denominado Universidad de La Habana en el año 2003 y está dis-
MULTIPROSPECTOR que extiende la metodología ponible a través de una interfase WWW en los sitios
de compatibilidad secuencia-estructura (del inglés de internet http://www.bioinfo.cu/iPPI.html y http://
“threading”) a la predicción de estructura cuaternaria, bio.cigb.edu.cu/iPPI/iPPI.html.
y que consta de dos fases. Una primera fase ejecuta el
método de “threading” PROSPECTOR, para generar Actualización
un conjunto de estructuras 3D potenciales de la pro- Fraser et al. 2003 proponen que las interacciones pro-
teína en estudio. En una segunda fase, re-evalúan la teína-proteína tienden a disminuir la velocidad a la
compatibilidad de las estructuras 3D generadas con cual ellas evolucionan [88]. Las proteínas que
las estructuras molde que forman parte de complejos interactúan acumulan menos cambios de aminoácidos
cristalográficos determinadas experimentalmente. El en su secuencia, debido posiblemente, a restricciones
método fue evaluado utilizando un conjunto de 40 estructurales.
homodímeros, 15 heterodímeros y 69 monómeros, Sprinzak y colaboradores proponen un método de
explorados contra una selección de 2,478 estructuras cómputo para evaluar la exactitud de los datos experi-
representativas de la base de datos PDB. El método mentales sobre interacciones proteína-proteína obteni-
predijo correctamente 36 homodímeros, 15 heterodí- dos por el método de doble-híbrido [89]. Estos
meros y 65 monómeros. Además, se evaluaron todas investigadores proponen que el 50% de las interaccio-
las posibles interacciones para proteínas de levadura, nes proteína-proteína identificadas en la levadura S.
de un total de 2,865 predicciones utilizando cerevisiae corresponden a casos positivos y que el nú-
MULTIPROSPECTOR, 1,138 están documentadas mero total de interacciones para este organismo
en la base de datos DIP, en comparación con PSI- (“interactoma”) es de 10,000-16,600.
BLAST que predice 1,781 interacciones, de ellas 1,215 Ofran y Rost utilizaron una red neuronal para pre-
documentadas en DIP. decir la región de contacto en las interacciones proteí-
Zhou y Shan [82] y Fariselli et al. [83] utilizan na-proteína [90]. El método sólo requiere de la
redes neuronales entrenadas en conjuntos de proteí- información de la secuencia aminoacídica de las pro-
nas que interactúan, específicamente perfiles de se- teínas que interactúan. Estos investigadores conclu-
cuencia y accesibilidad al solvente de residuos vecinos, yeron que el 70% de sus predicciones son correctas y
para predecir sitios de interacción proteína-proteína. que predicen correctamente al menos un sitio de
Estos métodos son capaces de predecir correctamente interacción en 66 de un total de 333 complejos
el 69-73% de los residuos que componen la interfase. proteicos estudiados (20% de los casos).
Aloy y Russell [84, 85] utilizan las estructuras Goffard et al. 2003 desarrollaron el método IPPRED
cristalográficas de complejos moleculares para eva- para la inferencia de interacciones entre proteínas ba-
luar mediante un potencial empírico, cuándo una pro- sado en la similitud de secuencias aminoacídicas [91].
teína homóloga al par de proteínas interactuantes IPPRED utiliza el programa BLAST [69] y los datos
conserva el mismo mecanismo de interacción. Por úl- experimentales documentados en BIND [26] y en la
timo, Bader y Hogue [86] han aplicado la teoría de literatura científica para inferir las interacciones entre
grafo para detectar regiones densamente pobladas en proteínas. Además, IPPRED está disponible a través
enrejados de interacciones proteína-proteína, y de esta de una interfase WWW en el sitio de internet http://
manera predecir complejos moleculares. El algoritmo cbi.labri.fr/outils/ippred/.
desarrollado por estos investigadores, MCODE (del von Mering et al. 2003 implementaron la predic-
inglés “molecular complex detection”), fue evaluado ción de asociaciones entre proteínas en el método

206 Biotecnología Aplicada 2003; Vol.20, No.3


Victor de la Torre Russis y cols. Interacciones proteína-proteína

STRING [92]. STRING no utiliza la información ex- teínas. Una vez descritas estas interacciones o
perimental sobre interacciones proteína-proteína ano- “interactoma” será posible el diseño de fármacos más
tada en las bases de datos referidas en este artículo; específicos y la ingeniería de procesos celulares.
por el contrario utiliza información sobre la fusión de La combinación del mayor número posible de datos
dominios, la conservación del orden génico y la distri- experimentales y teóricos, sobre interacciones entre pro-
bución filogenética, contenida en los genomas secuen- teínas, proporcionará información más completa y de-
ciados completamente. La nueva versión del método tallada de los sistemas biológicos. Especial cuidado debe
está disponible a través de una interfase WWW en el prestarse a las anotaciones en las bases de datos, pues
sitio de internet http://www.bork.embl-heidelberg.de/ de manera general son la fuente para el desarrollo de
STRING/. métodos teóricos de predicción. El uso combinado de
las anotaciones en bases de datos que se complementen
Conclusiones entre sí, aumentará el nivel de confianza en dichas anota-
La anotación funcional detallada para un genoma ciones y permitirá una curación y validación detallada.
secuenciado completamente requiere del estudio de
las interacciones entre sus componentes. De aquí se Agradecimientos
desprende la importancia y el enorme esfuerzo para Los autores agradecen a Liliana Basabe y a la Dra.
desarrollar métodos experimentales y teóricos más Lila Castellanos la lectura crítica del manuscrito y las
precisos para el estudio de las interacciones entre pro- oportunas sugerencias.

1. Pawson T, Nash P. Protein-protein interactio- 14. Xenarios I, Eisenberg D. Protein interaction 27. Ng SK, Zhang Z, Tan SH. Integrative
ns define specificity in signal transduction. databases. Curr Opin Biotechnol, 2001; approach for computationally inferring
Genes Dev 2000;14:1027-47. 12:334-9. protein domains interactions. Bioinformatics
2003;19:923-9.
2. Pawson T, Raina M, Nash P. Interaction 15. MacBeath G, Schreiber SL. Printing protein
domains: from simple binding events to complex as microarrays for high throughput function 28. Ji ZL, Chen X, Zhen CJ, Yao LX, Han LY,
cellular behavior. FEBS Lett 2002;513:2-10. determination. Science 2000;289:1760-2. Yeo WK, et al. KDBI: kinetic data of bio-mole-
cular interactions database. Nucleic Acids Res
3. Teichmann SA, Murzin AG, Chothia C. 16. Zhu H, Bilgin M, Bangham R, Hall D, 2003;31:255-7.
Determination of protein function, evolution Casamayor A, Bertone P, et al. Global analysis
and interactions by structural genomics. Curr of protein activities using proteome chips. 29. Zanzoni A, Montecchi-Palazzi L, Quondam
Opin Struct Biol 2001;11:354-63. Science 2001;293:2101-5. M, Ausiello G, Helmer-Citterich M, Cesareni G.
MINT: a molecular interaction database. FEBS
4. Walhout A, Sordella R, Lu X, Hartley J, Temple 17. Zhu H, Klemic JF, Chang S, Bertone P, Lett 2002;513:135-40.
G, Brasch M, et al. Protein interaction mapping Casamayor A, Klemic KG, et al. Analysis of
in C. elegans using proteins involved in vulval yeast protein kinases using protein chips. 30. Thierry-Mieg J, Thierry-Mieg D, Stein L.
development. Science 2000;287:116-22. Nature Genet 2000;26:283-9. ACEDB: The ACE database manager. In: S.
Letovsky, editor. Bioinformatics, Databases
5. Gavin AC, Bosche M, Krause R, Grandi P, 18. Rigaut G, Shevchenko A, Rutz B, Wilm M, and Systems. Dordrecht, The Netherlands:
Marzioch M, Bauer A, et al. Functional Mann M, Seraphin B. A generic protein Kluwer Academic Publishers; 1999. p.265-78.
organization of the yeast proteome by purification method for protein complex cha-
systematic analysis of protein complexes. racterization and proteome exploration. 31. Stein L, Thierry-Mieg J. Scriptable access to
Nature 2002;415:141-7. Nature 1999;17:1030-2. the Caenorhabditis elegans genome sequence
and other Acedb databases. Genome Res
6. Ho Y, Gruhler A, Heilbut A, Bader GD, Moore 19. von Mering C, Krause R, Snel B, Cornell M, 1999;8:1308-15.
L, Adams SL, et al. Systematic identification of Oliver SG, Fields S, et al. Comparative assess-
protein complexes in Saccharomyces cerevi- ment of large-scale data sets of protein-protein 32. Thorn KS, Bogan AA. ASEdb: a database
siae by mass spectrometry. Nature 2002;415: interactions. Nature 2002;417:399-403. of alanine mutations and their effects on the
180-3. free energy of binding in protein interactions.
20. Kemmeren P, van Berkum NL, Vilo J, Bijma Bioinformatics 2001;17:284-5.
7. Uetz P, Giot L, Cagney G, Mansfield TA, Judson T, Donders R, Brazma A, et al. Protein interaction
RS, Knight JR, et al. A comprehensive analysis verification and functional annotation by 33. Sánchez C, Lachaize C, Janody F, Bellon
of protein-protein interactions in Saccharomy- integrated analysis of genome-scale data. Mol B, Röder L, Euzenat J, et al. Grasping at mole-
ces cerevisiae. Nature 2000;403:623-7. Cell 2002;9:1133-43. cular interactions and genetic networks in
Drosophila melanogaster using FlyNets, an
8. Ito T, Chiba T, Ozawa R, Yoshida M, Hattori M, 21. Schwikowski B, Uetz P, Fields S. A network internet database. Nucleic Acids Res 1999;
Sakaki Y. A comprehensive two-hybrid analysis of protein-protein interactions in yeast. Nature 27:89-94.
to explore the yeast protein interactome. Proc Biotechnol 2000;18:1257-61.
Natl Acad Sci USA 2001;98:4569-74. 34. Mewes HW, Frishman D, Güldener U,
22. Gerstein M, Lan N, Jansen R. Integrating Mannhaupt G, Mayer K, Mokrejs M, et al. MIPS:
9. Rain JC, Selig L, De Reuse H, Battaglia V, interactomes. Science 2002;295:284-7. a database for genomes and protein sequen-
Reverdy C, Simon S, et al. The protein-protein ces. Nucleic Acids Res 2002;30:31-4.
interaction map of Helicobacter pylori. Nature 23. Tong AH, Drees B, Nardelli G, Bader GD,
2001;409:211-5. Brannetti B, Castagnoli L, et al. A combined 35. Costanzo MC, Crawford ME, Hirschman
experimental and computational strategy to JE, Kranz JE, Olsen P, Robertson LS, et al. YPDTM,
10. Claverie JM. Gene number. What if there define protein interaction networks for peptide PombePD TM and WormPDTM: model organism
are only 30,000 human genes? Science recognition modules. Science 2002;295: volumes of the BioKnowledgeTM library, an
2001;291:1255-7. 321-4. integrated resource for protein information.
Nucleic Acids Res 2001;29:75-9.
11. Edwards AM, Kus B, Jansen R, Greenbaum 24. Xenarios I, Fernández E, Salwinski L,
D, Greenblatt J, Gerstein M. Bridging structural Joyce-Duan X, Thompson MJ, Marcotte EM, 36. Eilbeck K, Brass A, Paton N, Hodgman C.
biology and genomics: assessing protein Eisenberg D. DIP:The database of interac- INTERACT: an object oriented protein-protein
interaction data with known complexes. Trends ting proteins: 2001 update. Nucleic Acids interaction database. ISMB 1999;7:87-94.
Genet 2002;18:529-36. Res 2001;29:239-41.
37. Eisenberg D, Marcotte EM, Xenarios I,
12. Jansen R, Greenbaum D, Gerstein M. 25. Xenarios I, Salwinski L, Duan XJ, Higney P, Yeates TO. Protein function in the post-
Relating whole-genome expression data with Kim SM, Eisenberg D. DIP, the database of in- genomic era. Nature 2000;405:823-6.
protein-protein interactions. Genome Res teracting proteins: a research tool for studying
2002;12:37-46. cellular networks of protein interactions. 38. Morera S, Lebras G, Lascu I, Lacombe
Nucleic Acids Res 2002;30:303-5. ML, Veron M, Janin J. Refined X-ray structure
13. Vajda S, Vakser IA, Sternberg MJE, Janin J. of Dictyostelium discoideum nucleoside
Modeling of protein interactions in genomes. 26. Bader GD, Betel D, Hogue CWV. BIND: the diphosphate kinase at 1.8Å resolution. J Mol
Proteins 2002;47:444-6. biomolecular interaction network database. Biol 1994;243:873-90.
Nucleic Acids Res 2003;31:248-50.

207 Biotecnología Aplicada 2003; Vol.20, No.3


Victor de la Torre Russis y cols. Interacciones proteína-proteína

39. Crennell SJ, Garman EF, Laver W, Vimr E, 58. Chakrabarti P, Janin J. Dissecting protein- 75. Bock JR, Gough DA. Predicting protein-
Taylor GL. Crystal structure of a bacterial protein recognition sites. Proteins 2002;47: protein interactions from primary structure.
sialidase (from Salmonella typhimurium LT2) 334-43. Bioinformatics 2001;17:455-60.
shows the same fold as an influenza virus
neuraminidase. Proc Natl Acad Sci USA 59. Halperin I, Ma B, Wolfson H, Nussinov R. 76. Wojcik J, Schächter V. Protein-protein
1993;90:9852-6. Principles of docking: An overview of search interaction map inference using interacting
algorithms and a guide to scoring functions. domain profile pairs. Bioinformatics 2001;17
40. Valencia A, Pazos F. Computational Proteins 2002;47:409-43. Suppl 1:296-305.
methods for the prediction of protein interac-
tions. Curr Opin Struct Biol 2002;12:368-73. 60. Smith GR, Sternberg MJ. Prediction of protein- 77. Pazos F, Valencia A. Similarity of phylo-
protein interactions by docking methods. Curr genetic trees as indicator of protein-protein
41. Chothia C, Janin J. Principles of protein- Opin Struct Biol 2002;12:28-35. interaction. Protein Eng 2001;14:609-14.
protein recognition. Nature 1975;256:705-8.
61. Dandekar T, Snel B, Huynen M, Bork P. 78. Pazos F, Valencia A. In silico two-hybrid
42. Janin J, Chothia C. The structure of Conservation of gene order: a fingerprint of system for the selection of physically interac-
protein-protein recognition sites. J Biol Chem proteins that physically interact. Trends ting proteins pairs. Proteins 2002;47:219-27.
1990;265:16027-30. Biochem Sci 1998;23:324-8.
79. Fraser HB, Hirsh AE, Steinmetz LM,
43. Lawrence MC, Colman PM. Shape 62. Overbeek R, Fonstein M, D’Souza M, Pusch Scharfe C, Feldman MW. Evolutionary rate
complementarity at protein/protein interfaces. GD, Maltsev N. The use of gene clusters to infer in the protein interaction network. Science
J Mol Biol 1993;234:946-50. functional coupling. Proc Natl Acad Sci USA 2002;296:750-2.
1999;96:2896-901.
44. Young L, Jernigan RL, Covell DG. A role 80. Ramani AK, Marcotte EM. Exploiting the
for surface hydrophobicity in protein-protein 63. Lathe WC, Snel B, Bork P. Gene context co-evolution of interacting proteins to discover
recognition. Protein Sci 1994;3:717-29. conservation of a higher order than operons. interaction specificity. J Mol Biol 2003;327:
Trends Biochem Sci 2000;25:474-9. 273-84.
45. Janin J. Principles of protein-protein re-
cognition from structure to thermodynamics. 64. Pellegrini M, Marcotte EM, Thompson MJ, 81. Lu L, Lu H, Skolnick J. MULTIPROSPECTOR:
Biochimie 1995;77:497-505. Eisenberg D, Yeates TO. Assigning protein an algorithm for the prediction of protein-
functions by comparative genome analysis: protein interaction by multimeric threading.
46. Janin J. Protein-protein recognition. Prog protein phylogenetic profiles. Proc Natl Acad Proteins 2002;49:350-64.
Biophys Mol Biol 1996;64:145-66. Sci USA 1999;96:4285-8.
82. Zhou HX, Shan Y. Prediction of protein
47. Jones S, Thornton JM. Principles of protein- 65. Huynen M, Snel B, Lathe W, Bork P. interaction sites from sequence profile and
protein interaction. Proc Natl AcadSci USA Predicting protein function by genomic residue neighbor list. Proteins 2001;44:
1996;93:13-20. context: quantitative evaluation and qualita- 336-43.
tive. Genome Res 2000;10:1204-10.
48. Jones S, Thornton JM. Analysis of protein- 83. Fariselli P, Pazos F, Valencia A, Casadio R.
protein interaction sites using surface patches. 66. Marcotte EM, Pellegrini M, Ho-Leung N, Prediction of protein-protein interaction sites
J Mol Biol 1997a;272:121-32. Rice DW, Yeates TO, Eisenberg D. Detecting in heterocomplexes with neural networks. Eur
protein function and protein-protein interac- J Biochem 2002;269:1356-61.
49. Jones S, Thornton JM. Prediction of protein- tions from genome sequences. Science 1999a;
protein interaction sites using surface patches. 285:751-3. 84. Aloy P, Russell RB. Interrogating protein
J Mol Biol 1997b;272:133-43. interaction networks through structural
67. Marcotte EM, Pellegrini M, Thompson MJ, biology. Proc Natl Acad Sci USA 2002;99:
50. Xu D, Tsai CJ, Nussinov R. Hydrogen bonds Yeates TO, Eisenberg D. A combined algorithm 5896-901.
and salt bridges across protein-protein for genome-wide prediction of protein
interfaces. Protein Eng 1997;10:999-1012. function. Nature 1999b;402:83-6. 85. Aloy P, Russell RB. InterPreTS: protein
interaction prediction through tertiary
51. Tsai CJ, Lin SL, Wolfson HJ, Nussinov R. 68. Enright A, Iliopoulos I, Kyrpides N, structure. Bioinformatics 2003;19:161-2.
Studies of protein-protein interfaces: a Ouzounis C. Protein interaction maps for com-
statistical analysis of the hydrophobic effect. plete genomes based on gene fusion events. 86. Bader GD, Hogue CWV. An automated
Protein Sci 1997;6:53-64. Nature 1999;402:86-90. method for finding molecular complexes in
large protein interaction networks. BMC Bio-
52. Keskin O, Bahar I, Badretdinov AY, Ptitsyn 69. Altschul SF, Gish W, Miller W, Myers EW, informatics 2003;4:2.
OB, Jernigan RL. Residue frequencies and Lipman DJ. Basic local alignment search tool.
pairing preferences at protein-protein J Mol Biol 1990;215:403-10. 87. Brannetti B, Zanzoni A, Montecchi-Palazzi
interfaces. Protein Sci 1998;7:2578-86. L, Cesareni G, Helmer-Citterich M. iSPOT: a
70. Bateman A, Birney E, Cerruti L, Durbin R, web tool for the analysis and recognition of
53. Lo Conte L, Chothia C, Janin J. The atomic Etwiller L, Eddy SR, et al. The Pfam protein protein domain specificity. Comparative and
structure of protein-protein recognition sites. families database. Nucleic Acids Res 2002; Functional Genomics 2001;2:314-8.
J Mol Biol 1999;285:2177-98. 30:276-280.
88. Fraser HB, Wall DP, Hirsh AE. A simple
54. Norel R, Perrey D, Wolfson HJ, Nussinov R. 71. Corpet F, Servan F, Gouzy J, Kahn D. ProDom dependence between protein evolution rate
Examination of shape complementarity in and ProDom-CG: tools for protein domain and the number of protein-protein interactio-
docking of unbound proteins. Proteins 1999; analysis and whole genome comparisons. ns. BMC Evolutionary Biol 2003;3:11.
36:307-17. Nucleic Acids Res 2000;28:267-9.
89. Sprinzak E, Sattath S, Margalit H. How reliable
55. Scheinerman FB, Norel R, Honig B. 72. Gallet X, Charloteaux B, Thomas A, are experimental protein-protein interaction
Electrostatic aspects of protein-protein Brasseur R. A fast method to predict protein data? J Mol Biol 2003;327:919-23.
interaction. Curr Opin Struct Biol 2000;10: interaction sites from sequences. J Mol Biol
153-9. 2000;302:917-26. 90.Ofran Y, Rost B. Predicted protein-protein
interaction sites from local sequence informa-
56. Valdar WSJ, Thornton JM. Protein- 73. Sprinzak E, Margalit H. Correlated sequence- tion. FEBS Lett 2003;544:236-39.
protein interfaces: analysis of amino acid signatures as markers of protein-protein
conservation in homodimers. Proteins interaction. J Mol Biol 2001;311:681-92. 91. Goffard N, Garcia V, Iragne F, Groppi A,
2001;42:108-24. de Daruvar A. IPPRED: server for proteins in-
74. Apweiler R, Attwood TK, Bairoch A, teractions inference. Bioinformatics 2003;
57. Glaser F, Steinberg DM, Vakser IA, Ben-Tal Bateman A, Birney E, Biswas M, et al. The 19:903-4.
N. Residue frequencies and pairing preferen- InterPro database, an integrated documen-
ces at protein-protein interfaces. Proteins tation resource for protein families, domains 92. von Mering C, Huynen M, Jaeggi D,
2001;43:89-102. and functional sites. Nucleic Acids Res Schmidt S, Bork P, Snel B. STRING: a database
2001;29:37-40. of predicted functional associations between
proteins. Nucleic Acids Res 2003;31:258-61.

Recibido en Mayo de 2003. Aprobado


en Agosto de 2003.

208 Biotecnología Aplicada 2003; Vol.20, No.3

Anda mungkin juga menyukai