Art I Go Triage M Virtual

Artigo
Estratgias de Triagem Virtual no Planejamento de Frmacos

Rodrigues, R. P.; Mantoani, S. P.; de Almeida, J. R.; Pinsetta, F. R.;
Semighini, E. P.; da Silva, V. B.;* da Silva, C. H. P.
Rev. Virtual Quim., 2012, 4 (6), 739-776. Data de publicao na Web: 24 de dezembro de 2012
http://www.uff.br/rvq
Virtual Screening Strategies in Drug Design

Abstract: The development of virtual screening techniques represents a major advance in the
current drug design era. Through several strategies, virtual screening is able to facilitate the
selection of molecules with the desired chemical features to modulate the biological activity of
the most attractive molecular targets currently available. From the simplest techniques, as the
similarity search or molecular docking, to more complex strategies, including statistical
methods and machine learning, the main goal of virtual screening is to improve the searching
for molecules with the desired features required for becoming drug candidates, thus
accelerating the continuous process of drug design. The aim of this review is to discuss the
main virtual screening strategies and how they relate to the drug design process.
Keywords: Virtual screening; drug design; molecular modeling.
Resumo
O desenvolvimento de tcnicas de triagem virtual representa um dos maiores avanos na atual
era de planejamento de frmacos. A triagem virtual, atravs de inmeras estratgias distintas,
capaz de direcionar a seleo de molculas com as caractersticas qumicas desejadas para
modular a atividade biolgica dos mais diversos e atrativos alvos moleculares conhecidos na
atualidade. Desde as tcnicas mais simples, como a bus a po si ila idade ou do age
molecular, at as estratgias mais complexas, que envolvem mtodos estatsticos e de
aprendizagem de mquinas, o objetivo principal da triagem virtual aprimorar o processo de
busca de novos candidatos a frmacos e acelerar o processo contnuo do seu planejamento. O
objetivo desta reviso discutir as principais tcnicas de triagem virtual e como elas se
relacionam com o desenvolvimento de novos frmacos.
Palavras-chave: Triagem virtual; planejamento de frmacos; modelagem molecular.
* Pontifcia Universidade Catlica de Gois, Departamento de Biomedicina, Rua 232, n 128,

Setor Universitrio, CEP: 74605-140, Goinia, GO, Brasil.
viniciusbarreto11@yahoo.com.br
DOI: 10.5935/1984-6835.20120055
Rev. Virtual Quim. |Vol 4| |No. 6| |739-776| 739

Volume 4, Nmero 6 Novembro-Dezembro 2012
Revista Virtual de Qumica

ISSN 1984-6835
Estratgias de Triagem Virtual no Planejamento de Frmacos

Ricardo P. Rodrigues,a Susimaire P. Mantoani,a Jonathan R. de Almeida,a
Flvio Roberto Pinsetta,a Evandro P. Semighini,a Vinicius B. da Silva,b,*
Carlos Henrique T. P. da Silvaa
a
Universidade de So Paulo, Faculdade de Cincias Farmacuticas de Ribeiro Preto, Av. do
Caf, s/n, Monte Alegre, CEP: 14040-903, Ribeiro Preto, SP, Brasil.
b
Pontifcia Universidade Catlica de Gois, Departamento de Biomedicina, Rua 232, n 128,
Setor Universitrio, CEP: 74605-140, Goinia, GO, Brasil.
* viniciusbarreto11@yahoo.com.br
Recebido em 21 de julho de 2012. Aceito para publicao em 12 de dezembro de 2012
1. Introduo
2. Bibliotecas Virtuais
3. Triagem Virtual Baseada na Estrutura do Alvo Molecular
3.1. Algoritmos de busca
3.2. Funes de escore
3.3. Conformao do alvo molecular
4. Triagem Virtual Baseada em Ligantes
4.1. Triagem virtual por padro farmacofrico
4.2. Triagem por similaridade
4.3. Descritores e novas tendncias
4.4. Aprendizagem de mquinas
5. Concluses
1. Introduo diversos processos fisiopatolgicos que

afligem a humanidade.1-3 A maior parte
dessas tecnologias fornece comunidade
Nas ltimas dcadas, um grande nmero cientfica grande diversidade de dados e
de tecnologias emergentes tm sido informaes que podem ser traduzidas em
aplicadas em projetos de pesquisa e conhecimento qumico e biolgico. Com esse
desenvolvimento de frmacos. Neste propsito, as tcnicas computacionais
contexto, destacam-se a genmica e a aplicadas ao estudo de sistemas biolgicos
protemica, que oferecem informaes mostram-se eficazes no manejo de dados e
relevantes de novos e atrativos alvos mapeamento da estrutura 3D de alvos
moleculares e sua relao com os mais moleculares e ligantes, guiando a
740 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

Rodrigues, R. P. et al.
identificao e otimizao de novos na busca e descoberta de compostos de

candidatos a frmacos.4-6 partida a triagem virtual.6,13-15
Um novo conceito nos projetos de As tcnicas de triagem virtual, atravs da
planejamento de frmacos conhecido como utilizao de mtodos computacionais,
d ugga ilit e ada ais do ue a ta o he idos pelo te o i sili o ,
possibilidade de modular um alvo biolgico auxiliam na seleo de compostos orgnicos
lanando mo de molculas orgnicas, com o promissores como ligantes de alvos
objetivo de obter efeitos teraputicos. Os teraputicos de interesse, sejam eles
alvos mais atrativos so os que possuem agonistas ou antagonistas de receptores, ou
representatividade na gnese ou progresso ainda inibidores enzimticos. Normalmente,
de um processo patolgico. Com as a estrutura qumica de possveis ligantes
informaes obtidas at o momento atravs advm de bases de dados que contm
da codificao do genoma humano, o grande milhares de compostos com propriedades
desafio entender as funes de tais alvos fsico-qumicas semelhantes s exibidas por
moleculares durante os eventos que induzem frmacos reconhecidos na prtica clnica,
a progresso das doenas e descobrir alm de grande diversidade qumica e,
substncias capazes de modular tais eventos portanto, preenchendo os requisitos bsicos
e restabelecer a sade do indivduo. De para garantir ampla gama de possveis
acordo com Cheng e colaboradores, cerca de interaes intermoleculares com os mais
60% dos projetos de descoberta de novos diversos alvos moleculares.16 Dessa forma, os
frmacos baseados em molculas pequenas o postos ide tifi ados i sili o omo
falham no processo de transposio da etapa promissores, tanto do ponto de vista
inicial (de promissor ligante) at a etapa final farmacofrico como do ponto de vista de
(de candidato a frmaco), pois o alvo suas propriedades fsico-qumicas, podem ser
biolgico em questo no participa sintetizados, ou mesmo adquiridos de
diretamente na patologia e, por conseguinte, empresas especializadas e, posteriormente,
sua modulao apenas no garantir a investigados por ensaios biolgicos.
eficcia do tratamento farmacolgico8.
As estratgias de triagem virtual
Desde a concepo do alvo biolgico at a compreendem, basicamente, duas
descoberta de um novo frmaco, o que pode abordagens principais: a triagem baseada na
levar uma dcada ou mais,9 inmeras estrutura do alvo molecular e a triagem
abordagens computacionais de baseada em ligantes. As tcnicas baseadas na
bioinformtica e quimioinformtica podem estrutura do alvo molecular consideram a
ser aplicadas nos diferentes estgios do estrutura tridimensional (3D) do alvo
processo de desenvolvimento. Nos estgios teraputico, utilizando como estratgia
iniciais, o foco principal concentra-se em principal os clculos de docagem para
identificar possveis ligantes para um alvo seleo de ligantes potenciais, com
biolgico, enquanto que nos estgios finais a caractersticas qumicas, eletrnicas e
ideia trabalhar apenas com ligantes que estruturais que favorecem interaes com o
tenham propriedades fsico-qumicas, stio ligante do alvo molecular. O
farmacodinmicas e farmacocinticas ideais planejamento de substncias bioativas com
para se tornarem frmacos e adentrar o base na estrutura do alvo molecular uma
mercado farmacutico.10-12 das estratgias mais robustas de
identificao de novos ligantes, capaz de
O grande nmero de alvos moleculares
contribuir em todo o processo, desde a
atrativos explorados atualmente no
anlise da estrutura 3D do alvo teraputico
planejamento de frmacos requer o emprego
at a otimizao das interaes moleculares
de mtodos rpidos e relativamente precisos
e propriedades farmacocinticas de
capazes de identificar prottipos, tambm 17-19
compostos candidatos a ensaios clnicos.
conhecidos como compostos de partida. Uma
das principais tcnicas utilizadas atualmente A disponibilidade de informaes

estruturais acerca do alvo teraputico de Tcnicas como Qumica Combinatria

interesse auxilia na descoberta e (QC) e ensaios biolgicos automatizados em
planejamento de compostos com la ga es ala high-throughput s ee i g -
complementaridade estrica, eletrosttica e HTS), tm aumentado consideravelmente o
hidrofbica ao seu stio ligante.9 O sucesso nmero de compostos avaliados quanto
deste tipo de abordagem exige que duas sua atividade. O uso de informaes
questes sejam previamente resolvidas: estruturais obtidas por triagem virtual pode
inicialmente, deve-se eleger um alvo reduzir drasticamente esse nmero,
biolgico de relevncia comprovada na tornando o processo mais dinmico e
gnese ou progresso de uma doena. Em otimizado, uma vez que prioriza as molculas
segundo lugar, deve-se desenvolver agentes mais interessantes dentre as milhares
teraputicos que modulem a atividade do disponveis no incio do projeto.20
alvo de maneira apropriada e que
Dessa forma, o objetivo principal de uma
apresentem nveis txicos tolerveis ao
triagem virtual o de identificar os
paciente.20
compostos de uma biblioteca que tenham
J as estratgias baseadas em ligantes maior probabilidade de se ligar a um alvo
utilizam molculas orgnicas com atividade biolgico. Com os avanos tecnolgicos, a
biolgica conhecida, funcionando como cada dia fica mais palpvel a realizao e
moldes para a triagem em bases de dados de aplicao prtica dos conceitos de triagem
novas entidades qumicas com algum nvel de virtual, em particular na otimizao de
similaridade, compartilhando com estes compostos em espaos qumicos que sejam
moldes a mesma atividade biolgica. Dessa acessveis sinteticamente e que,
forma, compostos so selecionados de concomitantemente, estejam de acordo com
acordo com os mais variados mtodos de os padres farmacofricos exigidos para o
similaridade molecular e farmacofrica, espao qumico de frmacos e substncias
direcionados por relaes entre propriedades bioativas em Qumica Medicinal (Figura 1).24-
estruturais e atividade biolgica.21-23 26
Figura 1. Esquema representando as otimizaes nas triagens para a pesquisa

farmacutica, onde o Espao Qumico representa o imenso universo de possveis molculas. O
espao bioativo representa todas as molculas com caractersticas farmacofricas que
favoream sua interao com algum alvo biolgico. J o espao de frmacos representa
apenas uma pequena poro na interseo do espao acessvel Qumica Medicinal com o
espao bioativo. O espao de frmacos engloba o seleto grupo de substncias bioativas que
so seguras e eficientes no tratamento de processos patolgicos. Adaptado de Drewry &
Macarron (2010).27

2. Bibliotecas Virtuais qumicos uma estratgia usual na reduo

inicial da biblioteca, com o intuito de priorizar
compostos que apresentem propriedades
fsico-qumicas e funcionalidades qumicas
Para a execuo do procedimento de
consistentes com o que se espera para
triagem virtual, a utilizao de uma biblioteca
frmacos em geral, ou at para os interesses
virtual de compostos qumicos uma etapa
particulares de uma srie de compostos
crucial que deve fornecer compostos com o
bioativos.29-31
maior grau possvel de diversidade molecular,
sejam eles j conhecidos e consagrados por Nos ltimos anos, grande nfase tem sido
suas atividades biolgicas e teraputicas, direcionada caracterizao de propriedades
sejam compostos j sintetizados e disponveis d ug-like , i lui do a Reg a dos Cinco, de
para ensaios biolgicos, molculas Lipinski,32 com o intuito de minimizar o risco
hipotticas (desenhadas em computador de seleo de molculas com a atividade
antes da sntese) ou at produtos de origem biolgica desejada, mas que so inadequadas
natural. A qualidade da base de dados do ponto de vista de propriedades muito
utilizada de vital importncia, pois a fonte importantes em farmacoterapia, tais como:
de onde sero selecionados os compostos biodisponibilidade, permeabilidade,
promissores para futuros ensaios absoro, metabolismo, excreo e
biolgicos.28 toxicidade. A escolha de uma biblioteca
Conceitos como diversidade e virtual de compostos com propriedades
representatividade so utilizados para o siste tes o o o eito d ug-like pode
reduzir o tempo do ciclo de desenvolvimento
assegurar uma boa amostragem da biblioteca
e minimizar a inviabilidade de aplicao
virtual. A diversidade um fator que almeja
teraputica de molculas bioativas por
garantir que as molculas selecionadas sejam
inadequao de propriedades
diferentes entre si e possam cobrir o maior
farmacocinticas e/ou toxicidade
espao qumico possvel de substncias
acentuada,33,34 propriedades estas que
bioativas (Figura 1), maximizando, assim, a
representam o principal gargalo no insucesso
probabilidade de encontrar um conjunto
diverso de molculas promissoras durante de candidatos a frmacos.35-37
uma simulao de triagem virtual. J a
representatividade almeja garantir que as
amostras da biblioteca tenham uma 3. Triagem Virtual Baseada na
distribuio equivalente nas diversas direes Estrutura do Alvo Molecular
do espao qumico, assegurando, assim, que
no existam muitas amostras moleculares
cobrindo um espao qumico restrito e A estratgia de triagem virtual baseada na
poucas cobrindo o espao qumico estrutura do alvo-molecular est associada
remanescente,28 fato que pode conferir busca de ligantes atravs de mtodos
baixo grau de confiabilidade ao experimento computacionais que consideram a estrutura
por tendenciar as simulaes. 3D de um alvo teraputico.38 O objetivo
Uma biblioteca virtual composta central o de predizer compostos de uma
tipicamente por uma base de dados de base de dados capazes de interagir com o
compostos disponveis para aquisio stio ligante do alvo-molecular e ordenar
comercial, como o caso da base de dados estas molculas de acordo com a sua
ZINC,16 que j supera 20 milhes de afinidade pelo stio receptor, com o intuito de
compostos. Como as bases de dados so identificar ligantes promissores com
desenvolvidas para auxiliar a triagem de potencial atividade farmacolgica. Os
molculas com aplicao teraputica, muito clculos de docagem representam a
importante que as propriedades moleculares abordagem central utilizada na triagem
sejam consideradas. A aplicao de filtros baseada em estrutura.39-41

As tcnicas de docagem, desenvolvidas para algoritmos desenvolvidos para programas de

predizer a melhor orientao e conformao docagem amplo. A capacidade de
de uma molcula ligante no seu stio reproduzir a orientao experimental de
receptor, so empregadas h algum tempo ligantes em relao aos modos de ligao
no processo de planejamento de frmacos. A observados em complexos com estrutura j
ideia geral obter um conjunto de resolvida a caracterstica mais importante
conformaes do complexo ligante-receptor do clculo de docagem. A reproduo de um
e classific-las em ordem de prioridade com modo de ligao experimental normalmente
base em suas estabilidades energticas.10,42 considerada bem-sucedida quando o desvio
dio uad ti o Root Mea ua e
A capacidade de predio dos modos de
De iatio , RMD al ulado se e o t a
ligao e afinidade de compostos que
abaixo de 2,0 (Figura 2) entre a orientao
interagem com o stio ligante de uma
cristalogrfica (experimental) e a orientao
protena um dos maiores desafios do
obtida durante o clculo.43
desenvolvimento de frmacos baseado em
estrutura. Consequentemente, o nmero de
Figura 2. Reproduo do modo de ligao experimental (orientao cristalogrfica) da

estaurosporina no stio ligante da CDK2 atravs do clculo de docagem, com RMSD de 0,91 .
Simulao realizada com programa GOLD 3.1.1.43 Figura gerada com o programa PyMOL.44
V ios p og a as de do age ue caractersticas qumicas e estruturais

usam diferentes filosofias metodolgicas distintas de ligantes usuais e conhecidos para
esto disponveis. Alguns dos programas mais um alvo molecular especfico,50
utilizados na atualidade incluem: FlexX,45 principalmente quando a base de dados
DOCK,46 GOLD43, GLIDE47,48 e AutoDock.49 utilizada garante elevado grau de diversidade
DOCK e AutoDock tm a vantagem adicional e representatividade molecular, permitindo,
de serem gratuitos para instituies assim, explorar ao mximo o grau de
acadmicas. A tcnica de docagem popular variabilidade qumica requerido para
justamente pelo seu potencial de interao de possveis ligantes em um alvo-
identificao de compostos com

molecular atravs da complementaridade que seria empregada em uma busca flexvel

com o stio receptor. do complexo ligante-protena.51,57
Os protocolos de docagem so formados, O maior problema desta abordagem que
de maneira geral, por dois componentes: o a flexibilidade do ligante no considerada.
algoritmo de busca e a funo de escore. O Na maioria das vezes, molculas pequenas
algoritmo utilizado na busca sistemtica de possuem grande variao conformacional,
orientaes e conformaes do ligante no com diversos estados de baixa energia. At
stio receptor e a funo de escore aplicada mesmo nas que tm poucas ligaes
aos possveis modos de ligao propostos rotacionveis podem ocorrer diferenas
pelo algoritmo, com o propsito de classific- significativas entre a conformao
los por afinidade de acordo com suas experimental e as conformaes sugeridas
interaes com os resduos de aminocidos pelo mtodo de docagem.53,57,58 Na tentativa
do stio receptor.42,51 de suprir esta deficincia, os algoritmos
tornaram-se mais elaborados, permitindo
uma busca mais completa no espao qumico,
3.1. Algoritmos de busca com processamento de clculo adequado a
cada situao, incluindo a considerao de
propriedades fsico-qumicas e da
Os algoritmos de busca, genericamente, flexibilidade do ligante. Essas melhorias
so um conjunto de regras e parmetros visaram, principalmente, considerar aspectos
aplicados com o objetivo de explorar a do ajuste induzido do complexo ligante-
flexibilidade da estrutura dos ligantes em receptor e descartar conformaes
simulaes de docagem. Para o xito da energeticamente desfavorveis do ligante,57
triagem virtual, imprescindvel o uso de o que por um lado contribui para o aumento
algoritmos eficientes que no apenas do gasto computacional necessrio para a
encaixem cada molcula do ligante realizao do procedimento, mas incrementa
realisticamente no stio receptor, mas que substancialmente a preciso do mtodo e a
tambm obtenham conformaes qualidade do resultado final.
energeticamente viveis do mesmo. Para
cada molcula, os algoritmos de busca Os algoritmos de busca, quanto anlise
tendem a criar vrias orientaes diferentes, da flexibilidade do ligante, podem ser
com distintos modos de ligao no stio agrupados em trs categorias: sistemticos,
receptor.25,52 Embora cada uma dessas randmicos ou baseados em simulao
tentativas parea ser aleatria e (Tabela 1), sendo que a maioria dos
independente, um grande nmero de programas tende a mesclar algumas destas
algoritmos adota uma heurstica baseada na abordagens.19,29,59
qumica ou geometria dos tomos Os algoritmos randmicos operam
envolvidos, como os algoritmos dos realizando mudanas aleatrias, geralmente
programas FlexX53 e DOCK. Em outros casos, alterando graus de liberdade (ligaes
podem adotar uma tcnica de otimizao rotacionveis) de uma molcula, explorando,
padro, como a estratgia de algoritmo assim, diversas conformaes possveis.
gentico implementada nos programas Nesta categoria destacam-se as simulaes
Autodock54-56 e GOLD.43 de Monte Carlo, tal como no programa MOE-
Nas estratgias pioneiras de docagem, os Dock,60 e os algoritmos genticos,
algoritmos empregados mantinham o ligante representados, principalmente, pelos
60
e a protena em sua conformao inicial programas AutoDock e GOLD [Tabela
durante todo o processo, considerando-os 1].5,19,60
como entidades no flexveis no espao Na estratgia de Monte Carlo, mudanas
o fo a io al do age de o po gido , aleatrias so aplicadas aos movimentos
reduzindo assim a demanda computacional translacionais, rotacionais e torcionais da

molcula. Aps cada movimento, o complexo baixa, a configurao aceita; se for mais
minimizado e a energia da nova estrutura alta, a configurao aceita, com certa
calculada. A aceitao de um novo modo de limitao, que depende da magnitude desse
ligao baseada em sua energia: se for mais aumento.19
Tabela 1. Principais algoritmos utilizados nas estratgias de docagem

Algoritmos de Busca Estratgia Programa de Docagem
AutoDock
Algoritmo Gentico GOLD
DARWIN
MOE-Dock
Randmicos ICM
MC DOCK
Monte Carlo DOCK VISION
AFFINITY
QXP
GLIDE
DOCK
FlexX
Glide
Incremental
Surflex-Dock
Sistemticos Hammerhead
HOOK
Base de dados de confrmeros Flexibase/FLOG
No-estocstico FRED
Dinmica molecular DynaDock
Simulao
Minimizao de energia DOCK
Os algoritmos genticos, tambm modificaes na posio do ligante no sitio

conhecidos como evolucionrios, como o ativo do alvo molecular.43
prprio nome sugere, so programados para
Os algoritmos genticos so
usar o mesmo princpio da evoluo
representados por uma srie binria que
biolgica.25,52 Geralmente, diz-se que os
apresenta uma estrutura de codificao
algoritmos genticos pertencem classe dos
semelhante ao DNA.52 Esta semelhana
algoritmos no determinsticos, isto , o tipo
estratgica, pois permite simular operaes
de clculo usado prev uma tomada de
genticas, como mutaes e recombinaes
deciso a partir de sua heurstica, fornecendo
(Figura 3A). A conformao de uma molcula
solues satisfatrias para a otimizao
deve ser representada de modo a permitir
combinatria a um custo acessvel, com o
que um processo evolucionrio de mutao e
propsito de encontrar solues, que por
seleo ocorra. De forma prtica, todas as
exemplo, no caso da docagem, buscariam
informaes de ngulos de toro de ligaes
predizer a conformao mais estvel.51,62 O
de uma molcula so armazenados como
programa GOLD, por exemplo, utiliza uma
uma sequncia numrica, que ir
variao desse algoritmo, com modificaes
o espo de ao o osso o . De t o
de diedros dos ligantes, geometria de anis e
deste o osso o , ada ge e

corresponde a um ngulo de toro (Figura 3B).25
Figura 3. A) Exemplo de mutaes e recombinao em sequencias binrias de 8 bits de

extenso. Os bits em vermelho destacam as mutaes, que geram os indivduos III e IV. O
indivduo V formado atravs da recombinao entre III e IV. B) Cada valor numrico que
representa um indivduo, possui subgrupos de nmeros responsveis por armazenar
informaes relativas a ngulos de rotaes das partes da molcula. Adaptado de Patrick
(2009).25
Os algoritmos sistemticos exploram os dos novos fragmentos adicionados ser

graus de liberdade das molculas, explorado.19,64 Um exemplo do emprego de
normalmente, atravs de sua construo algoritmos incrementais pode ser observado
incremental no stio receptor. Os algoritmos com o programa FlexX (Tabela1).45
incrementais, como o prprio nome sugere,
Outra estratgia de busca sistemtica a
utilizam-se do mtodo de construo
utilizao de bibliotecas pr-concebidas de
incremental atravs da fragmentao inicial
confrmeros. Um exemplo de algoritmo
da molcula. A simulao se inicia com o
baseado na anlise das conformaes o
posicionamento de um fragmento do ligante,
Flexibase/FLOG, desenvolvido por Miller e
denominado ncora, no stio ativo do alvo
Kearsley.57 O Flexibase65 armazena uma
molecular. Ento, os fragmentos
pequena srie de diferentes conformaes
remanescentes dos ligantes so adicionados
para cada molcula de uma determinada
sucessivamente, at atingir a reconstruo
base de dados. Ento, aproximadamente 25
total da molcula com seu posicionamento
conformaes de cada molcula so
em relao estrutura do receptor. Assim,
selecionadas adotando como critrio o desvio
um algoritmo de construo incremental
mdio quadrtico entre elas. Por fim, cada
possui trs fases: a seleo do fragmento
conformao da molcula submetida ao
ncora, o seu posicionamento no stio e a
procedimento de docagem utilizando o
fase da construo incremental.57,63
algoritmo FLOG, o qual considerar cada
A heurstica dos algoritmos incrementais conformao como esttica durante a
considera o fato de que a maioria das simulao. 57,66-69
molculas possui pelo menos um fragmento
Outro programa bastante empregado nas
rgido capaz de interagir com o stio receptor,
estratgias de docagem o FRED, que utiliza-
como por exemplo, um anel aromtico. Esses
se de multiconfrmeros provenientes de uma
fragmentos so dispostos em vrias posies
biblioteca, alm de um arquivo com
favorveis do stio ativo. Em sequncia,
i fo aes do e epto i put . Co o
solues de docagem so criadas, baseadas
resultado final, cria um arquivo final
nas posies iniciais destes fragmentos,
contendo as molculas com maior
seguido pelo processo de construo
probabilidade de se ligarem ao receptor
incremental, onde o espao conformacional
output . Pa a isso, e a i a

exaustivamente as possveis conformaes de docagem protena-ligante. Isto ocorre

do ligante dentro do stio ativo, filtrando por porque a demanda computacional
meio de complementaridades de forma e dos altssima, e apesar de garantir a flexibilidade
grupos farmacofricos antes da classificao. total do sistema o grande fator limitante o
Esta busca exaustiva baseia-se em rotaes e tempo gasto para execuo das simulaes.80
translaes rgidas de cada confrmero, De forma geral, o elevado nmero de
evitando os problemas comuns associados s molculas de uma base de dados exige que
rotaes flexveis.70,71 Como resultado final, os clculos de triagem virtual sejam rpidos e
FRED retorna uma nica molcula "docada" suficientemente precisos para processar o
para cada uma das molculas iniciais, grande nmero de estruturas envolvidas em
adotando em seu algoritmo os conceitos um tempo razovel. Entretanto, ao aumentar
sistemtico e no-estocstico,70,72 isto , a velocidade na qual um algoritmo opera,
realiza a construo incremental no stio invariavelmente necessrio diminuir a
receptor, porm adota como padro o uso de preciso do clculo.25,52,81 Como resultado,
estruturas com conformaes inalteradas essa uma rea de intensa pesquisa,
(fixas). alimentada pela atual necessidade de
desenvolvimento de algoritmos mais
J o programa Surflex-Dock, um dos
completos e otimizados.
mdulos do pacote computacional SYBYL, da
empresa Tripos,73 adota uma estratgia de
docagem que combina uma funo de escore
3.2. Funes de escore
emprica (semelhante a do Hammerhead)74
com mtodos de similaridade As funes de escore so utilizadas com o
morfolgica,75,76 gerando conformaes intuito de estimar a afinidade de uma dada
aleatrias de fragmentos do ligante. Alm posio (orientao) do ligante no stio
disso, tambm implementa uma nova forma, receptor.82 As posies do ligante em relao
mais rpida e precisa de reunir estes ao stio receptor so obtidas em etapas
fragmentos.76,77 O mtodo como estes anteriores, atravs dos algoritmos de busca,
fragmentos so agrupados remete como explicitado acima. Embora os mtodos
abordagem utilizada nos algoritmos de docagem sejam teis no desenvolvimento
78
genticos, entretanto, sua essncia de prottipos na busca por novos frmacos,
determinstica, pois o algoritmo ir seguir um um dos grandes problemas ainda a serem
padro j estabelecido, sem a tomada de resolvidos, ou melhorados, a predio das
decises que ocorreria caso utilizasse a energias de ligao.38
estratgia dos algoritmos genticos.76. Nos clculos de docagem, as funes de
Nos algoritmos de simulao, a estratgia escore desempenham duas tarefas principais
mais empregada a dinmica molecular. durante as etapas de triagem virtual.
Para uma anlise mais apurada, que obtenha Primeiramente, so usadas para diferenciar e
detalhes em nvel atmico das interaes avaliar as diversas conformaes e
protena-ligante, foram desenvolvidos orientaes que um mesmo ligante pode
mecanismos de dinmica molecular que adotar no stio receptor. Em seguida, aps a
permitem uma melhor explorao da energia realizao de simulaes com diversos
livre do sistema, como o aumento da ligantes contidos em bases de dados, a
temperatura da simulao. Inclusive, a funo de escore aplicada para estimar a
princpio, todos os graus de liberdade do afinidade de ligao dos diversos complexos
receptor tambm podem ser explorados.19 ligante-receptor estudados e, dessa forma,
Um exemplo de aplicao dessa estratgia classific-los de acordo com sua
43,83
o programa DynaDock.79 afinidade, facilitando assim a
diferenciao entre ligantes promissores e
Poucos so os mtodos que utilizam
molculas no-ligantes.
simulaes de dinmica molecular no estudo

As principais funes de escore tamanho da base de compostos a ser

implementadas nos mais diversos programas analisada ou a potncia dos computadores
disponveis podem ser classificadas, disponveis pode-se optar por uma ou outra
genericamente, em empricas, em baseadas metodologia, sendo que a funo de escore
em campos de fora de mecnica molecular e completa mais robusta, porm demanda
e aseadas e o he i e to k o ledge- mais tempo.
ased . As fu es e p i as so ali adas
em relao a um conjunto de dados de
afinidade de complexos ligante-receptor 3.3. Conformao do alvo molecular
obtidos experimentalmente. Nas funes
baseadas em mecnica molecular, a
afinidade de ligao estimada de acordo A conformao do alvo molecular proteico
com o somatrio das energias de interao um fator importante na obteno de
de van der Waals e eletrosttica entre os resultados confiveis em clculos de
tomos do ligante e do stio receptor. As docagem, pois a maior parte dos mtodos
fu es de es o e do tipo k o ledge- trabalha com amostras conformacionais
ased so de i adas de a lises de estticas do alvo molecular. O nvel de
preferncias estatsticas das distncias de exatido afetado sobremaneira pela
interao entre os diferentes tomos qualidade das estruturas proteicas.
baseadas no conhecimento de complexos Considerando as conformaes holo
ligante-protena com estrutura resolvida.38,84 (conformao do receptor complexado ao
Geralmente, contatos atmicos que ocorrem ligante), apo (conformao do receptor livre
com frequncia maior do que a mdia so do ligante) e outras obtidas por modelagem
energeticamente favorveis. As funes molecular para um mesmo receptor proteico,
k o ledge- ased so so as de ias normalmente, os melhores resultados so
contribuies desses contatos para as obtidos com a conformao holo, seguidos
combinaes de tomos da protena e do pela apo e, posteriormente, estruturas
ligante.83 modeladas. Isso se deve ao fato de a
conformao holo ser influenciada pela
Os mtodos de docagem utilizam as presena de um ligante atravs de um ajuste
funes de escore, basicamente, de duas induzido, diferentemente de uma
maneiras. A primeira abordagem lana mo conformao proteica sem a presena de
da funo de escore completa para ordenar qualquer ligante (apo) que possa interferir
uma conformao do ligante em relao ao em sua conformao. Apesar dessa regra
receptor. Ento, o sistema modificado pelo geral, algumas excees podem ocorrer. Em
algoritmo de busca, e a nova conformao alguns casos, a conformao holo s permite
obtida classificada pela mesma funo de bons resultados de simulao com molculas
escore. O mtodo alternativo utiliza a funo da base de dados estruturalmente
de escore em dois estgios. Nessa semelhantes ao ligante presente na estrutura
abordagem, uma funo reduzida aplicada resolvida do complexo ligante-receptor,
ao sistema com o objetivo de direcionar o perdendo qualidade em simulaes com
algoritmo de busca para regies do stio molculas com caractersticas estruturais
receptor em que o escore de interao distintas e um padro diferente de
mais alto e, ento, uma funo de escore ligao.10,23,85
mais refinada ranqueia as conformaes
obtidas nas diferentes posies. A funo de A conformao apo pode ser inadequada
escore reduzida, normalmente, considera para a acomodao do ligante, pois stios
apenas poucos tipos de interao, como por ativos que apresentam mudanas
exemplo, ligaes de hidrognio, omitindo conformacionais podem ter resduos em
outros termos importantes que sero posies que no traduziriam um estado
avaliados pela funo de escore refinada.42 adequado para interagir corretamente com o
Portanto, dependendo das condies como o ligante estudado e, dessa forma, dificultar a

obteno de resultados confiveis em ao seu stio receptor.88 Normalmente, apenas

procedimentos de docagem. As estruturas algumas cadeias laterais dos resduos do stio
modeladas, por sua vez, dependendo de sua ligante, selecionadas pelo usurio dos
qualidade podem apresentar resduos ou programas de acordo com o seu
suas cadeias laterais em locais imprprios, conhecimento do sistema estudado, so
fato que tambm dificulta a exatido do flexveis durante a simulao. No entanto,
procedimento.10 estas abordagens ainda so incipientes e
desconsideram maiores rearranjos
devido a estes fatores que a preparao
conformacionais na protena, como
do receptor proteico antes da realizao das
movimentos no esqueleto peptdico, por
simulaes de docagem to importante.
exemplo.89
Uma das alternativas considerar a
flexibilidade da estrutura do receptor e Uma das alternativas consiste em mesclar
permitir mudanas conformacionais durante vrias conformaes da estrutura do alvo
a simulao, pois os alvos-moleculares em molecular em uma nica conformao mdia,
sistemas biolgicos esto em contnuo para considerar conformaes de resduos
movimento.86 Apesar das estruturas que poderiam se mostrar essenciais na
resolvidas por difrao de raios-X serem formao do complexo ligante-receptor. Uma
comumente empregadas no planejamento de estrutura mdia final pode ser gerada atravs
substncia bioativas, vale ressaltar que a da mdia das coordenadas atmicas das
maioria das informaes estruturais acerca vrias conformaes envolvidas, fato que
de protenas depositadas no PDB limitada pode levar obteno de conformaes
conformao mais estvel quando artificiais, que podem ser muito distintas das
cristalizada em condies artificiais. Em conformaes biolgicas, sobretudo em
condies fisiolgicas um inibidor interage relao regio que compe o stio de
com conformaes variadas da protena e ligao do alvo molecular.90 Um protocolo
com maior afinidade quando comparado com mais robusto consistiria em simular o encaixe
a conformao sugerida por cristalografia de do ligante em seu respectivo stio de ligao
raios-X, por exemplo.87 atravs de docagem automatizada utilizando
mltiplas conformaes do receptor, e no
A no considerao de flexibilidade em
somente uma mdia, processo tambm
um clculo de docagem pode acarretar em
o he ido o o e se le do ki g , o ual
pouca exatido nas predies de modos de
requer um gasto computacional maior
ligao, reduo na eficincia de seleo de
quando comparado triagem com apenas
molculas ativas durante a triagem virtual e
uma conformao. As mltiplas
baixa correlao entre escore e afinidade de
conformaes mimetizam o equilbrio
ligao. Quando a flexibilidade do receptor
conformacional que caracteriza o estado
incorporada s simulaes, os riscos
natural de um alvo molecular proteico,
associados obteno de conformaes
fornecendo, assim, um modelo que considera
inadequadas da protena para o sistema
um maior grau de liberdade estrutural. Em
estudado so minimizados.10 Alguns dos
relao ao procedimento de mltiplas
programas mais recentes de docagem
o fo aes e se le do ki g , o
permitem a flexibilidade da estrutura do
conjunto de conformaes da protena
receptor, pelo menos parcial, ficando restrita
empregado no clculo pode advir de
s cadeias laterais do stio ligante atravs da
conformaes obtidas experimentalmente,
aplicao de uma biblioteca de rotmeros.
como por exemplo, de um conjunto de
Embora a flexibilizao das cadeias complexos do mesmo alvo molecular com
laterais nos clculos de docagem requeira ligantes distintos depositados no PDB, ou
maior gasto computacional, ela permite mesmo atravs de modelos gerados por
movimentos localizados da protena mtodos computacionais.89,91
resultando em um melhor encaixe do ligante

4. Triagem Virtual Baseada em similaridade ao quimiotipo da(s) molcula(s)

de referncia. Posteriormente, buscando
Ligantes aumentar a diversidade estrutural dos
o postos p ottipos hits fo e idos,
foram desenvolvidos diferentes mtodos
A triagem virtual baseada em ligantes baseados em descritores 3D mais
uma estratgia que utiliza compostos com elaborados.97
atividade biolgica j conhecida como fonte
de informao inicial, sem levar em conta a Dentre os mtodos baseados na
estrutura de um alvo molecular. Esta geometria 3D, alguns so dependentes do
abordagem visa a identificao de molculas alinhamento de conformaes moleculares.
com certa semelhana estrutural e que Talvez o mtodo mais amplamente
possam compartilhar tambm atividade empregado exigindo representaes 3D,
biolgica.92 O raciocnio central se baseia no aquele que explora o conceito de
princpio de que as molculas que similaridade aos grupos da molcula
compartilham algumas semelhanas essenciais atividade ( farmacforo ).93,98,99
estruturais entre si podem apresentar O sucesso das tcnicas de triagem virtual
tambm atividade biolgica semelhante. Em baseada em ligantes depende, portanto,
geral, os mtodos utilizam um conjunto de fortemente da natureza das relaes
ligantes ativos j conhecidos como referncia estrutura-atividade. Estas fornecem um
para extrair compostos estruturalmente conjunto de restries e parmetros que
semelhantes a partir das bibliotecas virtuais podem ser de grande valia na busca de novas
de compostos. A triagem virtual baseada em estruturas qumicas com, ao menos, nveis de
ligantes uma estratgia muito til, atividades biolgicas similares aos das
principalmente, quando nenhuma ou pouca molculas bioativas j conhecidas.100 Estes
informao advinda da estrutura 3D do alvo mtodos fornecem enriquecimentos
molecular estudado conhecida.93 Nessa significativos sobre a seleo aleatria de
abordagem, a busca de novos ligantes fica molculas em bases de dados. Assim, as
restrita explorao do espao qumico molculas de maior pontuao podem ser
oferecida pelos compostos ativos conhecidos. priorizadas em testes experimentais,
Atravs da sobreposio dos compostos reduzindo a relao custo/benefcio nos
ativos, por exemplo, possvel criar um programas de desenvolvimento de
esboo das principais caractersticas farmcos.98
compartilhadas entre as molculas no espao
tridimensional, como possveis grupos O crescimento cada vez maior das bases
capazes de realizar ligaes de hidrognio, de dados de pequenas molculas bioativas, o
bem como grupos hidrofbicos, com carga desenvolvimento de novos algoritmos,
positiva ou negativa.94-96 melhorias em componentes de
o putado es ha d a es , p og a as
Inicialmente, a triagem virtual baseada em soft a es e todos de t iage t sido
ligantes foi desenvolvida a partir de cada vez mais aplicados no cotidiano da
descritores 2D ou caractersticas moleculares identificao de compostos ativos,
espe fi as fi ge p i ts de i adas da permitindo o contnuo aprimoramento desta
estrutura de compostos ativos de referncia estratgia e ampliando o campo da triagem
e comparados com os correspondentes virtual na interface qumico-
descritores das molculas das bases de farmacutica.91,101
dados, lanando mo de uma medida de
similaridade, como por exemplo o famoso
coeficiente de Tanimoto. Este mtodo ,
geralmente, muito rpido e fornece como
resultado uma lista de compostos
classificados de acordo com a sua

4.1. Triagem virtual por padro grupo ster, todos passveis de realizarem
farmacofrico interaes por ligao de hidrognio.102 Esses
elementos se tornam mais representativos
quando as principais interaes de um grupo
Uma abordagem pertencente ao grupo de de ligantes com o seu alvo molecular so
tcnicas de triagem virtual baseada em bem estabelecidas. Dessa forma, a busca
ligantes a busca atravs da determinao pode ser direcionada para potenciais ligantes
do padro farmacofrico. A modelagem do que apresentem similaridades farmacofricas
farmacforo uma abordagem amplamente relevantes a um conjunto de compostos
empregada para um conjunto de ligantes bioativos, e no apenas para similaridades
ativos conhecidos, cujos grupos funcionais comuns, ao acaso, de grupamentos
responsveis por interaes especficas funcionais que mesmo sendo comuns ao
frmaco-receptor so analisados atravs de grupo de ligantes no so importantes na
alinhamentos no espao tridimensional.102,103 interao com o receptor biolgico. Ainda
O conceito de farmacforo foi primeiramente assim, essa abordagem apresenta limitaes,
introduzido por Paul Ehrlich, em 1909, como j que nem sempre se dispe de estruturas
"uma estrutura molecular (phros) que cristalogrficas dos compostos ativos
carrega as caractersticas essenciais, conhecidos complexados com seu alvo
responsveis pela ao biolgica de um biolgico, e mesmo quando h, a
frmaco (pharmacon's)". O farmacforo conformao cristalogrfica do ligante
inclui todas as principais caractersticas geralmente varia em relao a sua real
envolvidas na interao do ligante com o stio conformao bioativa, j que aquela no
receptor. Atravs desse conhecimento alguns obtida sob condies fisiolgicas.87,89
grupos qumicos podem ser incorporados a
Outra limitao encontrada quando se
determinados ligantes a fim de elevar a
trabalha com modelos farmacofricos est
especificidade, visando otimizar sua atividade
associada incerteza em relao a
biolgica.104 Na prtica, o farmacforo
configurao espacial dos grupos
engloba caractersticas qumicas especficas,
farmacofricos. Configuraes especficas
tais como potencialidade para realizao de
demais levam a seleo de compostos com
ligaes de hidrognio, interaes
diversidade estrutural muito pobre, e por
eletrostticas e hidrofbicas, entre outras.105
outro lado, configuraes mais gerais levam
Dessa forma, um modelo farmacofrico
a um modelo farmacofrico que gera um
sugerido para uma classe de ligantes pode
grande nmero de resultados falso-
ser utilizado como molde na busca e seleo
positivos.89
de novos prottipos que satisfaam os
principais requisitos moleculares Um modelo farmacofrico 3D no
responsveis pela atividade biolgica em transfervel para outro modelo 3D obtido
determinado alvo molecular. para um conjunto diferente de ligantes, ou
seja, um mesmo alvo biolgico pode possuir
Os elementos farmacofricos chaves em
diferentes molculas bioativas que
uma busca podem ser: um grupo especfico
apresentam diferentes conformaes e
de tomos, uma regio molecular volumosa,
orientaes em seu stio ativo. Assim, o
grupamentos doadores e aceptores de
padro farmacofrico ir depender do grupo
ligao de hidrognio, grupamentos com
de molculas selecionadas para sua
cargas, hidrofbicos e/ou anis aromticos,
derivao.106 Para criar um modelo
associados a restries geomtricas incluindo
farmacofrico terico, geralmente, o espao
distncias e ngulos de ligao. Assim, um
conformacional de cada ligante explorado e
grupo farmacofrico aceptor de ligao de
enumerado em vrios confrmeros. Uma vez
hidrognio, por exemplo, permite a busca de
gerado, cada confrmero ser tratado como
diversos padres estruturais, como molculas
um corpo rgido durante o mapeamento do
contendo grupo hidroxila, carbonila ou um

farmacforo. Nem sempre necessrio que redutase, por exemplo, utilizados na terapia
as coordenadas de uma caracterstica da hiperlipoproteinemia, apresentam um
molecular para uma molcula no espao 3D farmacforo definido, o qual pode ser
se encaixe perfeitamente com o farmacforo analisado aps a sobreposio dos modos de
correspondente comum a todo o conjunto de complexao dos ligantes presentes nos
ligantes estudado, pois, normalmente, existe complexos com a enzima depositados no
uma margem de tolerncia definida pelo PDB, ou mesmo das conformaes de baixa
usurio, a qual forma uma zona de alcance energia geradas por um programa capaz de
em torno de cada caracterstica do derivar um padro farmacofrico. Assim, os
farmacforo. Esta zona de alcance inibidores da HMG-CoA redutase apresentam
influenciada pela incerteza provocada pela em comum um ncleo central e outro
flexibilidade e adaptabilidade do sistema perifrico, compostos por anis aromticos,
protena-ligante. Um raio da zona de alcance alm de uma cadeia aliftica hidroxicida
maior indica uma maior incerteza associada com quatro grupamentos aceptores e/ou
ao grupo funcional correspondente.104 doadores de ligao de hidrognio e um
grupo ionizvel aninico. O anel central
Chen e colaboradores107 compararam
aromtico tambm apresenta substituintes
mtodos de triagem virtual baseados em
de natureza hidrofbica (Figura 4A). A anlise
docagem e farmacforo atravs da anlise de
visual dos complexos inibidores-HMG-CoA
16 conjuntos de buscas (8 alvos moleculares,
redutase108 revela que todos estes
cada um testado com duas bases de dados).
grupamentos desempenham algum papel na
A estratgia baseada em farmacforo
interao com o stio ligante da enzima
mostrou um maior fator de enriquecimento
(Figura 4B), embora outros grupamentos no
quando comparada estratgia de docagem,
compartilhados entre a srie de inibidores
inclusive com nveis superiores de
tambm sejam importantes para cada
recuperao de molculas bioativas.
inibidor, o que confere a diferena de
Os inibidores da enzima HMG-CoA potncia observada entre os mesmos.
Figura 4. (A) Modelo farmacofrico gerado para inibidores da HMG-CoA redutase com o
programa Pharmagist,99 entre eles a rosuvastatina, cerivastatina, fluvastatina e atorvastatina.
(B) Interaes dos grupamentos farmacofricos presentes na estrutura da rosuvastatina com
os resduos da HMG-CoA redutase. Figura gerada com o programa PyMOL44

O conjunto de caractersticas qumicas obtida e utilizada para relacionar cada

definido acima (Figura 4) e compartilhado composto filtrado com uma ao especfica
pela srie de inibidores seria o requerimento em determinado alvo molecular. Assim como
mnimo esperado para a obteno de na triagem convencional, este mtodo de
compostos com atividade inibitria relevante triagem reversa tambm apresenta
frente HMG-CoA redutase. Dessa forma, o limitaes relacionadas com as disparidades
padro farmacofrico abstrado para estes entre as conformaes das estruturas dos
inibidores confere informao importante na inibidores complexados existentes, usadas
busca de novos inibidores que mantenham as para gerar o modelo farmacofrico, e a sua
mesmas caractersticas qumicas no espao real conformao bioativa.86,89 As aplicaes
3D, uma vez que tal modelo poderia ser deste mtodo permitem a caracterizao de
utilizado como molde na seleo de novas possveis propriedades farmacolgicas
molculas em uma triagem virtual. Vale inerentes a novos compostos j sintetizados e
ressaltar que a natureza de cada componente tambm a sugesto de um possvel espectro
do grupo farmacofrico mais importante de atividade farmacolgica para frmacos
que o prprio grupo qumico presente na consagrados e compostos bioativos j
srie original de compostos, uma vez que conhecidos. A aplicao dessa estratgia
grupamentos qumicos distintos, entretanto permite tambm a triagem computacional de
com caractersticas qumicas semelhantes, potenciais stios de ao capazes de associar
podem desempenhar a mesma funo na os compostos filtrados a efeitos txicos e
manuteno de interaes com o alvo curso metablico, atravs do alinhamento
molecular. Um exemplo prtico pode ser desses compostos a um modelo
evidenciado pelos grupamentos hidroxila e farmacofrico especfico para ligantes de
carbonila, ambos capazes de atuar como protenas da famlia do citocromo P450, por
aceptores de ligao de hidrognio.25 exemplo, se alinhando a um novo paradigma
estabelecido nas etapas iniciais do processo
Outra abordagem de triagem virtual
de desenvolvimento de frmacos, a
baseada em farmacforo consiste em utilizar
preocupao com propriedades
um banco de dados de farmacforos
farmacocinticas adequadas e nveis
derivados de inibidores de alvos moleculares
tolerveis de toxicidade.19,109,110
de interesse farmacutico, como o
PharmTargetDB, e assim, realizar uma
triagem reversa, ou seja, uma molcula em
4.2. Triagem por similaridade
questo analisada frente a diversos alvos.
PharmTargetDB pertence ao servidor online
gratuito PhamMapper110 e contm mais de Outra estratgia comumente aplicada
7000 modelos farmacofricos, sendo que durante o processo de triagem virtual
cada modelo foi gerado a partir de um nico baseada em ligantes consiste na busca por
inibidor, a partir de sua conformao obtida similaridade. O princpio da propriedade de
de bancos de dados que contm complexos similaridade preconiza que molculas
protena-ligante, como o TargetBank, estruturalmente similares possuem alta
Bi di gDB e D ugBa k. A e p esso e e sa probabilidade de compartilharem tambm
para triagem virtual se aplica quando ao propriedades fsico-qumicas e atividades
invs de buscar molculas para um alvo biolgicas semelhantes.111 Entretanto, a
molecular especfico, como qualquer triagem similaridade e dissimilaridade entre
convencional, o mtodo de triagem reversa estruturas qumicas no so assim
busca possveis alvos moleculares para uma objetivamente definidas. Existem vrias
molcula de interesse. Nesse caso, uma lista relaes entre a estrutura e a atividade que
de compatibilidades entre as estruturas que demonstram que compostos similares podem
melhor se encaixam em cada modelo ter atividades biolgicas diferentes 112.
farmacofrico da base de dados pode ser
Kubinyi, H. (2002)112, em seu trabalho testes biolgicos. Assim, se o princpio de

sobre a similaridade qumica e atividades similaridade aplicvel, um conjunto de
biolgicas afirma que simples mudanas molculas que ainda no foi testado para
bioisostricas de tomos e grupos em alguns atividade biolgica, mas que possui
compostos biologicamente ativos podem similaridade estrutural a uma ou mais
resultar em efeitos inesperados, alguns molculas de referncia, apresenta, portanto,
desses efeitos incluem at novos modos de alta probabilidade de fornecer substncias
ao. O que deve ser levado em considerao tambm bioativas.113
sobre a similaridade e a diversidade de
Do ponto de vista prtico, para efetuar a
molculas a sua dependncia em relao
comparao entre duas molculas
estrutura alvo tridimensional, assim como as
necessrio empregar um padro de medida,
propriedades do stio de ligao do alvo
tambm conhecido como coeficiente de
biolgico, ou seja, sua complexao ao
similaridade, o qual quantificar o grau de
receptor biolgico.
semelhana entre as entidades qumicas
As busca por similaridade consiste em avaliadas. Existem inmeros coeficientes de
uma das estratgias de triagem mais simples medida (Tabela 2), sendo que o mais
e com menor gasto computacional. Na empregado em triagens virtuais o
aplicao desta estratgia, como em coeficiente de Tanimoto. Nos coeficientes de
qualquer busca baseada em ligantes, o ponto si ila idade, o te o a ep ese ta o
de partida corresponde seleo de uma ou nmero de caractersticas presentes em uma
mais molculas com atividade biolgica molcula A e ausente em uma molcula B, o
conhecida (denominadas estruturas-alvo ou te o ep ese ta o e o de
de referncia). Atravs da triagem em bases caractersticas presentes em B, mas ausentes
de dados de molculas virtuais possvel e A, o te o ep ese ta o e o de
filtrar molculas que so estruturalmente caractersticas comuns s molculas A e B.
mais similares s de referncia. A lista de Outro termo aparece nas frmulas de
molculas resultante da triagem indica as edidas de si ila idade ue o te o d ,
molculas mais provveis de exibir este termo representa o nmero de
propriedades similares s da(s) estrutura(s) caractersticas que est ausente em ambas as
de referncia, tornando-as candidatas para molculas.114
Tabela 2. Expresso de alguns coeficientes de similaridade
Coeficiente Expresso
1. Coeficiente de combinao simples

2. Tanimoto, Jaccard
3. Dice, Sorensen, Czekanowski, Hodgkin-Richards
4. Cosine, Ochiai, Carbo
5. Russell/Rao
6. Rogers/Tanimoto
7. Baroni-Urbani/Buser
8. Kulczynski-2

Para as medidas de similaridade, particular atravs de suas caractersticas

considerando-se duas molculas A e B, para especiais, da mesma maneira como uma
ada u a delas u a se u ia de its impresso digital identifica um indivduo.111
o st uda. Cada it i di a a p ese a ou Assim, atravs de representaes de
ausncia de uma caracterstica estrutural conjuntos binrios its , duas ol ulas
espe fi a fi ge p i t da ol ula. A podem ser comparadas de acordo com seu
caracterstica estrutural especfica de uma grau de similaridade (Figura 5).
estrutura qumica identifica uma molcula
Figura 5. Na representao binria, o n 1 representa uma caracterstica presente, e o n 0

u a a a te sti a ause te, seja as est utu as A ou B. O e o de its e A i di a as
a a te sti as p ese tes e A e o e o de its e B as a a te sti as p ese tes e B. Os
its e C i di a as a a te sticas comuns s estruturas A e B
O coeficiente de Tanimoto, por exemplo, do valor de 1, mais similar a molcula

fornece valores de comparao na faixa de 0 avaliada (Figura 6). Normalmente, os valores
(zero) a 1. O valor de 0 (zero) significa que de similaridade acima de 0,7 so mais
no h similaridade entre as molculas representativos, como por exemplo, entre a
comparadas, j o valor de 1 denota 100% de molcula referncia A e os compostos C e D
similaridade, ou seja, como as caractersticas (Figura 6), os quais so derivados da molcula
moleculares mapeadas representam uma referncia e apresentam, basicamente,
marca nica, o valor mximo de 1 garante a diferenas entre heterotomos e
comparao de uma molcula a ela mesma substituintes. ndices pouco abaixo de 0,7,
ou a seu enantimero (Figura 6). Atravs do normalmente, selecionam molculas que
coeficiente de Tanimoto, calcula-se a razo podem apresentar no somente diferenas
do nmero de caractersticas comuns entre em relao aos substituintes, mas tambm
as molculas, pelo nmero total de em relao s mudanas no ncleo de
caractersticas presentes em ambas, heterociclos em relao molcula
subtrado pelo nmero de caractersticas referncia A, como por exemplo, o composto
comuns (Tabela 2). Um aspecto importante E (Figura 6). J ndices muito baixos,
dessa medida a sua nfase sobre a normalmente, indicam molculas muito
presena de caractersticas comuns.115 distintas da molcula referncia e com
poucas caractersticas em comum, como por
O resultado de uma busca por
exemplo, o composto F (Figura 6).
similaridade basicamente uma lista de
molculas ranqueadas de acordo com o Dada a importncia atual das tcnicas de
coeficiente de medida empregado, seguindo triagem por similaridade no planejamento de
uma ordem de similaridade em relao (s) frmacos, h muito interesse no uso e
molcula(s) de referncia. Para o coeficiente desenvolvimento de medidas de similaridade
de Tanimoto, quanto mais prximo seu ndice baseadas em caractersticas bidimensionais

est utu ais i as fi ge p i ts 2D , as similaridade intermolecular, entre eles est a

quais focam na presena ou ausncias de representao por propriedades fsico-
fragmentos moleculares nas molculas qumicas, grficos qumicos, ndices
avaliadas. Entretanto, vale ressaltar que topolgicos, padro farmacofrico 3D, dentre
existem outros tipos de representao outros.113
estrutural sugeridos para o clculo de
Figura 6. Comparao da similaridade molecular entre a molcula-alvo e outras estruturas

atravs do ndice de Tanimoto (ST)
Embora a triagem por similaridade fragmentos que crescem radialmente a partir

baseada nestas caractersticas nicas de cada tomo, pares de tomos
fi ge p i t 2D seja apli ada com sucesso diferenciados por tipo e a distncia que os
na busca por compostos bioativos em separa, trio de tomos diferenciados por tipo
grandes bases de dados, nem sempre e as trs distncias que os separam ou quatro
possvel selecionar um mtodo adequado. tomos ligados consecutivamente
Duan e colaboradores116, aplicaram 8 diferenciados pelo tipo. Com estes estudos,
mtodos distintos destas caractersticas foi possvel compreender que a maioria das
nicas bidimensionais em 5 alvos caractersticas bidimensionais estruturais
moleculares diferentes empregando um nicas, possui taxas similares de recuperao
conjunto de dados devidamente validado de molculas bioativas em bases de dados.
cujo desempenho frente a diversas classes de
Esta questo levou considerao do uso
molculas foi avaliado. Cada uma destas
de mtodos de fuso de dados para combinar
caractersticas dotada de propriedades
os resultados das pesquisas nos bancos de
mpares, que distinguem o seu desempenho.
dados que utilizam diferentes coeficientes de
Algumas destas, dizem respeito presena
similaridade.117 Este mtodo de fuso de
de fragmentos lineares e fechamento do
dados est sendo cada vez mais utilizado
anel, fragmentos lineares e ramificados,
para melhorar o desempenho de sistemas colaboradores123 fizeram uma comparao de

para triagem virtual em pesquisas mtodos de triagem virtual baseado no
farmacuticas. Existem trs tipos de fuso de ligante e suas aplicaes para o receptor do
dados, sendo que o primeiro utiliza a mesma fator 1 de liberao da corticotrofina (do
molcula de referncia e mesma ingls Corticotrofin Releasing Factor 1
representao molecular fi ge p i t Receptor, CRF1)120. Empregando em seus
usando diferentes coeficientes de estudos, programas que adotam o uso de
similaridade. O segundo utiliza a mesma fingerprints 3D como o programa ROCS (do
molcula de referncia e o mesmo ingls, Rapid Overlay of Chemical Structures)
coeficiente de similaridade, mas diferentes que usa o coeficiente de Tanimoto para
representaes moleculares. O terceiro tipo calcular similaridade por forma,124 e outro
de fuso, e p ega os es os fi ge p i ts grupo, com o programa OpenEye Combo-
e mesmo coeficiente de similaridade, porm Score e o programa EON que usam o
variadas molculas de referncia. Este ltimo coeficiente de Tanimoto para clculo de
chamado de fuso de grupos. A fuso de similaridade eletrosttica.125, obtiveram um
grupos a combinao de uma lista de bom desempenho em identificar os ligantes
similaridade feita a partir de vrios ativos, e os mtodos 3D se destacaram por
compostos de referncia pertencendo ter obtido um melhor desempenho frente
mesma classe de atividades. aos mtodos 2D.
No geral, diferentes medidas de A similaridade molecular um dos temas
similaridade produzem ranqueamentos mais discutidos em qumica medicinal, pois
diferentes, portanto, os melhores resultados existem muitas medidas de similaridade que
so obtidos utilizando os mtodos de fuso esto disponveis para auxiliar o pesquisador
de dados para combinar os ranqueamentos na descoberta de novos frmacos atravs da
resultantes de diferentes coeficientes.118 As aplicao de tcnicas de triagem virtual,
triagens por similaridade atravs da assim como na criao de um novo conjunto
combinao de vrias molculas de de dados de compostos e pela
referncia, normalmente, apresentam disponibilidade de diversos coeficientes de
resultados superiores busca convencional, a medida de similaridade descritos na
qual utiliza apenas uma nica estrutura literatura.
bioativa como referncia.119-121
A qualidade da base de dados ou dos
A seleo de molculas baseada na compostos selecionados est diretamente
similaridade por forma molecular e tambm ligada e dependente da representao
na similaridade por distribuio eletrosttica molecular e da medida de similaridade que
desempenha um importante papel no ser selecionada para o estudo. Existe uma
reconhecimento molecular do stio receptor variedade de maneiras de se medir a
e contribui de maneira considervel para a semelhana entre as molculas e diferentes
seleo de ligantes com afinidade pelo alvo tipos de coeficientes de similaridade. Nos
molecular.121 Muitas representaes ltimos anos houve um rpido
moleculares e medidas de similaridade esto desenvolvimento de muitas abordagens
disponveis para auxiliar no desenvolvimento computacionais no desenvolvimento de
de frmacos e a qualidade da srie de medidas de similaridade.
compostos resultantes altamente
Entretanto, no h um consenso sobre
dependente da forma tridimensional e da
qual mtodo seja o melhor, pois ainda se faz
distribuio eletrosttica da molcula
necessrio a validao de tais procedimentos
(eletroforma)122.
e o uso de sistemas de filtragem para
Em um estudo para a seleo de remover as molculas com caractersticas
molculas baseado na similaridade de forma indesejveis. Sendo assim, uma abordagem
e na similaridade eletrosttica, Tresadern e racional na escolha dos coeficientes a serem

utilizados para um estudo de similaridade ou Um descritor molecular uma

de triagem virtual baseada em similaridade representao matemtica de uma molcula,
deve basear-se em tcnicas de fuso de resultante de um procedimento lgico no
dados, onde h uma combinao dos qual a informao estrutural codificada e
resultados das pesquisas nos bancos de convertida em uma representao simblica.
dados que utilizam diferentes coeficientes de O contedo da informao de um descritor
similaridade, alm de ser levado em molecular depende da representao
considerao um estudo sobre a cavidade de molecular do composto (Tabela 3) e do
ligao do alvo biolgico na qual o ligante algoritmo que empregado para o clculo do
ter que se ajustar, pois existe uma relao descritor.114 Estratgias que empregam
de dependncia entre a similaridade e a descritores constituem as novas tendncias
macromolcula biolgica onde os compostos no processo de triagem virtual de substncias
anlogos se ligaro. bioativas, incluindo as tcnicas que envolvem
a aprendizagem de mquina (Machine
Learning).126-128
4.3. Descritores e novas tendncias
Tabela 3. Classificao dos descritores de acordo com a representao molecular114

Representao Molecular Descritores
Peso molecular, nmero de tomos,
0D nmero de ligaes, soma de propriedades
atmicas.
1D Nmero de fragmentos.
2D ndice de Zagreb, ndice de Wiener,

descritores BCUT, vetor de autocorrelao
Descritores topolgicos 2D.
3D Descritor 3D-MoRSE, descritores WHIM,

descritores GETAWAY, vetores de
Descritores geomtricos autocorrelao 3D.
3D Potencial eletrosttico, potencial de

hidrofobicidade, potencial de ligao de
Propriedades da superfcie hidrognio.
3D Anlise comparativa dos campos
Propriedades da grade moleculares (CoMFA).
Coordenadas 3D e amostragem de
4D conformaes, valores da energia de
interao, descritores GRIND.
A rea de atuao de descritores entre estrutura e atividade biolgica, do

moleculares em grande parte i gl s ua titati e st u utu e-activity
interdisciplinar. Para o uso destas tcnicas elatio ship , e de QPR elao
necessrio o conhecimento de abordagens quantitativa entre estrutura e propriedade,
estatsticas, de quimiometria (uma rea que ta do i gl s ua titati e st u tu e-
se refere a problemas de quantificao p ope t elatio ship . Os todos
envolvidos com regresso multivariada) e dos estatsticos, como por exemplo, a anlise de
princpios de QSAR (relao quantitativa regresso multilinear e redes neurais
artificiais, so mtodos utilizados na refletem apenas a composio em carter

construo de modelos. Esses modelos bidimensional da molcula (Tabela 3).129
relacionam os descritores com a propriedade
Se os descritores moleculares so
ou a atividade biolgica dos compostos de
derivados de representaes moleculares 3D,
interesse e podem ser aplicados em triagem
esses perfis podem ser obtidos
virtual indicando a potencial atividade das
experimentalmente ou, quando no
estruturas de uma base de dados. Para isso,
disponveis, calculados por mtodos
desejvel que o conjunto de estruturas a
computacionais. Assim, cresce a importncia
partir do qual o modelo QSAR e/ou QSPR
do conhecimento das conformaes bioativas
obtido (conjunto de treinamento) apresente
das molculas do conjunto de treinamento.
uma diversidade estrutural representativa.12
As geometrias calculadas por mtodos
Um dos principais desafios desenvolver computacionais para as molculas das
compostos com as propriedades qumicas, bibliotecas virtuais so submetidas a uma
fsicas e biolgicas desejadas. Uma grande anlise conformacional a fim de restringir o
variedade dessas propriedades totalmente estudo s conformaes mais viveis, ou seja,
dependente da estrutura tridimensional da de baixa energia. Assim, os descritores
molcula, portanto os estudos de calculados devem refletir parmetros
QSAR/QSPR esto ganhando cada vez mais inerentes conformao das molculas
destaque. Abordagens que envolvem a relacionados estrutura tridimensional.114
modelagem e a predio da atividade
A anlise comparativa dos campos
biolgica, assim como a triagem virtual e
ole ula es CoMFA, do i gl s Co pa ati e
e pe i e tos de do age ou do ki g
Mole ula Field A al sis , u dos todos
(predio da interao receptor/ligante e
de clculo de QSAR-3D, desenvolvido por
complexos em sistemas biolgicos)
Cramer e colaboradores,130 descreve a
necessitam da informao da estrutura
relao entre as caractersticas moleculares
tridimensional das molculas. Entretanto, as
estricas e eletrostticas 3D de uma srie de
propriedades qumicas, fsicas e biolgicas de
ligantes com afinidades de ligao
um composto orgnico, normalmente, no
conhecidas, com o mesmo mecanismo de
podem ser preditas simplesmente de
ao, na mesma cavidade de ligao de um
maneira direta atravs do conhecimento de
receptor. Esta anlise realizada por meio de
sua estrutura molecular, sendo necessrio o
um algoritmo de sobreposio flexvel, que
estabelecimento de abordagens indiretas de
realiza a sobreposio de ligantes com o
QSAR e QSPR. Tais estratgias so indutivas,
objetivo de predizer afinidades de ligao
no sentido de que um modelo gerado
para novos compostos que sejam similares ao
atravs do conhecimento das propriedades
grupo de molculas de referncia.
ou atividades biolgicas de uma srie de
compostos qumicos. Em geral, os estudos de Em uma grade retangula g id as
QSPR/QSAR comeam a partir de um medidas de energias de ligao so efetuadas
conjunto de molculas bioativas e os com tomos de prova colocados
descritores calculados devem, no mnimo, consecutivamente em cada ponto da grade.
extrair informaes sobre a topologia Assim, as afinidades de ligao experimentais
molecular de cada composto.114 so correlacionadas com a contribuio dos
campos moleculares medidos na grade
A grande variedade de descritores
usando um algoritmo de aprendizagem
topolgicos (2D) existentes so aplicados
estatstica (anlise dos mnimos quadrados
frequentemente em modelagem fsica,
parciais - PL, do i gl s Pa tial Least
qumica ou de propriedades biolgicas de
ua es , p oduzi do u a e uao de
compostos orgnicos. Estes descritores no
regresso.131
dependem de orientao ou conformao,
mas sim de caractersticas moleculares que Uma abordagem alternativa ao CoMFA

so os mtodos de anlise comparativa de ativa dos compostos foi alinhada de maneira

ndices de similaridade molecular (CoMSIA, a representar um modo de ligao
do i gl s Co pa ati e Mole ula i ila it semelhante. Em anlises de QSAR-3D o
I di es A al sis ue faze o l ulo dos alinhamento das molculas uma etapa
campos de propriedades expressos em muito importante, este alinhamento feito
ndices de similaridade molecular. Os campos pela sobreposio de caractersticas
de diferentes propriedades fsico-qumicas no estruturais comuns usando o confrmero de
CoMSIA usam ndices de similaridade que menor energia de cada estrutura ou a
dependem da distncia e no ocorrem conformao bioativa encontrada na
singularidades nas posies atmicas. No estrutura cristalogrfica resolvida por raios-X
CoMFA, so necessrios valores limiares nos quando esta estiver disponvel 133. Os
campos e os mapas de contribuio dos modelos de CoMSIA foram gerados usando
campos gerados, muitas vezes, no so cinco descritores (estrico, eletrosttico,
ligados de forma contgua, isso faz com que a hidrofbico, doador e aceptor de ligao de
sua interpretao torne-se difcil. Os mapas hidrognio) como variveis independentes e
obtidos nos mtodos de CoMSIA so os valores de pKi como variveis dependentes
superiores e fceis de serem interpretados e realizando diferentes combinaes.
sua principal caracterstica destacar as Subsequentemente foi realizada a anlise de
regies dentro da rea ocupada pelos regresso dos mnimos quadrados parciais
ligantes que necessitam de uma determinada PL, do i gl s Pa tial Least ua e . Assi ,
propriedade fsico-qumica que ser os parmetros estatsticos do CoMSIA
importante para a atividade biolgica, ao juntamente com a contribuio dos
invs de designar regies separadas das descritores variveis foram resumidos em
molculas no qual presumia-se que cinco modelos que foram classificados como
ocorreriam as interaes, como ocorre nos sendo os melhores, caracterizados por
mtodos de CoMFA. 132 significativas propriedades correlativas e
preditas. A triagem virtual foi realizada em
Em um trabalho desenvolvido por
uma base de dados de aproximadamente
Thondorf, I. e colaboradores (2011), foi
650.000 molculas utilizando um modelo de
realizado um estudo de QSAR-3D em
farmacforo derivado dos mapas de
substratos sintticos e naturais do
contorno do CoMSIA permitindo, assim, a
transportador de aminocidos acoplados a
identificao de possveis substratos de
prtons (hPAT1). A anlise comparativa de
hPAT1. As afinidades dos compostos foram
ndices de similaridade molecular (CoMSIA)
preditas e 11 compostos foram identificados
foi aplicada para verificar cuidadosamente os
como possveis substratos de alta afinidade.
requisitos da estrutura para a ligao com os
Dos 11 compostos, dois compostos
substratos e tambm para derivar um
selecionados inibiram fortemente a protena.
modelo de previso que pudesse ser utilizado
O modelo de QSAR-3D empregado neste
para a concepo de novos pr-frmacos. Os
trabalho para racionalizar e entender as
estudos de QSAR-3D empregados neste
afinidades de ligao dos substratos de
trabalho foram utilizados como uma
hPAT1 fornece uma introspeco das
ferramenta para elucidar o mecanismo de
interaes entre os substratos e o seu alvo
ao do frmaco a nvel molecular uma vez
biolgico (hPAT1) permitindo, assim, a
que a estrutura tridimensional est
predio da afinidade desses novos
relacionada com a afinidade ao receptor. Os
compostos 133.
dados de 50 substratos de hPAT1 foram
usados para os estudos de CoMSIA na Desenvolvido por Hopfinger,134,135 o QSAR-
derivao de um modelo matemtico de 4D um mtodo de modelagem molecular
relao estrutura-atividade e para identificar que muito til na construo de modelos
quais as caractersticas estruturais que farmacofricos quantitativos 3D para um
determinam a ligao desses substratos conjunto de ligantes, quando a geometria do
protena. A conformao biologicamente receptor correspondente no conhecida.
No QSAR-4D, uma grade utilizada ao redor tridimensional; QSAR-3D, a representao

das estruturas dos ligantes para determinar tridimensional da estrutura investigada
as regies no espao tridimensional que so para provar os descritores moleculares;
responsveis por possveis interaes, mas a QSAR-4D, devem considerar
priori nenhuma prova ou energia de orientaes/conformaes de ligantes
interao utilizada. Em vez disso, este mltiplos; QSAR-5D, consideram
mtodo incorpora flexibilidade molecular e adicionalmente representaes mltiplas do
alinhamentos mltiplos, permitindo, assim, a efeito de ajuste induzido do receptor/ligante;
identificao da conformao que QSAR-6D, considera adicionalmente, modelos
potencializa a atividade biolgica prevista. mltiplos de solvatao. Formalmente, pode-
se adicionar a essa classificao o modelo de
Os mtodos de QSAR multidimensional, os
QSAR-0D, em que um nico parmetro
quais incluem os mtodos de QSAR-4D, 5D,
correlacionado com a afinidade dos
6D e 7D so essencialmente extenses dos
compostos. Dessa forma, a dimenso de
mtodos de QSAR-3D. Estes mtodos
QSAR (Tabela 4) refere-se representao
incorporam caractersticas fsicas ou
esttica do ligante em QSAR-3D,
propriedades adicionais necessrias para
representaes mltiplas do ligante em
contornar dificuldades provenientes dos
QSAR-4D, modelo de receptor ou pseudo
mtodos de QSAR-3D.136
receptor virtual baseado no ligante em QSAR-
Atravs do QSAR multidimensional a 5D, cenrios de mltipla solvatao em
atividade dos compostos pode ser QSAR-6D e dados do receptor real ou
relacionada ao descritor molecular em interao ligante-receptor no QSAR-7D. O
amostras de representaes moleculares protocolo de QSAR-7D deve tambm incluir
tridimensionais baseadas em dados modelos virtuais de receptor baseado no
atomsticos modelados in silico e/ou medidos alvo, obtidos por modelagem de protenas
por um mtodo experimental (como por homlogas.
exemplo, em anlises de raios-X).
Deve-se observar que quanto mais
Recentemente, tem sido demonstrado que o
complexo o descritor molecular considerado,
QSAR-5D e o 6D podem ser usados para
maior tambm a dimenso do QSAR,
representaes mltiplas do receptor, bem
portanto, esta dimenso um nmero
como de seus estados de solvatao. No
artificial que no pode ser relacionado
mtodo de QSAR-5D, Vedani e
137 138 diretamente topologia molecular. Em vez
colaboradores e Lill e colaboradores
disso, este sistema tem como objetivo
introduziram uma representao mltipla da
classificar uma variedade de mtodos que
hiptese de ajuste induzido, onde a
so includos em QSAR.139
adaptao do stio de ligao do receptor
topologia individual do ligante era
considerada como uma quinta dimenso.
4.4. Aprendizagem de mquinas
Estas dimenses de que trata o QSAR
multidimensional referem-se ao tipo de
informao codificada pelo descritor, que A Ap e dizage de ui as Ma hi e
usada como uma varivel independente. Lea i g App oa h u a o da
Vedani e Lill propuseram a seguinte inteligncia artificial que estuda o
classificao: mtodo de QSAR-1D, no qual as desenvolvimento de algoritmos capazes de
propriedades globais dos ligantes (exemplo, classificar objetos a partir de um dado
pKa, logP) so correlacionadas com a conjunto de treinamento. Em
afinidade dos compostos; mtodo de QSAR- quimioinformtica, os objetos normalmente
2D, o ual usa fi ge p i ts est uturais do so molculas e as classes so propriedades
ligante, por exemplo, conectividade qumica, inerentes a estas. Um exemplo o uso de
negligenciando a informao estrutural aprendizagem de mquinas para discriminar

uma srie de molculas em ativas ou inativas de treinamento, como por exemplo, valores
em relao a um determinado alvo de atividade inibitria (IC50), que fornece a
molecular. Estas tcnicas podem prever estrutura dos compostos ativos e seus
padres numricos a partir de um conjunto respectivos valores de IC50.140
Tabela 4. Classificao geral do QSAR multidimensional

Representao molecular usada para
Dimenso de QSAR
clculos de descritor molecular
Parmetro de nmero nico geralmente
0D
referindo-se a propriedade global.
Uma combinao multivariada de
1D
propriedades globais.
Padres estruturais relativos s
2D
representaes moleculares 2D.
nico estado de representao 3D de
3D
ligantes.
4D Mltiplas representaes 3D de ligantes.
5D QSAR-3D + cenrios de ajuste induzido.
6D QSAR-5D + cenrios de mltipla solvatao.
Receptor real ou dados do modelo do
7D
receptor baseado no alvo.
Para a obteno de bons resultados Em triagem virtual, a aprendizagem de

utilizando a tcnica de aprendizagem de mquinas tem sido empregada com
mquinas de suma importncia a escolha resultados semelhantes ou, em alguns casos,
de um conjunto de treinamento adequado, at mesmo melhores do que os mtodos
que represente de maneira consistente as convencionais utilizados, com um custo
propriedades a serem classificadas. O computacional reduzido.149 Os algoritmos de
conjunto de treinamento, constitudo por aprendizagem de mquinas aplicados em
um grupo finito de exemplos distribudos triagem virtual so concentrados no
dentro de um sistema com a finalidade de se aprendizado supervisionado, onde um
encontrar uma classificao padro desejada conjunto de treinamento fornecido para o
(propriedade em estudo). Este de conjunto aprendizado do sistema e os objetos devem
treinamento aplicado ao algoritmo de ser classificados como pertencentes a este
aprendizagem escolhido, a fim de treinar este conjunto.
algoritmo para que seja capaz de classificar
Dentre os algoritmos de aprendizagem de
novos dados dentro deste sistema. Uma vez
mquinas, os mais empregados em triagem
treinado o algoritmo, um conjunto teste
virtual so: as redes neurais artificiais (ANN,
(conjunto de exemplos no includo no
do i gl s a tifi ial eu al et o k ,
conjunto treinamento) utilizado para
mquinas de vetores suporte (SVM, do ingls
validar o mtodo. 140
suppo t e to a hi e e o k-simo
Atualmente, h grande interesse na vizinho mais prximo (k-NN, do i gl s k-
aplicao dessas ferramentas e tcnicas para nearest eigh o s .
obteno de respostas em modelos
Tcnicas de aprendizagem de maquinas
biolgicos e farmacolgicos140,141 incluindo
tm sido cada vez mais aplicadas em triagem
modelos de QSAR e QSPR,5,141-145 bem como
virtual baseada em ligantes, devido
simulaes de docagem e triagem
expanso das bibliotecas qumicas, do
virtual.121,146-148
surgimento de novos descritores moleculares

e das tcnicas de busca por similaridade. candidatos a frmacos.126

Alm disso, com a maior facilidade de
As ANN j foram utilizadas com relativo
obteno de dados de atividade em ensaios
sucesso na predio de inibidores de HIV-
biolgicos, os mesmos vm sendo
protease,150 combinando um algoritmo
incorporados em modelos que so usados
gentico para a seleo de variveis usadas
para auxiliar no planejamento de novos
para estimar a afinidade de derivados de
canditados a farmacos, o que facilita a
arilpiperazinas ao receptor 5-HT1A,
identificao de caractersticas moleculares
apresentando uma taxa de erro percentual
que so relevantes para a propriedade
baixa, cerca de 0,065.151 Sucesso tambm
biolgica, direcionando, assim, a sntese de
pde ser observado na predio da
compostos promissores.149
permeabilidade barreira hematoenceflica
e ligao soroalbumina, onde os valores
preditos apresentaram um coeficiente de
4.4.1. Redes neurais
determinao (R2) na ordem de 0,9 frente a
126 frmacos comerciais.152 Alm disso,
Uma rede neural artificial (ANN, do ingls ANNs j foram empregadas na predio de
a tifi al eu al et o k u odelo inibidores da Furina, capazes de evitar a
matemtico inspirado nas redes neurais maturao das toxinas produzidas pelo
biolgicas. As ANN so unidades que Bacillus anthracis,153 e, tambm, aplicadas na
processam informaes de uma forma gerao de um modelo de QSAR de predio
motivada pela funcionalidade do sistema de toxicidade de pirril-aril-sulfonas, utilizadas
nervoso biolgico. Assim, como o crebro como inibidores no nucleosdicos de
consiste de neurnios que esto ligados uns transcriptase reversa no tratamento da AIDS,
aos outros, uma ANN abrange neurnios com uma taxa de erro de 0,066 frente s
artificiais interconectados. Um neurnio concentraes citotxicas obtidas e as
artificial construdo em analogia aos calculadas.154
neurnios biolgicos. Os neurnios Os mapas auto-organizveis (do ingls,
trabalham em conjunto para resolver um elf-O ga izi g Maps - SOM) constituem
determinado problema. Assim, como em um tipo de ANN que transforma um espao
humanos, as ANN aprendem com os multidimensional em bidimensional,
exemplos (dados de entrada). O processo de classificando os dados devido a sua
aprendizagem de uma ANN chamado similaridade, j que os mesmos so
treinamento. No crebro humano, as agrupados de acordo com as suas
sinapses (conexes entre os neurnios), so caractersticas. Este mtodo foi usado com
adaptadas durante um processo de sucesso por Fernandes e colaboradores155
aprendizagem. Um processo correspondente para classificar lactonas sesquiterpnicas
executado quando uma ANN treinada, quanto sua atividade contra carcinoma
onde os pesos de suas conexes so nasofarngeo, assim como predizer a
ajustados com o intuito de reproduzir os toxicidade destes compostos, atingindo um
exemplos disponibilizados como dados de ndice de 89% de poder preditivo.
entrada. Depois do aprendizado, elementos a
Os SOM tambm j foram testados frente
serem preditos so adicionados com o intuito
a bibliotecas de inibidores de ciclo-oxigenase
de estimar sua possvel atividade biolgica.114
2 (COX-2), acetilcolinesterase,
As redes neurais artificiais tm diversas fosfodiesterase IV (PDE4), trombina 2105 e
aplicaes no processo de planejamento de inibidores de ativao de u-plasminognio
substncias bioativas, podendo ser (uPA) 199, e apresentaram sucesso de
empregadas, inclusive, para a determinao aproximadamente 70% frente aos compostos
da relao quantitativa entre estrutura com atividade conhecida.156 Alm disso,
molecular e atividade biolgica (QSAR) de observa-se o emprego desse mtodo na

identificao de inibidores de glicoprotena-P, podemos encontrar dois tipos de conjunto de

elucidando quinazolinonas, benzotiazis e informaes: os que apresentam um padro
propafenonas com atividade experimental na linearmente separvel e os que apresentam
faixa de concentrao de M.157 um padro no-linearmente separvel. No
segundo tipo, busca-se uma funo de
mapeamento apropriada para tornar o
4.4.2. "Support vector machine" conjunto mapeado linearmente separvel.162
O termo vetor definido como o conjunto
O VM uppo t Ve to Ma hi e 158 de caractersticas que descrevem um caso, ou
um algoritmo baseado na teoria de seja, uma linha de valores de predio.
aprendizado estatstico supervisionado que Assim, o objetivo da modelagem SVM
consiste em uma tcnica computacional de encontrar o hiperplano timo que separa
aprendizado para problemas de grupos de vetores de tal forma que os casos
159
reconhecimento de padres. Ela utiliza a com uma categoria de alvo varivel esto em
deduo de dados a partir do conjunto de um lado do plano e os casos com a outra
treinamento, e tem a habilidade de classificar categoria esto no outro lado do plano
os objetos de um determinado espao (Figura 7). Existem infinitas retas capazes de
altamente dimensional em duas classes separar os dois conjuntos de treinamento. As
distintas, traando um hiperplano, de acordo retas mostradas em verde (Figura 7)
com suas caractersticas, de tal forma que a representam os possveis hiperplanos, sendo
separao entre os exemplos seja que a reta mais espessa a que mais bem
mxima.160,161 representa o melhor posicionamento para
separao dos grupos, sendo esta chamada
SVM foi originalmente desenvolvido para de hiperplano timo. As retas paralelas a este
classificao binria, a qual busca a hiperplano so as que definem as margens e
construo de um hiperplano como os vetores de suporte.
superfcie de deciso. Dentro desta tcnica
Figura 7. Representao geral do processo SVM para determinao do hiperplano timo.

Adaptado de Gonalves (2010)161
Se Xi (i=1, 2, ..., M) um conjunto de associado um rotulo: yi=1 se Xi , yi=-1 se

treinamento em um problema, os quais esto Xi . Nesse caso a funo de deciso
presente em dois grupos linearmente linear (hiperplano timo) adquire a forma:
separveis ( e ), a cada objeto fica
D(x) = w . xi + b,

onde w um vetor m-dimensional (pesos) separados,162 e os vetores que determinam

e b o termo independente (bias), para i=1, estas margens so denominados de vetores
2, ..., M.163 suporte (Figura 8). Assim, temos que as
funes que definem as margens so:
Dentro da linguagem de SVM, podemos
definir a margem como a menor distncia margem 1: D(x) = w . xi + b = 1
entre os exemplos do conjunto de
margem 2: D(x) = w . xi + b = -1
treinamento e o hiperplano utilizado para
separao destes grupos.164 A margem
determina o quanto dois grupos podem ser
Figura 8. Identificao da margem e dos vetores suporte sobre a linha pontilhada. Adaptado de
Lima (2002)165
Uma vez determinados os vetores problemas no-lineares foram introduzidas

suporte, estes se tornam valores de funes reais, que mapeiam o conjunto de
referncia, que sozinhos determinam o treinamento em um espao linearmente
hiperplano timo, sendo que os demais separvel, o espao de caractersticas. Um
vetores se tornam irrelevantes, podendo ser conjunto de dados dito ser no-linearmente
removidos do conjunto de treinamento sem separvel caso no seja possvel separar os
afetar os resultados.162 Em problemas reais, dados com um hiperplano definido por uma
os padres linearmente separveis so funo do tipo f(x) = w . x + b . A figura 9
dificilmente encontrados, sendo a maioria mostra um conjunto linearmente e outro
deles complexos e no-lineares. Para no-linearmente separvel.
estender a SVM linear a resoluo de

Figura 9. Exemplos de padres linearmente e no-linearmente separveis, respectivamente.

Adaptado de Zien e colaboradores166
O teorema de Cover afirma que um dimensionalidade, por meio da funo de

problema no-linear tem maior Ke el , ai do e to e u p o le a de
probabilidade de ser linearmente separvel classificao linear (Figura 10), podendo fazer
em um espao de mais alta uso do hiperplano timo que agora definido
162
dimensionalidade. A partir disso, a SVM por f(x) = (w . x ) . + b.165
no-linear realiza uma mudana de
Figura 10. Representao esquemtica da mudana de um padro no - linearmente

separvel para um linearmente separvel atravs da aplicao da funo Kernel (). Adaptado
de Zien e colaboradores166
Devido a sua eficincia em trabalhar com antagonistas de dopamina, onde dois

dados de alta dimensionalidade, SVM conjuntos de treinamento foram fornecidos
relatada na literatura como uma tcnica ao SVM: um com compostos ativos e outro
altamente robusta, muitas vezes comparada com compostos inativos, sendo que esses
s Redes Neurais.167,168 SVM j foi usado para compostos inativos tinham estruturas
a predio de inibidores de HIV-protease,150 semelhantes aos ativos. Os resultados
com melhores resultados que os obtido com obtidos pelo SVM quando comparados a
as ANNs ("artificial neural network"). Han e outros mtodos de triagem baseados em
colaboradores127 realizaram um estudo com o ligantes mostrou um ndice de eficincia
intuito de verificar a aplicao da SVM em semelhante. A etapa determinante para o
triagem virtual com inibidores de HIV bom resultado da SVM, sem dvida alguma,
protease, diidrofolato redutase (DHFR) e a seleo do conjunto de treinamento, pois

este pode afetar sobremaneira o resultado comprovando a alta eficincia desta tcnica e
final. a sua grande vantagem em relao ao seu
poder preditivo quando comparada aos
Sucesso tambm pde ser observado na
mtodos mais clssicos de triagem virtual.
predio de inibidores seletivos para a
enzima conversora do fator de necrose
tumoral (TACE),169 apresentando alta
4.4.3. "k-Nearest Neighbors (k-NN)"
eficincia, cerca de 99% de preciso para
determinar os compostos inibidores e 98%
para determinar compostos no-inibidores, O algoritmo k-NN um mtodo para
desde que os descritores fossem bem classificao de objetos baseado em
selecionados. Alm disso, observa-se exemplos, tambm chamado de
tambm o emprego do SVM de forma "aprendizado preguioso", onde a funo s
combinada ao k-NN na classificao de aproximada localmente e toda a
inibidores e no inibidores de CYP1A2 (uma computao protelada at a classificao.
isoforma do citocromo P450), alcanando Ele est dentre os mais simples de todos os
nveis de preciso de 73% a 76% sobre o algoritmos que envolvem aprendizagem de
conjunto de teste.170 mquinas: um objeto classificado por uma
Liew e colaboradores171 propuseram criar maioria de votos dos seus vizinhos, com o
um modelo de SVM para realizao de objeto sendo designado classe mais comum
triagem virtual de inibidores de Lck entre seus k mais prximos vizinhos (k um
(Lymphocyte-specific protein tyrosine valor positivo, geralmente variando de 1 a
kinase). Para tal, foram utilizados 66.032 10).140 Se k = 1, ento o objeto designado
compostos de 8.423 famlias qumicas, classe de seu nico vizinho mais prximo, se
reunidas a partir de estudos publicados na k = 2, o objeto designado classe de seus
literatura e das bases de dados de estruturas dois vizinhos mais prximos e assim por
e atividades biolgicas do PUBCHEM e do diante. Os vizinhos so obtidos de um
MDDR. Inibidores desta enzima tm potencial conjunto de objetos para os quais a
emprego no tratamento de doenas auto- classificao correta conhecida. Isto pode
imunes e rejeies a transplantes. Um total ser considerado o conjunto de treinamento
de 100 descritores moleculares foi listado do algoritmo, embora no seja necessria
nessa investigao, sendo 13 referentes a nenhuma etapa explcita de treinamento.180-
182
propriedades moleculares simples, 13
descritores de carga, 34 de conectividades A ideia desse algoritmo a de que a classe
moleculares e descritores de forma e 40 a qual um determinado composto pertence
ndices de estado eletrotopolgico. O modelo pode ser definida pela classe qual
de SVM se mostrou capaz de identificar pertencem os vizinhos mais prximos
novos inibidores de Lck de uma grande (compostos mais similares, por exemplo),
biblioteca de compostos qumicos. Esta considerando similaridades ponderadas entre
biblioteca de inibidores possua um ndice de o composto e seus vizinhos mais prximos.128
0,52% de falsos positivos e foi desenvolvido a
partir de um grande conjunto de inibidores e Com o aumento do uso do k-NN, algumas
no inibidores de Lck. O uso do SVM, que no mudanas foram realizadas com o intuito de
depende apenas das associaes de famlias aprimorar este mtodo, sendo que a mais
qumicas, permitiu distinguir no-inibidores comum delas a de considerar a distncia
que so estruturalmente similares aos entre a molcula em estudo e os seus
inibidores j conhecidos. Muitos outros vizinhos, tendo maior peso as atividades dos
trabalhos vm sendo desenvolvidos vizinhos mais prximos.140 Para isso foi
utilizando a tcnica de SVM em triagem necessria a aplicao de uma funo de
virtual.149,172-179 Em tais estudos vm se ponderao (normalmente uma funo

"kernel"). Jensen e colaboradores183 Wang e colaboradores189 combinaram o k-NN

utilizaram uma funo de ponderao a diferentes mtodos de clculo de
gaussiana da distncia de Tanimoto entre as descritores em estudos de QSAR, para
molculas para prever a atividade de 1,000 determinao de afinidade e seletividade de
inibidores do citocromo P450 2D6 e 3A4. agonistas e antagonistas de receptores
Cedeo e Agrafiotis184 empregaram uma 5HT1E e 5HT1F, a partir de uma triagem em
funo kernel do inverso da distncia (com uma biblioteca virtual de 65 mil compostos,
um aditivo de correo para evitar obtendo uma correlao entre pKi terico e
singularidades) em um estudo QSAR. experimental de at 92%; Hsieh e
colaboradores128 utilizaram o algoritmo na
O maior refinamento realizado para este
lassifi ao de liga tes e o liga tes de -
mtodo a considerao do peso da
lactamases do tipo AmpC, com eficincia de
contribuio de cada descritor para o clculo
90%, encontrando 5 compostos com
da distncia. Miller e colaboradores185
atividade inibitria na escala milimolar.
descreveram uma variao na classificao k-
Existem, ainda, diversos outros exemplos do
NN, mtrica flexvel modificada do vizinho
emprego do algoritmo k-NN com sucesso no
ais p i o do i gl s, odified fle i le
planejamento de substncias
et i ea est eigh o - MFMNN), onde os
bioativas.150,169,180,190
pesos dos descritores so determinados pelo
quanto o descritor de cada um dos vizinhos
est distante do objeto em estudo, sendo
que os descritores dos vizinhos mais 5. Concluses
prximos apresentam maior peso.
Shen e colaboradores186 demonstraram a
As tcnicas de triagem virtual
eficcia desse algoritmo em vrios conjuntos
representaram um grande avano no
de dados, incluindo seu uso para identificar
processo de planejamento de frmacos, uma
nove potenciais anticonvulsivantes de uma
vez que tornou mais dinmico o processo de
biblioteca virtual contendo mais de 250 mil
busca por substncias bioativas de interesse
molculas, das quais sete foram confirmadas
farmacutico. As tcnicas existentes
como bioativas. O mesmo grupo tambm usa atualmente tm se mostrado muito teis, e a
o k-NN como o algoritmo de aprendizagem cada dia, o nmero de publicaes relatando
de seus mtodos COLIBRI187 e ENTess188 os
o sucesso na busca por substncias bioativas
quais incluem descritores que representam o
utilizando a triagem virtual vm aumentando.
receptor e, tambm, o ligante.
Entretanto, a cada dia tambm cresce o
O k-NN tem sido amplamente empregado nmero de molculas sintetizadas e de novos
nos ltimos anos em vrios grupos de alvos biolgicos atrativos descobertos, o que
pesquisa com diferentes finalidades, como acarreta a necessidade de um processo de
por exemplo: Du-Cuny e colaboradores181 triagem de molculas bioativas mais
verificaram a influncia de modificaes eficiente, seja ele virtual ou no. Neste
qumicas sobre a permeabilidade celular de contexto, torna-se necessrio o
possveis inibidores de AKT (protena cinase desenvolvimento de novas estratgias que
B); Peterson e colaboradores182 em estudos consigam traduzir cada vez mais os dados
de QSAR e triagem virtual, encontraram qumicos de substncias de interesse em
inibidores de geranil transferase tipo I, informaes capazes de nortear os cientistas
testados com sucesso posteriormente in vitro na busca de novos candidatos a frmacos. O
sendo que sete deles com potncia na escala desenvolvimento das tcnicas de triagem ,
milimolar; Vasanthanathan e primeira vista, promissor e a cada dia novas
colaboradores170 empregaram o k-NN de estratgias so descritas na literatura,
forma combinada ao SVM na classificao de sobretudo desenvolvimentos em relao aos
inibidores e no inibidores de CYP1A2, mtodos que envolvem aprendizagem de
conseguindo de 73% a 76% de preciso; mquinas e anlise de descritores, que

10
trouxeram novas perspectivas para a Alonso, H.; Bliznyuk, A. A.; Gready, J. E.
abordagem da triagem virtual, Med. Res. Rev. 2006, 26, 531. [CrossRef]
principalmente por aperfeioar os estudos de [PubMed]
relao estrutura-atividade e introduzir 11
Henzler, A. M.; Rarey, M. Mol. Inf. 2010,
mtodos de anlise capazes de detectar
29, 164. [CrossRef]
semelhanas entre compostos qumicos que
12
vo alm da simples organizao estrutural Talevi, A.; Bruno-Blanch, L. E. Lat. Am. J.
dos tomos no espao tridimensional. Existe Pharm. 2009, 28, 141. [Link]
grande expectativa de que o contnuo 13
Kroemer, R. T. Curr. Protein Pept. Sci. 2007,
aprimoramento destes processos ajudar a 8, 312. [CrossRef] [PubMed]
reduzir custos e o tempo necessrios para o
14
desenvolvimento de novos frmacos, Rarey, M.; Lemmen, C.; Matter, H. Em
sobretudo para doenas que ainda no tm Algorithmic Engines in Virtual Screening;
medicamentos efetivos para seu tratamento, Oprea, T. I., ed.; Wiley-VCH Verlag GmbH &
como por exemplo, a doena de Alzheimer, a Co. KGaA: Weinheim, 2005, cap. 4.
doena de Chagas e vrios tipos de cncer. 15
Vyas, V.; Jain, A.; Jain, A.; Gupta, A. Sci.
Pharm. 2008, 76, 333. [Link]
16
Referncias Bibliogrficas Irwin, J. J.; Shoichet, B. K. J. Chem. Inf.
Model. 2005, 45, 177. [CrossRef] [PubMed]
17
1
Anderson, A. C. Chem. Biol. 2003, 10, 787.
Buchanan, S. G. Curr. Opin. Drug. Discov. [CrossRef] [PubMed]
Devel. 2002, 5, 367. [PubMed]
18
2
Crivori, P.; Poggesi, I. Eur J. Med. Chem.
Lima, L. M. Quim. Nova 2007, 30, 1456. 2006, 41, 795. [CrossRef] [PubMed]
[CrossRef]
19
3
Taft, C. A; Da Silva, C. H. T. P.; Current
Verli, H.; Barreiro, E. J. Quim. Nova 2005, Methods in Medicinal Chemistry and
28, 95. [CrossRef] Biological Physics, 1a. ed., Research Singpost:
4
Hann, M. M.; Leach, A. R.; Green, D. V. Em Kerala, 2008.
Computational Chemistry, Molecular 20
Hajduk, P. J.; Greer, J. Nat. Rev. Drug
Complexity and Screening Set Design, Oprea Discov. 2007, 6, 211. [CrossRef] [PubMed]
T. I., ed; Wiley-VCH: Weinheim, 2005, cap 3.
21
5
Eckert, H.; Vogt, I.; Bajorath, J. J. Chem. Inf.
Kitchen, D. B.; Decornez, H.; Furr, J. R.; Model. 2006, 46, 1623. [CrossRef] [PubMed]
Bajorath, J. Nat. Rev. Drug Discov. 2004, 3,
22
935. [CrossRef] [PubMed] Muegge, I. Mini. Rev. Med. Chem. 2008, 8,
6
927. [CrossRef] [PubMed]
Klebe, G. Drug Discov. Today: Technol.
23
2004, 1, 225. [CrossRef] Shoichet, B. K. Nature 2004, 432, 862.
7
[CrossRef] [PubMed]
Owens J. Nat. Rev. Drug. Discov. 2007, 6,
24
187. [CrossRef] Grabowski, K.; Baringhaus, K. H.;
8
Schneider, G. Nat. Prod. Rep. 2008, 25, 892.
Cheng, A. C.; Coleman, R. G.; Smyth, K. T.; [CrossRef] [PubMed]
Cao, Q.; Soulard, P.; Caffrey, D. R.; Salzberg,
25
A. C.; Huang, E. C. Nat. Biotechnol. 2007, 25, Patrick, G. L.; An Introduction to Medicinal
71. [CrossRef] [PubMed] Chemistry, 4a. ed., Oxford University Press:
9
Oxford, 2009.
Marshall, G. R. Em Introduction to
26
chemoinformatics in drug discovery A Schneider, G. Nat. Rev. Drug Discov. 2010,
personal view; Oprea, T. I.; ed.; WILEY-VHC: 9, 273. [CrossRef] [PubMed]
Weinheim, 2004. cap. 1.

27 42
Drewry, D. H.; Macarron, R. Curr. Opin. Taylor, R. D.; Jewsbury, P. J.; Essex, J. W. J.
Chem. Biol. 2010, 14, 289. [CrossRef] Comput. Aided Mol. Des. 2002, 16, 151.
[PubMed] [CrossRef] [PubMed]
28 43
Brown, R. D.; Hassan, M.; Waldman, M. J. Verdonk, M. L.; Cole, J. C.; Hartshorn, M. J.;
Mol. Graph. Model. 2000, 18, 427. [CrossRef] Mulrray, C. W.; Taylor, R. D. Proteins 2003,
[PubMed] 52, 609. [CrossRef] [PubMed]
29 44
Lyne, P. D. Drug Discov. Today 2002, 7, DeLano Scientific LLC. PyMOL. Version
1047. [CrossRef] [PubMed] 0.99. 2006.
30 45
Walter, W. P.; Murcko, M. A. Adv. Drug Kramer, B.; Rarey, M.; Lengauer, T.
Deliv. Rev. 2002, 54, 255. [CrossRef] Proteins 1999, 37, 228. [CrossRef] [PubMed]
[PubMed] 46
Ewing, T. J. A.; Makino, S.; Skillman, A. G.;
31
Di, L.; Kerns, E. H. Curr. Opin. Chem. Biol. Kuntz, I. D. J. Comput. Aided Mol. Des. 2001,
2003, 7, 402. [CrossRef] [PubMed] 15, 411. [CrossRef] [PubMed]
32 47
Lipinski, C. A.; Lombardo, F.; Dominy, B. Friesner, R. A.; Banks, J. L.; Murphy, R. B.;
W.; Feeney, P. J. Adv. Drug Deliv. Rev. 2001, Halgren, T. A.; Klicic, J. J.; Mainz, D. T.;
46, 3. [CrossRef] [PubMed] Repasky, M. P.; Knoll, E. H.; Shelley, M.;
33 Perry, J. K.; Shaw, D. E.; Francis, P.; Shenkin,
Lumley, J. A. QSAR Comb. Sci. 2005, 24,
P. S. J. Med. Chem. 2004, 47, 1739. [CrossRef]
1066. [CrossRef]
[PubMed]
34
Brenk, R.; Schipani, A.; James, D.; 48
Halgren, T. A.; Murphy, R. B.; Friesner, R.
Krasowski, A.; Gilbert, I. H.; Frearson, J.;
A.; Beard, H. S.; Frye, L. L.; Pollard, W. T.;
Wyatt, P. G. ChemMedChem 2008, 3, 435.
Banks, J. L. J. Med. Chem. 2004, 47, 1750.
[CrossRef] [PubMed]
[CrossRef] [PubMed]
35
Eddershaw, P. J.; Beresford, A. P.; Bayliss, 49
Goodsell, D. S.; Morris, G. M.; Olson, A. J. J.
M. K.; Drug Discov. Today 2000, 5, 409.
Mol. Recognit. 1996, 9, 1. [CrossRef]
[CrossRef] [PubMed]
[PubMed]
36
Selick, H. E.; Beresford, A. P.; Tarbit, M. H. 50
Waszkowycz, B. Drug Discov. Today 2008,
Drug Discov. Today 2002, 7, 109. [CrossRef]
13, 219. [CrossRef] [PubMed]
[PubMed]
51
37 Dias, R.; de Azevedo, W. F. Curr. Drug.
Sheppard, G. S.; Bouska, J. J. Drug Discov.
Targets 2008, 9, 1040. [CrossRef] [PubMed]
Today: Therapeutic Strategies 2005, 2, 343.
[Link] 52
Duga , N.; E ko, . Algorithms 2009, 2,
38 410. [CrossRef]
Schneider, G.; Bhm, H-J. Drug. Discov.
53
Today 2002, 7, 64. [CrossRef] [PubMed] Rarey, M.; Lemmen, C.; Matter, H. Em
39 Algorithmic Engines in Virtual Screening;
Cavasotto, C. N.; Orry, A. J. W. Curr. Top.
Oprea, T. I., ed.; Wiley-VCH Verlag GmbH &
Med. Chem. 2007, 7, 1006. [CrossRef]
Co. KGaA: Weinheim, 2005, cap. 4.
[PubMed]
54
40 Cosconati, S.; Forli, S.; Perryman, A. L.;
Honorio, K. M.; Montanari, C. A.;
Harris, R.; Goodsell, D. S.; Olson, A. J. Expert
Andricopulo, A. D. Em: Advances and
Opin. Drug. Discov. 2010, 5, 597. [CrossRef]
applications of structure-based approaches in
[PubMed]
drug Discovery; Taft, C. A.; Silva, C. H. T. P.,
55
eds.; Research Signpost: Kerala, 2008, cap 5. Morris, G. M.; Huey, R.; Olson, A. J. Curr.
41 Protoc. Bioinformatic. 2008, 24, 1. [CrossRef]
Zavodszky, M. I.; Rohatgi. A.; Van Voorst, J.
56
R.; Yan, H.; Kuhn. L. A. J. Mol. Recognit. 2009, Trott, O.; Olson, A. J. J. Comput. Chem.
22, 280. [CrossRef] [PubMed] 2010, 31, 455. [CrossRef] [PubMed]

57 73
Lengauer, T.; Bioinformatics: From SYBYL. SYBYL-X 1.2, Tripos International,
Genomes to Drugs, 1a ed., Wiley-VCH: 1699 South Hanley Rd., St. Louis, Missouri,
Germany, 2001. 63144, USA. 2010.
58 74
Vieth, M.; Hirst, J. D.; Brooks, C. L. J. Jain, A. N. J. Comput. Aided Mol. Des. 1996,
Comput. Aided Mol. Des. 1998, 12, 563. 10, 427. [CrossRef] [PubMed]
[CrossRef] [PubMed] 75
Jain, A. N. J. Comput. Aided Mol. Des. 2000,
59
Brooijmans, N.; Kuntz, I. D. Annu. Rev. 14, 199. [CrossRef] [PubMed]
Biophys. Biom. 2003, 32, 335. [CrossRef] 76
Jain, A. N. J. Med. Chem. 2003, 46, 499.
[PubMed]
[CrossRef] [PubMed]
60
CCG The Molecular Operating Environment 77
Welch, W.; Ruppert, J.; Jain, A. N. Chem.
(MOE), Canada, 1996.
Biol. 1996, 3, 449. [CrossRef] [PubMed]
61
Goodsell, D. S.; Morris, G. M.; Olson, A. J. J. 78
Jones, G.; Willett, P.; Glen, R. C.; Leach, A.
Mol. Recognit. 1996, 9, 1. [CrossRef]
R.; Taylor, R. J. Mol. Biol. 1997, 267, 727.
[PubMed]
[CrossRef] [PubMed]
62
Clark, D. E.; Jones, G.; Willett, P.; Kenny, P. 79
Antes, I. Proteins 2010, 78, 1084.
W.; Glen, R. C. J. Chem. Inf. Comp. Sci. 1994,
[CrossRef] [PubMed]
34, 197. [CrossRef]
80
63 Taufer, M.; Crowley, M.; Price, D.; Chien, A.
Moon, J. B.; Howe, W. J. Proteins 1991, 11,
A.; Brooks III, C. L.; Parallel and Distributed
Processing Symposium, 2004 Proceedings
64
Xu, J.; Hagler, A. Molecules 2002, 7, 566. 18th International, Santa Fe, EUA, 2004.
[CrossRef] 81
Xu, H.; Hsu, P-H.; Zhang, L.; Tsai, M-D.;
65
Kearsley, S. K.; Underwood, D. J.; Sheridan, Freitas, M. A. J. Proteome Res. 2010, 9, 3384.
R. P.; Miller, M. D. J. Comput. Aided Mol. Des. [CrossRef] [PubMed]
1994, 8, 565. [CrossRef] [PubMed] 82
Hirst, J. D. Curr. Opin. Drug Discov. Devel.
66
Havel, T. F.; Kuntz, I. D.; Crippen, G. M. J. 1998, 1, 28. [PubMed]
Theor. Biol. 1983, 104, 359. [CrossRef] 83
Schulz-Gasch, T.; Stahl, M. J. Mol. Model.
[PubMed]
2003, 9, 47. [CrossRef] [PubMed]
67
Lagorce, D.; Pencheva, T.; Villoutreix, B. O.; 84
Huang, N.; Kalyanaraman, C.; Bernacki, K.;
Miteva, M. A. BMC Chem. Biol. 2009, 9.
Jacobson, M. P. Phys. Chem. Chem. Phys.
[CrossRef] [PubMed]
68
Maiorov, V.; Sheridan, R. P. J. Chem. Inf. 85
McGovern, S. L.; Shoichet, B. K. J. Med.
Model. 2005, 45, 1017. [CrossRef] [PubMed]
Chem. 2003, 46, 2895. [CrossRef] [PubMed]
69
Miller, M. D.; Kearsley, S. K.; Underwood, 86
Carlson, H. A.; McCammon, J. A. Mol.
D. J.; Sheridan, R. P. J. Comput. Aided Mol.
Pharmacol. 2000, 57, 213. [PubMed] [Link]
Des. 1994, 8, 153. [CrossRef] [PubMed]
87
70 Jenwitheesuk, E.; Horst, J. A.; Rivas, K. L.;
Breda, A.; Basso, L. A.; Santos, D. S.; de
Van Voorhis, W. C.; Samudrala, R. Trends
Azevedo Jr, W. F. Curr. Comput Aided Drug.
Pharmacol. Sci. 2008, 29, 62. [CrossRef]
Des. 2008, 4, 265. [CrossRef]
[PubMed]
71
OpenEye Scientific Software. FRED: Fast 88
Broughton, H. B. J. Mol. Graph. Model.
Rigid Exhaustive Docking. V. 2.2.5. 2009.
72
McGann, M. R.; Almond, H. R.; Nicholls, A.; 89
Scior, T.; Bender, A.; Tresadern, G.;
Grant, J. A.; Brown, F. K. Biopolymers 2003,
Medina-Franco, J. L.; Martnez-Mayorga, K.;
Langer, T.; Cuanalo-Contreras, K.; Agrafiotis,

105
D. K. J. Chem. Inf. Model. 2012, 52, 867. Rella, M.; Rushworth, C. A.; Guy, J. L.;
[CrossRef] [PubMed] Turner, A. J.; Langer, T.; Jackson, R. M. J.
90 Chem. Inf. Model. 2006, 46, 708. [CrossRef]
Knegtel, R. M. A.; Kuntz, I. D.; Oshiro, C. M.
[PubMed]
J. Mol. Biol. 1997, 266, 424. [CrossRef]
106
91 Spitzer, G. M.; Heiss, M.; Mangold, M.;
Totrov, M.; Abagyan, R. Curr. Opin. Struc.
Markt, P.; Kirchmair, J.; Wolber, G.; Liedl, K.
Biol. 2008, 18, 178. [CrossRef] [PubMed]
R. J. Chem. Inf. Model. 2010, 50, 1241.
92
Geppert, H.; Vogt, M.; Bajorath, J. J. Chem. [CrossRef] [PubMed]
Inf. Model. 2010, 50, 205. [CrossRef] 107
Chen, Z.; Li, H-L.; Zhang, Q-J.; Bao, X-G.;
[PubMed]
Yu, K-Q.; Luo, X-M.; Zhu, W-L.; Jiang, H-L.
93
Dror, O.; Schneidman-Duhovny, D.; Inbar, Acta Pharmacol. Sin. 2009, 30, 1694.
Y.; Nussinov, R.; Wolfson, H. J. J. Chem. Inf. [CrossRef] [PubMed]
Model. 2009, 49, 2333. [CrossRef] [PubMed] 108
Istvan, E. S.; Deisenhofer, J. Science 2001,
94
Leach, A. R.; Gillet, V. J.; Lewis, R. A.; 292, 5519. [CrossRef] [PubMed]
Taylor, R. J. Med. Chem. 2010, 53, 539. 109
Steindl, T. M.; Schuster, D.; Wolber, G.;
[CrossRef] [PubMed]
Laggner, C.; Langer, T. J. Comput. Aided Mol.
95
Tanrikulu, Y.; Proschak, E.; Werner, T.; Des. 2006, 20, 703. [CrossRef] [PubMed]
Geppert, T.; Todoroff, N.; Klenner, A.; Kottke, 110
Liu, X.; Ouyang, S.; Yu, B.; Liu, Y.; Huang,
T.; Sander, K.; Schneider, E.; Seifert, R.; Stark,
K.; Gong, J.; Zheng, S.; Li, Z.; Li, H.; Jiang, H.
H.; Clark, T.; Schneider, G. ChemMedChem
Nucleic Acids Res. 2010, 38, 609. [CrossRef]
[PubMed]
96
Wolber, G.; Seidel, T.; Bendix, F.; Langer, T. 111
Johnson, M. A.; Maggiora, G. M.; Concepts
Drug Discov. Today 2008, 13, 23. [CrossRef]
and applications of molecular similarity, 1a.
[PubMed]
ed., Wiley: New York, 1990.
97
Giganti, D.; Guillemain, H.; Spadoni, J-L.; 112
Kubinyi, H. J. Braz. Chem. Soc., 2002, 13,
Nilges, M.; Zagury, J-F.; Montes, M. J. Chem.
717. [CrossRef]
Inf. Model. 2010, 50, 992. [CrossRef]
113
[PubMed] Willett, P. Drug Discov. Today 2006, 11,
98 1046. [CrossRef] [PubMed]
Ekins, S.; Mestres, J.; Testa, B. Br. J.
114
Pharmacol. 2007, 152, 9. [CrossRef] Gasteiger, J.; Engel, T.; Chemoinformatics,
[PubMed] a textbook. 1a. ed., Wiley-VCH: Weinheim
99 2003.
Schneider, G.; Bhm, H-J. Drug. Discov.
115
Today 2002, 7, 64. [CrossRef] [PubMed] Baldi P.; Nasr, R. J. Chem. Inf. Model.
100 2010, 50, 1205. [CrossRef] [PubMed]
Eckert, H.; Bajorath, J. Drug Discov. Today
116
2007, 12, 225. [CrossRef] [PubMed] Duan, J.; Dixon, S. L.; Lowrie, J. F.;
101 Sherman, W. J. Mol. Graph. Model. 2010, 29,
Kontoyianni, M.; Madhav, P.; Suchanek,
E.; Seibel, W. Curr. Med. Chem. 2008, 15, 107.
117
[CrossRef] [PubMed] Salim, N.; Holliday, J.; Willett, P. J. Chem.
102 Inf. Comput. Sci. 2003, 43, 435. [CrossRef]
Langer, T.; Wolber, G. Drug Discov. Today:
[PubMed]
Technol. 2004, 1, 203. [CrossRef]
118
103 Whittle, M.; Gillet, V. J.; Willett, P.; Loesel,
McInnes, C. Curr. Opin. Chem. Biol. 2007,
J. J. Chem. Inf. Model. 2006, 46, 2206.
11, 494. [CrossRef]
[CrossRef] [PubMed]
104
Sun, H. Curr. Med. Chem. 2008, 15, 1018. 119
Zhang, Q.; Muegge, I. J. Med. Chem. 2006,
[CrossRef] [PubMed]

120
Abdo, A.; Salim, N. QSAR Comb. Sci. 2009, M. Bioorg. Med. Chem. 2011, 19, 6409.
28, 654. [Link] [CrossRef] [PubMed]
121 134
Hert, J.; Willett, P.; Wilton, D. J. J. Chem. Hopfinger, A. J.; Wang, S.; Tokarski, J. S.;
Inf. Model. 2006, 46, 462. [CrossRef] Jin, B.; Albuquerque, M.; Madhav, P. J.;
[PubMed] Duraiswami, C. J. Am. Chem. Soc. 1997, 119,
122 10509. [CrossRef]
Jennings, A.; Tennant, M. J. Chem. Inf.
135
Model. 2007,47, 1829. [CrossRef] [PubMed] Hopfinger, A. J.; Reaka, A.;
123 Venkatarangan. P.; Duca, J. S.; Wang, S. J.
Tresadern, G.; Bemporad, D.; Howe, T. J.
Chem. Inf. Comp. Sci. 1999, 39, 1151.
Mol. Graph. Model. 2009, 27, 860. [CrossRef]
[CrossRef]
[PubMed]
136
124 Myint, K. Z.; Xie, X-Q. Int. J. Mol. Sci. 2010,
Grant, J. A.; Gallardo, M. A.; Pickup, B. T. J.
Comput. Chem. 1996, 17, 1653. [CrossRef]
137
125 Vedani, A.; Dobler, M.; Lill, M. A. Basic
Nicholls, A.; MacCuish, N. E.; MacCuish, J.
Clin. Pharmacol. Toxicol. 2006, 99, 195.
D. J. Comput. Aided Mol. Des. 2004, 18, 451.
[CrossRef] [PubMed]
[CrossRef] [PubMed]
138
126 Lill, M. A.; Dobler, M.; Vedani, A. Curr.
Hu, L.; Chen, GH.; Chau, R. M-W. J. Mol.
Comput. Aided Drug. Des. 2005, 1, 307.
Graph. Model. 2006, 24, 244. [CrossRef]
[CrossRef]
[PubMed]
139
127 Polanski, J. Curr. Med. Chem. 2009, 16,
Han, L. Y.; Ma, X. H.; Lin, H. H.; Jia, J.; Zhu,
F.; Xue, Y.; Li, Z. R.; Cao, Z. W.; Ji, Z. L.; Chen,
140
Y. Z. J. Mol. Graph. Model. 2008, 26, 1276. Melville, J. L.; Burke, E. K; Hirst, J. D.
[CrossRef] [PubMed] Comb. Chem High T. Scr. 2009, 12, 332. [Link]
128 141
Hsieh, J. H.; Wang, X. S.; Teotico, D.; Duch, W.; Swaminathan, K.; Meller, J.
Golbraikh, A.; Tropsha, A. J. Comput. Aided Curr. Pharm. Des. 2007, 13, 1497. [CrossRef]
Mol. Des. 2008, 22, 593. [CrossRef] [PubMed] [PubMed]
129 142
Todeschini, R. Molecular descriptors and Fogel, G. B. Brief Bioinform. 2008, 9, 307.
chemometrics: A powerful combined tool for [CrossRef] [PubMed]
pharmaceutical, toxicological and 143
Li, H.; Yap, C. W.; Ung, C. Y.; Xue, Y.; Li, Z.
environmental problems. Disponvel em
R.; Han, L. Y.; Lin, H. H.; Chen, Y. Z. J. Pharm.
<http://www.iamc-
Sci. 2007, 96, 2838. [CrossRef] [PubMed]
online.org/tutorials/T2_moleculardescriptors
144
_chemom.pdf>. Acesso em: 22 maro de Burton, J.; Ijjaali, I.; Petitet, F.; Michel, A.;
2012. Vercauteren, D. P. Comb. Chem. High T. Scr.
130 2009, 12, 369. [CrossRef] [PubMed]
Cramer, R. D.; Patterson, D. E.; Bunce, J. D.
145
J. Am. Chem. Soc. 1988, 110, 5959. [CrossRef] Liu, P.; Long, W. Int. J. Mol. Sci. 2009, 10,
[PubMed] 1978. [CrossRef] [PubMed]
146
131
Khanfar, M. A.; El Sayed, K. A. Eur. J. Med. Halperin, I.; Ma, B.; Wolfson, H.; Nussinov,
Chem. 2010, 45, 5397. [CrossRef] [PubMed] R. Proteins 2002, 47, 409. [CrossRef]
132 [PubMed]
Klebe, G.; Abraham, U.; Mietzner, T. J.
147
Med. Chem. 1994, 24, 4130. [CrossRef] Krovat, E. M.; Steindl, T.; Langer, T. Curr.
[PubMed] Comput. Aided Drug. Des. 2005, 1, 93.
133 [CrossRef]
Thondorf, I.; Voigt, V.; Schfer, S.;
148
Gebauer, S.; Zebisch, K.; Laug, L.; Brandsch, Khedkar, S. A.; Malde, A. K.; Coutinho, E.
C. Indian J. Pharm. Sci. 2008, 68, 689. [Link]

149
Muegge, I.; Oloff, S. Drug Discov. Today: Schlkopf, B., eds.; MIT Press: Cambridge,
Technol. 2006, 3, 405. [CrossRef] 2000, cap. 1.
150 163
Rao, H.; Yang, G.; Tan, N.; Li, P.; Li, Z.; Li, X. Andreola, R.; Haertel, V.; Anais XIV
QSAR Comb. Sci. 2009, 28, 1346. [CrossRef] Simpsio Brasileiro de Sensoriamento
151 Remoto, Natal, Brasil, 2009.
Habibi-Yangjeh, A. Monatsh. Chem. 2009,
164
140, 523. [CrossRef] Lorena, A. C.; de Carvalho, A. C. P. L. F.,
152 Introduo s Maquinas de Vetores Suporte.
Karelson, M.; Dobchev, D.; Tamm, T.; Tulp,
Disponvel em:
I.; Janes, J.; Tamm, K.; Lomaka, A.;
<http://www.icmc.usp.br/~biblio/BIBLIOTEC
Savechenko, D.; Karelson, G. ARKIVOC 2008,
A/rel_tec/RT_192.pdf>. Acesso em: 22 maro
16, 38. [Link]
2012.
153
Worachartcheewan, A.; Nantasenamat, 165
Lima, A. R. G.; Dissertao de Mestrado,
C.; Naenna, T.; Isarankura-Na-Ayudhya, C.;
Universidade Federal do Cear, Brasil, 2002.
Prachayasittikul, V. Eur. J. Med. Chem. 2009,
[Link]
166
154 Zien, A.; Rtsc, G.; Mika, S.; Schlkopf, B.;
Chamjangali, M. A. Chem. Biol. Drug. Des.
Lengauer, T.; Mller, K-R. Bioinformatics
155
Fernandes, M. B.; Scotti, M. T.; Ferreira, 167
Sung, A. H.; Mukkamala, S.; Proceedings of
M. J. P.; Emerenciano, V. P. Eur. J. Med.
the 2003 International Symposium on
Chem. 2008, 43, 2197. [CrossRef] [PubMed]
Applications and the Internet Technology,
156
Hristozov, D.; Oprea, T. I.; Gasteiger, J. J. Orlando, EUA, 2003.
Chem. Inf. Model. 2007, 47, 2044. [CrossRef] 168
Ding, C. H.; Dubchak, I. Bioinformatics
[PubMed]
157
Kaiser, D.; Terfloth, L.; Kopp, S.; Schulz, J.; 169
Cong, Y.; Yang, X-G.; Lv, W.; Xue Y. J. Mol.
de Laet, R.; Chiba, P.; Ecker, G. F.; Gasteiger,
Graph. Model. 2009, 28, 236. [CrossRef]
J. J. Med. Chem. 2007, 50, 1698. [CrossRef]
[PubMed]
[PubMed]
170
158 Vasanthanathan, P.; Taboureau, O.;
Nascimento, R. F. F; Alcntara, E. H.;
Oostenbrink, C.; Vermeulen, N. P. E.; Olsen,
Kampel, M.; Stech, J. L.; Novo, E. M. L. M.;
L.; Jrgensen, F. S. Drug Metab. Dispos. 2009,
Fonseca, L. M. G; Anais XIV Simpsio
Brasileiro de Sensoriamento Remoto, Natal,
171
Brasil, 2009. Liew, C. Y.; Ma, X. H.; Liu, X.; Yap, C. W. J.
159 Chem. Inf. Model. 2009, 49, 877. [CrossRef]
Vapnik, V. N.; The nature of statistical
[PubMed]
learning theory, 1a. ed., Springer-Verlag: New
172
York, 1995. Mah, P.; Ralaivola, L.; Stoven, V.; Vert, J.
160 P. J. Chem. Inf. Model. 2006, 46, 2003.
Cristianini, N.; Shawe-Taylor, J.; An
[CrossRef] [PubMed]
Introduction To Support Vector Machines
173
(and other kernel-based learning methods), Yang, X. G.; Lv, W.; Chen, Y. Z.; Xue, Y. J.
1a. ed., Cambridge University Press, 2000. Comput. Chem 2010, 31, 1249. [CrossRef]
161 [PubMed]
Gonalves, A. R., Mquina de Vetores
174
Suporte. Acesso em 21 de maro de 2012. Mballo, C.; Makarenkov, V. Comb. Chem.
[Link] High. T. Scr. 2010, 13, 430. [PubMed]
162 175
Smola, A. J.; Bartlett, P.; Schuurmans, C. Agarwal, S.; Dugar, D.; Sengupta, S. J.
Introduction to large margin classifiers; Chem. Inf. Model. 2010, 50, 716. [CrossRef]
Scholkopf, B.; Schuurmans, D.; Smola, A. J.; [PubMed]

176 183
Nasonov, A. F. Russ. J. Gen. Chem. 2010, Jensen, B. F.; Vind, C.; Padkjar, S. B.;
80, 2541. [CrossRef] Brockhoff, P. B.; Refsgaard, H. H. F. J. Med.
177 Chem. 2007, 50, 501. [CrossRef] [PubMed]
Liu, X. H.; Song, H. Y.; Zhang, J. X.; Han, B.
184
C.; Wei, X. N.; Ma, X. H.; Cui, W. K.; Chen, Y. Z. Cedeo, W.; Agrafiotis, D. K. J. Comput.
Molecular Informatics 2010, 29, 407. Aided Mol. Des. 2003, 17, 255. [CrossRef]
[CrossRef] [PubMed]
178 185
Hao, M.; Li, Y.; Wang, Y.; Zhang, S. Anal. Miller, D. W. J. Chem. Inf. Comput. Sci.
Chim. Acta. 2011, 690, 53. [CrossRef] 2001, 41, 68. [CrossRef] [PubMed]
[PubMed] 186
Shen, M.; Bguin, C.; Golbraikh, A.;
179
Kinnings, S. L.; Liu, N.; Tonge, P. J.; Stables, J. P.; Kohn, H.; Tropsha, A. J. Med.
Jackson, R. M.; Xie, L.; Bourne, P. E. J. Chem. Chem. 2004, 47, 2356. [CrossRef] [PubMed]
Inf. Model. 2011, 51, 408. [CrossRef] 187
Oloff, S.; Zhang, S.; Sukumar, N.;
[PubMed]
Breneman, C.; Tropsha, A. J. Chem. Inf.
180
Rajwade, R.; Pande, R.; Mishra, K. P.; Model. 2006, 46, 844. [CrossRef] [PubMed]
Kumar, A.; Pandey, B. N. QSAR Comb. Sci. 188
Zhang, S. X; Golbraikh, A.; Tropsha, A. J.
2009, 28, 1500. [CrossRef]
181
Du-Cuny, L.; Song, Z.; Moses, S.; Powis, G.; [PubMed]
Mash, E. A.; Meuillet, E. J.; Zhang S. Bioorg. 189
Wang, X. S.; Tang, H.; Golbraikh, A.;
Tropsha, A. J. Chem. Inf. Model. 2008, 48,
[PubMed]
182
Peterson, Y. K.; Wang, X. S.; Casey, P. J.; 190
Gunturi, S.; Archana, K.; Khandelwal, A.;
Tropsha, A. J. Med. Chem. 2009, 52, 4210.
Narayanan, R. QSAR Comb. Sci. 2008, 27,
[CrossRef] [PubMed]
1305. [CrossRef]

Art I Go Triage M Virtual

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Art I Go Triage M Virtual

Diunggah oleh

Hak Cipta:

Format Tersedia

Artigo

Estratgias de Triagem Virtual no Planejamento de Frmacos

Virtual Screening Strategies in Drug Design

* Pontifcia Universidade Catlica de Gois, Departamento de Biomedicina, Rua 232, n 128,

Rev. Virtual Quim. |Vol 4| |No. 6| |739-776| 739

Revista Virtual de Qumica

Estratgias de Triagem Virtual no Planejamento de Frmacos

Recebido em 21 de julho de 2012. Aceito para publicao em 12 de dezembro de 2012

1. Introduo diversos processos fisiopatolgicos que

740 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

identificao e otimizao de novos na busca e descoberta de compostos de

Rev. Virtual Quim. |Vol 4| |No. 6| |739-776| 741

estruturais acerca do alvo teraputico de Tcnicas como Qumica Combinatria

Figura 1. Esquema representando as otimizaes nas triagens para a pesquisa

742 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

2. Bibliotecas Virtuais qumicos uma estratgia usual na reduo

Rev. Virtual Quim. |Vol 4| |No. 6| |739-776| 743

As tcnicas de docagem, desenvolvidas para algoritmos desenvolvidos para programas de

Figura 2. Reproduo do modo de ligao experimental (orientao cristalogrfica) da

V ios p og a as de do age ue caractersticas qumicas e estruturais

744 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

molecular atravs da complementaridade que seria empregada em uma busca flexvel

Rev. Virtual Quim. |Vol 4| |No. 6| |739-776| 745

Tabela 1. Principais algoritmos utilizados nas estratgias de docagem

Os algoritmos genticos, tambm modificaes na posio do ligante no sitio

746 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

corresponde a um ngulo de toro (Figura 3B).25

Figura 3. A) Exemplo de mutaes e recombinao em sequencias binrias de 8 bits de

Os algoritmos sistemticos exploram os dos novos fragmentos adicionados ser

Rev. Virtual Quim. |Vol 4| |No. 6| |739-776| 747

exaustivamente as possveis conformaes de docagem protena-ligante. Isto ocorre

748 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

As principais funes de escore tamanho da base de compostos a ser

Rev. Virtual Quim. |Vol 4| |No. 6| |739-776| 749

obteno de resultados confiveis em ao seu stio receptor.88 Normalmente, apenas

750 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

4. Triagem Virtual Baseada em similaridade ao quimiotipo da(s) molcula(s)

Rev. Virtual Quim. |Vol 4| |No. 6| |739-776| 751

752 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

Rev. Virtual Quim. |Vol 4| |No. 6| |739-776| 753

O conjunto de caractersticas qumicas obtida e utilizada para relacionar cada

Kubinyi, H. (2002)112, em seu trabalho testes biolgicos. Assim, se o princpio de

Tabela 2. Expresso de alguns coeficientes de similaridade

1. Coeficiente de combinao simples

Rev. Virtual Quim. |Vol 4| |No. 6| |739-776| 755

Para as medidas de similaridade, particular atravs de suas caractersticas

Figura 5. Na representao binria, o n 1 representa uma caracterstica presente, e o n 0

O coeficiente de Tanimoto, por exemplo, do valor de 1, mais similar a molcula

756 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

est utu ais i as fi ge p i ts 2D , as similaridade intermolecular, entre eles est a

Figura 6. Comparao da similaridade molecular entre a molcula-alvo e outras estruturas

Embora a triagem por similaridade fragmentos que crescem radialmente a partir

para melhorar o desempenho de sistemas colaboradores123 fizeram uma comparao de

758 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

utilizados para um estudo de similaridade ou Um descritor molecular uma

Tabela 3. Classificao dos descritores de acordo com a representao molecular114

2D ndice de Zagreb, ndice de Wiener,

3D Descritor 3D-MoRSE, descritores WHIM,

3D Potencial eletrosttico, potencial de

A rea de atuao de descritores entre estrutura e atividade biolgica, do

artificiais, so mtodos utilizados na refletem apenas a composio em carter

760 Rev. Virtual Quim. |Vol 4| |No. 6| |739-776|

so os mtodos de anlise comparativa de ativa dos compostos foi alinhada de maneira