Anda di halaman 1dari 103

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

PROGRAMA DE PS GRADUAO EM CINCIAS FARMACUTICAS


DESENVOLVIMENTO E AVALIAO DE MEDICAMENTOS

PROSPECO IN SILICO DE COMPOSTOS


BIOATIVOS CONTRA MALRIA UTILIZANDO
MODELOS DE PREVISO DE ATIVIDADE BIOLGICA

NATAL - RN
2016

CAROLINA ARRUDA BRAZ

PROSPECO IN SILICO DE COMPOSTOS


BIOATIVOS CONTRA MALRIA UTILIZANDO
MODELOS DE PREVISO DE ATIVIDADE BIOLGICA.

Dissertao apresentada ao Programa de


Ps Graduao em Cincias Farmacuticas
da Universidade Federal do Rio Grande do
Norte, como requisito para obteno do ttulo
de mestre em Cincias Farmacuticas.
rea de Concentrao: Desenvolvimento e
avaliao de Medicamentos
Orientador: Prof. Dr. Euzbio Guimares
Barbosa

NATAL RN
2016

CAROLINA ARRUDA BRAZ

PROSPECO IN SILICO DE COMPOSTOS


BIOATIVOS CONTRA MALRIA UTILIZANDO
MODELOS DE PREVISO DE ATIVIDADE BIOLGICA

Dissertao apresentada ao Programa de


Ps Graduao em Cincias Farmacuticas
da Universidade Federal do Rio Grande do
Norte, como requisito para obteno do ttulo
de mestre em Cincias Farmacuticas, pela
Banca examinadora, formada por:

Data de aprovao:
___/___/___

Presidente Prof. Dr. Euzbio Guimares Barbosa.

Menbro: Prof. Dr. Norberto de Kassio Vieira Monteiro.

Menbro: Prof. Dr. Davi Serradella Vieira.

Agradecimentos

Primeiramente ao meu orientador, o professor Euzbio pelas oportunidades


oferecidas durante o mestrado. Pelos conselhos, parceria e exemplos de postura de
pesquisador. Por transferir tanta calma e segurana que o mestrado passou
tranquilo. Que essa parceria possa perdurar por projetos futuros. E pela indicao de
jogos.

Aos meus colegas de laboratrio, em especial ao Edjan, pelas ajudas mtuas nos
nossos respectivos projetos.

A toda equipe do Programa de Ps Graduao em Cincias Farmacuticas.

A Sarah e Izadora, minhas amigas, conterrneas de estgio e Mestrado. Pelas


angstias e aperreios compartilhados nessa vida acadmica.

minha famlia, Cristina, in memoriam Alberto e Max, por me acompanhar e


acreditar nessa jornada. Ao meus primos, em especial a Laura, por tantas vezes
negar essa viagem para Jeriquaquara.

Ao meu querido companheiro Magnus, pela companhia, por se estressar junto


comigo durante o processo de escrituras e me convencer sempre que eu consigo
entregar os documentos nos prazos.

E aos meus amigos por me aguentarem usar o diploma de cientista pra ganhar
discusses.

PIGRAFE

The nitrogen in our DNA, the calcium in our teeth, the iron in our blood, the carbon in our
apple pies were made in the interiors of collapsing stars
. We are made of starstuff.
Carl Sagan.

LISTA DE FIGURAS

Figura 1

Nmero de casos confirmados de malria mundialmente em 2014.

Figura 2

Casos confirmados de malria no Brasil em 2014

Figura 3

Ciclo de vida do Plasmodium no homem e mosquito.

Figura 4

Rota geral do metabolismo da hemoglobina no P. falciparum

Figura 5

Principais frmacos utilizados no tratamento da malaria

Figura 6

Representao de uma caixa cbica utilizada para calcular descritores


MIF. A sonda utilizada para calcular as energias de interao est no
canto superior esquerdo.

Figura 7

Funcionamento esquemtico do OPS.

Figura 8

Exemplo de exibio espacial de descritores para a metodologia LQTA


e CoMFA. a) Representao descritores LJ e QQ em esferas. b) Mapas
de contorno obtidos por CoMFA

Figura 9

Mecanismo da quebra da ligao peptdica feita pelas proteases


asprticas.

Figura 10

Estrutura cristalogrfica da Plasmepsina.II.

Figura 11

Inibidores peptidiomimticos das plasmepsinas.

Figura 12

Pepstatina A e alofenilnorstatina.

Figura 13

Estrutura cristalina da Plasmepsina II (4CKU).

Figura 14

Etapas dos filtros virtuais .

Figura 15

Farmacforo caracterstico da srie de compostos utilizada na


construo do modelo LQTA-QSAR. Anel de cinco membros tiazolidina
e os locais de possveis substituies (R1, R2, R3 e R4)

Figura 16

Dendograma referente anlise de grupamentos hierrquicos para o


conjunto de dados (a numerao dos compostos no corresponde a
numerao referente a tabela).

Figura 17

Alinhamento das melhores conformaes obtidas pelo processo de


docagem automatizado.

Figura 18

Sitio ativo da Plm II com o Composto 33 (roxo) e ligante natural do cristal


(azul).

Figura 19

Composto 33 aps adaptao do stio ativo.

Figura 20

Melhor alinhamento aps a adaptao do sitio ativo.

Figura 21

Resultado do filtro virtual referente ao tratamento dos descritores de LJ.

Figura 22

Resultados dos testes de validao LNO e y-randomization e a qualidade


de previso do modelo.

Figura 23

Visualizao dos descritores no sitio ativo da protena.

Figura 24

Representao grfica dos descritores do modelo final. Vises com os


compostos 33 (a) e 25 (b).

Figura 25

Composto 39 (pKi: 9,6), mais potente, em cinza e 27 (pki: 4,89) em


laranja.

Figura 26

Orientao do anel tiazolidina. Composto 33 (pki: 7,69) e 30 (pki: 5,03).

Figura 27

Mapas de contorno obtidos por Muthas (MUTHAS et al., 2005). A regio


S1 est assinalada pelo mapa verde, que representa regio estrica
favorvel para presena de grupos volumosos.

Figura 28

Composto 39 (azul) com pKi: 9,7 e 25 (verde), pKi: 4,02. Em roxo os


resduos de aminocidos prximos aos descritores.

Figura 29

Composto 30 (verde) e 7 (vermelho) representando o pior e melhor perfil


para descritor QQ7.

Figura 30

A) Descritor QQ4 relacionado com substituintes alifticos e cclicos.


Compostos mais potente, 33 (roxo) com pKi de 7,69 e menos potente,
25 (azul) com pki de 4,01 foram usados como exemplo. B) Contribuio
de interaes eletronegativas negativas. Composto 9 em azul de pK i:
9,31 e 18, marrom de pKi: 6,14.

Figura 31

Esquema de interao das alofenilnorstatinas de acordo com o modelo


LQTA. Em vermelho, as regies do sitio ativo da Plm II que cada poro
do inibidor interage.

LISTA DE TABELAS
Tabela 1.

Candidatos a frmacos em estudos clnicos durante o ano de 2014

Tabela 2.

Parmetros estatsticos bsicos para modelos de regresso

Tabela 3.

Lista dos principais resduos de aminocidos e suas regies respectivas


no sitio ativo da Plm II

Tabela 4.

Conjunto de dados retirados da literatura

Tabela 5

Nmeros de descritores iniciais e aps casa processo de filtragem


virtual.

Tabela 6.

Figuras de mrito para o modelo final obtido.

RESUMO

Estratgias de planejamento de frmacos auxiliadas por computador utiliza-se


de tcnicas computacionais para auxiliar o descobrimento de novos frmacos.
Economizando custos e agilizando o processo de pesquisa e desenvolvimento, alm
de poder processar uma quantidade grande de dados. A utilizao da tcnica do
LQTA-QSAR permite a criao de modelos de previso de atividade biolgica capazes
de sugerir estruturas inditas sem a real necessidade de execuo de teste de
atividade biolgica in vitro ou in vivo. A malria uma doena causada pelo parasito
do gnero Plasmodium e afeta principalmente as regies da frica e Amrica Latina.
Estima-se que em 2014 ocorreram 214 milhes de caso de malria e 438 mil de
mortes de acordo com a Organizao Mundial de Sade. A enzima Plasmepsina II
responsvel pela clivagem inicial da hemoglobina e um alvo validado para o
planejamento de novos agentes antimalricos. O objetivo geral desse trabalho foi
desenvolver um modelo de previso de atividade biolgica baseado na relao
estrutura atividade de compostos inibidores da Plasmepsina II que possuem um
ncleo derivado de alofenilnostatinas. Foi criado um modelo de previso com 37
amostras. O modelo PLS apresentou um Q = 0,92 e R = 0,95 com 10 variveis e 2
variveis latentes. O modelo apresentou bons parmetros estatsticos e boa
capacidade preditiva (Q ext = 0,79) Os descritores tambm esto corroboram com a
interao dos inibidores com stio receptor da Plm II. Os dados obtidos servem como
guia para o planejamento de novos antimalricos com maior potncia.

ABSTRACT

Strategies for drug design aided by computer uses of computational techniques


for guidance on the discovery of new drugs. Saving costs and speeding the process of
research and development, besides it being able to process a big volume data. The
utilization of LQTA-QSAR allows the creation of predicting models of biological activity
able to propose novel compounds without the real necessity of in vitro biological activity
essays. Malaria is a disease caused by the parasite from genre Plasmodium and
affects mainly the Africa and Latin America regions. It is estimated that in 2014 it
happened 214 million cases of malaria and 438 thousand cases of death according to
World Health Organization. Plasmepsin II is responsible for the metabolism of
hemoglobin and it is a valid target for the development of new antimalarial agents. The
general objective of this work is to develop a predictive model of biological activity
based on the structure of Plasmepsin II inhibitors derivate from allophenylnorstatine.
A model was built with 37 samples, Q = 0.92 and R = 0.95 with 10 variables and 2
latent variables. The model present good statistical parameters and good predicting
ability (Qext=0.79). The descriptors could be well correlated to ligand-Plm II
interactions. The data obtained serves as guides to the design of new optimized
antimalarial agents.

SUMRIO
1.

INTRODUO .........................................................................................................................................13
1.1

MALRIA................................................................................................................................................. 13

1.1.1

Aspectos Epidemiolgicos. ............................................................................................................... 13

1.1.2

Ciclo evolutivo .................................................................................................................................. 16

1.1.2.1

1.1.3

Tratamento / Quimioterapia e Resistncia. ..................................................................................... 19

1.1.4

Resistncia ....................................................................................................................................... 22

1.2

DESCOBERTA DE FRMACOS........................................................................................................................ 23

1.2.1

Ferramentas computacionais para o desenvolvimento de frmaco................................................ 24

1.2.2

QSAR-4D .......................................................................................................................................... 25

1.2.3

Descritores moleculares de interao. ............................................................................................. 28

1.2.4

Validao dos modelos de LQTA-QSAR ............................................................................................ 29

1.3

APLICAO DO LQTA-QSAR PARA ALVOS E INIBIDORES DE PROTENA DE P. FALCIPARUM ....................................... 31

1.3.1

Plasmepsina II do Plasmodium falciparum. ..................................................................................... 31

1.3.2

Inibidores da Plasmepsina II : alofenilnorstatinas. .......................................................................... 34

OBJETIVOS ..............................................................................................................................................37
2.1

OBJETIVOS ESPECFICOS .............................................................................................................................. 37

MATERIAL E MTODOS ...........................................................................................................................38


3.1

MATERIAL ............................................................................................................................................... 38

3.1.1

Computadores. ................................................................................................................................ 38

3.1.2

Conjunto de dados ........................................................................................................................... 38

3.1.3

Receptor........................................................................................................................................... 38

3.2

METODOLOGIA......................................................................................................................................... 39

3.2.1

Padronizao do conjunto de dados e preparo das estruturas tridimensionais. ............................. 39

3.2.2

Adaptao do stio ativo .................................................................................................................. 40

3.2.3

Dinmica molecular ......................................................................................................................... 41

3.2.4

Gerao do modelo 4D LQTA-QSAR................................................................................................. 41

3.2.4.1

Filtros virtuais ..........................................................................................................................................42

3.2.4.2

Seleo de variveis ................................................................................................................................43

3.2.5

Validao do modelo ....................................................................................................................... 43

3.2.5.1

Degradao da hemoglobina. .................................................................................................................18

Leave-N-out e y-randomization...............................................................................................................43

RESULTADOS E DISCUSSES. ..................................................................................................................45


4.1

CARACTERIZAO DO CONJUNTO DE DADOS. .................................................................................................. 45

4.2

DIVISO DO CONJUNTO DE DADOS PARA A CONSTRUO DO MODELO LQTA-QSAR .............................................. 51

4.3

ADAPTAO DO STIO ATIVO........................................................................................................................ 51

4.4

4D LQTA-QSAR ..................................................................................................................................... 55

4.5

INTERPRETAO DOS DESCRITORES. .............................................................................................................. 58

CONCLUSES E PERSPECTIVAS. ..............................................................................................................68

REFERNCIAS ..........................................................................................................................................69

ANEXOS ..................................................................................................................................................76
7.1

ANEXO 1. SCRIPT PARA TRATAR A MATRIZ DE DESCRITORES DO OPEN3DQSAR ..................................................... 76

7.2

ANEXO 2. SCRIPT REALIZADO PARA A REALIZAO DOS FILTROS VIRTUAIS NO MATLAB. ........................................... 76

7.3

ANEXO 3. TABELA COM A REGRESSO PLS PARA O MELHOR MODELO 4D LQTA-QSAR ......................................... 78

7.4

ANEXO 4. ARQUIVO PDB DAS COORDENADAS DOS DESCRITORES. ........................................................................ 80

7.5

ANEXO 5. ARTIGO ..................................................................................................................................... 81

13

1. INTRODUO
1.1 Malria.
Os agentes etiolgicos da malria so protozorios eucariotos unicelulares
pertencentes ao filo Apicomplexa, da famlia Plasmodiidae e ao gnero Plasmodium,
onde as espcies P. falciparum, P. vivax, P. malariae, e P. ovale so conhecidas por
causarem a doena. A malria transmitida pela picada da fmea do mosquito
Anopheles, compartilhamento de agulhas e seringas infectadas, transfuso de
sangue, ou da gestante para o beb antes ou durante o parto. Os principais sinais
clnicos so febre alta, calafrio, sudorese e cefaleia. (MINISTRIO DA SADE, 2010).
Apesar de na maioria dos casos a malria no apresentar um risco vida, sua
manifestao em mulheres grvidas e crianas de extremo perigo. A espcie P.
falciparum a mais virulenta das formas de malria humana e o principal causador
de casos relatados de mortes em crianas, alm de ser a nica capaz de evoluir para
malria cerebral (SNOW; KORENROMP; GOUWS, 2004).
A resistncia crescente terapia atual (WHITE et al., 1999) e enquadramento
da malria como uma doena negligenciada (BRASIL, 2008) denota a importncia na
pesquisa em inovao para o planejamento de novos candidatos as frmacos
antimalricos. De fato, as tcnicas de modelagem molecular vem demonstrando um
papel importante na descoberta de candidatos a frmacos antimalricos (BARMADE
et al., 2015).
O custo de realizao desse tipo de projeto puramente computacional, e por
isso, bastante reduzido e seus resultados podem minimizar despesas desnecessrias
na sntese dos compostos ativos. O uso de altos nveis da teoria quntica molecular
mnimo nesse tipo de estudo, barateando ainda mais o custo computacional por
molcula investigada nos estudos QSAR. Dessa forma, com estaes de trabalho,
embora modestas, gera-se em tempo hbil resultados empricos que podem ser
utilizados diretamente na triagem de novos compostos bem como na proposio de
estruturas qumicas com possvel atividade in vitro e in vivo.

1.1.1 Aspectos Epidemiolgicos.


De acordo com a OMS (Organizao Mundial da Sade) a malria uma doena
que pe em risco cerca de 3,2 bilhes de pessoas quase metade da populao
mundial. Estima-se que em 2015 ocorreram 214 milhes de casos de malria e 438

14

mil mortes. Felizmente, este um nmero decrescente, nos ltimos 15 anos a


incidncia de casos de malria diminuiu 37% mundialmente. Os casos de morte,
tambm no mesmo perodo, diminuram 60% em todas as idades. A frica continua
sendo a regio de maior incidncia, com 89% dos casos mundiais (Figura 1). Apesar
da maioria dos casos se concentrarem na frica, tambm h grande incidncia de
casos de malria na sia, Amrica Latina e parte do Oriente Mdio (DALRYMPLE;
MAPPIN; GETHING, 2015; WHO, 2015).

Figura 1. Nmero de casos confirmados de malria em 2014.

Fonte: Global Malaria Mapper (Disponvel em: < http://www.worldmalariareport.org>).

Para regio da Amrica Latina a quantidade de casos confirmados de malria


diminuiu de 1,2 milhes de casos no ano de 2000 para 390 mil casos em 2014. Ainda
no ano de 2014, foi reportado somente 79 casos de morte por malria, uma diminuio
de 80% dos casos quando comparados com os ltimos 14 anos. O Brasil contabiliza
quase metade dos casos de mortes na regio (WHO, 2015).
A malria transmitida atravs da picada de fmeas do mosquito Anopheles spp.
Existem cerca de 400 espcies de Anopheles no mundo, onde somente 60 so
possveis vetores da malria e destes, 30 de maior importncia epidemiolgica. Nas

15

Amricas, ocorrem principalmente as espcies Anopheles darlingi, Anopheles


aquasalis, Anopheles albimanus e Anopheles pseudopunctipennis. No Brasil, o
principal vetor o A. darlingi (REY, 2011).
No Brasil, 99% dos casos de malria esto restritos Amaznia Legal (Figura
2), totalizando cerca de 310 mil novos casos por ano, quase todos os casos s
causados pelo P. vivax (OLIVEIRA-FERREIRA et al., 2010). Apesar da baixa
incidncia, quando comparada ao continente africano, o quadro endmico nesta
regio representa gastos substanciais para o Sistema nico de Sade (SUS),
chegando a aproximadamente US$ 72 milhes apenas em 2014 (WHO, 2015).
Na Amaznia, a diminuio da incidncia de casos por P. falciparum est
correlacionada a melhoras no diagnstico. provvel tambm que a adio da
associao artermter + lumefantrina terapia no estado de Manaus e outros
municpios tambm contribuiu para a diminuio da incidncia do P. falciparum. O
crescimento do nmero de casos de P.vivax pode ser explicado pela compensao
de comorbidades aguda ou crnica da malria (SAMPAIO et al., 2015).

Figura 2. Casos confirmados de malria no Brasil em 2014.

Fonte: adaptado de (WHO,2015).


Na Amaznia, a diminuio da incidncia de casos por P. falciparum est
correlacionada com melhorias na agilidade do diagnstico. provvel tambm que a
adio do tratamento medicamentoso associao artermter + lumefantrina no estado
de Manaus e outros municpios tambm contribuiu para a diminuio da incidncia do
P. falciparum. O crescimento do nmero de casos de P.vivax pode ser explicado pela
compensao de comorbidades agudas ou crnicas da malria (SAMPAIO et al.,
2015).

16

1.1.2 Ciclo evolutivo


O Plasmodium possui um ciclo biolgico complexo, dividido em trs etapas:
ciclo heptico, ciclo eritrocitrio e ciclo esporocognico. O seu desenvolvimento ocorre
envolvendo um hospedeiro invertebrado (Anopheles) nas fases sexuadas e um
hospedeiro vertebrado no ciclo assexuado. O processo evolutivo do parasita requer a
expresso de protenas, importantes para sua sobrevivncia tanto no hospedeiro
invertebrado como vertebrado. (TUTEJA, 2007). A Figura 3 (prxima pgina)
apresenta as etapas envolvidas no ciclo de vida do Plasmodium spp.
Os esporozotos (forma infectante), localizados nas glndulas salivares do
mosquito Anopheles, so inoculados no hospedeiro vertebrado durante a picada do
mosquito. Estas formas alcanam as clulas hepticas em mdia de 30 a 60 minutos
aps a picada (REY, 2013; TUTEJA, 2007). Antes que ocorra a infeco dos
hepatcitos, h a possibilidade dessas formas entrarem em diferentes clulas, sem
que ocorra o desenvolvimento. Os esporozotos apresentam motilidade graas a
reorientao de protenas de superfcies e de protenas adesivas, que so essenciais
para invaso das clulas hospedeiras (BRAGA; FONTES, 2005; MOTA et al., 2001).
Os esporozotos transformam-se em criptozotos, que so estruturas
arredondadas que crescem e iniciam o ciclo de reproduo assexuada. Aps
numerosas divises nucleares passa a constituir um esquizonte. No P. falciparum, a
fase esquizogonia pr-eritroctica dura 6 dias, enquanto que em P. vivax dura 8 dias.
Essa a primeira fase do ciclo, denominada exoeritroctica, antecedendo o ciclo
sanguneo (REY, 2013).
Em infeces causadas por P. falciparum e P. malariae, os esquizontes se
rompem todos ao mesmo tempo e no persistem no interior dos hepatcitos. J no P.
ovale e no P. vivax, algumas formas exo eritroct icas, denominadas hipnozot as
permanecem latentes no fgado, e parecem ser responsveis pelas recidivas tardias
da doena (BRAGA; FONTES, 2005).
O ciclo eritroctico se inicia quando os esquizontes localizados nas clulas
hepticas do origem aos merozotos, que so liberados aps o rompimento da clula
parasitada. Os merozotos invadem as hemcias iniciando ciclo eritroctico, onde se
desenvolvem e multiplicam por diviso binria at romperem a clula e serem
liberados na corrente sangunea para infectar novamente outras hemcias (REY,
2013). Para o P. falciparum o ciclo sanguneo se repete a cada 48 horas (NEVES,
2005).

17

Figura 3. Ciclo de vida do Plasmodium no homem e mosquito.

Fonte: adaptado de (ERSMARK; SAMUELSSON; HALLBERG, 2006)


Os merozotos podem tambm se diferenciar em estgios sexuados,
gametcitos femininos (macrogametcitos) e masculinos (microgametcitos) que iro
dar incio ao ciclo sexuado (esporognico) no vetor. O inseto, aps se alimentar de
sangue infectado pode ingerir esses gametcitos. Estes gametas se fundem e formam
um zigoto. O zigoto se diferencia em oocineto, que por sua vez migra at o intestino
do inseto e d origem a um oocisto. O oocisto maduro libera estes esporozotos que

18

migram para as glndulas salivares, podendo infectar outros seres humanos.


Retomando assim, o ciclo (DOUGLAS et al., 2015; TUTEJA, 2007).
O perodo de incubao da doena varia de 7 a 14 dias, podendo, contudo,
chegar a vrios meses devido s formas latentes de P. vivax e P. malariae. A crise
aguda caracteriza-se por episdios de febre, calafrios, tosse, dificuldade respiratria,
dor nas articulaes, dor de cabea, diarreia, vmitos e convulses. Os intervalos
entre as febres acompanham os ciclos repetidos de obstruo dos eritrcitos,
repetindo-se a cada 48 horas para infeces por P. vivax e P. falciparum e de 72 horas
para infeces causadas pelos demais parasitos (TUTEJA, 2007).
A gravidade do quadro clnico da malria depende da espcie do parasito, da
quantidade de parasitos circulantes, do tempo de doena e do nvel de imunidade
adquirida pelo paciente. O P. falciparum est sempre associado a quadros graves,
acarretando em complicaes clnicas como ictercia, insuficincia renal, anemia
grave e obstruo dos capilares que levam sangue ao crebro (SNOW;
KORENROMP; GOUWS, 2004; TUTEJA, 2007).

1.1.2.1 Degradao da hemoglobina.


O parasita degrada a hemoglobina (Hb) nas clulas eritrocticas do hospedeiro
durante fases morfolgicas distintas do seu ciclo evolutivo (esquizonte e trofozota). A
atividade metablica varia muito entre as fases e mais intensa durante o estgio
trofozoita (GOLDBERG, 1993). A hemoglobina, uma protena tetramrica com ~64k
Da, metabolizada pelas enzimas do parasito. Esses aminocidos obtidos da
metabolizao so utilizados para biossntese de protenas do prprio Plasmodium.
Ajudando a manter a osmolaridade intracelular durante esta fase de crescimento
intenso (MOURA; DAME; FIDOCK, 2009).
O P.falciparum digere mais de 80% da hemoglobina do eritrcito, para nutrir o
parasito durante sua fase de crescimento e replicao assexuada na fase eritroctica.
(LAZARUS; SCHNEIDER; TARASCHI, 2008). A degradao da hemoglobina ocorre
via proteases dentro do vacolo digestivo do parasita e a sua internalizao ocorre
por meio do citostoma, uma invaginao da membrana externa do vacolo (MILANI;
SCHNEIDER; TARASCHI, 2015). A hematina livre potencialmente txica tanto para
o parasito quanto seu hospedeiro, devido a sua atividade membranotropica. Para
bloquear essa toxicidade o Plasmodium sequestra a hematina na forma do pigmento
malrico cristalizado e insolvel, hemozoina (AZOUZI; EL KIRAT; MORANDAT,

19

2015). Frmacos como cloroquina, se acumulam no vacolo digestivo e interferem


neste processo (SCHOLL; TRIPATHI; SULLIVAN, 2005). As quinolinas agem
interferindo no processo de transformao da hematina (GOLDBERG, 1993).
O processo de degradao apresenta uma cascata ordenada de reaes
(Figura 4). Vrias enzimas so atribudas ao processo de degradao, no P. falciparm
so as proteases asprticas (Plasmepsinas (Plm) I, II, IV e HAP), falcipainas,
metaloproteases (falcilisina) e dipeptil aminopeptidases (DPAP 1). A clivagem inicial
se d nos resduos Phe33 e Leu34 na cadeia A da hemoglobina, regio do domnio
responsvel por manter a estabilidade da estrutura quaternria. A clivagem
subsequente da Hb em peptdeos menores realizada pelas proteases plasmepsinas
e falcipainas. Esses peptdeos menores so ento clivados pela falcilisina, DPAP 1 e
aminopeptidases formando os aminocidos que so aproveitados pelo Plasmodium.
(ERSMARK; SAMUELSSON; HALLBERG, 2006).

Figura 4. Rota geral do metabolismo da hemoglobina no P. falciparum.

Fonte: adaptado de (ERSMARK, 2006).


1.1.3 Tratamento / Quimioterapia e Resistncia.
O tratamento da malria deve tanto prevenir a ocorrncia de casos graves
quanto eliminar fontes de infeco para os mosquitos. Tratamento e diagnstico
adequado tem grande contribuio para reduo e erradicao da doena, mas

20

enfrentam grandes dificuldades frente a no existncia de uma nica terapia eficaz


contra as quatro espcies parasitrias que infectam o ser humano. Alm da crescente
resistncia do P. falciparum aos esquemas teraputicos utilizados (BRASIL, 2010).
A conduta teraputica na utilizao dos frmacos antimalricos deve levar em
considerao a tolerabilidade, segurana e tratamento com regimes de curta durao.
Atualmente se preconiza o uso de associaes entre antimalricos com mecanismos
de ao distintos, tornando o tratamento mais efetivo e evitando a expanso dos casos
de resistncia (GINER ALMARAZ et al., 2010; PETERSEN; EASTMAN; LANZER,
2011).
Os frmacos antimalricos so compostos naturais ou sintticos. Os
antimalricos eritrocticos atuam nas formas presentes nas clulas sanguneas do
homem enquanto que os antimalricos gametocticos atuam nas formas sexuadas do
parasita no individuo, com o intuito de evitar a disseminao da doena caso o
indivduo seja picado (GRIMBERG; MEHLOTRA, 2011). Grande parte dos frmacos
utilizados na rotina como antimalricos so denominados esquizonticidas sanguneos,
porque apresentam ao sobre os estgios assexuados sanguneos do parasita
responsveis pelas manifestaes clnicas (BIAMONTE; WANNER; LE ROCH, 2013;
PRAZERES et al., 2007).
Os medicamentos antimalricos podem ser classificados de acordo com seu
grupo qumico (Figura 5) : 4-aminoquinolinas (cloroquina e amodiaquina), arilaminolcoois (quinina, mefloquina, halofantrina e lumefantrina), 8-aminoquinolinas
(primaquina), perxido de lactona sesquiterpnica (derivados da artemisinina),
naftoquinonas

(atovaquona)

os

antibiticos

(tetraciclina,

doxiciclina

clindamicina)(BRASIL, 2010). A primeira terapia amplamente utilizada para as quatro


espcies do parasita que causam a malria foi a quinina e seus derivados sintticos,
desde o sculo XVII. Na segunda metade do sculo XX, a cloroquinolona foi utilizada
como medicamento de primeira linha para o tratamento das quatro espcies de
Plasmodium e uma combinao de sulfadoxina e pirimetamina como tratamento de
segunda escolha (WELLS; ALONSO; GUTTERIDGE, 2009).
No Brasil, o esquema teraputico para casos no complicados de malria so
realizado com cloroquina e primaquina, para infeces pelo P. falciparum usa-se a
combinao de artemeter+lumefantrina e artesunato+mefloquina e o tratamento de
segunda escolha realizado com quinina, doxiclina e primaquina (BRASIL, 2010).
Comumente, a terapia da malria utilizada em associao com outros

21

quimioterpicos,

como

sulfonamidas

(sulfadoxina),

tetraciclinas

(tetraciclina,

doxicilina) e lincosaminas (clindamicina e lincomicina), mas o seu uso apresenta


inconvenientes como administrao de regimes complexos e rgidos e muitos efeitos
colaterais. O que contribui para interrupo do tratamento e o consequente
desenvolvimento de resistncia do parasita (PIMENTEL et al., 2007).
Figura 5. Principais frmacos utilizados no tratamento da malria

22

Fonte: elaborado pelo autor


O aparecimento de cepas multirresistentes aos frmacos antimalricos
disponveis tem impulsionado a pesquisa de novos frmacos. A Tabela 1 ilustra os
principais candidatos a frmacos em fase clnica de desenvolvimento no ano de 2014.
possvel observar que a maioria dos candidatos so novas associaes de
medicamentos, ou mudana de formulao, ou adequao de doses para pacientes
peditricos (MMV, 2014) ou reproposio de outras terapias (KUNDU et al., 2015).O
que no sana a real necessidade apontada pelo surgimento de cepas resistentes a
maioria das terapias atuais, que o planejamento e desenvolvimento de novas
molculas.

Tabela 1. Candidatos a frmacos em estudos clnicos durante o ano de 2014.


Fase I
Fase II
Fase III
Fase IV
Registro
DSM

265 OZ439/PQ

(Takeda)
MMV

(Sanofi)
048 Ferroquina

(UCT/TIA)

Tafenoquina

Artesunato

Artesunato

(GSK)

retal

injetvel (Guilin)

co-

Pironaridina/Ar

ACT (Sigma

(Sanofi

trimoxazol( in tesunato

Aventis )

stituto

peditrico

Medicina

(Shin Poong)

Tau)

Tropical)
P218 (Novatis )

KAE609

ASAQ

(Sanofi

( Novartis )

Aventis/DNDi)

GSK030

KAF156

Pironaridina/Art

(GSK)

( Novartis)

esunato
(Shin Poong)

Fonte: adaptado de (MMV, 2014).


1.1.4 Resistncia
A partir da dcada de 90 estudos j apontavam para a resistncia global
mltiplos frmacos pelo P.falciparum nos casos agudos de malria (WHITE et al.,
1999). Terapias combinadas a base de artemisinina so utilizadas atualmente nos
programas de controle globais em resposta a resistncia do P .falciparum (MAZIER;
RNIA; SNOUNOU, 2009). A descoberta de parasitas com diminuio da

23

sensibilidade a artemisinina (WELLS, 2010), os efeitos colaterais da atual terapia


medicamentosa e a ausncia de vacinas efetivas (HOFFMAN et al., 2015; LONGLEY;
HILL; SPENCER, 2015; RICHIE; SAUL, 2002) denotam a necessidade da busca por
novos alvos teraputicos e do desenvolvimento de uma nova gerao de frmacos
para o tratamento, controle e erradicao da malria (WELLS; VAN HUIJSDUIJNEN;
VAN VOORHIS, 2015).
O principal mecanismo de resistncia cloroquina est relacionado com
mutaes no gene Plasmodium falciparum cloroquine resistance transporter (PFCRT),
que permite alteraes nos transportadores de membrana. Polimorfismo no gene
Plasmodium falciparum multidrug resistance I (PFMDRI) esto relacionados a
resistncia a quinina e mefloquina. Mutaes no gene Citocromo b conferem
resistncia a atovaquona, que acarretam em mutaes no sitio ativo da enzima alvo,
diminuindo a afinidade de ligao do frmaco (ARAV-BOGER; SHAPIRO, 2005) .
Mutaes nos genes das enzimas diidrofolato redutase (DHFR) e diidropteroato
sintetase (DHPS) esto associados a resistncia a pirimetamina e sulfadoxina,
respectivamente, para o P.falciparum (BASCO; RINGWALD, 1998). A resistncia a
artemisinina est relacionada a uma maior expresso do gene PFMDR I (AFONSO et
al., 2006) e a resistncia ao artesunato est relacionada a uma mutao no gene da
ubiquitina (HUNT et al., 2007).

1.2 Descoberta de Frmacos.


A descoberta e o desenvolvimento de frmacos pode ser dividida em trs fases.
A fase de descoberta, na qual ocorre a identificao e validao do alvo,
desenvolvimento de ensaios, identificao e otimizao de compostos prottipos e
seleo de candidatos a frmacos. Fase de estudos pr-clnicos, onde so
executados estudos extensos em animais. Fase de desenvolvimento clnico: durante
a qual o composto selecionado testado quanto eficcia, efeitos colaterais e riscos
potenciais em humanos (NWAKA; RIDLEY, 2003). O processo de pesquisa e
desenvolvimento de frmacos, ento, consiste e uma etapa de descoberta (pesquisa)
e desenvolvimento (ensaios pr-clnicos e clnicos) (ELEBRING; GILL; PLOWRIGHT,
2012).

24

1.2.1 Ferramentas computacionais para o desenvolvimento de frmaco.


O planejamento de novos candidatos a agentes teraputicos e otimizao
destes pode ser obtido por diferentes estratgias da Qumica Medicinal. A escolha da
estratgia a ser adotada depende da elucidao da estrutura do alvo (BARREIRO,
2009). A utilizao de mtodos computacionais no processo de pesquisa e
desenvolvimento de novos frmacos uma rea de destaque nos ltimos anos. O
conhecimento das estruturas de alvos macromoleculares ou de complexos ligantereceptor permite a aplicao de estratgias de planejamento de frmacos baseado na
estrutura (SBDD - Structure-based Drug Design) (COHEN, 1996).
Pela explorao de bancos de dados que compilam informaes sobre testes
biolgicos em alvos proteicos podem ser construdos modelos de previso da
atividade biolgica a partir da relao quantitativa da atividade destes compostos com
a sua estrutura (QSAR Quantitative Structure-Activity Relationship) (VERMA;
KHEDKAR; COUTINHO, 2010). A metodologia de QSAR foi inicialmente estabelecida
na dcada de 1960, pelos trabalhos de Hansch e Fujita (HANSCH; FUJITA, 1964). O
QSAR desempenha um papel vital no design de novos frmacos, j que se trata de
uma metodologia que permite um custo baixo, processamento rpido e diminuio da
quantidade de amostras in vitro geralmente envolvidas (PATEL et al., 2014).
O objetivo do estudo QSAR a criao de modelos capazes de prever a
atividade ou propriedade e explicar as relaes entre caractersticas estruturais
especficas (descritores moleculares) e atividade biolgica ou propriedade. Mtodos
estes que j se tornaram uma parte essencial do desenvolvimento de novas molculas
na atualidade. Atualmente, nenhum frmaco criado sem a anlise por QSAR
(ANDRADE et al., 2010).
Mtodos de QSAR so classificados de acordo com a dimensionalidade dos
descritores

utilizados,

estabelecendo

quantitativamente

correlao

entre

propriedades da estrutura qumica das molculas e a atividade biolgica. Assim, so


desenvolvidos modelos matemticos capazes de prever a atividade biolgica de
molculas, atravs de um conjunto de dados (HANSCH; FUJITA, 1964).
Diferentes tipos de descritores qumicos refletem diferentes nveis de
representao estrutural. Esses descritores podem ser classificados quanto sua
dimensionalidade: unidimensionais (1D), baseados em propriedades fsico-qumicas
e da frmula molecular (ex., massa molecular, refratividade molar, logP, entre outros);

25

bidimensionais (2D), que descrevem propriedades que podem ser calculadas de uma
representao 2D (ex., nmero de tomos, nmero de ligaes, ndices de
conectividade, entre outros); e tridimensionais (3D), que dependem da conformao
das molculas (ex., volume de Van der Waals, rea de superfcie acessvel ao
solvente, entre outros) (XUE; BAJORATH, 2000).

1.2.2 QSAR-4D
A anlise de QSAR-4D, proposta inicialmente por Hopfinger e colaboradores
(HOPFINGER et al., 1997) incorpora a liberdade conformacional com o alinhamento
para o desenvolvimento de modelos QSAR-3D levando em conta, ento uma quarta
dimenso para os descritores moleculares. Nessa abordagem, os valores dos
descritores so as ocupaes medidas para os tomos que compe as molculas do
conjunto investigado a partir da amostragem de conformao e do espao de
alinhamento (ANDRADE et al., 2010).
Uma nova abordagem de QSAR-4D, desenvolvida pelo grupo Laboratrio de
Quimiometria Terica e Aplicada (LQTA Unicamp) baseado na gerao de um
perfil de amostragem conformacional para cada composto. Ao invs de somente uma
conformao seguindo os princpios do QSAR-3D (KUBINYI, 1997). Esse perfil
conformacional seguido para os clculos de descritores 3D (MIFF - Molecular
Interaction Fields ou descritores de interao molecular).
Essa metodologia contempla simultaneamente, as principais caractersticas do
mtodo CoMFA (Comparative Molecular Field Analisys). Tcnica desenvolvida por
Cramer que demonstra que a propriedade biolgica dos compostos pode ser
correlacionada com as energias estricas e eletrosttica (descritores MIF)
provenientes das interaes formadas com o ligante no stio ativo do alvo biolgico
(CRAMER; PATTERSON; BUNCE, 1988) e o QSAR-4D (HOPFINGER et al., 1997).
Essas metodologias de QSAR-3D e 4D apresentam alguns problemas. No
QSAR-3D realizado pelo CoMFA, o fato da conformao bioativa no ser conhecida
acarreta ao usurio fazer a escolha de uma nica conformao para cada molcula
(geralmente a conformao bioativa). Em QSAR-4D a ausncia dos descritores de
interao dificultam a interpretao dos modelos obtidos (GHASEMI; SAFAVI-SOHI;
BARBOSA, 2012). Alis, no existe programas livres que possibilite a gerao de
descritores para essas duas metodologias. Existe uma verso gratuita do programa,
Open3DQSAR (TOSCO; BALLE, 2011), mas para utilizar o CoMFA necessrio

26

adquirir a verso do programa pago. Para usar o QSAR-4D, necessrio adquirir uma
licena colaborativa com o grupo do Hopfinger.
O LQTA-QSAR faz uso do pacote livre GROMACS (VAN DER SPOEL et al.,
2005) para calcular as simulaes de dinmicas moleculares (MD) e estimar o perfil
conformacional gerado. As simulaes de MD podem ser desenvolvidas considerando
molculas de solvente explicito, que gera aproximaes biolgicas mais precisas (mas
aumenta o custo computacional) ou com solvente implcito, menos dispendioso.
O programa open3DQSAR gera ao redor do alinhamento de todas as estruturas
uma caixa virtual cbica (grid) (Figura 6). A energia de interao para cada tipo de
campo de interao molecular (descritores estricos e eletrostticos) para onde, onde
em casa canto do grid, as interaes entre uma sonda e cada molculas so
calculadas (PATEL et al., 2014; TOSCO; BALLE, 2011).
A gerao de descritores MIF pelas metodologias de QSAR 3D geram uma
quantidade exorbitante de descritores. O nmero total de variveis disponveis muito
maior do que o nmero que ser efetivamente includo nos modelos, incluindo rudo e
informaes redundantes ou irrelevantes (TEFILO; MARTINS; FERREIRA, 2009a).
O objetivo da seleo de variveis diminuir o volume de processamento de data e
melhorar a performance preditiva do modelo(ARAKAWA; HASEGAWA; FUNATSU,
2007; GONZLEZ et al., 2008).

Figura 6. Representao de uma caixa cbica utilizada para calcular descritores MIF.
A sonda utilizada para calcular as energias de interao est no canto superior
esquerdo.

Fonte: (RONCAGLIONI; BENFENATI, 2008).

27

O algoritmo de seleo de preditores ordenados (OPS) (TEFILO; MARTINS;


FERREIRA, 2009a) foi desenvolvido para realizar esta seleo das variveis. A
seleo com algoritmo OPS realizada atravs do programa QSARModelling
(Disponvel em: < http://lqta.iqm.unicamp.br/programasOPS.html>) (MARTINS et al.,
2009). A regresso multivariada para construir o modelo feita com o mtodo de PLS
(partial least squares).
O OPS visa melhorar a qualidade dos modelos de regresso, removendo
descritores que possuem baixa capacidade de prever a atividade biolgica. Para isso
feito um ordenamento dos descritores utilizando um vetor informativo. Esse vetor
informativo pode ser a correlao destes descritores com a atividade biolgica, ou
mesmo os valores de regresso multivariada (vetor de regresso do PLS). Os modelos
so construdos com um determinado nmero de descritores (janela inicial) e
posteriormente tal janela aumentada de um incremento fixo at que todas os
descritores ou uma porcentagem do total sejam adicionadas a esta. O conjunto de
variveis que apresentarem os melhores parmetros de qualidade contm as
variveis que apresentam a melhor capacidade de previso para o modelo construdo
e, portanto, so estas as variveis selecionadas (TEFILO; MARTINS; FERREIRA,
2009a). A Figura 7 mostra um esquema do algoritmo OPS.

Figura 7. Funcionamento esquemtico do OPS.

Fonte : adaptado de (TEFILO; MARTINS; FERREIRA, 2009a).

28

1.2.3 Descritores moleculares de interao.


Na metodologia QSAR-3D a energia de interao de um tomo de prova ou
fragmento molecular (sonda) com cada molcula em uma conformao alinhada
calculada em ponto de uma grade e constitui os descritores chamados de campo de
interao molecular (MIF, molecular interacion fields) (CRUCIANI, 2006).
As energias de interao mais empregadas so as de van der Waals e
Coulomb, calculadas por funes comuns aos campos de fora moleculares, como o
potencial de Lennard-Jones (LJ) (2) e o potencial de Coulomb (1), respectivamente.

=
=1

6
2
= =1(

)

(1)
(2)

Onde EQQ e a Evdw so as energias que iro compor os descritores eletrostticos


(QQ) e de Van der Waals calculada pelo potencial de Lennard-Jones (VDW). qsonda
a carga da sonda, qk a carga parcial do tomo k da molcula, D a constante
dieltrica, e rsondak a distncia da sonda dentro da grade virtual at o tomo k da
molcula. Os termos A e C so constantes dependentes do raio de van der Waals
parametrizados para o campo de fora usado no clculo da energia (MARTINS et al.,
2009).
Os descritores no modelo final com a metodologia LQTA QSAR so expressos
como esferas, coloridas de acordo com o sinal do vetor de regresso e a natureza dos
descritores (LJ ou QQ). Diferentemente do CoMFA que os descritores de interao
so demonstrados atravs de mapas de contorno (Figura 8).

29

Figura 8. Exemplo de exibio espacial de descritores para a metodologia LQTA e


CoMFA. a) Representao descritores LJ e QQ em esferas. b) Mapas de contorno
obtidos por CoMFA.

Fonte : adaptado de (a) (DE ARAJO SANTOS et al., 2014) e (b) (DOWEYKO, 2004).
1.2.4 Validao dos modelos de LQTA-QSAR
A validao do modelo QSAR essencial para garantir a qualidade da
capacidade de previso do modelo. Para tanto, a validao deve ocorrer tanto de
maneira interna (do prprio modelo) quanto de maneira externa (do grupo de
previso). A validao cruzada (leave-one-out - LOO) utilizada para determinar o
nmero de variveis latentes no modelo PLS (KIRALJ; FERREIRA, 2009). A validao
cruzada leave-one-out consiste em excluir uma amostra de cada vez do conjunto de
treinamento, construir um modelo sem essa amostra, e ento realizar a previso da
atividade para esta amostra deixada de fora. O procedimento realizado quantas
vezes for o nmero das amostras do conjunto de treinamento. A diferena entre o
valor experimental e o estimado para as amostras retiradas so usados para calcular

30

o erro padro da validao cruzada (SEV, standart error of validation) e o coeficiente


de correlao da validao LOO (Q2). O modelo com todas as amostras expresso
em termos do coeficiente de correlao de determinao mltipla (R2) e o erro padro
de calibrao (SEC, standart error of calibration).
Se a diferena entre os valores de Q2 LOO e R2 for de 0,2 a 0,3 h indcios de
sobreajuste do modelo. preconizado que os valores de Q e R devem ser maiores
que 0,6 para um modelo satisfatrio (CHIRICO; GRAMATICA, 2011; GRAMATICA,
2007; KIRALJ; FERREIRA, 2009). A tabela 2 mostra os parmetros estatsticos
bsicos para os modelos de regresso.

Tabela 2. Parmetros estatsticos bsicos para modelos de regresso.


Parmetro
Definio
Coeficiente de validao cruzada

=1( )
= 1
=1( [])

Coeficiente de correlao de

( )
=1
( [])

determinao mltipla

Coeficiente de correlao de validao


externa

= 1

( )
( [])

A validao cruzada Leave-N-out (LNO) recomendada para testar a robustez


do modelo. Diferente do LOO, so retiradas do conjunto de treinamento N amostras
em bloco. Um novo modelo construdo sem estas amostras, e os valores de
atividade biolgica so previstos para o bloco de amostras separadas para validao.
O valor de N deve apresentar uma poro significativa das amostras, sendo
preconizado um nmero de 20% a 30% de amostras a serem retiradas (CHIRICO;
GRAMATICA, 2011). Os coeficientes de correlao da validao cruzada LNO
(Q2LNO) so calculados da mesma maneira que para Q2LOO. recomendado um
valor mximo de oscilao de 0,1. Os resultados do teste de LNO expresso atravs
de um grfico que mostra o desvio mximo entre Q2LOO e Q2LNO. Devem tambm
ser expressos dois desvios padro ao redor do valor mdio para a diferena entre o
Q2LOO e Q2LNO (KIRALJ; FERREIRA, 2009).

31

O ltimo teste, de y-randomization detectar e quantifica as chances de


correlaes ao acaso entre a varivel dependente e os descritores. De modo que o
modelo no seja obtido ao acaso. O teste consiste em construir vrios modelos com
as variveis independentes, mas utilizando valores randomizados da matriz de
variveis latentes (y). Nessas condies, os modelos obtidos no podem obter valores
bons de Q e R LOO. Valores ideais para os parmetros obtidos com o teste yrandomization, Qyrand e Ryrand so preconizados como : Qyrand e Ryrand < 0,2 para
um modelo obtido sem chance de correlao ao acaso (ERIKSSON et al., 2003).
Os resultados do teste ainda podem ser expressos levando em conta o
coeficiente de correlao absoluta de Pearson, |r|. So construdos dois grficos, no
eixo y com os valores de Q2yrand e outro R2yrand e no eixo x os valores de |r| para os
dois grficos. feita ento uma regresso linear com os valores e se o modelo foi
obtido com descritores que possuem correlao ao acaso, os interceptos desses
grficos so aQ > 0,05 e aR > 0,3. Estes interceptos so medidas da correlao ao
acaso (KIRALJ; FERREIRA, 2009).

1.3 Aplicao do LQTA-QSAR para alvos e inibidores de protena de P. falciparum


1.3.1 Plasmepsina II do Plasmodium falciparum.
Presentes no P. falciparum, as plasmepsinas so um grupo de dez isoformas
de proteases asprticas presentes no Plasmodium e esto envolvidas no processo de
degradao da hemoglobina. Quatro protenas so ativas no vacolo alimentar (I, II,
IV e HAP) e so expressas na fase eritroctica. Proteases aspartticas se constituem
de uma das maiores subclasses de protenas e so encontradas em sua maioria,
somente em eucariotos (ERSMARK; SAMUELSSON; HALLBERG, 2006).
A utilizao das Plm como alvos farmacolgicos j uma realidade no mercado
de frmacos. O FDA (Food and Drug Administration) j aprovou frmacos tanto para
alvos em humanos quanto na terapia contra o HIV. A maioria desses esforos foi
guiado pelo projeto de prottipos baseados em estrutura. As descobertas feitas nos
ltimos vinte anos quanto ao design de frmacos permitem uma orientao para o
descobrimento de possveis novos compostos para a inibio das plasmepsinas.
Existe uma vasta coleo na literatura de compostos com atividade inibitria
comprovada contra a enzima, que podem se tratar de ponto de partida para a pesquisa

32

de um novo antimalrico (BJELIC et al., 2007; J. MEYERS; E. GOLDBERG, 2012;


WEGSCHEID-GERLACH; GERBER; DIEDERICH, 2010).
O desenvolvimento de frmacos baseado na estrutura dos receptores foca
primariamente na Plm II como alvo proteico, pois se trata da primeira estrutura
cristalogrfica a ficar disponvel para pesquisa. (HUIZING; MONDAL; HIRSCH, 2015;
SILVA et al., 1996). O sequenciamento da Plm II tambm permitiu o desenvolvimento
in silico de modelos para a Plm I, IV e HAP, considerando que o sitio ativo destas
protenas so similares 63% de similaridade (BHAUMIK; GUSTCHINA;
WLODAWER, 2012; ERSMARK; SAMUELSSON; HALLBERG, 2006).
A estrutura madura da Plm II tem 329 aminocidos e consiste em dois domnios
(C- e N-terminal), apresentando a forma tpica bilobal das proteases asprticas, forma
esta que define o stio ativo. Cada domnio contribui com um resduo de cido
asprtico para compor o stio cataltico da protena, Asp214 e Asp34 (Figura 9).
formada ainda por uma formao de grampo (-hairpin) e um uma aba ( flap) que
cobre o sitio ativo e interage com o substrato (ASOJO et al., 2003; ERSMARK;
SAMUELSSON; HALLBERG, 2006; SILVA et al., 1996).

Figura 9.Mecanismo da quebra da ligao peptdica feita pelas proteases asprticas.

Fonte: adaptado de (J. MEYERS; E. GOLDBERG, 2012)


A Figura 10 mostra uma lista dos principais resduos de aminocidos e como
se organizam em bolses hidrofbicos de interao. Essas regies de bolses esto
denominados de acordo os dados de Schechter e colaboradores (SCHECHTER;
BERGER, 1967), seguindo a adaptao feita por Huizing (HUIZING; MONDAL;
HIRSCH, 2015). Em azul a regio S2; em laranja a regio S1; em amarelo a aba; em
vermelho a dade cataltica; em verde a regio S1/S3 e em roxo a regio S2.

33

Figura 10. Estrutura cristalogrfica da Plasmepsina.II.

Fonte: elaborado pelo autor.


Tabela 3. Lista dos principais resduos de aminocidos e suas regies respectivas no
sitio ativo da Plm II.
Dade
Flap
S1/S3
S2
S1'
S2'
Asp
Pro43,
Met75,
Asp34,

Val105,

Asp214. Phe111,
Ile123,

Tyr17,

Ile32,

Ser215,
Ser218,
Phe120,
Met15,
Ile123,Ile14,

Tyr77.

Thr114.

Pro243,
Leu271,
Phe244,
Met286,
Ile290,
Tyr273.

Tyr192,
Trp193,
Ile300,
Ile212,
Phe294.

Asn39,
Leu131,
Ser132,
Ile133.

Esse grupo de protenas capaz de clivar a cadeia A da hemoglobina entre os


resduos Phe33 e Leu34 (BRINKWORTH et al., 2001). Acredita-se que tal processo
induza um desenrolamento da protena e permita a exposio de mais stios catalticos
(ASOJO et al., 2003). Sendo assim, as plasmepsinas responsveis pelo metabolismo
da hemoglobina, so tambm consequentemente responsveis pelos sintomas
clnicos caractersticos da malria (febre); reforando a protena como alvo potencial
para terapia antimalrica.

34

1.3.2 Inibidores da Plasmepsina II : alofenilnorstatinas.


A principal estratgia do planejamento de inibidores das Plasmepsinas utiliza a
ao da dade cataltica formada pelos resduos de cido asprtico. O mecanismo de
ao consiste na clivagem da ligao peptdica, gerando um substrato intermedirio
tetradrico. Anlogos desse substrato intermedirio simulam a interao com as Plm
de maneira mais especfica. Issteros desse estado de transio so definidos por
possuir um grupamento funcional capaz de simular esse intermedirio, mas mais
resistente a clivagem da protena. Os inibidores peptidiomimticos (Figura 11)
resistentes a essa clivagem so amidas reduzidas, estatinas, estatinas reversas
hidroxietilaminas, hidroxipropilaminas, norstatinas e dihidroxietilenos (C e N
duplicados) (DAN; BHAKAT, 2015).

Figura 11. Inibidores peptidiomimticos das plasmepsinas.

Fonte: adaptado de (PREZ et al., 2013).


As norstatinas foram previamente desenvolvidas como inibidores de HIV e
utilizadas pela primeira vez como inibidores de Plasmepsina II por Nezami e

35

colaboradores, com uma srie de norstationas com um ncleo de alofenilnorstatinas


associado a tiazolidina (NEZAMI et al., 2002).
Em uma colaborao entre a Universidade Jonhs Hopkins e Universidade
Farmacutica de Kyoto, a srie chamada de KNI, com o intuito final de inibir as quatro
Plasmepsinas I, II, IV e HAP presentes no vacolo digestivo, mas primariamente a
plasmepsina II com maior potncia pelo design de inibidores adaptativos (HIDAKA et
al., 2007; KISO et al., 2004; MIURA et al., 2010; NEZAMI et al., 2002). Essa estratgia
tenta planejar inibidores mais potentes e especficos que interagem com as regies
mais conservadas no sitio ativo (rea cataltica) e mantendo a flexibilidade dos
compostos para que se adaptem as regies menos conservadas (S2, S1 e flap) da
protena (NEZAMI et al., 2003).
Compostos

baseados

nesse

ncleo

qumico

demonstraram

grande

biodisponibilidade e baixa toxicidade. As alofenilnorstatinas apresentam uma estrutura


similar ao primeiro sitio de clivagem da hemoglobina, Phe33-Leu34 e a poro
tiazolidina simula uma leucina conformacionalmente restringida. Estudos de docking
realizados por Nezami (NEZAMI et al., 2002) demonstraram que as alofenilnortatinas
se ligam a Plasmepsna II da mesma forma que a Pepstatina A (Figura 12), um potente
inibidor natural da proteases asprticas (ASOJO et al., 2003). Interaes dos
compostos com os resduos da Plm II sugeriam que a otimizao desta classe deveria
ser direcionada para interaes com o flap e as bordas dos bolses de interaes.
(NEZAMI et al., 2003).

Figura 12. Pepstatina A e alofenilnorstatina.

36

Fonte: elaborado pelo autor

37

2 OBJETIVOS
O objetivo geral dessa dissertao consiste no desenvolvimento de um modelo de
previso LQTA-QSAR para uma srie de inibidores da Plasmepsina II.
2.1 Objetivos especficos

Padronizao do conjunto de dados de compostos ativos contra o Plasmodium


falciparum para a gerao d modelo.

Desenvolvimento do modelo de LQTA-QSAR-4D

Validar extensivamente o melhor modelo obtido.

Identificao de pontos estruturais relevantes para a atividade biolgica por


meio da interpretao dos descritores.

38

3 MATERIAL E MTODOS
3.1 Material
3.1.1 Computadores.
Todos os estudos foram realizados no Laboratrio de Qumica Farmacutica
Computacional, em estaes computacionais operando em Linux, com processadores
Intel XeonE5-2690, 2.9 GHz, 20 MB cache, 16 GB RAM. Os softwares utilizados
esto disponveis atravs de licenas acadmicas ou so de uso livre.

3.1.2 Conjunto de dados


Para os estudos de modelagem molecular, foram selecionados um conjunto de
dados de 49 inibidores derivados da estrutura do cido (2S,3S) -3-amina-2-hidroxi-4fenilbutirato (ALOFENILNORSTATINAS) com cido (R)-1,3-tiazolidina 4-carboxilico
(BHAUMIK et al., 2011; HIDAKA et al., 2007; KISO et al., 2004; MIURA et al., 2010;
NEZAMI et al., 2002). Os valores da constante de inibio (Ki) foram obtidos sobre as
mesmas condies experimentais. Esses valores de Ki foram transformados para a
escala logartmica pki (-log Ki). A faixa de valores variou de 4,01 a 9,69.

3.1.3 Receptor
A estrutura cristalogrfica da enzima Plasmepsina II presente no Plasmodium
falciparum foi obtida a partir do banco de dados online Protein Data Bank ( PDB)
(BERNSTEIN et al., 1977) sob o cdigo 4CKU (JAUDZEMS et al., 2014), com
resoluo de 1,85 e valor-R de 0,209 (Figura 13). As estruturas, que apresentavam
resduos de aminocidos incompletos foram reconstrudas utilizando modelos de
homologia com o Swiss Model (GUEX; PEITSCH, 1997).

39

Figura 13. Estrutura cristalina da Plasmepsina II (4CKU).

Fonte: <http://www.rcsb.org>
3.2 Metodologia
3.2.1 Padronizao do conjunto de dados e preparo das estruturas tridimensionais.
As estruturas 3D dos compostos foram desenhadas com o auxlio do programa
Marvin Scketch verso 15.9 (ChemAxon). O estado de protonao foi estimado para
pH = 7,40 e os tomos de hidrognio foram adicionados com o programa Avogadro
(HANWELL et al., 2012). Foi realizada uma inspeo criteriosa do banco de dados
selecionado da literatura utilizando o protocolo descrito por Fourches & Tropsha
(FOURCHES, 2010).
Todos os modelos moleculares, nos devidos estados de protonao, passaram
por uma minimizao de energia com o campo de forma MMFFFG94 e tiveram suas
energias otimizadas ao nvel semi-emprico PM6, com o programa Gaussian. Cargas
AM1-BCC (JAKALIAN; JACK; BAYLY, 2002) foram adicionadas com o UCSF Chimera
(PETTERSEN et al., 2004).
Para as simulaes de dinmica molecular, todo o conjunto de dados tiveram
suas ligaes parametrizadas para o campo de fora AMBER99SB-ILDN (LINDORFFLARSEN et al., 2010).

40

3.2.2 Adaptao do stio ativo


A estrutura cristalogrfica 3D do complexo Plasmpepsina II com um ligante
natural baseado na estrutura da hidroxietilamina (cdigo PDB: 4CKU) (JAUDZEMS et
al., 2014) foi utilizado como receptor para a construo do modelo de previso
dependente de receptor LQTA-QSAR. A estrutura qumica do ligante cristalizado se
interage com a protena por um modo de interao distinto dos compostos do conjunto
de dados. O que no permite a insero direta dos ligantes escolhidos na conformao
apresentada pelo stio ativo cristalizado.
A adaptao do stio ativo foi feita a partir do estudo de docking do composto
mais potente da srie (composto 33). Para tal, o ligante natural foi removido da
estrutura do cristal e foi realizada a docagem com o composto 33. As melhores poses
foram submetidas a simulaes de dinmica molecular e propiciaram a adaptao do
stio ativo por meio de encaixe induzido. O processo automatizado de docking foi
realizado com o programa AutoDock Vina (TROTT; OLSON, 2010) e as simulaes
de dinmica molecular com o pacote GROMACS 4 (VAN DER SPOEL et al., 2005). O
novo stio ativo hipottico, adaptado e aperfeioado para o modo de interao do
composto 33 foi utilizado para orientar os processos de refinamento subsequentes
com dinmica molecular de todos os ligantes da srie de derivados Alofenilnorstatinas
e obter os perfis conformacionais necessrios para a construo do modelo LQTAQSAR-DR.
As conformaes iniciais (input) para a realizao das simulaes de todos os
ligantes dos conjuntos de dados foram obtidas a partir de um processo de docagem
manual, utilizando a estrutura da Plm II com o stio ativo adaptado. O processo manual
foi realizado utilizando a ferramenta de ajuste de tores (adjust torsions) e o
movimento do mouse (movement mouse), tomo por tomo, baseados no
conhecimento do modo de interao do ligante natural cocristalizado e interaes
relatadas na literatura (DAN; BHAKAT, 2015; HUIZING; MONDAL; HIRSCH, 2015).
Otimizaes da geometria dos compostos foram realizadas para eliminar possveis
distores nas posies dos tomos. As estruturas otimizadas foram submetidas ao
programa topobuild para a criao dos arquivos de topologia GAFF (WANG et al.,
2004) para as subsequentes simulaes de dinmica molecular.

41

3.2.3 Dinmica molecular


As simulaes de dinmica molecular ocorreram utilizando o pacote
GROMACS 4 (VAN DER SPOEL et al., 2005). Todas as simulaes foram feitas em
solvente implcito empregando o formalismo generalizado de Born (FAN et al., 2005).
Como no foi construdo uma caixa, no foi levado em considerao as condies
peridicas de limite. Todos os complexos tiveram sua energia otimizada usando o
algoritmo de descida mais inclinada (steepest descent algorithm - SDA). O critrio de
convergncia empregado nas otimizaes foi que a fora mxima que agisse sobre
os tomos no superasse 10 kJ mol-1 nm-1. Caso a convergncia no fosse atingida
em 20 000 passos, foi empregado o algoritmo de Broydens-Fletcher-Goldfarb-Shanno
(BFGS). Foram aplicadas Correes de disperso de longo alcance somente para
energia. Restries de posies com penalidades de energia totais foram adicionadas
cadeia principal (backbone) e parciais cadeia lateral da protena. Todas as ligaes
foram vnculos pelo algoritmo LINCS, foi removido o centro de massa translacional e
rotacional ao redor do centro de massa e um algoritmo de leap-frog foi utilizado para
integrar as equaes de Newton de movimento. As interaes de Lennard-Jones e
Coulombic sofreram consideradas at 2 nm. As simulaes duraram 2 000 ps para
cada composto, ou o suficiente para adaptao e estabilizao da posio do ligante
no stio ativo.

3.2.4 Gerao do modelo 4D LQTA-QSAR


Os descritores de interao foram calculados com o programa Open3DQSAR
(TOSCO; BALLE, 2011). Estes descritores foram criados com a utilizao das
conformaes alinhadas provenientes da dinmica molecular. A seleo destas
conformaes foi realizada a partir da ferramenta de anlise de agrupamentos do
Chimera. Foi utilizada uma caixa cbica com 1.0 de espaamento e dimenses de
33x32x30 . Foram calculados no total 63360 descritores paras energias de interao
de Lennard-Jones (LJ) e Coulomb (QQ). Os descritores de LJ foram calculados com
uma sonda sp, e os de QQ com uma sonda de carga +1.
A filtragem (Figura 14), seleo e construo dos modelos de QSAR seguiram
os protocolos j estabelecidos por Barbosa e colaboradores (BARBOSA; FERREIRA,
2012) para a metodologia do LQTA-QSAR. O script utilizado para retirar os descritores

42

do Open3DQSAR e o script feito para aplicar os filtros virtuais nas matrizes do Matlab
esto disponveis no Anexo I.

Figura 14. Etapas dos filtros virtuais.

Fonte: elaborado pelo autor


3.2.4.1 Filtros virtuais
Os descritores moleculares excessivamente distantes (baixa varincia) das
estruturas 3D alinhadas dentro da grade virtual foram eliminados. O corte da varincia
foi de 0,02 para descritores abaixo desse valor, de acordo com o proposto por Kubiny
e colaboradores (KUBINYI, 1997). Os descritores de LJ so submetidos a um
tratamento devido a seus valores positivos serem de elevada magnitude nos postos
da grade prximos aos tomos. Um corte (cut-off) de energia realizado seguindo a
equao X. Se um descritor de LJ nas coordenadas x, y, z tiver valor de energia menor
ou igual que 30 kcal/mol no foi aplicado nenhum corte. Se no, o valor logaritmo
residual da energia foi adicionado a 30 kcal/mol.

,, 30 1 , ,, = ,,
,,

,, > 30 1 , ,, = 30 + ( 1 29)

(3)

43

O segundo filtro virtual foi realizado por meio da eliminao dos descritores de
baixa correlao, ou seja, se comportam como um vetor aleatrio. Para tal, so
eliminados os descritores que tem correlao de Pearson absoluta (|r|) com atividade
biolgica (y) no mesmo nvel de rudo aleatrio.
A ltima etapa de filtros virtuais visa eliminar os descritores com perfil de
distribuio muito diferente em relao a atividade biolgica (y), utilizando o
Comparative Distribution Detection Algorithm (CDDA) (BARBOSA; FERREIRA, 2012).
Tal algoritmo permite um modo de quantificar o quo similar y est distribudo para
um descritor especifico.

3.2.4.2 Seleo de variveis


Aps o procedimento de filtragem virtual, foi realizado a seleo de descritores
com o algoritmo OPS (TEFILO; MARTINS; FERREIRA, 2009a). Foram removidos
descritores redundantes (com coeficiente de correlao inter descritor igual ou maior
que 0,9), que apresentaram discrepncia entre o sinal do vetor de regresso e do
coeficiente de correlao com a atividade biolgica (KIRALJ; FERREIRA, 2009).

3.2.5 Validao do modelo


A validao interna do modelo foi obtida a partir dos parmetros de mritos R
e Q, e testes de validao y-randomization e Leave-N-out (LNO) (GRAMATICA,
2007; KIRALJ; FERREIRA, 2009). A validao externa foi realizada empregando um
conjunto teste de 12 compostos, a fim de se verificar a capacidade preditiva dos
melhores modelos obtidos. Tal capacidade foi avaliada utilizando o coeficiente de
correlao externo (Qext).
O modelo final que passou nas devidas etapas de validao teve seus
descritores visualizados no espao 3D ao redor das molculas alinhadas. As
coordenadas que definem os descritores so expressas em formato .pdb e exibidas
como esferas utilizando o programa USCF Chimera (PETTERSEN et al., 2004). A
interpretao dos descritores do modelo foi feita com base na disposio espacial,
natureza energtica e pelo sinal do vetor de regresso.

3.2.5.1 Leave-N-out e y-randomization


Para o teste de LNO, os modelos foram considerados robustos se os desvios
mximos absolutos de QLNO e que o QLOO no fossem superiores que 0,1, para N

44

sendo cerca de 20-30% das amostras separadas para validao interna


(GRAMATICA, 2007; KIRALJ; FERREIRA, 2009). O resultado mostrado
graficamente, exibindo o valor do desvio mximo e o valor mdio de dois desvios
padro.
No teste y-randomization os modelos foram construdos com atividades
biolgicas randomizadas para gerar modelos que apresentassem pouca qualidade
estatstica (R e Q baixos). Os descritores obtidos para os modelos foram
considerados livres de correlao ao acaso quando os interceptos para as regresses
lineares dos valores de |r| x Qyrand e |r| x Ryrand forem aQ < 0,05 e aR < 0,3
(ERIKSSON et al., 2003). Os resultados foram expressos em dois grficos contendo
a linha para a regresso linear, seguindo as equaes:

i)

= + ||

ii)

= + ||

(4)

Onde Qyrad e Ryrad so os parmetros estatsticos do coeficiente de correlao


para os modelos randmicos, aQ e aR so os interceptos da reta e |r| o coeficiente
de correlao de Pearson. Foram realizadas 100 randomizaes de y.

45

4 RESULTADOS E DISCUSSES.
4.1 Caracterizao do conjunto de dados.
Um conjunto de dados de 49 compostos foi utilizado para a construo de
modelos LQTA-QSAR dependente de receptor (JAUDZEMS et al., 2014). A figura 15
mostra o esqueleto principal dos inibidores da srie escolhida. As molculas do
conjunto de dados variam a partir de quatro pontos de modificao, R1, R2, R3, R4,
mantendo sempre o radical Alofenilnorstatinas com um anel tiazolidina.
Seguindo a conveno de Schechter (SCHECHTER; BERGER, 1967), as
regies dos substratos, ou inibidores (P1-Pn/P1-Pn) so correspondentes a regies
que interagem no sitio ativo (S1-Sn/S1-Sn) das plasmepsinas (BHAUMIK;
GUSTCHINA; WLODAWER, 2012).
Figura 15 Farmacforo caracterstico da srie de compostos utilizada na construo
do modelo LQTA-QSAR. Anel de cinco membros tiazolidina e os locais de possveis
substituies (R1, R2, R3 e R4)

Fonte: elaborado pelo autor


Tal conjunto de dados indito na criao de modelos de QSAR na literatura.
As estruturas qumicas dos compostos e seus respectivos valores de atividade
biolgicas, expresso em pki, esto apresentados na Tabela 4.

46

Tabela 4 Conjunto de dados retirados da literatura (continua).

Composto

R1

R2

R3

pKi

CH3

8.04

CH3

8.07

CH3

CH3

7.92

CH2 CH3

9.16

CH2 CH3

CH2 CH3

8.29

CH2 CH3

CH2 CH3

8.37

CH2 CH3

CH2 CH3

CH2 CH3

Composto

pKi

Composto

pKi

9.30

17

6.95

10

7.14

18

6.14

11

7.65

19

7.02

47

Tabela 4 Continuao.
Composto

Composto

pKi

pKi

12

6.27

20

7.38

13

7.95

21

6.25

15

7.82

23

16

24

6.56

Composto

25

R1

R2

R3

R4

pKi

4.02

48

Tabela 4 Continuao.
Composto

R2

R3

CH3

CH3

5.06

4.89

29

CH3

CH3

7.15

30

5.03

31

6.22

26

27

R1

R4

pKi

49

32

CH3

CH3

7.52

CH3

CH3

7.69

5.09

33

35

Composto4

pKi

36

8.52

37

7.82

50

Tabela 4 Continuao
Composto4

pKi

38

8.0k5

39

9.7

40

8.3

Composto4

R1

R2

R3

pKi

41

CH3

7.75

42

CH3

8.30

43

NH2

8.40

44

NH2

7.92

45

OH

7.95

46

OH

8.40

47

OCH3

8.05

48

OCH3

7.77

49

OCH3

8.40

1Miura

et al., 2010; 2Kiso et al., 2004; 3Nezami et al., 2002; 4Hidaka et al., 2007.

51

4.2 Diviso do conjunto de dados para a construo do modelo LQTA-QSAR


O conjunto de dados foi dividido em grupo de treinamento e grupo teste, 85%
e 25% dos compostos, respectivamente. Para esta diviso, utilizou-se o mtodo de
anlise de grupamentos hierrquicos (HCA Hierarchical Cluster Analyses) a partir de
um dendograma (Figura 16). Os grupos testes e de treinamento foram escolhidos de
modo que o menor e o maior valor de pKi (composto 25 e 39) no fossem selecionados
para o grupo externo (conjunto teste) e de modo que os dois conjuntos apresentassem
uma boa distribuio ao longo do intervalo de atividade. O grupo de treinamento ficou
constitudo de 37 compostos e o grupo teste de 12 compostos. O grupo teste foi
constitudos dos compostos 17, 21, 29, 14, 40, 30, 32, 43, 5, 6, 3 e 27. O restante foi
utilizado como conjunto de treinamento para o modelo LQTA-QSAR.
Figura 16 Dendograma referente anlise de grupamentos hierrquicos para o
conjunto de dados (a numerao dos compostos no corresponde a numerao
referente a tabela).

4.3 Adaptao do stio ativo.


A adaptao do sitio ativo do cristal da Plasmepsina II se mostrou necessria,
porque o ligante cocristalizado tem uma estrutura qumica baseada em
hidroxietilaminas, diferente dos compostos que compe a srie utilizada para a

52

construo do modelo. A alta flexibilidade da estrutura da protena (HUIZING;


MONDAL; HIRSCH, 2015) acrescentou necessidade de realizar o processo de
docagem manualmente, e no, com o docking automatizado.
Inicialmente, todo o conjunto de dados passou pelo processo de docking
automatizado, utilizando o programa AutoDock Vina (TROTT; OLSON, 2010). As
conformaes obtidas para todo o conjunto de dados, apesar de apresentarem uma
funo de avaliao (score) alto, no apresentaram conformaes que permitissem o
alinhamento das molculas, ou que traduzissem um modo legtimo de interao
similar entre si. A figura 17 mostra o melhor alinhamento das conformaes obtidas
com o docking automatizado. perceptvel que o alinhamento obtido impossibilita a
construo de um modelo QSAR-3D.

Figura 17. Alinhamento das melhores conformaes obtidas pelo processo de


docagem automatizado.

Fonte: elaborado pelo autor


Enquanto perceptvel que o processo automatizado traduz em conformaes
similares ao modo de interao desvendado pelo cristal, ela no condiz com modo de
interao encontrado na literatura para as estruturas baseadas nas alofenilnorstatinas
(BJELIC et al., 2007; BOSS et al., 2003; ERSMARK; SAMUELSSON; HALLBERG,
2006). As alofenilnorstatinas so desenhados para ocupar o espao S1 do sitio ativo
da protena e explorar o bolso S2 (WEGSCHEID-GERLACH; GERBER; DIEDERICH,

53

2010), diferentemente da natureza do composto hidroxietilaminas cocristalizadas


(JAUDZEMS et al., 2014).
Frente a essa problemtica, a realizao de um modelo de previso 4D se
mostrou necessria. Utilizando-se das ferramentas de dinmica molecular e
aproveitando as vantagens de um modelo QSAR-4D frente a um 3D clssico (PATEL
et al., 2014). Assim, foi possvel adaptar o sitio ativo por encaixe induzido srie de
compostos do conjunto de dados e aferir um modo de interao mais consonante ao
modo de interao com a protena.
Composto 33 (pKi = 7,69), uma das molculas mais ativa da srie, foi escolhida
para a adaptao do sitio ativo. A simulao de MD resultou em diversas
conformaes, entre elas, uma mais frequente revelando um modo de interao
distinto para molculas derivadas de alofenilnorstatinas. A figura 18 mostra um corte
transversal do sitio ativo.
Figura 18 Sitio ativo da Plm II com o Composto 33 (roxo) e ligante natural do cristal
(azul).

Fonte: elaborado pelo autor.


Foi observado que o anel tiazolidina do composto ocupava a regio S1 do bolso
hidrofbico do sitio ativo, permitindo que o ligante alcance a regio S2. Atingindo
assim, uma conformao mais estvel do que a apresentada pela forma cristalizada.
O benzil na regio P1, comum para toda a srie, interagiu com a regio S1/S3 do stio

54

ativo, fazendo interaes de empilhamento- com os resduos de Phe120, Try77 e


Phe111 (flap). A Figura 19 mostra o composto 33 e os principais resduos aps a
adaptao do sitio ativo

Figura 19. Composto 33 aps adaptao do stio ativo.

Fonte: elaborado pelo autor.


A dade cataltica, formada pelos resduos Asp34 e Asp214 fazem ligaes de
hidrognio com a carbonila e hidroxila da estrutura das alofenilnorstatinas. O anel
tiazolidina interage com a regio S1 do sitio ativo, principalmente com os resduos de
Tyr192, Ile300 e Ile212.
Sabe-se que o conjunto de dados foram planejados para simular um estado de
transio do substrato da protena Plasmepsina II, estado esse em que o substrato se
estende pelos dois lados do centro cataltico e preenche a regio hidrofbica S1/S3 e
S1 (SHIM; MACKERELL, JR., 2011). Tal caracterstica peptidiomtrica foi confirmada
pelos resultados da adaptao do sitio ativo e as simulaes de dinmica moleculares
puderam ser conduzidas para o restante do conjunto de dados.
Aps a adaptao do sitio ativo para o composto 33, as molculas restantes do
conjunto de dados foi manualmente ancorado para a posio do modo de interao.

55

Translaes e rotaes das ligaes permitiram produzir o input inicial para as


subsequentes simulaes de dinmica molecular de todo o conjunto. A Figura 20
mostra o alinhamento do conjunto de dados aps o processo de adaptao do sitio
ativo e docagem manual, antes do processo de clculo dos descritores. possvel
observar que o anel tiazolidina e o benzil de todos os conjuntos de dados esto
alinhados todos no mesmo modo de interao.

Figura 20. Melhor alinhamento aps a adaptao do sitio ativo.

Fonte: elaborado pelo autor.


4.4 4D LQTA-QSAR
Os descritores calculados com o programa Open3DQSAR e submetidos ao
protocolo de filtragem virtual e seleo de variveis descritos anteriormente. A tabela
5 mostra a eliminao de descritores subsequentes de cada etapa de filtragem virtual.
No Anexo 2 est disponvel o script utilizado para automatizar as etapas de filtragem
atravs do programa Matlab (Mathlab., 2000)..A matriz inicial, aps o clculo dos
descritores, com propores de 49x63360 foi tratada como duas matrizes distintas,
com 49 amostras e 31680 descritores cada, para descritores de LJ e QQ. A matriz
final utilizada para a criao do modelo teve propores de 37x443 (37 amostras
referente ao grupo de treinamento e 443 descritores). A figura 21 mostra a matriz
referentes aos descritores LJ no tocante ao corte. possvel observar, no primeiro
grfico, os valores elevados na casa de 3*10 de energia. No segundo grfico, aps

56

o tratamento, os descritores apresentam distribuio mais uniforme e valores de


grandezas menores.

Tabela 5. Nmeros de descritores iniciais e aps casa processo de filtragem virtual.


Matriz inicial
Corte pela
Corte LJ
Corte da
Corte da

49x31680

varincia

correlao

distribuio

(0,02)

(0,03)

(CDDA)

49x4925

49x4925

49x4342

37x246

49x4925

49x4925

49x198

37x197

(QQ)
49x31680 (LJ)

Figura 21. Resultado do filtro virtual referente ao tratamento dos descritores de LJ.

Fonte: elaborado pelo autor.

57

A matriz final com 37x443 foi levada ao programa QSAR modelling (Disponvel
em

<http://lqta.iqm.unicamp.br/QSAR_modelling/QSARmodeling.zip>)

para

construo do modelo LQTA-QSAR por meio de PLS. A tabela 6 mostra as figuras de


mrito obtidas para o melhor modelo.
O resultado se mostrou satisfatrio, com valor de Q igual a 0,92 e R igual a
0,95, com apenas 10 descritores e 2 variveis latentes. O coeficiente de correlao
de predio (Qext) foi 0,79, satisfatrio, para os parmetros estabelecidos para um
modelo de QSAR desejvel (GRAMATICA, 2007).

Tabela 6. Figuras de mrito para o modelo final obtido.


Q2
R
Qext
N descritores
0,92

0,95

0,79

10

N Variveis Latentes
2

Fonte: elaborado pelo autor.


O melhor modelo foi validado sobre os aspectos de robustez (LNO) e evitar
correlao ao acaso (y-randomization). A Figura 22 mostra o grfico de disperso dos
valores de atividade biolgica previstos e experimentais para o conjunto treinamento
e teste (Figura 19A). A validao LNO demonstra robustez da validao interna, onde
o desvio mximo dos valores no passou de 0,05 para 30% das amostras (Figura
19D). O teste de y-randomization mostra que os interceptos da regresso linear (aR e
aQ) mostraram valores menores que 0,3 e 0, respectivamente. Garantindo que o
modelo no foi obtido ao acaso (Figura 19B e 19C).
Uma tabela com a equao da regresso PLS para o modelo 4D LQTA-QSAR
est disponvel no Anexo 3. Dispondo destas informaes, propostas de ligantes
inditos podem ser feitas, calculados seus descritores na conformao do stio ativo
e suas atividades biolgicas previstas in silico.

58

Figura 22. Resultados dos testes de validao LNO e y-randomization e a qualidade


de previso do modelo.

Fonte: elaborado pelo autor.


4.5

Interpretao dos descritores.


O modelo final est representado graficamente por esferas e tem suas

coordenadas e valores do vetor de regresso em um arquivo pdb (Anexo 4). A


disposio espacial dos descritores est representada na figura 23. O modelo final
apresentou descritores de interao de Lennard Jones (LJ) e Coulomb (QQ),
representados pelas cores vermelho e azul, respectivamente. Apresentou tambm
descritores com sinal de regresso positivo (azul e vermelho escuro) e sinal negativo
(azul claro e laranja).

59

Figura 23 Visualizao dos descritores no sitio ativo da protena.

Fonte: elaborado pelo autor.


A Figura 23 mostra uma viso do sitio ativo da protena, cortado, com a
representao grfica dos descritores. possvel perceber que os trs bolses
hidrofbicos do sitio ativo, S2, S1 e S1/S3 e a regio que cada descritor est
relacionado. Os descritores prximos de resduos de aminocidos representam
descritores de interao e os posicionados prximos aos ligantes so descritores
estruturais. Na Figura 24, um exemplo de conformao de uma molcula mais ativa
(composto 33 - Figura 24A) e menos ativa (composto 25 Figura 24B) so utilizados
como referncia para facilitar a visualizao e interpretao da posio dos
descritores. A interpretao adequada dos descritores importante, porque as
informaes estruturais determinantes para a atividade biolgica so assinaladas.

60

Figura 24. Representao grfica dos descritores do modelo final. Vises com os
compostos 33 (a) e 25 (b).

Fonte: elaborado pelo autor.


Os descritores LJ positivos (vermelho escuro LJ1, LJ3, LJ5, LJ6 e LJ10)
representam locais em que grupos volumosos so favorveis para o aumento da
atividade biolgica. Descritores LJ negativos (laranja - LJ8) indicam regies de
interaes hidrofbicas com resduos de aminocidos adjacentes. Descritores
eletrostticos positivos (azul escuro QQ2, QQ7 e QQ9) e negativos (azul claro
QQ4) representam, respectivamente, regies em que grupos com carga positiva e
negativa amplificam a atividade biolgica (Figura 24).
O nico descritor negativo de Lennard-Jones (LJ8), em laranja, est
relacionado com os resduos adjacentes de Tyr192 e Leu 131 da regio hidrofbica
S2 do sitio ativo da Plm II.

61

Os trs descritores positivos LJ1, LJ6 e LJ10 prximos ao anel tiazolidina se


referem a uma regio estrica favorvel para a atividade biolgica. A presena de
substituintes mais hidrofbicos na posio 5 do anel, como di-metilas presentes em
alguns compostos da srie aumentam a atividade inibitria (Figura 25). Foi relatado
perda da seletividade para Plm II de compostos com substituio das dimetilas por
hidrognio (NEZAMI et al., 2002).
Figura 25 Composto 39 (pKi: 9,6), mais potente, em cinza e 27 (pki: 4,89) em laranja.

Fonte: elaborado pelo autor.


Esses descritores, ainda, se correlacionam com a angulao que o anel
tiazolidina interage com o sitio ativo. A orientao do enxofre no anel demonstra
importncia para o potencial inibidor (Figura 26). O composto 33 (azul) apresenta a
melhor orientao do anel tiazolidina, com o tomo de enxofre apresentando uma
distncia de 3,6 ao descritor LJ6. O composto 30 (cinza) apresenta uma
conformao do anel tiazolidina com a orientao do enxofre diferente, mais distante
do descritor LJ6 (4,3 ). O composto 30 ainda apresenta um volume menor
enfraquecendo a interao nesta regio do stio.
Figura 26 Orientao do anel tiazolidina. Composto 33 (pki: 7,69) e 30 (pki: 5,03).

62

Fonte: elaborado pelo autor.


Os descritores LJ3 e LJ5 se referem ao favorecimento de substituintes
volumosos na regio hidrofbica S1. Como corroboram os estudos de Muthas e
colaboradores (MUTHAS et al., 2005), que construram um modelo de QSAR com
derivados de hidroxietilamina para a Plasmepsina II com o CoMFA. Os mapas de
contorno obtidos (Figura 27) confirmam algumas regies de interpretao de
interao. Onde Muthas observou que o mapa de contorno verde, traduz na presena
de substituintes volumosos relacionados ao aumento da atividade biolgica. O
contorno verde, referente a regio S1 do stio ativo da protena, faz aluso aos
descritores LJ3 e LJ5 (MUTHAS et al., 2005).

63

Figura 27 Mapas de contorno obtidos por Muthas (MUTHAS et al., 2005). A regio
S1 est assinalada pelo mapa verde, que representa regio estrica favorvel para
presena de grupos volumosos.

Fonte: (Muthas et al., 2005)


QQ2 e QQ9 (Figura 28) esto relacionados com a poro benzil da srie. QQ9
um descritor de interao que se relaciona com o resduo de Tyr77 do flap e sua
interao com o benzil. Correspondendo com as interaes de empilhamento-
principalmente com o resduo Tyr77. Variaes no potencial de atividade esto
relacionados com a orientao que o benzil ocupa a poro S1/S3 do sitio.

64

Figura 28. Composto 39 (azul) com pKi: 9,7 e 25 (verde), pKi: 4,02. Em roxo os
resduos de aminocidos prximos aos descritores.

Fonte: elaborado pelo autor


O descritor positivo QQ7 representa regio de interao eletrosttica.
Relacionado com a presena de grupos negativos, interagindo especialmente com a
regio S1 do stio ativo, que enfraquece a atividade inibitria dos compostos. Figura
29 mostra os compostos 7 e 30 que melhor ilustram esse descritor. Como se trata de
um descritor eletrosttico positivo, a presena da carboxila no composto 30 dificulta a
interao apropriada com o stio. Por isso, acarreta, para este descritor, em diminuio
da atividade biolgica. Os grupos preferencias nessa regio no podem ser
carregados negativamente, de preferncia aromticos neutros.

65

Figura 29 Composto 30 (verde) e 7 (vermelho) representando o pior e melhor perfil


para descritor QQ7.

Fonte: elaborado pelo autor


O nico descritor eletrosttico negativo, QQ4, constitui de uma regio
eletrosttica desfavorvel para a atividade biolgica. Compostos que contribuem com
interaes negativas nessa regio aumentam a atividade biolgica (Figura 30B).
Ainda, nessa posio, substituintes alifticos tem menor atividade que aromticos
(Figura 30A).
Figura 30 A) Descritor QQ4 relacionado com substituintes alifticos e cclicos.
Compostos mais potente, 33 (roxo) com pKi de 7,69 e menos potente, 25 (azul) com
pki de 4,01 foram usados como exemplo. B) Contribuio de interaes
eletronegativas negativas. Composto 9 em azul de pKi: 9,31 e 18, marrom de pKi: 6,14.

Fonte: elaborado pelo autor

66

As estratgias de otimizao para a criao de inibidores da plasmepsina II


derivados das alofenilnorstatinas pode seguir as informaes assinaladas por cada
grupo de descritor. Para cada bolso hidrofbico ento, possvel observar os
melhores substituintes de cada molcula do conjunto de dados. A figura 31 mostram
um esquema de otimizao de orientao.

Figura 31. Esquema de interao das alofenilnorstatinas de acordo com o modelo


LQTA. Em vermelho, as regies do sitio ativo da Plm II que cada poro do inibidor
interage.

Fonte: elaborado pelo autor


Os melhores substituites para cada regio dos pockets do sitio ativo so na
posio P1 o benzil, fazendo ligaes com os resduos de Tyr. Na posio P1 o
anel tiazolidina com a presena das duas metilas. O indanol em R4 garanti uma maior
seletividade a Plm II (presente nos compostos 1 a 10). Estudos de docking realizados
por Kiso e colaboradores sugerem que o indanol capaz de se adaptar em vrias
regies dependendo da orientao da regio S2 (ERSMARK; SAMUELSSON;
HALLBERG, 2006; KISO et al., 2004). A poro P2 tambm ocupou a regio S1 do
sitio ativo, o melhor substituinte para essa posio foi o dimetilphenoxiacetil ( presente

67

nos compostos 1-24,29,33 e 41 a 49) substitudo em vrias posies, garantindo a


presena de grupos volumosos para a interao com a regio S1 (MIURA et al.,
2010).

68

5 CONCLUSES E PERSPECTIVAS.

Nessa dissertao de mestrado a metodologia de LQTA-QSAR foi empregada na


construo do modelo de QSAR para prever a atividade biolgica de inibidores da
Plasmepsina II baseados em alofenilnorstatinas. As molculas estudadas possuem
considervel atividade sobre a enzima em ensaios in vitro. Dentre os principais
resultados, destacasse que os resultados podem ajudar a elucidar as caractersticas
estruturais necessrias para a inibio da Plm II. O modelo obtido apresentou
capacidades de previso adequadas, bem como valores mais que satisfatrios de
validao. Indicando um modelo estatisticamente confivel e podendo ser utilizados
para a previso da atividade biolgica de compostos ainda no sintetizados. De posse
desse modelo, trabalhos futuros do grupo podero focar na proposio de compostos
mais potentes. Fica evidenciado que as estratgias de planejamento de frmacos por
meio de ferramentas de modelagem molecular so importantes para o planejamento
racional de novos candidatos a frmacos com propriedades melhoradas.

69

REFERNCIAS
AFONSO, A. et al. Malaria parasites can develop stable resistance to artemisinin but
lack mutations in candidate genes atp6 (encoding the sarcoplasmic and endoplasmic
reticulum Ca2+ ATPase), tctp, mdr1, and cg10. Antimicrobial agents and
chemotherapy, v. 50, n. 2, p. 4809, 1 fev. 2006.
ANDRADE, C. H. et al. 4D-QSAR: perspectives in drug design. Molecules (Basel,
Switzerland), v. 15, n. 5, p. 328194, maio 2010.
ARAKAWA, M.; HASEGAWA, K.; FUNATSU, K. The recent trend in QSAR modeling Variable selection and 3D-QSAR methods. Current Computer-Aided Drug Design,
v. 3, n. 4, p. 254262, 2007.
ARAV-BOGER, R.; SHAPIRO, T. A. Molecular mechanisms of resistance in
antimalarial chemotherapy: the unmet challenge. Annual review of pharmacology
and toxicology, v. 45, p. 56585, 7 jan. 2005.
ASOJO, O. A. et al. Novel uncomplexed and complexed structures of plasmepsin II,
an aspartic protease from Plasmodium falciparum. Journal of Molecular Biology, v.
327, n. 1, p. 173181, 2003.
AZOUZI, S.; EL KIRAT, K.; MORANDAT, S. Hematin loses its membranotropic activity
upon oligomerization into malaria pigment. Biochimica et Biophysica Acta (BBA) Biomembranes, v. 1848, n. 11, p. 29522959, 2015.
BARBOSA, E. G.; FERREIRA, M. M. C. Digital Filters for Molecular Interaction Field
Descriptors. Molecular Informatics, v. 31, n. 1, p. 7584, 11 jan. 2012.
BARMADE, M. A et al. Discovery of anti-malarial agents through application of in silico
studies. Combinatorial chemistry & high throughput screening, v. 18, n. 2, p. 151
187, 2015.
BARREIRO, E. J. Medicinal Chemistry and the paradigm of the lead compound.
Revista Virtual de Qumica, v. 1, n. 1, p. 2634, 2009.
BAS, D. C.; ROGERS, D. M.; JENSEN, J. H. Very fast prediction and rationalization of
pKa values for protein-ligand complexes. Proteins, v. 73, n. 3, p. 76583, 15 nov.
2008.
BASCO, L. K.; RINGWALD, P. Molecular epidemiology of malaria in Yaounde,
Cameroon I. Analysis of point mutations in the dihydrofolate reductase-thymidylate
synthase gene of Plasmodium falciparum. The American journal of tropical
medicine and hygiene, v. 58, n. 3, p. 36973, 1998.
BERNSTEIN, F. C. et al. The Protein Data Bank: a computer-based archival file for
macromolecular structures. Journal of molecular biology, v. 112, n. 3, p. 53542, 25
maio 1977.
BHAUMIK, P. et al. Structural insights into the activation and inhibition of histo-aspartic
protease from Plasmodium falciparum. Biochemistry, v. 50, n. 41, p. 88628879,
2011.
BHAUMIK, P.; GUSTCHINA, A.; WLODAWER, A. Structural studies of vacuolar
plasmepsins. Biochimica et Biophysica Acta - Proteins and Proteomics, v. 1824,
n. 1, p. 207223, 2012.
BIAMONTE, M. A.; WANNER, J.; LE ROCH, K. G. Recent advances in malaria drug
discovery. Bioorganic & medicinal chemistry letters, v. 23, n. 10, p. 282943, 15

70

maio 2013.
BJELIC, S. et al. Computational inhibitor design against malaria plasmepsins. Cellular
and Molecular Life Sciences, v. 64, n. 17, p. 22852305, 2007.
BOSS, C. et al. Inhibitors of the Plasmodium falciparum parasite aspartic protease
plasmepsin II as potential antimalarial agents. Current medicinal chemistry, v. 10, n.
11, p. 883907, 2003.
BRAGA, . M. .; FONTES, C. J. F. Plasmodium - Malria. In: NEVES, D. P. (Ed.). .
Parasitologia Humana. 11. ed. So Paulo: Atheneu, 2005. p. 143161.
BRASIL. MINISTRIO DA SADE. SECRETARIA DE VIGILNCIA EM SADE.
DEPARTAMENTO DE VIGILNCIA. Malarias treatment in Brazil practical guide.
2010.
BRASIL. MINISTRIO DA SADE.SECRETARIA DE CINCIA, T. E I. E. (SCTIE). D.
DE C. E T. (DECIT). P. EM SADE NO B. Revista de Sade Pblica. v. 42, n. 4, 2008.
BRINKWORTH, R. I. et al. Hemoglobin-degrading, aspartic proteases of blood-feeding
parasites. Substrate specificity revealed by homology models. Journal of Biological
Chemistry, v. 276, n. 42, p. 3884438851, 2001.
CHIRICO, N.; GRAMATICA, P. Real external predictivity of QSAR models: how to
evaluate it? Comparison of different validation criteria and proposal of using the
concordance correlation coefficient. Journal of chemical information and modeling,
v. 51, n. 9, p. 232035, 2011.
COHEN, N. C. Guidebook on molecular modelling in drug design. San Diego:
Press, Academic, 1996.
CRAMER, R. D.; PATTERSON, D. E.; BUNCE, J. D. Comparative molecular field
analysis (CoMFA). 1. Effect of shape on binding of steroids to carrier proteins. Journal
of the American Chemical Society, v. 110, n. 18, p. 595967, 1 ago. 1988.
CRUCIANI, G. Molecular Interaction Fields. Perugia IT: Wiley - VCH Verlag GmbH
& Co. KGaA, 2006.
DALRYMPLE, U.; MAPPIN, B.; GETHING, P. W. Malaria mapping: understanding the
global endemicity of falciparum and vivax malaria. BMC Medicine, v. 13, n. 1, p. 140,
2015.
DAN, N.; BHAKAT, S. New paradigm of an old target: An update on structural biology
and current progress in drug design towards plasmepsin II. European journal of
medicinal chemistry, v. 95, p. 324348, 2015.
DE ARAJO SANTOS, R. A. et al. Mixed 2D3D-LQTA-QSAR study of a series of
Plasmodium falciparum dUTPase inhibitors. Medicinal Chemistry Research, v. 24,
n. 3, p. 10981111, 6 ago. 2014.
DE FARIAS SILVA, N.; LAMEIRA, J.; ALVES, C. N. Computational analysis of aspartic
protease plasmepsin II complexed with EH58 inhibitor: A QM/MM MD study. Journal
of Molecular Modeling, v. 17, n. 10, p. 26312638, 2011.
DONDORP, A. M. et al. Artemisinin resistance: current status and scenarios for
containment. Nature reviews. Microbiology, v. 8, n. 4, p. 27280, abr. 2010.
DOUGLAS, R. G. et al. Active migration and passive transport of malaria parasites.
Trends in Parasitology, v. 31, n. 8, p. 357362, 2015.
DOWEYKO, A. M. 3D-QSAR illusions. Journal of Computer-Aided Molecular

71

Design, v. 18, n. 7-9, p. 587596, 2004.


ELEBRING, T.; GILL, A.; PLOWRIGHT, A. T. What is the most important approach in
current drug discovery: doing the right things or doing things right? Drug Discovery
Today, v. 17, n. 21-22, p. 11661169, 2012.
ERIKSSON, L. et al. Methods for reliability and uncertainty assessment and for
applicability evaluations of classification- and regression-based QSARs.
Environmental health perspectives, v. 111, n. 10, p. 136175, ago. 2003.
ERSMARK, K.; SAMUELSSON, B.; HALLBERG, A. Plasmepsins as potential targets
for new antimalarial therapy. Medicinal Research Reviews, v. 26, n. 5, p. 626666,
2006.
FAN, H. et al. Comparative study of generalized Born models: protein dynamics.
Proceedings of the National Academy of Sciences of the United States of
America, v. 102, n. 19, p. 67604, 10 maio 2005.
FOURCHES, D.; MURATOV, E.; TROPSHA, A. Trust, but verify: on the importance of
chemical structure curation in cheminformatics and QSAR modeling research. Journal
of chemical information and modeling, v. 50, n. 7, p. 1189204, 26 jul. 2010.
FRIEDMAN, R.; CAFLISCH, A. The protonation state of the catalytic aspartates in
plasmepsin II. FEBS Letters, v. 581, n. 21, p. 41204124, 2007.
FRISCH, M. J.; TRUCKS, G. W.; SCHLEGEL, H. B.; SCUSERIA, G. E.; ROBB, M. A.;
CHEESEMAN, J. R.; SCALMANI, G.; BARONE, V.; MENNUCCI, B.; PETERSSON,
G. A.; NAKATSUJI, H.; CARICATO, M.; LI, X.; HRATCHIAN, H. P.; IZMAYLOV, A. F.;
BLOINO, J.; ZHENG, G.; SONNENB, D. J. g09Wallingford CT, , 2009.
GHASEMI, J. B.; SAFAVI-SOHI, R.; BARBOSA, E. G. 4D-LQTA-QSAR and docking
study on potent gram-negative specific LpxC inhibitors: A comparison to CoMFA
modeling. Molecular Diversity, v. 16, n. 1, p. 203213, 2012.
GINER ALMARAZ, S. et al. Guidelines for Treatment of Malaria in the United States
Guidelines for Treatment of Malaria in the United States. Jama, v. 15, n. 4, p. 227
238, 2010.
GOLDBERG, D. E. Hemoglobin degradation in Plasmodium-infected red blood cells.
Seminars in cell biology, v. 4, n. 5, p. 35561, out. 1993.
GONZLEZ, M. P. et al. Variable selection methods in QSAR: an overview. Current
topics in medicinal chemistry, v. 8, n. 18, p. 16061627, 2008.
GRAMATICA, P. Principles of QSAR models validation: internal and external. QSAR
& Combinatorial Science, v. 26, n. 5, p. 694701, maio 2007.
GRIMBERG, B. T.; MEHLOTRA, R. K. Expanding the Antimalarial Drug Arsenal-Now,
But How? Pharmaceuticals (Basel, Switzerland), v. 4, n. 5, p. 681712, 1 maio 2011.
GUEX, N.; PEITSCH, M. C. SWISS-MODEL and the Swiss-PdbViewer: an
environment for comparative protein modeling. Electrophoresis, v. 18, n. 15, p. 2714
23, dez. 1997.
HANSCH, C.; FUJITA, T. -- Analysis. A Method for the Correlation of Biological
Activity and Chemical Structure. Journal of the American Chemical Society, v. 86,
n. 8, p. 16161626, 1964.
HIDAKA, K. et al. Additional interaction of allophenylnorstatine-containing
tripeptidomimetics with malarial aspartic protease plasmepsin II. Bioorganic and

72

Medicinal Chemistry Letters, v. 17, n. 11, p. 30483052, 2007.


HOFFMAN, S. L. et al. The March Toward Malaria Vaccines. American Journal of
Preventive Medicine, v. 49, n. 6, p. S319S333, 2015.
HOPFINGER, A. J. et al. Construction of 3D-QSAR Models Using the 4D-QSAR
Analysis Formalism. Journal of the American Chemical Society, v. 119, n. 43, p.
1050910524, out. 1997.
HUIZING, A. P.; MONDAL, M.; HIRSCH, A. K. H. Fighting Malaria: Structure-Guided
Discovery of Nonpeptidomimetic Plasmepsin Inhibitors. Journal of Medicinal
Chemistry, 2015.
HUNT, P. et al. Gene encoding a deubiquitinating enzyme is mutated in artesunateand chloroquine-resistant rodent malaria parasites. Molecular microbiology, v. 65, n.
1, p. 2740, jul. 2007.
HYDE, J. E. UKPMC Funders Group Author Manuscript Drug-resistant malaria - an
insight. v. 274, n. 18, p. 46884698, 2009.
J. MEYERS, M.; E. GOLDBERG, D. Recent Advances in Plasmepsin Medicinal
Chemistry and Implications for Future Antimalarial Drug Discovery Efforts. Current
Topics in Medicinal Chemistry, v. 12, n. 5, p. 445455, 2012.
JAKALIAN, A.; JACK, D. B.; BAYLY, C. I. Fast, efficient generation of high-quality
atomic charges. AM1-BCC model: II. Parameterization and validation. Journal of
computational chemistry, v. 23, n. 16, p. 162341, dez. 2002.
JAUDZEMS, K. et al. Plasmepsin Inhibitory Activity and Structure-Guided Optimization
of a Potent Hydroxyethylamine-Based Antimalarial Hit. ACS medicinal chemistry
letters, v. 5, n. 4, p. 373377, 2014.
KHAN, S. M.; WATERS, A. P. Malaria parasite transmission stages: An update.
Trends in Parasitology, v. 20, n. 12, p. 575580, 2004.
KIRALJ, R.; FERREIRA, M. M. C. Basic validation procedures for regression models
in QSAR and QSPR studies: Theory and application. Journal of the Brazilian
Chemical Society, v. 20, n. 4, p. 770787, 2009.
KIRALJ, R.; FERREIRA, M. M. C. Is your QSAR/QSPR descriptor real or trash?
Journal of Chemometrics, v. 24, n. 11-12, p. 681693, 21 nov. 2010.
KISO, A. et al. Search for substrate-based inhibitors fitting the S2 space of malarial
aspartic protease plasmepsin II. Journal of Peptide Science, v. 10, n. 11, p. 641
647, 2004.
KLEIN, E. Y. Antimalarial drug resistance: a review of the biology and strategies to
delay emergence and spread. International journal of antimicrobial agents, v. 41,
n. 4, p. 3117, 4 abr. 2013.
KUBINYI, H. QSAR and 3D QSAR in drug design Part 1: methodology. Drug
Discovery Today, v. 2, n. 11, p. 457467, nov. 1997.
KUNDU, C. N. et al. Anti-malarials are anti-cancers and vice versa One arrow two
sparrows. Acta Tropica, v. 149, p. 113127, 2015.
LAZARUS, M. D.; SCHNEIDER, T. G.; TARASCHI, T. F. A new model for hemoglobin
ingestion and transport by the human malaria parasite Plasmodium falciparum.
Journal of cell science, v. 121, n. 11, p. 193749, 1 jun. 2008.
LINDORFF-LARSEN, K. et al. Improved side-chain torsion potentials for the Amber

73

ff99SB protein force field. Proteins, v. 78, n. 8, p. 19508, jun. 2010.


LONGLEY, R. J.; HILL, A. V. S.; SPENCER, A. J. Malaria vaccines: identifying
Plasmodium falciparum liver-stage targets. Frontiers in Microbiology, v. 6, n.
September, p. 18, 2015.
MARTINS, J. P. A. et al. LQTA-QSAR: a new 4D-QSAR methodology. Journal of
chemical information and modeling, v. 49, n. 6, p. 142836, jun. 2009.
MARVINSKETCH. Figura 1 Plm II crystal structure I) list of important amino acid
residues in their respective pocket. [s.d.].
Mathlab. Natick, MAThe MathWorks Inc., , 2000.
MAZIER, D.; RNIA, L.; SNOUNOU, G. A pre-emptive strike against malarias stealthy
hepatic forms. Nature reviews. Drug discovery, v. 8, n. 11, p. 85464, nov. 2009.
MILANI, K. J.; SCHNEIDER, T. G.; TARASCHI, T. F. Defining the morphology and
mechanism of the hemoglobin transport pathway in Plasmodium falciparum-infected
erythrocytes. Eukaryotic cell, v. 14, n. 4, p. 41526, 2015.
MINISTRIO DA SADE. Doenas infecciosas e parasitrias: guia de bolso.
Cadernos de Sade Pblica, v. 22, n. 11, p. 24982498, 2010.
MIURA, T. et al. Improvement of both plasmepsin inhibitory activity and antimalarial
activity by 2-aminoethylamino substitution. Bioorganic and Medicinal Chemistry
Letters, v. 20, n. 16, p. 48364839, 2010.
MMV. Medicine for Malaria Venture. Interactive R&D portfolio. Disponvel em:
<<http://www.mmv.org/research-development/rd-portfolio>.>. Acesso em: 25 jan.
2016.
MOTA, M. M. et al. Migration of Plasmodium sporozoites through cells before infection.
Science (New York, N.Y.), v. 291, n. 5501, p. 1414, 5 jan. 2001.
MOURA, P. A.; DAME, J. B.; FIDOCK, D. A. Role of Plasmodium falciparum Digestive
Vacuole Plasmepsins in the Specificity and Antimalarial Mode of Action of Cysteine
and Aspartic Protease Inhibitors. Antimicrobial Agents and Chemotherapy, v. 53,
n. 12, p. 49684978, 2009.
MUTHAS, D. et al. Synthesis, biological evaluation, and modeling studies of inhibitors
aimed at the malarial proteases plasmepsins I and II. Bioorganic & medicinal
chemistry, v. 13, n. 18, p. 537190, 2005.
NEVES, D. P. Parasitologia Humana. 11. ed. So Paulo: Atheneu, 2005.
NEZAMI, A. et al. Identification and characterization of allophenylnorstatine-based
inhibitors of plasmepsin II, an antimalarial target. Biochemistry, v. 41, n. 7, p. 2273
2280, 2002.
NEZAMI, A. et al. High-affinity inhibition of a family of Plasmodium falciparum
proteases by a designed adaptive inhibitor. Biochemistry, v. 42, n. 28, p. 84598464,
2003.
NWAKA, S.; RIDLEY, R. G. Virtual drug discovery and development for neglected
diseases through public-private partnerships. Nature reviews. Drug discovery, v. 2,
n. 11, p. 91928, dez. 2003.
OLIVEIRA-FERREIRA, J. et al. Malaria in Brazil: an overview. Malaria journal, v. 9,
n. 1, p. 115, 2010.
ORGANIZATION, W. H. World Malaria Report. [s.l: s.n.].

74

PATEL, H. M. et al. Quantitative structureactivity relationship (QSAR) studies as


strategic approach in drug discovery. Medicinal Chemistry Research, v. 23, n. 12, p.
49915007, 2014.
PREZ, B. et al. Development of Plasmodium falciparum protease inhibitors in the
past decade (2002-2012). Current medicinal chemistry, v. 20, n. 25, p. 30493068,
2013.
PETERSEN, I.; EASTMAN, R.; LANZER, M. Drug-resistant malaria: molecular
mechanisms and implications for public health. FEBS letters, v. 585, n. 11, p. 1551
62, 6 jun. 2011.
PETTERSEN, E. F. et al. UCSF Chimera--a visualization system for exploratory
research and analysis. Journal of computational chemistry, v. 25, n. 13, p. 1605
12, out. 2004.
PIMENTEL, L. F. et al. Nanotecnologia farmacutica aplicada ao tratamento da
malria. v. 43, 2007.
PRAZERES, V. F. V. et al. Nanomolar Competitive Inhibitors ofMycobacterium
tuberculosis andStreptomyces coelicolor Type II Dehydroquinase. ChemMedChem,
v. 2, n. 2, p. 194207, 2007.
REY, L. Os Plasmdios e a malria. In: Parasitologia: parasitos e doenas
parasitrias do homem nos trpicos ocidentais. 4. ed. Rio de Janeiro: Editora
Guanabara Koogan, 2013. p. 207221.
RICHIE, T. L.; SAUL, A. malaria vaccines. v. 415, n. February, p. 18, 2002.
RONCAGLIONI, A.; BENFENATI, E. In silico-aided prediction of biological properties
of chemicals: oestrogen receptor-mediated effects. Chemical Society reviews, v. 37,
n. 3, p. 44150, 28 mar. 2008.
SAMPAIO, V. S. et al. Malaria in the State of Amazonas: a typical Brazilian tropical
disease infl uenced by waves of economic development. v. 48, n. Suppl I, p. 411,
2015.
SCHECHTER, I.; BERGER, A. On the size of the active site in proteases. I. Papain.
Biochemical and biophysical research communications, v. 27, n. 2, p. 15762, 20
abr. 1967.
SCHOLL, P. F.; TRIPATHI, A. K.; SULLIVAN, D. J. Bioavailable iron and heme
metabolism in Plasmodium falciparum. Current topics in microbiology and
immunology, v. 295, p. 293324, jan. 2005.
SHIM, J.; MACKERELL, JR., A. D. Computational ligand-based rational design: role of
conformational sampling and force fields in model development. MedChemComm, v.
2, n. 5, p. 356, 2011.
SILVA, A M. et al. Structure and inhibition of plasmepsin II, a hemoglobin-degrading
enzyme from Plasmodium falciparum. Proceedings of the National Academy of
Sciences of the United States of America, v. 93, n. 19, p. 1003410039, 1996.
SNOW, R. W.; KORENROMP, E. L.; GOUWS, E. Pediatric mortality in Africa:
plasmodium falciparum malaria as a cause or risk? The American journal of tropical
medicine and hygiene, v. 71, n. 2 Suppl, p. 1624, ago. 2004.
TEFILO, R. F.; MARTINS, J. P. A; FERREIRA, M. M. C. Sorting variables by using
informative vectors as a strategy for feature selection in multivariate regression.
Journal of Chemometrics, v. 23, n. 1, p. 3248, 2009a.

75

TEFILO, R. F.; MARTINS, J. P. A.; FERREIRA, M. M. C. Sorting variables by using


informative vectors as a strategy for feature selection in multivariate regression.
Journal of Chemometrics, v. 23, n. 1, p. 3248, jan. 2009b.
TOSCO, P.; BALLE, T. Open3DQSAR: a new open-source software aimed at highthroughput chemometric analysis of molecular interaction fields. Journal of molecular
modeling, v. 17, n. 1, p. 2018, jan. 2011.
TROTT, O.; OLSON, A. J. AutoDock Vina: improving the speed and accuracy of
docking with a new scoring function, efficient optimization, and multithreading. Journal
of computational chemistry, v. 31, n. 2, p. 45561, 30 jan. 2010.
TUTEJA, R. Malaria - an overview. The FEBS journal, v. 274, n. 18, p. 46709, set.
2007.
VAN DER SPOEL, D. et al. GROMACS: fast, flexible, and free. Journal of
computational chemistry, v. 26, n. 16, p. 170118, dez. 2005.
VERMA, J.; KHEDKAR, V. M.; COUTINHO, E. C. 3D-QSAR in drug design--a review.
Current topics in medicinal chemistry, v. 10, n. 1, p. 95115, jan. 2010.
WANG, J. et al. Development and testing of a general amber force field. Journal of
computational chemistry, v. 25, n. 9, p. 115774, 15 jul. 2004.
WEGSCHEID-GERLACH, C.; GERBER, H.-D.; DIEDERICH, W. E. Proteases of
Plasmodium falciparum as potential drug targets and inhibitors thereof. Current topics
in medicinal chemistry, v. 10, n. 3, p. 346367, 2010.
WELLS, T. N. C. New medicines to improve control and contribute to the eradication
of malaria. v. 9, n. Suppl 2, p. 2010, 2010.
WELLS, T. N. C.; ALONSO, P. L.; GUTTERIDGE, W. E. New medicines to improve
control and contribute to the eradication of malaria. Nature reviews. Drug discovery,
v. 8, n. 11, p. 879891, 2009.
WELLS, T. N. C.; VAN HUIJSDUIJNEN, R. H.; VAN VOORHIS, W. C. Malaria
medicines: a glass half full? Nature reviews. Drug discovery, v. 14, n. 6, p. 424442,
22 maio 2015.
WHITE, N. J. et al. Av e rting a malaria disaster. v. 353, p. 19651967, 1999.
WHITE, N. J. Review series Antimalarial drug resistance. Trends in Parasitology, v.
113, n. 8, p. 10841092, 2004.
WHO. WHO | World Malaria Report 2015. 2015.
XUE, L.; BAJORATH, J. Molecular descriptors for effective classification of biologically
active compounds based on principal component analysis identified by a genetic
algorithm. Journal of chemical information and computer sciences, v. 40, n. 3, p.
8019, jan. 2000.

76

6 ANEXOS

6.1 Anexo 1. Script para tratar a matriz de descritores do Open3DQSAR


#!/bin/bash
#
#
for i in /home/carol/Documents/matriz_todas#
do
awk '{ print $1}' desc_fld-01_obj-01.agrd | awk 'FNR>=7' | cut -d "." -f 1 > x.txt
awk '{ print $2}' desc_fld-01_obj-01.agrd | awk 'FNR>=7' | cut -d "." -f 1 > y.txt
awk '{ print $3}' desc_fld-01_obj-01.agrd | awk 'FNR>=7' | cut -d "." -f 1 > z.txt
for i in `seq 1 31680` ; do echo "VDW" >> field1.txt ; done
for i in `seq 1 31680` ; do echo "ELE" >> field2.txt ; done
paste x.txt y.txt z.txt field1.txt -d_ > VDW.txt
paste x.txt y.txt z.txt field2.txt -d_ > ELE.txt
awk 'FNR>=7' desc_fld-01* | awk '{ print $4}' > vdw.dat
awk 'FNR>=7' desc_fld-02* | awk '{ print $4}' > ele.dat
done

6.2 Anexo 2. Script realizado para a realizao dos filtros virtuais no Matlab.
vdwname= VDW;
elename= ELE';
ele=reshape (ele, 31680, 54);
vdw=reshape( vdw, 31680, 54);
ele3=ele2';
vdw3=vdw2';
varLJ=var ( vdw3);
vdw4=vdw3;
vdw4(:,varLJ<0.02)=[];
[vdw4,varLJ]=cutoff_mesmo (vdw3,0.02);
ele4=ele3;
ele4(:,varLJ<0.02)=[];
elename2=elename;

77

elename2(:,varLJ<0.02)=[];
vdwname2=vdwname;
vdwname2(:,varLJ<0.02)=[];
vdw5=vdw4;
elimin=[19222731 34];
vdw5(elimin,:)=[];
ele5(elimin,:)=[];
extLJ=vdw4(elimin,:);
extQQ=ele4(elimin,:);
corr_cut_val(y)
[vdw6,vdwname3] = cdda(vdw5,y,vdwname2,0.1,0.3);
[ele6,elename3] = cdda(ele5,y,elename2,0.1,0.3);
[XoutLJ,Xname_outLJ] = inter_corr_rem(vdw6,vdwname3,y,0.9);
[XoutELE,Xname_outELE] = inter_corr_rem(ele6,elename3,y,0.9);
XN=[XoutLJ XoutELE];
XnameN=[Xname_outLJ Xname_outELE];
d = pdist(X2);
z = linkage(d);
dendrogram(z,0);
ytrain=y;
ytrain(testset)= [];
yext=y(testset);
XN2=XN;
XN2(testset,:)=[];
Xext2=XN(testset,:);
save descN.dat XN2 -ascii
save yextN.day yext -ascii
save ytrainN.dat ytrain ascii

78

6.3 Anexo 3. Tabela com a regresso PLS para o melhor modelo 4D LQTA-QSAR
34,58622
32,98143
34,62861
33,94449
35,11832
32,38606
34,95184
36,42481
36,65759
33,80257
34,09216
34,86923
37,24233
32,53176
32,31909
35,07513
34,57823
34,22676
37,09978
35,7403
31,32228
35,7394
33,65535
38,32029
34,15938
34,77232
38,41507
37,83609
35,09341
37,11355
15,6297
31,49017
34,96353
35,49317
34,58876
35,66969
33,1254

-26,5864
22,53707
-27,6889
-6,85812
-0,23186
-29,9775
20,48283
6,637085
-7,71524
6,58935
-9,16186
11,40218
-0,51467
21,67416
15,34149
48,28254
51,33432
12,35282
64,68356
14,10081
-22,6374
-15,1101
-17,7531
-16,2242
-25,1789
32,35683
49,83027
-16,5183
-12,5611
66,75574
-3,33622
-14,5028
36,41247
-26,2865
-61,3604
-49,9338
-57,3448

34,00342
35,69502
37,59481
34,14438
34,08909
35,25512
34,83275
35,37526
35,50188
34,68317
36,74104
36,6443
35,71986
33,56827
32,97112
33,66425
34,93441
34,76508
36,57412
36,9441
36,53522
36,5642
38,32017
36,13382
37,30352
38,02796
36,05158
36,32409
37,60172
35,38187
38,70792
36,19517
34,07679
34,15069
36,58301
35,84031
18,57819

Vetor de regresso
0,073078
0,0065555
0,06235406
-0,00486644
0,01830458
0,02077115
0,00309439
-3,49385318
0,01240195
0,01425531

-61,7916
-16,6665
-41,5923
-73,6739
-39,8034
43,96798
-70,1234
-106,441
8,694194
29,13157
9,337798
31,74899
-201,33
-22,4891
-55,7464
-46,7692
-1,39963
-11,9591
17,38044
-59,3608
-30,3597
-54,7008
19,45007
-25,0638
-52,5167
-25,482
-72,5363
-55,4929
-50,417
-37,1926
-3,98568
17,63766
-80,2636
19,91936
-12,3259
-2,06757
-7,83085

Descritores
1,850097 1,369324
31,35194 0,080294
10,13478 7,518929
20,57318 4,625244
3,565506 19,17647
31,7857 4,641404
-0,27574 2,483003
31,72549 0,489916
7,526613 22,50404
-0,32773 7,321241
32,17135 1,860433
-0,18126 3,500519
30,79509 31,97454
32,14644 32,28259
11,44379 22,66038
-0,38247 16,65829
34,15524 1,175658
31,39277 8,121331
29,12618 11,16674
0,94865 1,605744
31,61793 32,20605
32,2582 1,069265
11,346 30,97021
31,19549 8,712752
32,37888 9,158957
9,167486 1,91983
32,88108 25,61545
9,917931 2,189746
-0,33218 31,99676
36,23695 1,368796
-0,57096 -0,29545
1,271896 1,133354
1,663467 5,951532
6,182395 6,521636
0,097181 3,728484
1,707503 0,25094
-0,32949 -0,45855

-57,5891
-70,9426
-88,1076
-90,0973
-88,5303
-76,798
-115,336
-81,7706
-43,8311
-32,6947
-41,4951
-59,4224
-94,3062
-45,0082
126,2354
-203,218
9,314931
53,30782
-22,9858
-17,67
8,581951
-21,4922
-29,9616
-0,3877
-21,8296
-40,9488
-5,16806
0,246465
-25,2275
-39,1844
-17,3468
-29,5976
-82,1483
-44,2121
-111,765
-178,711
-64,8361

-0,13128
-0,11563
-0,13269
-0,13062
-0,09555
-0,05589
-0,1232
0,078381
-0,14196
-0,05752
-0,06722
-0,07365
-0,17544
-0,04788
-0,17194
-0,11206
-0,1251
-0,13414
-0,10867
-0,15395
-0,20464
-0,22532
-0,23587
-0,10226
-0,23007
-0,05417
-0,145
-0,10417
-0,1353
-0,1376
-0,02351
-0,03437
-0,23326
-0,07405
-0,06412
-0,05801
-0,06766

-16,3696
-17,2638
-11,3574
-12,1956
-14,5177
-16,3869
-19,9878
-15,839
-18,3921
-29,6135
-17,274
-13,8183
-6,58456
14,3798
-12,0359
14,95574
7,044745
21,48538
-16,2568
-3,41493
-10,9782
-18,4599
-15,1136
-13,1842
-33,4492
-13,6285
0,512689
-11,3757
-3,2853
-10,6176
-13,3842
-14,0198
-13,9145
-27,2159
-45,2052
-62,8218
-77,6581

6,685121
-0,03453
10,15886
2,33021
10,86729
-0,05132
22,26222
31,3525
32,48228
2,604802
4,029307
28,92
33,22965
-0,22204
0,32527
31,26275
4,931028
18,23493
32,19693
26,60423
-0,3311
31,00199
1,94004
33,25722
3,210202
17,4188
33,03444
33,07935
6,459479
32,36128
-0,32932
-0,29345
8,562773
13,87245
7,617981
23,67948
1,642828

79

Termo independente
1,75631127

2,527491639
-0,174287211
2,120251104
0,300705017
0,033865249
0,028442434
-0,17820298
0,458684925
-0,203014465
0,095298472
5,009234183

Vetor de Regresso x Descritores


2,410217 2,53059 2,480595
2,566377
0,147742 -0,18151 -0,04496
-0,00152
2,22573 2,344189 2,129041
2,125593
0,081107 0,202406 0,35853
0,193701
0,573884 0,185513 0,376583
0,065265
0,001668 0,156177 0,096072
0,398317
-0,21952 -0,27264 -0,2788
-0,27395
0,403981 0,463586 0,456357
0,333831
-0,2141 -0,14085 -0,15125
-0,18005
-0,00049 0,144818 0,033218
0,154917
5,410208 5,432271 5,455392
5,382485

2,366709
-0,19652
2,1983
-0,21397
0,581824
0,096407
-0,23764
0,195276
-0,20323
-0,00073
4,586427

2,55421
0,134275
2,171963
0,341251
-0,00505
0,051575
-0,3569
0,430448
-0,24789
0,317355
5,391248

2,661852
0,043509
2,205791
0,517987
0,580722
0,010176
-0,25303
-0,27385
-0,19643
0,44694
5,74366

2,678864
-0,05058
2,213686
-0,04231
0,137771
0,467435
-0,13563
0,495974
-0,2281
0,463045
6,00016

2,470224
0,043196
2,162636
-0,14177
-0,006
0,152071
-0,10117
0,200955
-0,36727
0,037132
4,450013

2,491387
-0,06006
2,290953
-0,04544
0,588883
0,038643
-0,1284
0,23486
-0,21423
0,057439
5,25403

Vetor de Regresso x Descritores (continuao)


2,548173 2,721595 2,377356
2,361814
2,563221 2,526908 2,501223 2,711178 2,61183
0,074747 -0,00337 0,142085
0,100571
0,316516 0,336522 0,080979 0,424033 0,092438
2,284921 2,227278 2,093118
2,055883
2,099103 2,178302 2,167744 2,280545 2,303615
-0,1545 0,979761 0,109442
0,271286
0,227599 0,006811 0,058198 -0,08458 0,288876
-0,00332 0,563691 0,588427
0,209474
-0,007
0,625197 0,574631 0,533142 0,017365
0,07271 0,664148 0,670547
0,470682
0,346012 0,02442 0,168689 0,231946 0,033353
-0,18388 -0,29182 -0,13927
0,390622
-0,62884 0,028824 0,164955 -0,07113 -0,05468
0,257332 0,612956 0,167294
0,600739
0,391523 0,437094 0,46868 0,37966 0,537872
-0,17137 -0,08166 0,178338
-0,14927
0,18548 0,087369 0,266461 -0,20162 -0,04235
0,412264 0,473699 -0,00317
0,004637
0,44566 0,070293 0,259945 0,458977 0,379252
5,137075 7,866272 6,184167
6,316439
5,939276 6,321741 6,711506 6,662158 6,16757

2,28897
-0,1484
2,278119
0,147743
0,578753
0,668957
0,026556
0,714988
-0,13615
-0,00472
6,414816

Vetor de Regresso x Descritores (continuao)


2,611764 2,459466 2,80037 2,496299
2,541092
-0,09905 -0,11638 -0,10636 -0,16506
0,212115
2,279926 2,389418 2,25309 2,326026
2,371198
0,266198 -0,09465 0,121972 0,255569
0,124007
0,590473 0,207684 0,57102 0,592682
0,167807
0,02221 0,643287 0,180974 0,190242
0,039877
-0,06651 -0,09271
-0,0012 -0,06755
-0,12671
0,787251 0,824101 0,357281 0,803836
0,189264
-0,22894 -0,18744 -0,16351 -0,41484
-0,16902
0,441943 0,027656 0,474092 0,045762
0,24831
6,605267 6,060428 6,487731 6,062972
5,597938

1,142187
-0,02187
2,413596
0,019396
-0,01045
-0,00614
-0,05368
0,082127

Vetor de Regresso x Descritores (continuao)


2,301238 2,555065 2,59377
2,527677
2,60667 2,420738 1,142187 2,301238 2,555065
-0,09507 0,238702 -0,17232
-0,40225
-0,32734 -0,37592 -0,02187 -0,09507 0,238702
2,256916 2,124826 2,129434
2,281099
2,234789 1,158426 2,413596 2,256916 2,124826
-0,08583 0,390598 -0,09694
0,059983
0,010062 0,038108 0,019396 -0,08583 0,390598
0,023282 0,030449 0,113166
0,001779
0,031255 -0,00603 -0,01045 0,023282 0,030449
0,023541 0,12362 0,135462
0,077445
0,005212 -0,00952 -0,00614 0,023541 0,12362
-0,09159 -0,2542 -0,13681
-0,34584
-0,553 -0,20063 -0,05368 -0,09159
-0,2542
0,120096 0,814979 0,258711
0,224019
0,202696 0,236404 0,082127 0,120096 0,814979

2,807297
0,326662
2,247962
0,352994
0,601874
0,532062
-0,01599
0,506592
0,006358
0,470916
7,836726

2,764986
-0,10829
2,264954
0,270053
0,181544
0,045484
0,000763
0,36397
-0,14108
0,471556
6,113943

2,564556
-0,08234
2,34462
0,245351
-0,00608
0,664609
-0,07806
0,472733
-0,04074
0,092082
6,176719

2,712184
0,437617
2,206203
0,180995
0,663302
0,028431
-0,12125
0,480766
-0,13168
0,46132
6,917889

80

-0,16599 -0,17387 -0,17257 -0,33753


-0,00469 -0,00418 0,122065 0,197756
3,394486 4,274524 5,973538 4,684702

Somatrio +
TI
6,765545453
7,166518793
7,18858251
7,211703045
7,138796681
6,342738668
7,147559184
7,499971606
7,756471563
6,206323902
7,010341674
6,893386475
9,622583286
7,940478713
8,072750606
7,69558736
8,078051863
8,467816936
8,418469763
7,923881317
8,17112743
8,361578414
7,816739221
8,244042377
7,819283364
7,354249284
9,59303709
7,870254531
7,933030118
8,674200199
5,150797243
6,030835479
7,72984956
6,441013222
5,728186628
5,525098729
4,078185971

-0,56063
0,108597
3,971875

-0,77911 -0,96311 -0,16599 -0,17387 -0,17257


0,337558 0,023419 -0,00469 -0,00418 0,122065
3,768787 2,321875 3,394486 4,274524 5,973538

Ycal
6,765546
7,166519
7,188583
7,211704
7,138797
6,342739
7,14756
7,499972
7,756472
6,206324
7,010342
6,893387
9,622584
7,940479
8,07275
7,695589
8,078052
8,467817
8,41847
7,923881
8,171127
8,361579
7,816739
8,244042
7,819284
7,35425
9,593037
7,870255
7,93303
8,674201
5,150797
6,030836
7,72985
6,441013
5,728187
5,525099
4,078186

6.4 Anexo 4. Arquivo pdb das coordenadas dos descritores.


MODEL 1
HETATM

1 C VDP

-7.000 -15.000 -41.000 1.00 0.00

HETATM

2 C ELP

-1.000 -13.000 -51.000 1.00 0.00

81

HETATM

3 C VDP

HETATM

4 C ELN

HETATM

5 C VDP

0.000 -16.000 -52.000 1.00 0.00

HETATM

6 C VDP

-4.000 -15.000 -38.000 1.00 0.00

HETATM

7 C ELP

4.000 -17.000 -47.000 1.00 0.00

HETATM

8 C VDN

-11.000 -8.000 -38.000 1.00 0.00

HETATM

9 C ELP

-1.000 -9.000 -46.000 1.00 0.00

HETATM 10 C VDP

0.000 -16.000 -46.000 1.00 0.00


-7.000 -7.000 -42.000 1.00 0.00

-8.000 -16.000 -41.000 1.00 0.00

C
C

C
C

END

6.5 Anexo 5. Artigo

QSAR study of Plasmepsin II inhibitors from Plasmodium falciparum: application of the 4D


LQTA-QSAR methodology.

Carolina Arruda Braz Edjan Carlos Dantas da Silva Euzbio Guimares Barbosa *
Department of Pharmacy. Natal, RN-Brazil.
Email:
Abstract
Malaria represents an actual scenario of importance for Drug Discovery. Plasmodium falciparum, the most virulent
form of the parasite, adds the increasing resistance of the current therapy to the issue. Plasmepsin II is part of a
group of aspartic protease responsible for Plasmodium's metabolism of hemoglobin, representing a potential
pharmaceutical target for malaria inhibition. The repertoire of inhibiting compounds from plasmepsin II were used
to build LQTA-QSAR models. Molecular Dynamics was performed previously, to understand better the potential
inhibitors binding mode and to compose the construction of the predicting model. The LQTA-QSAR model was
obtained by calculating Coulomb and Lennard-Jones descriptors from the aligned conformations with
Open3DQSAR. The model was built using 37 samples with 10 variables and 2 latent variables using PLS
regression. The model obtained a Q:0.92; R: 0.95 and a prediction Q: 0.78 from a test set of 12 molecules. With
a better understanding of the binding mode through molecular dynamics, it was possible to reach better results on
constructing a 4D predicting model instead of a 3D, mainly due to the difficulty presented by the protein flexibility.
The model has good statistics, robustness (by Leave-N-out-tests) and can be used to predict the activity of proposed
Plasmepsin II inhibitors.

Keywords: malaria, LQTA-QSAR, plasmepsin II, 4D QSAR

82

Introduction
Malaria is caused by a parasite of the genre Plasmodium and constitutes a large threat to human health. Infections
with malaria parasite results in half a million cases of death, mostly among African children (ORGANIZATION,
2014). Of the four species of Plasmodium parasites, P. vivax, P. ovale, P. malariae and P. falciparum, the last is
the most lethal and responsible for the increase in malaria resistance for the current drug therapy (HYDE, 2009;
SNOW; KORENROMP; GOUWS, 2004; WHITE et al., 1999). Artemisin-based combination therapies have been
recommended by the World Health Organization as first line treatment for P.falciparum malaria in endemic
countries, but increasing resistance to these treatments has stimulated the search and development of new drugs
with novel modes of action(BIAMONTE; WANNER; LE ROCH, 2013; DONDORP et al., 2010; KLEIN, 2013;
WELLS; VAN HUIJSDUIJNEN; VAN VOORHIS, 2015; WHITE, 2004).
The life cycle of the parasite involves a sexual (invertebrate host) and asexual (hepatocyte and erythrocyte) stage
in which the latter takes place in the human body. Most symptoms manifest themselves when the developing
parasites are released from the red blood cells. The parasite degrades human hemoglobin in the food vacuole to
produce essential amino acid for development and maturation (KHAN; WATERS, 2004; TUTEJA, 2007). A class
of eukaryotic Aspartate proteases of P. falciparum, plasmepsins (Plms) are involved in this process and are
currently under investigation as drug targets (ERSMARK; SAMUELSSON; HALLBERG, 2006; HUIZING;
MONDAL; HIRSCH, 2015).
Ten different plasmepsins have been identified in the P. falciparum while four (I IV) are active in the food
vacuole during intra-erythrocytic (BHAUMIK; GUSTCHINA; WLODAWER, 2012). Plasmepsins are one of the
oldest targets that still hold interest among drug discovery to develop novel antimalarial drugs(DAN; BHAKAT,
2015). Structure-based drug design focus mainly in Plm II as a target since it is the first protein which a crystal
structure available, consisting of a starting point to develop novel protease inhibitors as promising antimalarial
agents (HUIZING; MONDAL; HIRSCH, 2015; SILVA et al., 1996). Plm II sequence also enabled the
development of in silico models for Plm I, IV and HAP as the binding site region of these proteins are similar
(ERSMARK; SAMUELSSON; HALLBERG, 2006).
The mature Plm II consists of 329 amino acid residues and a single peptide chain folded into two domains (C- and
N-terminal). It's connected to the bottom of the binding cleft via a catalytic dyad ( formed by Asp34 and Asp214
residues ), a -hairpin turn and the flap, which covers the active site and interacts with the substrate (ASOJO et
al., 2003). Crystal structure of Plm II ( PDB code 4CKU (JAUDZEMS et al., 2014)) and a list of important amino
acid residues in their respective pockets (BRINKWORTH et al., 2001) are displayed in Figure 1. The pockets are
represented according to Schechter (SCHECHTER; BERGER, 1967) adapted from Huizing et al. (HUIZING;
MONDAL; HIRSCH, 2015) ( Table 1). In blue the S2 pocket; in orange the S1 pocket; in yellow the flap; in red
the catalytic dyad; in green the S1/S3 pocket and the S2 pocket in purple.
Fig. 1 Plasmepsin II crystal structure.

83

Table 1. List of amino acid residues in their respective pocket.


Asp
dyad

Flap

S1/S3

S2

S1'

S2'

Asp34,
Asp214.

Pro43,
Met75,
Val105,
Phe111,
Ile123.

Tyr17,
Ile32,
Ser215, Ser218,
Phe120, Met15,
Ile123,Ile14,
Thr114.

Pro243, Leu271,
Phe244,
Met286, Ile290,
Tyr273.

Tyr192,
Trp193,
Ile300,
Ile212,
Phe294.

Asn39,
Leu131,
Ser132,
Ile133.

Peptidomimetic inhibitors are the first choice when developing compounds targeting proteases due to its isosteric
nature with non-cleavable transition-state complex(DAN; BHAKAT, 2015). Allophenylnorstatine based
compounds have been selected as they mimic the protein substrate transition state. Since plasmepsins are capable
of making an initial cleavage in the hemoglobin alpha chain between residues Phe33 and Leu34 (DE FARIAS
SILVA; LAMEIRA; ALVES, 2011; FRIEDMAN; CAFLISCH, 2007). These compounds are characterized as
containing a unique unnatural allophenylnorstatine [Apns; (2S, 3S) amino-2-hydroxy-4phenylbutyric acid]
(NEZAMI et al., 2002).
Quantitative structureactivity relationship (QSAR) methods have become an essential part of modern drug design,
allowing cost and time saving. There is no more a drug developed without previous QSAR analyzes (ANDRADE
et al., 2010). Since these studies are helpful in understanding and explaining the drug action mechanism at the
protein active site in addition to suggesting designs of more specifics drug candidates (VERMA; KHEDKAR;
COUTINHO, 2010). QSAR methodology is based on the concept of quantitative correlation between differences
presented in a biological activity and differences in their structural or physicochemical properties per statistical or
mathematical tools (PATEL et al., 2014).
3D QSAR analysis is a common method used in molecular design, but the 4D QSAR analysis introduced initially
by Hopfinger et al. (HOPFINGER et al., 1997), includes the conformational flexibility and freedom of alignment
to the development of the model. In this study, an alternative 4D QSAR approach LQTA-QSAR (MARTINS et

84

al., 2009) and such model can be used to screen libraries of compounds and design novel potentially active
molecules.
In this study, molecular dynamics simulations and docking were combined to simulate the interaction of
allophenylnorstatine-based compounds within the active site of the Plasmepsin II for a better understanding of the
binding mode of these inhibitors. A LQTA-QSAR 4D model based was built to predict inhibitory potency and
provide means to design new drug-like ligands.

Methods
Dataset of known Plasmepsin II inhibitors
A dataset of Allophenylnorstatine-based Plasmepsin II inhibitors with a common thiazolidinecarboxylic ring and
their biological activities (Ki values) was taken from the literature (HIDAKA et al., 2007; KISO et al., 2004;
MIURA et al., 2010; NEZAMI et al., 2002). Divided into a training set of 37 compounds and a test set of 12
compounds, chosen by means of picking samples evenly in a dendrogram derived from Hierarchical Cluster
Analysis. The Hierarchical Cluster Analyses was performed with a complete as linkage scheme, considering the
distribution of both biological data values and structure diversity. The K i values in units of molarity (M) were
transformed in pKi (-log Ki). Also, inaccurate values were not included in the study. Molecules in the test set were
used to evaluate the predictivity of the LQTA-QSAR model developed. Compound 33 (Table 2) was used as
reference molecule (template) due to its high potency.
The chemical structures and biological activity values of all compounds are present in Table 2.

Table 2. Structures of all selected molecules taken from the literature.

Composto

R1

R2

R3

pKi

CH3

8.04

CH3

CH3

7.7

CH3

8.07

CH3

CH3

7.92

CH2 CH3

9.16

CH2 CH3

CH2 CH3

8.29

CH2 CH3

CH2 CH3

8.37

CH2 CH3

CH2 CH3

CH2 CH3

85

Composto

pki

Composto

pki

9.30

17

6.95

10

7.14

18

6.14

11

7.65

19

7.02

12

6.27

20

7.38

13

7.95

21

6.25

14

6.26

22

7.25

15

7.82

23

86

16

Composto

R1

24

6.56

R2

R3

R4

Pki

25

4.02

26

CH3

CH3

5.06

27

4.89

28

CH3

CH3

5.85

29

CH3

CH3

7.15

87

30

5.03

31

6.22

32

CH3

CH3

7.52

CH3

CH3

7.69

34

35

5.09

33

88

Composto4

pKi

36

8.52

37

7.82

8.05
38

39

9.7

40

8.3

89

Composto4

R1

R2

R3

pki

41

CH3

7.75

42

CH3

8.30

43

NH2

8.40

44

NH2

7.92

45
46
47

OH
OCH3

OH
-

7.95
8.40
8.05

48

OCH3

7.77

49

OCH3

8.40

All the 3D structures were constructed using MarvinSketch (MARVINSKETCH, [s.d.]). The molecular
protonation state was estimated at pH = 7.40 to simulate physiological conditions, and hydrogens were added
properly. All structures were curated using the Fourches and Tropsha protocol (FOURCHES; MURATOV;
TROPSHA, 2010) to guarantee proper final model quality. Furthermore, energy minimizations were performed
with the MMFF94 force field and semi-empirical PM6 level of energy with Gaussian (FRISCH, M. J.; TRUCKS,
G. W.; SCHLEGEL, H. B.; SCUSERIA, G. E.; ROBB, M. A.; CHEESEMAN, J. R.; SCALMANI, G.; BARONE,
V.; MENNUCCI, B.; PETERSSON, G. A.; NAKATSUJI, H.; CARICATO, M.; LI, X.; HRATCHIAN, H. P.;
IZMAYLOV, A. F.; BLOINO, J.; ZHENG, G.; SONNENB, 2009), AM1-BCC charges were added using UCSF
Chimera (PETTERSEN et al., 2004).

The Receptor
A Plasmepsin II 3D structure was retrieved from Protein Data Bank under the code 4CKU (JAUDZEMS et al.,
2014). The missing amino acid residues side chains were properly rebuilt using Swiss-Model webserver (GUEX;
PEITSCH, 1997), and their protonation states were set to pH=7.40 using PROPKA3 web server (BAS; ROGERS;
JENSEN, 2008). The final protein model was used to perform molecular docking with the compound 33 (most
active one).

Molecular docking
Automatic molecular docking was not able to give correct bioactive conformers. Every automatically docked
conformations diverge extensively from what was expected for Allophenylnorstatine-based Plasmepsin II
inhibitors binding poses. Based on the known ligand co-crystalized with the receptor (JAUDZEMS et al., 2014).
Even redocking experiments were utterly unsuccessful. It was decided to perform a manual docking procedure
with the atom-by-atom mouse movement and torsions adjustments tool implemented in UCSF Chimera. Geometry

90

optimizations were carried out to eliminate distortion on atoms positions. The manually docked ligands were
further optimized to simulate induced fit performing molecular dynamics simulations.
The Molecular Dynamics (MD) simulations for all ligand-receptor complexes were performed using the
GROMACS software. Every initial state was obtained from a previous docking procedure. The simulations of all
the ligands were executed considering implicit solvent using Generalized Born formalism (FAN et al., 2005).
Initially, all complexes had their geometry optimized utilizing the steepest descent algorithm and if the criteria for
convergence was not found the LBFGS algorithm was used to reach system convergence. Restraints were added
to the protein backbone and partially to the side chains. A leap-frog algorithm integrator was used for integrating
Newtons equations of motion, the center of mass translation and rotation was removed around the center of mass,
all bonds were converted to constraints. Lennard-Jones and Coulombic interactions were cut off at 2 nm. The
simulations procedures lasted about 2000 ps.

After Molecular dynamics simulation with the compound 33, the binding site was shaped to enable proper docking
of the remaining ligands of the data set. Every complex was yet submitted to further refinement employing
molecular dynamics simulations.

Receptor-Dependent 4D LQTA-QSAR model

The methodology to create a 4D-QSAR model followed the principles of the LQTA-QSAR methodology
previously described (MARTINS et al., 2009). Initially, the energy-optimized structures were submitted to the
topobuild program for generating the GAFF (WANG et al., 2004) topology files for GROMACS (VAN DER
SPOEL et al., 2005). The conformations necessary to create the model were retrieved from MD simulations. Every
simulation started with the initial coordinate resulted from the docking of each ligand to the binding site. An
optimal conformational was selected from the result of the MD simulations of all 49 molecules from the data set.
The selection was based on a clustering analysis of all MD frames using USCF Chimera clustering tool. The
selected conformation of each molecule from the MD process was considered on how often each ligand presented
it.

The selected conformations for each molecule from the MD simulations were aligned and submitted for the
calculation of molecular interaction descriptors using open3Dgrid (TOSCO; BALLE, 2011) free package.
Lennard-Jones ( LJ) and Coulomb (QQ) descriptors were generated as described in Barbosa et al. 2012
(BARBOSA; FERREIRA, 2012). A grid box was created with a spacing of 1.0 and grid size 33 x 32 x 30 to
calculate 63360 descriptors.

Data preprocessing and descriptors filtering methodology was applied as described by Barbosa and Ferreira
(BARBOSA; FERREIRA, 2012). The generated matrix with a dimension of 49 x 63360 in the following steps.
An energy cut-off for LJ descriptors was performed to avoid positive values with a higher order of magnitude and
to keep information in the region close to the molecules atoms. As follows in Equation 1, if a LJ descriptor at a

, , position had value of energy equal or lower than 30 kcal/mol, no cut-off would be applied. If not, then the
logarithmic value of the residual would be added to 30 kcal/mol.(MARTINS et al., 2009)

91

Equation 1

,, 30 1 ,, = ,,
,,
,, > 30 1 ,, = 30 + (
29)
1

Variables with variance lower than 0.02 kcal/mol were excluded. Descriptors having the absolute values of
correlation between each descriptor and biological activity (independent and latent variable, respectively) lower
than 0.3 were eliminated. Descriptors showing poor distribution when compared to the biological activity were
eliminated using a digital filter described on reference (BARBOSA; FERREIRA, 2012) and finally, nearly
identical descriptors were discarded, only kept those with the best correlation with the latent variable.

After filtering, the data set was divided into a training set and a test set based on dendogram obtained by
Hierarchical Cluster Analysis (KIRALJ; FERREIRA, 2010). The lowest and highest value of Ki were never
selected for the external data set. The training set containing 37 compounds was used to develop the LQTA QSAR
model and the test set, with 12 compounds, to evaluate the predictive ability of the built model. The Ordered
Prediction Selection algorithm (OPS) was applied for the selection of the most informative variables on the
remaining descriptors (TEFILO; MARTINS; FERREIRA, 2009b) and then partial least square (PLS) regression
methods were used to obtain the QSAR model.

Model Validation

The robustness and presence of chance correlations of the best model were examined by Leave-N-out (LNO) crossvalidation and y-randomization, respectively. Leave-one-out (LOO) was applied to define the optimum number of
factors in PLS (KIRALJ; FERREIRA, 2009). In the LNO cross-validation, N compounds N (1, 2) were left out
from the training set, a new model is built without it, and the values of the dependent variable are predicted. A
correlation coefficient (Q) is calculated and the model is considerate robust if the deviation of Q2 LNO values
from the Q2 LOO value does not exceed 0.05 for at least 20-30% of data set samples (GRAMATICA, 2007;
KIRALJ; FERREIRA, 2009). In the y-randomization test, PLS models are built using the scrambled dependent
variable vector and the models obtained should be of a poor quality. It was created a plot with the correlation with
the scrambled y (|r|) with it in the correct order v.s. Q and R2. Simple linear curves fitting of |r| x Q2yrand and |r| x
R2yrand are made. Models obtained not by chance correlation model have intercepts aQ < 0.05 and aR < 0.3
(ERIKSSON et al., 2003).
Equation 2

92

i)

= + ||

ii)

= + ||

The external predictability was evaluated by external Q statistical parameters (KIRALJ; FERREIRA, 2009). The
descriptors of the best model were illustrated by UCSF Chimera that also contributed to the interpretation of the
relationships between their positions and the adjacent binding site.

Results and discussion


Since all the ligands on the data set had an allophenylnorstatine scaffold, it was possible to establish similar binding
modes to construct of the LQTA-QSAR model. Automated docking procedures, however, were not successful in
providing reliable results. Given that Plm II and ligands are highly flexible (HUIZING; MONDAL; HIRSCH,
2015) the proper superimposition of the biological conformations was not obtained in an automatic fashion. A 4DQSAR model was due, combining manual docking with molecular dynamics to simulate the induced fit and adapt
the proteins binding site. Compound 33 was chosen to shape the binding site by means of MD simulation.
Translations and rotations of the bound pose helped to produce the initial input conformation for the MD
simulation. Figure 2 shows the protein after the binding site adaptations with compound 33 in the binding site.
Fig. 2 Ligand co-crystalized with Plm II 4CKU crystal (blue) and Compund 33 (purple) after binding site adaptation.

It was observed that the thiazolidine portion of the ligand occupied the protein S1 pocket allowing the ligand
branch to reach the S2 pocket. Reaching a more stable conformation than presented on the crystallographic form.
In all simulations, the benzyl side chain interacted with the residues on the S1/S3 pocket showing -interactions
with Phe120, Tyr77, and Phe111 (flap). The catalytic dyad formed by Asp 34 and Asp214 residues interacts with

93

the hydroxyl and carbonyl on the Apns scaffold forming an H-bond with the carboxylate oxygens of the aspartates.
The thiazolidine ring interacted with Tyr192, Ile 300 and Ile 212 residues of the hydrophobic S1 pocket. The fact
that the ligands are designed to mimic a substrate transition state is clear from the binding mode, where the inhibitor
extend on both sides of the catalytic center and are intended to fill optimally the S1/S3 and S1 pockets (SHIM;
MACKERELL, JR., 2011).

Fig. 3 Plm II complexed with compound 33 after binding site adaptation.

The resulting treatment of the conformation provided seemingly suitable aligned allophenylnorstatine ready to
construct 4D LQTA-QSAR models. After the descriptors filtering and selection procured by the OPS (TEFILO;
MARTINS; FERREIRA, 2009b) a model having good statistics parameters (Q = 0.92, R = 0.95) and suitable
external prediction (Qext = 0.79). A PLS model was built containing 2 latent variables and 10 selected descriptors.
Figure 4 shows the scatterplot predicted biological activity versus experimental K i values. The recommended
validation procedures for QSAR models were performed, ensuring the robustness and avoiding chance correlation
(KIRALJ; FERREIRA, 2009). The best model maintained predictability up to 15 samples (40%) in the Leave-Nout validation. The QLOO/QLNO ratio presents values lower than 0.05. The y-randomization required linear
regression delivered intercepts and values for lower than 0.3 and 0.0 (ERIKSSON et al., 2003), respectively,
as shown in Figure 4.

Fig. 4 Validation performed on the final model. a. The plot of calculated pKi values versus experimental ones,
black dots are training set samples and in red the external set. b. The regression curve computed for the real model
Q2 values and the ones obtained with the randomized Q2 values. c. The regression curve computed for the real
model R2 values and the ones obtained with the randomized R2 values d. Leave-N-out validation.

94

Descriptors of the best model are graphically represented in Figure 5 (dark and light blue, orange and red spheres).
Lennard-Jones descriptors (LJ) are presented as orange and red (negative and positive regression sign,
respectively). Electrostatics descriptors (QQ) in light, and dark blue (negative and positive regression sign,
respectively). The biological conformation of the best active compound 33 (Figure 5a) and an inactive analog,
compound 25 (Figure 5b) is shown to facilitate the visualization of the descriptors positioning.

Fig. 5 Descriptors of the best model.

95

The only negative Lennard-Jones (LJ8) descriptor, in orange, is related to the adjacent residues within Plm II
binding pocket, Tyr192 and Leu131, representing unfavorable steric interaction correlated with the biological
activity. The three positive LJ descriptors (LJ10, LJ1, and LJ6) in red near the thiazolidine ring address to favorable
steric regions. The presence of hydrophobic substituents such as dimethyl substituents present in compound 33
(Figure 5a) and other compounds of the data set correlate to a further increase in the biological inhibitory potency.
Lack of these substituents (Figure 5b) reflects in poor biological activity. Even so, these descriptors correlate to
the orientation that the sulfur in the thiazolidine ring binds to the site. Futher from the optimum conformation
presented by compound 33 shows decrease the activity as shown more specifically in Figure 6. The positive
descriptors LJ3 and LJ5 relate to favoring bulky substituents in the S1 pocket region, as corroborated in other
studies (MUTHAS et al., 2005), that greater activity is correlated with more bulk in this region.

Fig. 6 Orientation of the thiazolidine ring of compound 33 (blue) and 30 (gray).

96

The positive QQ7 descriptor represents favorable electronegative region and can be correlated with the addition
of polar groups interacting especially with the S1 pocket increasing the inhibitory activity. As shown in Figure
5b inactive ligands do not interact fully with this pocket. The positive descriptor QQ2 can be described as
modifications increasing the electronegativity on the phenyl portion. Descriptor QQ9 also relate favorable to
electronegative modifications, related with interactions with Tyr77 residue. The only negative descriptor QQ4
relates to the presence of negative interactions electronically increasing the activity. Also, aliphatic substituents
have less inhibitor activity than cyclic in this position.

The binding pocket along with the descriptor positions and selected ligands are available to the reader to perform
their screening procedures. An Excel spreadsheet gives the PLS regression 4D-LQTA-QSAR equation for
immediate usage. What is required are (i) bound ligand proposals within the provided pocket and (ii) computation
of open3Dgrid energy for the model descriptors specific positions and nature. LJ descriptors must be modified
according to equation 1.

Conclusion
A 4D LQTA-QSAR model was constructed for an allophenylnorstatine-based data set of Plasmepsin II inhibitors.
The model presented excellent statistical parameters and is suitable prediction power, allowing the model to be
used as assistance on a drug development research. The results enable a better understanding of the binding mode
of the Plm II and explaining structural features that reflect in the determined biological response of inhibiting the
parasite. These insights can be helpful to screening and designing new active compounds.

AFONSO, A. et al. Malaria parasites can develop stable resistance to artemisinin but lack
mutations in candidate genes atp6 (encoding the sarcoplasmic and endoplasmic reticulum Ca2+
ATPase), tctp, mdr1, and cg10. Antimicrobial agents and chemotherapy, v. 50, n. 2, p. 480
9, 1 fev. 2006.
ANDRADE, C. H. et al. 4D-QSAR: perspectives in drug design. Molecules (Basel,
Switzerland), v. 15, n. 5, p. 328194, maio 2010.
ARAKAWA, M.; HASEGAWA, K.; FUNATSU, K. The recent trend in QSAR modeling Variable selection and 3D-QSAR methods. Current Computer-Aided Drug Design, v. 3, n.
4, p. 254262, 2007.
ARAV-BOGER, R.; SHAPIRO, T. A. Molecular mechanisms of resistance in antimalarial
chemotherapy: the unmet challenge. Annual review of pharmacology and toxicology, v. 45,
p. 56585, 7 jan. 2005.
ASOJO, O. A. et al. Novel uncomplexed and complexed structures of plasmepsin II, an aspartic
protease from Plasmodium falciparum. Journal of Molecular Biology, v. 327, n. 1, p. 173
181, 2003.
AZOUZI, S.; EL KIRAT, K.; MORANDAT, S. Hematin loses its membranotropic activity
upon oligomerization into malaria pigment. Biochimica et Biophysica Acta (BBA) Biomembranes, v. 1848, n. 11, p. 29522959, 2015.
BARBOSA, E. G.; FERREIRA, M. M. C. Digital Filters for Molecular Interaction Field

97

Descriptors. Molecular Informatics, v. 31, n. 1, p. 7584, 11 jan. 2012.


BARMADE, M. A et al. Discovery of anti-malarial agents through application of in silico
studies. Combinatorial chemistry & high throughput screening, v. 18, n. 2, p. 151187,
2015.
BARREIRO, E. J. Medicinal Chemistry and the paradigm of the lead compound. Revista
Virtual de Qumica, v. 1, n. 1, p. 2634, 2009.
BAS, D. C.; ROGERS, D. M.; JENSEN, J. H. Very fast prediction and rationalization of pKa
values for protein-ligand complexes. Proteins, v. 73, n. 3, p. 76583, 15 nov. 2008.
BASCO, L. K.; RINGWALD, P. Molecular epidemiology of malaria in Yaounde, Cameroon I.
Analysis of point mutations in the dihydrofolate reductase-thymidylate synthase gene of
Plasmodium falciparum. The American journal of tropical medicine and hygiene, v. 58, n.
3, p. 36973, 1998.
BERNSTEIN, F. C. et al. The Protein Data Bank: a computer-based archival file for
macromolecular structures. Journal of molecular biology, v. 112, n. 3, p. 53542, 25 maio
1977.
BHAUMIK, P. et al. Structural insights into the activation and inhibition of histo-aspartic
protease from Plasmodium falciparum. Biochemistry, v. 50, n. 41, p. 88628879, 2011.
BHAUMIK, P.; GUSTCHINA, A.; WLODAWER, A. Structural studies of vacuolar
plasmepsins. Biochimica et Biophysica Acta - Proteins and Proteomics, v. 1824, n. 1, p.
207223, 2012.
BIAMONTE, M. A.; WANNER, J.; LE ROCH, K. G. Recent advances in malaria drug
discovery. Bioorganic & medicinal chemistry letters, v. 23, n. 10, p. 282943, 15 maio 2013.
BJELIC, S. et al. Computational inhibitor design against malaria plasmepsins. Cellular and
Molecular Life Sciences, v. 64, n. 17, p. 22852305, 2007.
BOSS, C. et al. Inhibitors of the Plasmodium falciparum parasite aspartic protease plasmepsin
II as potential antimalarial agents. Current medicinal chemistry, v. 10, n. 11, p. 883907,
2003.
BRAGA, . M. .; FONTES, C. J. F. Plasmodium - Malria. In: NEVES, D. P. (Ed.). .
Parasitologia Humana. 11. ed. So Paulo: Atheneu, 2005. p. 143161.
BRASIL. MINISTRIO DA SADE. SECRETARIA DE VIGILNCIA EM SADE.
DEPARTAMENTO DE VIGILNCIA. Malarias treatment in Brazil practical guide. 2010.
BRASIL. MINISTRIO DA SADE.SECRETARIA DE CINCIA, T. E I. E. (SCTIE). D. DE
C. E T. (DECIT). P. EM SADE NO B. Revista de Sade Pblica. v. 42, n. 4, 2008.
BRINKWORTH, R. I. et al. Hemoglobin-degrading, aspartic proteases of blood-feeding
parasites. Substrate specificity revealed by homology models. Journal of Biological
Chemistry, v. 276, n. 42, p. 3884438851, 2001.
CHIRICO, N.; GRAMATICA, P. Real external predictivity of QSAR models: how to evaluate
it? Comparison of different validation criteria and proposal of using the concordance correlation
coefficient. Journal of chemical information and modeling, v. 51, n. 9, p. 232035, 2011.
COHEN, N. C. Guidebook on molecular modelling in drug design. San Diego: Press,
Academic, 1996.
CRAMER, R. D.; PATTERSON, D. E.; BUNCE, J. D. Comparative molecular field analysis
(CoMFA). 1. Effect of shape on binding of steroids to carrier proteins. Journal of the
American Chemical Society, v. 110, n. 18, p. 595967, 1 ago. 1988.

98

CRUCIANI, G. Molecular Interaction Fields. Perugia IT: Wiley - VCH Verlag GmbH & Co.
KGaA, 2006.
DALRYMPLE, U.; MAPPIN, B.; GETHING, P. W. Malaria mapping: understanding the
global endemicity of falciparum and vivax malaria. BMC Medicine, v. 13, n. 1, p. 140, 2015.
DAN, N.; BHAKAT, S. New paradigm of an old target: An update on structural biology and
current progress in drug design towards plasmepsin II. European journal of medicinal
chemistry, v. 95, p. 324348, 2015.
DE ARAJO SANTOS, R. A. et al. Mixed 2D3D-LQTA-QSAR study of a series of
Plasmodium falciparum dUTPase inhibitors. Medicinal Chemistry Research, v. 24, n. 3, p.
10981111, 6 ago. 2014.
DE FARIAS SILVA, N.; LAMEIRA, J.; ALVES, C. N. Computational analysis of aspartic
protease plasmepsin II complexed with EH58 inhibitor: A QM/MM MD study. Journal of
Molecular Modeling, v. 17, n. 10, p. 26312638, 2011.
DONDORP, A. M. et al. Artemisinin resistance: current status and scenarios for containment.
Nature reviews. Microbiology, v. 8, n. 4, p. 27280, abr. 2010.
DOUGLAS, R. G. et al. Active migration and passive transport of malaria parasites. Trends in
Parasitology, v. 31, n. 8, p. 357362, 2015.
DOWEYKO, A. M. 3D-QSAR illusions. Journal of Computer-Aided Molecular Design, v.
18, n. 7-9, p. 587596, 2004.
ELEBRING, T.; GILL, A.; PLOWRIGHT, A. T. What is the most important approach in
current drug discovery: doing the right things or doing things right? Drug Discovery Today,
v. 17, n. 21-22, p. 11661169, 2012.
ERIKSSON, L. et al. Methods for reliability and uncertainty assessment and for applicability
evaluations of classification- and regression-based QSARs. Environmental health
perspectives, v. 111, n. 10, p. 136175, ago. 2003.
ERSMARK, K.; SAMUELSSON, B.; HALLBERG, A. Plasmepsins as potential targets for
new antimalarial therapy. Medicinal Research Reviews, v. 26, n. 5, p. 626666, 2006.
FAN, H. et al. Comparative study of generalized Born models: protein dynamics. Proceedings
of the National Academy of Sciences of the United States of America, v. 102, n. 19, p. 6760
4, 10 maio 2005.
FOURCHES, D.; MURATOV, E.; TROPSHA, A. Trust, but verify: on the importance of
chemical structure curation in cheminformatics and QSAR modeling research. Journal of
chemical information and modeling, v. 50, n. 7, p. 1189204, 26 jul. 2010.
FRIEDMAN, R.; CAFLISCH, A. The protonation state of the catalytic aspartates in plasmepsin
II. FEBS Letters, v. 581, n. 21, p. 41204124, 2007.
FRISCH, M. J.; TRUCKS, G. W.; SCHLEGEL, H. B.; SCUSERIA, G. E.; ROBB, M. A.;
CHEESEMAN, J. R.; SCALMANI, G.; BARONE, V.; MENNUCCI, B.; PETERSSON, G. A.;
NAKATSUJI, H.; CARICATO, M.; LI, X.; HRATCHIAN, H. P.; IZMAYLOV, A. F.;
BLOINO, J.; ZHENG, G.; SONNENB, D. J. g09Wallingford CT, , 2009.
GHASEMI, J. B.; SAFAVI-SOHI, R.; BARBOSA, E. G. 4D-LQTA-QSAR and docking study
on potent gram-negative specific LpxC inhibitors: A comparison to CoMFA modeling.
Molecular Diversity, v. 16, n. 1, p. 203213, 2012.
GINER ALMARAZ, S. et al. Guidelines for Treatment of Malaria in the United States
Guidelines for Treatment of Malaria in the United States. Jama, v. 15, n. 4, p. 227238, 2010.

99

GOLDBERG, D. E. Hemoglobin degradation in Plasmodium-infected red blood cells.


Seminars in cell biology, v. 4, n. 5, p. 35561, out. 1993.
GONZLEZ, M. P. et al. Variable selection methods in QSAR: an overview. Current topics
in medicinal chemistry, v. 8, n. 18, p. 16061627, 2008.
GRAMATICA, P. Principles of QSAR models validation: internal and external. QSAR &
Combinatorial Science, v. 26, n. 5, p. 694701, maio 2007.
GRIMBERG, B. T.; MEHLOTRA, R. K. Expanding the Antimalarial Drug Arsenal-Now, But
How? Pharmaceuticals (Basel, Switzerland), v. 4, n. 5, p. 681712, 1 maio 2011.
GUEX, N.; PEITSCH, M. C. SWISS-MODEL and the Swiss-PdbViewer: an environment for
comparative protein modeling. Electrophoresis, v. 18, n. 15, p. 271423, dez. 1997.
HANSCH, C.; FUJITA, T. -- Analysis. A Method for the Correlation of Biological Activity
and Chemical Structure. Journal of the American Chemical Society, v. 86, n. 8, p. 1616
1626, 1964.
HIDAKA, K. et al. Additional interaction of allophenylnorstatine-containing
tripeptidomimetics with malarial aspartic protease plasmepsin II. Bioorganic and Medicinal
Chemistry Letters, v. 17, n. 11, p. 30483052, 2007.
HOFFMAN, S. L. et al. The March Toward Malaria Vaccines. American Journal of
Preventive Medicine, v. 49, n. 6, p. S319S333, 2015.
HOPFINGER, A. J. et al. Construction of 3D-QSAR Models Using the 4D-QSAR Analysis
Formalism. Journal of the American Chemical Society, v. 119, n. 43, p. 1050910524, out.
1997.
HUIZING, A. P.; MONDAL, M.; HIRSCH, A. K. H. Fighting Malaria: Structure-Guided
Discovery of Nonpeptidomimetic Plasmepsin Inhibitors. Journal of Medicinal Chemistry,
2015.
HUNT, P. et al. Gene encoding a deubiquitinating enzyme is mutated in artesunate- and
chloroquine-resistant rodent malaria parasites. Molecular microbiology, v. 65, n. 1, p. 2740,
jul. 2007.
HYDE, J. E. UKPMC Funders Group Author Manuscript Drug-resistant malaria - an insight.
v. 274, n. 18, p. 46884698, 2009.
J. MEYERS, M.; E. GOLDBERG, D. Recent Advances in Plasmepsin Medicinal Chemistry
and Implications for Future Antimalarial Drug Discovery Efforts. Current Topics in
Medicinal Chemistry, v. 12, n. 5, p. 445455, 2012.
JAKALIAN, A.; JACK, D. B.; BAYLY, C. I. Fast, efficient generation of high-quality atomic
charges. AM1-BCC model: II. Parameterization and validation. Journal of computational
chemistry, v. 23, n. 16, p. 162341, dez. 2002.
JAUDZEMS, K. et al. Plasmepsin Inhibitory Activity and Structure-Guided Optimization of a
Potent Hydroxyethylamine-Based Antimalarial Hit. ACS medicinal chemistry letters, v. 5, n.
4, p. 373377, 2014.
KHAN, S. M.; WATERS, A. P. Malaria parasite transmission stages: An update. Trends in
Parasitology, v. 20, n. 12, p. 575580, 2004.
KIRALJ, R.; FERREIRA, M. M. C. Basic validation procedures for regression models in
QSAR and QSPR studies: Theory and application. Journal of the Brazilian Chemical Society,
v. 20, n. 4, p. 770787, 2009.
KIRALJ, R.; FERREIRA, M. M. C. Is your QSAR/QSPR descriptor real or trash? Journal of

100

Chemometrics, v. 24, n. 11-12, p. 681693, 21 nov. 2010.


KISO, A. et al. Search for substrate-based inhibitors fitting the S2 space of malarial aspartic
protease plasmepsin II. Journal of Peptide Science, v. 10, n. 11, p. 641647, 2004.
KLEIN, E. Y. Antimalarial drug resistance: a review of the biology and strategies to delay
emergence and spread. International journal of antimicrobial agents, v. 41, n. 4, p. 3117, 4
abr. 2013.
KUBINYI, H. QSAR and 3D QSAR in drug design Part 1: methodology. Drug Discovery
Today, v. 2, n. 11, p. 457467, nov. 1997.
KUNDU, C. N. et al. Anti-malarials are anti-cancers and vice versa One arrow two sparrows.
Acta Tropica, v. 149, p. 113127, 2015.
LAZARUS, M. D.; SCHNEIDER, T. G.; TARASCHI, T. F. A new model for hemoglobin
ingestion and transport by the human malaria parasite Plasmodium falciparum. Journal of cell
science, v. 121, n. 11, p. 193749, 1 jun. 2008.
LINDORFF-LARSEN, K. et al. Improved side-chain torsion potentials for the Amber ff99SB
protein force field. Proteins, v. 78, n. 8, p. 19508, jun. 2010.
LONGLEY, R. J.; HILL, A. V. S.; SPENCER, A. J. Malaria vaccines: identifying Plasmodium
falciparum liver-stage targets. Frontiers in Microbiology, v. 6, n. September, p. 18, 2015.
MARTINS, J. P. A. et al. LQTA-QSAR: a new 4D-QSAR methodology. Journal of chemical
information and modeling, v. 49, n. 6, p. 142836, jun. 2009.
MARVINSKETCH. Figura 1 Plm II crystal structure I) list of important amino acid residues in
their respective pocket. [s.d.].
Mathlab. Natick, MAThe MathWorks Inc., , 2000.
MAZIER, D.; RNIA, L.; SNOUNOU, G. A pre-emptive strike against malarias stealthy
hepatic forms. Nature reviews. Drug discovery, v. 8, n. 11, p. 85464, nov. 2009.
MILANI, K. J.; SCHNEIDER, T. G.; TARASCHI, T. F. Defining the morphology and
mechanism of the hemoglobin transport pathway in Plasmodium falciparum-infected
erythrocytes. Eukaryotic cell, v. 14, n. 4, p. 41526, 2015.
MINISTRIO DA SADE. Doenas infecciosas e parasitrias: guia de bolso. Cadernos de
Sade Pblica, v. 22, n. 11, p. 24982498, 2010.
MIURA, T. et al. Improvement of both plasmepsin inhibitory activity and antimalarial activity
by 2-aminoethylamino substitution. Bioorganic and Medicinal Chemistry Letters, v. 20, n.
16, p. 48364839, 2010.
MMV. Medicine for Malaria Venture. Interactive R&D portfolio. Disponvel em:
<<http://www.mmv.org/research-development/rd-portfolio>.>. Acesso em: 25 jan. 2016.
MOTA, M. M. et al. Migration of Plasmodium sporozoites through cells before infection.
Science (New York, N.Y.), v. 291, n. 5501, p. 1414, 5 jan. 2001.
MOURA, P. A.; DAME, J. B.; FIDOCK, D. A. Role of Plasmodium falciparum Digestive
Vacuole Plasmepsins in the Specificity and Antimalarial Mode of Action of Cysteine and
Aspartic Protease Inhibitors. Antimicrobial Agents and Chemotherapy, v. 53, n. 12, p. 4968
4978, 2009.
MUTHAS, D. et al. Synthesis, biological evaluation, and modeling studies of inhibitors aimed
at the malarial proteases plasmepsins I and II. Bioorganic & medicinal chemistry, v. 13, n.
18, p. 537190, 2005.

101

NEVES, D. P. Parasitologia Humana. 11. ed. So Paulo: Atheneu, 2005.


NEZAMI, A. et al. Identification and characterization of allophenylnorstatine-based inhibitors
of plasmepsin II, an antimalarial target. Biochemistry, v. 41, n. 7, p. 22732280, 2002.
NEZAMI, A. et al. High-affinity inhibition of a family of Plasmodium falciparum proteases by
a designed adaptive inhibitor. Biochemistry, v. 42, n. 28, p. 84598464, 2003.
NWAKA, S.; RIDLEY, R. G. Virtual drug discovery and development for neglected diseases
through public-private partnerships. Nature reviews. Drug discovery, v. 2, n. 11, p. 91928,
dez. 2003.
OLIVEIRA-FERREIRA, J. et al. Malaria in Brazil: an overview. Malaria journal, v. 9, n. 1,
p. 115, 2010.
ORGANIZATION, W. H. World Malaria Report. [s.l: s.n.].
PATEL, H. M. et al. Quantitative structureactivity relationship (QSAR) studies as strategic
approach in drug discovery. Medicinal Chemistry Research, v. 23, n. 12, p. 49915007, 2014.
PREZ, B. et al. Development of Plasmodium falciparum protease inhibitors in the past decade
(2002-2012). Current medicinal chemistry, v. 20, n. 25, p. 30493068, 2013.
PETERSEN, I.; EASTMAN, R.; LANZER, M. Drug-resistant malaria: molecular mechanisms
and implications for public health. FEBS letters, v. 585, n. 11, p. 155162, 6 jun. 2011.
PETTERSEN, E. F. et al. UCSF Chimera--a visualization system for exploratory research and
analysis. Journal of computational chemistry, v. 25, n. 13, p. 160512, out. 2004.
PIMENTEL, L. F. et al. Nanotecnologia farmacutica aplicada ao tratamento da malria. v. 43,
2007.
PRAZERES, V. F. V. et al. Nanomolar Competitive Inhibitors ofMycobacterium tuberculosis
andStreptomyces coelicolor Type II Dehydroquinase. ChemMedChem, v. 2, n. 2, p. 194207,
2007.
REY, L. Os Plasmdios e a malria. In: Parasitologia: parasitos e doenas parasitrias do
homem nos trpicos ocidentais. 4. ed. Rio de Janeiro: Editora Guanabara Koogan, 2013. p.
207221.
RICHIE, T. L.; SAUL, A. malaria vaccines. v. 415, n. February, p. 18, 2002.
RONCAGLIONI, A.; BENFENATI, E. In silico-aided prediction of biological properties of
chemicals: oestrogen receptor-mediated effects. Chemical Society reviews, v. 37, n. 3, p. 441
50, 28 mar. 2008.
SAMPAIO, V. S. et al. Malaria in the State of Amazonas: a typical Brazilian tropical disease
infl uenced by waves of economic development. v. 48, n. Suppl I, p. 411, 2015.
SCHECHTER, I.; BERGER, A. On the size of the active site in proteases. I. Papain.
Biochemical and biophysical research communications, v. 27, n. 2, p. 15762, 20 abr. 1967.
SCHOLL, P. F.; TRIPATHI, A. K.; SULLIVAN, D. J. Bioavailable iron and heme metabolism
in Plasmodium falciparum. Current topics in microbiology and immunology, v. 295, p. 293
324, jan. 2005.
SHIM, J.; MACKERELL, JR., A. D. Computational ligand-based rational design: role of
conformational sampling and force fields in model development. MedChemComm, v. 2, n. 5,
p. 356, 2011.
SILVA, A M. et al. Structure and inhibition of plasmepsin II, a hemoglobin-degrading enzyme
from Plasmodium falciparum. Proceedings of the National Academy of Sciences of the

102

United States of America, v. 93, n. 19, p. 1003410039, 1996.


SNOW, R. W.; KORENROMP, E. L.; GOUWS, E. Pediatric mortality in Africa: plasmodium
falciparum malaria as a cause or risk? The American journal of tropical medicine and
hygiene, v. 71, n. 2 Suppl, p. 1624, ago. 2004.
TEFILO, R. F.; MARTINS, J. P. A; FERREIRA, M. M. C. Sorting variables by using
informative vectors as a strategy for feature selection in multivariate regression. Journal of
Chemometrics, v. 23, n. 1, p. 3248, 2009a.
TEFILO, R. F.; MARTINS, J. P. A.; FERREIRA, M. M. C. Sorting variables by using
informative vectors as a strategy for feature selection in multivariate regression. Journal of
Chemometrics, v. 23, n. 1, p. 3248, jan. 2009b.
TOSCO, P.; BALLE, T. Open3DQSAR: a new open-source software aimed at high-throughput
chemometric analysis of molecular interaction fields. Journal of molecular modeling, v. 17,
n. 1, p. 2018, jan. 2011.
TROTT, O.; OLSON, A. J. AutoDock Vina: improving the speed and accuracy of docking with
a new scoring function, efficient optimization, and multithreading. Journal of computational
chemistry, v. 31, n. 2, p. 45561, 30 jan. 2010.
TUTEJA, R. Malaria - an overview. The FEBS journal, v. 274, n. 18, p. 46709, set. 2007.
VAN DER SPOEL, D. et al. GROMACS: fast, flexible, and free. Journal of computational
chemistry, v. 26, n. 16, p. 170118, dez. 2005.
VERMA, J.; KHEDKAR, V. M.; COUTINHO, E. C. 3D-QSAR in drug design--a review.
Current topics in medicinal chemistry, v. 10, n. 1, p. 95115, jan. 2010.
WANG, J. et al. Development and testing of a general amber force field. Journal of
computational chemistry, v. 25, n. 9, p. 115774, 15 jul. 2004.
WEGSCHEID-GERLACH, C.; GERBER, H.-D.; DIEDERICH, W. E. Proteases of
Plasmodium falciparum as potential drug targets and inhibitors thereof. Current topics in
medicinal chemistry, v. 10, n. 3, p. 346367, 2010.
WELLS, T. N. C. New medicines to improve control and contribute to the eradication of
malaria. v. 9, n. Suppl 2, p. 2010, 2010.
WELLS, T. N. C.; ALONSO, P. L.; GUTTERIDGE, W. E. New medicines to improve control
and contribute to the eradication of malaria. Nature reviews. Drug discovery, v. 8, n. 11, p.
879891, 2009.
WELLS, T. N. C.; VAN HUIJSDUIJNEN, R. H.; VAN VOORHIS, W. C. Malaria medicines:
a glass half full? Nature reviews. Drug discovery, v. 14, n. 6, p. 424442, 22 maio 2015.
WHITE, N. J. et al. Av e rting a malaria disaster. v. 353, p. 19651967, 1999.
WHITE, N. J. Review series Antimalarial drug resistance. Trends in Parasitology, v. 113, n.
8, p. 10841092, 2004.
WHO. WHO | World Malaria Report 2015. 2015.
XUE, L.; BAJORATH, J. Molecular descriptors for effective classification of biologically
active compounds based on principal component analysis identified by a genetic algorithm.
Journal of chemical information and computer sciences, v. 40, n. 3, p. 8019, jan. 2000.

103

Anda mungkin juga menyukai