4
Fiocruz-Bahia Centro de Pesquisas Gonalo Moniz
Margareth B. C. Gallo
Salvador 2011
ndice
1. Criando projeto de processamento no PLGS para amostras sem marcadores isotpicos/isobricos ....................................................................................................... 3 2. Criando projeto de processamento no PLGS para amostras marcadas com iTRAQ (isobaric tag for relative and absolute quantitation) ......................................................... 8 3. Criando programa de processamento (Processing Parameters) no PLGS para amostras com marcadores isotpicos/isobricos .......................................................... 26 4. Criando programa para a comparao em banco de dados (Workflow Designer) no PLGS para amostras com marcadores isotpicos/isobricos ....................................... 31 5. Criando/Adicionando modificaes fixas ou variveis ............................................ 39
6. Usando o Expression Analysis para comparar e analisar os grupos de amostras com marcadores isobricos (iTRAQ) ............................................................................ 41 7. 8. 9. Observando/interpretando os resultados da anlise de expresso ........................ 49 Organizando os bancos de dados .......................................................................... 55 Referncias ............................................................................................................ 59
Autora:
Margareth B. C. Gallo
Manual para o processamento de dados com o PLGS, Abr/2011 1.Criando projeto de processamento no PLGS para amostras sem marcadores isotpicos/isobricos
1.1.No computador de processamento de dados, clique no cone do PLGS (Protein Lynx Global Server) v. 2.4 1.2. Clique em Project Manager File new project, aparece caixa de dilogo para voc nomear o projeto, faa-o e depois clique OK. O nome do projeto aparecer preenchendo o espao em branco de projects. Na lateral direita aparece a pasta do novo projeto contendo vrias opes para criao das amostras.
1.3. Nas opes disponveis, clique esquerdo sobre microtitre plates e direito sobre new microtitre plates.
Autora:
Margareth B. C. Gallo
Autora:
Margareth B. C. Gallo
1.6.Clique esquerdo sobre um dos pocinhos de amostra e depois clique direito em set sample. Vai aparecer a janelinha do select a sample, clique sobre default e OK. Os pocinhos se tornam cinzas e clicando sobre o novo ndulo que aparece abaixo da
microtitre plate, voc ver aparecer todas amostras numeradas adequadamente. Caso o default esteja com o instrumento errado, por exemplo Maldi em vez de QTOF, v em options preferences (clique esquerdo), aparece janela de preferences, clique instrument QTOF- MSMS apply OK. importante que o instrumento esteja determinado corretamente, pois o processamento estar baseado em parmetros especficos para cada instrumento.
Autora:
Margareth B. C. Gallo
Autora:
Margareth B. C. Gallo
not yet obtained e depois clique direito. Aparece novas opes, clique esquerdo sobre set raw data file, v ao diretrio de Database (D:) raw selecione o arquivo da amostra. Proceda como nos passos dos captulos 3 e 4, para criar os programas de Processing Parameters e Workflow Designer. Caso voc j tenha criado os arquivos com os parmetros de processamento e do banco de dados, proceda como no tem 2.11.
Autora:
Margareth B. C. Gallo
2.Criando projeto de processamento no PLGS para amostras marcadas com iTRAQ (isobaric tag for relative and absolute quantitation)
2.1.No computador de processamento de dados, open PLGS (Protein Lynx Global Server) v 2.4 2.2. Clique Project Manager File new project, aparece caixa de dilogo para voc nomear o projeto, faa-o e depois clique OK. Na lateral direita aparece a pasta do novo projeto contendo vrias opes para criao das amostras. 2.3. Nas opes disponveis, clique esquerdo sobre original samples e direito sobre add new sample. Responda yes pergunta add new sample to vial?. Repita esta
Autora:
Margareth B. C. Gallo
2.5. Depois clique sobre Tag, embaixo do quadro aparece local para voc determinar qual o marcador. Escolha na lista conforme voc usou os reagentes iTRAQ 4-plex (114, 115, 116 ou 117) ou 8-plex (113, 114, 115, 116, 117, 118, 119 ou 121). KY significa marcao isobrica nos resduos de lisina e tirosina da cadeia lateral, e Nterminal no grupo amino terminal do peptdeo. Neste campo, s necessria a escolha de uma das opes (KY ou N-term). Posteriormente, no Workflow designer, que ser necessria a escolha de todas as opes como fixed modifications.
Autora:
Margareth B. C. Gallo
Autora:
Margareth B. C. Gallo
10
Autora:
Margareth B. C. Gallo
11
Autora:
Margareth B. C. Gallo
12
Autora:
Margareth B. C. Gallo
13
Observao: Se voc est analisando vrias sub-fraes provenientes da mesma amostra marcada com iTRAQ (por exemplo, 12 ou 24 fraes provenientes de um prfracionamento de amostra complexa em SCX ou OFFGEL), voc ter que repetir o procedimento de original samples e processed samples para cada uma das fraes. Posteriormente, poder processar cada uma separadamente, e depois todas de uma s vez (ver Merge MSMS spectra).
Autora:
Margareth B. C. Gallo
14
Autora:
Margareth B. C. Gallo
15
Dados no processados Processing parameters 2.13. Se voc no tiver clicado sobre Process no passo 2.11, para processar os dados, selecione a amostra, clique direito Process (no canto direito inferior da tela , inicia-se a contagem da porcentagem que falta para o trmino do processamento).
Autora:
Margareth B. C. Gallo
16
Autora:
Margareth B. C. Gallo
17
2.16. Talvez os parmetros de processamento usados foram muito rgidos, como por exemplo, no Workflow Designer Fragment tolerance estar com o valor de 0,1 Da. Tente criar outro Workflow Designer com o valor de 0,2 e reprocessar os dados. Aps criado, clique sobre o espectro processado, clique direito, attach workflow template. Selecione o arquivo criado na nova caixa de dilogo que aparece, clique OK.
Autora:
Margareth B. C. Gallo
18
2.18. Para ver os dados processados, clique sobre o nome do novo workflow, clique direito e view workflow results.
Autora:
Margareth B. C. Gallo
19
Autora:
Margareth B. C. Gallo
20
2 2 2 2 2 2 2 2 2 2
Significado dos subttulos da tabela acima: O ladder score est baseado no nmero de ons b e y do peptdeo. Quanto mais ions consecutivos b e y, maior o score. ons y tambm contribuem para um maior score (acima de 66%) do que os ons b. Delta (DA) a diferena entre a massa terica de um fragmento e a massa observada. Tambm pode ser dada em ppm. PLGS Score = uma medida calculada pelo Protein Lynx Global Server (PLGS 2.2.5) software usando o algortmo de Monte Carlo para analisar todos os dados dos espectros de massas. uma medida estatstica de acurcia da identificao. Quanto maior o score maior ser a confidncia da identidade protica. Alguns autores s levam em considerao identificaes com PLGS score 9 (Zanini et al., 2008; Xu et al, 2008). Probability = indica, em porcentagem, qual a chance da identificao da protena ser verdade. Coverage = mostra a porcentagem correspondente do peptdeo (s) identificado (s) em relao sequncia total de peptdeos da protena.
Autora:
Margareth B. C. Gallo
21
Meaning The peak is not matched to a peptide from the current protein or EST. A standard peptide (that is, with no modifications or missed cleavage sites). A peptide that contains one or more missed cleavage sites. A modified peptide, neutral loss (a or z ion), or immonium ion. A peptide that contains post-translational modifications and missed cleavage sites.
Autora:
Margareth B. C. Gallo
22
Autora:
Margareth B. C. Gallo
23
Autora:
Margareth B. C. Gallo
24
todos os espectros obtidos para os respectivos precursores, clique sobre um deles para visualizar qual o seu tempo de reteno no espectro geral (parte de cima, marcado com tringulo vermelho). Se o precursor tiver gerado fragmentos, o espectro contendo os fragmentos aparece automaticamente abaixo. Para observar uma determinada rea, clique direito e arraste. Para retornar o espectro original, clique 2 vezes com o boto esquerdo do mouse.
Autora:
Margareth B. C. Gallo
25
Manual para o processamento de dados com o PLGS, Abr/2011 3.Criando programa de processamento (Processing Parameters) no PLGS para amostras com marcadores isotpicos/isobricos
Para se adquirir MS/MS de compostos desconhecidos, o Micromass Q-Tof micro tem um poderoso software de sistema de controle capaz de permitir o instrumento de realizar Data Depedent Analysis (DDA), trocando-se do modo MS para o modo MS/MS e retornando ao modo MS usando-se critrios dependentes dos dados. A vantagem deste mtodo que ele remove a necessidade de se analisar a amostra primeiramente no modo MS, o qual identifica os ons precursores alvos, para depois correr a amostra novamente no modo MS/MS, o qual realiza a fragmentao dos precursores escolhidos. Os dados de MS e MS/MS so adquiridos subsequentemente na mesma anlise, podendo-se escolher vrios canais para se realizar a fragmentao de mltiplos precursores. Esta ferramenta particularmente importante na anlise de amostras desconhecidas usando-se cromatografia on-line, onde os ons precursores alvos e seus respectivos tempos de reteno podem ser ligeiramente diferentes para cada corrida da respectiva amostra. O programa de processamento ProteinLynx Global Server engloba dois projetos para se analisar os dados: Processing Parameters e Workflow Designer. O Processing Parameters determina como os dados provenientes tanto dos espectros de MS quanto dos espectros de MS/MS no tratados sero processados. Os atributos que devem ser considerados determinam a acurcia da massa, reduo de rudo e deisotoping/centroid dos dados. O Workflow Designer possibilita a determinao de parmetros para se realizar uma busca automatizada no banco de dados de amostras. A busca (fragment ion search) realizada comparando-se os fragmentos inicos obtidos da amostra com aqueles listados no banco de dados, identificando-se os peptdeos baseando-se no padro de fragmentao e, subsequentemente, as protenas.
Autora:
Margareth B. C. Gallo
26
3.2. Aparece ento a janela do Processing parameters, a qual j vem com um ttulo automtico. Voc pode mud-lo digitando no espao selecionado.
Autora:
Margareth B. C. Gallo
27
Autora:
Margareth B. C. Gallo
28
Autora:
Margareth B. C. Gallo
29
Autora:
Margareth B. C. Gallo
30
Manual para o processamento de dados com o PLGS, Abr/2011 4.Criando programa para a comparao em banco de dados (Workflow Designer) no PLGS para amostras com marcadores isotpicos/isobricos
4.1.Clique sobre o cone Workflow Designer File New, aparecem opes para voc selecionar que anlise voc quer realizar. Clique sobre Fragment ion search, confirme .
4.2. Aps confirmado, aparece caixa de dilogo do Fragment ion search, nomeie o arquivo (title) do seu workflow, clique direito sobre workflow add databank search.
Autora:
Margareth B. C. Gallo
31
Fragment tolerance: a diferena mxima permitida entre a massa do fragmento observada e a massa do fragmento terico ao qual a primeira ser comparada. Quanto menor este valor, mais acurada ser a identificao. Geralmente o valor varia de 0,1 a 0,3. Para uma mistura de protenas padro usamos 0,1 e para amostras desconhecidas, usamos 0,2 se no quisermos restringir muito as identificaes.
Autora:
Margareth B. C. Gallo
32
Margareth B. C. Gallo
33
Em seguida, realiza-se o rompimento de interaes covalentes, como por exemplo, as ligaes dissulfeto existentes entre os resduos de cistena presentes nas cadeias laterais dos peptdeos. Essas ligaes so responsveis por estabilizar a protena mantendo-a enrolada e hidrofbica. A destruio destas ligaes torna a
Autora:
Margareth B. C. Gallo
34
Autora:
Margareth B. C. Gallo
35
A formao dos produtos secundrios deve ser informada na programao do PLGS como fixed modifications, pois o software calcula a adio da massa correspondente a cada modificao e subtrai a mesma para se identificar o peptdeo em questo em comparao com o banco de dados. Numa anlise, por exemplo, cuja a amostra protica entrou em contato com uria, reagente iTRAQ e MMTS so
Autora:
Margareth B. C. Gallo
36
O N O
-amino group Lys (K) da cadeia lateral de um peptdeo N O N O O NH2 N O O N O N N OH N-terminus Tyr (Y) da cadeia lateral de um peptdeo HO O NH O N O NH NH2 OH OH
OH
Esquema 3. Reaes que podem ocorrer durante a marcao isobrica usando-se reagentes
iTRAQ.
Autora:
Margareth B. C. Gallo
37
cido isocinico HO HN C O
NH2 (CH2)4 NH C
O NH2 I iodoacetamida HO
HS CH2
NH2
O OH I cido iodoactico HO
HS CH2
OH
NH2 O S -carboxymethyl C
E HO
Esquema 4. Reaes de carbamilao (A), alquilao (B, C, D) e oxidao (E) que podem
ocorrer durante preparo da amostra protica.
Autora:
Margareth B. C. Gallo
38
Manual para o processamento de dados com o PLGS, Abr/2011 5.Criando/Adicionando modificaes fixas ou variveis
Como vimos no captulo anterior, a incluso das modificaes qumicas muito importante para que voc no perca a identificao das protenas de sua amostra. O programa j contm uma srie de modificaes previstas, mas dependendo do seu protocolo de preparao de amostra, talvez voc precise incluir alguma nova modificao. o caso quando voc realiza reao de alquilao com MMTS e forma methylthio C. Esta modificao tem que ser includa, pois no existe na lista. 5.1.No PLGS, em Tools, clique direito no cone Modifier tool. Clique New na barra de ferramentas. A mesma ao se d quando voc quer editar uma modificao que voc criou. Para ambas as aes, so gerados um painel e uma caixa de texto, de modo que voc pode definir ou editar os valores para cada atributo. Obs: somente modificadores criados pelo usurio podem ser editados.
Autora:
Margareth B. C. Gallo
39
Applies to: C (letra que simboliza o aminocido cistena) 5.3.Para salvar, clique sobre o disquete da barra de ferramentas. O novo modificador pode ser visto no final da lista de Amino acid modifier reagents em letras pretas. 5.4.Para deletar, clique sobre o modificador criado na lista file delete, ou sobre o cone delete da barra de ferramentas.
Autora:
Margareth B. C. Gallo
40
Manual para o processamento de dados com o PLGS, Abr/2011 6.Usando o Expression Analysis para comparar e analisar os grupos de amostras com marcadores isobricos (iTRAQ)
O Expression Analysis identifica e extrai pares de massas marcadas, computa suas abundncias relativas e indica quando elas esto hipo ou superexpressas. 6.1.Abra o projeto que voc quer trabalhar. 6.2.Na janela do Project manager do seu experimento com iTRAQ, selecione Expression Analysis, clique direito e Add Expression Analysis. Aparece na janela ao lado o Expression analysis design manager, e o primeiro tem Experiment attributes. Nesta aba, nomeie o experimento e, se desejar, faa uma descrio. Clique Apply (para ver esta opo, clique direito com o mouse sobre a barra do Expression analysis design manager e arraste-a, pois a opo se encontra no canto direito da aba ou clique sobre a seta para expand-la). Aps feito isto, automaticamente o nome da amostra se torna ativo e tambm o prximo passo (a aba de cor cinza se torna rosa).
Autora:
Margareth B. C. Gallo
41
O Select grouping method para especificar como as amostras sero desagrupadas e comparadas umas com as outras. Se voc est usando amostras com marcadores, quando voc selecionar Use isotope-labeled sample, somente aparecero na lista as processed samples contidas no project manager. O place samples into separate groups s estar ativo se mais de uma amostra estiver contida na amostra processada selecionada. Clique Select All para incluir todas as amostras, ou pressione CTRL ou SHIFT para incluir somente as amostras que voc quer comparar. Clique Apply.
Autora:
Margareth B. C. Gallo
42
Autora:
Margareth B. C. Gallo
43
Autora:
Margareth B. C. Gallo
44
Autora:
Margareth B. C. Gallo
45
Autora:
Margareth B. C. Gallo
46
Autora:
Margareth B. C. Gallo
47
Autora:
Margareth B. C. Gallo
48
os
resultados
da
anlise
de
desvio padro Razo entre as amostras O texto fica verde se a probabilidade de upregulation 0.95 (1 significa upregulated). O texto fica vermelho se a probabilidade de downregulation 0.05 (0 significa downregulated). Se um cluster (protena) apareceu apenas numa das amostras (grupo), mas em todas as injees daquele grupo, o nome da amostra demonstrado na coluna UNIQUE.
Autora:
Margareth B. C. Gallo
49
inferior direita) para selecionar se quer mostrar todas as protenas ou s as yes ou maybe protenas.
Curate data
Autora:
Margareth B. C. Gallo
50
Se voc quiser exportar os resultados para uma tabela, visto que a janela do programa no permite copiar toda a imagem com os resultados de uma s vez, clique no cone Export data , abre-se uma caixa de dilogo onde voc seleciona as
informaes que voc quer exportar, d OK. Aparece caixa para voc escolher destino do arquivo. Escolha system (C:) openoffice.org 3.2 (ou excel) nomeie arquivo (*.txt). Se voc acha que seus resultados esto extensos demais e necessitam alguns filtros, clique em filter data , v no manual do ProteinLynx e verifique p. 10-
12 a 10-14). Para saber detalhes de outros cones, v no mesmo manual captulo 10. Para replicatas de iTRAQ (10-19).
Autora:
Margareth B. C. Gallo
51
Observao: MS/MS scoring (fragment ion searches) The scoring scheme implemented for MS/MS searches addresses the question: What is the probability that a protein is in the mixture of proteins that constitutes the sample? For this reason more than one hit can be reported as having maximum (or near maximum) probability of being correct. The data consists of a set of (mass, intensity) pairs (and their associated uncertainties) representing the monoisotopic mass and intensity of every peak in the processed data.
Autora:
Margareth B. C. Gallo
52
digestion of the protein sequences in the database, which match within the user-defined peptide tolerance of the precursor mass.
For each peptide sequence, the probability of fragment spectrum GIVEN
peptide sequence is calculated. The natural log of this is the peptide score. From these probabilities a list is compiled of the most likely combinations of proteins that could have given rise to the data. For example, if we have three proteins, there are eight possible combinations. The probability of the whole data set is then calculated given each of these combinations and the probability for a particular protein is accumulated whenever it appears in a combination. We assume that the prior probability of each combination is related to the number of proteins in it and use Bayes theorem to calculate the probability of protein present in mixture GIVEN data set. The results are normalized to reflect the number of protein sequences considered in the search. Therefore: Probability of A in mixture given dataset = (sum over probabilities of combinations containing A) / (sum over probabilities of all combinations) Only the highest scoring peptide match is reported for each submitted precursor ion and its associated fragmentation data. Where more than one peptide matches the data equally well (for example, if two peptide matches differ only by one or more isobaric residues), all are reported. To determine whether a hit is real, always look to the top-scoring protein. Look at the spread of scores: if the scores are grouped together, they have the same share of the available probability. In practice, given the variable quality of data, the difference between the top score and the next highest score is usually a good indicator of the correctness of the highest-scoring protein. A difference of five (factor of ~ 150) is normally sufficient to indicate that the top-scoring protein is correct. Alternatively, a proportion of the available probability can be assumed to be significant, for example, 95%.
Autora:
Margareth B. C. Gallo
53
Autora:
Margareth B. C. Gallo
54
Manual para o processamento de dados com o PLGS, Abr/2011 8.Organizando os bancos de dados
8.1.Primeiramente, faa o download do novo banco e grave no System (C:)/database(D:)/Databanks, criando a devida pasta para o mesmo. 8.2.Clique no cone databank admin tool (na barra ferramentas lateral esquerda do PLGS). 8.3. Uma search engine (no nosso caso sempre PLGS) precisa ser especificada para que as opes se tornem ativas. 8.4. Depois, para adicionar o novo banco de dados, clique em na barra de
ferramentas, ou clique databanks clique direito new databank. O painel do editor do banco de dados aparece.
Autora:
Margareth B. C. Gallo
55
O novo databank aparecer na rvore do navegador depois de um certo tempo. Se o arquivo grande, o processamento pode levar alguns segundos, para s depois ficar disponvel para o uso e tambm aparecer seu nome no campo do Databank admin tool. Para garantir que voc est vendo o status mais atual do banco de dados via Databank admin tool, clique na barra de ferramentas.
Autora:
Margareth B. C. Gallo
56
UniprotKB/Swissprot standard_spaced. Location o diretrio onde est gravado o banco de dados. Geralmente estaro gravados no D:/databanks/ Load into memory aumenta a velocidade na qual o banco de dados consultado, porm necessrio verificar se h memria RAM suficiente. Quando o banco muito grande e no est carregado na memria, a consulta pode falhar. Species for indexing usado quando voc quer usar o banco de dados restritamente para uma ou mais espcies. Cada espcie para o qual o banco de dados foi indexado aparecer na lista de espcies do Databank search tool. Clique sobre o atributo, v na lista que aparece abaixo do quadro. Para selecionar mais de uma espcie, aperte e segure CTRL enquanto estiver clicando sobre as espcies desejadas. Management options usado (para isto, digite TRUE) quando se deseja usar downloads e updates automticos. Periodically update uma boa opo quando voc j que deixar a atualizao do banco de dados programada automaticamente, porm voc deve sempre conferir qual foi a edio do banco usada para uma determinada identificao. Caso o banco esteja sendo atualizado muitas vezes, voc pode no ter repetibilidade nas suas anlises.
Autora:
Margareth B. C. Gallo
57
Margareth B. C. Gallo
58
McCarthy J, Hopwood F, Oxley D, Laver M, Castagna A, Righetti PG, Williams K, Herbert B. 2003. Carbamylation of Proteins in 2-D Electrophoresis Myth or Reality? Journal of Proteome Research 2: 239-242. Stanley BA. 2011. iTRAQ sample preparation protocol. http://www.hmc.psu.edu/core/proteins_massspec/massspec/iTRAQ%20Protocol.htm
Autora:
Margareth B. C. Gallo
59