Anda di halaman 1dari 8

Arq Bras Cardiol volume 73, (n6), 1999

Andrade PJN Atualizao Teorema de Bayes e raciocnio diagns ico

Sistemas Especialistas de Apoio ao Diagnstico em Medicina. Relaes com o Teorema de Bayes e com a Lgica do Raciocnio Diagnstico
Pedro Jos Negreiros de Andrade
Fortaleza - CE

Ningum se iluda pensando que pode competir com a memria de um computador e muito mais que isso com a rapidez de utilizao dos dados memorizados.... um mundo novo que desponta aceleradamente e que revolucionar toda estrutura de trabalho mdico e, principalmente, a tica mdica 1. Sistemas especialistas so o fruto da aplicao da chamada engenharia do conhecimento, uma das subespecialidades da inteligncia artificial 2. Tais sistemas empregam tcnicas simples de inteligncia artificial para simular a atuao de peritos humanos. Uma das caractersticas que um sistema de inteligncia artificial pode apresentar a capacidade de adquirir conhecimentos, ou seja, modificar-se com o uso. Isso, em geral, no acontece com os chamados sistemas especialistas que apesar de apresentarem um desempenho, s vezes, comparvel ao de especialistas humanos na resoluo de problemas especficos, no so capazes, em geral, de aprender, ou seja, de apresentar comportamento realmente inteligente. O maior interesse por estes sistemas data do incio dos anos 70, quando o paradigma da inteligncia artificial sofreu uma importante mudana, muito bem expressa nas palavras de Goldstein 3. Poderia deduzir-se desta afirmativa que a eficcia de um sistema especialista depende mais da quantidade de conhecimentos neles depositados do que da capacidade de adquirir conhecimentos. O fato que nenhum mtodo genrico perfeito foi encontrado ainda para criar ambiente inteligente sem o suficiente conhecimento para raciocinar sobre ele. Um avano importante e recente na rea de aquisio de conhecimentos seria os sistemas baseados em redes neurais, inspirados em modelos biolgicos, ou seja, nos fundamentos anatomofuncionais do crebro 4,5. Mas, at que esta mudana no paradigma venha a dar frutos maiores, os sistemas especialistas continuaro a depender muito mais da qualidade da sua base de conhecimentos do que da complexidade dos seus algoritmos.

Hospital Universitrio Walter Cantdio da UFC Correspondncia: Pedro Jos Negreiros de Andrade Rua Tibrcio Cavalcante, 1445/802 60125-100 Fortaleza, CE Recebido para publicao em 17/12/98 Aceito em 16/6/99

Dentro, pois, desta lgica de aplicao de bases de conhecimento, os sistemas especialistas de diagnstico em medicina dividiram-se,na sua fase inicial, em dois tipos 6: a) sistemas baseados em regras; b) sistemas baseados em reconhecimento de padres. A maioria dos esforos iniciais, no sentido de aplicar tcnicas de inteligncia artificial na resoluo de problemas reais em medicina, fundamentou-se em sistemas baseados em regras. Tais programas so relativamente fceis de criar, porque seu conhecimento catalogado na forma de regras do tipo If...Then... utilizadas em forma de cadeia com o objetivo de atingir uma concluso. Este tipo de programa facilmente consegue parecer inteligente, permitindo tambm o fcil uso das chamadas rvores de deciso, muito freqentes na medicina moderna. Em reas de domnio limitado, tais programas tm se mostrado bastante efetivos. Um exemplo bastante conhecido o sistema Mycin, desenvolvido na Universidade de Stanford para a seleo de antibiticos em pacientes com infeco severa 6. Esse programa j foi amplamente testado, mostrando um desempenho semelhante ao de especialistas na rea de doenas infecciosas. O problema desses sistemas baseados em regras que em reas mais complexas, como o diagnstico em Medicina Interna, o domnio do conhecimento de tal forma extenso que os torna de implementao extremamente difcil 6,7. Assim, sistemas desse tipo, designados pioneiramente para a rea mdica, encontraram uma aplicao bem maior em tarefas comerciais ou tcnicas tipo avaliao de linhas telefnicas. Apesar da mais que evidente utilidade desses sistemas em programas mdicos baseados em rvores de deciso, a principal limitao ao seu uso advm da dificuldade de aceitar condutas de um computador que ponham em risco vidas humanas 6. Em face da dificuldade de aplicar sistemas baseados em regras em reas de domnio extenso como o diagnstico em Medicina Interna , a soluo pareceria estar em programas tipo reconhecimento de padres (pattern matching systems). Ao nvel mais elementar, tais programas funcionam da seguinte maneira 7: 1) para cada possvel doena (hiptese diagnstica) determinam se um achado (sintoma, sinal ou exame complementar) apresentado pelo paciente pode aparecer nela; 2) estabelecem escores para cada doen537

Andrade PJN Teorema de Bayes e raciocnio diagnstico

Arq Bras Cardiol volume 73, (n 6), 1999

a de acordo com o nmero de achados que ela apresenta em comum com o paciente; 3) ordenam as doenas de acordo com os escores obtidos; 4) perguntam se achados pertencentes base de dados da doena com maior pontuao e no listados no caso encontram-se presentes no paciente; 4) repetem a anlise (1 e 2); 5) repetem o procedimento na(s) doena(s) seguintes (3 e 4). Se um programa tipo reconhecimento de padres for desenvolvido dentro desta forma simplista, ele se assemelhar maneira como muitos iniciantes abordam o processo de diagnstico. Em conseqncia falhar por no levar em conta os seguintes fatores: a) quo fortemente a presena de um achado (sintoma, sinal ou exame complementar) lembra uma determinada doena?; b) quo fortemente a ausncia de um achado afasta a possibilidade de uma doena ?; c) qual a prevalncia de cada uma das hipteses na populao estudada?; d) quo fortemente um achado presente no paciente e no presente na hiptese afasta o diagnstico?; e) o doente apresenta apenas uma ou mais de uma doena? f) se houver mais de uma doena, estaro elas relacionadas? Sabe-se que o mdico experiente, dispondo de uma forte base de conhecimentos na cabea, emprega com competncia estas informaes ao longo do processo diagnstico, sendo esta uma das caractersticas que o separa dos iniciantes 8-11. Por isso mesmo, os programas de computador mais conhecidos na rea de diagnstico diferencial, como o Internist 12, sua variante QMR 13, o DX Plain, o Iliad alm do programa Consultor, por ns desenvolvido, incorporam a um programa tipo reconhecimento de padres aspectos de raciocnio probabilstico e (no caso do Internist) de encadeamento causal. Para que sistemas especialistas deste tipo sejam melhor entendidos necessrio que discutamos mais detalhadamente os fundamentos lgicos do processo de diagnstico.

Lgica do processo de diagnstico


O avano da tecnologia coloca o problema diagnstico no primeiro plano das preocupaes. O diagnstico definitivo saiu da esfera Clnica e passou a depender de uma tecnologia mdica de altos custos e potencialmente iatrognica. Esta realidade obriga-nos a atuar com maior tirocnio, a utilizar mtodos cientficos na argumentao clnica, partindo da premissa que a iatrogenia e os gastos mdicos diminuem na medida dos acertos na solicitao de exames complementares 14.

Princpiosbsicos
A palavra diagnstico tem origem grega, significando discernir ou distinguir. Em termos mdicos, foi definido por Mason como uma srie de procedimentos de ordem intelectual e operacional atravs dos quais se obtm uma resposta a um problema clnico 14. Neste sentido, h vrias palavras que complementam a palavra diagnstico modificando-lhe o sentido: diagnstico clnico, diagnstico anatomopatolgico, diagnstico radiolgico, diagnstico eletrocardio538

grfico, etc. J a expresso diagnstico diferencial foi definido por Harvey 11 como a arte de distinguir uma doena de outras, estabelecendo uma ou mais causas bem definidas para explicar as alteraes apresentadas pelo paciente. O clssico instrumento de ensino desta forma de diagnstico tem sido as sesses clinicopatolgicas em que casos particularmente difceis so submetidos a internistas ou subespecialistas para efeito de ensino. Na prtica clnica, assim como nas referidas sesses, a seqncia pela qual feito o diagnstico diferencial pode ser resumida nas seguintes etapas 11: 1) colheita dos dados; 1a) histria clnica; 1b) exame fsico; 1c) exames laboratoriais; 2) anlise dos dados; 2a) Avaliao crtica dos dados colhidos; 2b) listagem dos achados em ordem de importncia; 2c) seleo de um ou, preferencialmente, dois a trs achados centrais; 2d) listagem das doenas em que esses achados centrais se encontram; 2e) busca do diagnstico final pela seleo da doena que melhor explica os achados do paciente; 2f) reviso de todos os dados positivos, a fim de no deixar nenhum achado considerado importante sem um diagnstico que o explique. A seqncia citada no necessariamente rgida. A anlise de um caso usualmente comea durante o prprio processo de colheita dos dados, quando o mdico utiliza a sua experincia para detalhar os achados obtidos. Diante da queixa de dispnia, um cardiologista procurar defini-la como de esforo ou de repouso, na tentativa de fazer o diagnstico de insuficincia cardaca. Procurar a partir da, no exame fsico, sinais de congesto sistmica (turgncia jugular, estertores de base) ou de sobrecarga do corao (desvio do pex, impulso de meso, ritmo de galope), para confirmar a hiptese formulada. Diante de um paciente com febre prolongada que apresenta um sopro mitral, o mdico experiente procurar sinais de fenmenos emblicos, palidez, esplenomegalia ou baqueteamento de dedos, para confirmar a suspeita de endocardite infecciosa (EI). Estes dois exemplos mostram como a anlise dos dados pode comear precocemente, aperfeioando a obteno da histria e do exame fsico. Terminada a colheita dos dados, o mdico os ordena por importncia e inicia-se o processo de diagnstico diferencial dentro da seqncia proposta anteriormente. Alguns mdicos procuram muitas vezes caracterizar combina es de achados como sndromes no intuito de simplificar o processo de diagnstico diferencial. Expresses como sndrome consuptiva, sndrome diarrica, sndrome de hipertenso pulmonar, sndrome congestiva, sndrome infecciosa, sndrome de derrame pleural e outras so freqentemente usadas. Representam na realidade formas de expressar em poucas palavras a combinao de sintomas, sinais ou achados laboratoriais enquadrados como de maior relevncia. Apesar do extremo didatismo desta abordagem, alguns problemas podem advir durante o seu uso. O primeiro a escolha equivocada dos achados centrais. Exige alguma experincia a definio de achados que, pela sua maior especificidade, merea estar no centro do processo de diagnstico. A escolha equivocada de um achado central pode tornar a lista de possibilidades levantadas excessivamente longa, dificultando a elaborao do diagnsti-

Arq Bras Cardiol volume 73, (n6), 1999

Andrade PJN Teorema de Bayes e raciocnio diagns ico

co. Alm disso, a omisso de um achado relevante da lista, um erro comum, de grave conseqncia para o processo de diagnstico 15. Outro erro freqente, mesmo entre os mais experientes, a concluso prematura de um diagnstico definitivo ou sindrmico, sem que haja dados indiscutveis para estabelec-lo 15. Para efeito de se entender melhor como feita a anlise diagnstica, como os erros acima podem ser evitados e como podemos simular o raciocnio mdico em um programa de computador interessante que faamos uma reviso crtica dos trs tipos de raciocnio diagnstico habitualmente utilizados.

Tiposderaciocniodiagnstico
Segundo Sox 16 existem trs tipos bsicos de raciocnio diagnstico: 1) o raciocnio fisiopatolgico; 2) o raciocnio por reconhecimento de padres; 3) o raciocnio probabilstico; O raciocnio fisiopatolgico o mais difcil de simular em um programa de computador. Quando um paciente descreve histria de febre h seis semanas, seguida trs semanas depois por dor no quadrante superior direito de crescente severidade, o mdico comea a imaginar uma massa que cresce e estabelece presso em estruturas sensveis dor. Comea ento a pensar em um abscesso heptico ou em um ndulo maligno com centro necrtico, causando resposta inflamatria. J o raciocnio por reconhecimento de padres o mais freqentemente usado tanto por estudantes de medicina quanto por especialistas. , alm disso, o mais fcil de simular em programas de computador. Certos achados ocorrem juntos e sua combinao leva o mdico a formular hipteses. A partir da ele confronta os dados do paciente com os da doena (hiptese) para verificar em que grau os mesmos se encaixam. Uma das falhas desse tipo de raciocnio consiste na incapacidade de reconhecer doenas quando elas se apresentam de forma diferente das suas manifestaes clssicas 7,14. As outras so semelhantes s comentadas em relao aos programas de computador que utilizam regras simples de reconhecimento de padres: a) no levar em conta quo fortemente a presena de um achado evoca uma doena; b) no levar em conta quo fortemente ausncia de um achado esperado afasta uma determinada hiptese; c) no levar em conta a prevalncia da doena; d) no levar em conta a relevncia de um achado, ou seja, quo fortemente o fato dele no ser explicado por uma doena a elimina como hiptese. O raciocnio probabilstico baseia-se no fato de que os mdicos convivem com a incerteza em um grau comparvel ao de bem poucos profissionais. Probabilidade, no caso, seria apenas uma maneira de medir essa incerteza. Quando dois mdicos dizem, por exemplo, que um doente provavelmente tem embolia pulmonar, um pode estar pensando em uma probabilidade de 30% e o outro de 90%. No manuseio dessa incerteza o mdico recorre muitas vezes a exames laboratoriais que a alteram, mas no a eliminam. Na interpretao probabilstica desses testes, os mdicos experientes usam intuitivamente o chamado Teorema de Bayes 16,17, o qual re-

laciona sensibilidade, especificidade, prevalncia e probabilidade ps-teste. Obviamente, a aplicao de tais conceitos deve idealmente referir-se no apenas a exames laboratoriais, mas tambm a achados de histria ou exame fsico. Alm destas trs formas clssicas de raciocnio, duas outras formas de fazer diagnstico merecem ser citadas: o raciocnio intuitivo e o diagnstico por aforismas. O raciocnio intuitivo provavelmente uma mistura inconsciente dos trs tipos de raciocnio j citados, alm de incorporar outros elementos subjetivos difceis de definir. O diagnstico por aforismas mais especificamente a mistura do raciocnio por reconhecimento de padres com o raciocnio probabilstico. Tais aforismas constituem-se em uma srie de regras baseadas na experincia de clnicos respeitveis. conhecido, por exemplo, o sinal de Courvoisier (ictercia associada vescula palpvel e indolor significa obstruo carcinomatosa do coldoco). Outro exemplo a expresso segundo a qual ictercia associada palidez e esplenomegalia faz pensar em anemia hemoltica. Tais aforismas, embora memorveis e abrangendo uma infinidade de combinao de achados clnicos, constituem, na verdade, simplificao de problemas complexos. Alm disso, sua memorizao pouco contribui ao ensino da lgica do processo de diagnstico. interessante lembrar que muita nfase tem sido dada, em anos recentes, s chamadas regras de predio clnica. As mesmas tm por objetivo reduzir o grau de incerteza no diagnstico, determinando como usar achados clnicos para fazer predies. Uma anlise mais cuidadosa mostra que essas regras de predio clnica so a reedio moderna dos antigos aforismas 18. A diferena que tais regress es estabelecidas atravs da anlise de centenas de pacientes, empregam clculos de probabilidade e tcnicas matemticas sofisticadas. Por isso, elas tm sido motivo de grande interesse nos ltimos anos, em particular pela sua potencial utilizao em sistemas de apoio deciso mdica 18,19. Dada a importncia do raciocnio probabilstico para os sistemas de apoio ao diagnstico mdico sobre ele que discorreremos com maior detalhe nas prximas pginas.

Raciocnio probabilstico em medicina


Quando voc pode medir um fenmeno sobre o qual est falando e express-lo em nmeros, voc sabe alguma coisa sobre ele. Mas, quando voc no pode medi-lo, quando voc no pode express-lo em nmeros, o seu conhecimento vago e insatisfatrio. Pode ser o comeo do conhecimento, mas voc progrediu muito pouco em direo ao estgio de cincia (Lord Kelvin (1824-1907) 6. As aparncias para mente so de quatro tipos: as coisas so o que parecem ser ou no so e nem parecem ser; ou so e no parecem ser; ou no so e mesmo assim parecem ser. Identificar corretamente todos esses casos a tarefa do homem sbio Epictetus (Sculo II DC) 20.

Conceitos bsicos
O raciocnio mdico sabidamente mais baseado em probabilidades do que em certezas. Sendo o raciocnio 539

Andrade PJN Teorema de Bayes e raciocnio diagnstico

Arq Bras Cardiol volume 73, (n 6), 1999

probabilstico to importante no processo de diagnstico, na definio de regras de predio clnica 18 e mesmo na conduta em casos complexos, espantoso que quase nada sobre o mesmo seja ensinado no currculo mdico. Para entendermos melhor os aspectos quantitativos da lgica diagnstica, ou mais especificamente o raciocnio probabilstico e o teorema de Bayes, necessria uma breve introduo aos conceitos de sensibilidade e especificidade a partir da definio de probabilidade condicional. Dentro deste conceito para dois eventos quaisquer A e B, sendo P(A)>0, definimos a probabilidade condicional de B dado A, como sendo: P(A B) P(B/A) = P(A) Consideremos agora a situao abaixo, sintetizada numa tabela 2x2, onde n1 pessoas sabidamente portadoras de uma doena e n2 pessoas sabidamente livres da doena foram submetidas a um determinado teste clnico: Teste/Doena (D) Presente (d) Ausente Total Positivo a c a+c Negativo b d b+d Total n1 n2 N

com lpus eritematoso sistmico (LES). Um teste altamente especfico raramente deixar de ser negativo em pessoas que no tenham a doena. Como exemplo de teste de alta especificidade teramos a presena de uma grande vegetao no ecocardiograma para efeito de diagnstico de EI. Em resumo, testes altamente sensveis so teis para afastar doenas quando negativos e testes altamente especficos so teis para confirmar doenas quando positivos. Sempre que alterarmos o critrio de positividade de um teste no sentido de torn-lo mais especfico, estaremos, por outro lado, diminuindo a sua sensibilidade. O oposto igualmente verdadeiro. O conceito de prevalncia refere-se freqncia da doena na populao estudada. J o conceito de valor preditivo mais complexo, referindo-se probabilidade que um indivduo tem de ter a doena aps o resultado alterado de um teste. S poderemos saber o valor preditivo de um teste se considerarmos conjuntamente informa es sobre prevalncia, sensibilidade e especificidade desse teste, expressas matematicamente atravs da frmula de Bayes.

Teorema de Bayes
Embora os conceitos de sensibilidade e especificidade sejam bastante difundidos, o mesmo no acontece com os conceitos de probabilidade pr-teste e ps-teste e, particularmente, com o teorema de Bayes, que, apesar de colocado nos captulos introdutrios de livros-texto clssicos 8 raramente lido ou ensinado aos estudantes de medicina. Recentemente, testou-se a capacidade dos estudantes de medicina de interpretar quantitativamente resultados de exames laboratoriais atravs da questo em uma prova de residncia mdica: um teste tem uma sensibilidade de 70% e uma especificidade de 90%. Aplicado em um paciente pertencente a populao em que a prevalncia da doena de 1% o exame resulta positivo. Qual a probabilidade psteste deste paciente ter a doena? No foi nenhuma surpresa verificar que a maioria dos estudantes situou esta probabilidade entre 70 e 90%, em vez de escolherem a resposta correta, que era 6,6%. Os nicos que acertaram foram os que, tendo rodado pelo Servio de Cardiologia, nele haviam recebido alguma informao sobre o teorema de Bayes, atravs da sua aplicao ergometria 22. Thomas Bayes (1702-1761) foi um filsofo, matemtico e religioso ingls, sendo considerado um dos pais do clculo de probabilidade. Anlise bayesiana seria, pois, uma teoria de deciso estatstica para clculo de probabilidade de uma proposio, com base na probabilidade original e nas novas relevncias. Expresso em termos clnicos o conceito segundo o qual o valor preditivo de um teste ou achado clnico depende no apenas da sua sensibilidade e especificidade, mas tambm da probabilidade prvia (ou seja, da prevalncia da doena na populao estudada). de importncia histrica ressaltar que o trabalho pioneiro sobre a aplicao do teorema de Bayes em Medicina foi publicado em 1959 por um especialista em informtica,

Temos nessa situao os seguintes resultados possveis: teste positivo e doena presente: VP (verdadeiro positivo) = a casos; teste negativo e doena ausente: VN (verdadeiro negativo) = d casos; teste negativo e doena presente: FN (falso negativo) = b casos; teste positivo e doena ausente: FP (falso positivo) = c casos. Ao perguntarmos: se a doena est presente, qual a probabilidade do teste ser positivo, ou melhor, P(T/D)? A resposta dada da seguinte maneira: P(T d) a/N a a P(T/D)=.................. = ............=............=............= VP/(VP+FN) P(d) n1/N nl a+b Esta a chamada a sensibilidade estimada do teste. Ao perguntarmos: Se a doena est ausente, qual a probabilidade do teste ser negativo, ou melhor, P(T/d)? A resposta no caso dada da seguinte maneira: P(T d) d/N (d) VN P(T/d)= .................. =............... = ............... =............... = P(d) n2/N n2 VN+FP Esta a chamada especificidade estimada do teste. Estes conceitos de sensibilidade e especificidade so bastante conhecidos, embora freqentemente em um nvel superficial ou intuitivo. Comearam a ser usados mais intensamente aps a II Guerra Mundial a partir da anlise da eficincia de achados radiolgicos no diagnstico de tuberculose 21. Um teste altamente sensvel raramente deixar de ser positivo em pessoas que realmente tenham a doena. Como exemplo de teste altamente sensvel teramos a presena de febre em pacientes com EI, ou o FAN positivo em paciente 540

Arq Bras Cardiol volume 73, (n6), 1999

Andrade PJN Teorema de Bayes e raciocnio diagns ico

Lested, e um mdico radiologista, Lusted, este ltimo previamente envolvido nos trabalhos que deram origem aos conceitos mdicos de sensibilidade e especificidade 20,23. A frmula original de Bayes, usada pelos estatsticos, seria a seguinte: P(Ci).P(A/Ci) P(Ci/A) = ............................, i= 1,....,n N P(Cj).P(A/Cj) j=1 Uma verso mais simples, aplicvel medicina a seguinte: Pv. S VP + = .......................................... Pv.S + (1-Pv). Pv(1-E) E analogamente: Pv . (1-S) VP - = .......................................... Pv(1-S) + (1-Pv). E Onde: VP + = valor preditivo (probabilidade ps-teste) de teste positivo; VP - = valor preditivo (probabilidade psteste) de teste negativo; Pv = prevalncia da doena (ou probabilidade pr-teste); S = sensibilidade do teste ou achado clnico; E = especificidade do teste ou achado clnico. Um aspecto inerente frmula bayesiana a possibilidade de ser aplicada seqencialmente. Em outras palavras, aps aplicar ao resultado de um teste frmula bayesiana, o valor preditivo obtido passa a ser a nova probabilidade de ocorrncia da doena. A partir dela novas probabilidades devero ser calculadas face a outros testes ou achados. O nico pressuposto para essa aplicao seqencial que os testes sejam independentes entre si, ou seja, que o resultado de um no interfira no do outro. Exemplos de testes no independentes seriam a depresso do ST na prova de esforo e a presena da mesma depresso de ST no Holter. Outro exemplo seria a presena de palidez conjuntival ao exame fsico e o achado de hemoglobina diminuda no hemograma. At onde pudemos investigar a primeira tentativa prtica de aplicar o teorema de Bayes medicina foi na rea de cardiologia, atravs dos trabalhos de Warner e cols. 24,25, que o utilizaram como auxiliar ao diagnstico de cardiopatias congnitas. Mas, o trabalho de maior repercusso na nossa especialidade foi publicado por Rifkin e Hood 26 que conseguiram explicar atravs dele as curiosas diferenas de credibilidade do eletrocardiograma de esforo quando aplicados em homens ou mulheres, assim como em pacientes sintomticos ou assintomticos. Seguiram-se outros trabalhos demonstrando do ponto de vista prtico a fora do emprego da lgica bayesiana na interpretao da ergometria 17,27, levando por conseqncia a sua grande divulgao entre cardiologistas, logo a seguir estendida a todas as reas da medicina interna. O que esses trabalhos mostraram, se tomarmos um teste com sensibilidade de 60% (S=0,6) e uma especificidade de

90% (E=0,9) e o aplicarmos em uma populao com prevalncia da doena de 1% (PV=0,01), que a probabilidade de um paciente com teste positivo apresentar doena seria (de acordo com a frmula de Bayes) a seguinte: 0,01 x 0,6. VP + = = 0,056 (ou 5,6%) (0,01 x 0,6) + (0,99x 0,1) Esta situao reflete a probabilidade de uma mulher de 43 anos assintomtica (ou uma jovem de 33 anos com dor torcica no cardaca) apresentar doena coronariana face a um teste de esforo positivo 17,26-28. A lio bsica do emprego da frmula no caso que constitui um desperdcio de recursos solicitar uma prova de esforo eletrocardiogrfica nesta situao, pois dificilmente a mesma alterar a conduta a ser tomada 29. Se a probabilidade pr-teste for no entanto de 50% (caso de um homem de 48 anos com angina atpica) o teste de esforo positivo alterar a probabilidade de doena coronariana para 85% se positivo e para 28% se negativo. Uma outra forma de calcular a probabilidade ps-teste atravs do uso de diagramas. Tomemos, por exemplo, uma populao com probabilidade de apresentar uma doena de 5%, submetendo-se a um teste que apresenta sensibilidade de 70% e especificidade de 90%. O caso guarda uma certa analogia com o uso de uma urografia excretora em um paciente com uma probabilidade um pouco maior que a habitual de apresentar estenose de artria renal. Em caso, portanto, de urografia alterada, qual seria a probabilidade de estenose da artria renal em um paciente com probabilidade prvia de 5%? Para resolver esse problema poderemos construir o seguinte diagrama: 1000 pacientes 950 sadios 95 FP 855 VN (PV= 5%) => 50 com estenose

<=( E=90%) S=70%) =>35 15 (VP) (FN) VP Prob. ps teste + = ................ VP + FP 35 35 Prob. ps teste + = ................... ............ = 26,9% 35+95 130 A lio que se tirou do emprego da frmula bayesiana nesta situao foi que a prtica de solicitar urografia excretora na avaliao de possvel estenose de artria renal, uma regra no passado,deveria ser suspensa, uma vez que os custos e a morbidade do teste seriam maiores que o ganho a ser obtido com ele 30. A conseqncia que outros testes como o renograma com captopril passaram ento a ser utilizados no seu lugar, e ainda assim em pacientes com suspeita significativa de hipertenso renovascular. Dos exemplos citados, parece claro a grande importncia da probabilidade prvia, ou seja, da prevalncia da doena na interpretao de um teste ou achado clnico. Fica claro tambm que testes com sensibilidade e especificidade 541

Andrade PJN Teorema de Bayes e raciocnio diagnstico

Arq Bras Cardiol volume 73, (n 6), 1999

limitados alteram significantemente a probabilidade diagnstica apenas quando aplicados em indivduos com probabilidade intermediria de ter uma doena 16. Nas situaes em que a probabilidade prvia muito alta ou muito baixa, testes de sensibilidade e especificidade limitados no alteram o diagnstico. A exceo seria testes de alta especificidade para indivduos com baixa probabilidade prvia ou testes de alta sensibilidade para indivduos com alta probabilidade prvia. Outras formas de utilizao do teorema de Bayes tm sido propostas como o uso de nomogramas 31 e a tabela 2x2 dos estatsticos e epidemiologistas 15, por alguns considerados de mais fcil aplicao 32. Apesar da s recente divulgao do teorema de Bayes entre internistas e cardiologistas, particularmente em funo da interpretao de testes ergomtricos 22,32, importante enfatizar que os mdicos experientes sempre o empregaram, ainda que intuitivamente, em todas as etapas do processo diagnstico. Quando os antigos clnicos afirmavam ser a clnica soberana, face aos exames laboratoriais, estavam, sem o saber, raciocinando bayesianamente. Quando afirmavam ser melhor pensar em doenas comuns, ainda que com manifestaes atpicas, em lugar de manifestaes tpicas de raridades, estavam, intuitivamente, aplicando o teorema de Bayes. Usar a presena de achados de alta especificidade para confirmar diagnsticos e achados de alta sensibilidade para afast-los, aplicar, ainda que no formalmente, a lgica bayesiana. Em uma poca de proliferao tecnolgica, em que exames laboratoriais so solicitados desnecessariamente e mal interpretados, dar relevncia historia do paciente e a dados epidemiolgicos raciocinar bayesianamente 22.

seria o uso do teorema de Bayes convertido em um sistema de escores,conforme proposta de Rembold e Watson 34. Segundo esses autores, convertendo a probabilidade em chances e linearizando a equao pelo uso do logaritmo natural correspondente,teramos a converso dos valores fracionrios em nmeros inteiros, que seriam chamados de peso ou escores, mais fceis de serem entendidos e utilizados. A frmula proposta por Rembold e Watson seria a seguinte: 1-S ln chance ps-teste (+) = ln chance pr-teste + ln 1- E 1-S ln chance ps-teste (-) = ln chance pr-teste + ln E (Onde ln = logaritmo natural, S= sensibilidade e E= especificidade) chance doena = prob D/pro (1-D) D= Mesmo sem entrar no mrito matemtico desta proposio ela se torna atraente por sugerir que ao atribuirmos escores positivos para testes ou achados clnicos em funo principalmente da especificidade (se presentes ou positivos) e escores negativos em funo da sensibilidade (se ausentes ou negativos) estar-se-ia, de certa forma, aplicando o teorema de Bayes. Outra razo para ver com simpatia propostas deste tipo que a idia de fazer diagnsticos atravs de escores de h muito familiar aos clnicos, sendo enorme a literatura sobre o assunto. Na cardiologia, talvez tenha sido Jones 35 o primeiro a propor, com aceitao, uma forma de diagnstico atravs de alguma coisa anloga a escores. Os chamados critrios de Jones (dois sinais maiores ou um maior e dois menores como condio para o diagnstico de febre reumtica) so facilmente transformveis em escores. Basta no caso atribuir o valor 5 para os sinais maiores e 2 para os sinais menores e considerar 9 como a somatria de pontos capaz de tornar provvel o diagnstico de febre reumtica. Os sinais maiores so obviamente os de alta especificidade; os menores, os menos especficos. Ainda dentro da cardiologia, alm da prpria febre reumtica, doenas to diversas quanto insuficincia coronariana 29, insuficincia cardaca 36, prolapso de vlvula mitral 37 EI 38 e derrame pericrdico j tiveram propostos critrios de diagnsticos atravs da somatria de escores, ou algo semelhante (combinao de sinais maiores e menores). Na reumatologia so bem conhecidos os critrios do Colgio Americano de Reumatologia para diagnstico de artrite reumatide 39 e LES 40. Na endocrinologia interessante lembrar o critrio de pontos de Wayne para o diagnstico de hipertireoidismo 41. A lista potencial enorme, sugerindo que o diagnstico atravs de escores apresenta uma base lgica muito forte (no fundo de natureza bayesiana, ainda que sem o rigor matemtico do emprego da frmula), servindo de instrumento de utilizao extremamente simples em softwares de diagnstico diferencial. Por todas estas razes programas como o Internist-I e sua variante QMR tentam fazer diagnsticos atravs de escores que so atribudos relao entre os achados clnicos e as doenas. Um destes escores refere-se evoking strenght, que, segundo os autores, representaria grosseiramente o conceito de valor preditivo positivo, sendo fortemente in-

Diagnsticos baseados em escores, suas relaes com o teorema de Bayes e com sistemasespecialistas
O teorema de Bayes pela sua perfeio lgica,exatido matemtica e possibilidade de aplicao seqencial, pareceria, pois, o instrumento ideal para estabelecer uma ponte entre o raciocnio mdico e a informtica. Apresenta, no entanto, algumas limitaes, particularmente no que toca ao seu uso em sistemas especialistas de diagnstico diferencial: a) dificuldade de definir a probabilidade prvia em situaes diferentes. Programas designados para os Estados Unidos da Amrica teriam que ser modificados em regies como o interior do Cear. Alm disso, a prevalncia de certas doenas varia tambm com a instituio, sendo, s vezes, baixssima em um ambulatrio geral, no to baixa na enfermaria de um hospital tercirio e alta em sesses anatomoclnicas; b) dificuldade de aplicar seqencialmente a frmula Bayesiana em mltiplos testes e, particularmente, em circunstncias em que os testes no sejam independentes 16,33; c) dificuldade de entendimento da frmula por parte de especialistas mdicos encarregados da elaborao da base de dados. Estas dificuldades seriam a provvel explicao para o fato dos programas baseados em uma aplicao rgida do teorema de Bayes funcionarem melhor em reas mais limitadas do conhecimento mdico. Uma forma de minimiz-las 542

Arq Bras Cardiol volume 73, (n6), 1999

Andrade PJN Teorema de Bayes e raciocnio diagns ico

fluenciado pela especificidade e pela prevalncia. O segundo refere-se freqncia do achado na doena, a qual guardaria relao com a sensibilidade do achado. O programa Internist foi testado em artigo clssico 12, mostrando desempenho inferior ao dos responsveis pela discusso dos casos em sesses anatomoclnicas do New England Journal of Medicine, mas comparvel ao dos responsveis pelos pacientes (diagnstico clnico). Em avaliao posterior, a sua variante QMR 42 teve desempenho considerado como satisfatrio em termos de auxlio ao diagnstico em casos reais em hospitais universitrios. Alm desses o Dx-Plain 43, da Universidade de Harvard e o Iliad 44 inspiram-se em princpios semelhantes, sendo este ltimo rigorosamente bayesiano.O programa Consultor, desenvolvido inicialmente na rea de cardiologia 45 e depois estendido a toda medicina interna 46 apresenta importantes analogias com os referidos sistemas. Consultor foi avaliado inicialmente atravs da submisso ao mesmo de provas de residncia mdica 46 e, mais recentemente, atravs de sesses anatomoclnicas do Hospital Universitrio Walter Cantdio e do New England Journal of Medicine (neste caso apenas casos cardiolgicos). O sistema teve, luz destas avaliaes, um desempenho bastante aceitvel , em medicina interna de maneira geral e em cardiologia em particular 1,47. Os quatro sistemas norte-americanos avaliados comparativamente apresentaram desempenho tambm aceitvel e comparativamente similar 48,49. Algumas das suas limitaes, no entanto, levam os especialistas na rea a concluir que deveriam ser utilizados apenas por mdicos capazes de identificar e utilizar as informaes relevantes e ignorar as irrelevantes por eles fornecidas. Uma srie de questionamentos poderia ser levantada em relao aos sistemas especialistas de apoio ao diagnstico mdico. Podero tais programas embotar o desenvolvimento do raciocnio clnico? Dever ou no ser permitida a sua utilizao por leigos ou paramdicos? Podero sistemas como este, no futuro, substituir os clnicos? Em relao 1 pergunta a nossa experincia de que a utilizao de sistemas especialistas de apoio ao diagnstico por estudantes

de medicina leva-os a dominar mais intensamente conceitos como sensibilidade, especificidade e prevalncia e suas relaes com o teorema de Bayes, melhorando, em vez de embotar o raciocnio clnico. Obviamente, uma avaliao mais definitiva exigiria que se comparasse o desempenho diagnstico de estudantes treinados no uso de tais sistemas com o de estudantes no expostos aos referidos programas. A 2 pergunta mais difcil de responder. Embora nenhum conhecimento deva, em princpio, ser privilgio de uma corporao, a tendncia atual dos responsveis por sistemas especialistas no liber-los para a populao leiga. Isso se deve fundamentalmente a duas raz es: a mais importante que no se pode confiar ainda plenamente no valor preditivo dos diagnsticos desses sistemas, o que poderia levar prejuzo a pacientes se usado por indivduos no adequadamente treinados; a outra que o desempenho de sistemas especialistas exige obteno e interpretao acuradas dos achados clnicos, que no so encontradas no momento fora da profisso mdica. Parece, portanto, evidente que a liberao de sistemas especialistas como o Consultor, o QMR, o Iliad e o Dxplain para uso por pessoal leigo poder trazer mais riscos que benefcios para os pacientes, uma vez que o algoritmo desses sistemas necessita ser aprimorado, pois um longo caminho continua a separ-los de um comportamento realmente similar ao raciocnio mdico 49-52. Tal caminho passa, particularmente em relao ao Consultor 28, pela incorporao de um grau maior de raciocnio fisiopatolgico sua lgica e pelo estabelecimento de relaes de causa e efeito entre doenas. Possivelmente, isso s ser atingido atravs da substituio das atuais linguagens por outras mais adequadas inteligncia artificial. Mas, ainda que o desempenho destes sistemas melhore, tornando-os realmente inteligentes e independentes, dificilmente poder-se- aceitar a possibilidade de virem a substituir os mdicos, devido ao lado humano da profisso, da necessidade de colheita minuciosa dos dados e da capacidade de compaixo pelos semelhantes, que mantero sempre um lugar para o mdico no cuidado dos pacientes.

Referncias
1. 2. Ribeiro JC. Aula da Saudade. Rev Med Univ Fed Cear 1976; 15: 67-70. Genaro S. Sistemas Especialistas: O Conhecimento Especializado. Rio de Janeiro - So Paulo: Livros Tcnicos e Cientficos Editora, 1986. 3. Goldstein J, Papert S.Cogn Sci, 1977; 1: 84. Apub Duda RO, Sotliffe EH. Expert systems research. Science 1983; 220: 261-20. 4. Baxt WB. Use of an artificial neural network for the diagnosis of miocardial infarction. Ann Intern Med 1991; 115: 843-8. 5. Ortiz J, Sabbatini RM, Gheffer CGM, Silva CES. Uso de redes neurais artificiais na avaliao da sobrevida na insuficincia cardaca. Arq Bras Cardiol 1995; 64: 87-90. 6. Duda RO, Shotliffe EH. Expert system research. Science 1983; 220: 261-8. 7. Slozovitz P, Patil R, Schwartz WB. Artificial inteligence in medical diagnosis. Ann Intern Med 1988; 108: 80-7. 8. Pauker SG. Clinical decision making. In: Wyngarden JB, Smith Jr LH, Bennett JC (Ed). Cecils Textbook of Internal Medicine. Philadelphia: WB Saunders, 1992: 68-73. 9. Braunwald E. Introduction to clinical medicine. In: Braunwald et al (Ed). Harrisons Principles and practice of Internal Medicine. New York: McGraw-Hill, 1987: 1-5. 10. Johns RJ, Hazzard WR. Clinical information and problem solving. In: Harvey AM, et al (Ed). The Principles and Practice of Medicine. Norwalk-Connecticutt: Appleton Century Crafts, 1984: 5-27. 11. Harvey AM, Bordley J. Diferential Diagnosis - Abridgement of the 2nd Ed. Philadelphia: WB Saunders, 1972: 1-18. 12. Miller RA, Pople Jr, HE, Myers JD. Internist I, an experimental computer based diagnostic consultant in general internal medicine. N Eng J Med 1982; 307: 468-75. 13. Miller RA, McNeil MA, Chalinor SM, Masarie FE, Myers JDP. The internist1/ quick medical reference project- Status report. West J Med 1986; 145: 816-22. 14. Rodrigues PMM. Lgica diagnstica. Cear Mdico 1981; 3: 71-2. 15. Voytovich AE, Ryppey RM, Sufreddem AS. Premature conclusions in diagbnostic reasoning. J Med Educ 1985; 60: 302-7. 16. Sox Jr HC. Medical decision making. In: Barondness JA, Carpenter G, Harvey AM. Diferential Diagnosis. Philadelphia: Lea & Fediger, 1994: 9-22, 17. Diamond GA, Forrester JS. Analisys of probability as an aid in the clinical diagnosis of coronary artery disease. N Eng J Med 1979; 300: 1350-8. 18. Wasson JH, Sox HC, Neff RK. Clinical prediction rules: aplications and methodological standards. N Eng J Med 1980; 392: 1109-17. 24. Warner HR, Toronto F, Veasy LG. Experience with Bayess theorem for computer diagnosis of congenital heart disease. Ann NY AcadSci 1964; 115: 558-67. 25. Warner HR, Toronto AK, Vezsy LG, Stephenson RA. Mathematical aproach to me-

543

Andrade PJN Teorema de Bayes e raciocnio diagnstico


dical diagnosis : aplication to congenital heart disease. JAMA 1964; 177: 177-83. 26. Rifkin RD, Hood Jr WB. Bayesian analisys of the eletrocardiogram exercise testing. N Eng J Med 1977; 297: 681-5. 27. Wegner DA, Ryan TJ, McCabe CH. Exercise stress testing: correlations between history of angina, ST response and prevalence of coronary artery disease in the coronary artery surgery study (CASS). N Eng J Med 1979; 30: 230-5. 28. Andrade PJN. Apresentao e avaliao de um programa de computador de auxlio ao diagnstico mdico. Tese de Livre-Docncia-UFC, 1995. 29. Gibbons RJ, Balady GJ, Beasley JW, et al. Guidelines for exercise testing. A report of the American College of Cardiology/American Heart Association Task Force on Practice Guidelines (Committee on Exercise Testing) J Am Coll Cardiol 1997; 30: 260-315. 30. Cheilin MD, Solokox M, McIlroy MB. Clinical Cardiology. Lange Medical Publishers 1994: 280. 31. Fagen TJ. Nomogram for Bayess theorem. N Eng J Med 1975; 243: 57. 32. Brito AHX. Anlise bayesiana do teste ergomtrico. Arq Bras Cardiol 1991; 56: 97-103. 33. Sox HL. Probability theory in the use of diagnostic tests. Ann Intern Med 1986; 104: 60-6. 34. Rembold C, Watson DW. Pos-test probability by weights: a simple form of Bayess theorem. Ann Intern Med 1988; 108: 115-20. 34. Jones TD. The diagnosis of rheumatic fever. JAMA 1944; 126: 481-2. 35. McKee PA, Castelli WB, McNamara PM. The natural history of congestive heart failure: the Framingham study. N Eng J Med 1971; 285: 1441-6. 37. Perloff JK, Child JS, Edward JE. New guidelines for the clinical diagnosis of mitral valve prolapse. Am J Cardiol 1986; 57: 1124-8. 38. Von Reyv CF, Levy DS, Arbeit RD, Friedlan G, Crompacks CS. Infective endocarditis: an analisys based on strict case definition. Ann Intern Med 1981: 94: 505-18. 39. Arnett FC, Edworthy SM, Chlock DA. The American Rheumathism Association

Arq Bras Cardiol volume 73, (n 6), 1999


1987 revised criteria for the classification of rheumathoid arthritis. Arthrits Rheum 1987; 31: 315-20. The 1982 revised criteria for the classification of systemic lupus erythematosus. Arthritis Rheum 1982; 25: 1271-8. Wayne EJ. Clinical and metabolic studies in thyroid disease. Brit Med J 1960; 1: 78-82. Bankowitz RA, McNeil MA, Chalinor SM, Parker RC, Kappoor WN, Miller RA. A computer-assisted medical diagnostic consultation service. Ann Intern Med 1989; 110: 824-32. Batnett GO, Cimino JJ, Hupp JA, Hoffer EP. Dxplain: an evolving diagnostic decision system. JAMA 1987; 87: 67-74. Warner HR Jr. Iliad: moving medical decision-making into new frontiers. Method Inf Med 1989; 28: 370-2. Andrade PJN, Menezes HVB, Teixeira CAC, Colares FAN, Lima JMC. Projeto Hipcrates - Sistema de auxlio ao diagnstico diferencial em Cardiologia. Sess es de Temas Livres: VIII Congresso Norte-Nordeste de Cardiologia, 1988. Andrade PJN, Menezes HVB, Teixeira CAC, et al. - Avaliao de um software de diagnstico diferencial em Medicina Interna e Cardiologia. Arq Bras Cardiol 1993; 60: 285-8. Andrade PJN, Menezes HVAB, Rocha ELA, Magalhes HA. Avaliao com nfase em Cardiologia de um software de diagnstico diferencial em Medicina Interna. Arq Bras Cardiol 1996; 67(supl 1): 110. Berner ES, Webster GD, Shugerman AA, et al. Performance of four computer-based diagnostic systems. N Eng J Med 1994; 330: 1792-6. Kassirer JP. A report on computer-assisted diagnosis - the grade. CN Eng J Med 1994; 330: 1884-5. Barnett GO. The computer and clinical judgement. N Eng J Med 1982; 307: 493-4. Sabatini RME. O diagnstico mdico por computador. Informdica 1993; 1: 5-10. Schwartz P, Papil RM, Slozovits P. Artificial inteligence in medical diagnosis: where do we stand? N Eng J Med 1987; 316: 685-7.

40. 41 42.

43. 44. 45.

46.

47.

48. 49. 50. 51. 52.

544

Anda mungkin juga menyukai