Domnios Mdicos
Maria do Carmo Nicoletti 1; Flvia Oliveira Santos 1
1
Depto. de Computao - DC/UFSCar
Rodovia Washington Luiz, km 235 - 13565-905 - So Carlos (SP)
Resumo - Este artigo trata do uso de tcnicas simblicas indutivas de aprendizado automtico de mquina aplicadas a
domnios mdicos. Apresenta os paradigmas proposicional e relacional de aprendizado simblico indutivo e discute a
efetiva contribuio de tais mtodos no aprendizado de regras de diagnstico mdico.
Abstract - This paper describes the use of inductive symbolic techniques of automatic machine learning applied to
medical domains. It presents the propositional and relational paradigms of inductive symbolic learning and discusses the
effective contribution of these methods when learning medical diagnostic rules.
1
Resultados do conceito) deve ser cuidadosamente "pensado" e
preparado, de maneira que ele possa orientar o sistema
Os problemas tpicos do aprendizado precisamente na direo da expresso do conceito;
proposicional, alm daqueles inerentes prpria na dificuldade da definio pelo usurio, da teoria do
limitao da sua expressividade, so bem conhecidos e domnio, i.e., de um conjunto adequado de predicados
suas possveis solues, bem estudadas. Por exemplo, representativos, que sero utilizados como base para a
problemas relacionados a atributos multivalorados, a expresso daquele conceito. A esses problemas,
atributos com valores contnuos, com valores acrescente-se algumas limitaes na aplicao de
desconhecidos, com valores irrelevantes, memria sistemas de PLI, apontadas em Bratko5: falta de
disponvel versus nmero de exemplos, facilidade para o usurio controlar o processo indutivo
incrementabilidade, redundncia, dados com rudos, (e.g. poder especificar restries nos operadores de
etc. foram exaustivamente abordados e diversas refinamento); instabilidade dos resultados
solues poder ser encontradas na literatura. Entretanto (sensibilidade ao setup de parmetros e modos de
alguns domnios, particularmente domnios mdicos, operao).
caracterizam-se pela existncia de rudos inerentes que,
em alguns casos, dificilmente so eliminados, mesmo Discusso e Concluses
com uma cuidadosa preparao dos exemplos de
treinamento e utilizao de tcnicas disponveis para As tcnicas de aprendizado simblico
tratamento de rudos em sistemas proposicionais3. Em proposicional j esto consolidadas; o uso de sistemas
domnios mdicos, alguns dados so colecionados a que as implementam j fato. Apesar desse
partir da descrio da doena/sintoma feita s vezes de aprendizado ser limitado, sua contribuio e seus
memria pelo prprio paciente e interpretada por um limites so perfeitamente conhecidos. Entretanto,
mdico. Em muitos casos, tanto a descrio quanto a como visto, quando tais sistemas so utilizados na rea
interpretao so subjetivas e, conseqentemente, no mdica, alguns cuidados adicionais devem ser
confiveis. Esse poblema discutido em Lavrac et al 4, tomados. J sistemas de programao lgica indutiva,
onde descrito um experimento do aprendizado de em virtude de serem razoavelmente recentes, tm ainda
regras para diagnstico de doenas reumticas, em um longo caminho a percorrer, para se tornarem
estgio inicial. Nesse experimento, as efetivamente sistemas automticos de aquisio de
aproximadamente 200 doenas reumticas podiam ser conhecimento. Apesar de mais poderosos que os
agrupadas em 3, 6, 8 ou 12 classes de diagnstico. proposicionais, sua utilizao ainda exige um esforo
Oito classes foram escolhidas, por sugesto de um exagerado por parte do usurio, na preparao do
especialista. Notou-se, entretanto, que conjunto de exemplos e teoria de domnio apropriada.
aproximadamente 74% dos exemplos disponveis
pertenciam a duas dessas classes, restando s 6 outras Referncias
apenas 26%. Dos 462 registros de pacientes, apenas
16 pertenciam classe de doenas inflamatrias da 1
MURPHY, P.M.; AHA, D.W. UCI Repository of
espinha, por exemplo. Apesar dos problemas machine learning databases and domain theories,
associados confeco do conjunto de treinamento, o Irvine, University of California, Department of
aprendizado indutivo proposicional tem sido Information and Computer Science, 1994.
satisfatoriamente utilizado em domnios mdicos, 2
desde que considerados alguns pontos: o conjunto de NICOLETTI, M.C. Ampliando os limites do
treinamento deve ser representativo do domnio, tanto aprendizado indutivo de mquina atravs das
abordagens construtiva e relacional. Tese de
qualitativa quanto quantitativamente; tcnicas
Doutorado, IFSC/USP, 1994.
convencionais para tratamento de rudos devem
3
necessariamente ser aplicadas, caso contrrio, a GAMBERGER, D. Inductively learned rule for
tendncia a da gerao de um nmero grande de breast cancer domain with improved interobserver
regras, excessivamente especializadas e reproductibility. P. Barahona; M. Sefanelli; J. Wyatt
conseqentemente, com pouca utilidade; a aplicao (eds), Lecture Notes in AI 934, 1995, pp. 431-432.
de tcnicas de aprendizado de mquina a domnios 4
LAVRAC, N. et al. The utility of background
mdicos sofre um problema conhecido como problema
knowledge in learning medical diagnostic rules.
geogrfico, que geralmente impede a portabilidade de
Applied Artificial Intelligence 7, 1993, pp. 273-293.
conjuntos de regras entre regies/pases.
5
Por outro lado, pesquisas tm tentado BRATKO, I. Machine learning and qualitative
contornar as limitaes representacionais reasoning. Machine learning 14, 1994, pp. 305-312.
caractersticas do aprendizado proposicional, atravs
do uso de sistemas relacionais, tipicamente, os sistemas
Agradecimentos : FAPESP, pelo apoio financeiro.
de programao lgica indutiva. A difuso no uso de
tais sistemas tem esbarrado: na dificuldade de
definio e preparao do conjunto de exemplos pelo
usurio do sistema. O conjunto de exemplos (sempre
dividido em exemplos positivos e exemplos negativos