TESE
Estudos em Descoberta de Conhecimento e
Minerao de Dados em Sade
ATENO!
Em se tratando de material para
prova de seleo de alunos no
Curso de Especializao em
Informtica em Sade
de
Livre-Docncia
junto
ao
Departamento de Informtica em
Sade (Disciplina de Informtica em
Sade).
So Paulo
2013
ii
TESE
Estudos em Descoberta de Conhecimento e
Minerao de Dados em Sade
Livre-Docncia
junto
ao
Departamento de Informtica em
Sade (Disciplina de Informtica em
Sade), de acordo com o processo
no 23089.001329/2012-11, edital no
819/2012 publicado em 24/12/2012,
e edital de retificao no 402/2013
publicado em 10/05/2013.
So Paulo
2013
iii
iv
AGRADECIMENTO
De corao meus sinceros agradecimentos a todos os colegas, professores, tcnicoadministrativos e alunos que colaboraram, uns mais outros menos, com as atividades
de pesquisa apresentadas nesta tese. Tambm agradeo aos meus familiares e
agregados que me apoiaram, com pacincia e f, para que minha carreira acadmica
chegasse ao dia de hoje. Agradeo pela felicidade e oportunidade de poder escrever
este documento com vocs. Este documento resultado do que imaginamos juntos,
colaborativamente.
Vamos continuar pensando grande, sempre comeando pequeno e crescendo
rapidamente nossa coleo de pequenos dados da sade....
SUMRIO
AGRADECIMENTO .....................................................................................................IV
NDICE DE TABELAS..................................................................................................IX
NDICE DE QUADROS .................................................................................................X
NDICE DE FIGURAS ..................................................................................................XI
NDICE DE ABREVIATURAS E SIGLAS ...................................................................XIII
NOTAS ..................................................................................................................... XVI
RESUMO ................................................................................................................. XVII
1. INTRODUO ......................................................................................................... 1
1.1. Contexto...................................................................................................... 1
1.2. Organizao do Documento ........................................................................ 6
1.3. Referncias ................................................................................................. 8
2. ESTUDOS SOBRE A REA DE INFORMTICA EM SADE ................................ 11
2.1. Epistemologia da Informtica em Sade ................................................... 12
Tesauro para Modelagem de Domnios .................................................. 14
Pesquisas Realizadas........................................................................................ 15
Estatstica de Termos de Artigos PubMed .............................................. 17
Tesauro EpistemIS ................................................................................. 18
Publicaes no PubMed ......................................................................... 19
Pesquisa de Opinio .............................................................................. 21
Tecnocincia Interdisciplinar .................................................................. 22
Diferentes Nomenclaturas para Informtica em Sade........................... 23
Informtica em Sade como Melhor Nomenclatura ................................ 27
Nomenclaturas na Web .......................................................................... 29
Subreas da Informtica em Sade ....................................................... 29
2.2. Classificao de Artigos Cientficos da Informtica em Sade .................. 33
Classificao e Indexao de Artigos ..................................................... 34
Pesquisas Realizadas........................................................................................ 36
Portal ISI Web Of Knowledge ................................................................. 37
Estratgia de Classificao e Indexao dos Artigos.............................. 38
Separao de Domnios por Termos ...................................................... 40
Proposta de Mtodo de Indexao ......................................................... 41
2.3. Rede de Colaborao em Informtica em Sade ...................................... 44
Anlise de Rede Social .......................................................................... 45
Pesquisas Realizadas........................................................................................ 47
vi
vii
viii
ix
NDICE DE TABELAS
Tabela 1 Tesauro EpistemIS. Distribuio de termos nas reas de conhecimento e
categoria MeSH (Colepicolo 2008). ............................................................................ 18
Tabela 2 - Primeiros 30 nomes da rede social de 793 profissionais, pesquisadores e
estudantes da informtica em sade usando critrio do ndice Pisa de Popularidade.
Clculo realizado em 2008 (Costa et al. 2008)............................................................ 49
Tabela 3 - Mtricas globais dos grafos de relaes entre os currculos e suas ligaes
(coautorias) dentro de cada grande rea. ................................................................... 56
Tabela 4 - Mtricas globais dos grafos de relaes entre os currculos e suas ligaes
(coautorias) dentro das cinco reas mais citadas........................................................ 56
Tabela 5 - Top 5 de mtricas de centralidade (intermediao e proximidade) (a) global
e (b) nas 2 maiores grandes reas da informtica em sade. ..................................... 57
Tabela 6 - Quantidade de pginas web, contagem de palavras repetidas e contagem
de palavras no-repetidas para as bases de treinamento e validao do classificador
InDeCS de Mancini (2011). ......................................................................................... 78
Tabela 7 - Exemplo de 10 dos 100 termos DeCS encontrados aps a filtragem e suas
frequncias em cada seo e nmero total dos laudos, respectivamente (Nicolas
2013). ....................................................................................................................... 165
Tabela 8 - Valores mnimos e mximos da mdia e do coeficiente do tempo de
permanncia hospitalar e quantidade de DRGs de 1998 a 2006. Unidade de tempo em
dias (Dalmati 2012). .................................................................................................. 204
Tabela 9 - Valores mdios, desvio padro, mnimo e mximo do nmero de
hospitalizaes (sadas) e do coeficiente de variao de todos os anos, de 1998 a
2006 (Dalmati 2012). ................................................................................................ 206
NDICE DE QUADROS
Quadro 1 - Nmero aproximado de ocorrncias na web das principais nomenclaturas
associadas rea da informtica em sade. .............................................................. 30
Quadro 2 - Codificao dos atributos para construo do classificador de doena
celaca (Tenrio 2011). ............................................................................................. 138
Quadro 3 - Distribuio da importncia das variveis em cada cluster identificado no
projeto Epidoso. A ordem (de cima para baixo) das variveis representa sua
importncia (da mais para a menos importante) no grupo (cluster). A intensidade da
cor azul representa a importncia global da varivel para a clusterizao (Cohrs 2011).
................................................................................................................................. 192
xi
NDICE DE FIGURAS
Figura 1 - Descrio hierrquica do conceito descoberta de conhecimento e dos
conceitos relacionados (Bendoly 2003)......................................................................... 5
Figura 2 Contagem de artigos PubMed da rea de informtica em sade publicados
no perodo 1998-2005 de acordo com classificao EpistemIS (Colepcolo 2008)...... 21
Figura 3 Disciplinas que contribuem para a interdisciplinaridade da informtica em
sade (traduzido e adaptado) (Mantas et al. 2010). .................................................... 34
Figura 4 - Quantidade de termos nicos (35.484) e respectiva interseco presente
nos conjuntos de artigos cientficos dos domnios da cincia da computao,
informtica em sade e sade (Teixeira 2011). .......................................................... 41
Figura 5 - Distribuio dos artigos cientficos e descritores em relao aos domnios
estudados (30 categorias), de acordo com a indexao sugerida pelo mtodo de
competio de tcnicas (Teixeira 2011). ..................................................................... 43
Figura 6 - Grafo de relao entre as 9 grandes reas informadas nos currculos
analisados. Os pontos vermelhos representam as grandes reas. As ligaes
representam a coocorrncia com repetio entre grandes reas nos currculos. A
espessura das arestas e os nmeros informados representam a quantidade destas
coocorrncias. Verso digital em goo.gl/LJrqZ2.......................................................... 52
Figura 7 - Grafo de relao entre as 72 reas informadas nos currculos analisados.
Os pontos representam as reas e as ligaes representam a coocorrncia com
repetio entre reas nos currculos. A espessura das arestas representa a quantidade
destas coocorrncias. A cor do n representa a quantidade de ligaes de uma rea,
independente da quantidade de coocorrncias: azul significa mais ligaes, vermelho
menos ligaes. Verso digital em goo.gl/M1ZIJw. ..................................................... 52
Figura 8 - Grafos de relaes entre os currculos e suas ligaes (coautorias) dentro
de cada grande rea. A cor de cada ns (currculo) representa o grau de ligao com
outros currculos variando do vermelho (menor grau, menos currculos ligados) ao azul
(maior grau, mais currculos ligados). A espessura das arestas representa a
quantidade de coocorrncias entre currculos. ............................................................ 55
Figura 9 - Grafos de relaes entre todos os currculos e suas ligaes (coautorias).
Verso digital em goo.gl/jto2Gs. ................................................................................. 58
Figura 10 - Tela do buscador Busca Sade UNIFESP buscasaude.unifesp.br (Mancini
2011). ......................................................................................................................... 82
Figura 11 - Curva de revocao-preciso para as 19 posies do ranking de relevncia
de categorias (Sousa 2011). ....................................................................................... 88
xii
xiii
ABNT/CEE
ABRAHUE
ACG
ACM
ACM
ADG
AIDS
AIH
AIH
AJAX
AMIA
ANEW-BR
AUC
B2B
B2C
BIREME
C2C
CBIS
CETIC
CFM
CID/ICD
CNES
CPDH
CS
cervical stages
CVM
DeCS
DIS
DRGs
DTM
disfuno temporomandibular
xiv
ECG
eletroencefalograma
EpistemIS
ERP
GCD
GT
grupo de trabalho
HIPAA
HIV
HIVAS
HLA
HON
HTML
IMIA
INAMPS
InDeCS
IPP
IR-DRG
ISO
JDI
JSON
KDD
LDA
LILACS
LOD
MeSH
MS
NIH
NLM
NUPAIG
ODR
OMS
PD&I
PEP
PHP
RDC/TMD
RDF
RES
xv
RNA
ROC
RUTE
SADC
SAMHPS
SBIS
SIGKDD
SIH/SUS
SMS
SNA
SNOMED
S-RES
STI
SUS
TCLE
TIC
UMLS
UNIFESP
WHO
xvi
NOTAS
1. A nomenclatura informtica em sade a escolhida pelo pesquisador para
representar a grande rea de pesquisa. Mas outras nomenclaturas podem ocorrer
ao longo de todo o texto em respeito aos autores citados e especificidades.
2. Algumas denominaes da rea e subreas foram traduzidas. A traduo buscou
refletir uma compreenso comum do tema segundo a cultura acadmica brasileira.
3. Alguns termos no foram traduzidos para o portugus brasileiro para manter
fidelidade quanto ao seu emprego.
4. A tipografia dos termos estrangeiros no sofreu modificaes. Portanto, termos
estrangeiros so apresentados naturalmente ao longo do texto.
xvii
RESUMO
Pisa IT. Estudos em descoberta de conhecimento e minerao de dados em sade.
So Paulo. Tese [Livre-Docncia] - Universidade Federal de So Paulo, Escola
Paulista de Medicina, Departamento de Informtica em Sade (Disciplina de
Informtica em Sade). 2013.
1.
INTRODUO
Este documento tem como objetivo apresentar estudos realizados pelo autor
considerando a rea de descoberta de conhecimento e minerao de dados, dentro da
grande rea da informtica em sade. Foi confeccionado com o objetivo de apresentar
resultados e discusses sobre pesquisas acadmicas realizadas pelo autor e seus
colaboradores para o Concurso de Livre Docncia 2013 da UNIFESP
Estes estudos foram realizados nos ltimos 5 anos junto ao grupo de pesquisa
acadmica Sade 360 (saude360.com.br), criado e liderado pelo autor deste
documento, associado ao Programa de Ps-graduao em Gesto e Informtica em
Sade, da Escola Paulista de Medicina, Universidade Federal de So Paulo
(UNIFESP). Contou com a participao de graduandos, ps-graduandos, professores
colaboradores e convidados, ligados ao grupo de pesquisa. Outros estudos
desenvolvidos e em desenvolvimento, que no esto descritos neste documento,
podem ser identificados pela pgina web do grupo e por meio de publicaes.
1.1. Contexto
restringe a aplicaes de sade pblica. Esta subrea tem foco na anlise do uso da
informtica na perspectiva do gestor e suas necessidades de informao, estudos e
mtodos para tornar a informao acessvel ao gestor, e modelos e integrao de
preferncias do gestor em sistemas de informao em sade.
Estes 3 eixos, que consideram as diferentes perspectivas (1) do consumidor de
sade, (2) do profissional de sade e (3) do gestor, podem ser usados para organizar
nossos estudos neste documento. As pesquisas realizadas incluram temas como
minerao de dados e texto em sade, telemedicina, telessade, aplicativos mveis,
redes sociais em sade, anlise de grandes bases de dados, anlise de agrupamentos
(clusters), ontologias, tesauros e tcnicas de inteligncia artificial. Estes temas
tecnolgicos e cientficos esto includos na proposta de currculo para a rea de
descoberta de conhecimento e minerao de dados feita pela grupo especial de
interesse SIGKDD da Association for Computing Machinery (ACM acm.org)
(Chakrabarti et al. 2006). Mais recentemente o tema linked open data (LOD) (Bizer et
at. 2009) sensibilizou os participantes do grupo e direcionou novos estudos sobre
inter-relacionamento semntico de dados heterogneos da sade. A temtica big data,
bastante presente em discusses acadmicas atuais, conforme pode ser observado
no Medinfo 2013 realizado em julho em Copenhague, est presente em nossas
escolhas de pesquisa e metodolgica devido natureza complexa da informao em
sade e dos novos desafios (Peek 2013).
De fato, a adoo de sistemas de gesto empresarial (enterprise resource
planning ERP) em organizaes nos ltimos 25 anos, e mais recentemente em
organizaes provedoras de sade, veio acompanhada de um enorme aumento na
quantidade de dados produzidos e disponveis para anlise (Bendoly 2003). No
entanto, a relevncia desses dados comumente definida a partir da examinao de
mltiplos problemas simultaneamente e da habilidade de gerar inferncias crticas a
um plano estratgico (Berry e Linoff 1997). Os benefcios contribuem para a
inteligncia organizacional e subsequentemente vantagem competitiva global do
negcio (Francis 1997). Portanto, o desafio encontrado pela organizao, e pelos
analistas responsveis por manipular tais dados, est em sua habilidade em converter
as estratgias decorrentes da anlise dos dados em economia de esforo, tempo e
dinheiro. Um dos problemas fundamentais da extrao da informao que os
formatos das fontes de dados disponveis so frequentemente incompatveis,
requerendo um grande esforo de converso (Bendoly 2003).
Do ponto de vista da gesto do conhecimento, os processos de minerao de
dados possibilitam a criao de uma informao bem-definida, transfervel. Em
contraste, os processos de descoberta de conhecimento so caracterizados pela
Uma aplicao especfica de KDD pode ter diferentes objetivos, por exemplo,
aqueles derivados das relaes de dependncia dos dados, desenvolvimento de
previses e classificao. O produto final pode ser uma juno de tais informaes,
organizado em um formato que pode ser aplicado como conhecimento relevante para
planejar uma atividade. No entanto, quando o processo de KDD possibilita oferecer
uma ferramenta de anlise, em qualquer ponto de iterao, seu resultado se torna
aplicvel e geralmente com impacto direto. Neste caso, ferramentas de minerao de
dados acabam se apresentando como uma soluo superior, com impacto imediato
nos objetivos definidos para sua aplicao. A maior parte da literatura de KDD tem
apresentado foco maior, portanto, na avaliao da eficincia de ferramentas e
algoritmos (Bendoly 2003).
Captulo
(pg.
11)
apresenta
estudos
que
foram
realizados
Alerta de celular para adeso ao tratamento (pg. 99): apresenta 3 estudos que
conduzimos sobre o envio de mensagens de texto para o celular do paciente
com foco no aumento da adeso ao tratamento e diminuio do absentemos.
Foram investigados a adeso de pacientes portadores de HIV, junto ao Ncleo
Multidisciplinar de Patologias Infecciosas da Gestao (NUPAIG), UNIFESP, e
o impacto clnico em pacientes com disfuno temporomandibular (DTM), junto
ao Ambulatrio de DTM da UNIFESP.
1.3. Referncias
Berner ES, Houston TK, Ray MN, Allison JJ, Heudebert GR, Chatham WW, et al.
Improving ambulatory prescribing safety with a handheld decision support
system:
randomized
controlled
trial.
Am
Med
Inform
Assoc.
2006;13(2):171-9.
Berners-Lee T, Chen Y, Chilton L, Connolly D, Dhanaraj R, Hollenbach J, Lerer A,
Sheets D. Tabulator: exploring and analyzing linked data on the Semantic
Web. In Proceedings of the 3rd international semantic web user interaction
workshop, Georgia, USA, 2006 November 6.
Berry MJA, Linoff G. Data Mining Techniques for Marketing, Sales, and Customer
Support, Wiley, New York, 1997.
Brasil. Lei no. 12.527, de 18 de novembro de 2011 [Internet]. 2011 [citado 15 de
outubro de 2013]. Disponvel em: http://www.presidencia.gov.br/ccivil_03/
_Ato2011-2014/2011/Lei/L12527.htm.
Chakrabarti S, Ester M, Fayyad U, Gehrke J, Han J, Morishita S, Piatetsky-Shapiro G,
Wang W. Data Mining Curriculum: A Proposal (Version 1.0). Intensive
Working Group of ACM SIGKDD Curriculum Committee. 2006 Apr 30. [cited
2013 Oct 20] Available from: http://www.kdd.org/sites/default/files/CURMay06
.pdf
Denekamp Y. Clinical decision support systems for addressing information needs of
physicians. Isr Med Assoc J. 2007;9(11):771-6.
Dietrich D, Gray J, McNamara T, Poikola A, Pollock R, Tait J, et al. Guia de Dados
Abertos - Open Data Handbook [Internet]. Open Data Handbook. [citado 10 de
outubro de 2013]. Available from: http://opendatahandbook.org/pt_BR.
Fayyad UM, Piatetsky-Shapiro G, Smyth P. From data mining to knowledge discovery:
an overview, in: Fayyad UM, et al. (Eds.), Knowledge Discovery in Databases,
The AAI Press, Menlo Park, CA, 1996, pp. 131.
Francis DB. Your competitors: who will they be? Competitive Intelligence Review 8,
1997, pp. 1623.
IMIA. International Medical Informatics Association. MedInfo 2013. Last updated: 2012.
[cited 2013 Oct 20]. Available from: http://www.medinfo2013.dk/node/13.
KDD [Internet]. Sig KDD: bringing together the data mining, data science and analytics
community. [cited 2013 Oct 15]. Available from: http://www.kdd.org.
Kulikowski CA, Shortliffe EH, Currie LM, Elkin PL, Hunter LE, Johnson TR, Kalet IJ,
Lenert LA, Musen MA, Ozbolt JG, Smith JW, Tarczy-Hornoch PZ, Williamson
JJ. AMIA Board white paper: definition of biomedical informatics and
specification of core competencies for graduate education in the discipline. J
Am Med Inform Assoc 2012;19:931-938 doi:10.1136/amiajnl-2012-001053.
10
11
2.
SADE
A informtica em sade surgiu como uma aplicao da informtica medicina.
Shortliffe (1995) explica que o surgimento da rea ocorreu por 3 motivos principais: 1)
devido aos avanos da computao e das tecnologias de informao e comunicao;
2) conscincia crescente de que a base de conhecimento da medicina e das demais
reas da sade no pode ser gerenciada apenas em suporte papel; 3) convico de
que o processo de tomada de deciso to importante para a medicina quanto a
coleo de fatos nos quais estas decises so baseadas, e que ambos podem ser
otimizados com o auxlio da informtica. Shortliffe descreveu uma necessidade da
implantao de setores de tecnologia nas escolas mdicas, ao que tem se tornado
uma realidade cada vez mais comum em todo o mundo. Nas ltimas dcadas a
informtica mdica foi ampliando seu escopo para alm da medicina, atrelando-se
necessidade de organizao do conhecimento e da pesquisa em cincias da sade.
Mais que isso, seu escopo inclui a idia de otimizar processos relacionados s prticas
dessas cincias, por meio das tecnologias da informao e comunicao, fomentando
projetos multidisciplinares envolvendo informtica e cincias da sade. Tais fatos
justificaram denomin-la informtica em sade.
Nos dias de hoje o processamento de informao e de comunicao tornou-se
essencial para muitas atividades em cincias da sade, incluindo: registro e
recuperao de informao sobre pacientes; comunicao entre profissionais de
sade; acesso literatura mdica; seleo de procedimentos diagnsticos;
interpretao de resultados de laboratrio e coleo de dados clnicos (Georgiou
2002). A rea vem se tornando essencial na pesquisa em cincias da sade e, mais
recentemente, nas pesquisas biolgicas. Com isto, a informtica em sade vem se
estabelecendo e se consolidando como uma rea de conhecimento independente.
A informtica em sade uma disciplina que envolve diversas reas do
conhecimento, tanto cientficas, quanto tecnolgicas e at mesmo artsticas, e vem
sendo considerada de importncia primordial para os avanos das cincias da sade e
da informtica em todo o mundo. Esta importncia foi enfatizada por Parent et al.
(2001) ao afirmar, na dcada passada, que a globalizao efetiva ainda estava em
curso de se concretizar porque ainda no existia uma distribuio eqitativa do uso
das tecnologias da informao. Essa realidade vlida nos dias de hoje. Parent et al.
propuseram aes para melhorar essa realidade no mbito da sade global que
12
captulo apresenta 3
temas
que representam
um esforo
de
pelo
pesquisador
nos
temas
relacionados.
Esto
indicados
os
13
14
15
a nveis de especificidade mais restritos ou mais amplos do que aqueles usados pelo
indexador, melhorando os resultados da busca. Alm disso, tcnicas e ferramentas da
minerao de textos em estudo na inteligncia artificial e na lingstica computacional
vm utilizando tesauros como instrumentos para modelagem de domnios especficos
e para extrao automtica de informao, a partir de conjuntos de textos (corpus) que
resultam numa srie de aplicaes, por exemplo, para indexao
Um tesauro pode ser considerado como uma linguagem para modelagem de
domnio, ou seja, uma linguagem especializada que abrange a maioria dos conceitos e
relaes conceituais de uma rea especfica, podendo ser utilizada como instrumento
para uma srie de aplicaes na rea. Um dos principais objetivos de uma linguagem
especializada estabelecer limites de abrangncia conceitual do domnio, assim como
eliminar a ambiguidade dos conceitos, dando maior coerncia e consistncia ao
conhecimento do domnio. Tanto o desenvolvimento de linguagens especializadas
contribui para a reduo da ambiguidade, quanto a reduo da ambiguidade promove
o desenvolvimento de linguagens especializadas e ambas contribuem para a
formalizao do conhecimento de um domnio. Maas et al. (2001) afirmam que o
caminho para a maturidade cientfica da informtica em sade (medical informatics)
a formalizao do conhecimento pertinente ao domnio. Ressaltam que o
desenvolvimento de linguagens para modelagem de domnios especficos das cincias
da sade essencial ao desenvolvimento da informtica em sade, tal como ocorre
em reas como a de sistemas de informao, na qual as linguagens de modelagem de
domnios so utilizadas como fundamento do sistema de informao daquele domnio.
Se a informtica em sade considerada um tema do escopo da cincia da
informao, questes relacionadas a remover a ambiguidade da informao mdica
fazem parte de seus assuntos centrais. Logo, a informtica em sade como cincia
deve buscar respostas no ambguas s questes do seu domnio, do contrrio faltar
a esta disciplina uma fundamentao terica adequada que a eleve ao status de uma
cincia (Maas et al. 2001).
Pesquisas Realizadas
16
17
cincias comportamentais,
cincias naturais,
cincias biolgicas,
18
cincias da informao;
Tesauro EpistemIS
O tesauro EpistemIS construdo contm 730 termos, sendo 110 provenientes do
MeSH e 620 obtidos da literatura tcnico-cientfica em informtica em sade. Os
termos contidos (Tabela 5) fazem parte, em sua maioria, da rea de cincias da
informao (76%), seguido por cincias biolgicas (8%) e cincias comportamentais
(8%), havendo uma pequena minoria da rea de cincias humanas (2%). A pequena
porcentagem de termos na rea de cuidado em sade (categoria N) se justifica por ser
uma rea MeSH que abrange os seus aspectos organizacionais, educacionais e
econmicos, enquanto aspectos relativos prtica do cuidado em sade esto
alocados em cincias biolgicas.
Em relao aos MAPHs, os termos do tesauro EpistemIS obteve uma
distribuio equitativa entre tecnocincia (35%), tecnologia (28%) e cincia (31%).
Tambm consideramos lgico que seja mnima a quantidade de termos classificados
como arte (6%), j que h um esforo da informtica em sade em comportar-se como
cincia e tecnologia, afastando-se da subjetividade, sendo o mais objetiva possvel.
19
Publicaes no PubMed
De um total de 437.289 artigos analisados, somente 231.416 (53%) estavam
relacionados aos MAPHs, porm se consideramos o total de artigos que tm autores
coletivos, temos somente 7.538 artigos escritos por autores coletivos. Entre estes,
apenas 5.200 (69%) tm relao com o tesauro EpistemIS, ou seja, tm relao com a
informtica em sade. Identificamos os autores individuais que mais publicaram
artigos que contm ngramas do tesauro EpistemIS, ou seja, os mais representativos
em informtica em sade. Esta contagem foi realizada por autor individual com
repetio na base indexada. Foi possvel observar que o aspecto cientfico dos
registros de artigos publicados pelos autores individuais dominante (2.292.569),
seguido pelo tecnolgico (430.906) e tecnocientfico (218.008), com uma pequena
quantidade de artigos sobre o aspecto artstico (110.543).
Ao analisar o top 20 do ranking gerado dos autores que mais publicam em
informtica em sade, incluindo origem, vnculo institucional e perfil desses autores, foi
possvel observar as reas de atuao e inferir interesse e motivos que os levam a
publicar em informtica em sade. Observamos que a maioria destes autores, em
2008, atuava no Channing Laboratory, que uma diviso de pesquisa multidisciplinar
do
Brigham
and
Women's
Hospital
da
Harvard
Medical
School
20
21
em 2005 com 2.301 artigos em cincia. At ento foi o peridico mais representativo
em informtica em sade, no perodo estudado.
22
23
24
25
26
27
28
29
30
Nomenclaturas***
Bing
PubMed
ACM
Wikipedia
YouTube
Acadmico
eHealth
177.000K
52K
2.700K
17K
1K
Sim
14K
Biomedical
Informatics
77.000K
40K
464K
3K
5K
Sim *
1K
Health
Informatics
22.900K
50K
1.490K
3K
3K
Sim
5K
Medical
Informatics
21.700K
356K
1.360K
16K
8K
Sim *
2K
Informtica
Biomdica
2.630K
1K
60K
0,027K
0,007K
Sim
0,816K
Informtica
Mdica
2.300K
8K
261K
0,067K
0,018K
Sim
2K
Informtica
em Sade
684K
3K
49K
0,017K
0,013K
No
0,238K
eSade
93K
0,168K
10.300K
No
0,020K
BioHealth
Informatics
22K
0,5K
6K
0,004K
0,005K
No
0,005K
0,001K
0,002K
0,043K
No
Informtica
em Biossade**
31
32
2.
3.
armazenamento, processamento,
transmisso e visualizao de imagens
mdicas;
4.
5.
6.
bioengenharia;
7.
bioinformtica;
8.
cientometria em sade;
9.
sade;
imagens mdicas;
35. pronturio eletrnico do paciente (PEP);
36. realidade virtual em sade;
de dados em sade;
14. econometria em tecnologia da informao e
comunicao em sade;
15. educao a distncia em sade;
16. educao e capacitao em informtica em
sade
17. educao em sade mediada por
computador;
18. equipamentos informatizados em sade;
19. tica, legislao e polticas em informtica
em sade;
20. fundamentos e epistemologia em
informtica em sade;
21. histria da informtica em sade;
51. telemedicina;
52. telessade.
33
diversificando
fontes
de
armazenamento
recuperao
de
artigos
publicados
na
biblioteca
virtual
Medline/Pubmed
34
35
36
Pesquisas Realizadas
Considerando o tema de classificao de artigos cientficos da informtica em sade,
realizamos uma pesquisa cujo objetivo principal foi desenvolver uma classificao e
indexao de artigos cientficos a partir de tcnicas vetoriais de extrao de
caractersticas
de
textos
aliadas
um
classificador
probabilstico.
Mais
para
domnio
da
informtica
em
sade,
no
qual
37
que ocorreu no estudo aqui apresentado foi a concepo de uma nova anlise
baseada em contexto a partir do algoritmo Journal Description Indexing (JDI), da
National Library of Medicine, EUA (Humphrey et al. 2009; Humphrey 1998).
Este trabalho foi realizado no grupo de pesquisa Sade 360 junto ao Programa
de Ps-graduao em Gesto e Informtica em Sade, EPM, UNIFESP. A pesquisa
foi conduzida como um projeto de mestrado por Fbio Oliveira Teixeira, cujo foco
concentrou-se nas tcnicas de classificao. Fernando Sequeira Sousa e Prof. Dr.
Luciano Vieira de Araujo, da EACH-USP, colaboraram ativamente com a metodologia
e as anlises realizadas.
Portal ISI Web Of Knowledge
Os dados avaliados no estudo foram coletados a partir do portal ISI Web Of
Knowledge (wokinfo.com), que concentra bancos de dados de publicaes cientficas
de diferentes domnios de conhecimento. O escopo da coleta foi definido como os
ttulos e os resumos de artigos cientficos do idioma ingls, classificados sob um
conjunto de categorias associadas s revistas e disponveis no portal utilizado.
As categorias refletem uma abrangncia conceitual dos domnios da cincia da
computao, da informtica em sade e sade, seguindo mesmo critrio de seleo
de categorias de Spreckelsen et al. (2011).
As 30 categorias estudadas foram:
Sade (16): anatomy & morphology; biochemistry & molecular biology; biology;
cell biology; clinical neurology; infectious diseases; medicine, research &
experimental; microbiology; neurosciences; nursing; oncology; parasitology;
pediatrics; psychiatry; psychology, developmental; virology.
38
Sade (9): Brain, CA-A Cancer Journal for Clinicians, Cell, International Journal
of Nursing Studies, Journal of Anatomy, Journal of the American Academy of
Child and Adolescent Psychiatry, Nature Medicine, PLOS Biology, PLOS
Pathogens.
Foram selecionados 10.800 artigos cientficos dispostos uniformemente entre
39
a um determinado
grupo
ou
categoria, caracteriza
mtodo
40
41
menos
representativo,
com
apenas
1.696
itens.
Tal
cenrio
expe
42
43
44
exemplos
(twitter.com),
(facebook.com)
(linkedin.com), ilustram como as pessoas esto conectadas entre si. No entanto, ainda
no se sabe o impacto das conexes sociais na disseminao da informao e do
conhecimento. Sabe-se que qualquer pessoa no mundo pode chegar a qualquer outra
com apenas 6 pessoas de contato entre elas em mdia (Watts 2002). Conhecer as
dimenses e conexes sociais de uma determinada rea serve no somente para
agrupar os profissionais que fazem parte dela, mas talvez para compreender os
45
46
47
Pesquisas Realizadas
48
participantes
representam
minimamente
uma
lista
de
profissionais
49
Vale ressaltar que esse ndice representa uma medida da conexo da pessoa
com as demais pessoas da mesma lista, num conjunto fechado. No representa,
necessariamente, um ndice de qualidade (cientfica) desta colaborao. No entanto,
nomes bastante conhecidos da informtica em sade encontram-se mais no topo da
lista. Outra ressalva se d com relao ao uso do currculo Lattes. De fato, h muitas
pessoas que no utilizam essa plataforma de divulgao de sua produo, mas
razovel considerar que no caso de produo acadmica, tem sido o principal
instrumento de divulgao, normalmente considerado oficial para entrada em
programas de ps-graduao e concursos pblicos. Assim, entendemos que a
conexo medida a partir do Lattes pode no ser precisa, medida em que pode no
constar todos os seus relacionamentos. Mas pode ser considerada com um conjunto
50
mnimo. Ou seja, possvel que uma pessoa tenha mais conexo com os demais,
mas menos do que apontado no Lattes improvvel. Portanto, os erros do IPP
devem estar mais concentrados para as pessoas no final do ranking, quando h
possibilidade de nem toda conexo da pessoa ter sido computada (por estar ausente
do Lattes), que para as pessoas do topo da lista.
Ampliao da Anlise de Rede Social
Para esta segunda abordagem foram considerados os nomes dos participantes dos
Congressos Brasileiros de Informtica em Sade (CBIS) entre os anos de 2006 e
2012. Tambm foram includos os nomes dos scios da Sociedade Brasileira de
Informtica em Sade (SBIS). Outros nomes foram includos arbitrariamente devido
sua experincia, conhecimento e participao na rea de informtica em sade. No
entanto, no possvel afirmar que a lista trabalhada representa amplamente os
profissionais e pesquisadores que atuam na rea da informtica em sade no Brasil.
Possivelmente alguns nomes ficaram de fora. Ainda, apesar da lista inicial contar com
uma quantidade maior de nomes, apenas aqueles que possuem um currculo na
Plataforma Lattes CNPq permaneceram na lista final de anlise. Este estudo seguiu as
seguintes etapas: extrao dos currculos, representao em rede, extrao de
subredes por grandes reas e por reas segundo modelo CNPq, e clculo das
mtricas de anlise de redes sociais.
Para extrao dos currculos da Plataforma Lattes foi utilizado o software livre
ScriptLattes (Mena-Chalco & Cesar-Jr 2009) (scriptlattes.sourceforge.net). Este
software faz a extrao dos currculos de uma lista previamente informada e retorna os
dados de cada pesquisador e um compilado de sua produo cientfica. Cabe salientar
que o ScriptLattes tambm possui um algoritmo que identifica e elimina as produes
duplicadas. Gera relatrios, grafos e arquivos de apoio a partir da base extrada. Para
este trabalho foi utilizado como base o arquivo de grafo gerado pelo ScriptLattes no
formato graphml. O formato graphml um padro para representao de grafos
baseado em XML e utilizado pela maioria dos aplicativos de anlise de redes. No grafo
obtido, os pesquisadores foram representados como ns e as produes como
arestas.
Para a extrao de subredes, primeiramente o arquivo graphml foi importado
no software de visualizao e anlise de redes Gephi (gephi.org). A partir da foi
exportada uma lista de ns e uma lista de arestas, ambas no formato csv. A lista de
ns foi ento importada no software R (r-project.org) com a utilizao das bibliotecas
iGraph (igraph.sourceforge.net) e reshape (cran.r-project.org/web/packages/reshape).
51
52
53
54
55
56
Tabela 3 - Mtricas globais dos grafos de relaes entre os currculos e suas ligaes
(coautorias) dentro de cada grande rea.
Tabela 4 - Mtricas globais dos grafos de relaes entre os currculos e suas ligaes
(coautorias) dentro das cinco reas mais citadas.
57
Figura 9 - Grafos de relaes entre todos os currculos e suas ligaes (coautorias). Verso digital em goo.gl/jto2Gs.
58
59
60
coautoria ter sido computada (por estar ausente do Lattes), que para os indivduos do
topo.
Nas reas industrial e comercial no h reconhecimento sobre o uso do Lattes
como tal, portanto, acaba sendo um instrumento menos utilizado. Estudos futuros mais
precisos necessitam incluir no conjunto de dados colaboraes divulgadas em outros
repositrios. De fato, podemos dizer que a anlise baseada no Lattes representa muito
mais uma colaborao acadmica que propriamente da rea como um todo. Estudos
sobre a ligao destes indivduos com outras reas, por exemplo eliminando a barreira
da limitao do conjunto fechado da informtica em sade (por rea e por pas), j
esto sendo realizadas no grupo de pesquisa. Alm disso, anlises independentes que
respeitem a cronologia das colaboraes podem apontar quais indivduos j foram,
quais esto sendo e possivelmente quais sero mais colaborativos na rea de
informtica em sade no Brasil.
61
62
63
2.5. Referncias
Aiguzhinov A, Soares C, Serra AP. A similarity-based adaptation of naive bayes for
label ranking: application to the metalearning problem of algorithm
recommendation [Internet]. In: Proceedings of the 13th international
conference on Discovery science. Berlin, Heidelberg: Springer-Verlag; 2010
[cited
2011
Jun
9].
p.
1626.
Available
from:
http://portal.acm.org/citation.cfm?id=1927300.1927302.
Altman DG. Practical Statistics for Medical Research. 1st ed. New York: Chapman and
Hall/CRC; 1990.
AMIA. American Medical Informatics Association. The science of informatics.
Bethesda: AMIA, 2013. Last updated: 2013. [cited 2013 Oct 20]. Available
from: http://www.amia.org/about-amia/science-informatics.
Baeza-Yates RA, Ribeiro-Neto B. Modern Information Retrieval. Boston: AddisonWesley Longman Publishing Co., Inc.; 1999.p. 163-189.
Bauer DF. Constructing Confidence Sets Using Rank Statistics. Journal of the
American Statistical Association 1972;67(339):68790.
Bernstam EV, Smith JW, Johnson TR. What is biomedical informatics? J Biomed
Inform 2010;43(1):10410.
Borgatti SP, Foster PC.The network paradigm in organizational research: a review and
typology. Journal of Management 2003 Dec;29(6):991-1013.
Brandes U. A faster algorithm for betweenness centrality. The Journal of Mathematical
Sociology. 2001;25(2):16377.
Bunge M. Cincia e desenvolvimento. Belo Horizonte/So Paulo: Itatiaia/EDUSP;
1980.
Bunge M. Epistemologia: curso de atualizao. 2.ed. Trad. Claudio Navarra. So
Paulo: T.A.Queiroz; 1987.
Bunge M. La investigacin cientfica. Barcelona: Ariel; 1969.
Colepcolo E, Matsubara ET, Falco AEJ, Pisa IT. Uso da ferramenta PreText para
minerao de textos extrados do NCBI para estudo epistemolgico da
Informtica em Sade. Revista de Informtica Terica e Aplicada, v. 16, p. 924, 2009.
Colepcolo E. Epistemologia da informtica em sade: entre a teoria e a prtica. So
Paulo. Dissertao [Mestrado em Informtica em Sade] - Universidade
Federal de So Paulo; 2008.
64
Costa TM, Hummel AD, Falco AEJ, Mancini F, Ribeiro VPS, Alves D, Pisa IT.
LattesRank. Ranking dos participantes do Congresso Brasileiro de Informtica
em Sade 2006 baseado no grau de conexo via currculo Lattes. In: XI
Congresso Brasileiro de Informtica em Sade - CBIS 2008, Anais do XI
Congresso Brasileiro de Informtica em Sade. Sociedade Brasileira de
Informtica em Sade SBIS, Campos do Jordo, 2008, SP.
Della Mea V. What is e-Health (2): The death of telemedicine? J Med Internet Res.
2001 Jun 22;3(2):e22.
DeShazo JP, Lavallie DL, Wolf FM. Publication trends in the medical informatics
literature: 20 years of Medical Informatics in MeSH. BMC Med Inform Decis
Mak. 2009;9(1):7.
Di Chiara IG, Alcar AR, Tanzawa ECL, Rodrigues JL. As citaes como base da rede
social egocntrica: o artigo citado e suas conexes. In: Anais do VII Encontro
Nacional de Pesquisa em Cincia da Informao - ENANCIB; 2006; Marlia,
So Paulo. Marlia: Unesp. p. 441-52. [acesso em: 12 jan. 2007]. Disponvel
em: <http://www.portalppgci.marilia.unesp.br/enancib/viewpaper.php?id=134>.
Ebecken NF, Lopes MCS, Costa MCA. Minerao de textos. In: Rezende SO. (Org.).
Sistemas inteligentes. Barueri: Manole; 2003. p. 337-70.
Eysenbach G. What is e-health? J Med Internet Res. 2001 Apr-Jun 18;3(2):e20.
Fischer T. A formao do administrador brasileiro na dcada de 90: crise,
oportunidade e inovaes nas propostas de ensino. RAP - Revista de
Administrao Pblica. 1993 Out/Dez;27(4):11-20.
Freeman
LC.
Some
antecedents
of
social
network
analysis.
Connections
1996;19(1):39-42.
Gehanno J-F, Rollin L, Jean T, Louvel A, Darmoni S, Shaw W. Precision and Recall of
Search Strategies for Identifying Studies on Return-To-Work in Medline. J
Occup Rehabil 2009;19(3):22330.
Georgiou A. Data, information and knowledge: the health informatics model and its role
in evidence-based medicine. J Eval Clin Pract 2002 May;8(2):127-30.
Greenes RA, Shortliffe EH. Medical informatics. An emerging academic discipline and
institutional priority. JAMA 1990 Feb 23;263(8):111420.
Guthrie L, Walker E, Guthrie J. Document classification by machine: theory and
practice [text on the Internet]. In: Proceedings of the 15th conference on
Computational linguistics - Volume 2; 1994; Stroudsburg, PA, USA:
Association for Computational Linguistics; p. 105963. [cited 2011 May 18].
Available from: http://dx.doi.org/10.3115/991250.991322.
65
Hanson AF. From classification to indexing: how automation transforms the way we
think. Social Epistemology: A Journal of Knowledge, Culture and Policy
2004;18(4):333.
Hayashi
Disponvel
em
http://revista.ibict.br/liinc/index.php/liinc/article/view/274.
Herlocker, Konstan, Borchers, Riedl. An Algorithmic Framework for Collaborative
Filtering. Proc. SIGIR 1999.
Hope ACA. A simplified Monte Carlo significance test procedure. J R Stat Soc Series B
Stat Methodol 1968;30(3):58298.
Humphrey SM, Nvol A, Browne A, Gobeil J, Ruch P, Darmoni SJ. Comparing a rulebased versus statistical system for automatic categorization of MEDLINE
documents according to biomedical specialty. J. Am. Soc. Inf. Sci. Technol.
2009;60(12):25309.
Humphrey SM, Rogers WJ, Kilicoglu H, Demner-Fushman D, Rindflesch TC. Word
sense disambiguation by selecting the best semantic type based on Journal
Descriptor Indexing: preliminary experiment. J. Am. Soc. Inf. Sci. Technol
2006 Jan 1;57(1):96113.
Humphrey SM. A new approach to automatic indexing using journal descriptors.
Proceedings of the ASIS Annual Meeting 1998;35:496500.
Humphrey SM. Automatic Indexing of Documents from Journal Descriptors: A
Preliminary Investigation. J Am Soc Inf Sci 1999;50(8):661-74.
Humphreys BL, Lindberg DA, Schoolman HM, Barnett GO. The Unified Medical
Language System: an informatics research collaboration. J Am Med Inform
Assoc 1998;5(1):111.
IMIA. International Medical Informatics Association. MedInfo 2013. Last updated: 2012.
[cited 2013 Oct 20]. Available from: http://www.medinfo2013.dk/node/13.
Ivanitskaya L, OBoyle I, Casey AM. Health information literacy and competencies of
information age students: results from the interactive online Research
Readiness Self-Assessment (RRSA). J Med Internet Res. 2006 Apr
21;8(2):e6.
Joachims T. A probabilistic analysis of the Rocchio Algorithm with TFIDF for text
categorization. In ICML '97 Proceedings of the Fourteenth International
Conference on Machine Learning; 1997. San Francisco: Morgan Kaufmann
Publishers Inc; 1997. p. 143-151.
66
from:
67
SIGIR
conference
on
Research
and
development
in
information
em
20
nov
2006];7(2).
Disponvel
em:
http://www.dgz.org.br/abr06/F_I_art.htm.
Matsubara ET. PreText: an environment for pre-processing text for Text Mining. ltima
atualizao: 15 jun. 2005.[acesso em 13 dez 2006]. Disponvel em:
http://www.icmc. usp.br/~edsontm/PreText/PreText.html.
Mena-Chalco JP, Cesar-Jr RM. ScriptLattes: An open-source knowledge extraction
system from the Lattes platform. Journal of the Brazilian Computer Society
2009;15(4):31-9.
Mitchell JG. From Telehealth to E-health: The unstoppable rise of E-health [text ont the
Internet].
Canberra:
Commonwealth
Department
of
Communications,
Information Technology and the Arts; 1999 [cited 2007 Oct 29]. Available from:
http://www.archive.dcita.gov.au/1999/09/rise#foreword.
Molina JL. El estdio de las redes personales: contribuciones, mtodos y perspectivas.
Empiria 2005 Jul-Dec;10:71-106.
Nigam K, McCallum A. A comparison of event models for Naive Bayes text
classification. In: AAAI-98 Workshop on Learning for Text Categorization;
1998. p. 418.
NLM. Medical Subject Headings: files available to download. [Internet].[cited 2006 Jun
02]. Available from: http://www.nlm.nih.gov/mesh/filelist.html
NLM/NIH/NBCI. PubMed: a service of the National Library of Medicine and the National
Institutes
of
Health.
[Internet].[cited
2007
Out
03].
http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed
Available
from:
68
Feb
24
[cited
2013
Oct
27];7(1).
Available
from:
http://www.jmir.org/2005/1/e1/.
Oliveira SC. Anlise de redes sociais em grupos de pesquisa de gesto do
conhecimento da Plataforma Lattes. 2006. 36 f. Trabalho de Concluso de
Curso
(Graduao
em
Biblioteconomia
Cincia
da
Informao)
jan.
2006.
Disponvel
em:
http://tartarus.org/~martin/PorterStemmer.
Radlinski F, Craswell N. Comparing the sensitivity of information retrieval metrics. In:
Proceeding of the 33rd international ACM SIGIR Conference on Research and
Development in Information Retrieval. New York, NY, USA: ACM; 2010. p.
66774.
Rodrigues SB, Carrieri AP. A Tradio Anglo-Saxnica nos estudos organizacionais
brasileiros. RAC Revista de Administrao Contempornea 2001:81-102.
Royston J. An Extension of Shapiro and Wilks W Test for Normality to Large Samples.
J R Stat Soc Ser C Appl Stat [Internet] 1982 [cited 2011 Jun 16];31(2).
Available from: http://dx.doi.org/10.2307/2347973.
Salton G, Buckley C. Term-weighting approaches in automatic text retrieval.
Information Processing and Management 1988;24:513--523.
Salton G, Buckley C. Term-weighting approaches in automatic text retrieval.
Information Processing and Management.1988;24:513-23.
Salton G, McGill MJ. Introduction to Modern Information Retrieval [Internet]. McGrawHill,
Inc.;
1986
[cited
2009
Feb
3].
Available
from:
http://portal.acm.org/citation.cfm?id=576628.
Salton G, Wong A, Yang CS. A vector space model for automatic indexing. Commun.
ACM 1975;18:61320.
69
Santo CC, Bonome KS, Teixeira F, Araujo GD Pisa IT. Rede Social de Currculos
Lattes da Informtica em Sade Brasileira. In: XIII Congresso Brasileiro de
Informtica em Sade - CBIS2012; 2012 Nov 19-23; Curitiba, PR: 2012. p1-2.
Schuemie MJ, Talmon JL, Moorman PW, Kors JA. Mapping the Domain of Medical
Informatics. Methods Inf Med [Internet] 2009 [cited 2011 Mar 9];Available
from: http://goo.gl/vaPUZl.
Shortliffe EH, Cimino JJ. Biomedical Informatics: Computer Applications in Health Care
and Biomedicine. Springer; 2006.
Shortliffe EH. Medical informatics meets medical education. JAMA 1995;273(13):1061,
1064-5.
Sigulem, D. Um novo paradigma de aprendizado na prtica mdica da UNIFESP/EPM.
So Paulo. Tese [livre-docncia] - Universidade Federal de So Paulo/Escola
Paulista de Medicina. 1997.
Silva ABO, Matheus RF, Parreiras FS, Parreiras TAS. Estudo da rede de co-autoria e
da interdisciplinaridade na produo cientfica com base nos mtodos de
anlise de redes sociais: avaliao do caso do programa de psgraduao
em cincia da informao PPGCI/UFMG [acesso em: 27 nov 2006] 2006a.
Enc. Bibli: R. Eletr. Bibliotecon. Disponvel em: <http://www.encontrosbibli.ufsc.br/>.
Silva ABO, Parreiras FS, Matheus RF, Brando WC. Redes de co-autoria dos
professores da cincia da informao: um retrato da colaborao cientfica
dessa disciplina no Brasil. In: Anais do VII Encontro Nacional de Pesquisa em
Cincia da Informao - ENANCIB 7; 2006; Marlia, SP. Marlia: FFC/UNESP;
2006b
[acesso
em
abr
2007].
p.
441-452.
Disponvel
em:
http://www.portalppgci.marilia.unesp.br/enancib/viewpaper.php?id=130.
Sohn S, Kim W, Comeau DC, Wilbur WJ. Optimal training sets for Bayesian prediction
of MeSH assignment. J Am Med Inform Assoc 2008;15(4):54653.
Sousa FS. Anlise Comparativa de Mtodos de Recuperao de Informao para
Categorizao de Contedos Web Relacionados Sade. So Paulo.
Dissertao [Mestrado em Cincias - Gesto e Informtica em Sade] UNIFESP; 2011.
Spreckelsen C, Deserno T, Spitzer K. Visibility of medical informatics regarding
bibliometric indices and databases. BMC Med Inform Decis Mak 2011 Apr
15;11:24.
Teixeira FO. Classificao e Indexao de artigos cientficos Internacionais de
Informtica em Sade. So Paulo. Dissertao [Mestrado em Cincias Gesto e Informtica em Sade] - Universidade Federal de So Paulo; 2011.
70
Text Categorization [Internet]. Text Categorization 2011 [cited 2011 Jul 15]. Available
from:
http://lexsrv3.nlm.nih.gov/LexSysGroup/Projects/tc/current/web/index.html
Thomson ISI. ISI HighlyCited.com: Willett, Walter C. Last update: 2002 Nov 22.
Available from: http://goo.gl/rtixET. [cited 2013 Oct 20].
Trieschnigg D, Pezik P, Lee V, de Jong F, Kraaij W, Rebholz-Schuhmann D. MeSH
Up: effective MeSH text classification for improved document retrieval.
Bioinformatics 2009;25(11):14128.
Van Bemmel JH. (Ed.). Handbook of Medical Informatics. Rotterdam: Erasmus
University,
1999.
[cited
2013
Oct
20].
Available
from:
http://www.mieur.nl/mihandbook/r_3_3/ handbook/home.htm.
Van Bemmel JH. Medical Informatics Is Interdisciplinary avant la Lettre.Methods Inf
Med [Internet] 2008 [cited 2011 Mar 9]. Available from: http://goo.gl/awvzlV.
Vasuki V, Cohen T. Reflective random indexing for semi-automatic indexing of the
biomedical literature. J Biomed Inform 2010;43(5):694700.
Wasserman S, Faust K. Social network analysis: methods and applications.
Cambridge: Cambridge University Press, 1999. 857p.
Watts DJ, Dodds PS, Newman ME. Identity and search in social networks. Science
2002 May 17;296(5571):1302-5.
Wellman B. An electronic group is virtually a social network. Culture of the Internet
1997; 4: 179-205.
Wellman B. For a social network analysis of computer networks: a sociological
perspective on collaborative work and virtual comunity. In: Proceedings of
SIGCPR/SIGMIS. Denver, CO: ACM Press, 1-11, 1996.
WMA. Responsibilities and ethical guidelines in the practice of telemedicine.
[Declarao de Telaviv]. Adopted by the 51st World Medical Assembly Tel
Aviv, Israel, October 1999 and rescinded at the WMA General Assembly,
Pilanesberg, South Africa, 2006 [cited 2013 Oct 16]. Available from:
http://www.wma.net/e/policy/a7.htm.
Yang Y, Pedersen J. A comparative study on feature selection in text categorization
[Internet]. In: Proceedings of ICML-97, 14th International Conference on
Machine Learning. Morgan Kaufmann Publishers, San Francisco, US; 1997
[cited
2011
Aug
20].
p.
41220.Available
from:
http://citeseerx.ist.psu.edu/viewdoc/summary.
Zhang W, Yoshida T, Tang X. A comparative study of TF*IDF, LSI and multi-words for
text classification. Expert Syst Appl 2011;38(3):275865.
71
3.
CONSUMIDOR
O termo informtica para a sade do consumidor (IMIA 2013; AMIA 2013), tambm
empregado como informtica para o consumidor em sade, ou informtica em sade
para o consumidor, representa a rea de aplicao da informtica do ponto de vista
dos consumidores e pacientes. Os temas incluem informtica focada no paciente,
literacia em sade e educao do consumidor. O foco das pesquisas encontra-se nas
estruturas e processo de informao que aumentam o poder do consumidor em
gerenciar sua prpria sade, como exemplos, literacia em informao em sade,
linguagem adequada ao consumidor, registro eletrnico em sade, modalidades de
entrega de informao e estratgias e recursos baseados na web.
Esta rea apresenta anlises do uso da informtica na perspectiva do
consumidor e suas necessidades de informao, estudos e mtodos implementados
para tornar a informao acessvel ao consumidor, e modelos e integrao de
preferncias do consumidor em sistemas de informao em sade. Informtica para a
sade do consumidor se situa no cruzamento de diferentes disciplinas como
informtica em enfermagem, sade pblica, promoo da sade, educao em sade,
cincia da informao e documentao, e cincia da comunicao.
A rea da informtica para a sade do consumidor, considerada uma das 5
grandes reas relevantes da informtica em sade (AMIA 2013), com representao
de um grupo de trabalho especfico na International Medical Informatics Association
(IMIA 2013), tambm pode ser descrita como o uso de recursos modernos de
computao e telecomunicao para apoiar consumidores na obteno de informao,
analisando suas necessidades individuais de assistncia em sade e auxiliando-os em
suas decises em benefcio de sua prpria sade (U. S. General Accounting Office
1996 pg. 1).
Este
captulo apresenta 3
temas
que representam
um esforo
de
de
uma
classificao
automatizada
de
contedos,
72
pelo
pesquisador
nos
temas
relacionados.
Esto
indicados
os
73
calcula-se que no ano de 2008 em torno de 33% das atividades de usurios da web no
Brasil estavam relacionadas procura de informao sobre sade, atingindo 35% em
2010 e 43% em 2012. Nos Estados Unidos, essa porcentagem sobe para 55% (Pew
Internet and American Life Project 2010). Os principais temas de busca esto
principalmente relacionados a doenas ou condies mdicas (cerca de 90% das
buscas), seguido por recuperao de informaes sobre e hospitais e profissionais em
sade (85%), e nutrio (82%) (Taha et al. 2009).
Uma constatao importante que na rea da sade, principalmente quando
se busca informaes sobre doenas ou sintomas, os usurios muitas vezes chegam
a concluses erradas sobre o que pesquisam (White e Horvitz 2009). O nvel de
conhecimento sobre as terminologias mdicas e problemas de interpretao sobre
contedos recuperados foram identificados como as principais causas para estas
concluses erradas (Keselman et al. 2008).
Entretanto, no podemos desconsiderar a popularidade da ferramenta de
busca Google quando utilizada para recuperao de contedos em sade na web
(Tang e Ng 2006; Giustini 2005). Porm, Chang et al. (2006) mostraram que esta
ferramenta de busca apresenta algumas dificuldades em recuperar contedos
relevantes nesta rea. O que torna este ambiente ainda mais crtico o fato que os
usurios normalmente no esto cientes sobre suas limitaes em elaborar
estratgias de busca (Lorence e Greenberg 2006) e consideram-se, em grande
maioria, satisfeitos com o contedo recuperado pelas ferramentas de buscas
comerciais (Neelapala 2008).
Uso da Web para Deciso em Sade
No podemos deixar de lado o crescimento da utilizao da web por usurios leigos
para auxiliar na tomada de deciso sobre sua sade (Coulter 2006). Cada vez mais
pacientes acessam a web antes de uma consulta mdica, e este aspecto apresenta
uma recente mudana na relao mdico-paciente (Falagas et al. 2008). Alm disto, o
uso da web para busca de contedos em sade afeta diretamente seu estilo de vida
(alimentao, exerccios, tratamentos etc) (Pew Internet and American Life Project
2010).
Por tais razes considera-se de fundamental importncia o desenvolvimento de
portais de busca na web especficos para a rea da sade com foco no pblico leigo
(Mancini et al. 2009). Uma das iniciativas internacionais a destacar para este propsito
so os buscadores desenvolvidos pela Health On Net Foundation (HON hon.ch). O
HON oferece ferramentas de buscas web em sade para o pblico leigo
74
(hon.ch/HONtools/Patients).
75
2004; Spink et al. 2001). Em outras situaes, a presena de anncios (Toms e Latter
2007), informaes irrelevantes e falta de especificidade das pginas retornadas pela
ferramenta de busca ou a dificuldade dos usurios em avaliar a relevncia e a
confiana do resultado retornado (Fogg et al. 2003) podem ser empecilhos para que o
usurio encontre a informao desejada.
Uso de Vocabulrios Controlados da Sade
Nas ltimas dcadas diversos algoritmos foram desenvolvidos com o objetivo de
classificar contedos textuais cientficos relacionados rea da sade a partir de
vocabulrios mdicos controlados. H estudos que consideram o uso do vocabulrio
Medical Subject Headings (MeSH
76
77
Pesquisas Realizadas
As pesquisas desenvolvidas no grupo Sade 360o envolveram uma comparao de
estratgias para investigar a utilizao do DeCS na construo de um classificador
automtico de contedos web textuais brasileiros como pertencentes ou no
pertencentes rea da sade, com foco no pblico leigo. Estas estratgias foram
construdas a partir de mtodos vetoriais de classificao de texto baseados em
contedos (Salton G, Buckley 1988). A escolha deste mtodo se deu pela sua
popularidade e bom desempenho na rea de recuperao de informao (Markov
2008). A proposta da construo deste classificador se mostrou interessante porque
quando o usurio da web est em busca de contedos relacionados rea da sade,
as ferramentas de busca disponveis - principalmente as genricas - retornam pginas
web que no esto relacionadas ao contexto da sade. Por exemplo, inserindo a
palavra vrus como termo de busca, essas ferramentas recuperam pginas web com
contedos relacionados sade (agentes infecciosos) e computao (vrus de
computadores). Entretanto, se o foco do usurio da web pesquisar sobre agentes
infecciosos, pginas web recuperadas com contedos relacionados computao
oferecem carga de informao ruidosa para o cenrio de busca proposto. Este aspecto
ainda mais significativo devido a estudos (McLellan 1998; Fava e Guidi 2007)
apontarem que a sobrecarga de informaes recuperadas pelas ferramentas de busca
um dos obstculos para que usurios leigos melhor interpretem estes contedos.
Este estudo foi conduzido por meio de uma tese de doutorado, de Felipe
Mancini, junto ao Programa de Ps-graduao em Gesto e Informtica em Sade,
UNIFESP. A pesquisa buscou determinar a relevncia da aplicao do DeCS na
78
79
O vetor de
80
pgina web, estes vetores e seus rtulos (sade ou no-sade) foram apresentados a
um classificador de padres para treinamento.
Testes preliminares foram realizados com objetivo de escolher o classificador
de padres mais adequado, conforme sugesto de Bellazzi e Zupan (2008): bayesiano
ingnuo (naive bayes NB) (Duda et al. 2000) (sensibilidade 0,94; especificidade 0,94),
redes neurais artificiais (artificial neural networks) (Haykin 1999) (0,90; 0,93), rvores
de deciso (decision trees) (Quinlan 1993) (0,90; 0,95), redes bayesiana (bayesian
network) (Duda et al. 2000) (0,91; 0,94), k-vizinhos mais prximos (k-nearest neighbor)
(Aha et al. 1991) (0,80; 0,95) e mquina de suporte vetorial (support vector machine)
(Cristianini e Shawe-Taylor 2000) (0,91; 0,95). Para este teste foi usada a base de
treinamento e a estratgia 3 para treinar os classificadores, e a base de validao para
test-los.
Os testes preliminares mostraram que o classificador bayesiano ingnuo
apresentou melhores taxas de sensibilidade e especificidade, que se tornou a escolha
do classificador para esta pesquisa. A literatura relata diversas aplicaes do
bayesiano ingnuo para classificao de texto, o qual prove abordagem simples e
eficiente para esta tarefa de classificao (Schneider 2005; Maimon e Rokach 2005;
Lewis 1998; John e Langley 1995).
Deste estudo decorreu a utilizao de um mtodo de variao da base de
dados de treinamento para investigar a acurcia dos classificadores quando alterada a
quantidade de informao (pginas web) utilizada para o treinamento. Como a
quantidade de pginas web no-sade maior se comparada com a quantidade de
pginas web de sade para a base de treinamento (Tabela 1), o mtodo foi construdo
fixando o conjunto de pginas web de sade e somando para cada teste pginas web
classificadas como no-sade sorteadas aleatoriamente. Os diferentes classificadores
gerados para cada teste foram avaliados levando-se em considerao todas as
pginas web da base de dados de validao, produzindo os valores de sensibilidade e
especificidade. Desta maneira foram produzidas 300 variaes da base de dados de
treinamento com 10 diferentes quantidades de pginas web no-sade, sendo
calculados 300 diferentes valores de sensibilidade e especificidade. Com o objetivo de
identificar se existiam valores de sensibilidade e especificidade estatisticamente
semelhantes entre os diferentes testes foi utilizado o teste pareado de Mann-Whitney
(Corder e Foreman 2009) com 5% de nvel de significncia. A escolha deste teste
pareado se deu a partir da indicao da distribuio no-normal dos 30 sorteios para
todos os testes analisados, aps a aplicao do teste de Kolmogorov-Smirnov (Corder
e Foreman 2009) com 5% de nvel de significncia.
81
82
(a) tela de entrada com notcias. termos mais procurados e pginas mais acessadas
83
84
85
86
importantes modificaes foram feitas: substituio dos 122 descritores MeSH pelas
19 categorias utilizadas neste trabalho; e a reconstruo do conjunto original de
treinamento, contendo as associaes de relevncia entre as palavras presentes nas
pginas web e as 19 categorias.
Na Figura 11 (pg. 88) apresentamos um grfico da curva de revocaopreciso (Witten e Frank 2005). Observamos o melhor desempenho do classificador
nb-to, uma vez que os pontos de sua curva de revocao preciso apresentam-se
mais direita e acima, em relao aos pontos das curvas dos outros classificadores
(Witten e Frank 2005). Com o intuito de verificar a ocorrncia de diferenas
significativas entre os classificadores aplicamos o teste t de Student sobre os
resultados dos 50 conjuntos aleatrios de testes. Aplicamos este teste s medidas de
revocao e F2, e s posies 1 e 5 do ranking de relevncia. No houve diferena
significativa apenas entre a revocao dos classificadores jdi-dc e jdi-wc. Para todos
os outros pares de classificadores foram encontradas diferenas significativas. Desta
forma o nb-to foi melhor entre todos os classificadores para primeira posio do
ranking de relevncia porque obteve o maior valor de revocao (0,91 0,007 para 1a
posio e 0,98 0,005 at 5a posio). Portanto, consideramos que o classificador nbto foi melhor para classificar as pginas web de sade, uma vez que obteve um
desempenho numericamente superior tanto para a primeira quanto para a quinta
posio do ranking de relevncia e a diferena deste classificador para os outros
estatisticamente significativa.
Em um trabalho recente sobre a utilizao do JDI para classificar documentos
do MEDLINE em especialidades biomdicas derivadas do MeSH (Humphrey et al.
2011), os autores conseguiram atingir uma preciso at a quinta posio de 0,45,
tanto para dc quanto para wc. No nosso trabalho os valores menores em relao ao
trabalho citado (0,19 para ambas as abordagens) so devido presena de um nico
rtulo nas pginas da base de dados, enquanto que o trabalho citado utilizou uma
base com textos originalmente multirroulados. Quanto revocao considerando a
quinta posio, o trabalho citado atingiu 0,71, enquanto que em nossa pesquisa
atingimos 0,97, ambos para wc e dc. Mais uma vez, a presena de um nico rtulo nos
documentos do presente trabalho colaborou para que o valor da revocao fosse
maior, fenmeno este desejvel.
Comparao com Classificao Humana
Foram convidados 21 voluntrios, especializados em sade ou informtica em sade,
para multirrotular 20 de 57 pginas web de sade escolhidas aleatoriamente dos
87
88
89
90
91
92
93
94
95
96
oferece
tratamento,
apresenta
outras
formas
de
tratamento
ou
procedimentos?
10. H contato do responsvel?
11. H avisos sobre quem mantm a pgina web financeiramente?
12. H avisos sobre contedos de propaganda?
Estudos apontam que a qualidade da informao um conceito complexo para
ser definido, no sendo evidente para o usurio a sua definio (Oleto 2006). Assim
sendo, o que mais se aproxima deste conceito a percepo da qualidade a ponto de
vista do usurio.
Pesquisas Realizadas
97
um sistema baseado na tecnologia Web 2.0, que foi denominado HealthRank, pelo
qual fosse possvel a avaliao de pginas web por usurios, e confeccionar um ndice
de adequao s recomendaes de adequao baseado em avaliaes de usurios.
Nossa expectativa que fosse possvel desenvolver um sistema automatizado para
avaliao destes critrios de adequao, sem a participao de usurios. Havia um
interesse em tentar responder se as pginas web que atendem os critrios HON so
vistos como pginas de qualidade pelo consumidor, ou seja, se h uma relao direta
entre critrio tico e qualidade.
Avaliao de Pginas Web por Voluntrios
O primeiro experimento conduzido, por meio de uma interface web de busca e
recuperao da informao especfica para a prova de conceito, seguindo estilo do
buscador Google, foram considerados os critrios de adequao da HON. Foram
analisados os logs de acesso e respostas ao atendimento ou no dos critrios. Foram
escolhidos aleatoriamente 50 portais web a partir do diretrio Alexa (alexa.com) com
213 portais da categoria sade, de 7.567 portais disponveis. Este diretrio apresenta
tambm estatsticas sobre os portais cadastrados (Yanbe et al. 2007). Este conjunto
de pginas web foi apresentado a 352 voluntrios (estudantes de especializao em
informtica em sade), gerando 2.277 avaliaes (IC 95%, erro ~2%), com cobertura
variada. Os avaliadores apontaram percepo de qualidade muito bom 21%, bom
42%, neutro 23%, ruim 11% e muito ruim 3%. O portal web com maior avaliao de
percepo de qualidade foi o #15 com 75,00 pontos (Hospital das Clnicas da FMUSP
hc.fm.usp.br) e o avaliado com menor qualidade foi o #34 com 31,49 pontos. A mdia
total da percepo de qualidade foi de 49,06 10,54.
O coeficiente de correlao calculado pelo teste Pearson entre a percepo de
qualidade do usurio e cada critrio HON foi avaliado. Observamos valor de
correlao Pearson de 0,60 e 0,65 com indcios de boa correlao positiva entre a
percepo de qualidade do usurio e o critrio O objetivo do website foi
mencionado? e o critrio H contato do responsvel? respectivamente. Observamos
uma correlao negativa (-0,53) entre a percepo do usurio e o critrio H
informaes sobre o uso ou compartilhamento de informaes sigilosas?.
Classificador Automtico de Critrios ticos
Como segundo experimento foi construdo um algoritmo, aqui denominado rob, para
avaliao automtica dos critrios ticos (HON) para pginas web. O rob inicialmente
98
classifica se uma pgina web apresenta contedo de sade, e caso afirmativo, avalia o
atendimento aos critrios. Este rob construdo usando a linguagem Perl constituiu a
primeira verso do algoritmo InDeCS (Falco et al. 2009), criado no grupo de
pesquisa, mencionado na seo Trs Estratgias de Classificao (pg. 79), deste
mesmo captulo. A classificao de sade ou no-sade baseou-se numa estatstica
de presena de termos pr-definidos como sade, provenientes de classificao
manual e do Manual Merck de Informao Mdica - Sade para a Famlia (Berkow et
al. 2009).
Das 1.132 pginas web coletadas foram examinadas 740.644 composies
para um termo (1-grama), 1.296.780 composies de dois termos (2-gramas) e
1.426.760
composies
para
trs
termos
(3-gramas),
totalizando
3.464.184
99
100
101
as pessoas enviam mensagens SMS de um telefone celular para outro, porm podese enviar SMS de um telefone celular para uma linha telefnica fixa, que pode ler
automaticamente a mensagem. O envio de mensagens de um computador para um
telefone celular e de um telefone celular para um computador tambm possvel
(Stucken 2010). Notcias, alertas de resultados esportivos, usurio e senha em
pginas web e at mesmo jogos podem ser executados via mensagem SMS.
Instituies financeiras como bancos e provedores de carto de crdito utilizam SMS
para enviar saldos ou alertas sobre movimentaes financeiras efetuadas na conta
bancria.
SMS na Sade
Na rea de sade as mensagens SMS tambm tm demonstrado utilidade. Volcke et
al. (2007) realizaram um estudo piloto com 27 pacientes portadores de diabetes para
os quais, por meio do envio de mensagens SMS, tentou-se avaliar a viabilidade e a
aceitabilidade de um sistema que lembrava os pacientes que estavam tomando a
medicao quetiapina a seguirem a prescrio. Mensagens eram enviadas
questionando os pacientes se eles haviam tomado a medicao e como eles estavam
se sentindo. As respostas eram recebidas e armazenadas. De acordo com os autores,
52% (11/21) dos pacientes que continuaram o estudo relataram sentirem-se mais bem
cuidados e 33% (7/21) relataram que foram lembrados, pelo sistema, de tomar a
medicao em momentos que o haviam esquecido. Os autores relatam que de acordo
com os pacientes, sentir-se mais bem cuidado e lembrar de tomar a medicao so os
maiores benefcios do sistema. A concluso inferida do estudo que os altos nveis de
adeso ao sistema de alerta, medidos pelas respostas das mensagens enviadas e os
benefcios expressos pelos pacientes e psiquiatras suportam uma avaliao em
grande escala do sistema.
Hee-Seung et al. (2006) tambm investigaram o efeito do envio de mensagens
para o celular de pacientes no controle de diabetes. No referido estudo o processo
iniciava-se com o paciente que, diariamente, relatava por mensagem SMS o seu nvel
glicmico equipe de sade. Recomendaes timas eram enviadas por SMS
semanalmente para esses pacientes como resposta aos relatos de nvel glicmico.
Aps um perodo de 12 semanas os autores observaram nos pacientes que
participaram do estudo uma reduo de 1,1% no nvel de hemoglobina glicosilada
alm de maior adeso a 30 minutos de exerccios dirios, tomada de medicamentos e
aos cuidados com os ps. Apesar dos achados, cabe ressaltar que no estudo no
102
houve uma discusso consistente sobre a preciso das medidas de adeso aos
exerccios fsicos e a significncia da reduo no nvel de hemoglobina glicosilada.
Downer, Meara e Da Costa (2005) enviaram mensagens SMS para pacientes
com o intuito de evitar ausncia a consultas. Segundo os autores, os resultados
variam de especialidade para especialidade, mas em geral, o grupo de pacientes que
recebeu mensagens SMS teve 14,2% de ausncias a consultas agendadas, enquanto
que o grupo de pacientes que no recebeu SMS teve 23,4% de ausncias. Geraghty
et al. (2008) tambm realizaram um estudo para avaliar a reduo de ausncias a
consultas agendadas devido ao envio prvio de alertas SMS em um hospital que cuida
dos ouvidos, nariz e garganta. De acordo com os autores, as mensagens SMS
reduziram em 11% a incidncia de ausncia a consultas.
A adeso a atividades preventivas, como por exemplo, tomar vitamina C
(Cocosila et al. 2009) e vacinao antes e depois de viajar (Vilella et al. 2003) tambm
foram beneficiados pelas alertas SMS.
Apesar dos resultados encorajadores sobre o uso mensagens SMS na rea de
sade, os resultados preliminares de uma reviso sistemtica (Thyra et al. 2010)
indicam que existem poucos ensaios clnicos controlados e aleatorizados sobre o
assunto.
Kaplan et al. (2006) notaram que quase no h estudos analisando o uso de
telefones celulares como uma ferramenta para interveno em pacientes infectados
por HIV, tuberculose, malria e outras condies crnicas em pases em
desenvolvimento. Em adio, os primeiros estudos sobre o efeito de SMS em
pacientes que vivem com HIV/AIDS so recentes, e, segundo os autores, sua
aplicabilidade em outros cenrios necessita ser avaliada (Lester et al. 2010). Em
reviso sistemtica da literatura da Cochrane em 2010 sobre os tipos de auxlio e
educao para promover adeso terapia antiretroviral altamente efetiva para
HIV/AIDS, Rueda et al. (2010) incluram 19 estudos e nenhum deles utiliza o envio de
SMS para auxiliar os pacientes com HIV nesse tipo de tratamento. Os autores
mencionam ainda que excluram vrios artigos de sua anlise devido baixa
qualidade metodolgica, nas quais os problemas mais comuns foram a falta de
comparao com grupo controle e o fracasso em relatar a medida de adeso para
ambos os grupos por pelo menos 6 semanas. Este resultado corrobora a constatao
de Thyra et al. (2010) sobre a escassez de ensaio clnicos controlados e aleatorizados.
Lester et al. (2010) conduziram provavelmente o primeiro ensaio clnico controlado e
aleatorizado sobre o tema no Qunia. Os autores, no entanto, concluem que embora o
estudo tenha demonstrado resultados positivos, sua aplicabilidade para outros pases
ainda necessita ser avaliada.
103
Figura 13 Grfico com a quantidade de publicaes PubMed sobre uso de SMS como
suporte ao tratamento de doenas por ano, considerando (*) dados parciais de 2013.
104
Pesquisas Realizadas
105
106
107
para
aumentar
adeso
previamente
adotadas
pelo
NUPAIG,
108
109
110
limitaes
ou
outras
alteraes
na amplitude
dos
movimentos
111
112
abordagem utilizada neste estudo demonstrou ser interessante sob o ponto de vista de
que as mulheres que vivem com HIV/AIDS gostaram e se sentiram bem com as
mensagens SMS recebidas. No entanto, novos estudos so necessrios, com mais
participantes, para aumentar a confiana estatstica dos achados encontrados. A
variao dos textos, dos dias e horrios em que as mensagens so enviadas, a
personalizao das mensagens por meio de lgicas de inteligncia artificial e seu
impacto em longo prazo so abordagens diferentes, ainda no investigadas, que
carecem de estudos para determinar sua efetividade.
J o estudo do absentesmo em clnicas considera uma abordagem mais
clssica, de fcil aferio e compatvel com resultados da literatura. Interessante foi
apresentar uma estimativa, simples, do balano financeiro relacionado s faltas que
no ocorreram.
O estudo do impacto no tratamento da DTM ainda segue em anlise, mas os
resultados preliminares apontam que h pequena diferena, positiva, para o grupo de
pacientes que recebe SMS. Neste caso, possvel mostrar impacto clnico, de fato,
por meio de escalas clssicas na rea da odontologia.
Em suma, a abordagem do envio de torpedos para celular, quando
consideradas situaes de personalizao, horrio e texto nas mensagens, apresentase como um recurso simples, barato e de impacto positivo em variadas assistncias
em sade, conforme nossos estudos e os demais relatados na literatura.
113
114
115
web e minerao de dados visuais (Chakrabarti et al. 2006), pode ser aplicado de
maneira criativa e inovadora para oferecer representaes computacionais mais
efetivas para problemas atuais de grande complexidade (Marx 2013; Andersen et al.
2012, Ahmed et al. 2012, Sobkowicz et al. 2012).
Uma investigao sobre o acesso direto ao cotidiano do consumidor de sade
tambm foi conduzida. O objetivo foi avaliar o impacto do uso de uma tecnologia
bastante simples e disponvel, como o envio de mensagem de texto para o celular do
paciente, para produzir alguma mudana de comportamento em benefcio de sua
sade. Estudos (Prado et al. 2012) apontam resultados favorveis ao paciente quando
utilizada esta interveno por celular. Inicialmente investigamos a utilizao dessas
mensagens para aumentar a adeso de pacientes infectados com HIV. Nestes casos,
devido s elevadas taxas de mutaes e replicaes do vrus um alto nvel de adeso,
superior a 95%, necessita ser mantido para que o vrus possa ficar suprimido (WHO
2003; Bangsberg et al. 2000), evitando dessa forma a resistncia viral que pode ser
transmitida para outras pessoas (WHO 2003). Os resultados obtidos mostraram-se
favorveis quanto aplicao do envio de SMS para estes pacientes (Costa et al.
2012), conforme apontam outros estudos na literatura (Lester et al. 2010; Cocosila et
al. 2009). A inovao, neste caso, foi o emprego de uma triangulao de mtodos para
aumentar a percepo da mudana de comportamento do paciente.
Um segundo estudo considerou o absentemo em consultas mdicas em
hospitais e clnicas da grande So Paulo. Foi avaliada uma srie histrica de 32.709
agendamentos de consulta com o envio de 7.890 lembretes enviados para celular. Os
resultados (Costa et al. 2010) apontaram que a mdia de absentesmo de 26% cai
para 19% com a introduo dos lembretes via celular, com valores que variam de
acordo com a especialidade mdica da consulta, similar aos resultados encontrados
na literatura.
Por fim, um terceiro estudo, ainda em desenvolvimento, busca avaliar o
impacto do uso das mensagens de celular diretamente na evoluo clnica de
pacientes
de
disfuno
temporomandibular
(DTM).
maioria
das
DTM
116
3.5. Referncias
117
(XML)
[Internet].
2009
Jan;
Available
from:
http://www.w3.org/TR/REC-xml/
Breitman K, Casanova MA, Truszkowski W. Semantic Web: Concepts, Technologies
and Applications. 1o ed. Springer; 2006.
Burnette WN. "Western blotting": electrophoretic transfer of proteins from sodium
dodecyl
and
118
American
Society
for
Information
Science
and
Technology
2006;57(2):20821.
Canny J. The Future of Human-Computer Interaction. Queue. 2006;4(6):24-32.
CFM. Define e disciplina a prestao de servios atravs da telemedicina [Internet].
2009 Jan 12; Disponvel em: http://www.portalmedico.org.br/resolucoes/cfm/
2002/1643_2002.htm
Chakrabarti S, Ester M, Fayyad U, Gehrke J, Han J, Morishita S, Piatetsky-Shapiro G,
Wang W. Data Mining Curriculum: A Proposal (Version 1.0). Intensive
Working Group of ACM SIGKDD Curriculum Committee. 2006 Apr 30. [cited
2013 Oct 20] Available from: http://www.kdd.org/sites/default/files/CURMay06
.pdf
Chang P, Hou IC, Hsu CL, Lai HF. Are Google or Yahoo a Good Portal for Getting
Quality Healthcare Web Information? In: Annual Symposium on Biomedical
and Health Informatics (AMIA 2006). 2006.
Cocosila M, Archer N, Brian Haynes R, Yuan Y. Can wireless text messaging improve
adherence to preventive activities? Results of randomized controlled trial. Int J
Med Inform 2009 Apr; 78 (4): 230-38.
Costa TM, Barbosa BJ, Gomes e Costa DA, Sigulem D, de Ftima Marin H, Filho AC,
Pisa IT. Results of a randomized controlled trial to assess the effects of a
mobile SMS-based intervention on treatment adherence in HIV/AIDS-infected
Brazilian women and impressions and satisfaction with respect to incoming
messages. Int J Med Inform. 2012 Apr;81(4):257-69.
Costa TM, Salomo PL, Martha AS, Pisa IT, Sigulem D. The impact of short message
service text messages sent as appointment reminders to patients cell phones
at outpatient clinics in So Paulo, Brazil. Int. J. Med. Inform. 2010 79:65-70.
Coulter A. Assessing the quality of information to support people in making decisions
about their health and healthcare. Picker Institute Europe; 2006.
CREMESP. Manual de princpios ticos para sites de medicina e sade na internet.
[Internet]. Conselho Regional de Medicina do Estado de So Paulo. 2001
[citado 2008 Jan 15]; Disponvel em: http://www.cremesp.org.br/?siteAcao=
PublicacoesConteudoSumario&id=26
Croarkin C, Tobias P. e-Handbook of Statistical Methods [Internet]. NIST/SEMATECH
e-Handbook
of
Statistical
Methods.
http://www.itl.nist.gov/div898/handbook/
2009
Set
1;
Available
from:
119
D3.js - Data-Driven Documents [Internet]. [cited 2013 Oct 15]. Available from:
http://d3js.org.
de Vasconcelos PB. Avaliao ultrassonogrfica da musculatura mastigatria e de
fora de mordida mxima em indivduos com osteoporose nos ossos da face.
Ribeiro Preto. Tese [Mestrado em Cincias] Faculdade de Odontologia de
Ribeiro Preto da Universidade de So Paulo;2010.
Downer SR, Meara JG, Da Costa AC. Use of SMS text messaging to improve
outpatient attendance. Med J Aust. 2005; 183(7): 366-3.
Dowshen N, Kuhns LM, Gray C, Lee S, Garofalo R. Feasibility of interactive text
message response (ITR) as a novel, real-time measure of adherence to
antiretroviral therapy for HIV+ youth. AIDS Behav. 2013 Jul;17(6):2237-43.
Dumais S, Chen H. Hierarchical classification of Web content. In: Proceedings of the
23rd annual international ACM SIGIR conference on Research and
development in information retrieval. 2000. p. 263.
Dworkin SF, Huggins KH, Wilson L, Mancl L, Turner J, Massoth D, LeReshe L,
Truelove E. A Randomized Clinical Trial Using Research Diagnostic Criteria
for Temporomandibular Disorders-Axis II to Target Clinic Cases for a Tailored
Self-Care TMD Treatment Program. J Orofac Pain 2002 Winter;16(1):48-63.
Dworkin SF, LeReshe L, De Rouen T, Von Korff M. Research diagnostic criteria for
temporomandibular
disorders:
review,
criteria,
examinations
and
from:
http://www.stats.gla.ac.uk/steps/glossary/paired_data.html
#ppmcorrcoeff
Ebersbach A, Glaser M, Heigl R, Warta A. Wiki: Web Collaboration.
New York:
3.0
[Internet].
[cited
2013
Oct
15].
Available
from:
http://simile-
widgets.org/exhibit3.
Falagas ME, Karveli EA, Tritsaroli VI. The risk of using the Internet as reference
resource: A comparative study. International Journal of Medical Informatics
2008;77(4):2806.
Falco AEJ, Mancini F, Costa TM, Hummel AD, Teixeira FO, Sigulem D, et al. InDeCS:
Mtodo Automatizado de Classificao de Pginas Web de Sade Usando
120
Available
from:
http://www.adaptivepath.com/ideas/essays/archives/
000385.php
Geraghty M, Glynn F, Amin M, Kinsella J. Patient mobile telephone text reminder: a
novel way to reduce non-attendance at the ENT out-patient clinic. J Laryngol
Otol. 2008; 122:2968.
Giustini
D.
How
is
changing
medicine.
British
Medical
Journal
2005;331(7531):1487.
Guimares AS, Carlsson GE, Marie SK. Bite force and handgrip force in patients with
molecular diagnosis of myotonic dystrophy. J Oral Rehabil 2007 Mar; 34(3):
195-200.
Hasty H. Social, Search, and Branding [Internet]. 2009 Ago 26; Available from:
http://searchenginewatch.com/3634798
Haykin S. Neural Networks: A Comprehensive Foundation. 2o ed. Prentice Hall; 1999.
Haynes RB, McDonald HP, Garg AX, Helping patients follow prescribed treatment:
clinical applications.JAMA 2002; 288: 28803.
Hee-Seung K, Nam-Cho K, Sung-Hee A. Impact of a nurse short message service
intervention for patients with diabetes.J Nurs Care Qual. 2006 JulSep;21(3):266-71.
Himmel W, Reincke U, Michelmann HW. Text mining and natural language processing
approaches for automatic categorization of lay requests to web-based expert
forums. J Med Internet Res. 2009;11(3):e25.
121
Holanda AJ, Pisa IT, Kinouchi Filho O, Martinez AS, Ruiz EES. Thesaurus as a
complex network. Physica A (Print), EUA. 2004 344:530-6.
Java A, Song X, Finin T, Tseng B. Why we twitter: understanding microblogging usage
and communities. In: Procedings of the Joint 9th WEBKDD and 1st SNA-KDD
Workshop 2007. San Jose, California: ACM; 2007. p. 56-65.
Kaplan WA. Can the ubiquitous power of mobile phones be used to improve health
outcomes in developing countries? Global Health. 2006; 23(2):9.
Kellar M, Watters C, Shepherd M. A field study characterizing Web-based informationseeking tasks. J. Am. Soc. Inf. Sci. Technol. 2007;58(7):9991018.
Keselman A, Browne AC, Kaufman DR. Consumer Health Information Seeking as
Hypothesis Testing. Journal of the American Medical Informatics Association.
2008 July;15(4):48495.
Klyne G, Carroll JJ. Resource Description Framework (RDF): Concepts and Abstract
Syntax
[Internet].
2004
[cited
2013
Oct
15].
Available
from:
http://www.w3.org/TR/rdf-concepts.
Kristensen CH, Gomes CF de A, Justo AR, Vieira K. Brazilian norms for the Affective
Norms for English Words. Trends in Psychiatry and Psychotherapy 2011; 33:
135146.
Kunder M. WorldWideWebSize.com - The size of the World Wide Web [Internet].
[citado 2013 set 11]; Available from: http://www.worldwidewebsize.com/
Kwon OW, Lee JH. Text categorization based on k-nearest neighbor approach for web
site classification. Information Processing & Management 2003;39(1):2544.
Lan M, Tan CL, Su J, Lu Y. Supervised and Traditional Term Weighting Methods for
Automatic Text Categorization. IEEE Trans. Pattern Anal. Mach. Intell.
2009;31(4):72135.
Lazar J, Meiselwitz G, Feng J. Understanding web credibility: a synthesis of the
research literature. Found. Trends Hum.-Comput. Interact. 2007;1(2):139-202.
Lei X, Liu Q, Wang H, Tang X, Li L, Wang Y. Is the short messaging service feasible to
improve adherence to tuberculosis care? A cross-sectional study. Trans R Soc
Trop Med Hyg. 2013 Oct;107(10):666-8.
Lester RT, Ritvo P, Mills EJ, Kariri A, Karanja S, Chung MH, Jack W, Habyarimana J,
Sadatsafavi M, Najafzadeh M, Marra CA, Estambale B, Ngugi E, BallT.B,
Thabane L, Gelmon LJ, Kimani J, Ackers M, Plummer FA. Effects of a mobile
phone short message service on antiretroviral treatment adherence in Kenya
(WelTel Kenya1): a randomised trial. Lancet. 2010; 6736(10): 61997-6.
122
Liang CY, Guo L, Xia ZJ, Nie FG, Li XX, Su L, et al. Dictionary-based text
categorization of chemical web pages. Information Processing & Management
2006;42(4):101729.
Liu C, Yeh Y, Chiang I, Chen H, Lee T, Chiu W. Development and evaluation of an
integrated pharmaceutical education system. International Journal of Medical
Informatics. 2004 May;73(4):383-389.
Lober WB, Flowers JL. Consumer empowerment in health care amid the internet and
social media. Seminars in Oncology Nursing. 2011 Aug;27(3):169-182.
Lopes IL. Novos paradigmas para avaliao da qualidade da informao em sade
recuperada na Web. Cincia da Informao. 2004;33:81-90.
Lorence DP, Greenberg L. The zeitgeist of online health search: Implications for a
consumer-centric health system. Journal of General Internal Medicine
2006;21(2):134.
Louch G, Dalkin S, Bodansky J, Conner M. An exploratory randomised controlled trial
using short messaging service to facilitate insulin administration in young
adults with type 1 diabetes. Psychol Health Med. 2013;18(2):166-74.
Luhn HP. A statistical approach to mechanized encoding and searching of literary
information. IBM J. Res. Dev. 1957;1(4):30917.
MacDonell K, Gibson-Scipio W, Lam P, Naar-King S, Chen X. Text messaging to
measure asthma medication use and symptoms in urban African American
emerging adults: a feasibility study. J Asthma. 2012 Dec;49(10):1092-6.
Maduka O, Tobin-West CI. Adherence counseling and reminder text messages
improve uptake of antiretroviral therapy in a tertiary hospital in Nigeria. Niger J
Clin Pract. 2013 Jul-Sep;16(3):302-8.
Mancini F, Falco AEJ, Hummel AD, Costa T, Silva F, Teixeira F, et al. Brazilian
health-related content web search portal: presentation on a method for its
development and preliminary results. In: HEALTHINF 2009 - International
Conference on Health Informatics. Porto, Portugal: 2009.
Mancini F. Construo e Avaliao de um Portal de Busca de Contedos Web em
Sade Baseado em Minerao Web. So Paulo. Tese [Doutorado em Gesto
e Informtica em Sade] - UNIFESP; 2011.
Marx V. The big challenges of big data. Technology feature. Nature. 2013 Jun
13;498:255-260.
Massad E, Menezes RX, Silveira PSP, Ortega NRS. Mtodos quantitativos em
medicina. So Paulo: Manole, 2004.
Mbuagbaw L, Ongolo-Zogo P, Thabane L. Investigating community ownership of a text
message programme to improve adherence to antiretroviral therapy and
123
Dimension
Contemporary
German
Arts
And
Letters
1998;752:418.
McDonald HP, Garg AX, Haynes RB. Interventins to enhance patient adherence to
medication prescriptions: scientific review. JAMA. 2002; 288(22): 2868-2879.
Millard DE, Ross M. Web 2.0: hypertext by any other name? In: HYPERTEXT '06.
Odense, Denmark: ACM; 2006. p. 27-30.
Neelapala P, Duvvi SK, Kumar G, Kumar BN. Do gynaecology outpatients use the
Internet to seek health information? A questionnaire survey. Journal of
Evaluation in Clinical Practice 2008;14(2):3004.
Nelson TM; Berg JH; Bell JF; Leggott PJ; Seminario AL. Assessing the effectiveness of
text messages as appointment reminders in a pediatric dental setting. JADA
2011 Apr;142(4):397-405.
NetScoring. NetScoring: criteria to assess the quality of Health Internet information
[Internet]. 2001 [cited 2010 Mar 26]; Available from: http://www.chu-rouen.fr/
netscoring/netscoringeng.html
Oleto RR. Percepo da qualidade da informao. Cincia da Informao [Internet].
2006;35(1). Disponvel em: http://revista.ibict.br/ciinf/index.php/ciinf/article/
view/705
O'Reilly T. Web 2.0 Conference [Internet]. In: Web 2.0 Conference. San Francisco:
O'Reilly;
2004
[citado
2009
Ago
10].
Available
from:
http://conferences.oreillynet.com/web2con/
O'Reilly T. What is Web 2.0? Design Patterns and Business Models for the Next
Generation
of
Software
[Internet].
2007
Abr
1;
Available
from:
http://oreilly.com/web2/archive/what-is-web-20.html
zel SA. A Web page classification system based on a genetic algorithm using taggedterms as features. Expert Systems with Applications 2011;38(4):340715.
Palla S. Mioartropatias do sistema mastigatrio e dores orofaciais. So Paulo: Artes
Mdicas; 2004.
Pandolfini C, Bonati M. Follow up of quality of public oriented health information on the
world wide web: systematic re-evaluation. BMJ. 2002;324(7337):582-583.
Pew Internet and American Life Project. The online health care revolution: how the
Web helps Americans take better care of themselves [Internet]. 2010 [cited
2010 Mar 4]. Available from: http://www.pewinternet.org
124
Prado CS, Tenrio JM, Ruiz EES, Ortolani CLF, Pisa IT. Impacto da utilizao de
mensagens do tipo SMS - Short Message Service. J. Health Inform. 2012
Out;4(4):159-64.
Qi X, Davison BD. Web page classification: Features and algorithms. ACM Computing
Surveys 2009;41(2).
Robins D, Holmes J, Stansbury M. Consumer health information on the Web: The
relationship of visual design and perceptions of credibility. Journal of the
American Society for Information Science and Technology. 2010;61(1):13-29.
Rueda S, Park-Wyllie LY, Bayoumi A, Tynan AM, Antoniou T, Rourke S, Glazier R.
Patient support and education for promoting adherence to highly active
antiretroviral therapy for HIV/AIDS. Cochrane Database of Systematic
Reviews. In: The Cochrane Library, Issue 1, Art. No. CD001442, 2010.
Salton G, Buckley C. Term-weighting approaches in automatic text retrieval.
Information Processing and Management 1988;24:513--523.
Salton G, Wong A, Yang CS. A vector space model for automatic indexing.
Communications of the ACM 1975;18(11):61320.
Salton G. The smart document retrieval project. In: Proceedings of the 14th annual
international ACM SIGIR conference on Research and development in
information retrieval. New York, NY, USA: ACM; 1991. p. 3568.
Schneider K-M. On Word Frequency Information and Negative Evidence in Naive
Bayes Text Classification [Internet]. In: Vicedo JL, Martnez-Barco P, Muoz
R, Saiz Noeda M, organizadores. Advances in Natural Language Processing.
Berlin, Heidelberg: Springer Berlin Heidelberg; 2004. p. 47485.
Scrivani SJ, Keith DA, Kaban LB. Temporomandibular Disorders. N Engl J Med 2008
Dec;359(25):2693-705.
Shapiro SS, Wilk MB. An analysis of variance test for normality (complete samples).
Biometrika. 1965; 52 (3): 591.
Silberg WM, Lundberg GD, Musacchio RA. Assessing, Controlling, and Assuring the
Quality of Medical Information on the Internet: Caveant Lector et Viewor--Let
the Reader and Viewer Beware. JAMA. 1997;277(15):1244-1245.
Sim J, Wright CC. The kappa statistic in reliability studies: use, interpretation, and
sample size requirements. Phys Ther. 2005;85(3):257-68.
Singhal A. Modern information retrieval: a brief overview. Bulletin of the IEEE
Computer Society Technical Committee on Data Engineering 2001;24:2001.
Sobkowicz P, Kaschesky M, Bouchard G. Opinion mining in social media: Modeling,
simulating, and forecasting political opinions in the web. Government
Information Quarterly 2012;29:470479.
125
126
127
4.
EM SADE
O termo sistema de apoio a deciso clnica (SADC) - tambm denominado sistema de
auxlio deciso clnica ou mais amplamente sistema de apoio a deciso em sade representa um sistema de informao utilizado para integrar informaes clnicas e do
paciente, e prover apoio para a tomada de decises nos cuidados ao paciente (Berner
2006). Um sistema de apoio deciso clnica qualquer programa projetado para
ajudar profissionais de sade na tomada de deciso (Musen et al. 2006).
Um dos motivadores para o desenvolvimento e uso desses sistemas a
esperana de que eles auxiliem na superao das dificuldades intrnsecas ao
conhecimento mdico, que impreciso e incompleto (lvaro 2007; Bouchon-Meunier
2000). Sigulem et al. (1997) afirmam que a principal motivao para o
desenvolvimento desses sistemas reside no aumento progressivo da quantidade de
dados, informao e conhecimento que o profissional de sade de hoje deve utilizar
para exercer adequadamente a sua profisso. Segundo Denekamp (2007), a
expectativa que os SADCs diminuam a distncia entre as evidncias e a prtica
clnica ao disponibilizar dados relevantes e conhecimento no ponto de cuidado. De
fato, o uso de SADCs contribui com a qualidade na prestao de cuidados de sade,
uma vez que a Organizao Mundial de Sade declara que a segurana do doente
uma componente essencial da qualidade na prestao de cuidados de sade,
considerando a complexidade, tanto da prtica, como da organizao. Os trs
principais objetivos de uma prtica clnica segura so: (1) identificar quais os
diagnsticos e procedimentos teraputicos que so mais seguros e eficientes; (2)
garantir que so aplicados a qualquer pessoa que deles necessite; (3) implement-los
corretamente e sem erros (Aranaz et al. 2005, p. 2)
Os SADCs podem ser categorizados segundo o tipo de suporte ao mdico:
ativo, quando provem alertas ativamente, ou passivo, se apenas responde quando h
uma solicitao especfica. Os SADCs tambm podem ser categorizados segundo o
mtodo empregado para prover o apoio: se sistemas baseados em conhecimento ou
em aprendizagem de mquina e padres estatsticos de reconhecimento (Berner e La
Lande 2007). Mais especificamente, na literatura existem trabalhos publicados que
mostram a aplicao de tcnicas matemticas, como anlise estatstica (Patel et al.
2008; Murugan et al. 2008), modelos matemticos (Costa et al. 2008; Marinho 2006) e
128
apresenta 4
temas
que
representam um esforo
de
129
130
131
132
133
mtricas
mostraram excelentes
resultados na identificao
de
134
135
(acerto
75%,
sensibilidade
0,725,
especificidade
0,765,
AUC
0,836)
no
136
potencialmente
mais
efetiva
que
mtodos
estatsticos
Pesquisas Realizadas
137
138
139
machine (LibSVM), k-vizinhos prximos (Lbk, KStar, LBR) e rede neural artificial
(multilayer perceptron MLP). A partir da variao dos valores dos parmetros para
cada tcnica foram experimentados 270 modelos no total.
140
141
Catassi e Fasano (2010) indicaram que a biopsia do intestino delgado tem sido
questionada como nico teste conclusivo para o diagnstico em vrios casos. Os
autores sugerem que o diagnstico da doena celaca deva ser o resultado de uma
anlise ampla, em que as manifestaes clnicas, testes sorolgicos e histolgicos,
142
alm da anlise do HLA e resposta terapia devam ser igualmente avaliados como
regras. Para a concluso diagnstica, pelo menos quatro das cinco regras devem ser
atendidas. Nesta perspectiva, as manifestaes clnicas tm um peso anlogo aos
exames invasivos e dispendiosos. Considerando que a anlise das manifestaes
clnicas condizentes com a doena celaca um item importante para o levantamento
de uma suspeita diagnstica que pode desencadear um processo diagnstico, este
estudo pode contribuir como uma ferramenta confivel para anlise dessas
manifestaes e indicao de um possvel diagnstico positivo.
143
doador (Freeman e Edwards 2000; Fryer et al. 2003; Kim et al. 2006). Outra questo
relevante que a utilizao de inibidores de calcineurina por longos perodos pode
ocasionar
nefrotoxicidade
ao
imunossupressor
conseqentemente
no
funcionamento dos rins (Bittencourt et al. 2004; Morales 2005). Outro fator a ser
levado em considerao o alto custo do procedimento. Como exemplo, o transplante
heptico em 2004 teve um custo mdio de R$ 52.172,60 no Brasil (Castelo et al.
2007).
Constitui-se, assim, um cenrio no qual o transplante de rgos est associado
ao aumento da qualidade de vida e da sobrevida do paciente, como tambm baixa
oferta de rgos, considervel probabilidade da perda do enxerto de mortalidade na
fila de espera e alto custo do procedimento. Logo, melhorias nos procedimentos de
transplante de rgos que visem aperfeioar o processo tem tido cada vez maior
ateno pela sociedade. Nesse contexto a tecnologia da informao pode atuar como
um significativo mecanismo interventor.
SADCs em Doena Heptica e Transplante
Os sistemas de apoio deciso clnica (SADC) so um exemplo de como a rea de
informtica em sade pode contribuir no ambiente da sade. Os primeiros SADCs
surgiram na dcada de 1970 (Shortliffe 1976; de Dombal et al. 1972). A partir desta
poca diferentes SADCs foram desenvolvidos para as mais variadas reas da
medicina, como por exemplo, para medicina clnica, Internist-1/QMR (Miller et al. 1986;
Miller et al. 1982), o DXPlain (Barnett et al. 1987), e o Lepidus (Silva 2000), e tambm
para domnios especficos, como transplantes de rgos (Wang et al. 2008).
Diferentes abordagens podem ser empregadas no desenvolvimento de um
SADC, desde a aplicao do conhecimento mdico de forma direta at a utilizao de
tcnicas de minerao de dados. Na literatura existem trabalhos publicados que
mostram o sucesso da aplicao de tcnicas matemticas, como: anlise estatstica
(Patel et al. 2008; Murugan et al. 2008), modelos matemticos (Costa et al. 2008;
Marinho 2006) e tcnicas de minerao de dados e inteligncia artificial (IA) (Wang et
al. 2008; Banerjee 2003).
As tcnicas de minerao de dados e IA, particularmente as de redes neurais
artificiais (RNA) (Haykin 1999; Mohamad 1995; Rosenblatt 1958), tm sido utilizadas
para este tipo de problema (Caocci et al. 2010; Nilsson et al. 2010; Nilsson et al. 2009;
ztekin et al. 2009; Pidala et al. 2009; Wang et al. 2008; Ghoshal e Das 2001). Temse, como exemplo, o estudo de Wang et al. (2008) o qual mostra que possvel
formular uma abordagem baseada em RNA que apresente maior acurcia que o uso
144
Pesquisas Realizadas
145
146
147
148
149
150
mtodos de avaliao da idade ssea tm sido estudados, como a inspeo das fases
de maturao ssea das vrtebras cervicais (cervical vertebral maturation, CVM)
observadas em radiografias cefalomtricas laterais, tcnica esta comum na ortodontia
(Lamparski 1972). Nestas radiografias a segunda, terceira e quarta vrtebras (C2, C3
e C4) so vistas mesmo quando o paciente est usando um colar de proteo da
tireide.
O mtodo CVM possibilita avaliar a maturao ssea por meio de uma nica
radiografia cefalomtrica lateral, evitando assim uma nova exposio do paciente
radiao ionizante. O custo tambm reduzido, uma vez que esta tcnica elimina o
uso de radiografias adicionais como a carpal. No mtodo CVM somente C2, C3 e C4
so analisadas e as fases de maturao so divididas em seis estgios cervicais
(cervical stages, CS), variando de CS1 a CS6 (Baccetti et al. 2005), conforme Figura
16. Este mtodo apresenta uma tendncia atual de uso com grande confiabilidade
descrita na literatura (Generoso et al. 2003; Arajo 2001; Armond 2000). Ortolani
(2005) o considerou como um mtodo alternativo vlido e prtico, possibilitando at
mesmo substituir outros mtodos de avaliao do estgio em que o indivduo se
encontra na curva de crescimento (Santos et al. 2005).
151
152
Pesquisas Realizadas
Realizamos um estudo que envolveu o desenvolvimento de um sistema computacional
de apoio deciso clnica baseado na atualizao do mtodo CVM proposto por
Bacceti et al. (2005) para colaborar na diminuio da discordncia entre examinadores
quanto avaliao da maturao ssea para a ortodontia. A proposta deste estudo foi
estudar classificadores de padres para identificar automaticamente a fase de
crescimento que um indivduo se encontra segundo o mtodo de maturao cervical
vertebral. Os resultados deste trabalho visaram promover a utilizao do mtodo de
maturao vertebral cervical por ortodontistas por meio do auxlio de um sistema de
apoio deciso clnica, alcanando assim um parmetro satisfatrio e padronizado
para estimar a fase de crescimento que um indivduo se encontra. Na poca do estudo
nenhum trabalho havia sido encontrado na literatura aliando tcnicas computacionais
ltima modificao do mtodo realizado por Bacceti et al. (2005).
Esta pesquisa foi concebida junto ao grupo de pesquisa Sade 360, nas
reunies sobre sistemas de apoio a deciso, associado ao Programa de Psgraduao em Gesto e Informtica em Sade, da Escola Paulista de Medicina,
Universidade Federal de So Paulo UNIFESP. Este grupo conta com a participao
da Profa. Dra. Cristina Lcia Feij Ortolani, especialista em ortodontia. Esta pesquisa
foi conduzida como um projeto de mestrado de Roberto Silva Baptista, analista de
sistemas, com apoio dos especialistas ortodontistas Camila Leite Quaglio Tagliavini e
Laila Mohamad El Harati Mourad. As etapas conduzidas no estudo incluram o
desenvolvimento de um classificador de padro para identificao do estgio cervical
de um indivduo, construo de um sistema computacional a partir do classificador
desenvolvido e avaliao do grau de concordncia entre avaliadores quanto
classificao manual versus classificao pelo sistema proposto.
Base de Radiografias Cefalomtricas Laterais
Para a formao da base de imagens, as radiografias cefalomtricas laterais para este
tipo de estudo foram regularmente adquiridas dentro de um servio de radiologia
seguindo um padro definido pela instituio, incluindo a utilizao de uma geometria
calibrada para aquisio da imagem de raios-X. Estas radiografias foram realizadas
com o propsito de diagnstico ortodntico para posterior tratamento.
Foram coletadas e digitalizadas 187 radiografias cefalomtricas laterais sendo
118 de indivduos do gnero feminino e 69 do gnero masculino, segundo parmetros
153
154
155
Figura 17 - Tela capturada: pgina de avaliao por meio da marcao dos pontos de
interesse e sugesto do SAD (Baptista 2012).
156
em
ortodontia,
de
maneira
que
diferentes
imagens
foram
apresentadas ora para avaliao manual (usurio observa a imagem como se faz
tradicionalmente e indica um estgio de maturao), ora avaliao aps marcao de
pontos (usurio marca pontos do padro cefalomtrico e depois indica um estgio de
maturao), ora avaliao aps sugesto do classificador automtico (usurio marca
pontos do padro cefalomtrico e aceita ou recusa o estgio sugerido pelo
classificador automtico). O objetivo foi avaliar como seria o comportamento do
usurio a partir da sugesto do sistema.
A comparao da situao de apenas marcao de pontos e aps a sugesto
de estgio pelo sistema resultou em grau de concordncia quase perfeito, indicando
que o sistema de apoio robusto para absorver pequenas variaes encontradas na
marcao de pontos. Foi possvel detectar que houve uma tendncia de mudana de
opinio dos avaliadores acompanhando a sugesto apresentada pelo sistema de
apoio.
Portanto, a anlise conduzida do sistema como apoio ao ortodontista indicou
que para o grupo de avaliadores deste estudo tanto a sugesto do sistema quanto a
ao de marcar os pontos influenciaram na deciso do avaliador, minimizando a
discordncia entre diferentes avaliadores.
157
158
Pesquisas Realizadas
159
160
161
Construo de Taxonomia
A tcnica de minerao de textos possibilitou gerar uma taxonomia em formato de
rvore composta por 206 termos ordenados, ocorrendo 20.599 vezes em 3.018
laudos, de forma que foi possvel observar as relaes de dependncia entre os
termos, como tambm favorecer na classificao dos respectivos laudos. Uma
taxonomia com 206 termos pode ser considerada com alta densidade uma vez que
poucos termos representam um volume de 3.018 documentos. A gerao de uma
nuvem de termos se mostrou adequada para observar graficamente a frequncia e
dinmica de distribuio dos termos. Foi possvel observar tambm as relaes de
dependncia mais frequentes entre termos e diagnsticos.
Para a representao do resultado da adequao dos textos diagnsticos
foram construdas trs vises:
Nuvem de termos: criou-se uma nuvem de termos, por meio do software R (Rproject.org), na qual o tamanho da fonte representa a frequncia dos termos na
coleo de textos. A representao obtida mostra que quanto maior o tamanho
da letra e mais central o termo estiver posicionado, mais frequente ele . E
quanto menor for a letra e mais prximo da margem da nuvem (periferia) o
termo estiver posicionado, menos frequente;
rvore de trs nveis diagnsticos: construiu-se uma rvore, com trs nveis
diagnsticos, na qual em cada n atribuiu-se a ocorrncia de pacientes com os
respectivos diagnsticos concomitantemente.
nuvem
de
palavras
foi
uma
tcnica
utilizada
para favorecer o
162
de massa renal estes indivduos esto perdendo, sendo uma informao fundamental
quando se planeja estratgias teraputicas e quando se pretende apresentar o
prognstico da doena.
Figura 18 - Nuvem de termos referente aos trs primeiros termos dos campos
diagnsticos (Rocha 2013).
Agrupamento de Laudos
Foi utilizado como tcnica de anlise de agrupamento o algoritmo K-means (Tan et al.
2005). Neste algoritmo, primeiramente, o usurio deve escolher o nmero de grupos
(K) desejado. Para cada grupo, um exemplo da base selecionado aleatoriamente
como centride inicial e cada exemplo atribudo ao centride mais prximo. Em
seguida, em cada grupo calculado a mdia das distncias de cada exemplo ao
centride, resultando em um novo centride. Cada exemplo atribudo ao centride
163
164
165
Tabela 7 - Exemplo de 10 dos 100 termos DeCS encontrados aps a filtragem e suas
frequncias em cada seo e nmero total dos laudos, respectivamente (Nicolas 2013).
166
uma verdade absoluta, uma vez que o par aparece, em menor quantidade, no
diagnstico dos laudos de bipsia renal.
A partir deste estudo foi possvel evidenciar associaes estatisticamente
significativas entre as sees dos documentos. Especificamente, foi possvel mostrar
que a seo de imunofluorescncia direta est fortemente relacionada com o campo
observaes, sugerindo que deve haver redundncia na descrio dos sintomas do
paciente. Ainda, que os diagnsticos esto fortemente correlacionados com as sees
imunofluorescncia direta e exame macroscpico, e pouco com as sees exame
microscpico, cabealho e observaes. As correlaes das estruturas e termos
podem contribuir para o desenho de um sistema de diagnstico baseado em rede
bayesiana.
Classificao Auxiliada pela Terminologia DeCS
Para estas fase do estudo foram utilizados 1.002 laudos completos de bipsia renal,
referente aos anos de 1994 a 2010, obtidos utilizando critrios de aleatoriedade a
partir de uma base contendo 3728 laudos completos. Os classificadores usarsam
termos mdicos como atributos. Com o objetivo de reconhecer os termos mdicos
presentes nos laudos, modelamos um reconhecedor de entidades nomeadas baseado
em dicionrio. Este reconhecedor atua em cada sentena do laudo procurando pelos
termos completos. Como dicionrio utilizamos a terminologia DeCS, extrada do UMLS
(Bodenreider 2004).
Previamente a etapa de reconhecimento de entidades nomeadas, os laudos e
o dicionrio foram pr-processados. Inicialmente os acentos foram removidos e todas
as palavras foram convertidas para letras minsculas. Numa segunda etapa, foi
efetuada a remoo de stop-words, ou seja, palavras muito frequentes, como artigos,
preposies, pontuao, conjunes e pronomes. Por fim adotou-se a estratgia de
stemming (Porter 2006) para a reduo das formas flexionais das palavras dos laudos.
Este pr-processamento visou minimizar o custo e otimizar os resultados do
processamento.
Uma vez que os laudos e dicionrio estavam devidamente pr-processados, foi
calculada a freqncia de cada termo DeCS nos laudos de bipsia renal. Com estes
dados, foi elaborado de maneira automtica um arquivo no formato .arff, em que os
termos DeCS encontrados so os atributos para a classificao e as instncias so a
frequncia dos termos em cada seo dos laudos. Este arquivo foi utilizado como
entrada para cinco algoritmos de classificao, que foram escolhidos com base no
trabalho de Frunza e Inkpen (2010). So estes os algoritmos de classificao
167
168
169
celular
caracterizada
histologicamente
por
necrose
das
clulas
170
171
4.6. Referncias
172
randomized
controlled
trial.
Am
Med
Inform
Assoc.
2006;13(2):171-9.
Berner ES, La Lande TJ. Overview of clinical decision support systems. In: Clinical
decision support systems: theory and practice. 2a ed. New York: Springer;
2007. p. 3-22.
Berner ES. Clinical decision support systems: theory and practice. New York: Springer.
1999.
Bittencourt ZZLC, Alves FG, Mazzali M, Santos NR. Quality of life in renal transplant
patients: impact of a functioning graft. Rev. Sade Pblica. 2004 Oct; 38(5):
732-34.
Bodenreider O. The Unified Medical Language System (UMLS): integrating biomedical
terminology. Nucleic Acids Research, 32(suppl.1):D267D270, January 2004.
Bouchon-Meunier B. Uncertainty Management in Medical Applications. In: Akay, M.
(Ed.), Nonlinear Biomedical Signal Processing: Fuzzy Logic, Neural Networks,
and New Algorithms. New York: IEEE Press, 2000; 1:1-26.
Brooke J. SUS - A quick and dirty usability scale. [Internet] 1986. [cited 2008 Jul 1].
Available from: http://www.usability.gov.
173
networks
compared
with
logistic
regression
models.
Eur
174
Duarte HEM. et al. Effect of image compression of digital lateral cephalograms on the
reproducibility of cephalometric points. Dentomaxillofacial Radiology, v. 38, n.
6, p. 393-400, 1 set. 2009.
Duda RO, Hart PE, Stork DG. Pattern Classification. 2. ed. [S.l.] Wiley-Interscience,
2000.
Fasano A, Catassi C. Current approaches to diagnosis and treatment of celiac disease:
an evolving spectrum. Gastroenterology. 2001;120:63651.
Fasano A. Surpresas da doena celaca. Scientific American Brasil. 2009 Set
8;(88):404.
Ferraz FHRP. et al. Perfil das doenas glomerulares em um hospital pblico do Distrito
Federal. Jornal Brasileiro de Nefrologia, v. 32, n. 3, setembro. 2010.
Firouzi F, Rashidi M, Hashemi S, Kangavari M, Bahari A, Daryani NE, et al. A decision
tree-based approach for determining low bone mineral density in inflammatory
bowel disease using WEKA software. Eur J Gastroenterol Hepatol. 2007
Dec;19(12):1075-81.
Fishman LS. Radiographic evaluation of skeletal maturation. A clinically oriented
method based on hand-wrist films. The Angle Orthodontist, v. 52, n. 2, p. 88112, abr. 1982.
Fitzwater DS, Brouhard BH, Garred D, Cunningham RJ 3rd, Novick AC, Steinmuller D.
The outcome of renal transplantation in children without prolonged pretransplant dialysis. Clin Pediatr 1991;30:148-52.
Forman L, Lucey M. Predicting the prognosis of chronic liver disease: an evolution from
Child to MELD. Hepatology. 2001; 33: 4735.
Freeman Jr RB, Edwards EB. Liver transplant waiting time does not correlate with
waiting list mortality: implications for liver allocation policy liver transplantation.
2000 Sep; 6(5): 543-52.
Frunza O, Inkpen D. Extraction of Disease-Treatment Semantic Relations from
Biomedical Sentences, Proceedings of the 2010 Workshop on Biomedical
Natural Language Processing, ACL 2010, pages 9198, Uppsala, Sweden, 15
July 2010.
Fryer J, Pellar S, Ormond D, Koffron A, Abecassis M. Mortality in candidates waiting
for combined liver-intestine transplants exceeds that for other candidates
waiting for liver transplants. Liver Transplantation. 2003 Jul; 9(7): 748-53.
Galvo LC, Melo SBC, Fernandes MM, Peres L, Troncon LA, Melo EV. Celiac disease
prevalence in blood donors and clinical aspects of the patients in Ribeiro
Preto-Brazil. J Pediatr Gastroenterol Nutr Suppl. 2004 Jun;39:S227-S8.
175
to
artificial
neural
network:
critical
review.
Hepatology
176
AD,
Mannon
RB,
Swanson
SJ,
Hale
DA.
Strategies
for
minimizing
177
em
transplantes
renais:
classificadores
automticos
para
178
2008
Jul
1].
Available
from:
http://www.useit.com/alertbox/20030825.html.
Niemeijer M. et al. Assessing the skeletal age from a hand radiograph: automating the
Tanner-Whitehouse method. Proceedingsof SPIE, v. 5032, n. 1, p. 1197-1205,
16 Mai. 2003.
Nilsson JM, Ohlsson M, Hoglund P, et al. Artificial neural networks - a method for
optimal donor-recipient matching. large scale simulation of survival after heart
transplantation. The Journal of Heart and Lung Transplantation. 2010
Feb;29(2, Supplement 1):S29.
Nilsson JM, Ohlsson M, Hoglund P, et al. Virtual Cross-Matching in Heart
Transplantation:
Large
Scale
Simulation
of
Survival
after
Heart
179
180
Porter M. The Porter Stemming Algorithm [Internet]. [cited 2007 Oct 21]. Last update:
2006 Jan. Available from: http://tartarus.org/~martin/PorterStemmer.
Quinlan JR. Induction of decision trees, Machine Learning. 1986: 1(1): 81106.
Rassinoux AM. Section Editor for the IMIA yearbook section on knowledge
representation
and
management.
Knowledge
representation
and
1999
[Acesso
em:
19
jun.
2013].
Disponvel
em:
http://www.csse.monash.edu.au/~roset/papers/cal99.pdf.
Reunanen J. Overfitting in making comparisons between variable selection methods.
JMLR 2003: 3:1371-82.
Rocha AR. Aplicao de tcnicas de minerao de textos para categorizao de
diagnsticos em laudos de bipsias renais. So Paulo. Dissertao [Mestrado
em Gesto e Informtica em Sade] - UNIFESP; 2013.
Rodrigo L. Celiac disease. World J Gastroenterol. 2006; 12(41): 6585-93.
Roque FS, Jensen PB, Schmock H, Dalgaard M, Andreatta M, et al. Using electronic
patient records to discover disease correlations and stratify patient cohorts.
PLoS Comput Biol 7(8): e1002141. doi:10.1371/journal.pcbi.1002141. 2011.
Rosenblatt F. The perceptron: a probabilistic model for information storage and
organization in the brain. Psychological Review. 1958:3(6):386-408.
Rosner B. Fundamentals of biostatistics. 6th ed. Boston: Duxbury Press; 2006.
Sadeghi S, Barzi A, Sadeghi N, King B. A Bayesian model for triage decision support.
Int J Med Inform. 2006 May;75(5):403-11.
Saitta S, Raphael B, Smith IF. A bounded Index for cluster validity proceedings of the
5th international conference on machine learning and data mining in pattern
recognition [Internet]. 2007 [Acesso em: 17 June, 2013] MLDM 07.Berlin,
Heidelberg: Springer-Verlag. Disponvel em: http://dx.doi.org/10.1007/978-3540-73499-4_14.
Santos ECA. et al. Evaluation of the reproducibility of the method of determination of
the skeletal maturation by cervical vertebrae. Revista Dental Press de
Ortodontia e Ortopedia Facial, v. 10, n. 2, p. 62-68, abr. 2005.
Sdepanian VL, Fagundes-Neto U. Doena inflamatria intestinal. In: Carvalho ES,
Carvalho WB. Teraputica e prtica peditrica. 2a ed. So Paulo: Atheneu;
2001. p. 683-91.
181
182
Tenrio JM, Sdepanian VL, Pisa IT, Amaral MB. Desenvolvimento e avaliao de um
protocolo eletrnico para atendimento e monitoramento do paciente com
doena celaca. In: XI Congresso Brasileiro de Informtica em Sade - CBIS
2008, Anais do XI Congresso Brasileiro de Informtica em Sade. Sociedade
Brasileira de Informtica em Sade SBIS, Ribeiro Preto 2008, SP.
Tenrio JM. Aplicao de Tcnicas de Inteligncia Artificial ao Desenvolvimento de um
Sistema de Apoio Deciso para Doena Celaca. So Paulo. Dissertao
[Mestrado em Cincias - Informtica em Sade] - UNIFESP; 2011.
Theodoridis S, Koutroumbas K. Pattern Recognition. Fourth Edition. 4. ed. [S.l.]
Academic Press, 2008.
Thodberg HH, et al. The BoneXpert method for automated determination of skeletal
maturity. IEEE Trans Med Imaging, v. 28, p. 52-66, 2009.
Torres MI, Lpez Casado MA, Ros A. New aspects in celiac disease. World J
Gastroenterol. 2007;13(8):1156-61.
Vafai H, Jong KD. Genetic algorithms as a tool for feature selection in machine
learning. In: Proceedings 4th International Conference on Tools with Artificial
Intelligence. Rockvill: IEEE Computer Society Press, 1992: 200-203.
Vieira S. Introduo Bioestatstica. [s.l.] Elsevier Brasil, 1997.
Viera AFG, Virgil J. Uma reviso dos algoritmos de radicalizao em lngua portuguesa
[Internet].
Disponvel
em:
<http://informationr.net/ir/12-3/paper315.html>.
183
5.
A gesto em sade pode ser definida como uma rea que compreende atividades de
formao, implementao e avaliao de polticas, instituies, programas, projetos e
servios de sade, bem como a conduo, gesto e planejamento de sistemas e
servios de sade (DeCS goo.gl/gHaLbl). A nomenclatura informtica para a gesto
em sade representa, portanto, um esforo em fundamentar, planejar, desenvolver,
implantar e avaliar modelo e tcnicas da rea da informtica para aplicao nos
diferentes aspectos da gesto em sade. Inclui em seu escopo abordagens da
chamada informtica da sade pblica (public health informatics) como definida por
Kulikowski et al. (2012), que tambm por vezes denominada informtica
populacional ou informtica da sade global, mas no se restringe a aplicaes de
sade pblica.
Esta subrea tem foco na anlise do uso da informtica na perspectiva do
gestor e suas necessidades de informao, estudos e mtodos para tornar a
informao acessvel ao gestor, e modelos e integrao de preferncias do gestor em
sistemas de informao em sade. Informtica para a gesto em sade se situa no
cruzamento de diferentes disciplinas como informtica, sade pblica, promoo da
sade, cincia da informao e documentao, economia em sade e governana de
tecnologia da informao e comunicao.
Este captulo
apresenta 4
temas
que
representam um esforo
de
184
pelo
pesquisador
nos
temas
relacionados.
Esto
indicados
os
185
como sinonmia, uma vez que h diferenas conceituais entre eles. A segmentao
pode ser geogrfica (por exemplo, regio, porte da cidade, densidade, rea),
demogrfica (por exemplo, idade, tamanho da famlia, ciclo de vida da famlia, sexo,
renda, ocupao, grau de instruo, religio, raa, gerao, nacionalidade, classe
social); psicogrfica (por exemplo, estilo de vida, personalidade), comportamental (por
exemplo, ocasies, benefcios, status do usurio, ndice de utilizao, status de
fidelidade, estgio de prontido, atitude em relao a um produto ou servio). Cada
tipo de segmento j possui um conjunto de variveis definidas para melhor
compreenso do sujeito (Kotler e Keller 2006).
Na realizao de uma clusterizao em minerao de dados, algumas
condies so comuns (Han e Hamber 2006):
a) escalabilidade dos dados: alguns algoritmos de clusterizao funcionam melhor
com pequena quantidade de dados, outros com grande massa de dados. Ainda
h algoritmos que podem ser usados com pequena ou grande quantidade de
dados invariavelmente;
b) habilidade de lidar com diferentes tipos de atributos: muitas anlises podem
requerer uso de variveis binrias ou categricas, alm das numricas;
c) possibilidade de clusters com formas arbitrrias: alguns algoritmos, por usar
medidas euclidianas ou de Manhattan tendem a encontrar clusters com formato
esfricos. Porm, importante que o algoritmo a ser usando possa identificar
clusters com formas arbitrrias;
d) pouco domnio da rea de conhecimento para determinar os parmetros de
entrada: quanto mais conhecimento da rea de estudo seja necessrio, maior a
dificuldade de controle na clusterizao especialmente em bases com alta
dimensionalidade;
e) habilidade para lidar com dados ruidosos: bases de dados do mundo real
possuem valores extremos, valores ausentes, dados inseridos erroneamente.
Alguns algoritmos so sensveis a tais dados e podem conduzir a uma
clusterizao sem qualidade;
f) clusterizao incremental e nenhuma sensibilidade com a ordem de entrada
dos dados: o algoritmo deve permitir novas inseres de dados e no ser
sensvel ordem de entrada;
g) alta
dimensionalidade:
alguns
algoritmos
lidam
bem
com
baixa
186
baseados
em
modelos,
clusterizao
de
dados
ultra
dimensionais,
187
2010) orienta cada ponto a um cluster cujo centro (tambm chamado de centride)
esteja mais prximo. O centro a mdia de todos os pontos no cluster, ou seja, suas
coordenadas so a mdia aritmtica para cada dimenso separadamente sobre todos
os pontos no cluster. A fragilidade do k-means o fato de lidar com a mdia. Se uma
determinada varivel tiver valores discrepantes, a mdia no a melhor representao
do grupo. Assim, pode-se ento usar uma tcnica baseada em objeto representativo,
que o k-medoide (Velmurugan e Santhanam 2010). Ao invs de selecionar o valor
mdio do objeto no cluster como um ponto de referncia, um objeto selecionado
para representar o cluster, usando um objeto representativo por cluster. Cada objeto
restante agrupado com o objeto representativo com o qual mais similar. O mtodo
de particionamento ento realizado com base no princpio de minimizao da soma
das diferenas das distncias entre cada objeto e seus pontos de referncia
correspondentes.
Um problema na utilizao dos mtodos acima descritos recai na necessidade
de prvia de informar ao algoritmo a quantidade de clusters que se deseja. J o
mtodo TwoStep (Theodoridis e Koutroumbas 2009) produz uma anlise escalonvel,
apropriado para grandes conjuntos de dados e que possuam uma mistura de variveis
contnuas e categricas. Seu funcionamento, como o nome j indica, baseado em
dois passos. No primeiro passo, o algoritmo forma os pr-clusters, que so clusters
dos casos originais, usados no local dos dados brutos objetivando ter um menor
nmero de casos para a prxima etapa, reduzindo o tamanho da matriz que contm
distncias entre todos os casos pareados possveis. Isso porque usada uma
abordagem de agrupamento sequencial. O algoritmo faz uma varredura dos registros
um a um e decide se o registro atual deve fundir-se com os clusters formados
anteriormente ou iniciar um novo cluster com base no critrio da distncia (SPSS
2001).
Aps a finalizao da pr-clusterizao, todos os casos em um mesmo prcluster so tratados como uma nica entidade, com uma tcnica baseada em
hierarquizao. As suas caractersticas so utilizadas como novos casos. O tamanho
da matriz de distncias no mais dependente do nmero de casos, mas do nmero
de pr-clusters (Bacher et al. 2004). Duas medidas de distncia esto disponveis:
euclidiana e log-verossimilhana. A log-verossimilhana pode lidar com tipos mistos de
atributos, que a vantagem deste algoritmo. A medio da disperso das variveis
categricas feita por uma entropia. Igualmente ao que acontece na clusterizao
hierrquica, os clusters com as menores distncias so unidos em cada passo (Bacher
et al. 2004). A vantagem do mtodo TwoStep para clusterizao de dados que no
188
Pesquisas Realizadas
Este estudo tem como cenrio o Projeto Epidoso (Ramos 1993), um estudo
longitudinal iniciado em 1991 e conduzido na UNIFESP como projeto temtico com
foco em idosos residentes na rea da Vila Clementino em So Paulo visando
identificar qualidade de vida, perdas funcionais, condies de sade fsica sob a ptica
da cardiologia, sade mental e sade bucal. O projeto original considerou quatro
perodos, denominados ondas, de entrevistas com questionrios estruturados para
coletar informaes demogrficas e clnicas. A primeira onda iniciou-se em 1991 e
contou com informaes sobre 1.667 idosos, e foram armazenadas em um programa
computacional prprio. Esta foi a onda utilizada para nosso estudo.
Este estudo foi conduzido por meio de um projeto de mestrado, de Frederico
Molina Corhs, junto ao Programa de Ps-graduao em Sade Coletiva, UNIFESP,
189
com colaborao do Prof. Dr. Luiz Roberto Ramos, pesquisador responsvel pelo
projeto Epidoso. O trabalho aqui relatado considerou a organizao dos dados do
Projeto Epidoso para facilitar o acesso geogrfico aos dados coletados e identificar
uma viso conjunta, integrada, considerando o sujeito, o idoso, com suas
caractersticas socioeconmicas, de agravos, e vulnerabilidades, colaborando ainda
com a integrao dos pesquisadores de diferentes especialidades e pontos
geogrficos. Desta forma, optamos pela criao de um portal web que possibilitasse
uma gesto integralizada dos dados (Cohrs 2011).
Para o gerenciamento desses dados coletados ao longo de 15 anos foi
construda uma infoestrutura provendo uma estrutura de apoio tecnolgico para o
projeto; software necessrio para acessar, manipular, organizar e analisar as
informaes; apoio na governana, gesto e uso da informao e treinamento de
pessoas e organizaes envolvidas na criao da informao. Neste trabalho a
questo norteadora para a anlise dos dados foi considerar grupos de idosos com
caractersticas socioeconmicas e agravos ou vulnerabilidades semelhantes, a partir
de tcnicas de clusterizao, para apoiar a criao de aes educativas e preventivas
com maior e melhor foco.
Foram analisados 41 arquivos nos formatos SAV, DBF, XLS e MDB com dados
redundantes. Um arquivo-base (epidoso.sav) contendo todos os dados unificados de
todas as ondas, com 929 variveis e 1.666 registros, tambm foi analisado. Para
compreender o contedo das variveis foi construdo um dicionrio de dados com
nome, significado e tipo (categrico ou numrico) de cada varivel e onda a qual
estava vinculada, para posterior normalizao. Os dados de mortalidade foram
importados para a base.
A abordagem escolhida foi pela clusterizao do tipo particionamento por meio
do algoritmo TwoStep. O mtodo TwoStep (Theodoridis e Koutroumbas 2009)
possibilita uma anlise escalonvel apropriada para grandes conjuntos de dados que
apresentem uma mistura de variveis contnuas e categricas. Seu funcionamento
baseado em dois passos: no primeiro passo, o algoritmo forma os pr-clusters, que
so clusters dos casos originais, substituindo-os com objetivo de se ter um menor
nmero de casos para a prxima etapa, reduzindo o tamanho da matriz que contm
distncias entre todos os casos pareados possveis. Essa estratgia representa uma
abordagem de agrupamento sequencial. O algoritmo faz uma varredura dos registros
um a um e decide se o registro atual deve fundir-se com os clusters formados
anteriormente ou iniciar um novo cluster com base no critrio da distncia (SPSS
2001). Aps a finalizao da pr-clusterizao todos os casos em um mesmo prcluster so tratados como uma nica entidade com uma tcnica baseada em
190
caractersticas
socioeconmicas,
de
agravos
vulnerabilidades
191
192
habitao possibilita que outras pessoas contribuam para que o idoso tenha uma
maior aderncia aos tratamentos.
193
194
mental; 42% relataram que possuem varizes e isso interfere nas atividades dirias;
19% referiam ter incontinncia urinria com interferncia no dia-a-dia; 59% referem
que os problemas na compra de remdios esto relacionados com o custo; 51%
apresentavam problemas na coluna; 29% relataram ter priso de ventre; 40%
relataram ter reumatismo; 72% no realizavam caminhadas; 26% relataram ter
hipertenso arterial; 36% relataram ter insnia, e todas as doenas relatadas acima
interferiam nas atividades dirias; 54% apresentavam dificuldade de conversar. Uma
viso facilitada do grupo 1 v-lo como um conjunto de mulheres que caminhavam
dentro e fora de casa, com alguma dificuldade, com razovel dependncia para
realizao de atividades dirias e um considervel nmero de comorbidades, cujas
doenas relatadas interferiam nas atividades dirias. Em poucas palavras: mulheres
com alguma dependncia fsica, algum comprometimento cognitivo, com doenas
interferindo nas atividades dirias.
J os indivduos presentes no grupo 2 eram predominantemente vivos
(74,8%), cuidados predominantemente pela filha (58,3%) ou parentes (24,8%) quando
estavam internados; sem interesse em manter contato sexual (97,4%); sem relato de
prticas sexuais (99,5%); a minoria (30,7%) morando s; do sexo feminino (91%); a
maioria (72,7%) vivendo com a aposentadoria ou penso, sem um trabalho
remunerado; um baixo grau (2,9) de dependncia; 64,2% no realizavam atividades
manuais; caminhavam em casa e sem dificuldade (99,5%); 56,4% no se
aposentaram; caminhavam fora de casa e sem qualquer dificuldade (85,8%); 55,9%
no possuam varizes; 89,4% no apresentaram casos de sade mental; 80,7%
possuam filhos, e 80,4% no relataram nenhum problema de movimentao. De
forma
sinttica,
grupo
composto
por
mulheres,
vivas,
cuidadas
195
sexual pelo menos uma vez por ms; 66% so do sexo masculino; possuem uma
mdia de 2,5 (d.p. 1,7) doenas; 55% vivem s com os recursos da aposentadoria;
atingiram uma pontuao mdia de 26,4 (d.p. 3,1) no exame de estado mental; 54%
aposentaram por tempo de servio; 99% caminham fora de casa sem dificuldade ou
com alguma dificuldade; 99% conviviam com pelo menos mais uma gerao;
apresentam idade mdia de 72,6 (d.p. 5,4) anos; 81% possuam casa prpria; 43%
tinham o ensino mdio ou superior; 71% relataram realizar caminhadas. Em sntese,
so indivduos fisicamente independentes, casados, com interesse em manter prtica
sexual, sendo cuidados pelo cnjuge quando internados, predominando o sexo
masculino, com baixo nmero de comorbidades, vivendo apenas com o dinheiro da
aposentadoria, apresentando uma boa capacidade cognitiva, caminhando bem fora de
casa, convivendo com geraes em casa prpria, relatando ainda terem cursado o
ensino mdio ou j o superior. Este grupo formado, assim, por homens fisicamente
independentes, com boa capacidade cognitiva, aposentados, convivendo com
geraes em casa prpria.
Comunicao em Sade sob Medida
Considerando que uma comunicao em sade eficaz busca primordialmente
identificar o pblico-alvo (Kotler et al. 2010), o uso da clusterizao para identificao
segmentos auxilia no planejamento otimizado da comunicao com direcionamento
para cada segmento, ou selecionar um dos segmentos para uma comunicao ainda
mais direta.
Por fim, no cenrio do projeto Epidoso, uma anlise de cluster mostrou-se
interessante para identificar grupo de pessoas com caractersticas socioeconmicas e
agravos ou vulnerabilidades comuns, o que conduz a uma concepo mais eficaz de
promoo da sade. Cada cluster identificado possui carctersticas prprias e
composto por grupos distintos de indivduos, que trazem a possibilidade de uma nova
viso para os dados de um estudo longitudinal. Mais do que uma viso
epidemiolgica, uma viso estatstica com criao de segmentos pde ser construda,
mostrando que h vrias facetas para se compreender problemas, e tambm h vrias
formas para a resoluo de um mesmo problema (Cohrs et al. 2013). O mtodo
TwoStep apresentou-se como uma opo aceitvel para a identificao de grupos com
caractersticas semelhantes, uma vez que no necessrio informar a quantidade
tima de grupos.
196
um sistema informatizado
sobre a
197
do Departamento de
Cincias
198
199
200
(DRS XIII), no ano de 1997; e uma amostra nacional de hospitalizaes dos EUA
referentes ao mesmo ano. Foi utilizado o programa computacional denominado
Grouper, na verso 14.1, para a classificao denominada All Patient Diagnosis
Related Groups (AP-DRG), contendo 641 grupos. A autora concluiu que possvel
classificar as informaes da base de dados de Ribeiro Preto em DRGs, embora com
algumas limitaes: mapeamento para ICD-9-CM/Procedures; (b) sem peso ao nascer
do neonato e diagnstico, a classificao deste fica prejudicada; (c) a disponibilidade
de somente um campo para o registro de diagnsticos secundrios e um para os
procedimentos, na poca, resultou na reduo do nmero de pacientes classificados
em DRGs que indiquem maior complexidade. Por fim, pelas anlises realizadas pela
autora possvel notar que diferenas no tempo mdio de permanncia entre Ribeiro
Preto e os Estados Unidos podem estar sendo influenciadas pelas diferenas na
gerncia desses pacientes, na disponibilidade de tecnologias, nas caractersticas dos
hospitais, nas prticas mdicas, na eficincia na prestao dos servios, e na forma de
financiamento das hospitalizaes (Silver et al. 1992).
Outro trabalho de destaque foi fruto de uma dissertao de mestrado (Zanetta
2003) pela qual testou o uso de DRGs para verificar limites e potencialidades desse
sistema de classificao como instrumento de mensurao do produto hospitalar no
Instituto Central do Hospital das Clnicas da Faculdade de Medicina da Universidade
de So Paulo (ICHC-FMUSP). Foram usadas duas bases de dados: uma referente s
sadas hospitalares (morbidade) e a outra, referente s informaes sobre as AIHs
enviadas para cobrana ao SUS. O software utilizado neste trabalho foi o International
Refined DRG Software (IR-DRGs), na verso 1.1a, ICD-10 Diagnoses/ICD-9-CM
Procedures, contendo 992 grupos DRGs. Cada base de dados foi classificada pelo IRDRG resultando em 26 grandes categorias diagnsticas (GCD) e 672 grupos DRGs
para a base de morbidade contra 24 GCDs e 558 DRGs para a base das AIHs. Isto
porque ao utilizar apenas um diagnstico secundrio e um nmero limitado de quatro
procedimentos, o banco de AIH perdeu em capacidade de discriminao de suas
internaes dentre os 992 grupos DRGs possveis. Ainda, um nmero maior de
procedimentos discriminados no banco de morbidade-pareado permitiu qualificar mais
sadas como cirrgicas em relao ao banco das AIHs.
Devido a esses resultados, possvel a observao de que os bancos de
dados de AIH no mostram adequadamente a complexidade das internaes
realizadas e perdem em capacidade de discriminao para informaes de outros
sistemas existentes nos hospitais, quando utilizados para anlises que avaliem o perfil
de morbidade atendida, complexidade e utilizao de recursos hospitalares.
201
Pesquisas Realizadas
Conduzimos um estudo cujo objetivo foi testar a classificao DRG em um perodo
mais longo que o geralmente encontrado na literatura, de 9 anos (1998-2006), a fim de
verificar como esta classificao se comporta ano a ano e se ela se modifica no
decorrer dos anos e se sim, quanto que essa mudana. A base de dados da regio
de Ribeiro Preto foi utilizada. Abrange hospitalizaes tanto pblicas quanto privadas
e so melhores do que as informaes das AIHs, que alm de serem utilizadas para
fins de financiamento, representam somente as hospitalizaes dos hospitais
financiados pelo SUS, no abrangendo todo o sistema de prestao de servios
hospitalares.
Esta pesquisa foi conduzida por meio de um projeto de mestrado, de Carla
Dalmati, junto ao Programa de Ps-graduao em Gesto e Informtica em Sade,
UNIFESP, com colaborao do Prof. Dr. Domingos Alves, do Centro de
Processamento de Dados Hospitaladas (CPDH) da Faculdade de Medicina de
Ribeiro Preto, USP.
A principal fonte de dados que alimenta o banco de dados do Centro de
Processamento de Dados Hospitalares da USP Ribeiro Preto a folha de alta
hospitalar. O Centro processa as altas hospitalares de 35 hospitais em um total de 26
municpios (Ribeiro Preto e regio). A base de dados utilizada contm 1.449.618
hospitalizaes do perodo 1998-2006. Essa ficha preenchida pelos mdicos dos
hospitais, que referem os diagnsticos principais e secundrios, os procedimentos
realizados, as complicaes e a condio de sada. Aps ser preenchida pelos
mdicos, a folha de alta hospitalar passa por um processamento, momento em que
revista qualitativa e quantitativamente e codificada, segundo os cdigos da
Classificao Estatstica Internacional de Doenas e Problemas Relacionados Sade
Dcima Reviso (CID-10) e da Classificao Brasileira das Ocupaes (CBO). Uma
segunda reviso realizada e ento essa folha de alta digitada. Aps a digitao
uma nova reviso realizada, para ento ser gravada e classificada em arquivos
(Passos et a. 2010). Representa um sistema de registro contnuo de informaes
referentes utilizao de leitos, com estatsticas hospitalares e caracterizao da
assistncia prestada. Os dados que so armazenados pelo Centro so: nmero do
hospital, enfermaria, especialidade, regio do paciente, sexo, idade, ocupao do
paciente, categoria de internao, procedncia, data de internao, data de sada,
diagnstico principal, diagnstico secundrios, data da operao, operao principal,
outra
operao,
reoperao,
acidente-envenenamento-violncia,
complicao
202
203
204
205
206
207
208
209
210
pacientes aceitam o uso do RES desde que as preocupaes com a segurana destas
informaes sejam endereadas (Chhanabhai e Holt 2007).
No Brasil, o Conselho Federal de Medicina (CFM) tambm est atento ao
tema, por meio de um convnio com a Sociedade Brasileira de Informtica em Sade
(SBIS). Em novembro de 2007 ocorreu a publicao da Resoluo 1821/07 no Dirio
Oficial, que aprova as normas tcnicas concernentes digitalizao e ao uso dos
sistemas informatizados para a guarda e manuseio de documentos dos pronturios
dos pacientes, autorizando a eliminao do papel e a troca de informao identificada
em sade. Com esta resoluo estabelece-se o amparo para o uso do registro de
sade em meio exclusivamente digital. A resoluo aprova o Manual de Certificao
para Sistemas de Registro Eletrnico em Sade (S-RES) e autoriza a eliminao do
pronturio do paciente em papel, tornando-o completamente digital, desde que os SRES para guarda e manuseio de pronturios de paciente atendam integralmente aos
requisitos do nvel de garantia de segurana 2 (NGS2) (CFM 2007). Mais
recentemente os conjuntos de requisitos foram atualizados para a verso 3.3, com
publicao realizada em 2009. Esta verso foi revista por especialistas e colocada em
discusso pblica em meados de 2013 com vistas a atualizao para a verso 4, a
qual ainda no foi publicada oficialmente.
Pesquisas Realizadas
211
RES. Neste cenrio que este trabalho se prope a identificar o grau de conformidade
dos hospitais com as normas e padres j publicados oficialmente sobre o tema da
gesto da segurana da informao digital em sade.
Este estudo foi conduzido por meio de um projeto de mestrado, de Heitor
Neves Gottberg, junto ao Programa de Ps-graduao em Sade Coletiva, UNIFESP,
sob orientao do pesquisador desta tese. Contamos com a colaborao da Dra.
Beatriz de Faria Leo, especialista em normas e requisitos em S-RES, participante
ativa junto ao CEE-78 Informtica em Sade, da ABNT. Posteriormente iniciamos uma
nova fase de investigao tambm por meio de um projeto de mestrado de Marcelo
Carvalho, junto ao Programa de Ps-graduao em Gesto e Informtica em Sade,
UNIFESP, com colaborao da Profa. Dra. Cristina Lucia Feij Ortolani e Prof. Dr.
Eduardo Marques, especialista em normas e requisitos em S-RES. O objetivo desta
segunda abordagem, em curso, considera desenvolver um modelo comparativo
(objeto referncia) propiciando uma avaliao de maturidade holstica de um S-RES
com base em normas e melhores prticas existentes atualmente. Pelo modelo
pretendemos identificar a condio (posio em que se encontra) do sistema avaliado
dentro de uma sistema validado dentro de uma escala evolutiva crescente por meio de
suas caractersticas.
Para o desenvolvimento de um padro de comparao referente ao tema de
gesto da segurana da informao fizemos uso de uma srie de normas e padres,
nacionais e internacionais, incluindo:
212
Data Protection Act, que a lei inglesa de 1998 que trata da regulamentao
do processamento de informaes relacionada aos indivduos, incluindo a
aquisio, armazenamento, uso e divulgao destes dados (UK-OPSI 1998);
corporativa
de
segurana da
informao
50,0%,
(2)
contratos
de
213
(5) acesso a informaes por funcionrios desligados 31,8%, (6) equipamentos usados
fora do hospital e acesso remoto 54,5%, (7) procedimentos de backup de dados
63,6%, (8) segurana de correios eletrnicos 34,1%, (9) garantia de data/hora dos
registros 38,6%, (10) liberao de acesso a informaes 34,1%, (11) procedimentos
em caso de falhas de segurana da informao 13,6%, (12) plano de continuidade das
operaes em caso de falhas 27,3%, e (13) garantia da proteo aos dados e
informaes pessoais 40,9%. Nas 12 questes sobre S-RES a conformidade mdia
foi: (14) NGS1 controle de verso do software 64,3%, (15) NGS1 identificao e
autenticao de usurio 48,6%, (16) NGS1 controle de durao da sesso de usurio
57,1%, (17) NGS1 autorizao e controle de acesso 18,9%, (18) NGS1 Gerao e
recuperao de cpia de segurana pelo S-RES 57,1%, (19) NGS1 excluso ou
alterao de dados existentes no S-RES 64,3%, (20) NGS1 funcionalidades de
auditoria 67,9%, (21) NGS1 documentao do S-RES 14,3%, (22) NGS1
representao de instante de tempo no S-RES 50,0%, (23) NGS2 uso do certificado
digital no S-RES 14,3%, (24) NGS2 uso de assinatura digital no S-RES 3,6%, e (25)
NGS2 uso de certificado digital para autenticao de usurio 7,1%. Estes valores
esto apresentados na Figura 20.
(a) processos
(b) S-RES
214
conformidade do mesmo, uma vez que houve hospitais que j usavam sistemas h
mais tempo com graus mdios de conformidade menores que outros que iniciaram o
uso mais recentemente. Destacamos que na parte de processos de gesto
encontramos mdias mais altas nos hospitais com uma ou mais acreditaes. A mdia
geral de conformidade em processos ficou em 37% (em uma escala de 0%-100%)
enquanto, se usarmos apenas hospitais com pelo menos uma acreditao, a mdia
sobre para 41%. Alm disso, notamos que somente hospitais acreditados conseguiram
mdias acima de 50%, que equivalem conformidade com a ISO 27001. Ambos os
dados nos pareceram razoveis, uma vez que o processo de acreditao exige uma
melhor gesto dos processos. Encontramos, porm, extremos de conformidade em
processos. Temos hospitais com 65% de conformidade e outros com 10%. Isto nos
chamou a ateno para o fato de que se encontramos uma excelncia comparativa
neste tema por parte de uns, temos outros hospitais que do ateno mnima ao tema.
Quanto aos S-RES, a mdia de conformidade ficou em 38%. Foi possvel
identificar que a maioria (86%) dos respondentes com sistema possua pelo menos
uma acreditao, mas que a acreditao no garantia que o S-RES tinha uma alta
conformidade, visto que o maior grau foi encontrado em um hospital no acreditado.
Isto tambm nos pareceu coerente, porque a conformidade do S-RES depende mais
do sistema adquirido ou desenvolvido atender lista de requisitos propostos do que
dos processos de gesto que so verificados nos processos de acreditao.
Chama a ateno que os procedimentos para backup de dados sejam o item
de maior conformidade, denotando a percepo da sua relevncia no atendimento aos
pacientes no caso de queda de um sistema ou da rede de comunicaes. Vemos
neste item que nenhum hospital se mostrou 0% conforme. Ao mesmo tempo, a gesto
do hospital parece no se importar com a informao do grau de confidencialidade dos
documentos, i.e, informar em cada documento se este de caracterstica confidencial,
restrita, semirrestrita ou pblica, uma vez que na questo 7 tivemos a menor mdia e
nenhum hospital com 100% de aderncia. Com relao ao S-RES, o item de maior
conformidade referiu-se s funcionalidades de auditoria. De fato, se o sistema no
seguro o suficiente, tais ferramentas so fundamentais para identificar quem acessou
quais dados e em que instante, de forma a permitir o rastreamento das atividades em
caso de falhas. Os itens de menor conformidade referem-se ao uso de assinatura
digital e de uso de certificado digital para autenticao (i.e., acesso do usurio) ao
sistema. Dois temas esto ligados ao uso de certificado digital e/ou assinatura digital
pelos profissionais de sade, diretamente ligados ateno ao paciente, algo ainda
distante do dia-a-dia hospitalar. Porm, este o requisito para a eliminao completa
do pronturio em papel, segundo a resoluo do CFM (NGS2).
215
ainda
no
haviam
alterado
seus
processos
para
atender
216
217
218
219
220
mapeamento das teorias para identificar temas relevantes. A fase 3 desenvolveu uma
matriz de temas de avaliao e estgios de programas. Como resultados os autores
apresentam uma estrutura que identifica e define diferentes estgios de programas de
telessade e, em seguida, aplicam teorias de avaliao para cada uma destas etapas
para o desenvolvimento. Esta estrutura baseia-se em teorias existentes de sade e
avaliao da tecnologia, e apresenta um quadro conceitual para desenvolvimento de
uma ferramenta de avaliao para examinar e medir diferentes fatores que
desempenham um papel definitivo para o sucesso dos programas de telessade. A
estrutura possui um eixo horizontal que se divide em diferentes fases de execuo do
programa, enquanto o eixo vertical identifica diferentes temas e reas de estudo para
avaliao de programas. Esta estrutura proposta ajuda a entender vrios aspectos de
programas e-Sade e seu impacto requer avaliao em diferentes estgios do ciclo de
vida.
O segundo trabalho analisa sete redes de telessade de longa durao
(Wootton et al. 2012). As redes prestam servios humanitrios (clnica e educacional)
em pases em desenvolvimento e esto em operao por perodos de 5 a 15 anos. O
nmero de peritos que serve cada rede variou de 15 a 513. A menor rede tinha um
total de 10 solicitantes e um dos maiores tinha mais de 500 solicitantes. As redes
operam em quase 60 pases. As sete redes analisadas atenderam um total de 1.857
casos em 2011, ou seja, uma mdia de 265 casos por ano por rede. As sete redes
tinham publicado um total de 44 artigos listados no Medline, que apontam evidncias
decorrentes da prestao de servios por telessade. Havia uma escassez de
informao sobre clnica e relao custo-eficcia. No entanto, os servios foram muito
apreciados por mdicos de referncia, considerados clinicamente teis, e h indcios
de que os resultados clnicos para os pacientes se apresentam melhores que os
modelos tradicionais.
Telessade no Brasil
No cenrio nacional, a tese de Rosangela Gundim (2009) avalia o desenvolvimento e
aplicao de um instrumento de gesto dos fatores indicadores de sustentabilidade de
centros de telemedicina e telessade com base nas entrevistas de avaliao
conduzidas em 10 centros de telessade. No estudo evidenciou-se a necessidade de
acompanhamento da sustentabilidade no s do ponto de vista financeiro, mas da
adoo de uma viso mais holstica e integrada da gesto do centro, incluindo
aspectos institucional, relacional, funcional, econmico-financeira, renovao, tcnicocientfica e bem-estar social. Alm da apresentao desse modelo, o estudo
221
(Haddad
2012)
(telessaudebrasil.org.br)
Rede
Universitria
de
Latino-Americana de
Redes
Avanadas),
as
instituies
222
ps-graduao
atualizao
profissional
permanente
por
videoconferncia e webconferncia);
pesquisa
(multicntrica,
cooperao
por
videoconferncias,
trabalho
Destas,
existem unidades
com
salas
homologadas
pela
223
Pesquisas Realizadas
Nosso interesse nesse tema esteve focado a realizar um estudo orientado ao projeto
da Rede Universitria de Telemedicina (RUTE) (rute.rnp.br). O objetivo geral foi
investigar a insero do projeto da RUTE nos hospitais universitrios em relao s
premissas previstas no projeto original, visando explicitar sua contribuio no
desenvolvimento de uma nova prtica de sade digital. Mais especificamente,
estvamos interessados em mensurar as transformaes relacionadas ao projeto na
educao em sade, nas prticas assistenciais colaborativas remotas, na pesquisa
multicntrica e na pesquisa, desenvolvimento e inovao da prpria telemedicina nos
hospitais universitrios. Ainda, em identificar contribuies da RUTE na percepo dos
coordenadores das unidades. Por fim, nossa expectativa foi apresentar um diagnstico
geral do estado da RUTE a partir destes eixos e planejar a construo de um
instrumento eletrnico, permanente, de apoio avaliao da RUTE.
Estes estudos foram conduzidos por meio de uma tese de doutorado, de Paulo
Roberto de Lima Lopes, junto ao Programa de Ps-graduao em Gesto e
Informtica em Sade, com orientao do Prof. Dr. Daniel Sigulem e coorientao
deste pesquisador, em parceria oficial com a coordenao RUTE, na pessoa do Dr.
Luiz Ary Messina. Tambm contou com a colaborao de Thiago Lima Verde, que
neste momento est planejando uma continuidade do estudo, por meio de um
mestrado, para construo de um instrumento eletrnico de avaliao.
Cinco Eixos de Anlise
Foi realizada uma pesquisa quali-quantitativa exploratria, transversal, considerando
as 72 unidades RUTE em operao com anlise documental a partir dos dados das
unidades da RUTE e sobre a mudana da prtica de sade auto-relatada, com 146
respondentes. Utilizamos um censo com o intuito de obter informaes de todas as
unidades da RUTE, em operao, por meio da coleta de dados de percepo das
pessoas responsveis pelas unidades.
224
telemonitorizao,
teleconsultoria,
segunda
opinio
formativa,
de
colaborao
audiovisual
(videoconferncia,
webconferncia
ou
225
para
regies
remotas,
por
meio
de
telemonitoramentos,
por
videoconferncia
ou
webconferncia
com
reduo
dos
226
227
sempre as aes propostas pelo projeto RUTE e tem sido demandadas por outros
problemas e projetos de telessade, com desdobramentos que tem transformando a
instituio e a sociedade.
Figura 22 - Grfico radar das respostas por eixo para o questionrio completo (Lopes
2013).
228
229
maturidade, com estgios hierrquicos, no qual cada estgio do modelo definido por
uma situao de entrada e melhores prticas para obter um nvel mais elevado na
situao de sada do estgio. Este modelo de maturidade poderia se constituir em um
guia de orientao para as unidades da RUTE, desde os novos at aqueles que j
esto operacionais. De forma agilizar e ordenar a expanso da RUTE.
Dentro do grupo de pesquisa estes aspectos esto sendo debatidos como
potenciais prximos passos, em especial uma ordenao (rank) e modelo de
maturidade. Ainda, pretendemos considerar a incluso de uma triangulao
envolvendo anlise de agrupamentos das unidades RUTE baseada na classificao
em grupos, anlise da rede colaborativa dos grupos de interesse especial (SIGs)
baseada em anlise de rede social, e por fim, anlise da opinio dos usurios da
RUTE baseada em critrios de satisfao.
A gesto em sade pode ser definida como uma rea que compreende atividades de
formao, implementao e avaliao de polticas, instituies, programas, projetos e
servios de sade, bem como a conduo, gesto e planejamento de sistemas e
servios de sade (termo DeCS goo.gl/gHaLbl). Nossos estudos nesta rea
consideraram o uso da informtica na perspectiva do gestor e suas necessidades de
informao.
Como um dos subsdios de pesquias consideramos a utilizao de tcnicas de
descoberta de conhecimento de minerao de dados para tentar extrair padro de
dados que pudessem colaborar, assim, com essa perspectiva. Realizamos um estudo
para organizar e analisar os dados do projeto Epidoso, que acompanhou idosos do
bairro de Vila Mariana, So Paulo, buscando facilitar o acesso aos dados coletados ao
longo de 15 anos e identificar uma viso conjunta, integrada, considerando o sujeito, o
idoso, com suas caractersticas socioeconmicas, de agravos, e vulnerabilidades.
Nossa inteno foi colaborar com a integrao dos pesquisadores de diferentes
especialidades e pontos geogrficos que atuavam no projeto Epidoso. A partir da
construo de uma infoestrutura (Cohrs 2011) foi possvel oferecer um sistema web de
gerenciamento e visualizao dos dados do projeto, anteriormente distribudos em
diferentes formatos de arquivo e verses. Realizamos tambm uma investigao sobre
padres existentes nos dados completos, longitudinais, envolvendo 929 variveis
sobre 1.666 indivduos. A clusterizao proposta auxiliou na descrio de 3 perfis de
230
idosos, com descrio socioeconmica e de sade diferenciados. Para cada grupo foi
possvel identificar quais variveis coletadas apresentavam maior significncia
estatstica e podem auxiliar no direcionamento de programas de comunicao em
sade, ou mesmo na mudana de processo de atendimento de sade desses idosos.
A inovao neste estudo foi aplicar uma tcnica de anlise de agrupamentos, clssica,
para um problema que ainda no tinha sido investigado sob essa tica, com a incluso
de todas as variveis coletadas ao longo dos anos. Comunicao em sade pode ser
realizada de maneira especfica para os diferentes perfis detectados para aumentar
sua efetividade.
Outro estudo que realizamos teve motivao no modelo de identificao de
grupos homogneos de pacientes (diagnosis related groups DRGs) usado no clculo
de indicadores de sade pela Agency for Healthcare and Research Quality (ahrq.gov)
nos EUA. H interesse por parte do Ministrio da Sade e pela ANVISA para adoo
de maneira ampla de caractersticas deste modelo de clculo de indicadores aqui no
Brasil. Procedemos uma anlise de dados de alta de internao hospitalar da regio
de Ribeiro Preto, em parceria com o Centro de Processamento de Dados
Hospitalares (CPDH) da USP. Um estudo anterior (Noronha 2001) considerou um
intervalo menor de tempo, como perodo de anlise de 1 ano. Nosso interesse estava
em investigar como uma anlise de homogeneidade se comportaria ao consideramos
um perodo mais longo de tempo, por alguns anos. Havia uma expectativa, que no se
concretizou, de que seria necessrio propor um modelo de grupos homogneos
especfico para a realidade brasileira, e que um portal web com um sistema anlise
poderia auxiliar um gestor na tomada de deciso sobre o gerenciamento do sistema de
sade. As anlises realizadas possibilitaram avaliar 9 anos (1998-2006) como perodo,
com quase 1,5 milho de internaes hospitalares realizadas em 35 hospitais de 26
municpios da regio. O modelo de grupos International Refined Diagnosis Related
Groups (IR-DRG) foi utilizado com sucesso na anlise, o que nos levou a
desconsiderar a construo de um modelo brasileiro. Os resultados possibilitaram
discutir e compreender o macrocomportamento das internaes em funo dos grupos
IR-DRGs, a qualidade do preenchimento do dado dessas internaes e apontar
variaes sobre o tempo de internao em funo de grandes categorias diagnsticas
(Dalmati 2012). Os prximos passos destas pesquisa incluem construir uma viso
simplificada e georreferenciada dos resultados que facilite a anlise e tomada de
deciso por parte do gestor.
Com o foco no gestor da tecnologia de informao e comunicao de hospitais
e clnicas, realizamos um estudo sobre a conformidade de sistemas de informao de
estabelecimentos de sade a normas e recomendaes de gesto da segurana da
231
232
5.6. Referncias
RL.,
Mandil
SH,
Shannon
GW.
Introduction:
state-of-the-art
233
Carvalho Junior MA, Lopes PRL, Corhs FM, Pisa IT. Health Informatics System
requirements dependency analysis as audit facilitator. Int. Res. J. Comput.
Sci. Inform. Syst. 2013 Jul;2(5):73-85.
Castellani B, Castellani J. Data mining: Qualitative analysis with health informatics
data. Qualitative Health Research. 2003;13(7):1005-18.
CFM Conselho Federal de Medicina (CFM). Resoluo n 1.246/88, 1988.
CFM Conselho Federal de Medicina. Resoluo CFM n 1.821/2007. Disponvel em:
Chhanabhai P, Holt A. Consumers are ready to accept the transition to online and
electronic records if they can be assured of the security measures. Medscape
General Medicine. 2007.
Cohrs FM, Sousa FS, Tenrio JM, Ramos LR, Pisa IT. Aplicao de Anlise de Cluster
em dados integrados de um estudo prospectivo: projeto epidoso como
cenrio. Journal of Health Informatics [Internet]. 2013 Mar 29 [citado em 25
Out
2013];5(1).
Disponvel
em:
http://www.jhi-sbis.saude.ws/ojs-
jhi/index.php/jhi-sbis/article/view/231
Cohrs FM. Portal Web para gesto de dados de estudo de coorte com posterior
anlise de cluster: o Projeto Epidoso como cenrio. So Paulo. Dissertao
[Mestrado em Sade Coletiva] - UNIFESP; 2011.
Dalmati CF. Aplicao do mtodo de grupos de diagnsticos homogneos (DRGs)
para classificao das internaes hospitalares de pacientes da regio de
Ribeiro Preto. So Paulo. Dissertao [Mestrado em Gesto e Informtica
em Sade] - UNIFESP; 18 de maio de 2012.
Dimitropoulos L. Privacy and security solutions for interoperable health information
exchange. USA Office of Policy and Research. 2007.
Fetter RB, Brand DA, Gamache D et. al. The DRG patient classification system background. In: DRGs: Their Design and Development. Ann Arbor (Michigan):
Health Administration Press; 1991. p. 3-27.
Fetter RB, Freeman JL, Averill RF, Thompson JD. Case-mix definition by diagnosis
related groups. Med Care 1980; 18 (Suppl.): 1-53.
Fonseca JS, Martins GA. Curso de estatstica. 6 Edio. So Paulo: Atlas, 1996,
320p.
Fountain JE. Digital government and public health. Centers for Disease Control and
Prevention, 2004.
Gelbard R, Goldman O, Spiegler I. Investigating diversity of clustering methods: an
empirical comparison. Data Knowl Eng. 2007;6(3):155-66.
234
2012.
[acesso
em
2013
Fev
05].
Disponvel
em:
http://www.telessaude.uerj.br/resource/goldbook/pdf/2.pdf.
Halling A, Fridh G, Ovhed I. Validating the john hopkins ACG case-mix system of the
elderly. In: Swedish primary health care. BMC Public Health 2006, 6:171.
Han J, Kamber M. Cluster analysis. In: Elsevier, editor. Data mining: concepts and
techniques. 2 ed. So Francisco: Morgan Kaufmann; 2006. p. 770.
Healy JC. The WHO eHealth resolution - eHealth for all by 2015? Methods Inf Med.
[Internet] 2007 [cited 2013 Feb 5];46(1):2-4. PubMed PMID: 17224974.
Available from: http://www.schattauer.de/en/magazine/subject-areas/journalsa-z/methods/contents/archive/issue/670/manuscript/7685.html
http://www.portalmedico.org.br/resolucoes/cfm/2007/1821_2007.htm. 2007.
ISO-TC215 International Organization for Standartization Technical Committee 215
Health Informatics. ISO/IEC 27799:2008 - Health informatics - Information
security management in health using ISO/IEC 27002. 2008.
Khoja S, Durrani H, Scott R, Sajwani A, Piryani U. Conceptual framework for
development of comprehensive e-Health evaluation tool. Telemedicine and eHealth. 2013 January; 19(1): 48-53.
Kotler P, Keller KL. Identificao de segmentos de mercado e seleo de mercadosalvo. Administrao de Marketing. 12 ed. So Paulo: Pearson Prentice Hall;
2006. p. 236-65.
Kotler P, Shalowitz J, Stevens RJ. Planejamento e gerenciamento integrado de
comunicao de marketing. In: Marketing estratgico para a rea da sade.
So Paulo: Bookman; 2010. p. 395-448.
Kulikowski CA, Shortliffe EH, Currie LM, Elkin PL, Hunter LE, Johnson TR, Kalet IJ,
Lenert LA, Musen MA, Ozbolt JG, Smith JW, Tarczy-Hornoch PZ, Williamson
JJ. AMIA Board white paper: definition of biomedical informatics and
235
2012.
[acesso
em
2013
Fev
05].
Available
from:
http://www.telessaude.uerj.br/resource/goldbook
McGregor C, Percival J, Curry J, Foster D, Anstey E, Churchill D. A structured
approach to requirements gathering creation using PaJMa models, 2008.
Mullin RL. Development of DRGs. In: Proceedings of International Conference on
Management and Financing of Hospital Services. London: Health Systems
Management Group da School of Organization and Management/Henry J.
Kaiser Family Foundation; 1986. p. 15-8.
Myers J, Frieden T, Bherwani K, Henning K et. al. Privacy and public health at risk:
public health confidentiality in the digital age. American Journal of Public
Health Vol. 98, No. 5, 2008.
NCBI National Center of Biologic Information. [cited 2009 Nov 28]. Available from:
http://www.ncbi.nlm.nih.gov/sites/entrez.
Noronha MF. Classificao de hospitalizaes em Ribeiro Preto: os diagnosis related
groups. So Paulo, 2001. 200p. Tese (doutorado) Faculdade de Sade
Pblica da Universidade de So Paulo.
Passos ADC, Perdona G, Rocha JSY, Monteiro RA, Pereira Jr.GA, Licio JF, Franco LJ,
Scarpelini S et. al. Doenas e agravos no transmissveis. 1. ed. Ribeiro
Preto: Angelo Marcelo Fossa EPP, 2010. v. 1. 262 p.
236
Ramos LR, Rosa TEC, Oliveira ZM, Medina MCG, Santos FRG. Perfil do idoso em
rea metropolitana na regio sudeste do Brasil: resultados de inqurito
domiciliar. Rev. Sade Pblica. 1993;27(2):87-94.
Ravera L, Colombo I, Tedeschi M, Ravera A. Security and privacy at the private
multispecialty hospital instituto clinico humanitas: strategy and reality.
International Journal of Medical Informatics (2004) 73, 321324.
Roiger RJ, Geatz MW. Data mining: a tutorial-based primer. New York: Addison
Wesley; 2003.
Rosa IV. Festinger revisitado: sacrifcio e argumentao como fontes de conflito na
tomada de deciso. Anlise Psicolgica [serial on the Internet]. 2006; 24(2):
Available
from:
http://www.scielo.oces.mctes.pt/scielo.php?script=sci_arttext&pid=S087082312006000200004&lng=pt&nrm=iso.
Sigulem, D. Um novo paradigma de aprendizado na prtica mdica da UNIFESP/EPM.
So Paulo. Tese [livre-docncia] - Universidade Federal de So Paulo/Escola
Paulista de Medicina. 1997.
Silva AB, Hammerli I, Moraes S. O caso da Rede Universitria de Telemedicina:
anlise da entrada da telessade na agenda poltica brasileira. Physis Revista
de Sade Coletiva. 2012:1211-1235.
Silver LD, Travassos VC, Noronha MF, Martins MS, Leite IC. Estudo da validade dos
Diagnosis Related Groups (DRG) para internaes hospitalares no Brasil. Rio
de Janeiro: Escola Nacional de Sade Pblica, Fundao Oswaldo Cruz;
1992. (Relatrio final de pesquisa).
SPSS
I.
1122644952_The
application/pdf):
SPSS
SPSS
TwoStep
Inc.;
Cluster
2001.
Component.pdf
Available
(objeto
from:
http://www.spss.ch/upload/1122644952_The%20SPSS%20TwoStep%20Clust
er%20Component.pdf.
Teng Z, Liu Y, Ren F, Tsuchiya S, Ren F. Single document summarization based on
local topic identification and word frequency, 2008.
Theodoridis S, Koutroumbas K. Pattern recognition. 4 ed. USA: Elsevier; 2009.
UK-OPSI United Kingdom Office of Public Sector information, Data Protection Act
Chapter
29.
[Internet].
1988.
Available
from
http://www.opsi.gov.uk/acts/acts1998/ukpga_19980029_en_1.
US-DHHS United States Dept. of Health and Human Services. General overview of
standards for privacy of individually identifiable health information. [internet]
2003. Available from: http://www.hhs.gov/ocr/hipaa/guidelines/overview.pdf.
237
US-DHHS United States Dept. of Health and Human Services. HIPAA Administrative
Simplification
Regulation
Text.
[Internet]
2006.
Available
from:
http://www.hhs.gov/ocr/AdminSimpRegText.pdf.
Velmurugan T, Santhanam T. Computational complexity between k-means and kmedoids clustering algorithms for normal and uniform distributions of data
points. Journal of Computer Science. 2010:6(3):363-8.
Vogel L, Perreault L. Management of Information in Healthcare Organizations. In:
Shortliffe E, Cimino J, organizadores. Biomedical Informatics: Computer
Applications in Health Care and Biomedicine, 3rd ed. 2006, p. 476-510.
Wootton R, Geissbuhler A, Jethwani K, Kovarik C, Person DA, Vladzymyrskyy A, et al.
Comparative performance of seven long-running telemedicine networks
delivering humanitarian services. Journal of Telemedicine and Telecare
[Internet].
2012
Sep
1;
18(6):30511.
Available
from:
http://jtt.rsmjournals.com/content/18/6/305.abstract
Yazlle RJS, Simoes BJG. Estudo da assistncia hospitalar pblica e privada em bases
populacionais, 1986-1996. Rev. Sade Pblica. 1999 Feb;33(1):44-54.
Zanetta SFR. Morbidade no Hospital das Clnicas: identificao de perfis e
desenvolvimento de instrumento de monitoramento. So Paulo, 2003. 160p.
Dissertao (Mestrado) Faculdade de Medicina da Universidade de So
Paulo.
238
6.
CONSIDERAES FINAIS
Este documento teve como objetivo apresentar estudos realizados pelo autor
considerando a rea de descoberta de conhecimento e minerao de dados, dentro da
grande rea da informtica em sade. Foi elaborado com o objetivo de apresentar
resultados e discusses sobre pesquisas acadmicas realizadas pelo autor e seus
colaboradores para o Concurso de Livre Docncia 2013 da UNIFESP, junto ao
Departamento de Informtica em Sade (Disciplina de Informtica em Sade). A
atividade de pesquisa descrita neste documento se enquadra na rea de informtica
em sade e foi conduzida principalmente com a participao de ps-graduandos do
Programa de Ps-graduao em Gesto e Informtica em Sade (antes denominado
apenas Informtica em Sade) da UNIFESP, que integram o grupo de pesquisa Sade
360 (saude360.com.br) cadastrado no Diretrio de Grupos de Pesquisa CNPq.
Nossas pesquisas concentram-se na utilizao de preceitos, tcnicas,
procedimentos e modos de avaliao integrantes do currculo proposto da disciplina de
descoberta de conhecimento e minerao de dados (knowledge discovery and data
mining KDD), segundo o grupo especial de interesse SIGKDD da Association for
Computing Machinery (ACM acm.org) (Chakrabarti et al. 2006), para a rea da sade.
Os conceitos e aplicao de tcnicas de consulta em base de dados (database query),
busca por informao (information search) que inclui minerao de dados ,
descoberta de conhecimento (knowledge Discovery), gesto do conhecimento
(knowledge management) e inteligncia de negcios (business intelligence) esto
relacionados medida em que aumenta a dependncia dos domnios de
conhecimento envolvidos para sua organizao (Bendoly 2003).
Desenvolvemos experincia colaborativa em diferentes trabalhos e aplicaes
metodolgicas que podem ser descritas em 3 eixos, sendo (1) informtica para a
sade do consumidor, (2) sistemas de apoio a deciso em sade, e (3) informtica
para a gesto em sade. Estes 3 eixos representam 3 escalas de aplicao da viso
da informtica em sade, sendo (1) viso do consumidor, (2) viso do profissional de
sade, e (3) viso do gestor de sade. No entanto, outras vises da aplicao da
informtica em sade tambm permearam nossos estudos, como a viso do
pesquisador acadmico, do estudante, do editor e publicador (scientific publisher), do
professor em cincias da sade, do tcnico hospitalar, do engenheiro biomdico, do
enfermeiro, do gestor e a autoridade de sade, entre outros (Brittain e Norris 2000).
Os resultados de nossos estudos focados na prpria rea da informtica em
sade possibilitaram apresentar uma anlise epistemolgica da rea (Colepcolo
239
240
241
242
6.1. Referncias
Baptista RS, Quaglio CL, Mourad LMEH, Hummel AD, Caetano CAC, Ortolani CLF,
Pisa IT. A semi-automated method for bone age assessment using cervical
vertebral maturation. The Angle Orthodontist. 2012 Jul;82(4):658-62.
Bendoly E. Theory and support for process frameworks of knowledge Discovery and
data mining from ERP systems. Information & Management. 2003;40:639-647.
Brittain JM, Norris AC. Delivery of health informatics education and training. Health
Library Review. 2000;17(3):117-128.
Carvalho Junior MA, Lopes PRL, Corhs FM, Pisa IT. Health Informatics System
requirements dependency analysis as audit facilitator. Int. Res. J. Comput.
Sci. Inform. Syst. 2013 Jul;2(5):73-85.
Chakrabarti S, Ester M, Fayyad U, Gehrke J, Han J, Morishita S, Piatetsky-Shapiro G,
Wang W. Data Mining Curriculum: A Proposal (Version 1.0). Intensive
Working Group of ACM SIGKDD Curriculum Committee. 2006 Apr 30. [cited
2013 Oct 20] Available from: http://www.kdd.org/sites/default/files/CURMay06
.pdf
Cohrs FM, Sousa FS, Tenorio JM, Ramos LR, Pisa IT. Aplicao de anlise de cluster
em dados integrados de um estudo prospectivo: projeto epidoso como
cenrio. J. Health Inform. 2013 Jan;5(1):17-22.
Colepcolo E. Epistemologia da informtica em sade: entre a teoria e a prtica. So
Paulo. Dissertao [Mestrado em Informtica em Sade] - Universidade
Federal de So Paulo; 2008.
Costa TM, Barbosa BJ, Gomes e Costa DA, Sigulem D, de Ftima Marin H, Filho AC,
Pisa IT. Results of a randomized controlled trial to assess the effects of a
mobile SMS-based intervention on treatment adherence in HIV/AIDS-infected
Brazilian women and impressions and satisfaction with respect to incoming
messages. Int J Med Inform. 2012 Apr;81(4):257-69.
Costa TM, Salomo PL, Martha AS, Pisa IT, Sigulem D. The impact of short message
service text messages sent as appointment reminders to patients cell phones
at outpatient clinics in So Paulo, Brazil. Int. J. Med. Inform. 2010 79:65-70.
Dalmati CF. Aplicao do mtodo de grupos de diagnsticos homogneos (DRGs)
para classificao das internaes hospitalares de pacientes da regio de
Ribeiro Preto. So Paulo. Dissertao [Mestrado em Gesto e Informtica
em Sade] - UNIFESP; 18 de maio de 2012.
243
Falco AEJ, Mancini F, Costa TM, Hummel AD, Teixeira FO, Sigulem D, et al. InDeCS:
Mtodo Automatizado de Classificao de Pginas Web de Sade Usando
Minerao de Texto e Descritores em Cincias da Sade (DeCS). Journal of
Health Informatics 2009;1(1):1824
Falco AEJ, Mancini F, Teixeira FO, Sousa FS, Hummel AD, Sigulem D, Pisa IT.
Analysis of the Use of Social Media for Adequacy Evaluation of Health
Related Websites Based on Health on Net Code. In: MEDINFO 2010, 2010,
Cape Town. MEDINFO. Amsterdam : IOS Press, 2010. v. 2. p. 1405.
Fuks H, Raposo AB, Gerosa MA, Lucena CJP. O Modelo de Colaborao 3C e a
Engenharia de Groupware. Monografias em Computao. 2002;17(2).
Gottberg HN. Avaliao do grau de conformidade s normas e recomendaes em
gesto da segurana da informao digital em hospitais. So Paulo.
Dissertao [Mestrado em Sade Coletiva] - UNIFESP; 28 de julho de 2010.
Hummel AD, Maciel RF, Rodrigues RGS, Pisa IT. Application of artificial neural
networks in renaltransplantation: classification of nephrotoxicity and acute
cellular rejection episodes. Transplant. Proc. 2010 Mar;42(2):471-72.
Hummel AD, Maciel RF, Sousa FS, et al. Artificial intelligence techniques: predicting
necessity for biopsy in renal transplant recipients suspected of acute cellular
rejection or nephrotoxicity. Transplantation Proceedings, 2011 May; 43 (4):
1343-44.
Lopes PRL. Investigar a contribuio da Rede Universitria de Telemedicina no
desenvolvimento de uma nova prtica de sade digital. So Paulo. Tese
[Doutorado em Gesto e Informtica em Sade] - UNIFESP; 12 de novembro
de 2013.
Maciel RF, Hummel AD, Cohrs FM, Mancini F, Falco AEJ, Teixeira FO, Costa TM,
Sousa FS, Alves D, Miranda R, Pisa IT. Aplicao de Tcnicas de Inteligncia
Artificial
em
Transplantes
Renais:
Classificadores
Automticos
para
244
Prado CS, Tenrio JM, Ruiz EES, Ortolani CLF, Pisa IT. Impacto da utilizao de
mensagens do tipo SMS - Short Message Service. J. Health Inform. 2012
Out;4(4):159-64.
Reis AR. Aplicao de Tcnicas de Minerao de Textos para Categorizao de
Diagnsticos em Laudos de Bipsias Renais. So Paulo. Dissertao
[Mestrado em Cincias - Gesto e Informtica em Sade] - UNIFESP; 2013.
Santo CC, Bonome KS, Teixeira F, Araujo GD Pisa IT. Rede Social de Currculos
Lattes da Informtica em Sade Brasileira. In: XIII Congresso Brasileiro de
Informtica em Sade - CBIS2012; 2012 Nov 19-23; Curitiba, PR: 2012. p1-2.
Sousa FS. Anlise Comparativa de Mtodos de Recuperao de Informao para
Categorizao de Contedos Web Relacionados Sade. So Paulo.
Dissertao [Mestrado em Cincias - Gesto e Informtica em Sade] UNIFESP; 2011.
Teixeira FO. Classificao e Indexao de artigos cientficos Internacionais de
Informtica em Sade. So Paulo. Dissertao [Mestrado em Cincias Gesto e Informtica em Sade] - Universidade Federal de So Paulo; 2011.
Tenrio JM, Hummel AD, Cohrs FM, Sdepanian VL, Pisa IT, Heimar FM. Artificial
intelligence techniques applied to the development of a decision support
system for diagnosing celiac disease. Int. J. Med. Inform. 2011 80:793-802.
Wainer J, Campos CJR, Sigulem D, Lopes P, Salomo P. O que pesquisa em
informatica em sade. Revista de Informtica Terica e Aplicada. 2006;13:4256.