Anda di halaman 1dari 12

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Sistem Pakar Dengan Aplikasi 136 (2019) 230–241

Daftar isi tersedia diScienceDirect

Sistem Pakar Dengan Aplikasi


halaman utama jurnal:www.elsevier.com/locate/eswa

Prediksi penyakit kronis menggunakan data administrasi dan


teori grafik: Kasus diabetes tipe 2-
Arif Khan A,B,∗, Syahadat UddinA, Uma SrinivasanB,C
AFakultas Teknik & TI, Universitas Sydney, Sydney, NSW, Australia
BProgram Penelitian Kualitas Pasar Kesehatan, Capital Markets CRC, Level 2, 55 Harrington Street, Sydney, NSW, Australia
CCRC Kesehatan Digital, Level 3, 55 Harrington Street, Sydney, NSW, Australia

articleinfo abstrak

Riwayat artikel: Diagnosis klinis dan pemantauan rutin terhadap populasi yang berisiko terkena penyakit kronis membutuhkan
Diterima 17 Januari 2019 banyak sumber daya secara klinis dan finansial. Menambang data administrasi bisa menjadi cara alternatif yang
Direvisi 18 April 2019 Diterima
efektif untuk mengidentifikasi kelompok berisiko tinggi ini. Dalam penelitian ini, kami menerapkan teknik
28 Mei 2019 Tersedia online 8
penambangan data dan analisis jaringan pada data masuk dan keluar rumah sakit untuk memahami jejak penyakit
Juni 2019
atau komorbiditas pasien kronis. Berdasarkan pemahaman ini kami telah mengembangkan kerangka prediksi risiko
Kata kunci: penyakit kronis. Kerangka tersebut kemudian diuji pada konteks kesehatan Australia untuk memprediksi risiko
Prediksi penyakit diabetes tipe 2 (T2D). Dataset berisi sekitar 1,4 juta catatan penerimaan dari 0,75 juta pasien. Dari ini, kami memfilter
Rekam medis elektronik Sistem dan mengambil sampel catatan dari 2300 pasien yang memiliki penyakit penyerta termasuk T2D dan 2300 pasien
informasi medis Teori jaringan lainnya yang memiliki penyakit penyerta selain T2D. Seiring dengan faktor risiko demografis dan perilaku untuk
prediksi, kami mengusulkan beberapa teori grafik dan tindakan berbasis jejaring sosial yang menunjukkan
Teori prediksi
prevalensi komorbiditas, pola transisi, dan keanggotaan pengelompokan. Kami menggunakan pendekatan
Diabetes tipe 2
eksplorasi untuk memahami dampak relatif dari faktor risiko ini dan mengevaluasi kinerja prediksi menggunakan
tiga metode prediksi yang berbeda—regresi, optimalisasi parameter, dan klasifikasi pohon. Ketiga metode prediksi
memberikan peringkat tertinggi pada skor 'prevalensi komorbiditas' berbasis teori grafik dan skor 'pencocokan pola
transisi' yang menunjukkan keefektifan tindakan berbasis teori jaringan yang diusulkan. Keseluruhan, akurasi
prediksi antara 82% hingga 87% menunjukkan potensi framework memanfaatkan data administratif. Kerangka yang
diusulkan dapat berguna bagi pemerintah dan perusahaan asuransi kesehatan untuk mengidentifikasi kelompok
penyakit kronis berisiko tinggi. Mengembangkan strategi pencegahan kemudian, selama periode waktu tertentu,
dapat mengurangi beban rawat inap perawatan akut.
© 2019 Elsevier Ltd. Semua hak dilindungi undang-undang.

1. Perkenalan penerimaan, menambah beban meningkat pada sumber daya


kesehatan yang terbatas (Haris, 1993; Kapur, Sandblom, Hert, James, &
Penyakit dan kondisi kronis telah menjadi beban kesehatan dan ekonomi Sean, 1999; Lauruschkat et al., 2005; MacKenzie, Morris, & Edelstein,
bagi negara-negara di seluruh dunia (Yach, Hawkes, Gould, & Hofman, 2004 1989; Tenenbaum et al., 2000; Umpierrez et al., 2002). Jika pasien ini
). Tantangan utama untuk mencegah penyakit kronis adalah, dalam banyak dapat diidentifikasi lebih awal ketika mereka berada di batas kronis,
kasus, pasien tetap tidak menyadari perkembangan penyakit (Gregg et al., komplikasi lebih lanjut dapat dihindari. Namun, ada tantangan seperti
2004; Rathmann et al., 2003) sampai mereka dirawat di rumah sakit. kendala sumber daya ekonomi dan klinis untuk melakukan studi
Selanjutnya, ketika kondisi kronis ditemukan sebagai diagnosis sekunder ( intervensi dan pemantauan rutin terhadap populasi besar ini.
Taubert et al., 2003), mengakibatkan komplikasi lebih lanjut, lama tinggal
lebih lama selama di rumah sakit Alternatif potensial dapat menggunakan data administrasi yang
dikumpulkan secara rutin dan menerapkan teknik penambangan data dan
analisis jaringan pada data ini untuk mendapatkan wawasan potensial
-
Makalah ini dan ide-ide yang diungkapkan adalah bagian dari tesis doktor penulis
tentang kemungkinan keberadaan dan perkembangan penyakit kronis.
pertama di University of Sydney. Persetujuan etika manusia untuk protokol penelitian
diperoleh dari Komite Etika Penelitian Manusia Universitas Sydney dengan nomor proyek Terutama, data masuk dan keluar rumah sakit yang dihasilkan secara
2015/824. sistematis (Departemen Kesehatan (Pemerintah Australia), 2016) berisi
∗Penulisyang sesuai. informasi kesehatan pasien dalam kode standar ICD (International Codes for
Surel alamat: arif.khan@sydney.edu.au (A. khan), Diseases) (Organisasi Kesehatan Dunia, 2014) yang dapat membantu kita
syahadat.uddin@sydney.edu.au (S.Uddin),umas@digitalhealthcrc.com (U.Srinivasan).
memahami jejak penyakit yang ditinggalkan secara menahun

https://doi.org/10.1016/j.eswa.2019.05.048 0957-4174/© 2019


Elsevier Ltd. Semua hak dilindungi undang-undang.
A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241 231

pasien. Pemahaman ini kemudian dapat digunakan untuk mengidentifikasi kerangka kerja untuk memprediksi risiko penyakit kronis, yang merupakan tujuan
pasien kronis ambang yang jejak penyakitnya secara luas mengikuti lintasan utama dari penelitian yang disajikan dalam makalah ini. Kami memilih diabetes
serupa. tipe 2 (T2D) sebagai contoh penyakit kronis untuk memprediksi risikonya.
Sejumlah besar pekerjaan telah dilakukan di bidang prediksi risiko Di bagian selanjutnya, kami menjelaskan beberapa informasi kontekstual
penyakit kronis (Davis, Chawla, Christakis, & Barabasi, 2010; Palaniappan & tentang kumpulan data dan kerangka kerja. Kami kemudian menyajikan
Awang, 2008). Sebagian besar dari karya ini didasarkan pada model skoring metodologi yang digunakan dalam kerangka penelitian, diikuti dengan
berbasis aturan yang berfokus pada pemahaman klinis dan empiris gejala, diskusi dan kesimpulan.
komorbiditas penyakit, dan prevalensi. Mereka menetapkan skor untuk
berbagai gejala yang dapat diamati secara fisiologis, kondisi komorbiditas, 2. Latar Belakang
dan informasi demografis untuk menilai kondisi kesehatan pasien
berdasarkan skala risiko yang telah ditetapkan sebelumnya. Indeks 2.1. Pemilihan dataset dan kohort
Komorbiditas Charlson (Charlson, Pompei, Ales, & MacKenzie, 1987),
diusulkan sejak tahun 1987, adalah model prediksi berbasis aturan yang Data kesehatan administratif untuk penelitian ini diperoleh dari
terkenal. Ini memprediksi kematian sepuluh tahun untuk pasien dengan dana kesehatan swasta yang berbasis di Australia. Ini berisi informasi
memberi peringkat berbagai kondisi demografis dan komorbiditas seperti penerimaan rumah sakit untuk sekitar 749.000 pasien yang tidak
penyakit jantung, kanker, AIDS, dll. Indeks serupa lainnya, yaitu indeks teridentifikasi yang merupakan anggota dari salah satu dana ini.
Elixhauser (Elixhauser, Steiner, Harris, & Coffey, 1998), berkinerja sedikit Kumpulan data longitudinal mencakup rentang waktu 6 tahun antara
lebih baik (Sharabiani, Aylin, & Botol, 2012), terutama untuk prediksi September 2009 dan Maret 2015. Dari beberapa elemen data, kami
kematian setelah 30 hari. Model berbasis aturan seperti APACHE-II (Fisiologi menggunakan kode ICD (versi ICD-10-AM) yang ada dalam data masuk
Akut dan Evaluasi Kesehatan Kronis-II), SAPS (Skor Fisiologi Akut Sederhana), dan keluar dari setiap episode masuk.
MPM (Model Probabilitas Kematian) (Breslow & Badawi, 2012; Wong & Data asli diperiksa dan disaring untuk mendapatkan dataset penelitian
Knaus, 1991) dll juga digunakan untuk menilai kondisi kesehatan pasien unit yang sesuai. Kriteria penyaringan meliputi: (a) memilih pasien yang memiliki
perawatan intensif (ICU). Model penilaian ini biasanya berasal dari setidaknya dua rawat inap dengan kode ICD yang valid selama periode
pengamatan empiris yang kaku yang berfokus pada pengaturan perawatan dataset; (b) mengecualikan pasien yang membutuhkan rawat inap yang
kesehatan tertentu, penyakit atau kematian. Mereka biasanya tidak sering dijadwalkan sebelumnya, misalnya - untuk layanan seperti
ditingkatkan untuk populasi besar yang beragam dengan banyak penyakit kemoterapi atau dialisis; dan (c) mengecualikan kode ICD terkait dengan
penyerta. Namun, memprediksi risiko penyakit kronis cukup kompleks gejala, tanda, dan temuan klinis dan laboratorium abnormal, yang tidak
karena tidak terjadi secara terpisah (Barabasi, 2007). Penyakit kronis sering diklasifikasikan di tempat lain (seperti demam, vertigo, pusing, dan pusing,
memiliki faktor risiko yang sama, yang dapat dipengaruhi oleh kombinasi dll.). Selanjutnya, kami fokus pada pemilihan kelompok yang sesuai. Untuk
faktor genetik, lingkungan, dan perilaku. Faktor-faktor ini memiliki efek memprediksi risiko T2D, kami memerlukan dua kohort: kohort pasien yang
sinergis (Burton et al., 2007; Loscalzo, Kohane, & Barabasi, 2007) pada hasil didiagnosis dengan T2D (CT2D), dan kelompok yang tidak kronis—
kesehatan keseluruhan pasien dan dengan demikian tidak boleh yaitu, tidak memiliki T2D (C′ T2D). Ada kode ICD yang terdefinisi dengan baik
dipertimbangkan secara terpisah, yaitu melalui penilaian mereka secara untuk penyakit yang berbeda. Kami menggunakan kode ICD T2D - "E11", untuk mengidentifikasi
individual. T2Ddengan mencari
memastikan apakah seorang pasien milikCT2DatauC′
ada atau tidak adanya kode ini dalam riwayat masuknya.
Oleh karena itu, pekerjaan yang disajikan dalam makalah ini Pada bagian selanjutnya, kami menyajikan beberapa definisi berbasis jaringan
menggunakan pendekatan berbasis jaringan yang mengeksploitasi yang akan bertindak sebagai dasar untuk konsep fungsional selanjutnya yang
semantik yang tersembunyi dalam kode ICD yang tercatat dalam data digambarkan dalam kerangka prediksi.
administrasi, yaitu data masuk dan keluar rumah sakit untuk memahami
pola komorbiditas pasien, perkembangan penyakit dan kemudian 2.2. Definisi berbasis teori graf yang digunakan dalam kerangka penelitian
memprediksi risikonya. Pendekatan berbasis jaringan serupa telah
digunakan di berbagai bidang ilmiah, terutama dalam domain biomedis 2.2.1. Jaringan penyakit individu (IDN)
untuk memahami patogenesis penyakit dengan memetakan ekspresi gen Jaringan ini mewakili lintasan kesehatan pasien individu, yaitu
dan protein terkait yang bekerja pada jalur yang sama (Ideker & Sharan, transisi dari satu komorbiditas ke komorbiditas lainnya selama
2008). Namun, penelitian berbasis jaringan terbatas telah dilakukan pada penerimaan berikutnya dalam lingkungan perawatan kesehatan (Khan,
data perawatan kesehatan administratif yang dikumpulkan secara elektronik Uddin, & Srinivasan, 2018). Itu dibangun dengan mengulangi semua
karena data tersebut tidak mudah diakses oleh para peneliti. Akibatnya, riwayat penerimaan dan melihat daftar komorbiditas dari setiap
potensi data tersebut belum terealisasi sepenuhnya. Kode ICD dalam data penerimaan. Node IDN menunjukkan komorbiditas. Tepi yang
admisi rumah sakit administratif memiliki potensi yang luar biasa dalam menghubungkan dua simpul menunjukkan bahwa pasien baik – (a)
memahami sifat komorbiditas (Luijks et al., 2012), prediksi penyakit (Folino, telah berkembang dari satu komorbiditas ke yang lain pada
Pizzuti, & Ventura, 2010; Khan, Uddin, & Srinivasan, 2016) dll. Beberapa penerimaan berikutnya, atau (b) memiliki kedua komorbiditas pada
karya penelitian menerapkan metode berbasis penambangan data pada penerimaan yang sama. IDN memiliki dua atribut. Yang pertama -
kumpulan data ini. Penyaringan kolaboratif (Davis et al., 2010; Davis, Chawla, frekuensi node dikaitkan dengan setiap node atau komorbiditas yang
Blumm, Christakis, & Barabási, 2008) diusulkan untuk memahami menunjukkan berapa kali komorbiditas telah dicatat dalam riwayat
perkembangan penyakit dan prediksi menggunakan data administratif. penerimaan pasien. Atribut lainnya - berat sisi dikaitkan dengan
Penambangan aturan asosiasi digunakan (Piri, Delen, Liu, & Paiva, 2018) masing-masing sisi dan mewakili berapa kali pasien telah berkembang
untuk mengidentifikasi pola langka dalam komorbiditas terkait diabetes. di antara dua komorbiditas yang sesuai.
Pendekatan berbasis analisis jaringan sosial (SNA) baru-baru ini mendapat Gambar 1mengilustrasikan proses pembuatan IDN. Dua jaringan tersebut
perhatian (Baglioni et al., 2013; Khan, Srinivasan, & Uddin, 2019) karena dihasilkan dari data penerimaan dua pasien yang sewenang-wenang. Misalnya,
elemen data administratif, misalnya pasien, dokter, rawat inap, diagnosis, pasien 2 memiliki dua rawat inap dan didiagnosis dengan D1
asupan obat, dll. terkait secara inheren. Misalnya, SNA telah digunakan dan D2pada penerimaan pertama dan dengan D3pada penerimaan
untuk memahami koordinasi yang efektif untuk pemindahan pasien antar kedua. Pada resultan IDN (di bagian bawah dengan sorot kuning),
rumah sakit atau entitas terkait (Landon et al., 2012). Namun, sangat sedikit frekuensi node untuk masing-masing dari tiga node adalah 1 karena
penelitian yang secara eksplisit menggunakan teori jaringan dan data masing-masing didiagnosis hanya sekali dalam dua penerimaan. Ada
administrasi untuk mengembangkan penelitian secara sistematis hubungan dua arah antara D1dan D2karena mereka didiagnosis dalam
penerimaan yang sama (masuk pertama). Ada juga yang searah
232 A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241

Gambar 1.Komponen pertama dari kerangka penelitian - pembuatan jaringan komorbiditas.

penghubung antara D1dan D3, dan D2dan D3sejak D3 didiagnosis


setelah D1dan D2didiagnosis pada penerimaan segera sebelumnya.

2.2.2. jaringan komorbiditas


Jaringan ini dihasilkan dari IDN orang-orang dalam a
kelompok (CT2DatauC′ T2D) dan karena itu mewakili kesehatan secara keseluruhan
lintasan kelompok itu. IDN dikumpulkan bersama dengan atribut
frekuensi node dan edge untuk membentuk jaringan komorbiditas
keseluruhan. Di dalamGambar 1, jaringan komorbiditas berdasarkan
dua IDN (pasien 1 dan pasien 2) ditampilkan di sisi kanan. Di jaringan
itu, frekuensi simpul D1adalah 3 karena frekuensi simpulnya di IDN
Pasien 1 dan Pasien 2 masing-masing adalah 2 dan 1. Demikian pula,
Gambar 2.Kerangka penelitian untuk prediksi penyakit.
bobot tepi dari D1ke D2pada jaringan komorbiditas ini adalah 2 karena
bobotnya pada kedua IDN adalah 1.

3. Metode T2D. Popu-


dua kelompok seperti yang telah dibahas sebelumnya, yaitu -CT2DDanC′
ukuran rasio dari kedua kohort ini adalah sama. Jaringan komorbiditas,
Kami membagi kerangka penelitian kami, seperti yang diilustrasikan yaitujaringan komorbiditas diabetesdihasilkan dariCT2D. Ini mewakili
dalamGambar 2, menjadi tiga bagian. Pertama, kami menghasilkan lintasan kesehatan T2D, dan riwayat komorbiditas dipilih sampai
pandangan jaringan perkembangan penyakit kronis, yaitu,Jaringan mereka pertama kali didiagnosis dengan T2D (yaitu, ketika
Komorbiditaspenciptaan. Kedua, kami menghitung skor risiko untuk Kode E11 ditemukan dalam riwayat penerimaan). DariC′ T2D, lain
berbagai faktor demografis, perilaku, dan jaringan. Bagian terakhir memiliki jaringan komorbiditas, yaitujaringan komorbiditas non-diabetesdibuat.
dua komponen. Pada komponen pertama, kami memprediksi risiko penyakit Ini mewakili lintasan kesehatan untuk pasien yang bukan penderita
kronis dengan mencocokkan jalur kesehatan pasien yang tidak terdiagnosis diabetes, dan riwayat masuk mereka terdiri dari garis waktu lengkap
dengan jaringan komorbiditas. Komponen kedua memvalidasi prediksi dari kumpulan data penelitian. Sekarang kami membangun jaringan
komponen pertama menggunakan validasi k-fold. komorbiditas akhir (NC) dengan menggabungkan dua jaringan
komorbiditas tersebut. Proses penggabungan dikenal sebagai
3.1. Jaringan komorbiditas (NC) kreasi 'penyesuaian atribut'. Ini memberikan prioritas positif pada
komorbiditas yang lebih banyak terjadi pada jaringan komorbiditas
Dalam kerangka kami untuk prediksi risiko, jaringan komorbiditas (NC) diabetik dibandingkan dengan jaringan komorbiditas non-diabetes dan
berfungsi sebagai dasar untuk perkembangan T2D.Gambar 1menggambarkan memberikan prioritas negatif untuk kasus sebaliknya. Atribut frekuensi
bagaimana jaringan komorbiditas untuk kelompok tertentu dibuat dari IDN simpul dan berat tepi jaringan komorbiditas diabetes dan non-diabetes
kelompok tersebut. Untuk implementasi kami, pertama-tama kami memilih disesuaikan untuk jaringan komorbiditas akhir (NC).
A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241 233

Tabel 1 ing kesamaan-cocok skor. Formulasi matematis dari skor ini dibahas di
Daftar faktor risiko yang dipertimbangkan dalam kerangka kerja.
bawah ini.
Jenis faktor risiko Nama Jenis nilai Notasi

Demografis, Usia Kontinu


3.2.2.1. Skor kecocokan simpul grafik.Ini mengukur kesamaan antara
rfusia
perilaku Seks Diskrit rfseks jaringan pasien uji (Ntes) dan jaringan komorbiditas (NC) dalam hal
Perilaku Diskrit rfberperilaku prevalensi penyakit. Skor mempertimbangkan intensitas prevalensi,
Grafik/kesehatan Pencocokan simpul grafik Kontinu rfgNode atau frekuensi simpul untuk perhitungan. Jadi, untuk pasien uji, nilai
berbasis lintasan Pencocokan pola grafik Kontinu rfgPat
tinggi dalam skor kecocokan simpul grafik hanya mungkin terjadi
Kluster jaringan Kontinu rfgugus
cocok dalam dua skenario berikut:

(a) Pasien uji memiliki lebih banyak penyakit yang juga ada diNC.
(b) Penyakit-penyakit ini (yang umum terjadi di kedua jaringan) memiliki prevalensi
3.2. Perhitungan skor risiko
yang lebih tinggi di wilayah tersebutNCserta diNtes.

Pada bagian ini, kami menghitung skor risiko untuk berbagai faktor Secara matematis, faktor risiko berbasis simpulrfsimpuldari setiap nodeDtes(Saya)
berbasis lintasan demografis, perilaku, dan kesehatan. Keseluruhan enam dalam jaringan pasien ujiNtesdapat didefinisikan sebagai berikut:
faktor risiko di bawah dua kategori dianggap sebagai variabel independen
skor pertandingan
dan terdaftar diTabel 1. Selain itu, dua subbab berikut membahas proses Fsimpuluji(i) = , Di mana
total praayAl
perhitungan skor risiko untuk kedua kategori tersebut.
|V (N∑tes)| ( ) ( )
3.2.1. Usia, jenis kelamin dan faktor risiko perilaku skor pertandingan= f req dtes(i) ∗f req dJ NC
,
Literatur menunjukkan bahwa usia merupakan faktor risiko T2D ( Saya=1

Zoungas et al., 2014). Beberapa penyakit kronis juga cenderung memiliki Dtes(i)=DJ, iklan
NC
N
bias gender. Juga, beberapa faktor risiko perilaku, seperti alkohol atau
merokok bertindak sebagai faktor risiko T2D dan dipertimbangkan dalam
|V (N∑tes)| ( )
total praayAl= f req dtes(i) (1)
kerangka kerja. Jika pasien memiliki riwayat alkohol atau merokok saat ini
Saya=1
atau sebelumnya, itu sering diberi kode dan tercermin dalam catatan
penerimaan pasien. Oleh karena itu, dengan melihat kode ICD terkait Intinya, skor adalah jumlah tertimbang yang dinormalisasi. Jumlah
penggunaan alkohol dan merokok, kami dapat menetapkan skor risiko tertimbang ('skor kecocokan') dihitung dengan mengalikan frekuensi
perilaku untuk pasien. penyakit umum dari tes dan jaringan komorbiditas dan
Faktor usia (rfusia) adalah skor kontinu, mulai dari 0 sampai 1. Kami menjumlahkannya. Ini kemudian dinormalisasi dengan jumlah
membagi usia aktual pasien (dalam tahun) dengan selisih antara usia keseluruhan frekuensi jaringan uji ('preval total').
maksimum dan minimum dalam kohort agar menjadi normal. Faktor
risiko jenis kelamin (rfseks) pada dasarnya adalah skor kategoris dan 3.2.2.2. Skor kecocokan pola grafik.Seperti faktor risiko berbasis nodus,
tidak memerlukan perhitungan lebih lanjut. Terakhir, skor untuk faktor skor pencocokan pola grafik mengukur kesamaan dalam transisi
risiko perilaku (rfberperilaku) memiliki nilai diskrit 0 jika pasien tidak penyakit, yaitu, jumlah tepi yang cocok dan frekuensi yang sesuai
memiliki kode ICD yang dianggap sebagai skor risiko (misalnya, (bobot tepi). Mirip dengan skor kecocokan node grafik, skor ini juga
merokok) dan 1 jika ditemukan setidaknya satu kecocokan. merupakan jumlah tertimbang yang dinormalisasi. Oleh karena itu,
secara matematis, faktor risiko berbasis polarftepiandari tepi manapun e
3.2.2. Perhitungan skor risiko berbasis grafik test(di, dj)antara penyakit penyertaDSayaDanDJdari penyakit pasien uji

Tiga skor risiko terhadap tiga faktor risiko berbasis jaringan atau kemudahan jaringan,Ntesadalah sebagai berikut:

lintasan kesehatan dihitung. Hal ini dilakukan dengan membandingkan skor pertandingan
riwayat medis pasien tes dengan jaringan komorbiditas (NC). Prinsip- rftepiane = , Di mana
( di ,dj)
tes total praayAl
prinsip di bawah ini diikuti saat pencocokan. Menurut mereka,
kemungkinan pasien terkena penyakit kronis meningkat - |V (N∑tes)| ( ) ( )
skor pertandingan= permintaan f
etes(D Saya ,DJ ) ∗permintaan f
eNC(DSaya,DJ)
(a) ketika dia memiliki riwayat penyakit yang memiliki frekuensi simpul yang
Saya=1,J=1,Saya=J,
tinggiNC.
(b) jika dia memiliki lebih banyak penyakit dariNC.
e
tes ( di ,dj) ∈E(Ntes)
(c) jika urutan perkembangan penyakitnya sebagian besar cocok dengan
|V (N∑tes)| ( )
urutan penyakit tersebut diNC. total praayAl= f req etes(DDSayaJ) (2)
(d) jika penyakit berpasangan dalam jaringan perkembangan penyakitnya, termasuk
Saya=1,J=1,Saya=J,
dalam kelompok atau kelompok yang sama diNC.
e
tes ( di ,dj)E(∈tesN)
Metode perbandingan keseluruhan untuk mencocokkan jaringan
pasien uji denganNCdisebut sebagai 'pencocokan jarak longitudinal'. Dalam(2),e(Ntes) menunjukkan himpunan semua sisiNtes. Jika tepi e
Metode perbandingan jaringan ini dilatarbelakangi oleh konsep 'Jarak NC(di,dj)tidak
ada, frekuensi yang sesuai adalah nol.
Edit String' algoritma, juga dikenal sebagai 'Jarak Levenstein' (
Levenstein, 1966). 'Jarak edit' didefinisikan sebagai jumlah minimum 3.2.2.3. Skor kecocokan cluster grafik.Ukuran ini dinilai terhadap faktor
operasi (penyisipan, penghapusan, atau penggantian) yang diperlukan risiko berbasis cluster,rfgugusberdasarkan teori jaringan sosial
untuk mengubah satu kata menjadi kata lain dan digunakan secara pengelompokan. Motivasi di balik skor ini adalah bahwa penyakit tidak
luas dalam pemeriksa ejaan, saran kata, dan pengenalan karakter terjadi dalam isolasi, melainkan sekelompok penyakit cenderung terjadi
optik. Demikian pula, untuk mengukur perbedaan antara jaringan bersama-sama: penyakit ini memiliki jumlah transisi yang lebih tinggi
penyakit pasien uji danNC, kami mencoba mencari tahu jumlah (yaitu, keberadaan tepi, frekuensi yang lebih tinggi) di antara mereka
minimum perubahan yang diperlukan untuk mengonversi jaringan dan jumlah yang lebih rendah. transisi ke penyakit kelompok lain. Oleh
pasien uji menjadiNC. Perubahan diukur dalam hal atribut grafik, yaitu - karena itu, skor ini mengukur proporsi tepi dalam jaringan pasien uji (N
frekuensi node, bobot tepi dan cluster. Berdasarkan ketiga atribut ini, tes) yang terletak di dalam cluster yang sama di jaringan komorbiditas (
kami memiliki tiga faktor risiko berbasis jaringan dan korespondensi NC).
234 A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241

Untuk menghitung skor, framework terlebih dahulu menjalankan penyakit tanpa mengubah parameter apapun. Di dalamk-fold validasi,
algoritma pengelompokan (Blondel, Guillaume, Lambiotte, & Lefebvre, 2008) anggota kelompok asli ditugaskan secara acakkberukuran sama, partisi
dalam NC. Jika pasangan simpul membentuk tepi dariNtesjatuh di bawah yang saling eksklusif (Kohavi, 1995). Dari inik partisi, satu partisi
cluster yang sama diNC, ini dihitung sebagai pencocokan klaster. Misalnya, ditugaskan untuk menguji model dan sisanyak-1partisi digunakan
jikaNtesjaringan memiliki keunggulan antara dua penyakit – hipertensi dan untuk melatih model. Setelah model dilatih dan diuji menggunakan
stroke dan kedua penyakit ini juga termasuk dalam kelompok yang sama di penetapan ini, partisi tunggal lainnya ditetapkan untuk pengujian dan
NCjaringan maka tepi ituNtesdihitung sebagai pertandingan. Pasangan sisanyak-1 digunakan untuk pelatihan. Dengan cara ini, seluruh proses
simpul untuk semua sisi dariNtesdicocokkan dengan cara itu dan jumlah diulangikkali menggunakan penetapan partisi yang berbeda untuk
keseluruhan kecocokan disebut sebagaiNpertandingan (Ntest). Skor kecocokan pelatihan dan pengujian.
akhir adalah jumlah dari semua kecocokan klaster yang dinormalisasi Untuk kerangka kerja kami, kami menggunakan validasi silang 10
dengan jumlah sisi yang ada diNtes. Karena itu, kali lipat yang biasa diikuti (yaitu,k=10). Kami membagi kohort pasien
T2D dan non-T2D (misCSaya(T2D)DanC′ Saya(T2D)) masing-masing menjadi 10 partisi
Npertandingan (Ntes)
rfgugus= . (3) dariukuran yang sama. Awalnya, enam partisi pertama digunakan untuk
jumlah tepi total dalam NC
membangkitkan jaringan komorbiditas, tiga partisi berikutnya digunakan
3.3. Prediksi risiko penyakit untuk melatih dataset dan partisi terakhir digunakan untuk menguji
keakuratan prediksi. Dalam iterasi berikutnya, penetapan partisi digeser ke
Pada fase ini, kami memprediksi risiko berkembangnya penyakit kanan satu tempat pada satu waktu. Secara keseluruhan, 10 iterasi dibuat
kronis untuk pasien uji yang memiliki penyakit penyerta tertentu untuk memvalidasi framework.
namun belum didiagnosis dengan penyakit tersebut untuk diprediksi.
Kami menggunakan tiga model prediktif untuk analisis kinerja dan 4. Hasil dan Pembahasan
tujuan perbandingan, yaitu - 1) model estimasi parameter, 2) regresi
logistik biner dan 3) klasifikasi pohon biner. Semua model ini pertama Kumpulan data keseluruhan berisi sekitar 385.000 anggota yang
kali dilatih menggunakan kelompok pelatihan yang berisi pasien T2D memenuhi syarat yang memiliki informasi komorbiditas yang
dan non-T2D dalam jumlah yang sama. Dalam proses ini, skor risiko diperlukan dalam hal kode ICD dan karenanya memenuhi kriteria untuk
untuk tiga faktor risiko berbasis jaringan dihitung untuk kelompok dimasukkan dalam kerangka penelitian. Setelah memindai daftar
pelatihan dengan membandingkannya dengan jaringan komorbiditas. komorbiditas mereka, kami menemukan total 18.353 pasien yang
Tiga skor risiko demografis dan perilaku lainnya diperoleh dari data memiliki jenis kode yang berhubungan dengan diabetes, misalnya tipe
pasien. Sekarang, dengan menggunakan hasil yang diketahui dan 1, tipe 2 dan diabetes mellitus lain yang ditentukan atau tidak
enam skor risiko untuk setiap pasien uji, ditentukan. Karena penelitian ini menganggap diabetes tipe 2 (T2D)
sebagai komorbiditas yang akan diprediksi, kami menandai pasien
Model estimasi parameter banyak digunakan di berbagai domain (Aksoy, yang memiliki E11 (kode ICD-10-AM untuk T2D) dalam daftar
2015; Ferrier & Lovell, 1990; Kailath, Sayed, & Hassibi, 2000) di mana model komorbiditas mereka untuk dimasukkan dalam kohort diabetes. Ini
matematis dengan satu atau lebih parameter dihasilkan dan kemudian nilai menghasilkan 16.812 pasien T2D. Karena kohort diabetes dan non-
parameter optimal diestimasi melalui berbagai teknik. Untuk implementasi diabetes membutuhkan jumlah pasien yang sama, kami secara acak
kami, model yang digunakan adalah model linier dari enam faktor risiko mengambil sampel pasien non-diabetes dengan jumlah yang sama dari
yang masing-masing memiliki bobot faktor atau parameter. Jumlah faktor daftar pasien yang memenuhi syarat yang tersisa.Bagian 2.1hanya
risiko tertimbang dianggap sebagai ambang batas untuk prediksi T2D. memasukkan catatan yang memiliki informasi yang cukup berupa kode
Setiap pasien uji yang memiliki skor risiko keseluruhan lebih besar dari penyakit. Dengan demikian, kohort diabetes dan non-diabetes akhir
ambang batas yang diperkirakan untuk T2D. Dengan demikian, fungsi diperoleh. Masing-masing berisi 2.300 pasien.
tujuan dari model estimasi parameter adalah untuk menemukan nilai
ambang optimal dengan menyetel enam parameter untuk setiap faktor 4.1. Pemilihan rentang kode
risiko yang memberikan akurasi prediksi maksimum untuk dataset
pelatihan. Model estimasi parameter diselesaikan secara iteratif sebagai Kami menemukan sekitar 7000 kode ICD berbeda dalam catatan
masalah pemrograman linier. penerimaan yang terlalu besar untuk dipertimbangkan untuk dianalisis.
Mirip dengan metode estimasi parameter, regresi logistik biner Oleh karena itu, kami mengelompokkan kode ICD ke dalam komorbiditas
menghasilkan model linier di mana koefisien untuk setiap faktor risiko yang relevan dengan T2D dan penyakit kronis lainnya. Kami menggunakan
dan intersep dihitung. Log-peluang probabilitas adalah variabel indeks Elixhauser sebagai dasar karena secara khusus dikembangkan untuk
dependen. Kami menafsirkan 0,5 sebagai nilai probabilitas ambang mengukur komorbiditas menggunakan data administratif dan telah
batas. Siapa pun yang memiliki probabilitas prediksi lebih besar dari 0,5 digunakan secara luas (Proyek Biaya dan Pemanfaatan Kesehatan (HCUP),
diprediksi menderita diabetes dan sebaliknya. Klasifikasi pohon biner, 2017; Joynt, Orav, & Jha, 2011). Indeks asli memiliki 30 komorbiditas,
di sisi lain, bukanlah model linier, melainkan metode berbasis data kemudian direvisi menjadi 31 komorbiditas (Garland et al., 2012). Kami
mining. Ini menghasilkan pohon keputusan biner. Setiap simpul non- mengecualikan dua komorbiditas terkait diabetes karena diabetes itu sendiri
daun dari pohon memiliki logika perbandingan yang terkait dengan adalah kondisi kronis untuk dijelajahi. Kami selanjutnya memeriksa literatur
salah satu faktor risiko, berdasarkan mana keputusan dicabangkan ke untuk menemukan komorbiditas yang tidak tercakup oleh indeks Elixhauser
simpul anak yang dapat berupa simpul logika lain atau simpul daun tetapi relevan untuk diabetes atau dapat berfungsi sebagai proksi dari
yang berisi prediksi akhir. komorbiditas. Misalnya, 'Keberadaan implan dan cangkok angioplasti
Setelah model prediktif dilatih dan akibatnya parameter prediksi koroner' dan 'Kehadiran cangkok bypass aortokoroner' menunjukkan
diperoleh, parameter ini digunakan untuk menjalankan prediksi penyakit penyerta terkait jantung yang mungkin berhubungan dengan T2D.
menggunakan kelompok uji data lainnya. Kelompok uji juga berisi Komorbiditas terkait jantung sudah ada dalam indeks Elixhauser asli, tetapi
jumlah pasien T2D dan non-T2D yang sama untuk memvalidasi hasil dapat dilaporkan atau tidak dilaporkan dalam data karena kualitas
prediksi. pengkodean. Di sisi lain, kondisi kesehatan proksi ini lazim dan dilaporkan
dengan baik dalam kumpulan data karena terkait dengan prosedur dan
3.4. Validasi K-fold klaim keuangan. Lewat sini, enam penyakit penyerta dan kondisi kesehatan
ditambahkan di atas indeks Elixhauser. Pemetaan antara 29 komorbiditas
Kami menggunakan validasi silang k-fold untuk menguji bagaimana model kami pertama (berdasarkan indeks Elixhauser) dan kode ICD-10-CM berasal dari
dapat diskalakan atau digeneralisasikan ke kumpulan data lain untuk kronis yang sama
A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241 235

Gambar 3.Jaringan komorbiditas akhir setelah penyesuaian atribut. Ukuran node mewakili frekuensinya dan node dengan warna yang sama milik komunitas yang sama. (Untuk
interpretasi referensi warna dalam legenda gambar ini, pembaca dirujuk ke versi web artikel ini.)

Meja 2 metode ini dan kemudian menganalisis pengaruh variabel jaringan,


Komorbiditas dan kondisi kesehatan ditambahkan ke indeks Elixhauser.
demografis dan perilaku dalam kinerja prediksi.
S/LA Komorbiditas atau kondisi kesehatan ICD-10-AM Setelah penyaringan, masing-masing kelompok diabetes dan non-
30 Katarak H25?, H26?
diabetes terdiri dari 2.300 pasien. Kedua kelompok dibagi menjadi 10 partisi.
31 Anemia, tidak ditentukan D64.9 Dari mereka, 6 partisi pertama digunakan untuk menghasilkan jaringan
32 Riwayat pengobatan jangka panjang, Z92.22 komorbiditas dasar, 3 partisi berikutnya digunakan untuk pelatihan dan
33 degenerasi makula insulin H35.3 sisanya digunakan untuk pengujian dan validasi. Seperti yang ditunjukkan di
34 Adanya implan dan cangkok angioplasti koroner Z95.5
Gambar 4, kami pertama-tama membandingkan jaringan penyakit individu
35 Adanya cangkok bypass aortocoronary Z95.1
(IDN) masing-masing pasien dalam kelompok pelatihan dengan jaringan
AS/L berlanjut dari Elixhauser Index.'?' menunjukkan topeng wildcard: yaitu, 'H25?'
komorbiditas dan menghitung kesamaan grafik (simpul dan tepi) dan skor
berarti setiap kode ICD dimulai dengan 'H25' (misalnya, H25.0, H25.1).
kecocokan klaster. Untuk pengelompokan, kami menerapkan algoritma
deteksi komunitas yang diusulkan olehBlondel dkk. (2008)yang dibangun di
Gephiperangkat lunak. Ini menghasilkan tiga kelompok dalam jaringan
pekerjaan dariQuan dkk. (2005)dan diperiksa secara manual untuk
komorbiditas akhir. Skor risiko demografis dan perilaku yang tersisa tidak
kompatibilitas dengan ICD-10-AM. Enam penyakit penyerta dan kondisi
memerlukan jaringan komorbiditas untuk perbandingan, karena skor
kesehatan tambahan dipetakan dengan kode ICD dari database
tersebut hanyalah skor risiko individu.
referensi ICD-10-AM (ACCD, 2015) dan terdaftar diMeja 2. Jaringan
Setelah memperoleh enam skor variabel independen untuk setiap pelatihan
komorbiditas selanjutnya berdasarkan 35 komorbiditas ini
pasien, kami mencoba untuk mengeksplorasi hubungan mereka dengan variabel
diilustrasikan dalamGambar 3.
dependen - kondisi diabetes pelatihan pasien. Matriks scatterplot yang dihasilkan
ditunjukkan padaGambar 5.
4.2. Pengembangan model prediksi Gambar 5(c) dan (e) menunjukkan bahwa faktor risiko jenis kelamin dan
perilaku mungkin tidak berpengaruh dalam pemodelan prediksi linier (yaitu,
Seperti disebutkan di bagian metode, kami menggunakan tiga metode dalam model estimasi parameter dan model regresi logistik biner) karena
pemodelan prediktif (lihatGambar 1): model estimasi parameter, regresi keduanya terdistribusi secara merata untuk pasien T2D dan non-T2D .Gambar 5(a),
logistik biner dan klasifikasi pohon biner.Gambar 4menunjukkan bagian usia vs hasil menunjukkan kecenderungan skor risiko usia yang lebih tinggi untuk
ketiga dari kerangka kerja yang mengimplementasikan pasien diabetes. Pun demikian, jika kita berpikir secara horizontal
236 A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241

Gambar 4.Komponen prediksi dan analisis kinerja (bagian ketiga) dari kerangka kerja.

Tabel 3 Tabel 4
Faktor pembobotan optimal dari model estimasi parameter (dari iterasi Nilai koefisien terhadap faktor risiko dalam
fold-0). model regresi logistik biner (dari fold-0) iterasi).

Faktor risiko Faktor pembobotan optimal (dinormalkan)


Faktor risiko Nilai koefisien
Usia 0,1933
Seks 0 Usia 6.20462
Perilaku 9.62 E-06 Seks - 0,14172
Pencocokan simpul grafik 1 Perilaku 0,1749
Pencocokan pola grafik 0,09625 Pencocokan simpul grafik 27.37487
Pertandingan klaster 9.62 E-05 Pencocokan pola grafik 1.96632
Pertandingan klaster 0,87465

garis ambang untuk mengklasifikasikan T2D dan non-T2D, sejumlah besar skor
usia milik pasien non-T2D berada di atas garis ambang. Poin-poin ini akan ramalan. Ini juga memperkuat bahwa komorbiditas dan frekuensinya
memberikan false positive jika kita menganggap usia sebagai satu-satunya berbeda secara signifikan antara pasien diabetes dan non-diabetes.
variabel. Selanjutnya, diGambar 5(b), menunjukkan bahwa sebagian besar pasien Kontribusi terpenting kedua dikaitkan dengan skor usia, yang secara
diabetes menerima skor kecocokan simpul grafik yang lebih tinggi daripada signifikan lebih kecil dari yang sebelumnya. Secara klinis, sebagian
pasien nondiabetes. Dan skor kecocokan simpul kelompok terakhir telah condong besar diagnosis diabetes tipe 2 terjadi setelah usia 45 tahun (Asosiasi
ke garis nol yang menunjukkan bahwa skor kecocokan simpul grafik harus Diabetes Amerika, 2014) menjadikannya indikator potensial. Namun, itu
menjadi prediktor yang baik. tidak menjadi potensi dalam kasus kami, karena proporsi yang relatif
Kami kemudian secara statistik menguji skor risiko untuk kelompok tinggi dari pasien usia non-diabetes dalam dataset juga.
pelatihan T2D dan non-T2D untuk menentukan apakah skor risiko mereka
berbeda secara signifikan atau tidak. Kami melakukan dua sampel WelchT Faktor pembobotan tertinggi ketiga dengan nilai 0,096 dikaitkan
-tes pada dua kohort ini dalam hal masing-masing usia dan simpul, pola, dan dengan skor kecocokan pola grafik, yang hampir setengah dari skor
skor pencocokan kluster. Keempat variabel menunjukkan signifikan secara risiko usia. Skor kecocokan pola cocok dengan pola transisi penyakit
statistik (p <0,01) perbedaan antara kelompok T2D dan non-T2D. Kami pasien uji dengan pola dalam jaringan komorbiditas. Jaringan
melakukan uji chi-square pada jumlah pasien dalam hal variabel kategori - perkembangan penyakit pasien uji seringkali jarang karena rendahnya
jenis kelamin dan adanya faktor risiko perilaku untuk kedua kohort. Hasilnya jumlah penerimaan dalam dataset yang menghasilkan jumlah pola
tidak mengungkapkan perbedaan yang signifikan dalam hal kedua faktor transisi yang lebih rendah. Selanjutnya, skor kecocokan pola yang
risiko ini yang analog dengan pola yang divisualisasikanGambar 5. Pada dihasilkan mungkin terlalu terperinci untuk kumpulan data tanpa
subbagian berikut, kami mengimplementasikan model prediktif menangkap informasi yang signifikan untuk prediksi. Oleh karena itu,
menggunakan tiga metode yang disebutkan sebelumnya untuk menentukan skor kecocokan pola grafik tidak berbeda jauh dibandingkan dengan
kontribusi dan signifikansi masing-masing parameter serta untuk mengukur dua prediktor lain yang lebih signifikan. Tiga faktor risiko lainnya tidak
kinerja prediksi secara keseluruhan. mencapai banyak signifikansi dalam hal faktor pembobotannya.

4.2.1. Pengaruh faktor risiko dari model estimasi parameter Model 4.2.2. Pengaruh faktor risiko dari regresi logistik
estimasi parameter secara iteratif menemukan nilai parameter Metode regresi logistik biner memodelkan variabel dependen (yaitu,
optimal terhadap masing-masing variabel independen untuk hasil) sebagai rasio ganjil terhadap jumlah linier variabel independen,
memaksimalkan akurasi prediksi untuk dataset pelatihan. Faktor yang masing-masing memiliki koefisien sebagai faktor pengali. Untuk
pembobotan optimal dan ternormalisasi untuk faktor risiko ditunjukkan analisis ini, variabel kategori diubah menjadi variabel dummy sebelum
padaTabel 3. Hasilnya didapat dari eksekusi fold-0; lipatan lain mengimplementasikan model. Tabel 4melaporkan nilai koefisien dari
memberikan hasil yang serupa. eksekusi fold-0; lipatan lain memberikan hasil yang serupa.
Tabel tersebut menunjukkan bahwa skor kecocokan node grafik memberikan
kontribusi paling penting untuk memprediksi skor risiko. Ini menunjukkan bahwa Tabel 4menunjukkan bahwa skor kecocokan node grafik sekali lagi
ukuran berbasis jaringan yang diusulkan berpengaruh dalam memberikan kontribusi paling penting untuk memprediksi risiko, memperoleh a
A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241 237

Gambar 5.Matriks scatterplot untuk faktor risiko dari model estimasi parameter. Sumbu X menunjukkan kondisi diabetes sebenarnya dari pasien uji. Nilai gelisah pada sumbu X untuk
visualisasi.

nilai koefisien 27,37. Hal ini menunjukkan bahwa dengan setiap berdasarkan skor kecocokan simpul grafik.Gambar 6menunjukkan pohon
peningkatan skor kecocokan simpul grafik, log odd diabetes meningkat klasifikasi yang dihasilkan dari iterasi fold-0 yang memiliki tiga split.
sebesar 27,37. Kontribusi terpenting kedua sekali lagi dikaitkan dengan Di dalamGambar 6, kita dapat melihat bahwa tiga pemisahan dibuat
skor usia, dengan nilai koefisien 6,2. Skor kecocokan pola grafik berdasarkan dua faktor risiko, yaitu simpul grafik (gNode) dan usia, dalam urutan
menarik faktor pembobotan tertinggi ketiga. Hasil ini analog dengan itu. Skor kecocokan pola grafik tidak muncul secara signifikan pada lipatan ini
model estimasi parameter. karena dua faktor risiko lainnya pada tiga pemisahan pertama memberikan
akurasi yang optimal. Dari gambar tersebut terlihat bahwa split kedua dan ketiga
dapat diringkas dan dieksekusi sebagai satu split tunggal, yaitu dengan syarat:
4.2.3. Pengaruh faktor risiko dari metode klasifikasi pohon biner Metode ini umur >0,3364. Namun, algoritma klasifikasi pohon biner masih membuat dua
secara berurutan membagi set pelatihan pasien menjadi dua kelompok pemisahan berturut-turut pada skor risiko yang sama dengan algoritma (Breiman,
berdasarkan kondisi jangkauan dari salah satu variabel independen. Untuk Friedman, Stone, & Olshen, 1984) menumbuhkan pohon dengan membaginya
implementasi kami lebih dari 10 kali lipat, klasifikasi pohon biner sebagian secara progresif pada satu faktor risiko pada satu waktu berdasarkan heuristik (
besar membuat tiga pemisahan: pertama, berdasarkan skor simpul grafik, Lho, 2011) tanpa mengetahui kondisi split berikutnya sebelumnya. Karena pohon
kedua berdasarkan skor usia dan akhirnya skor kecocokan pola. Untuk dua terakhir tidak besar, kami tidak menerapkan pemangkasan untuk
kasus, pemisahan tambahan dilakukan pada skor kecocokan klaster. Juga, menyederhanakan pohon dan ada belahan pada kondisi yang sama.
dalam tiga kasus, hanya ada satu perpecahan
238 A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241

tidak digunakan dalam output pohon klasifikasi. Skor kepentingan yang


diberikan terhadap setiap skor risiko selama 10 kali lipat ditampilkan di
Gambar 7.
Gambar 7menegaskan bahwa skor kecocokan simpul grafik secara
konsisten memperoleh skor kepentingan tertinggi dari semua
parameter, sebagian besar dalam kisaran 60-70. Ini menunjukkan
bahwa menggunakan parameter ini pada awalnya memberikan akurasi
paling tinggi dalam pemisahan primer, yang kemudian disesuaikan
dengan dua parameter berikutnya, pertama - skor usia, yang menerima
skor kepentingan dalam kisaran 16-26 di seluruh lipatan. Ini diikuti dan
sering digantikan oleh skor kecocokan pola grafik, dalam kisaran 14-23.
Faktanya, baik skor kecocokan pola maupun skor usia sering kali sama
pentingnya. Secara keseluruhan, kita dapat mengamati bahwa hasilnya
analog dengan regresi logistik biner dan model estimasi parameter.
Untuk meringkas, kami menghasilkan model prediktif yang dapat
menilai risiko diabetes. Untuk melatih model, kami menggunakan tiga
partisi dengan total 690 pasien diabetes dan 690 pasien non-diabetes.
Ketiga metode prediksi menghasilkan keluaran yang relatif sama dalam
hal pengaruh enam faktor risiko atau variabel independen. Skor
kecocokan node grafik menerima skor pengaruh tertinggi yang juga
secara signifikan lebih besar daripada skor yang diberikan untuk
parameter lainnya. Skor usia adalah faktor risiko terpenting kedua
dalam memprediksi risiko diabetes, sedangkan skor kecocokan pola
grafik menerima skor yang relatif lebih kecil.

Gambar 6.Pohon klasifikasi dihasilkan dari metode klasifikasi pohon biner (iterasi fold-0). 4.3. Hasil penilaian risiko untuk kelompok uji

Pada tahap ini, tiga metode prediktif diimplementasikan pada


Metode klasifikasi pohon menampilkan kepentingan relatif dari masing- kelompok uji dengan menggunakan nilai parameter masing-masing
masing parameter. Untuk sebagian besar dari 10 iterasi, hanya tiga (misalnya nilai koefisien/faktor pembobot optimal dari faktor risiko,
parameter yang dianggap penting. Tiga sisanya - skor risiko perilaku, skor pohon klasifikasi) yang diperoleh selama pelatihan. Kelompok uji terdiri
jenis kelamin dan skor kecocokan klaster, tidak diberi skor kepentingan apa dari partisi terakhir (dari 10) yang berisi 230 pasien diabetes dan 230
pun untuk sebagian besar kasus, sebagaimana adanya. pasien non-diabetes. Regresi logistik biner dan pohon biner

Gambar 7.Kepentingan parameter lebih dari 10 lipatan dalam metode klasifikasi pohon (faktor risiko perilaku tidak ditampilkan).
A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241 239

Tabel 5
Hasil terkait prediksi untuk model yang berbeda berdasarkan rata-rata semua lipatan.

Regresi logistik biner. Model estimasi parameter Klasifikasi pohon biner

Benar positif (%) 81.78 91.91 93.96


Benar-benar negatif (%) 83.35 79.09 78.48
Positif palsu (%) 16.65 20.91 21.52
Negatif palsu (%) 18.22 8.09 6.04
Akurasi (%) 82.56 85.5 86.22
SD Akurasi 1.55 1.23 1.16

metode klasifikasi diimplementasikan dalam bahasa 'R' dan pengujian model memberikan output sebagai skor risiko tunggal untuk pasien uji.
model estimasi parameter diimplementasikan dalam perangkat lunak Juga, memberikan nilai skor ambang optimal setelah pelatihan. Semua
khusus kami.Tabel 5menunjukkan hasil prediksi untuk tiga model pasien yang mendapat skor lebih tinggi dari skor ambang batas
prediksi yang diterapkan pada partisi pengujian. Hasilnya diperoleh ditandai sebagai diabetes, dan non-diabetes sebaliknya (lihatGambar 8
dari fold-0. untuk ilustrasi lipat-0). Di sisi lain, regresi logistik memberikan output
Klasifikasi pohon biner menunjukkan akurasi rata-rata tertinggi sebagai log rasio odds. Rasio odds log meningkat secara linear dengan
86,22% di semua lipatan, diikuti oleh model estimasi parameter, yang variabel independen, bukan probabilitas aktual itu sendiri. Untuk model
memberikan akurasi 85,5%. Regresi logistik biner dilakukan dengan estimasi parameter kami, skor risiko itu sendiri berhubungan linier
akurasi yang sedikit lebih rendah dari model estimasi parameter, yaitu dengan skor risiko, atau variabel independen. Perbedaan ini dapat
82,56%. Hasilnya tidak banyak menyimpang di 10 lipatan yang terlihat mempengaruhi perbedaan akurasi dan berkontribusi pada keuntungan
dari standar deviasi yang rendah. Untuk metode estimasi parameter model estimasi parameter kami.
dan klasifikasi pohon biner, false positive count lebih besar daripada Sekarang, kami mencoba menjelaskan perolehan akurasi dari model
false negative. Ini lebih disukai untuk kerangka kerja. Karena untuk klasifikasi pohon biner, yang mengungguli dua model lainnya dengan selisih
perspektif prediksi penyakit kronis, lebih aman menandai pasien yang tipis. Klasifikasi pohon biner bukanlah model linier, melainkan lebih
kurang berisiko sebagai berisiko kronis (yaitu, positif palsu) daripada merupakan metode klasifikasi berbasis data mining. Itu mempartisi seluruh
menandai dengan cara sebaliknya (yaitu, negatif palsu). kelompok uji secara berurutan, setiap kali terhadap satu variabel
Kami dapat mengaitkan sejumlah kecil perolehan akurasi dalam independen dengan kondisi percabangan. Ini memberikan keuntungan logis
model estimasi parameter kami di atas model regresi logistik dengan dan kebebasan yang lebih baik dalam mengkotak-kotakkan efek individual
cara interpretasi hasilnya. Meskipun kedua model mengasumsikan dari variabel. Misalnya, metode klasifikasi memiliki kebebasan untuk
hubungan linier, ada sedikit perbedaan. Estimasi parameter membagi pohon klasifikasi berdasarkan beberapa kali

Gambar 8.Skor risiko keseluruhan dari kelompok uji, prediksi hasil dan pengelompokan yang sesuai menurut model estimasi parameter (fold-0). Titik merah (pasien) di bawah ambang
batas optimal dan titik biru di atas ambang batas optimal adalah prediksi yang salah. (Untuk interpretasi referensi warna dalam legenda gambar ini, pembaca dirujuk ke versi web artikel
ini.)
240 A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241

pada variabel yang sama menggunakan kondisi batas yang berbeda. ences. Selanjutnya, sejumlah besar skor kecocokan klaster pasien
Dengan demikian, metode klasifikasi berbasis pohon dapat melihat pelatihan adalah nol, karena pasien ini memiliki sejumlah kecil
kontinum yang berbeda dari skor parameter, membaginya menjadi komorbiditas keseluruhan dalam penerimaan mereka.
dua atau lebih wilayah, dan memprediksi keanggotaan kelas secara
individual untuk masing-masing wilayah. Keuntungan ini tidak ada di 5. Kesimpulan
salah satu dari dua model linier lainnya. Singkatnya, hasil akurasi dari
ketiga metode cukup memuaskan mengingat sifat kompleks dan klinis Dalam makalah ini, kami telah memperkenalkan pendekatan baru untuk memprediksi risiko T2D menggunakan

dari data dan fakta bahwa data memiliki beberapa keterbatasan teori grafik dan analisis jaringan sosial. Akurasi prediksi berkisar antara 82% hingga 87% di tiga model prediksi dengan

praktis. kinerja yang konsisten. Hasilnya menunjukkan bahwa teori graf dan metode berbasis analisis jejaring sosial dapat

Akhirnya, satu poin penting untuk dicatat bahwa penelitian ini digunakan secara efektif untuk tujuan prediksi risiko penyakit. Ini juga menawarkan pendekatan alternatif yang dapat

menggunakan kohort T2D dan non-T2D berukuran sama untuk tahap digunakan oleh dana perawatan kesehatan swasta dan lembaga pemerintah untuk memanfaatkan data administrasi

pembuatan, pelatihan, dan pengujian jaringan komorbiditas. Namun, mereka secara lebih efektif. Ini dapat digunakan sebagai metode murah untuk memilih kelompok berisiko tinggi yang

jumlah pasien T2D dan non-T2D aktual tidak seimbang dengan rasio berisiko mengembangkan T2D. Dengan memasukkan mereka ke dalam program pencegahan dan jadwal skrining

4,8% vs 95,2% untuk kohort T2D dan non-T2D. Jika kelompok uji diambil lebih lanjut, potensi masuk rumah sakit dan komplikasi dapat dihindari yang pada gilirannya dapat mengurangi

sampelnya secara acak untuk mencerminkan rasio yang tidak sama ini, tekanan pada sumber daya kesehatan. Sebagai pekerjaan di masa mendatang, kami berencana untuk terus

hal itu akan memengaruhi akurasi keseluruhan. Keakuratan baru dapat mengeksplorasi kumpulan data untuk menyertakan informasi biaya guna memahami kelompok diagnosis mana yang

didekati dengan memperbesar ukuran sampel dan menemukan nilai mengarahkan pasien penyakit kronis pada perjalanan kesehatan yang lebih mahal dan sulit. Ini dapat sangat

matriks kebingungan yang sesuai. Karena ukuran pasien T2D sangat membantu penyedia layanan kesehatan, asuransi dan pasien untuk menilai risiko secara tepat waktu dan mengambil

kecil, jumlah true positive dan false negative akan lebih kecil dalam tindakan pencegahan untuk mengelola perkembangan penyakit dan mengurangi biaya dalam jangka panjang.

kasus tersebut. Di sisi lain, jumlah absolut untuk negatif benar dan Bersamaan dengan itu, kami juga berencana untuk menyertakan pembelajaran mesin dan teknik penambangan data

positif palsu untuk pasien non-T2D akan lebih tinggi. Namun, yang lebih canggih yang dapat meningkatkan performa prediksi kerangka kerja secara keseluruhan. asuransi dan

sensitivitas dan spesifisitas harus tetap sama jika data uji baru yang pasien untuk menilai risiko secara tepat waktu dan mengambil tindakan pencegahan untuk mengelola perkembangan

tidak seimbang relatif bebas dari bias. Mempertimbangkan hal ini, penyakit dan mengurangi biaya dalam jangka panjang. Bersamaan dengan itu, kami juga berencana untuk

akurasi untuk data uji T2D dan non-T2D yang tidak seimbang masing- menyertakan pembelajaran mesin dan teknik penambangan data yang lebih canggih yang dapat meningkatkan

masing akan menjadi 83%, 80% dan 79% untuk regresi logistik biner, performa prediksi kerangka kerja secara keseluruhan. asuransi dan pasien untuk menilai risiko secara tepat waktu dan

estimasi parameter dan model klasifikasi pohon biner. Karena mengambil tindakan pencegahan untuk mengelola perkembangan penyakit dan mengurangi biaya dalam jangka

klasifikasi pohon biner memiliki persentase prediksi true positive dan panjang. Bersamaan dengan itu, kami juga berencana untuk menyertakan pembelajaran mesin dan teknik

true negative yang lebih rendah untuk data seimbang dibandingkan penambangan data yang lebih canggih yang dapat meningkatkan performa prediksi kerangka kerja secara

dengan dua metode lainnya, menggunakan data uji yang tidak keseluruhan.

seimbang akan menurunkan akurasi klasifikasi pohon dan efek Penelitian ini memiliki beberapa keterbatasan. Kebanyakan dari mereka terkait dengan kendala yang melekat pada kumpulan data kesehatan dunia nyata. Kualitas

sebaliknya akan terjadi untuk metode regresi logistik biner. pengkodean dapat bervariasi antara rumah sakit ke rumah sakit dan antara periode waktu yang berbeda. Kebijakan perawatan kesehatan sering berubah dan dapat

memengaruhi praktik pengkodean. Pembaruan kebijakan terkadang dapat secara dramatis meningkatkan atau menurunkan frekuensi kode ICD terkait komorbiditas tertentu

4.4. Dampak jenis kelamin, perilaku, dan skor kecocokan klaster dalam waktu singkat. Pendanaan, keahlian pembuat kode klinis, batasan waktu, motivasi, dll. Juga dapat memengaruhi kedalaman pengkodean. Sumber dataset adalah ringkasan

masuk dan keluar rumah sakit. Oleh karena itu, tidak memuat informasi kunjungan dokter umum (GP) dan diagnosis selanjutnya. Ini mungkin meremehkan komorbiditas pasien.

Ketiga faktor risiko ini menerima skor pengaruh yang lebih rendah atau tidak Juga, karena dataset diperoleh dari dana kesehatan swasta, mereka tidak memuat informasi tentang pasien ketika mereka dirawat di rumah sakit umum sebagai pasien umum.

sama sekali dalam ketiga model prediktif. Meskipun proporsi laki-laki sedikit lebih Selain itu, jaminan kesehatan swasta pada layanan terkait seperti kedokteran gigi, oftalmologi, dll. bervariasi di antara pasien dan juga dapat menyebabkan perkiraan yang terlalu

tinggi pada kohort diabetes dalam kumpulan data penelitian, jenis kelamin tidak rendah terhadap penyakit penyerta. Namun, dalam banyak kasus, batasan ini melekat pada sebagian besar sistem perawatan kesehatan dunia nyata di mana sebagian besar data

terlalu penting untuk model. Ini mungkin karena memberikan nilai faktor kesehatan dipisahkan antara badan pengatur yang berbeda dan penjaga data yang tidak dapat berbagi atau menautkan data karena kendala kebijakan, privasi, dan teknologi.

pembobotan yang lebih tinggi atau pentingnya skor jenis kelamin akan secara Namun demikian, terlepas dari keterbatasan ini, kumpulan data administratif yang digunakan untuk penelitian ini cukup besar dan berpotensi untuk digunakan secara murah

akurat memprediksi risiko untuk beberapa pasien, tetapi pada saat yang sama untuk mengidentifikasi risiko penyakit kronis. perlindungan kesehatan swasta pada layanan terkait seperti kedokteran gigi, oftalmologi, dll. bervariasi di antara pasien dan juga

dapat menciptakan hasil positif palsu dan negatif palsu yang mengurangi akurasi dapat menyebabkan perkiraan yang terlalu rendah terhadap penyakit penyerta. Namun, dalam banyak kasus, batasan ini melekat pada sebagian besar sistem perawatan

keseluruhan. Karena model prediktif memiliki enam parameter berbeda untuk kesehatan dunia nyata di mana sebagian besar data kesehatan dipisahkan antara badan pengatur yang berbeda dan penjaga data yang tidak dapat berbagi atau menautkan data

diseimbangkan, skor jenis kelamin secara alami menerima faktor pembobotan karena kendala kebijakan, privasi, dan teknologi. Namun demikian, terlepas dari keterbatasan ini, kumpulan data administratif yang digunakan untuk penelitian ini cukup besar

atau kepentingan yang lebih rendah daripada parameter lain yang unggul. dan berpotensi untuk digunakan secara murah untuk mengidentifikasi risiko penyakit kronis. perlindungan kesehatan swasta pada layanan terkait seperti kedokteran gigi,

Argumen serupa dapat dibuat terhadap faktor risiko perilaku yang sangat oftalmologi, dll. bervariasi di antara pasien dan juga dapat menyebabkan perkiraan yang terlalu rendah terhadap penyakit penyerta. Namun, dalam banyak kasus, batasan ini

rendah atau tidak signifikan, yang kami definisikan sebagai adanya penggunaan melekat pada sebagian besar sistem perawatan kesehatan dunia nyata di mana sebagian besar data kesehatan dipisahkan antara badan pengatur yang berbeda dan penjaga

tembakau atau merokok. Bukti ilmiah menunjukkan bahwa merokok data yang tidak dapat berbagi atau menautkan data karena kendala kebijakan, privasi, dan teknologi. Namun demikian, terlepas dari keterbatasan ini, kumpulan data

menyebabkan diabetes tipe 2 (CDC, 2015;HS, 2014): perokok 30-40% lebih administratif yang digunakan untuk penelitian ini cukup besar dan berpotensi untuk digunakan secara murah untuk mengidentifikasi risiko penyakit kronis. keterbatasan ini

mungkin mengembangkan diabetes tipe 2 dibandingkan bukan perokok. Namun, melekat pada sebagian besar sistem perawatan kesehatan dunia nyata di mana sebagian besar data kesehatan dipisahkan antara badan pengatur yang berbeda dan pemelihara

seperti yang diamati, ada skor risiko yang lebih signifikan (misalnya, simpul grafik data yang tidak dapat berbagi atau menautkan data karena kendala kebijakan, privasi, dan teknologi. Namun demikian, terlepas dari keterbatasan ini, kumpulan data

dan kecocokan pola, usia) yang mengungguli faktor risiko perilaku terkait administratif yang digunakan untuk penelitian ini cukup besar dan berpotensi untuk digunakan secara murah untuk mengidentifikasi risiko penyakit kronis. keterbatasan ini

merokok. Fakta lainnya adalah merokok juga bertanggung jawab atas banyak melekat pada sebagian besar sistem perawatan kesehatan dunia nyata di mana sebagian besar data kesehatan dipisahkan antara badan pengatur yang berbeda dan pemelihara

penyakit lain, termasuk kanker dan asma. Karena kami memiliki jumlah pasien data yang tidak dapat berbagi atau menautkan data karena kendala kebijakan, privasi, dan teknologi. Namun demikian, terlepas dari keterbatasan ini, kumpulan data

diabetes dan non-diabetes yang sama dalam kohort kami dan banyak pasien non- administratif yang digunakan untuk penelitian ini cukup besar dan berpotensi untuk digunakan secara murah untuk mengidentifikasi risiko penyakit kronis.

diabetes memiliki penyakit yang melibatkan merokok, merokok tidak


menunjukkan kepentingan prediktif yang signifikan. Namun, karena kerangka Deklarasi Kepentingan Bersaing
kerjanya adaptif, merokok dapat memberikan bobot yang lebih tinggi untuk
kumpulan data lainnya. Para penulis menyatakan bahwa tidak ada konflik kepentingan dalam
Akhirnya, mengenai skor kecocokan klaster - tidak ada model yang naskah ini.
memberikan banyak bobot padanya. Ini karena jaringan komorbiditas
ditemukan jenuh, karena 58% tepi ada di jaringan. Ini membuat skor Pernyataan kontribusi penulis kredit
modularitas lebih rendah; oleh karena itu, hubungan antara komorbiditas
dari klaster yang sama memiliki sedikit perbedaan dibandingkan dengan Arif Khan:Konseptualisasi, Perangkat Lunak, Investigasi, Kurasi
komorbiditas dari klaster yang berbeda. Jadi, pada fase pelatihan model Data, Analisis Formal, Validasi, Visualisasi, Penulisan - draf asli.
prediktif, skor kecocokan klaster antara pasien diabetes dan non-diabetes Syahadat Uddin:Pengawasan, Penulisan - tinjauan & penyuntingan,
tidak menunjukkan perbedaan yang signifikan. Administrasi proyek, Sumber Daya, Konseptualisasi,
A. Khan, S. Uddin dan U. Srinivasan / Sistem Pakar Dengan Aplikasi 136 (2019) 230–241 241

Investigasi, Validasi.Uma Srinivasan:Administrasi proyek, Pengawasan, Kailath, T., Sayed, AH, & Hassibi, B. (2000).Estimasi linier. Sungai Pelana Atas:
Sumber Daya, Penulisan - tinjauan & penyuntingan, Investigasi, Kurasi Balai Prentice.
Kapur, V., Sandblom, RE, Hert, R., James, B., & Sean, D. (1999). Biaya medis dari
data. apnea tidur yang tidak terdiagnosis.Tidur, 22, 749.
Khan, A., Srinivasan, U., & Uddin, S. (2019). Pengembangan dan eksplorasi poli-
Pengakuan jaringan pengobatan dari data Skema Manfaat Farmasi dan Medicare. Di dalam
Prosiding multikonferensi minggu ilmu komputer Australasia(P. 34). ACM.

Para penulis ingin mengucapkan terima kasih atas dukungan Khan, A., Uddin, S., & Srinivasan, U. (2016). Mengadaptasi teori graf dan jejaring sosial
finansial dan platform analitik data yang disediakan oleh Pusat langkah-langkah kerja pada data perawatan kesehatan: Kerangka kerja baru untuk
memahami perkembangan penyakit kronis. Di dalamProsiding multikonferensi minggu ilmu
Penelitian Koperasi Pasar Modal di bawah Program Kualitas Pasar
komputer Australasia(P. 66). ACM.
Kesehatan dan mitra industri HAMB Systems Ltd. Khan, A., Uddin, S., & Srinivasan, U. (2018). Jaringan komorbiditas untuk penyakit kronis
kemudahan: Pendekatan baru untuk memahami perkembangan diabetes tipe 2.Jurnal
Internasional Informatika Medis, 115, 1–9.
Bahan pelengkap
Kohavi, R. (1995). Studi tentang validasi silang dan bootstrap untuk estimasi akurasi
dan pemilihan model. Di dalamIjcai: 14(hlm. 1137–1145).
Materi tambahan yang terkait dengan artikel ini dapat ditemukan, Landon, BE, Keating, NL, Barnett, ML, Onnela, J.-P., Paul, S., O'Malley, AJ,
dalam versi online, di doi:10.1016/j.eswa.2019.05.048. et al. (2012). Variasi dalam jaringan berbagi pasien dokter di seluruh Amerika Serikat.
JAMA, 308, 265–273.
Lauruschkat, AH, Arnrich, B., Albert, AA, Walter, JA, Amann, B., Rosendahl, UP,
Referensi et al. (2005). Prevalensi dan risiko diabetes melitus yang tidak terdiagnosis pada
pasien yang menjalani pencangkokan bypass arteri koroner.Sirkulasi, 112, 2397–
ACCD. (2015). Konsorsium Australia untuk pengembangan klasifikasi. Di dalam: ICD-10- 2402. Levenshtein, VI (1966). Kode biner mampu mengoreksi penghapusan, penyisipan
AM/ACHI/ACS. (Vol. 2019).https://www.accd.net.au/Icd10.aspxTerakhir diakses: dan pembalikan. Di dalamdoklady fisika Soviet: 10(P. 707).
18-06-2019. Loh, WY (2011). Pohon klasifikasi dan regresi.Ulasan Wiley Interdisipliner:
Aksoy, A. (2015). MODEL NUMERIK| Estimasi Parameter. Penambangan Data dan Penemuan Pengetahuan, 1, 14–23.
Asosiasi Diabetes Amerika. (2014).Laporan statistik diabetes nasional, 2014. Es- Loscalzo, J., Kohane, I., & Barabasi, AL (2007). Klasifikasi penyakit manusia di
waktu diabetes dan bebannya dalam metode estimasi epidemiologiNatl Diabetes era postgenomik: Pendekatan sistem kompleks untuk patobiologi manusia.Biologi
Stat Rep, 2009–2012. Sistem Molekuler, 3, 124.
Baglioni, M., Pieroni, S., Geraci, F., Mariani, F., Molinaro, S., Pellegrini, M., Luijks, H., Schermer, T., Bor, H., van Weel, C., Lagro-Janssen, T., Biermans, M.,
et al. (2013). Kerangka kerja baru untuk menyaring informasi berkualitas lebih tinggi dari data et al. (2012). Prevalensi dan tingkat kepadatan kejadian komorbiditas kronis pada pasien
kesehatan melalui analisis jaringan sosial. Di dalamLokakarya penambangan data (ICDMW), diabetes tipe 2: Sebuah studi kohort eksplorasi.Kedokteran BMC, 10, 128. MacKenzie, EJ,
konferensi internasional ke-13 IEEE 2013 tentang(hlm. 48–55). IEEE. Morris, JA, Jr, & Edelstein, SL (1989). Efek dari kondisi yang sudah ada sebelumnya
Barabasi, A.-L. (2007). Pengobatan jaringan — dari obesitas hingga "menyakitkan".Baru mengurangi lama tinggal di rumah sakit pada pasien trauma.Jurnal Bedah Trauma dan
Jurnal Kedokteran Inggris, 357, 404–407. Perawatan Akut, 29, 757–765.
Blondel, VD, Guillaume, J.-L., Lambiotte, R., & Lefebvre, E. (2008). Berlangsung cepat Palaniappan, S., & Awang, R. (2008). Penggunaan sistem prediksi penyakit jantung cerdas
komunitas dalam jaringan yang besar. Jurnal Mekanika Statistik: Teori dan menggunakan teknik penambangan data. Di dalamSistem dan aplikasi komputer, 2008. AICCSA 2008.
Eksperimen, P10008 2008. Konferensi internasional IEEE/ACS tentang(hlm. 108–115). IEEE.
Breiman, L., Friedman, J., Stone, CJ, & Olshen, RA (1984).Klasifikasi dan regre- Piri, S., Delen, D., Liu, T., & Paiva, W. (2018). Pengembangan metrik baru untuk mengidentifikasi
pohon sion. Boca Raton, Florida: Pers CRC. pola langka dalam analisis asosiasi: Kasus menganalisis komplikasi diabetes.Sistem
Breslow, MJ, & Badawi, O. (2012). Skor keparahan pada pasien yang sakit kritis: Bagian 1—di- Pakar dengan Aplikasi, 94, 112–125.
terpretasi dan akurasi sistem skor prediksi hasil.Jurnal DADA, 141, 245–252. Quan, H., Sundararajan, V., Halfon, P., Fong, A., Burnand, B., Luthi, J.-C., dkk. (2005).
Algoritma pengkodean untuk menentukan komorbiditas dalam data administrasi ICD-9-CM
Burton, PR, Clayton, DG, Cardon, LR, Craddock, N., Deloukas, P., Duncanson, A., dan ICD-10.Perawatan medis, 1130–1139.
et al. (2007). Studi asosiasi genome dari 14.000 kasus tujuh penyakit umum dan 3.000 Rathmann, W., Haastert, B., Icks, A. a., Löwel, H., Meisinger, C., Holle, R., dkk. (2003).
kontrol bersama.Alam, 447, 661–678. CDC. (2015). Merokok dan diabetes.Tips dari Prevalensi tinggi diabetes melitus yang tidak terdiagnosis di Jerman Selatan: Target
mantan perokok: 2016. populasi untuk skrining yang efisien. Survei KORA 2000.Diabetes, 46, 182–189.
Charlson, ME, Pompei, P., Ales, KL, & MacKenzie, CR (1987). Metode baru
mengklasifikasikan komorbiditas prognostik dalam studi longitudinal: Sharabiani, MT, Aylin, P., & Bottle, A. (2012). Tinjauan sistematis komorbiditas
Pengembangan dan validasi.Jurnal Penyakit Kronis, 40, 373–383. indeks untuk data administrasi.Perawatan Medis, 50, 1109–1118.
Davis, DA, Chawla, NV, Blumm, N., Christakis, N., & Barabási, A.-L. (2008). Pra- Taubert, G., Winkelmann, BR, Schleiffer, T., März, W., Winkler, R., Gök, R.,
mendikte risiko penyakit individu berdasarkan riwayat medis. Di dalamProsiding et al. (2003). Prevalensi, prediktor, dan konsekuensi diabetes melitus yang tidak
konferensi ACM ke-17 tentang Manajemen Informasi dan Pengetahuan(hlm. 769– diketahui pada 3266 pasien yang dijadwalkan untuk angiografi koroner.Jurnal
778). ACM. Jantung Amerika, 145, 285–291.
Davis, DA, Chawla, NV, Christakis, NA, & Barabási, A.-L. (2010). Waktu untuk PEDULI:A Tenenbaum, A., Motro, M., Fisman, EZ, Boyko, V., Mandelzweig, L., Re-
mesin kolaboratif untuk prediksi penyakit praktis.Penambangan Data dan Penemuan icher-Reiss, H., dkk. (2000). Dampak klinis diabetes melitus borderline dan tidak
Pengetahuan, 20, 388–415. terdiagnosis pada pasien dengan penyakit arteri koroner. Jurnal Kardiologi Amerika,
Departemen Kesehatan (Pemerintah Australia) (2016). Rumah Sakit Casemix Pro- 86, 1363–1366.
tokol (HCP). Di dalam:Statistik Laporan Tahunan HCP dan PHDB.http:// Umpierrez, GE, Isaacs, SD, Bazargan, N., You, X., Thaler, LM, &
www.kesehatan. gov.au/internet/main/publishing.nsf/Content/health-casemix-data- Kitabchi, AE (2002). Hiperglikemia: Penanda independen mortalitas di rumah sakit
collectionsabout-HCP. Terakhir diakses: 18-06-2019. pada pasien dengan diabetes yang tidak terdiagnosis.Jurnal Endokrinologi &
Elixhauser, A., Steiner, C., Harris, DR, & Coffey, RM (1998). Tindakan komorbiditas Metabolisme Klinis, 87, 978–982.
untuk digunakan dengan data administrasi.Perawatan Medis, 36, 8–27. Departemen Kesehatan dan Layanan Kemanusiaan Amerika Serikat. (2014).Kon-
Ferrier, GD, & Lovell, CK (1990). Mengukur efisiensi biaya di perbankan: Econo- urutan merokok—50 tahun kemajuan: Sebuah laporan dari Surgeon General: 17
bukti metrik dan pemrograman linier.Jurnal Ekonometrika, 46, 229–245. Folino, F., Atlanta, GA: US Department of Health and Human Services, Centers for Disease
Pizzuti, C., & Ventura, M. (2010). Pendekatan jaringan komorbiditas untuk pra- Control and Prevention, National Center for Chronic Disease Prevention and Health
dikte risiko penyakit. Di dalamTeknologi informasi dalam informatika bio dan medis, ITBAM Promotion, Office on Smoking and Health,https://www.ncbi.nlm.nih.gov/pubmed/
2010(hlm. 102–109). Peloncat. 24455788.
Garland, A., Fransoo, R., Olafson, K., Ramsey, C., Yogendren, M., Chateau, D., Wong, DT, & Knaus, WA (1991). Memprediksi hasil dalam perawatan kritis: Arus
et al. (2012).Epidemiologi dan hasil penyakit kritis di manitoba. Universitas Manitoba, status sistem penilaian prognostik APACHE.Jurnal Anestesi Kanada, 38, 374–383.
Winnipeg, Manitoba. Fakultas Kedokteran, Departemen Ilmu Kesehatan Masyarakat.
Organisasi Kesehatan Dunia (2014). SIAPA | Klasifikasi Penyakit Internasional
Gregg, EW, Cadwell, BL, Cheng, YJ, Cowie, CC, Williams, DE, Geiss, L., (ICD). Di dalam.

et al. (2004). Tren prevalensi dan rasio diabetes terdiagnosis dan tidak terdiagnosis Yach, D., Hawkes, C., Gould, CL, & Hofman, KJ (2004). Beban global dari
menurut tingkat obesitas di AS.Perawatan Diabetes, 27, 2806–2812. Haris, MI (1993). penyakit kronis: Mengatasi hambatan untuk pencegahan dan pengendalian.JAMA,
NIDDM yang tidak terdiagnosis: Masalah klinis dan kesehatan masyarakat.Diabetes 291, 2616–2622.
Peduli, 16, 642–652. Zoungas, S., Woodward, M., Li, Q., Cooper, ME, Hamet, P., Harrap, S., dkk. (2014).
Proyek Biaya dan Pemanfaatan Kesehatan (HCUP). (2017). komorbiditas HCUP elixhauser Dampak usia, usia saat diagnosis dan durasi diabetes terhadap risiko komplikasi
perangkat lunak ity.Badan penelitian dan kualitas kesehatan. MD: Rockville. Ideker, makrovaskular dan mikrovaskular serta kematian pada diabetes tipe 2. Diabetes, 57,
T., & Sharan, R. (2008). Jaringan protein pada penyakit.Penelitian Genom, 18, 2465–2474.
644–652.
Joynt, KE, Orav, EJ, & Jha, AK (2011). Tingkat penerimaan kembali tiga puluh hari untuk Medicare
penerima manfaat berdasarkan ras dan tempat perawatan.JAMA, 305, 675–681.

Anda mungkin juga menyukai