A R T I K L EI N F A B S T R A C T
O
Tujuan: Algoritma pembelajaran mesin semakin banyak digunakan untuk memprediksi penerimaan kembali pasien
Kata kunci di rumah sakit. Meta-analisis ini mengevaluasi kinerja model regresi logistik (LR) dan pembelajaran mesin (ML)
Penerimaan kembali
untuk prediksi penerimaan kembali pasien rawat inap selama 30 hari di Amerika Serikat.
Pembelajaran mesin
Metode: Database elektronik (yaitu, Medline, PubMed, dan Embase) ditelusuri dari Januari 2015 hingga
Regresi logistik
Regresi logistik Desember 2019. Hanya penelitian dalam bahasa Inggris yang disertakan. Dua pengulas melakukan penyaringan
Pembelajaran studi, penilaian kualitas, dan pengumpulan data. Kualitas penelitian dinilai menggunakan alat Quality in
mendalam Prediksi Prognosis Studies (QUIPS). Kinerja model dievaluasi dengan menggunakan Area Under the Curve (AUC). Meta-
Jaringan neuron analisis efek acak dilakukan dengan menggunakan STATA 16.
Hasil: Sembilan penelitian dimasukkan berdasarkan kriteria seleksi. Teknik ML yang paling umum
digunakan adalah metode berbasis pohon seperti boosting dan random forest. Sebagian besar penelitian memiliki
risiko bias yang rendah (8/9). AUC lebih besar dengan ML untuk memprediksi 30 hari rawat inap di rumah
sakit untuk semua penyebab dibandingkan dengan LR [Mean Difference (MD): 0,03; 95% Confidence
Interval (CI) 0,01-0,05]. Analisis subkelompok menemukan bahwa metode deep-learning memiliki kinerja
yang lebih baik dibandingkan dengan LR (MD 0,06; 95% CI, 0,04-0,09), diikuti oleh jaringan saraf (MD:
0,03; 95% CI, 0,03-0,03), sedangkan AUC dari metode berbasis pohon (MD: 0,02; 95% CI -0,00-0,04) dan
berbasis kernel (MD: 0,02; 95% CI 0,02 (-0,13-0,16) tidak berbeda dengan LR. Lebih dari separuh penelitian
mengevaluasi rawat inap ulang terkait gagal jantung (N = 5). Untuk prediksi rawat inap ulang di antara pasien
gagal jantung, ML berkinerja lebih baik dibandingkan dengan LR, dengan perbedaan rata-rata AUC sebesar 0,04
(95% CI, 0,01-0,07). Analisis sensitivitas leave-one-out mengkonfirmasi kekokohan temuan ini.
Kesimpulan: Beberapa metode ML digunakan untuk memprediksi 30 hari rawat inap di rumah sakit dengan semua
penyebab. Performa bervariasi di seluruh metode ML, dengan metode deep-learning menunjukkan performa
terbaik dibandingkan LR.
1. Pendahuluan dengan tingkat rawat inap yang lebih tinggi dari rata-rata dan
merupakan salah satu inisiatif yang paling menonjol dari CMS.
Rawat inap di rumah sakit tidak hanya bernilai tinggi bagi rumah Sebagaimana dicatat dalam sebuah studi oleh Byrnes dkk., denda rawat
sakit, tetapi juga berkontribusi pada pengeluaran perawatan kesehatan inap pada tahun 2017 melebihi setengah miliar dolar AS.3
secara keseluruhan dan berdampak pada kualitas perawatan pasien. Model prediksi risiko dapat membantu dalam mengidentifikasi
Karena meningkatnya kekhawatiran tentang biaya perawatan pasien dengan kondisi tertentu yang dapat memperoleh manfaat paling
kesehatan dan perawatan rumah sakit yang tidak perlu, pada tahun 2012, besar dari program manajemen penyakit untuk mengurangi rawat inap
Centers for Medicare and Medicaid Services (CMS) 1mulai ulang dan biaya berlebih. Mengidentifikasi pasien berisiko tinggi
melaporkan tingkat rawat inap selama 30 hari untuk infark miokard melalui model prediksi risiko memungkinkan strategi intervensi dini.
akut (AMI), pneumonia (PN), gagal jantung (HF), dan lain-lain Program manajemen penyakit dapat diimplementasikan secara
sebagai bagian dari Undang-Undang Perlindungan Pasien dan proaktif, bahkan sebelum pasien keluar dari rumah sakit. Oleh karena
Perawatan Terjangkau (Patient Protection and Affordable Care Act) itu, model untuk memprediksi risiko rawat inap ulang menjadi sangat
untuk mengurangi pembayaran kepada rumah sakit atas rawat inap penting. Memanfaatkan teknik statistik yang canggih dapat membantu
yang berlebihan.2 Program Pengurangan Rawat Inap Rumah Sakit mengidentifikasi
(Hospital Readmission Reduction Program - HRRP) menghukum
rumah sakit
* Penulis korespondensi di: Departemen Hasil dan Kebijakan Kesehatan Farmasi, Geriatri, Sekolah Kedokteran UTHealth McGovern, Gedung Kesehatan dan Ilmu
Biomedis 2 - Kantor 4052, Sekolah Farmasi, Universitas Houston, 4349 Martin Luther King Boulevard, Houston, TX 77204-5047, AS.
Alamat email: rraparasu@uh.edu (R.R. Aparasu).
https://doi.org/10.1016/j.rcsop.2023.100317
Diterima 16 Juni 2023; Diterima dalam bentuk revisi 8 Agustus 2023; Diterima 9 Agustus 2023
Tersedia secara online 10 Agustus 2023
2667-2766/© 2023 Para Penulis. Diterbitkan oleh Elsevier Inc. Ini adalah artikel akses terbuka di bawah lisensi CC BY-NC-ND
(http://creativecommons.org/licenses/by- nc-nd/4.0/).
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
populasi sasaran untuk alokasi sumber daya awal dan pada akhirnya
2.1. Kriteria kelayakan
mengurangi rawat inap untuk meningkatkan perawatan pasien dan
mengurangi biaya perawatan kesehatan. Regresi logistik (LR) adalah
Kami menyertakan penelitian jika mereka menggunakan setidaknya satu
teknik yang umum digunakan untuk masalah klasifikasi karena
teknik ML dan LR untuk prediksi rawat inap ulang di rumah sakit dan
kesederhanaan dan kemampuan interpretasi modelnya. 4CMS menggunakan
melaporkan kinerja model prediktif dalam hal luas area di bawah kurva
model rawat inap terstandardisasi risiko berdasarkan regresi logistik
(AUC). Hanya penelitian yang melaporkan data dari basis data berbasis
hirarkis untuk memprediksi rawat inap. 5Pendekatan statistik ini
populasi di AS yang mengevaluasi hasil penerimaan kembali, yang
memperhitungkan struktur hirarkis data, dengan mempertimbangkan
didefinisikan sebagai rawat inap ulang atau rawat inap ulang dalam
bahwa pasien bersarang di rumah sakit. Dengan menyesuaikan
waktu 30 hari, yang dipertimbangkan. Studi yang tidak menggunakan
campuran kasus pasien dan karakteristik rumah sakit, model-model ini
memungkinkan perbandingan yang adil terhadap tingkat rawat inap di
rumah sakit, sehingga memungkinkan identifikasi institusi dengan
tingkat rawat inap yang lebih tinggi dari yang diharapkan dan
mendorong peningkatan transisi perawatan untuk mengurangi tingkat
rawat inap dan meningkatkan luaran pasien. Dengan kemajuan dalam
solusi data besar, pendekatan berbasis data yang muncul telah
memudahkan pemodelan prediksi dalam perawatan kesehatan. Dengan
demikian, metode machine learning (ML), suatu bentuk kecerdasan
buatan yang menggunakan algoritme komputasi untuk
mengidentifikasi pola data non-linear dalam kumpulan data besar
untuk merumuskan prediksi hasil, semakin populer di bidang
kedokteran klinis di tengah meningkatnya aksesibilitas data perawatan
kesehatan. Algoritma ini 6dapat menyaring banyak variabel untuk
mengidentifikasi variabel dan kombinasi yang dapat memprediksi hasil
secara andal. Hal ini 6didasarkan pada konsep pembelajaran dari
pelatihan dan pengujian menggunakan algoritme; dengan demikian,
mereka mampu menganalisis
tipe data yang beragam dan besar dengan fleksibilitas tinggi.
Algoritma pembelajaran mesin yang sering digunakan termasuk
pemodelan berbasis pohon (boosting, pohon keputusan, hutan acak),
metode berbasis kernel (mesin vektor pendukung), jaringan saraf
tiruan [Multilayer Perceptron (MLP)], dan metode pembelajaran
mendalam. Meskipun model regresi logistik didasarkan pada teori dan
asumsi untuk mengembangkan spesifikasi model,7 ML memiliki
keunggulan dalam mengatasi banyak tantangan yang dihadapi dengan
metode tradisional, seperti asumsi statistik, hubungan yang kompleks
dan tidak linier, variabel independen berdimensi tinggi, dan
multikolinearitas.8,9 Faktor-faktor ini bersama dengan ketersediaan
data perawatan kesehatan yang besar telah membuat algoritma ML
menjadi pilihan yang menarik di bidang perawatan kesehatan,
termasuk memprediksi aktivitas penyakit, 10risiko efek samping,11 dan
respons pengobatan. 12Namun, ada kebutuhan untuk memahami
keunggulan algoritma ML dibandingkan metode statistik tradisional
dalam bidang kesehatan.
Beberapa penelitian dalam beberapa tahun terakhir telah
membandingkan metode ML dan LR untuk berbagai hasil rumah sakit.
Namun, hasilnya tidak meyakinkan untuk prediksi rawat inap di rumah
sakit. Beberapa meta-analisis telah dilakukan untuk mengevaluasi
berbagai metode prediksi ML.7,8,13,14 Sebuah studi oleh Christodoulou
et al. membandingkan LR vs metode ML yang berbeda untuk prediksi
klinis secara keseluruhan dan mendukung bahwa tidak ada bukti
kinerja ML yang lebih unggul dibandingkan LR.7 Meta-analisis lainnya
membandingkan metode ML dan LR dalam memprediksi hasil untuk pasien
trauma, sepsis, dan cedera ginjal akut meskipun tidak ada konsensus
yang jelas tentang kinerja model.8,13,15 Namun, belum ada penelitian
yang melakukan analisis komparatif model ML dan LR untuk prediksi
rawat inap di rumah sakit. Oleh karena itu, tujuan dari penelitian ini
adalah untuk mensintesis literatur secara sistematis dan membandingkan
kinerja LR dengan ML untuk pemodelan prediksi risiko rawat inap di rumah
sakit dalam waktu 30 hari pada orang dewasa di Amerika Serikat.
Risiko bias dalam artikel yang disertakan dinilai oleh dua penulis
(AT dan YH), dan jika terjadi ketidaksepakatan, penulis ketiga
dikonsultasikan (RA). Kami menggunakan Quality in Prognosis
Studies (QUIPS). 17Ini terdiri dari enam domain berikut: Populasi
Studi, Attrisi Studi, Pengukuran Faktor Prognostik, Pengukuran Hasil,
Perancu Studi, dan Analisis/Pelaporan Statistik. Alat QUIPS telah
digunakan secara luas untuk menilai kualitas studi yang melibatkan
prediksi penerimaan kembali.18–20 Alat ini dirancang untuk tinjauan
kami berdasarkan literatur sebelumnya yang terkait dengan
pemodelan untuk penerimaan kembali7,21 dan pekerjaan kami
sebelumnya.19 Di antara setiap studi yang disertakan, hal-hal berikut
ini di setiap domain diuraikan untuk studi kami: (1) Populasi studi:
'Apakah ada deskripsi yang memadai tentang populasi studi?'; (2)
Atrisi studi: 'Apakah studi memberikan deskripsi yang memadai
tentang informasi tindak lanjut, mis, menggambarkan metode apa pun
untuk menangani pasien yang tidak dapat ditindaklanjuti atau
3
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
pengukuran dan penghitungan: 'Apakah penelitian tersebut analisis yang dilakukan: Algoritma berbasis pohon, berbasis kernel,
memperhitungkan faktor perancu potensial dari lebih dari tiga domain deep learning, dan Neural network (NN) dengan mengelompokkan
berikut ini, seperti faktor demografi, faktor penentu sosial kesehatan, teknik ML sesuai dengan klasifikasi algoritma. Jika sebuah penelitian
diagnosis utama/komorbiditas, tingkat keparahan penyakit, kondisi menyebutkan lebih dari satu jenis teknik ML dalam kelompok
kesehatan mental, status kesehatan dan fungsional, penggunaan klasifikasi, kami memilih metode dengan kinerja terbaik berdasarkan
layanan medis di masa lalu seperti rawat inap?"; dan (6) Analisis dan berbagai kriteria dan tidak perlu menjadi model dengan AUC tertinggi.
pelaporan statistik: 'apakah penelitian tersebut melakukan prosedur Untuk menginformasikan temuan spesifik penyakit, kami
untuk prosedur validasi model?".19 Penilaian 'ya' , ' tidak', atau ' tidak jelas' melakukan analisis sub-kelompok sesuai dengan area penyakit-pasien
diberikan pada masing-masing domain untuk menilai studi. Kualitas setiap jantung. Karena kami menggunakan estimasi sin- gle untuk r (0,50)
penelitian didefinisikan sebagai 'rendah', 'sedang', atau 'tinggi' untuk semua perhitungan kesalahan standar perbedaan antara dua
berdasarkan hasil gabungan dari masing-masing penelitian.22,23 Jika AUC, analisis sensitivitas dilakukan dengan memvariasikan koefisien
>80% (Lima) domain dijawab "ya", maka penelitian tersebut dianggap korelasi menjadi 0,1 dan 0,8. Selain itu, untuk mengevaluasi pengaruh
berkualitas 'tinggi'. Penelitian ini dianggap berkualitas 'sedang' jika setiap studi terhadap ukuran efek keseluruhan, analisis sensitivitas lain
empat domain dijawab 'ya'. Terakhir, keseluruhan studi didefinisikan dilakukan dengan menggunakan metode leave-one-out (dengan
sebagai kualitas 'rendah' jika hanya tiga domain yang dijawab 'ya'. menghapus satu studi pada satu waktu dan kemudian melakukan
analisis). 25Pendekatan ini membantu dalam mengeksplorasi sumber
heterogenitas yang disebabkan oleh sebuah penelitian dan menguji
2.6. Tindakan dan sintesis efek stabilitas hasil. Semua analisis dilakukan dalam STATA versi 16
(StataCorp LP, Texas, AS).26
AUC dari model LR dan ML dibandingkan dalam meta-analisis. Nilai
AUC digunakan dalam urutan prioritas berikut: validasi eksternal, 2.7. Pelaporan Penilaian bias dan penilaian kepastian
validasi internal, dan data pelatihan (jika tidak ada hasil validasi yang
disajikan). Kami melakukan meta-analisis model efek acak untuk data Plot corong dan uji asimetri regresi Egger digunakan untuk
berpasangan. Sebuah studi oleh Hanley dan McNeil menunjukkan menganalisis bias publikasi dalam hasil penelitian kami. 27Kekuatan
bahwa perbandingan statis dari area di bawah dua kurva ROC yang bukti dinilai dengan menggunakan pendekatan GRADE (Grading of
berasal dari kumpulan pasien yang sama dapat dilakukan dengan Recommendations, Assessment, Development, and Evaluation).28
memperhitungkan korelasi
(r) antara kawasan yang disebabkan oleh sifat data yang berpasangan.24 3. Hasil
Heterogenitas dikuantifikasi dengan menghitung I-kuadrat (I2 ) dan
dengan meninjau plot hutan untuk melihat tumpang tindih CI. Jika CI tidak 3.1. Pemilihan studi
tumpang tindih, maka uji coba tersebut cenderung heterogen. Kami
mengeksplorasi heterogenitas lebih lanjut dengan analisis Kami mengidentifikasi 921 penelitian; dari 129 artikel teks lengkap
subkelompok jika heterogenitas terdeteksi (I2 > 40%). Karena yang ditinjau kelayakannya, sembilan penelitian memenuhi kriteria
variabilitas dalam prediksi ML untuk penerimaan kembali dapat inklusi. Diagram alir PRISMA meringkas proses seleksi studi (Gbr. 1).
dikaitkan dengan teknik ML tertentu, kami melakukan analisis sub-
kelompok sesuai dengan teknik tersebut. Empat jenis sub-kelompok
berikut ini
N = 921 Studi
Pubmed: n =
225 Medline: n
Identifikasi
= 211 Embase:
n = 485
399 Duplikat
Dihapus
Penyaring
N=522
Studi untuk skrining
an
393
Studi yang dikeluarkan setelah penyaringan
judul dan abstrak
Kelayaka
N=129
Artikel teks lengkap
n
dinilai kelayakannya
4
dalam penelitian
kualitatif dan Tidak ada teknik pembelajaran mesin
untuk pengembangan model (9)
sintesis kuantitatif
Tidak ada penerimaan
kembali di rumah sakit
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
Gbr. 1. Diagram PRISMA untuk Pemilihan Studi.
(4) Artikel duplikat (4)
Jenis RCT atau tinjauan
(1)
5
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
Teknik berbasis pohon ML yang paling umum digunakan adalah Dari sembilan penelitian yang disertakan, 8 (89%) penelitian 29–
boosting (4, 44,44% penelitian) dan random forest (4, 44,44%). 36memiliki risiko bias yang rendah sementara satu penelitian (11%)
Karakteristik terperinci dirangkum dalam Tabel Tambahan 2. Sebagian 37memiliki risiko sedang (Gbr. 2). Delapan penelitian (89%)
besar (8 penelitian, 89%) dari penelitian-penelitian ini menggunakan menggambarkan populasi penelitian secara memadai,29–34,36,37 dan 6
beberapa bentuk validasi (seperti validasi silang n-lipatan) dengan studi27,29,32–36 (67%) memberikan deskripsi yang memadai tentang
mempartisi data secara acak ke dalam bagian pelatihan/pengujian informasi tindak lanjut (misalnya, menjelaskan metode apa pun untuk
untuk validasi di dalam set pelatihan untuk konstruksi model.29–36 menangani kehilangan yang tidak dapat ditindaklanjuti atau jumlah
Basis data yang paling sering digunakan untuk pemodelan prediksi kematian). Kesembilan penelitian 29–37(100%) memberikan deskripsi
adalah Electronic Health Record (EHR) (4 penelitian, 44,44%). Untuk yang memadai tentang pengukuran faktor prognostik, seperti
lima penelitian, alasan untuk melakukan pembacaan adalah kondisi menjelaskan metode imputasi untuk menangani data yang hilang,
jantung seperti gagal jantung.29,32–35 Pada saat yang sama, penelitian memberikan definisi yang jelas tentang hasil rawat inap, dan
lain melihat rawat inap ulang setelah masuk ICU, 31inpa- tient memperhitungkan faktor perancu potensial seperti faktor demografi.
rehospitalization,30,36 dan rawat inap kembali setelah operasi kanker Delapan studi29–36 (89%) melaporkan rincian analisis statistik,
kolorektal.37 Sebagian besar penelitian melatih LR dengan pemilihan termasuk prosedur validasi model. Penjelasan rinci tentang setiap
variabel bertahap menggunakan set pelatihan. Selain AUC, penelitian parameter yang termasuk dalam skala dapat dilihat pada Gambar
melaporkan ukuran kinerja dalam hal akurasi33,36 (2, 22%), sementara Tambahan 1.
ukuran kinerja lain yang umum digunakan dalam studi terpilih ini,
termasuk sensitivitas29,30,35,37 (4, 44%) dan spesifisitas29,30,35,37 (4, 44%)
( Tabel Tambahan 3). 3.5. Perbandingan kinerja LR dan ML
Hanya satu penelitian yang melaporkan presisi 33(1, 11%) dan recall33
(1, 11%), sementara hanya tiga penelitian yang melaporkan skor F1 Terdapat variasi dalam kinerja model di seluruh metode ML,
(33%).31,33,35 Hanya tiga penelitian (33%) yang melaporkan metode seperti yang terlihat pada Gbr. 3. Secara keseluruhan, ML berkinerja
untuk mengatasi data yang tidak seimbang.30,32,34 lebih baik daripada LR (perbedaan rata-rata AUC = 0,03; 95% CI:
0,01-0,05). Kami menemukan bahwa metode deep-learning (perbedaan
AUC = 0,06; 95% CI: 0,04-0,09) dan metode NN (perbedaan rata-rata
3.3. Validasi model AUC = 0,02; 95% CI: 0,01-0,03) memiliki kinerja yang lebih baik
daripada LR (Gbr. 4).
Delapan penelitian (89%) menerapkan beberapa metode validasi, Teknik-teknik seperti random forest, decision tree, metode
dan satu penelitian tidak menggunakan metode validasi apa pun (11%). boosting, dan CART, yang dikelompokkan sebagai metode
Satu penelitian (11%) secara acak mempartisi data ke dalam bagian pembelajaran berbasis pohon, tidak menunjukkan perbedaan dengan
pelatihan/pengujian atau pelatihan/validasi/pengujian, 36dan sebagian LR (perbedaan rata-rata AUC = 0,02; 95% CI: -0,01-0,05) (Gbr. 5).
besar penelitian ini menggunakan beberapa bentuk validasi silang Selain itu, metode boosting dikelompokkan untuk memahami metode
dalam set pelatihan untuk konstruksi model. Rincian jenis validasi berbasis pohon yang sangat canggih, dan tidak menemukan perbedaan
model yang digunakan dalam setiap penelitian dapat ditemukan di kinerja antara metode boosting dan LR (perbedaan rata-rata AUC =
Tabel Tambahan 4. 0,02; 95% CI: -0,02-0,06) (Gbr. 5). Metode berbasis kernel, yang
Tujuh penelitian (78%) divalidasi menggunakan berbagai jenis mencakup teknologi seperti support vector machine (SVM) (perbedaan
prosedur resampling, seperti validasi silang k-lipatan,29,30,32,33 validasi rata-rata AUC = 0,02; 95% CI: -0,13-0,16), memiliki kinerja yang
silang k-lipatan bertingkat,31,34 dan pemisahan uji-coba acak mirip dengan metode LR (Gbr. 6). Dari lima penelitian29,32–35 yang
berulang.35 Hanya dua penelitian (22%) yang menggunakan beberapa dilakukan pada populasi pasien jantung, kami menemukan bahwa ML
bentuk metode validasi eksternal, termasuk membagi dataset berkinerja lebih baik daripada metode LR (perbedaan rata-rata AUC =
pelatihan/uji berdasarkan waktu.29,30 0,03; 95% CI: 0,01-0,06) ketika memprediksi 30-
6
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
Gbr. 2. Grafik risiko bias untuk studi yang disertakan yang diadaptasi dari alat QUIPS.
7
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
Gbr. 3. Plot Hutan yang Membandingkan Metode Pembelajaran Mesin dan Regresi Logistik untuk Penerimaan Kembali 30 hari.
4. Diskusi
9
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
Gbr. 4. Plot Hutan yang Membandingkan Metode Deep Learning dan Metode Jaringan Syaraf Tiruan untuk Penerimaan Kembali 30 hari.
11
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
Gbr. 5. Studi Perbandingan Petak Hutan menggunakan Metode Pembelajaran Berbasis Pohon untuk Penerimaan Kembali selama 30 hari.
Gbr. 6. Studi Perbandingan Petak Hutan menggunakan Metode Berbasis Kernel untuk penerimaan kembali selama 30 hari.
lebih banyak wawasan tentang kinerja metode ML yang spesifik jika dengan pedoman PRISMA untuk memberikan konsistensi dan
dibandingkan dengan metode LR dalam memprediksi hasil penerimaan transparansi dalam meta-analisis ini.
kembali. Ketiga, penelitian ini memberikan faktor-faktor penting yang Namun, penelitian ini memiliki beberapa keterbatasan. Untuk
terlibat dalam pengembangan model ML, seperti sumber data dan memberikan rangkuman metode ML yang luas untuk prediksi risiko
metode validasi, yang semakin memperkuat penelitian ini. Keempat, rawat inap ulang, penelitian yang termasuk dalam meta-analisis ini
sebagian besar studi yang diikutsertakan memiliki kualitas yang tinggi tidak terbatas pada diagnosis tertentu, dan oleh karena itu, kami tidak
dan dengan demikian, memastikan validitas internal dari temuan dalam dapat membahas kinerja metode ML untuk prediksi rawat inap ulang
meta-analisis ini. Terakhir, tinjauan ini dilakukan sesuai dengan pada penyakit tertentu.
12
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
Gbr. 7. Analisis Subkelompok: Plot Hutan yang Mengevaluasi Rawat Inap 30 hari untuk Pasien Jantung.
14
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
Garcia-Arce
dkk.32
Catatan kaki: Untuk memprediksi risiko rawat inap ulang dengan menggunakan
Pendanaan
teknik ML atau LR, kepastian bukti sangat rendah karena keterbatasan desain
penelitian dan ketidakkonsistenan akibat heterogenitas kondisi klinis yang Kami tidak memiliki dukungan dana untuk penelitian ini.
dinilai. Untuk memprediksi risiko rawat inap ulang di antara pasien gagal
jantung, kepastian bukti rendah karena keterbatasan desain penelitian;
ditingkatkan d e n g a n mengatasi ketidakkonsistenan, ketidaklangsungan, dan
tidak ada efek sampel kecil yang terdeteksi.
metode untuk mengatasi data yang tidak seimbang. Hal ini menyoroti
perlunya daftar parameter yang komprehensif untuk evaluasi model
agar dapat membuat perbandingan yang berarti dari kinerja model.
Kurangnya metode validasi standar 53dan tidak adanya validasi
eksternal menggunakan set data yang saling bergantung telah dicatat
dalam meta-analisis sebelumnya.14,54 Generalisasi dari model-model
prediktif canggih ini dapat ditingkatkan dengan metode validasi
eksternal. Selain itu, kerangka kerja untuk pengembangan model ML
dengan prosedur validasi standar membantu menerapkan metode ML
untuk memprediksi penerimaan kembali pasien di rumah sakit.
Penelitian juga harus fokus pada identifikasi algoritma mana yang
memiliki kinerja optimal untuk berbagai jenis masalah prediksi dalam
perawatan kesehatan.
5. Kesimpulan
Pengungkapan
15
Semua
A. Talwar et al. data penelitian yang digunakan dalam naskah ini Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
dirangkum dan tersedia dalam tabel dan gambar yang disediakan
dalam dokumen utama dan materi tambahan.
Referensi
1. Panduan Rumah Sakit Rockville M. untuk Mengurangi Rawat Inap Medicaid 2014
Oktober 1.
http://www.ahrq.gov/sites/default/files/publications/files/medreadmissions.pdf;
2015.
2 Jweinat JJ. Penerimaan kembali di rumah sakit di bawah sorotan. J Healthcare
Manag. Jul-Aug 2010;55(4):252-264.
3 Byrnes J. Menang dalam hal kualitas dan keselamatan: apakah Anda memerlukan
kepala petugas kualitas?
J Healthcare Manag. Nov/Des 2016;61(6):391-395.
4 Shipe ME, Deppen SA, Farjah F, Grogan EL. Mengembangkan model prediksi
untuk penggunaan klinis menggunakan regresi logistik: tinjauan umum. J Thorac
Dis. Mar 2019; 11 (suppl 4): S574–s584. https://doi.org/10.21037/jtd.2019.01.25.
5. Acumen L. Tindakan Berbasis Klaim Readmisi yang Berpotensi Dicegah untuk
Kesehatan Rumah: Metodologi Penyesuaian Risiko. Diakses pada Desember
https://www.cms.gov
/Medicare/Inisiatif-Kualitas-Instrumen-Penilaian-Pasien/HomeHealthQuality
Inits/Downloads/PPR_Risk_Adjustment_Methodology_07DEC2016-508-v3.pdf;
2021.
6 Obermeyer Z, Emanuel EJ. Memprediksi masa depan - data besar, pembelajaran
mesin, dan kedokteran klinis. N Engl J Med. 2016 Sep 29; 375(13):1216-1219.
https://doi.org/ 10.1056/NEJMp1606181.
7 Christodoulou E, Ma J, Collins GS, Steyerberg EW, Verbakel JY, Van Calster B.
Sebuah tinjauan sistematis menunjukkan tidak ada manfaat kinerja pembelajaran mesin
dibandingkan regresi logistik untuk model prediksi klinis. J Clin Epidemiol. Jun
2019;110:12–22. https://doi.org/10.1016/j.jclinepi.2019.02.004.
8 Song X, Liu X, Liu F, Wang C. Perbandingan pembelajaran mesin dan model
regresi logistik dalam memprediksi cedera ginjal akut: tinjauan sistematis dan meta-
analisis. Int J Med Inform. Jul 2021; 151, 104484. https://doi.org/10.1016/j.
ijmedinf.2021.104484.
9 Boulesteix AL, Schmid M. Pembelajaran mesin versus pemodelan statistik. Biom J Biom
Z. Jul 2014;56(4):588–593. https://doi.org/10.1002/bimj.201300226.
10 Norgeot B, Glicksberg BS, Trupin L, dkk. Penilaian model pembelajaran mendalam
berdasarkan data catatan kesehatan elektronik untuk meramalkan hasil klinis
pada pasien rheumatoid arthritis. JAMA Netw Open. Mar 1 2019;2(3).
https://doi.org/10.1001/ jamanetworkopen.2019.0606. e190606.
11 Vodencarevic A, Tascilar K, Hartmann F, dkk. Pembelajaran mesin tingkat
lanjut untuk memprediksi risiko flare individu pada pasien artritis reumatoid
yang menggunakan obat biologis. Radang Sendi Res Ther. Feb 27
2021;23(1):67. https://doi.org/10.1186/s13075- 021-02439-5.
12 Johansson FD, Collins JE, Yau V, dkk. Memprediksi respons terhadap
monoterapi tocilizumab pada artritis reumatoid: analisis data dunia nyata
menggunakan pembelajaran mesin. J Rheumatol. Sep 2021;48(9):1364-1370.
https://doi.org/10.3899/ jrheum.201626.
13 Fleuren LM, Klausch TLT, Zwager CL, dkk. Pembelajaran mesin untuk prediksi
sepsis: tinjauan sistematis dan meta-analisis akurasi tes diagnostik. Med Perawatan
Intensif. Mar 2020;46(3):383–400. https://doi.org/10.1007/s00134-019-05872-y.
14 Lee Y, Ragguett RM, Mansur RB, dkk. Aplikasi algoritma pembelajaran mesin
untuk memprediksi hasil terapi pada depresi: meta-analisis dan tinjauan sistematis. J
Affect Disord. 2018 Des 1; 241: 519-532. https://doi.org/10.1016/j. jad.2018.08.073.
16
A. Talwar et al. Penelitian Eksplorasi dalam Farmasi Klinis dan Sosial 11 (2023) 100317
15 Hassanipour S, Ghaem H, Arab-Zozani M, dkk. Perbandingan jaringan saraf 34 Allam A, Nagy M, Thoma G, Krauthammer M. Jaringan saraf versus regresi
tiruan dan model regresi logistik untuk prediksi hasil pada pasien trauma: logistik untuk prediksi penerimaan kembali semua penyebab selama 30 hari. Sci
tinjauan sistematis dan meta-analisis. Cedera. Feb 2019;50(2):244–250. Rep. 26 Jun 2019;9(1): 9277. https://doi.org/10.1038/s41598-019-45685-z.
https://doi.org/10.1016/j.injury.2019.01.007. 35 Mortazavi BJ, Downing NS, Bucholz EM, dkk. Analisis teknik pembelajaran mesin
16 Moher D, Liberati A, Tetzlaff J, Altman DG. Item pelaporan yang disukai untuk untuk penerimaan kembali gagal jantung. Circ Cardiovasc Qual Outcomes. Nov
tinjauan sistematis dan meta-analisis: pernyataan PRISMA. Bmj. Jul 21 2009; 339, 2016;9(6):629-640. https://doi.org/10.1161/circoutcomes.116.003039.
b2535. https://doi.org/10.1136/bmj.b2535. 36 Rajkomar A, Oren E, Chen K, dkk. Pembelajaran mendalam yang terukur
17 Hayden JA, van der Windt DA, Cartwright JL, Coˆte´ P, Bombardier C. Menilai bias dan akurat dengan catatan kesehatan elektronik. NPJ Digit Med. 2018;1:18.
dalam studi faktor prognostik. Ann Intern Med. Feb 19 2013;158(4):280-286. https://doi.org/10.1038/ s41746-018-0029-1.
https://doi.org/10.7326/0003-4819-158-4-201302190-00009. 37 Yeo H, Mao J, Abelson JS, dkk. Pengembangan model prediktif nonparametrik
18 Artetxe A, Beristain A, Gran˜a M. Model prediktif untuk risiko rawat inap di rumah untuk risiko rawat inap pada orang dewasa lanjut usia setelah operasi kanker usus
sakit: tinjauan sistematis metode. Program Metode Komputasi Biomed. Oktober besar dan dubur. J Am Geriatr Soc. Nov 2016;64(11):e125-e130.
2018;164: 49–64. https://doi.org/10.1016/j.cmpb.2018.06.006. https://doi.org/10.1111/jgs.14448.
19 Huang Y, Talwar A, Chatterjee S, Aparasu RR. Penerapan pembelajaran mesin 38 Futoma J, Morris J, Lucas J. Perbandingan model untuk memprediksi penerimaan
dalam memprediksi penerimaan kembali di rumah sakit: tinjauan literatur. BMC kembali di rumah sakit secara dini. J Biomed Inform. Aug 2015;56:229-238.
Med Res Methodol. Mei 6 2021;21(1):96. https://doi.org/10.1186/s12874-021- https://doi.org/10.1016/j. jbi.2015.05.016.
01284-z. 39 Shams I, Ajorlou S, Yang K. Pendekatan analitik prediktif untuk mengurangi
20 Kansagara D, Englander H, Salanitro A, dkk. Model prediksi risiko untuk rawat penerimaan kembali yang dapat dihindari selama 30 hari di antara pasien dengan
i n a p d i rumah sakit: tinjauan sistematis. Jama. J. Med. 2011 Oct 19 gagal jantung, infark miokard akut, pneumonia, atau PPOK. Health Care Manag
2011;306(15):1688-1698. https:// doi.org/10.1001/jama.2011.1515. Sci. Mar 2015;18(1):19-34. https://doi.org/10.1007/s10729-014-9278-y.
21 Mahmoudi E, Kamdar N, Kim N, Gonzales G, Singh K, Waljee AK. Penggunaan 40 Finch HW, Davis A, Dean RS. Identifikasi individu dengan ADHD menggunakan
r e k a m medis elektronik dalam pengembangan dan validasi model prediksi risiko baterai motorik sensorik Dean-woodcock dan algoritma pohon yang ditingkatkan.
rawat inap di rumah sakit: tinjauan sistematis. Bmj. Apr 8 2020;369. Metode Behav Res. Mar 2015;47(1):204–215. https://doi.org/10.3758/s13428-014-
https://doi.org/10.1136/bmj. m958. m958. 0460-4.
22 Shung D, Simonov M, Gentry M, Au B, Laine L. Pembelajaran mesin untuk 41 Elith J, Leathwick JR, Hastie T. Panduan kerja untuk pohon regresi yang
memprediksi hasil pada pasien dengan perdarahan gastrointestinal akut: tinjauan ditingkatkan. J Anim Ecol. Jul 2008;77(4):802–813. https://doi.org/10.1111/j.1365-
sistematis. Dig Dis Sci. 2019 Aug 2019;64(8):2078-2087. 2656.2008.01390.x.
https://doi.org/10.1007/s10620-019-05645-z. 42 Gatys LA, Ecker AS, Bethge M. Tekstur dan seni dengan jaringan saraf dalam. Curr
23 Zarshenas S, Tam L, Colantonio A, Alavinia SM, Cullen N. Prediktor tujuan Opin Neurobiol. Oct 2017;46:178–186. https://doi.org/10.1016/j.conb.2017.08.019.
pemulangan dari perawatan akut pada pasien dengan cedera otak traumatis. BMJ 43 Durstewitz D, Koppe G, Meyer-Lindenberg A. Jaringan saraf dalam dalam
Terbuka. 2017 Agustus 31; 7 (8), e016694. https://doi.org/10.1136/bmjopen- psikiatri. Mol Psikiatri. Nov 2019;24(11):1583-1598.
2017-016694. https://doi.org/10.1038/s41380-019- 0365-9.
24 Hanley JA, McNeil BJ. Metode untuk membandingkan area di bawah kurva 44 Alom MZ, Taha TM, Yakopcic C, dkk. Survei mutakhir tentang teori dan arsitektur
karakteristik operasi penerima yang berasal dari kasus yang sama. Radiologi. Sep pembelajaran mendalam. Elektronik. 2019;8(3):292.
1983;148(3): 839–843. https://doi.org/10.1148/radiology.148.3.6878708. 45 LeCun Y, Bengio Y, Hinton G. Pembelajaran mendalam. Nature.
25 Deeks JJ, Higgins JP, Altman DG, Grup CSM. Menganalisis data dan melakukan 2015;521(7553):436-444. https://doi.org/10.1038/nature14539, 2015/05/01.
meta-analisis. Dalam: Buku Pegangan Cochrane untuk Tinjauan Sistematis 46 Schmidhuber J. Pembelajaran mendalam dalam jaringan saraf: sebuah tinjauan
Intervensi. 2019: umum. Neural Netw. Jan 2015;61:85–117.
241-284. https://doi.org/10.1016/j.neunet.2014.09.003.
26. StataCorp.. Perangkat Lunak Statistik Stata: Release 16. College Station, TX: StataCorp 47 Yu S, Farooq F, van Esbroeck A, Fung G, Anand V, Krishnapuram B.
LLC; 2019. Memprediksi risiko rawat inap ulang dengan model prediksi khusus institusi. Artif
27 Egger M, Davey Smith G, Schneider M, Minder C. Bias dalam meta-analisis Intell Med. Oct 2015;65(2):89–96. https://doi.org/10.1016/j.artmed.2015.08.005.
terdeteksi oleh tes grafis sederhana. Bmj. Sep 13 1997; 315 (7109): 629-634. 48 Dhalla IA, O'Brien T, Morra D, dkk. Pengaruh bangsal virtual pascapemulangan
https://doi.org/ 10.1136 / bmj.315.7109.629. terhadap penerimaan kembali atau kematian pasien berisiko tinggi: uji klinis acak.
28 Schünemann H, Broz˙ek J, Guyatt G, Oxman A. Buku panduan GRADE untuk Jama. 1 Oct 2014;312(13):1305-1312. https://doi.org/10.1001/jama.2014.11492.
menilai kualitas bukti dan kekuatan rekomendasi. Dalam: Diperbaharui Oktober 49 Goldman LE, Sarkar U, Kessell E, dkk. Dukungan dari rumah sakit ke rumah untuk
2013. Kelompok Kerja GRADE; 2013. Tersedia dari para lansia: uji coba acak. Ann Intern Med. 2014 Oct 7;161(7):472-481.
guidelinedevelopment.org/handbook. https://doi.org/ 10.7326/m14-0094.
29 Zack CJ, Senecal C, Kinar Y, dkk. Memanfaatkan teknik pembelajaran mesin 50 Cortes C, Jackel LD, Chiang W P . Batasan akurasi mesin pembelajaran yang ditentukan
untuk meramalkan prognosis pasien setelah intervensi koroner perkutan. JACC oleh kualitas data. Adv Neural Inf Proces Syst. 1994;7.
Cardiovasc Interv. Jul 22 2019;12(14):1304-1311. 51 Ho LV, Ledbetter D, Aczon M, Wetzel R. Ketergantungan pembelajaran mesin
https://doi.org/10.1016/j.jcin.2019.02.035. pada kualitas rekam medis elektronik. AMIA Annu Symp Proc. 2017;2017:883-891.
30 Xue Y, Liang H, Norbury J, Gillis R, Killingworth B. Memprediksi risiko rawat inap 52 Upadhyay S, Stephenson AL, Smith DG. Tingkat rawat inap dan dampaknya terhadap
perawatan akut di antara pasien rawat inap rehabilitasi: pendekatan pembelajaran kinerja keuangan rumah sakit: sebuah studi tentang rumah sakit di Washington.
mesin. Pertanyaan: J Med Care Pembiayaan Penyediaan Organ. Jan-Des 2019;56.
J Biomed Inform. Oct 2018;86:143–148. https://doi.org/10.1016/j.jbi.2018.09.009. https://doi.org/10.1177/ 0046958019860386, 46958019860386.
31 Pakbin A, Rafi P, Hurley N, Schulz W, Harlan Krumholz M, Bobak Mortazavi J. 53 Senanayake S, White N, Graves N, Healy H, Baboolal K, Kularatna S.
Prediksi penerimaan kembali ICU menggunakan data saat pemulangan pasien. Annu Pembelajaran mesin dalam memprediksi kegagalan cangkok setelah transplantasi
Int Conf IEEE Eng Med Biol Soc. Jul 2018;2018:4932-4935. https://doi.org/10.1109/ ginjal: tinjauan sistematis dari model prediktif yang dipublikasikan. Int J Med
embc.2018.8513181. Inform. Oct 2019;130, 103957. https://doi.org/10.1016/j.ijmedinf.2019.103957.
32 Garcia-Arce A, Rico F, Zayas-Castro JL. Perbandingan algoritma pembelajaran 54 Librenza-Garcia D, Kotzian BJ, Yang J, dkk. Dampak teknik pembelajaran mesin
mesin untuk prediksi penerimaan kembali rumah sakit yang dapat dicegah. J Healthc dalam studi gangguan bipolar: tinjauan sistematis. Neurosci Biobehav Rev. 2017
Qual. May/Jun 2018;40(3):129–138. https://doi.org/10.1097/jhq.0000000000000080. Sep 2017;80:538-554. https://doi.org/10.1016/j.neubiorev.2017.07.004.
33 Golas SB, Shibahara T, Agboola S, dkk. Model pembelajaran mesin untuk
memprediksi risiko r a w a t i n a p 30 hari pada pasien gagal jantung: analisis
retrospektif data rekam medis elektronik. BMC Med Inform Decis Mak. 2018 Jun
22;18(1):44. https://doi.org/10.1186/s12911-018-0620-z.
10