Anda di halaman 1dari 11

Memprediksi Lama Tinggal Tahunan dan Dampaknya pada

Kesehatan
Biaya
Kasus Sistem Perawatan Kesehatan Kolombia
Álvaro J. Riascos Universitas los tertentu atau ciri fisiologis yang seringkali tidak teramati oleh perusahaan asuransi.
Andes dan Quantil Bogotá, Misalnya, [4] studi individu dengan kecelakaan serebrovaskular, [10] studi pasien
yang
Kolombia
ariascos@uniandes.edu.co
ABSTRAK
Rawat inap yang dapat dihindari merupakan sumber peningkatan biaya
kesehatan di banyak sistem kesehatan. Rawat inap yang berkepanjangan
membutuhkan biaya yang mahal bagi penyedia, asuransi, dan pasien jika
dikaitkan dengan konsumsi layanan kesehatan yang lebih tinggi dan
perkembangan keadaan yang membahayakan selama rawat inap di rumah
sakit. Dalam artikel ini kami menggunakan teknik pembelajaran mesin untuk
memprediksi lama tinggal pasien tahunan dalam sistem perawatan kesehatan
wajib Kolombia dan mengukur dampaknya terhadap biaya kesehatan dengan
memperkirakan potensi penghematan biaya dari program pencegahan rawat
inap. Hasil dari pemodelan prediktif menunjukkan metode berbasis pohon
mengungguli perkiraan linier dan mencapai tingkat kesalahan di luar sampel
yang lebih rendah dibandingkan dengan model pemenang Hadiah Kesehatan
Warisan. Kami juga menunjukkan bahwa program pencegahan di mana
intervensi pasien diputuskan berdasarkan prediksi model dapat mencapai
penghematan biaya yang signifikan relatif terhadap kebijakan seragam terbaik
(yaitu, campur tangan semua pasien atau tanpa intervensi). Ini berlaku untuk
program yang lebih besar dari 40% dan biaya intervensi per pasien berkisar
antara 100.000 dan
700.000 peso Kolombia.

KATA
KUNCI
Pembelajaran mesin, kebijakan publik, kebijakan kesehatan,
pencegahan, efektivitas biaya

1. PERKENALAN
Rawat inap yang dapat dihindari merupakan sumber peningkatan pengeluaran
kesehatan di banyak sistem kesehatan. Rawat inap yang berkepanjangan mahal bagi
penyedia, perusahaan asuransi, dan pasien karena dikaitkan dengan konsumsi
layanan kesehatan yang lebih besar dan perkembangan keadaan yang
membahayakan selama rawat inap di rumah sakit. Dalam sistem perawatan
kesehatan masyarakat Kolombia, kenaikan biaya kesehatan akibat rawat inap yang
dapat dihindari telah menimbulkan banyak pertanyaan tentang apakah perusahaan
asuransi melaksanakan program pencegahan dan apakah program tersebut efektif.
Dalam konteks ini, prediksi lama tinggal tahunan pasien (LOS) merupakan alat
penting untuk alokasi sumber daya dan meningkatkan hasil kesehatan pasien. Oleh
karena itu, tujuan dari makalah ini adalah: memprediksi lama tinggal tahunan
pengguna dalam sistem perawatan kesehatan publik di Kolombia dan
memperkirakan potensi penghematan biaya dari program pencegahan yang
masukan utamanya adalah prediksi LOS tahunan. Sebagian besar literatur tentang
prediksi LOS tahunan telah dikembangkan dari perspektif penyedia daripada dari
perspektif perusahaan asuransi. Banyak penulis memprediksi LOS menggunakan
sampel pasien dengan kondisi akut tertentu atau ciri fisiologis yang seringkali tidak
teramati oleh perusahaan asuransi. Misalnya, [4] mempelajari individu dengan
kecelakaan serebrovaskular, [10] mempelajari pasien yang Banyak penulis
memprediksi LOS menggunakan sampel pasien dengan kondisi akut tertentu atau
ciri fisiologis yang seringkali tidak teramati oleh perusahaan asuransi. Misalnya, [4]
studi individu dengan kecelakaan serebrovaskular, [10] studi pasien yang Banyak
penulis memprediksi LOS menggunakan sampel pasien dengan kondisi akut
Natalia Serna
Quantil Bogotá, Kolombia
natalia.serna@quantil.com.co
dirawat di unit perawatan intensif setelah menjalani operasi
jantung, [5] fokus pada pasien dengan gagal ginjal, dan [6]
menganalisis pasien dengan patah tulang pinggul. Studi kami
berbeda dari studi sebelumnya dalam artian kami memprediksi
LOS tahunan menggunakan informasi yang simetris antara
perusahaan asuransi, penyedia, dan pemerintah. Kami tidak fokus
pada pengguna dengan kondisi kesehatan tertentu tetapi
menganalisis sampel yang mewakili individu dalam sistem
perawatan kesehatan masyarakat dengan karakteristik demografis
dan morbiditas yang beragam. Kami juga kekurangan data
mengenai ciri-ciri fisiologis pasien tertentu dan kami memperluas
analisis kami untuk mengukur potensi penghematan biaya dari
program pencegahan di mana intervensi diputuskan berdasarkan
prediksi LOS pasien. Berkenaan dengan teknik empiris untuk
memprediksi LOS tahunan,
Sisa dari makalah ini disusun sebagai berikut: setelah
pendahuluan ini, bagian II menjelaskan sistem perawatan
kesehatan masyarakat Kolombia, bagian III menjelaskan kerangka
kerja empiris, bagian IV menjelaskan database kami dan
pemrosesan awal data, bagian V menyajikan hasil mesin teknik
pembelajaran, bagian VI menyajikan dampak LOS pada biaya
kesehatan, dan bagian VII menyimpulkan.

2 SISTEM PERAWATAN KESEHATAN


MASYARAKAT KOLOMBIA
Sistem perawatan kesehatan masyarakat Kolombia terdiri dari dua
rezim: iuran dan bersubsidi. Yang pertama mencakup 44 persen
penduduk dan sisanya 56 persen. Setiap rezim memiliki jaringan
asuransi kesehatan dan penyedia layanan kesehatannya sendiri,
yang bertanggung jawab untuk memberikan paket manfaat yang
telah ditentukan sebelumnya kepada semua pendaftar, yang dikenal
sebagai “Plan Obligatorio de Salud” (POS). Dalam rezim iuran,
para pendaftar (pegawai formal dan kontraktor perorangan)
membayar layanan perawatan kesehatan dengan tarif bulanan
wajib yang sebanding dengan pendapatan mereka, sementara rezim
bersubsidi sepenuhnya didanai oleh pemerintah.
Kontribusi pendaftar di rejim kontributor dikumpulkan oleh
badan pemerintah yang disebut FOSYGA. Agen ini
mendistribusikan kembali kontribusi kepada perusahaan asuransi di
awal tahun menggunakan premi yang disesuaikan dengan risiko
per pendaftar yang dikenal sebagai “Unidad de Pago por
Capitación” (UPC). Premi kapitasi menyesuaikan risiko kesehatan
dengan variabel demografis seperti usia, jenis kelamin, dan
kotamadya tempat tinggal sementara pendapatan netral. Setiap
tahun, semua layanan yang diberikan harus dilaporkan ke
FOSYGA untuk menghitung UPC untuk periode berikutnya.
Analisis empiris kami didasarkan pada database layanan ini di
rezim kontribusi.
Memprediksi Lama Tinggal Tahunan dan Dampaknya pada Biaya Álvaro J. Riascos Natalia Serna
Kesehatan

Pada saat yang sama, perusahaan asuransi dan penyedia layanan Tabel 1: Statistik deskriptif biaya rumah sakit tahunan tertimbang (dalam
kesehatan merundingkan kontrak bilateral dari menu tetap jenis peso Kolombia)
kontrak yang ditentukan oleh undang-undang. Kontrak dalam
menu ini menentukan jenis pembayaran dari perusahaan asuransi Jenis Kelamin Lokation Age group Berarti biaya
Perempuan Perkotaan Usia 0 1.124.958
kepada penyedia untuk menghadiri populasi pendaftarnya, tetapi Laki-laki Urban Usia 0 1.119.639
pengaturan tambahan antara para pihak tidak diperhatikan. Bentuk Wanita Urban Usia 19-44 957.419
Laki-laki Urban Usia 19-44 1.214.199
pembayaran termasuk kapitasi dan biaya-untuk-layanan, yang Perempuan Perkotaan Usia 70-74 3.605.493
mendistribusikan risiko dan insentif dengan cara yang berlawanan Laki-laki Urban Age 70-74 4.958.471
Tabel ini menunjukkan rata-rata biaya rawat inap tahunan untuk kelompok risiko tertentu yang
antara perusahaan asuransi dan penyedia. Perusahaan asuransi ditimbang dengan jumlah hari yang terdaftar. Sumber: Base de Su ciencia, Kementerian
menanggung semua risiko keuangan dan kesehatan saat Kesehatan dan Perlindungan Sosial. Perhitungan penulis.

berlangganan kontrak biaya-untuk-layanan, sementara penyedia


menanggung semua risiko dalam kontrak kapitasi. model pohon, hutan acak, jaringan saraf artifisial dan regresi linier,
Peningkatan biaya dan risiko kesehatan sistem selama dekade membatasi jumlah koefisien menjadi 1 dan memotong prediksi
terakhir telah memperjelas bahwa penerapan dan evaluasi program negatif. Model dibandingkan dan dievaluasi menggunakan Root
promosi dan pencegahan penting untuk mengurangi biaya dan Mean Squared Error (RMSE). Tim pemenang mencapai RMSE di
mengidentifikasi sumber penghematan biaya, misalnya, rumah luar sampel sebesar 0,4438 yang, meskipun demikian, 2,5 kali
sakit yang dapat dihindari. Seperti yang disarankan dalam [1], lipat log LOS rata-rata pada data tahun ketiga.
sistem perawatan kesehatan yang mengandalkan rawat inap untuk Untuk memprediksi LOS pasien di tahun t dengan data klaim t - 1 dan
perawatan pasien dini, seperti sistem perawatan kesehatan t - 2, kami menggunakan panel individu dari rezim kontributor dan
Kolombia, lebih mahal daripada sistem yang menggunakan rawat semua klaim terkait mereka dari tahun 2009 hingga 2011 yang
inap sebagai sumber daya terakhir. disebut "Base de Su - ciencia". Kami tertarik pada tugas regresi
Selama 2011, untuk setiap 100.000 pendaftar, ada 3.500 rumah seperti yang diusulkan dalam Hadiah Kesehatan Warisan dan
sakit di Kolombia [1]. Rawat inap lebih sering di unit pediatrik menggunakan teknik pembelajaran mesin yang berbeda seperti:
(19.983 untuk setiap 100.000 pendaftar neonatal dan pohon yang didorong (GMB), hutan acak (RF), jaringan saraf
8.117 untuk setiap 100.000 pendaftar berusia 4 atau kurang) dan beberapa tiruan (JST), regresi linier ( OLS), dan teknik ensemble (ENS).
kelompok terkait diagnosis seperti infeksi saluran pernapasan akut (32 Untuk tujuan kedua, kami memodelkan aturan keputusan yang
persen rawat inap anak-anak kurang dari 5 tahun, selama 2009 hingga menunjukkan kapan pasien harus diintervensi untuk mengurangi
2012, disebabkan oleh infeksi saluran pernapasan seperti pneumonia risiko dan biaya rawat inap yang diharapkan, sebagai berikut.
atau bronkiolitis akut) dan penyakit diare akut (9 persen dari rawat inap Biarkan yˆsaya menjadi prediksi ln(LOS + 1) untuk pasien i.
anak-anak di bawah 5 tahun, selama 2009-2012, dikaitkan dengan Sejak
penyakit saluran cerna) ([8]). tujuan kedua membutuhkan pengukuran risiko rawat inap, kami
Oleh karena itu, memprediksi lama tinggal pasien tahunan ubah yˆsaya menjadi probabilitas dengan memperkirakan model
merupakan alat penting untuk alokasi sumber daya dan logit pada persamaan (1):
administrasi biaya di rumah sakit dan perusahaan asuransi
kesehatan. Mengidentifikasi faktor-faktor yang meningkatkan rata- β0 + β 1 yˆsaya
rata pasien LOS memungkinkan rumah sakit dan asuransi untuk
terlibat dalam program intervensi dan pencegahan dini untuk
mengurangi risiko rumah sakit.
pitalization. psaya = Prob[ysaya = 1]e = 1 + e (1)
β0
diman + β 1 yˆsaya
3 KERANGKA EMPIRIS a,
Untuk memprediksi LOS pasien dan mengevaluasi program pencegahan, 1 jika
ysaya (2)
kami melakukan dua hal: kami menggunakan teknik pembelajaran mesin = LOS> 0
untuk mengatasi hal pertama kami
0 jika LOS = 0
objektif dan yang kedua kami memodelkan aturan keputusan dan LOS adalah lama tinggal tahunan yang diamati.
berdasarkan prediksi tahap pertama, yang akan menunjukkan kapan Sekarang anggaplah setiap perusahaan asuransi dalam sistem
pasien harus diintervensi untuk mengurangi risiko dan biaya yang menjalani program pencegahan dengan efektivitas α dan biaya per
diharapkan untuk dirawat di rumah sakit tahun depan. Kemudian pasien f. α dapat diartikan sebagai penurunan kemungkinan
kami mengukur potensi penghematan biaya dari program dirawat di rumah sakit tahun depan dan f adalah biaya tetap.
pencegahan tersebut relatif terhadap beberapa skenario dasar. Misalkan g menjadi kumpulan risiko yang ditandai dengan
Memprediksi pasien LOS telah memotivasi bagian dari literatur kombinasi unik dari jenis kelamin (pria atau wanita), lokasi
big data dan pembelajaran mesin dalam perawatan kesehatan. (perkotaan, normal, pedesaan), dan kelompok usia (0, 1-4, 5-14,
Biasanya dilakukan melalui metode regresi dengan 15-18, 19-44, 45-49, 50-54,
mentransformasikan variabel hasil 55-59, 60-64, 65-69, 70-74, dan 75 atau lebih tua). Kategori di setiap
ke skala logaritmik, ln(LOS + 1), seperti yang disarankan [7] dan variabel akan dijelaskan di bagian selanjutnya. Kombinasi ini
[12]. Selama membuat total 72 kumpulan risiko. Biarkan Xgs = Í ∈g x saya jadilah
tahunan a

2013, aliansi penyedia layanan di Amerika Serikat diluncurkan biaya kesehatan pasien LOS> 0 dalam kelompok risiko g dihitung
dengan sebagai
the Heritage Health Prize, sebuah kompetisi untuk memprediksi dalam skala logaritma. Sebagian besar peserta menunjukkan teknik
hari-hari tahunan di rumah sakit berdasarkan data klaim dari dua pembelajaran mesin mengungguli regresi linier biasa. Secara
tahun sebelumnya. Variabel hasil untuk kompetisi ini juga diukur khusus, ansambel
Memprediksi Lama Tinggal Tahunan dan Dampaknya pada Biaya Álvaro J. Riascos Natalia Serna
Kesehatan
jumlah biaya semua layanan yang diklaim selama satu tahun dan biaya tahunan rawat inap untuk pasien dalam kelompok risiko g
biarkan adalah:
Dg = Í ∈g dsaya menjadi jumlah hari setiap pasien dengan s
LOS> 0 dalam kelompok risiko g telah didaftarkan ke sistem kesehatan. Itu a Xg
metode terbukti menjadi model terbaik. Pemenang pencapaian cg = 360 × (3)
digunakan, untuk g
Misalnya, ensembel yang terdiri dari kombinasi linier yang
ditingkatkan

D
Tabel (1) menunjukkan rata-rata biaya rawat inap tahunan untuk
beberapa kelompok risiko ini. Biaya rawat inap tahunan meningkat seiring SA f
bertambahnya usia dan, secara keseluruhan, berbentuk U. Penurunan biaya s pˆ ≥ (C (pˆ ) - C (pˆ ))
YA
a αcg
dari bayi baru lahir ke manusia
N
i =
1
usia 15-18, dan kemudian meningkat secara monoton untuk orang  jikasaya
Í 0 saya0 i 1 i
 
berusia 19 tahun N ( ) CN (pˆ1) i 
i =
1 fC pˆ i = 1 <Í
dan lainnya. CE 2 =  ˆ (9)
Berikut [3] perkiraan biaya rawat inap pasien i adalah  ÍN
i =
1

i = 1 psaya < α c g 
produk antara kemungkinan dirawat di rumah sakit dan saya
 S 
A C 0 (pˆsaya ) > C 1 (pˆsaya ) 
biaya rawat inap di kumpulan risiko yang dimilikinya: Y N
A Í
 ji N
i = 1 i =
N k 1
dimana sayai = C 0 (pˆsaya ) <ÍN C 1 (pˆsaya ) menyarankan seragam
1 i = terbaik
1
C 0 (pˆsaya ) = pˆsa ya cg (4) kebijakan ada intervensi dan Í N i1 = C 0 (pˆsaya ) > C 1 (pˆsaya )
ÍN menyarankan
kebijakan seragam terbaik adalah mengintervensi
Jika asuransi menjalani program pencegahan untuk pasien ini, setiap pasien.
kemungkinan dirawat di rumah sakit menurun dengan efektivitas
program, tetapi biaya rawat inap meningkat secara linier dengan 4 DATA
biaya intervensi per pasien. Jika diintervensi, biaya kesehatan yang Untuk memprediksi LOS pasien dan memperkirakan dampaknya terhadap
diharapkan adalah: biaya kesehatan, kami memiliki klaim tahunan dari sampel 5,7 juta pendaftar
dalam sistem iuran selama 2009 hingga 2011. Sampel tersebut dibangun oleh
C 1 (pˆsaya ) = (1 - α )pˆsa ya cg + f (5) Jadi, Kementerian Kesehatan dan Perlindungan Sosial, dengan fokus pada individu
yang mengklaim setidaknya satu layanan per tahun dan tidak mengubah
pasien harus diintervensi jika perusahaan asuransi mereka selama rentang waktu tersebut. Untuk
kemudahan penghitungan, kami memilih secara acak 1 juta pendaftar dan
π (pˆsaya |α, f ) = C0 (pˆsaya ) - C 1 (pˆsaya ) ≥ 0 (6) klaim terkait.
Informasi per individu meliputi: perusahaan asuransi tempat dia
Atau jika: terdaftar, layanan yang dia minta (klaim) diidentifikasi dengan
kode layanan (CUPS dengan akronim Spanyolnya) 1 , ID penyedia,
f biaya per layanan,
tanggal, diagnosis diidentifikasi dengan Klasi kasi Internasional
Kode Penyakit (ICD) (versi 10), lama tinggal per klaim, usia,
pˆsaya ≥ (7) jenis kelamin, dan kota tempat tinggal.
αcg
Kotamadya tempat tinggal dikategorikan sebagai perkotaan,
normal, atau
Untuk mengukur efektivitas biaya tambahan dari program pencegahan, pedesaan mengikuti definisi wilayah geografis pembayaran dari
kami membandingkan biaya yang dihasilkan oleh program di mana intervensi Departemen Administrasi Nasional Statistik (DANE). Definisi
diputuskan atas ketidaksetaraan dalam ekspresi (7) dengan dua skenario dasar: pertama mengintegrasikan wilayah metropolitan dan kotamadya
kebijakan tanpa intervensi dan kebijakan seragam terbaik yang diberikan α yang berdekatan, yang kedua mencakup kotamadya kecil di sekitar
dan f. wilayah metropolitan, dan yang ketiga mencakup kotamadya
Skenario dasar pertama mengasumsikan biaya yang diharapkan pinggiran. Usia juga dikategorikan dalam 12 kelompok menurut
per pasien selalu C0 . Jika ketidaksetaraan pada (7) tidak berlaku, Kementerian Kesehatan dan Perlindungan Sosial: 0, 1-4, 5-14, 15-
program juga memutuskan untuk tidak mengintervensi pasien, 18, 19-44, 45-49, 50-54, 55-59, 60-64 ,
oleh karena itu peningkatan efektivitas biaya untuk pasien ini 65-69, 70-74, dan 75 atau lebih tua. Akhirnya, kode ICD 10
adalah nol. Sebaliknya, jika ketimpangan pada (7) berlaku, pasien dikategorikan dalam 29 penyakit jangka panjang yang diusulkan oleh
diintervensi, biaya yang diharapkan adalah C 1 , dan efektivitas [2].2
biaya tambahan relatif terhadap Karena data perlu dikumpulkan dari tingkat klaim ke tingkat pasien,
kebijakan tanpa intervensi adalah C 0 - C 1 . Persamaan (8) kami membuat fitur berikut dengan informasi dari t - 2 sampai t - 1:
menunjukkan total LOS tahunan, LOS rata-rata, LOS maksimum, LOS maksimum
efektivitas biaya tambahan relatif terhadap skenario dasar kedua, indikator LOS tahunan lebih dari 30 hari, deviasi standar
pertama: LOS, biaya rata-rata, deviasi standar biaya, pendapatan rata-rata
pendaftar di masing-masing perusahaan asuransi, deviasi standar
ˆ N pendapatan
1 f
CE = Õ sayapsaya ≥ α, | f)
π (pˆsaya di setiap
mahal perusahaan
dalam sampel,asuransi, indikator dari 10 diagnosis yang lebih
i = 1 jumlah hemogram, tes tekanan, CT, tes kreatinin, tiroid
αc g (8)
N ˆ tes, layanan ER, layanan rawat jalan, layanan rumah sakit, domisili-
f
= Õ saya psaya ≥ (-C0 (pˆsaya ) Ca1pˆ
())say layananpanjang
jangka kesehatan, klaim obat, dan jumlah yang berbeda dalam
i = 1 penyakit yang menyerang setiap pasien. Kami juga membuat jumlah
αc g
klaim
Dalam kasus kedua, kebijakan seragam terbaik adalah kebijakan per bulan dan per hari dalam seminggu, indikator penyakit jangka
termurah antara tanpa intervensi dan intervensi penuh. Perhatikan panjang, dan interaksi antara indikator layanan rumah sakit,
bahwa jika kebijakan seragam terbaik adalah untuk campur tangan layanan ER, layanan domisili, dan layanan rawat jalan. Variabel
dan ketidaksetaraan (7) berlaku untuk pasien tertentu, efektivitas terikat adalah logaritma lama tinggal pasien selama tahun t.
biaya tambahan karena ini
pasien nol. Hal yang sama terjadi ketika kebijakan seragam terbaik
1
CUPSlayanan,
semua adalah singkatan dari "Código Único de Procedimientos" dan merupakan kamus dari
tidak ada intervensi dan ketidaksetaraan (7) tidak berlaku. Jadi, Efektivitas biaya tambahan relatif terhadap skenario dasar kedua
total dalam kasus yang relevan adalah:
prosedur, dan obat-obatan yang termasuk dalam paket manfaat Kolombia.
2
Untuk detail lebih lanjut tentang konstruksi kelompok penyakit jangka panjang ini,
lihat www.alvaroriascos.com \reasearch\ekonomi kesehatan
Tabel 2: Statistik deskriptif di set kereta dan tes

Uji Melatih
di sd Berarti sd Berarti Variabel
Variabel tak bebas
0.811 8.346 1.894 8.387 1.891 LOS t
Demografi
0.432 0.497 0.446 0.497 0.445 Pria
0,690 0.180 0,034 0.180 0,034 Umur 0
0,388 0.226 0,054 0.225 0,054 Usia 1-4
0.378 0.305 0.104 0.305 0.103 Umur 5-14
0,570 0.139 0,020 0.138 0,020 Usia 15-18
0,054 0.490 0.402 0.491 0.403 Umur 19-44
0.745 0,275 0,082 0,275 0,082 Umur 45-49
0,084 0.255 0,070 0.254 0,069 Usia 50-54
0.487 0,237 0,060 0.238 0,060 Umur 55-59
0.175 0.222 0,052 0.221 0,052 Usia 60-64
0,687 0.199 0,041 0.199 0,041 Umur 65-69
0,541 0.178 0,033 0.178 0,033 Usia 70-74
0,985 0.214 0,048 0.214 0,048 Usia > 75
0.633 0.499 0,535 0.499 0,535 Lokasi perkotaan
0,550 0,496 0.438 0,496 0.438 Lokasi normal
0.715 0.161 0,026 0.161 0,027 Lokasi pedesaan
Karakteristik klaim
0.177 222.212.1 30.106.1 194.898.3 29.706.1 Biaya rata-rata
0.871 6.356 3.368 6.352 3.369 Rata-rata LOS t-1
0.819 285.711.2 58.462.1 292.593.7 58.556.0 St. Dev. biaya
0.804 19.389 5.613 18.007 5.620 St. Dev. LOS
0,639 26.875 19.024 26.772 19.006 LOS t-1
0.837 0.412 0.217 0.412 0.217 LOS t-1 > 30
0.802 3.597 0.708 3.589 0.707 Max LOS
0,591 1.351 0.149 1.333 0.150 LOS maks kedua
0.709 1.635 0,621 1.628 0,620 Hemogram
0.714 0.174 0,006 0.210 0,006 Tes tekanan
0,934 0.435 0,079 0.432 0,080 CT
0,146 1.417 0.472 1.410 0.469 Tes kreatinin
0,679 0.746 0.221 0.744 0.220 Tes tiroid
0.855 6.083 2.383 6.001 2.382 Layanan ER
0.873 37.705 25.625 37.849 25.617 Layanan rawat jalan
0.872 18.030 2.668 18.161 2.664 Pelayanan rumah sakit
0.209 7.452 0.140 6.955 0.127 Layanan Domisili
0,754 291.343.8 1.020.367.0 291.184.2 1.020.238.0 Pendapatan kontribusi rata-rata
0.780 395.142,5 1.075.271.0 394.921,6 1.075.115.0 St. Dev. kontribusi pendapatan
0,942 20.52 10.72 20.45 10.72 Narkoba
1 993,71 7 993,85 N
Tabel ini menunjukkan mean dan deviasi standar dari beberapa fitur di set kereta dan pengujian. Kolom “di” menunjukkan nilai-p dari uji perbedaan mean antara kedua dataset. Sumber: Base de
Su ciencia, Kementerian Kesehatan dan Perlindungan Sosial. Perhitungan
penulis.
Untuk menghindari prediksi yang berlebihan dalam set kereta karena parameter menggunakan algoritma propagasi balik. Jumlah neuron
model diperkirakan berdasarkan pola dan fitur yang relevan dari sampel ini, di lapisan tersembunyi (12) dan penurunan bobot antar lapisan
kami membuat set pengujian dengan informasi sampel baru dari 1 juta (0,125) dipilih menggunakan validasi silang berulang pada kisi
individu yang dipilih secara acak yang saling eksklusif dari set kereta. Tabel (2) nilai. Untuk model pohon terdorong, kami menggunakan validasi
menunjukkan beberapa statistik deskriptif dari kedua dataset dan menunjukkan silang berulang untuk menemukan parameter optimal untuk jumlah
apakah perbedaan dalam variabel berarti signifikan di antara mereka. Untuk pohon (8000), pengamatan minimum dalam node (100),
semua fitur yang dilaporkan dalam tabel, rangkaian rangkaian kereta dan penyusutan (0,1), dan kedalaman interaksi (2). Di kedua model,
pengujian secara statistik tidak berbeda satu sama lain pada tingkat parameter dipilih untuk meminimalkan RMSE di set kereta. Untuk
kepercayaan 95 persen. Rata-rata lama tinggal selama tahun t adalah 1,89 hari. hutan acak, kami x jumlah pohon menjadi 7500. Akhirnya, kami
Dari mereka yang mengklaim setidaknya satu layanan kesehatan, 22 persen menggunakan metode ensembel yang terdiri dari kombinasi linier
tetap lebih dari 30 hari di rumah sakit selama tahun t- 2 dan dari semua model sebelumnya, tanpa batasan pada jumlah
t - 1. Rata-rata pengguna mengklaim 30 layanan per tahun, di koefisien. Dalam semua kasus, prediksi negatif dipotong menjadi
mana 83 persen terkait dengan layanan rawat jalan dan rata-rata nol dan prediksi di atas ln(360) dipotong di ln(360).
10,72 disebabkan oleh obat-obatan dan pengobatan. Mayoritas Tabel (3) menunjukkan koefisien kombinasi linier dalam ensembel.
individu tinggal di kota-kota perkotaan dan berpenghasilan sekitar Metode berbasis pohon memiliki korelasi positif dengan
1 juta peso Kolombia. Pemrosesan awal lebih lanjut dari database prediktor akhir sedangkan ANN dan OLS memiliki
terdiri dari menghapus pengamatan dengan lebih dari 360 hari di korelasi negatif. Tabel (4) menunjukkan Mean
rumah sakit selama tahun t, menghapus pengamatan dengan lebih Absolute Error (MAE) di luar sampel,
dari 720 hari di rumah sakit dari t.- 2 sampai t - 1, RMSE dan R-squared dari model yang berbeda dihitung pada set tes dan
dan mendikotomi semua variabel kategori. tabel (5) menyajikan beberapa statistik distribusi pasien LOS yang
dihasilkan oleh masing-masing model versus skenario yang diamati dalam
set tes. Dalam hal MAE, ansambel linier mengungguli model lainnya
5 HASIL
sedangkan random forest tampaknya menjadi prediktor terbaik dalam hal
Untuk prediksi LOS tahunan pasien kami menggunakan teknik RMSE dan R-squared. Secara keseluruhan, memodelkan data dengan baik
pembelajaran mesin yang berbeda. Dalam kasus jaringan neural, hingga persentil ke-75 dari distribusi LOS tetapi merupakan prediksi
kami menetapkan fungsi aktivasi linier, satu lapisan tersembunyi,
dan memperkirakan bobot masukan
Tabel 3: Koefisien ansambel linier 2.75

2.50
Variabel tak bebas:
ln(L HAI S + 1) 2.25
ANN -0,058∗∗∗
(0,003) 2.00
BT 0,246∗∗∗
(0,004) 1.75
RF 0,857∗∗∗

RMSE
(0,004) 1.50
OLS -0,047∗∗∗
(0,002) 1.25
Konstanta 0,002∗
(0.001) 1.00
Pengamatan 993.927
Sisa Std. Kesalahan 0,559 0.75
Statistik F 291.939∗∗∗
Tabel ini menunjukkan koefisien dari ansambel linier dari prediksi Ordinary Least Squares 0,50
(OLS), Arti cial Neural Network (ANN), Random Forest (RF), dan Boosted Trees (BT).
0.25
Kesalahan standar dalam tanda kurung. ∗ p < 0,1; ∗∗ p < 0,05; ∗∗∗ p < 0,01. Sumber: Base de
Su ciencia, 0,75 0,80 0,85 0,90 0,95 1,00
Kementerian Kesehatan dan Perlindungan Sosial. Perhitungan Persentil ln (LOS + 1)
penulis.
ANN ENS GBM OLS RF
Tabel 4: Model out-of-sample t

Model MAE RMSE Gambar 1: Variasi dalam RMSE menurut persentil LOS
OLS 0.4546 0.7502
ANN 0,5032 0.7824 distribusi
RF 0.2634 0,5623
BT 0.2721 0,5720 Sumber: Base de Su ciencia, Kementerian Kesehatan dan
ENS 0,2523 0,5609 0,5179 Sosial
Tabel ini menunjukkan MAE, RMSE, dan R-kuadrat di luar sampel dari berbagai model. OLS:
Kuadrat Terkecil Biasa, ANN: Arti Jaringan Neural, RF: Hutan Acak, BT: Pohon yang Didorong,
Perlindungan. Perhitungan
ENS: Ensembel linier. Sumber: Base de Su ciencia, Kementerian Kesehatan dan Perlindungan penulis.
Sosial. Perhitungan penulis.

Tabel 5: Perbandingan persentil distribusi pasien LOS


pendekatan prediksi LOS dan preprocessing data antara kompetisi
Statistik Berarti St. Dev. Min Pctl (25) Pctl (75) Max
Teramati 0.333 0.828 0.000 0.000 0.000 5.889
dan penelitian ini: pertama, dalam kompetisi HHP, set pelatihan
LOS 0.338 0.318 0.000 0.128 0.482 5.886 hanya terdiri dari satu tahun data sementara kami menggunakan
JST 0.370 0.247 0.000 0.229 0.753 5.851
RF 0,332 0,562 0,004 0,028 0,376 3,213 paling banyak dua tahun; kedua, kami kekurangan informasi
BT 0,335 0,580 0,000 0,022 0,390 5,886 mengenai Indeks Charlson, jumlah laboratorium, dan jumlah obat
ENS 0,334 0,605 0,000 0,008 0,373 3,909
Tabel ini menunjukkan mean, deviasi standar, minimum, persentil ke-25, persentil ke-75, dan yang termasuk dalam HHP; dan ketiga, kami memiliki sampel
distribusi maksimum pasien LOS yang dihasilkan oleh masing-masing model dan skenario yang pasien yang lebih besar dibandingkan dengan HHP dan dua
diamati dalam set pengujian. OLS: Kuadrat Terkecil Biasa, ANN: Arti Jaringan Neural, RF:
Hutan Acak, BT: Pohon yang Didorong, ENS: Ansambel Linear. Sumber: Base de Su ciencia, variabel tambahan yang terkait dengan pendapatan bulanan pasien.
Kementerian Kesehatan dan Perlindungan Sosial. Perhitungan penulis. Terlepas dari perbedaan tersebut, fitur yang dibangun untuk
pembelajaran saat ini dan teknik pembelajaran mesin serupa
persentil yang lebih tinggi kurang akurat. Persentil ke-25 dan ke-75 dengan yang digunakan oleh pemenang Milestone.
dari distribusi prediksi ansambel linier lebih mirip dengan persentil Pengujian akurasi model untuk tugas klasifikasi adalah Kurva
yang sesuai dari distribusi yang diamati daripada model lainnya. Karakteristik Operasi Penerima (Receiver Operating
Pada persentil ke-25 terdapat selisih 0,008 hari sehubungan dengan Characteristics Curve / ROC). Pada gambar (2) kami membangun
distribusi yang diamati dan 0,452 hari pada persentil ke-75. kurva KOP dan menghitung luas di bawahnya (AUC) untuk setiap
Namun, LOS maksimum yang diprediksi oleh ansambel linier model. Proporsi yang diprediksi dihitung sebagai prediksi linier di-
adalah 48,8 hari sedangkan maksimum yang diamati adalah 360 dibagi menjadi ln(360). Hasil pengamatan biner mengambil
hari, yang menunjukkan bahwa model secara signifikan nilainya
meremehkan up-per tail distribusi. Sebaliknya, JST melebih- dari 1 jika LOS tahunan lebih besar dari nol. Hutan acak memiliki
lebihkan LOS pada persentil yang lebih rendah dan selisih antara AUC tertinggi, diikuti oleh model pohon terdorong dan ansambel
perkiraan LOS maksimum dan yang diamati adalah 13 hari. linier masing-masing: 0,932, 0,921, 0,920. Perhatikan bahwa
Gambar (1) menunjukkan variasi dalam RMSE untuk persentil regresi linier mengungguli JST dan alasannya adalah karena kita
yang berbeda dari distribusi LOS yang diamati. Metode berbasis mendefinisikan fungsi aktivasi linier pada yang terakhir, sehingga
pohon menunjukkan peningkatan RMSE yang lebih rendah di pada dasarnya sama dengan memperkirakan regresi yang linier
ujung kanan distribusi dibandingkan dengan model OLS dan ANN. dalam variabel tetapi nonlinier dalam parameter.
MAE dari ansambel linier mewakili 75 persen dari rata-rata ln(LOS Gambar (3) menunjukkan prediktor paling penting dalam model
+ 1) di set pengujian dan RMSE 168 persen. Dibandingkan dengan hutan acak atau faktor risiko yang diukur dengan variasi dalam
jumlah node. Hasil yang ditunjukkan pada gambar tidak boleh
tim pemenang dalam Heritage Health Prize (HHP), model terbaik
diinterpretasikan dalam kaitannya dengan arah efek tetapi dalam
kami mengungguli model terbaik dalam kompetisi, yang mencapai
hal kepentingan variabel. Jumlah layanan rumah sakit diikuti
RMSE 0,4438 atau 249 persen dari rata-rata di(LOS + 1) dalam data
dengan LOS maksimum yang terkait dengan klaim dan deviasi
tahun ke-3. Namun demikian, terdapat beberapa perbedaan
standar pendapatan pengguna rata-rata perusahaan asuransi selama
tahun sebelumnya adalah prediktor paling relevan dari LOS tahun
depan. Komorbiditas seperti penyakit kardiovaskular dan penyakit
paru jangka panjang menjelaskan sedikit variasi dalam LOS
tahunan, sementara efek tetap untuk perusahaan asuransi K dan O
lebih signifikan.
1.0

1.0
0.8

0.8
Kemanjuran

0.6
0.6
Kepekaan

0.4
0.4

OLS: 0,775

0.2
0.2

JST: 0.713

RF: 0,932

GBM: 0,921

ENS: 0,920

0.0
0.0

0.0 0.2 0.4 0.6 0.8 1.0


0 100000 200000 300000 400000 500000 600000 700000

1 − Especificity Biaya intervensi

Gambar 2: Akurasi prediksi Gambar 4: Penghematan biaya atas kebijakan tanpa


Sumber: Base de Su ciencia, Kementerian Kesehatan dan intervensi Sumber: Base de Su ciencia, Kementerian
Sosial Kesehatan dan Perlindungan Sosial. Perhitungan penulis.
Perlindungan. Perhitungan
penulis.

Pelayanan rumah
sakit
LOS
maksimum
Std. Dev. Pendapatan berdasarkan prediksi hutan acak versus tanpa intervensi
case, untuk 0 ≤Penanggung
α ≤ 1 dan K
0 ≤ f ≤ 700.000. Aturan keputusan terdiri
Pendapatan rata-
rata menugaskan C1 ke pasien i jika pertidaksamaan dalam persamaan
Std. Dev. LOS
biaya,
(7) aturan
berlaku dankeputusan berdasarkan model prediksi menghasilkan
Variabel

Biaya rata-
Penanggung O
rata tahunan
C 0 jika tidak. Untuk
penghematan biaya setiap
yang kombinasi
signifikan efektivitas
per pasien.dan intervensiyang
Intervensi
LOS Obat membutuhkan biaya
Penyakit 200.000 peso per pasien menghasilkan 50.000 peso penghematan biaya
Maksimum kedua LOS per pasien jika efektivitas program lebih besar dari atau sama dengan
Desember
30%. Untuk biaya intervensi yang lebih besar dari itu, jumlah tabungan
November
per pasien hanya dapat dicapai dengan efektivitas program yang lebih
Penyakit kardiovaskular lainnya
besar dibandingkan dengan kasus tanpa intervensi.
Penyakit paru jangka panjang
Pada Gambar (5) kami menunjukkan plot kontur penghematan
0 20000 40000 60000 80000
Penambahan dalam biaya per pasien karena aturan keputusan versus kebijakan
Kemurnian Node seragam terbaik untuk setiap kombinasi α dan f. Kebijakan
seragam terbaik adalah kebijakan yang menghasilkan
penghematan biaya tertinggi dengan syarat α dan
Gambar 3: Faktor risiko dalam model hutan acak Sumber: f antara mengintervensi semua pasien (menugaskan C 1 kepada
Base de Su ciencia, Kementerian Kesehatan dan semua pasien) dan tidak mengintervensi mereka (menugaskan C 0
Perlindungan Sosial. Perhitungan penulis. kepada semua pasien). Untuk biaya intervensi kurang dari 50.000
peso per pasien dan biaya lebih besar dari
6 POTENSI PENGHEMATAN BIAYA 10%, lebih murah untuk mengintervensi semua pasien daripada menggunakan
aturan keputusan. Kebijakan seragam terbaik dalam hal ini akan menghasilkan
DARI PROGRAM PENCEGAHAN penghematan biaya 20.000 peso per pasien. Namun, ketika biaya intervensi
Untuk mengukur potensi penghematan biaya dari program pencegahan di meningkat, manfaat menggunakan aturan keputusan lebih besar daripada
mana intervensi pasien diputuskan berdasarkan proporsinya yang diprediksi kebijakan seragam terbaik, dan dalam hal apapun lebih besar daripada tidak
seperti pada persamaan (7), kami memperkirakan π untuk kombinasi yang ada intervensi sama sekali untuk program lebih dari 20%. Jika efektivitas
berbeda dari program pencegahan dan biaya intervensi per pasien. Gambar program turun dari ambang batas ini untuk biaya intervensi apa pun, maka
(4), menunjukkan plot kontur penghematan biaya per pasien karena aturan program tersebut tidak bermanfaat karena akan lebih baik jika tidak
keputusan mengintervensi pasien mana pun.
karena dilatih dengan informasi yang simetris antara penyedia,
penjamin, dan pemerintah.
Menggunakan prediksi model kami membangun aturan
1.0

keputusan yang menyarankan kapan harus mengintervensi pasien


untuk mencegah rawat inap dan mencapai penghematan biaya.
Untuk mengukur potensi penghematan biaya, kami menghitung
0.8

selisih total biaya kesehatan tahunan antara program pencegahan


yang keputusan intervensinya bergantung pada prediksi model dan
kebijakan seragam terbaik yang terdiri dari mengintervensi semua
pasien atau tidak mengintervensi mereka, bergantung pada
Kemanjuran

persentase efektivitas program dan biaya intervensi per pasien.


0.6

Hasilnya menunjukkan sistem perawatan kesehatan kontribusi


Kolombia akan mencapai penghematan biaya yang signifikan jika
perusahaan asuransi menerapkan program pencegahan berdasarkan
0.4

pemodelan prediktif dengan efisiensi lebih dari 40% dan untuk


biaya intervensi antara 100.000 dan 700.000 peso per pasien.
Artikel ini berkontribusi pada literatur pembelajaran mesin yang
0.2

berkembang dalam perawatan kesehatan dan memberikan bukti


yang sangat penting untuk memahami sumber peningkatan
pengeluaran kesehatan yang merusak stabilitas keuangan pasar
0.0

kesehatan Kolombia.
0 100000 200000 300000 400000 500000 600000 700000 REFERENSI
Biaya intervensi [1] ACEMI. 2013. Cifras e indicadores del Sistema de Salud. Laporan teknikal. Aso-
ciación Colombiana de Empresas de Medicina Integral.
[2] E. Alfonso, A. Riascos, dan M. Romero. 2013. Kinerja model penyesuaian risiko
di pasar asuransi kesehatan kompetitif Kolombia. (2013).
Gambar 5: Penghematan biaya atas kebijakan seragam [3] M. Bayati, M. Braverman, M. Gillam, K. Mack, G. Ruiz, M. Smith, dan E.
Horvitz.
terbaik Sumber: Base de Su ciencia, Kementerian 2014. Keputusan Berdasarkan Data untuk mengurangi penerimaan ulang untuk gagal
Kesehatan dan Perlindungan Sosial. Perhitungan penulis. jantung: metodologi umum dan studi kasus. PLOS One 9, 10 (2014), 1–9.
[4] K. Chang, M. Tseng, H. Weng, Y. Lin, C. Liou, dan T. Tan. 2002. Prediksi
Lama Tinggal Stroke Iskemik Pertama Kali. Stroke 33, 11 (2002), 2670–2674.
[5] G. Chertow, E. Burdick, M. Honor, J. Bonventre, dan D. Bates. 2005. Akut
Hasil ini menunjukkan bahwa untuk setiap biaya intervensi dari Cedera Ginjal, Kematian, Lama Rawat, dan Costos pada Pasien Rawat Inap.
100.000 hingga 700.000 peso per pasien dan dengan fasilitas yang Jurnal American Society of Nephrology 16, 11 (2005), 3365-3370.
[6] J. Clague, E. Craddock, G. Andrew, M. Horan, dan N. Pendleton. 2002.
lebih besar dari 40%, aturan keputusan otomatis berdasarkan Prediktor hasil setelah patah tulang pinggul. Waktu masuk memprediksi lama
pemodelan prediktif merupakan sumber penghematan biaya yang tinggal dan kematian di rumah sakit. International Journal of Care Injured 33
(2002), 1-6.
penting untuk setiap perusahaan asuransi dalam sistem perawatan [7] P. Cleary, S. Pauker, dan B. Mcneil. 1991. Variasi dalam Lama Rawat dan Hasil
kesehatan kontributif Kolombia. Aturan keputusan dan hasil yang untuk Enam Kondisi Medis dan Bedah di Massachusetts dan California. The
disajikan dalam bagian ini menjelaskan heterogenitas pasien dalam Journal of American Medical Association 266, 1 (1991), 73-79.
[8] MinSalud. 2014. Análisis de Situación de Salud. Laporan teknikal. Ministerio de
dua cara: pertama, model prediktif dilatih tentang karakteristik Salud y Protección Social.
demografi dan morbiditas pasien dan kedua, biaya kesehatan [9] P. Rezaei, M. Ahmadi, S. Alizadeh, dan F. Sadoughi. 2013. Penggunaan Teknik
Penambangan Data untuk Menentukan dan Memprediksi Lama Rawat Inap
tahunan diperbolehkan untuk bervariasi per pasien. Pasien Jantung. Penelitian Informatika Kesehatan 19, 2 (2013), 121–129.
[10] J. Tu dan M. Guerriere. 1993. Penggunaan Jaringan Saraf sebagai Instrumen
7 KESIMPULAN Prediktif untuk Lama Tinggal di Unit Perawatan Intensif Setelah Operasi
Jantung. Komputer dan penelitian biomedis 26, 3 (1993), 220–229.
Rawat inap adalah salah satu sumber utama biaya kesehatan dalam [11] P. Walsh, P. Cunningham, S. Rothenberg, S. O'Doherty, H. Hoey, dan R. Healy.
2004. Ansambel jaringan saraf artifisial untuk memprediksi disposisi dan lama rawat
sistem perawatan kesehatan masyarakat Kolombia. Mengandalkan inap pada anak-anak yang mengalami bronkiolitis. European Journal of Eemergency
rawat inap untuk perawatan pasien meningkatkan risiko Medicine 11, 5 (2004), 259-264.
kekurangan tempat tidur di rumah sakit dan risiko hasil kesehatan [12] C. Winslow, R. Bode, D. Felton, D. Chen, dan P. Meyer. 2002. Dampak
Komplikasi Pernafasan pada Lama Rawat Inap dan Biaya Rumah Sakit pada
yang lebih buruk pada pasien. Oleh karena itu, memprediksi lama Cedera Tulang Belakang Serviks Akut. Jurnal DADA 121, 5 (2002), 1548-
tinggal pasien tahunan merupakan alat yang penting untuk 1554.
administrasi biaya dan alokasi sumber daya bagi perusahaan
asuransi dan penyedia. Dalam makalah ini kami menggunakan
teknik pembelajaran mesin untuk memprediksi LOS pasien
tahunan berdasarkan karakteristik mereka dari tahun-tahun
sebelumnya. Kami menunjukkan model berbasis pohon seperti
pohon yang diperkuat, hutan acak dan ansambel prediksi mereka
mengungguli model linier dan jaringan saraf tiruan, dalam ukuran
seperti RMSE, MAE dan R-squared. Sehubungan dengan rata-rata
LOS dalam sampel kami, kami mencapai tingkat kesalahan yang
lebih rendah dibandingkan dengan hasil yang diperoleh oleh tim
pemenang Heritage Health Prize, meskipun ada perbedaan dalam
cara pemrosesan data kami. Dibandingkan dengan beberapa upaya
internasional dalam memprediksi LOS tahunan, model terbaik
kami sangat prediktif dan cocok untuk setiap agen di pasar
perawatan kesehatan Kolombia,

Anda mungkin juga menyukai