Anda di halaman 1dari 14

LAPORAN SHARING JURNAL

“Machine Learning For Prediction Of Septic Shock At Initial Triage In


Emergency Depertemen”

Untuk Memenuhi Tugas Profesi Ners


Departemen Keperawatan Gawat Darurat

Disusun oleh:
Rossyta (190070300011040)

PROGRAM STUDI PROFESI NERS


JURUSAN KEPERAWATAN FAKULTAS KEDOKTERAN
UNIVERSITAS BRAWIJAYA
MALANG
2020
PEMBAHASAN JURNAL

A. Identifikasi Jurnal

Judul : ”Machine Learning For Prediction Of Septic Shock At


Initial Triage In Emergency Depertemen”
Pengarang : Joonghee kim, et al.
Tahun : 2020
Penerbit : Journal Of the Crtical

B. Latar Belakang Jurnal

Sepsis adalah gangguan organ yang mengancam keselamatan hidup yang


disebabkan oleh reaksi disregulasi pada infeksi. Ini adalah masalah
kesehatan yang siginfikan dengan perkiraan kasus global yang diperkiran
148 per 100.000 ribu orang/tahun dengan kasus kematian 26%. Deperteman
UGD mempunyai peranan yang penting dalam penanganan awal kasus
sepsis. Lebih dari satu setegah kasus pertama kali diidentifikasi di IGD. IGD
semakin berperan aktif dalam penanganan pertama sepsis dilakukan dengan
tindakan resusitasi untuk hemodinamik dan inisiasi dalam pemberian
antibiotic. Syok septik merupakan sub kategori sepsis yang mendasari
sirkulasi sel dan ketidaknormalan metabolisme yang dikaitkan dngan resiko
kematian yang besar. Digambarkan secara operasional sebagai sebuah
kondisi septik yang memerlukan vasopressor untuk mempertahankan rata-
rata tekanan arteri (MAP) >65 mmHg dengan level serum laktasi > 2 mmol/L
dengan pemberian cairan resusitasi yang cukup. Dengan adanya. kasus
kematian yang tinggi dan ketidakstabilan hemodinamik sangat penting untuk
dilakukan skrining septik shock di ugd dengan triage dengan sisa yang tidak
diketahui. Tujuan utama dari penelitian ini adalh untuk mengetahui hasil dari
ML-based sebagai triage dalam menskrining pasien syok septik di IGD.

C. Metode Penelitian

Bahan-bahan dan metode-metode


1) Desain studi

Studi observasional terpusat (single-center) yang menggunakan database


catatan kesehatan elektronik (EHR) pasien yang mengunjungi UGD untuk
dugaan infeksi dari 2008 hingga 2016. Fasilitas penelitian adalah rumah sakit
akademik tersier yang berlokasi di Korea Selatan dengan kunjungan UGD
tahunan dari lebih dari 80.000 pasien per tahun. Dewan peninjau kelembagaan
dari lokasi penelitian menyetujui penelitian dan memberikan pengabaian
persetujuan berdasarkan informed consent.

2) Populasi dan hasil utama

Populasi penelitian adalah sebagai berikut orang dewasa (usia ≥ 20 tahun)


pasien di UGD dengan dugaan infeksi. Dugaan infeksi ditentukan dengan
mengambil kultur dan resep antibiotik sistemik dalam waktu 24 jam setelah
kedatangan di UGD. Kunjungan kasus trauma, kasus trauma yang ditransfer
dan kasus trauma dengan data >50% salah/ hilang/tidak singkron dikecualikan.
Kunjungan berulang diperlakukan sebagai kasus independen. Hasil utama
adalah pengembangan syok septik (atau henti jantung) dalam 24 jam setelah
kedatangan ED. Syok septik didefinisikanmengikuti kriteria klinis SEPSIS-3
[5,10] dengan asumsibahwa resusitasi volume yang memadai diberikan dalam
waktu tigajam. Oleh karena itu, kasus syok septik secara klinis didefinisikan
sebagai ketergantunganpada vasopressor (indeks vasopresor kumulatif [CVI]
≥2) [28] pada atau setelahtiga jam perawatan ED sampai 24 jam disertai dengan
peningkatantingkat serum laktat (≥2) diukur dalam jendela waktu yang sama
(3sampai 24 jam). Jika tidak ada pengukuran kadar serum yang diperoleh di
jendela akhir(3 hingga 24 jam), kami mengasumsikan bahwa case positif untuk
syok septik jikapasien masih tergantung vasopresor (CVI ≥2) pada atau setelah
12 jam (12hingga 24 jam) perawatan di UGD.

3) Variabel Predictor dan Preprocessing


Predictor berikut diambil dari EHR; usia; seks; keluhan utama (CC); tanda-tanda
vital awal, termasuk tekanan darah sistolik (SBP, mmHg), tekanan darah
diastolik (DBP, mmHg), denyut nadi (PR, denyut per menit), kecepatan
pernapasan (RR, napas per menit) dan suhu tubuh (BT, diukur dalam Celsius);
tingkat kesadaran awal diukur pada skala AVPU (AVPU: Alert, Verbal, Pain dan
Unre-sponsive); pengukuran saturasi O2 diukur dengan pulse oximetry
(SpO2,%);dan hasil tes darah awal, termasuk jumlah sel darah putih (WBC, 10 9
/ L), jumlah diferensial, berat distribusi sel darah merah (RDW,%), jumlah
trombosit (10 9 / L), rasio waktu normalisasi internasional sebelum protrombin
(PT INR), fibrinogen (mg / dL), nitrogen urea darah (BUN, mg / dL), natrium
(mmol / L), kalium (mmol / L), klorida (mmol / L), kreatinin (mg / dL), kreatinin
(mg / dL), aspartat aminotransferase (AST , U / L), alanine aminotransferase
(ALT, U / L), alkaline phosphatase (ALP, U / L), total bilirubin (mg / dL), albumin
(g / dL) dan protein C-reaktif (CRP, mg / dL).

Variabel kategorikal dengan kardinalitas rendah (jenis kelamin dan AVPU)


dikodekan satu kali. CC, yang memiliki kardinalitas tinggi (lebih dari 1500),
tertanam ke dalam ruang vektor 16-dimensi menggunakan dekomposisi nilai
singular (SVD) [ 29 ] Embedings CC diproyeksikan ke plot pencar 2-D
menggunakan t-SNE (embeding tetangga stochastic) terdistribusi untuk
visualisasi. Variabel kontinu ditransformasikan oleh metode YeoJohnson, yang
merupakan perpanjangan dari transformasi Box-Cox, untuk meningkatkan
normalitas [ 30 ] Nilai yang hilang diperhitungkan dengan cara ataumode yang
sesuai dengan dimasukkannya variabel indikator. Secara khusus,kami
menerapkan imputasi untuk prediktor kontinyu dan imputasi metodeuntuk
prediksi kategori. Nilai tema / mode dihitungmenggunakan dataset pelatihan dan
diterapkan secara seragam untuk pelatihan dandataset uji.

4) Pelatihan pengklasifikasi ML
Kinerja dari classifier tergantung pada set prediktornya. Di sebuah UGD khas,
informasi dasar, seperti usia, jenis kelamin, CC, tanda-tanda vital, SpO2(jika
diukur pada awalnya) dan AVPU, tersedia saat triase. Tidak seperti prediktor
lain,CC perlu disematkan ke ruang dimensi yang lebih rendah
mengingatkardinalitas tinggi. Hasil uji laboratorium membutuhkan beberapa jam
untuk dilaporkan;Namun, hasil ini kadang-kadang tersedia di triase jika pasien
dirujuk dari departemen rawat jalan atau layanan kesehatan lainnya. Oleh
karena itu, kami mengasumsikan empat skenario prediksi yang
berbedaketersediaan:
1) Prediktor dasar (usia, jenis kelamin, tanda vital, SpO2 danAVPU),
2) Prediktor baseline dan CC embedding,
3) Prediktor baselineditambah hasil tes laboratorium awal, dan
4)Prediktor dasar ditambah keduanya(Hasil embeddings dan uji laboratorium
CC).
Semua algoritma ML duludioptimalkan dan diuji dalam empat kondisi berbeda
ini. SemuaVariabel non laboratorium yang digunakan dalam penelitian ini
tersedia di triase.Namun, sebagian besar variabel laboratorium tidak tersedia di
kasus triase.

Populasi penelitian secara acak dibagi menjadi pelatihan dandataset uji dengan
rasio 6: 4 menggunakan nomor identifikasi pasien. Enamalgoritma ML dasar,
termasuk mesin vektor dukungan dengan radialbasis function kernel (SVM),
gradient-boosting machine with Bernoulli loss (GBM), random forest (RF),
regresi adaptif multivariatsplines (MARS), penyusutan absolut dan operator
seleksi(Lasso) dan regresi ridge, dinilai. Selain itu, kami juga membangundua
pengklasifikasi ansambel menggunakan SVM, GBM, RF, MARS dan
laso sebagai pelajar dasar (punggungan tidak digunakan karena korelasinya
yang tinggidengan laso). Algoritma pertama menggunakan rata-rata sederhana,
dan yang keduaAlgoritma yang digunakan MARS memanfaatkan prediksi basis
yang divalidasi silangpelajar.

Pelatihan dilakukan dengan menggunakan paket mlr, yang


merampingkanmembangun model prediktif dengan berbagai paket ML
[31].Hyperparameter disetel menggunakan penelusuran grid dengan validasi
silang 5 kali lipat.AUROC digunakan untuk memilih kombinasi hyperparameter
terbaik.Spesifikasi ruang pencarian dan model dijelaskan dalam tambahan
Tabel 1.

Selain itu, kami melatih pengklasifikasi multiplemultilayer perceptron (MLP)dari


berbagai kombinasi ukuran jaringan, hyperparameter, danskema pelatihan
untuk mengidentifikasi kombinasi terbaik. Menggunakan pencarian kotak,setiap
kombinasi diuji dalam set validasi, yang termasuk 40%kasus dalam set data
pelatihan. Penjelasan rinci tentang pencariantempat disediakan dalam tabel
tambahan 2.

5). analisis statistik


Variabel kategori dilaporkan menggunakan frekuensi dan proporsi.Variabel
kontinyu dilaporkan menggunakan median dan kuartil antarjarak (IQR). Uji-t, uji
rank-sum Wilcoxon, uji chi-square atauTes pasti Fisher dilakukan sebagaimana
mestinya untuk perbandingan antarakelompok.

Kinerja pengklasifikasi ML dinilai dengan menghitung areadi bawah kurva


karakteristik operasi penerima (AUROC) danarea di bawah kurva presisi-recall
(AUPRC) dalam set data pengujian. 95% keyakinaninterval (CI) dari AUROC
dan AUPRC dihitung dengan2000 replikasi bootstrap bertingkat dari set data
pengujian. Sensitivitas (ingatan),spesifisitas, nilai prediksi positif (PPV, presisi)
dan negatifnilai prediksi (NPV) dinilai setelah menetapkan spesifisitas pada
90%.Pilihan spesifisitas 90% dirancang untuk mencapai NPV N95% dan
dibuat selama langkah analisis data. 95% nilai CI sensitivitas,spesifisitas, PPV
dan NPV dinilai dengan menghitung binomial yang tepatbatas kepercayaan.
Skor qSOFA dan MEWS serta usia dan jenis kelamin mereka disesuaikannilai-
nilai (skor qSOFA yang disesuaikan dan MEWS) digunakan sebagai
baselineuntuk perbandingan. Selain itu, kami menilai peringkat kepentingan
variabeldari prediktor dengan mengukur pengurangan akurasi prediksisetelah
permutasi dari prediktor target.
Definisi klinis syok septik yang digunakan dalam penelitian ini mengasumsikan
memadai resusitasi cairan dalam tiga jam. Namun, ada kemungkinan ini tujuan
tidak dapat dicapai pada beberapa pasien. Oleh karena itu, kami melakukan
sebuah analisis sensitivitas dengan asumsi alternatif cairan yang memadai
sehingga resusitasi bisa ditunda hingga enam jam. Dengan asumsi baru
ini,beberapa kasus yang tergolong syok septik akan terjadi secara prematur
diklasifikasikan sebagai syok nonseptik. Kami membuat semua pengklasifikasi
ML
lagi dalam kondisi ini dan menilai kembali nilai AUROC dan AUPRC dari model
untuk mengevaluasi apakah hipotesis utama yang mengklasifikasikan MLunggul
dari skor klinis konvensional masih berlaku.

P Values <0,05 dianggap signifikan. Semua penanganan data dan


analisis statistik dilakukan dengan menggunakan R-paket versi 3.5.1 (R
foundation for statistical computing, vienna, Austria).

D. Hasil Penelitian

Ada 55.313 kunjungan IGD dengan dugaan infeksi dari 2008 hingga 2016.

Setelah pengecualian kunjungan trauma (1582, 2,9%), kasus yang ditransfer

(1917, 3,5%) dan mereka dengan nilai hilang N50% (2515, 4,5%), total

49.299 pasien dimasukkan sebagai populasi penelitian (Gambar. 1). Di

antara populasi, total 4782 pasien (9,7%) diidentifikasi mengalami syok

septik dalam waktu 24 jam setelah kedatangan di IGD (Tabel 1). Kematian

enam bulan di rumah sakit adalah 31,1% pada kelompok syok septik dan

7,6% pada pasien tanpa syok septik. Durasi rata-rata di IGD adalah 576
menit pada pasien dengan syok septik dan 1036,5 menit pada mereka tanpa

syok septik.

1) Tabel 2 menunjukkan kinerja diskriminatif dari pengklasifikasi non-Machine

Learning termasuk skor qSOFA dan MEWS dan usia serta nilai yang

disesuaikan jenis kelamin. QSOFA yang disesuaikan menunjukkan AUROC

tertinggi 0,832 (interval kepercayaan 95% [CI], 0,822-0,842), dan qSOFA

yang tidak disesuaikan menunjukkan AUPRC tertinggi 0,395 (95% CI, 0,371-

0,419). Dalam jurnal ini pengklasifikasi 9 Machine Learning (6 basis, 2


ansambel, dan pengklasifikasi 1MLP) untuk masing-masing dari empat set

prediktor yaitu 1) prediktor baseline, 2) prediktor baseline ditambah

penyematan keluhan utama, 3) prediktor baseline ditambah hasil uji

laboratorium awal, dan 4) baseline prediktor plus keduanya.

2) Hyperparameter yang digunakan untuk pembuatan model disajikan dalam

tabel tambahan 1 dan 2 dan proyeksi 2-D dari menambahkan keluhan utama

divisualisasikan pada Gambar. 2. Pengklasifikasi ML yang menggunakan

prediktor dasar mengungguli qSOFA yang disesuaikan dengan AUROC

mereka yang berkisar dari 0,882 hingga 0,902. AUROC maksimum

ditemukan pada pengklasifikasi ensemble dengan nilai AUROC 0,902 (95%

CI, 0,895-0,909) untuk rata-rata sederhana dan 0,902 (95% CI, 0,895-0,908)

untuk ensembel berbasis MARS. Demikian pula, mereka juga menunjukkan

nilai AUPRC yang lebih tinggi masing-masing 0,556 (0,531-0,580) dan 0,554

(0,529-0,578).

3) Dimasukkannya keluhan utama dikaitkan dengan peningkatan kecil tetapi

signifikan secara statistik dari AUROC di GBM dan dua pengklasifikasi

ansambel (semua pb 0,001) dan AUPRC di semua pengklasifikasi Machine

Learning (semua pb 0,001 kecuali RF, yang p = 0,035; tabel tambahan 4).

Penambahan temuan laboratorium awal ke set prediktor dasar dikaitkan

dengan peningkatan kinerja yang signifikan (baik AUROC dan AUPRC) di

semua pengklasifikasi Machine Learning (semua pb 0,001). Dengan

penyertaan keluhan utama dan temuan laboratorium awal, AUROC berkisar

dari 0,904 hingga 0,924, dan penggolong ensemble yang memanfaatkan


MARS menunjukkan kinerja tertinggi (AUROC, 0,924; 95% CI, 0,918-0,929;

AUPRC, 0,623; 95% CI, 0,599-0,645). Dimasukkannya keluhan utama ketika

hasil tes laboratorium awal tersedia dikaitkan dengan peningkatan AUROC di

GBM dan dua model ansambel (p = 0,019, 0,001 dan 0,003, masing-masing)

dan peningkatan AUPRC di GBM, RF, MARS, Lasso, ridge dan keduanya.

model ansambel (semua pb 0,001). Namun, penurunan AUPRC tercatat

dalam model SVM dan MLP (semua p <0,001). Gambar Tambahan S1

menunjukkan plot kalibrasi dari seluruh pengklasifikasi.

4) Tabel 3 menunjukkan peringkat kepentingan variabel hingga kelima untuk

setiap pengklasifikasi Machine Learning. SBP adalah variabel

nonlaboratorium penting yang paling konsisten muncul di setiap

pengklasifikasi (28/28) diikuti oleh AVPU: Alert (19/28), SpO2 (9/28), DBP

(8/28) dan BT (8/28). Untuk variabel laboratorium, neutrofil tersegmentasi


(4/14), monosit (4/14), WBC (3/14), limfosit (3/14) dan kreatinin (3/14) adalah

variabel yang paling penting secara konsisten.

5) Analisis sensitivitas dilakukan dengan asumsi alternatif bahwa resusitasi

cairan yang adekuat dapat ditunda hingga enam jam. Dengan asumsi ini,

jumlah kunjungan dengan komplikasi syok septik menurun menjadi 4636 /

49.299 dari 4782 / 49.299. Hasil analisis sensitivitas tidak berbeda dengan

analisis utama dengan semua pengklasifikasi Machine Learning

menunjukkan kinerja yang lebih unggul dibandingkan dengan skor klinis dan

dua model ensemble menunjukkan kinerja terbaik (Gambar Tambahan S2,

tabel tambahan 5).

E. Diskusi

Dalam studi ini, mengevaluasi performa berbagai pengklasifikasi Machine


learning (ML) dalam empat kondisi ketersediaan data yang berbeda.
pengklasifikasi ini memiliki kekuatan yang tinggi bahkan ketika diberikan hanya
dengan data dasar dan mengungguli skor tradisional seperti qSOFA atau MEWS.
ini adalah laporan pertama dari kelayakan menggunakan algoritma ML untuk
skrining syok septik di triase emergency.

Algoritma Machine learning (ML) untuk mengidentifikasi atau memprediksi


berbagai kondisi terkait sepsis, termasuk infeksi, infeksi dengan sindrom respons
inflamasi sistemik (SIRS), sepsis (sepsis berat sebelum definisi SEPSIS-3, kondisi
infeksi yang disertai dengan disfungsi organ) dan syok septik.
Algoritme Machine learning (ML) memberikan performa prediksi yang lebih
baik daripada regresi konvensional karena kemampuannya yang bervariasi untuk
mengotomatiskan pemilihan fitur dan untuk menangani nonlinier dan interaksi.
Algoritme ini sangat menjanjikan dalam perawatan kesehatan karena peningkatan
yang signifikan dalam daya komputasi (penyimpanan data dan informasi yang
berbasis internet) dan ketersediaan "data besar", seperti database EHR. Namun,
melatih pengklasifikasi ML memerlukan keahlian yang berbeda dibandingkan
dengan pemodelan regresi konvensional. Praktisi dibutuhkan untuk mengoptimalkan
hyperparameter yang relevan untuk mencapai kinerja terbaik. "Proses penyetelan"
ini menggunakan laporan sementara dari uji performa dalam subset khusus dari set
data pelatihan (set validasi) atau beberapa subset yang dihasilkan oleh skema
validasi silang atau bootstrap.
Tujuan utama dari proses ini adalah untuk menangani masalah trade-off
varian bias. Biasnya adalah kesalahan dari asumsi yang salah dalam algoritma
pembelajaran. Varian adalah variabel dari prediksi model untuk data tertentu dimana
memberikan kita informasi perserbaran data kita. dengan demikian, varian yang
tinggi menunjukkan fleksibilitas yang tinggi membuatnya rentan terhadap overfitting.
Overfitting terjadi karena model yang dibuat terlalu fokus pada training dataset
tertentu, hingga tidak bisa melakukan prediksi dengan tepat jika diberikan dataset
lain yang serupa. Overfitting biasanya akan menangkap data noise yang seharusnya
diabaikan. Overfitting model akan memiliki low loss dan akurasi rendah. Kumpulan
data pelatihan yang lebih besar dapat mengatasi masalah. Namun, praktisi sering
diminta untuk menyesuaikan hyperparameter untuk mengidentifikasi keseimbangan
optimal antara bias dan varians.Di awal studi ini, memiliki harapan yang tinggi untuk
algoritma MLP, mengingat laporan terbaru dari penerapan pembelajaran mendalam
yang berhasil di berbagai bidang. Penemuan ini menunjukkan bahwa skrining syok
septik bukanlah masalah yang “dalam”. Kami menyarankan penggunaan algoritme
ML konvensional untuk menyaring syok septik pada triase emergency.

Anda mungkin juga menyukai