248 523 1 PB PDF
248 523 1 PB PDF
seperti yang dilakukan Tabrizi untuk klasifikasi lima dihubungkan dengan bobot/weight. Struktur jaringan
tipe sel darah putih terbukti pemakaian metode LVQ ditunjukan pada Gambar 1, dimana xi adalah
Learning Vector Quantization (LVQ) sangat masukan (input), yi sebagai luaran (output) dan wii
memuaskan karena komputasi yang sangat ringan dan adalah bobot.
konvergensi baik[10], penelitian LVQ juga diterapkan
untuk mengklasifikasikan sekumpulan data
Electrocardiogram (ECG) penyakit arrhythmia.
Datasets ECG arrhythmia terdiri dari 452 kasus dengan
279 atribut, namun 0,33% data atributnya tidak lengkap.
Data dikelompokan kedalam 16 kelas. LVQ dinyatakan
lebih baik dan cepat daripada Backpropagation [11].
Untuk itu dalam penelitian ini diusulkan sebuah
pendekatan baru untuk klasifikasi stroke secara
terkomputerisasi berdasarkan data klinis pasien
menggunakan metode Learning Vector Quantization
Neural Network.
Gambar. 1. Struktur Jaringan LVQ
II. LEARNING VECTOR QUANTIZATION
Neural Network (jaringan saraf tiruan) termasuk salah Neuron-neuron keluaran pada LVQ menyatakan suatu
satu metode klasifikasi yang populer. Metode ini kelas atau kategori tertentu. Vektor bobot untuk suatu
merupakan suatu generalisasi model matematis dari cara unit keluaran sering dinyatakan sebagai sebuah vektor
kerja otak manusia (sistem saraf) yang didasarkan atas referens menggunakan klasifikasi target yang diketahui
asumsi pemrosesan informasi terjadi pada elemen untuk setiap pola masukan. Apabila beberapa vektor
sederhana yang disebut neuron, sinyal mengalir diantara masukan tersebut memiliki jarak yang sangat
sel saraf/neuron melalui suatu sambungan dimana setiap berdekatan, maka vektor-vektor masukan tersebut akan
sambungan memiliki bobot yang bersesuaian. Bobot ini dikelompokkan dalam kelas yang sama. Pemilihan
akan digunakan untuk menggandakan/mengalikan “vektor referensi” dengan cara kuantisasi vektor pada
sinyal yang dikirim melaluinya. Setiap sel saraf akan data learning. Secara umum algoritma LVQ sebagai
menerapkan fungsi aktivasi terhadap sinyal hasil berikut[13]
penjumlahan berbobot yang masuk kepadanya untuk 1. Inisialisasi vektor referensi, learning rate (α).
menentukan sinyal keluarannya. Model pembelajaran 2. While (stop == false) kerjakan langkah 3-1
jaringan saraf tiruan memiliki 3 paradigma, yaitu: 3. Untuk masing-masing traning input, kejakan
supervised learning artinya kumpulan masukan langkah 4-9
berusaha membentuk target luaran yang sudah diketahui 4. Hitung J minimum dari || x-wj || (1)
sebelumnya (mengacu pada learning data). Perbedaan 5. Update bobot wj dengan syarat:
antara luaran yang masih salah dengan luaran yang 6. if T = Cj, then
diharapkan harus sekecil mungkin. Biasanya lebih baik 7. wj(baru) = wj(lama) + α[x - wj(lama)]; (2)
daripada unsupervised. Kelemahan: pertumbuhan waktu 8. if T ≠ Cj, then
komputasi eksponensial, data bnyk berarti semakin 9. wj(baru) = wj(lama) - α[x - wj(lama)]; (3)
lambat. Kedua adalah unsupervised learning jika 10. Kurangi learning rate
jaringan mengorganisasikan dirinya untuk membentuk 11. Hentikan pada iterasi tertentu atau learning rate
vektor-vektor masukan tanpa menggunakan data atau mendekati 0
contoh-contoh pelatihan, pada umumnya ada umpan Dimana,
balik. Terakhir adalah gabungan antara unsupervised x = training vector (x1,x2,…,xn)
dan supervised. Sedangkan berdasarkan aturan T = Kelas dari training vector
pembelajaran dalam Neural Network digolongkan wj = bobot vektor untuk luaran ke-j
dalam: correlation learning disebut juga hebbian, Cj = Kategori atau kelas yang dihasilkan dari
competitive learning, dan feedback-based weight luaran ke-j
adaptation[12]. || x-wj || = Jarak Euclidean antara vektor masukan
Learning Vector Quantization (LVQ) termasuk jenis dan bobot vektor ke-j
Neural Network yang dikembangkan oleh Teuvo
Kohonen tahun 1989. LVQ adalah algoritma klasifikasi III. METODE PENELITIAN
prototipe supervised dengan aturan Competitive Sistem dibangun dengan skema seperti pada Gambar
Learning versi dari algoritma Kohonen Self-Organizing 2 di bawah ini. Data yang digunakan pada penelitian ini
Map (SOM). Model pembelajaran LVQ dilatih secara adalah data sekunder dari dokumen rekam medis pasien
signifikan agar lebih cepat dibandingkan algoritma lain rawat inap Rumah Sakit Bina Sehat dan Rumah Sakit
seperti Back Propagation Neural Network. LVQ Umum Kaliwates Jember. Data-data tersebut berisi data
merupakan single-layer net pada lapisan masukan yang pemeriksaan fisik (anamnesis), data riwayat penyakit
terkoneksi secara langsung dengan setiap neuron pada dan data hasil pemeriksaan laboratorium darah pasien.
lapisan keluaran. Koneksi antar neuron tersebut Data pasien yang diambil telah melalui pemeriksaak tim
medis dan memiliki diagnosis dokter spesialis saraf berdekatan, maka vektor-vektor masukan tersebut akan
sebagai acuan dan validasi hasil klasifikasi. dikelompokkan dalam kelas yang sama. Dari proses
pembelajaran ini akan didapatkan bobot-bobot terbaik
Pengambilan Rekam Medis
Data Pasien Pasien
seperti pada Gambar 3 untuk tiap hubungan antara node
masukan dan luaran. Bobot-bobot ini yang akan
disimpan dan digunakan dalam proses pengujian. Proses
Dataset Dataset
pembelajaran dibatasi dengan nilai learning rate atau
Pembelajaran Ujicoba iterasi tertentu. Jika learning rate mendekati nol atau
iterasi telah mencapai iterasi maksimum maka proses
pembelajaran dihentikan.
Proses Pengujian Hasil
Bobot
Pembelajaran
terbaik Klasifikasi Klasifikasi D. Pengujian dan Hasil Klasifikasi
LVQ
Setelah mendapatkan bobot-bobot terbaik, maka
Gambar. 2. Diagram Pengolahan Data
untuk mengetahui keberhasilan dan performa sistem
A. Karakteristik Data harus dilakukan pengujian. Pengujian meliputi tingkat
Data berjumlah 373 data yang terdiri dari penderita akurasi, sensitifitas jumlah data training dan waktu.
laki-laki 52,28% dan perempuan 47,72%. Berdasarkan Tahap ini menggunakan dataset ujicoba. Hasil akhir
klasifikasi Penderita stroke infark sebesar 71,31% dan dari proses klasifikasi adalah keputusan pasien
hemorrhagic 28,69% sesuai dengan literatur maupun menderita stroke infark atau hemorrhagic, hasil ini akan
keterangan pakar melalui wawancara langsung angka di-crossceck dengan diagnosis dokter spesialis saraf
kejadian stroke infark di Indonesia lebih banyak (neurology).
dibanding stroke hemorrhagic. Dilihat dari usia, pasien
yang pernah stroke kurang dari 45 tahun sebanyak 26 IV. HASIL DAN PEMBAHASAN
pasien, usia 45-55 tahun 105 pasien, usia 56-65 tahun A. Program Aplikasi
126 pasien sedangkan usia diatas 65 tahun ada 116 Sistem dalam penelitian ini dikembangkan berbasis
tahun. web dengan bahasa pemrograman PHP dan perangkat
B. Dataset lunak basisdata menggunakan MySQL. Antarmuka
merupakan elemens sistem yang penting karena sebagai
Dataset adalah kumpulan data yang ada dalam
alat komunikasi antara pengguna dan sitem. Antarmuka
basisdata. Sesuai kebutuhan sistem, data dibagi menjadi
pertama adalah untuk melakukan inisialisai parameter
dua untuk pembalajaran (training) jaringan saraf tiruan
training seperti pada Gambar 4 diantaranya
learning vector quantization dan untuk ujicoba agar
memasukkan nilai maksimum epoch yang digunakan
tidak saling intervensi. Data yang digunakan untuk
untuk menghentikan program jika telah menghasilkan
training sebanyak 323 data sedangkan untuk ujicoba 50
nilai luaran yang sama. Learning rate(α) adalah laju
data. Data ujicoba harus benar-benar berbeda dari data
pembelajaran, semakin besar α maka semakin besar
pembelajaran untuk memenuhi aspek obyektifitas.
langkah pembelajaran. Decrement α besaran nilai yang
Pembagian ini dilakukan secara acak dimana masing-
akan digunakan untuk mengurangi nilai α agar
masing terdiri dari data dengan klasifikasi stroke infark
mendekati bobot ideal. Minimum α adalah nilai terkecil
(±70% ) dan hemorrhagic(±30% ).
dari α yang diinginkan.
C. Pembelajaran LVQ
Pada tahap ini merupakan tahap dimana jaringan
saraf tiruan LVQ melakukan proses “belajar” dengan
sendirinya berdasarkan data pembelajaran oleh karena
itu proses pembelajaran ini dikenal sebagai model
terawasi (supervised learning).
mempermudah pengujian dengan banyak data masukan dibanding total subyek infark. Spesifitas adalah proporsi
sekaligus, pada percobaan kali ini data uji berjumlah 50 subyek dengan klasifikasi hemorrhagic dengan hasil uji
data. Gambar 5 merupakan hasil klasifikasi multidata. diagnosis negatif dibanding total subyek Hemorrhagic.
Dalam tampilan hasil klasifikasi ini ada dua kolom yaitu
nilai klasifikasi yang sebenarnya berdasarkan diagnosis
dokter spesialis saraf dan luaran dari sistem.
Ditampilkan juga jumlah data yang benar/sesuai
klasifikasinya serta yang salah.
TABEL 1
DAFTAR FITUR DAN NILAI ATAU SATUANNYA
1 Umur Tahun
[0].Perempuan;
2 Jenis Kelamin
[1].Laki-laki
3 Sistol mmHg
4 Distol mmHg
5 Suhu Tubuh 0
Celsius Gambar. 5. Hasil Pengujian Klasifikasi
6 Denyut Nadi x/menit TABLE 2
7 Pernafasan x/menit UJI DIAGNOSIS SKENARIO 1
8 Kesadaran [0].Tidak; [1]. Menurun
9 Mual_Muntah [0].Tidak; [1]. Iya Diagnosis Dokter
10 Nyeri Kepala [0].Tidak; [1]. Iya Inf Hemo Jumlah
11 Sulit Bicara [0].Tidak; [1]. Iya Hasil Inf 35 15 50
12 Gerak Terbatas [0].Tidak; [1]. Iya Program Hemo 0 0 0
Kondisi Jumlah 35 15 50
13 [0].Tidak; [1]. Iya
Badan(Lemas)
14 Kejang [0].Tidak; [1]. Iya Keterangan: Inf = Stroke infark; Hemo = Stroke hemorrhagic
15 Diabetes Mellitus [0].Tidak; [1]. Iya
16 Hipertensi [0].Tidak; [1]. Iya
Nilai-nilai sensitifitas dan spesifisitas tersebut
17 CVA [0].Tidak; [1]. Iya digambarkan dalam kurva Receiver Operating
18 Kolesterol [0].Tidak; [1]. Iya Characteristic (ROC) [15] seperti ditunjukkan Gambar
19 Hemoglobin gr/dl
6. Untuk menilai tingkat keberhasilan diagnosis yang
20 Kadar Gula Acak Mg/dl
21 Blood Urea Nitrogen Mg/dl dihasilkan program dilihat dari Nilai Area Under Curve
22 Kreatinin Mg/dl serum/plasma (AUC) sebesar 0,5, hal ini berarti bahwa pengujian
23 Uric Acid Mg/dl tergolong dalam kondisi gagal (fail/F) dan tidak dapat
24 Kolesterol Total Mg/dl
25 Trigyeride Mg/dl dijadikan sebagai alat bantu diagnosis stroke.
26
High Density
Mg/dl
Sensitivitas = 35 / (35 + 0) x 100%
Cholesterol = 1 (100%)
Low Density
27
Cholesterol
Mg/dl Spesifisitas = 0 / (0 + 15) x 100%
28 Natrium mmol/L = 0 (0%)
29 Kalium mmol/L Nilai prediksi positif = 35 / (35 + 15) x 100%
30 Kalsium mg/dL
31 Chlorida mmol/L = 0,7 (70%)
32 Albumin gr/dl Nilai prediksi negatif = 0 / (0+ 0) x 100%
=-
(sumber: dokumen rekam medis RS.Bina Sehat dan
RSU.Kaliwates Jember Jawa Timur)
1
B. Pengujian Akurasi 0.9
0.8
Fitur yang digunakan berdasarkan data pasien yang
terdapat dalam dokumen rekam medis rumah sakit 0.7
Sensitivitas
dihitung nilai sensitivitas, spesifisitas, nilai prediksi bentuk grafik seperti pada Gambar 7 dibawah ini.
positif dan nilai prediksi negatif. Nilai-nilai sensitifitas Semakin banyak jumlah data training maka semakin
dan spesifisitas tersebut digambarkan dalam kurva banyak pula waktu yang dibutuhkan. Hal ini dapat
Receiver Operating Characteristic (ROC) seperti diartikan jika keterbatasan jumlah data tidak menjadi
ditunjukkan Gambar 7. kendala bagi proses pembelajaran LVQ.
TABLE 3
UJI DIAGNOSIS SKENARIO 2 TABEL 4
Diagnosis Dokter WAKTU TRAINING (DETIK)
Inf Hemo Jumlah Jumlah Data Training Skenario 1 Skenario 2
Hasil Inf 34 1 35
Program Hemo 1 14 15 100_a 0,09375 0,0957
Jumlah 35 15 50 100_b 0,094533 0,094487
100_c 0,097811 0,09413
Keterangan: Inf = Stroke infark; Hemo = Stroke hemorrhagic 150 0,145324 0,144826
Sensitivitas = 34 / (34 + 1) x 100% 200 0,1991 0,191964
250 0,241385 0,236768
= 0,971 (97,1%) 323 0,318657 0,31022
Spesifisitas = 14 / (1 + 14) x 100%
= 0,933 (93,3%)
Nilai prediksi positif = 35 / (34 + 1) x 100%
= 0,971 (97,1%)
Nilai prediksi negatif = 14 / (14+ 1) x 100%
= 0,933 (93,3%)
Sekali lagi untuk menilai tingkat keberhasilan
diagnosis yang dihasilkan program dilihat dari Nilai
Area Under Curve (AUC) dan dari perbobaan skenario
2 diperoleh hasil yang lebih baik yaitu sebesar 0,952,
hal ini berarti bahwa pengujian tergolong dalam kondisi
sangat baik (excellent/A).
1
0.9
0.8
Gambar. 7. Grafik Uji Waktu Training
0.7
Sensitivitas
0.6
0.5 V. KESIMPULAN
0.4 Berdasarkan uraian permasalahan hingga hasil
0.3 penelitian, maka dapat disimpulkan beberapa hal
0.2 sebagai berikut:
0.1 1. Sistem yang dibangun berhasil mengklasifikasi
stroke berdasarkan kelainan patologis dengan
0
tingkat akurasi 96% dengan nilai AUC termasuk
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 dalam kategori excellent (A).
1-Spesifisitas 2. Metode Learning Vector Quantization ternyata
mampu melakukan klasifikasi dengan akurasi
Gambar. 7. ROC Ujicoba Skenario 2 tinggi hanya dengan 100 data training. Hal ini
sebuah indikasi baik jika disuatu wilayah kasus
C. Pengujian Data Training
pasien stroke belum banyak maka dengan
Data training dalam penelitian ini digunakan untuk keterbatasan data tetap bisa dijadikan sebagai
proses pembelajaran Learning Vector Quantization data training.
hingga mendapatkan bobot-bobot terbaik. Didalam data
training terdapat hasil diagnosis dokter sebagai target REFERENSI
untuk melatih jaringan LVQ yang bersifat supervised.
[1] Yayan A. Israr, Stroke, Fakultas Kesehatan Universitas Riau.
Percobaan ini dilakukan dengan jumlah data berbeda- Pekanbaru, 2008.
beda, mulai 100 data, 150 data, 200 data, 250 dan 323 [2] Ekowati Rahajeng, Upaya Pengendalian Penyakit Tidak
data yang dipilih secara acak. Hal ini untuk mengetahui Menular Di Indonesia, Buletin Penyakit Tidak Menular, ISSN
2088-270X, Semester II 2012, pp.23-28, Jakarta, 2011.
pengaruh jumlah data training terhadap waktu [3] Mochammad Bahrudin, Model Diagnostik Stroke Berdasarkan
pembelajaran/training klasifikasi. Waktu training Gejala Klinis, Jurnal Saintika Medika Vol.6 No.13 Universitas
dihitung dari awal inisialisasi bobot, proses perbaikan Muhammadiyah, Malang, 2010.
[4] Andreas C Widjaja, Tesis. Uji Diagnostik Pemeriksaan Kadar
bobot hingga mendapatkan bobot-bobot terbaik. Hasil D-Dimer Plasma Pada Diagnosis Stroke Iskemik, Patologi
pengujian waktu disajikan dalam Tabel 4. Perbedaan Klinik Fakultas Kedokteran Universitas Diponegoro,
waktu training untuk 2 skenario divisualisaikan dalam Semarang, 2010.