Anda di halaman 1dari 10

BAB III

ANALISIS

3.1

Data Understanding Phase


Pada penelitian ini, data kasus yang digunakan adalah data pasien liver.

Data ini dikumpulkan dari timur laut bagian Andhra Pradesh, India. Data pasien
liver terdiri dari 416 (empat ratus enam belas) pasien pengidap penyakit liver dan
167 (seratus enam puluh tujuh) pasien yang nonliver. Variabel yang terdapat pada
data pasien liver tersebut adalah sebagai berikut :
1) Age (Usia)
2) Gender (Jenis Kelamin)
3) Total Bilirubin (Bilirubin Total)
4) Direct Bilirubin (Bilirubin Langsung)
5) Alkaline Phosphatase (ALP)
6) Serum Glutamic Pyruvic Transaminase (SGPT) / Alanin Aminotransferase
(ALT)
7) Serum Glutamic Oxaloacetic Transaminase (SGOT) / Aspartate
Aminotransferase (AST)
8) Total Protein (Protein Total)
9) Albumin
10) Albumin- Globulin Ratio (A/G Rasio)
11) Liver Patient (Yes/No)

Data pasien liver yang diambil dari UCI Machine Learning Repository
berupa format comma separated values (CSV) seperti yang digambarkan pada
Gambar 3.1 berikut.

III-1

III-2

Gambar 3.1 Data Pasien Liver dalam Format CSV

Data yang didapat tidak disertai keterangan yang menjelaskan maksud


secara rinci mengenai maksud dari data, sehingga peneliti harus menganalisis
dengan langkah awal melakukan pencarian informasi mengenai liver. Setelah
melakukan pencarian tersebut, maka didapat beberapa informasi dan keterangan
yang dapat membuat peneliti lebih memahami mengenai data pasien liver
tersebut.
Variabel-variabel tersebut merupakan komponen yang mempengaruhi
seseorang memiliki indikasi menderita penyakit liver. Beberapa atribut merupakan
istilah-istilah dalam kedokteran atau kesehatan yang terkait dengan penyakit liver.
Untuk keterangan lebih lanjut, pada Tabel 3.1 dijelaskan definisi dari istilahistilah tersebut dari setiap komponen.

Tabel 3.1 Definisi Istilah


No
1

Istilah

Definisi

Total Bilirubin

Bilirubin

adalah

produk

utama

dari

(Bilirubin Total)

penguraian sel darah merah yang tua.

III-3

No
2

Istilah

Definisi

Direct Bilirubin

Bilirubin disaring dari darah oleh hati dan

(Bilirubin Langsung)

dikeluarkan

pada

cairan

empedu.

Sebagaimana hati menjadi semakin rusak,


bilirubin total akan meningkat. Sebagian
dari bilirubin total termetabolisme, dan
bagian

ini

langsung.

disebut

Bila

sebagai

bagian

ini

bilirubin
meningkat,

penyebab biasanya di luar hati. Bilirubin


langsung larut dalam air.
3

Alkaline Phosphatase

enzim yang dibuat oleh hati, tulang, dan

(ALP)

plasenta

dan

biasanya

hadir

dalam

konsentrasi tinggi pada darah tumbuh dan


empedu dan dalam konsentrasi rendah pada
darah. ALP dilepaskan ke dalam darah
dalam jumlah yang meningkat selama
kerusakan sel-sel hati dan selama aktivitas
normal seperti pertumbuhan tulang dan
kehamilan
4

Serum

Glutamic Pyruvic Enzim yang diproduksi di hati ketika

Transaminase

(SGPT)

/ membran sel-sel hati rusak. Biasanya hadir

Alanin

Aminotransferase di sel-sel hati dan jantung. SGPT dilepaskan

(ALT)

ke dalam darah ketika hati atau jantung


rusak. Tingkat ALT diukur untuk membantu
menilai

tingkat

menentukan

kerusakan

seberapa

baik

hati

dan

pengobatan

bekerja.
5

Serum Glutamic

Enzim yang diproduksi di dalam hati.

Oxaloacetic Transaminase

Ketika sel-sel hati yang rusak, AST

(SGOT)

Aspartate dilepaskan . Peningkatan kadar AST dapat

III-4

No

Istilah

Definisi

Aminotransferase (AST)

mengindikasikan penyakit hati, tetapi juga


terlihat pada orang dengan kerusakan otot.

Total Protein

Protein total terdiri atas albumin (60%) dan

(Protein Total)

globulin (40%). Penurunan angka protein


total dapat menggambarkan kerusakan hati,
kerusakan ginjal atau kerusakan dimana
protein tidak dicerna sepenuhnya

Albumin

Protein darah yang diproduksi oleh hati dan


berperan dalam mempertahankan volume
darah normal. Tingkat albumin yang rendah
dikaitkan dengan sirosis hati.

Albumin-Globulin
(A/G Rasio)

Ratio Perbandingan albumin dengan globulin


yang merupakan konstituen utama protein
yang ditemukan dalam darah. Rasio yang
abnormal terlihat ketika kadar albumin atau
globulin meningkat atau menurun. Rasio
abnormal terlihat pada berbagai gangguan,
termasuk penyakit ginjal dan hati.

Batas normal setiap komponen-komponen yang terkait liver tersebut


ditentukan oleh nilai laboratorium normal. Setiap laboratorium dalam menentukan
nilai normal tergantung pada alat yang dipakai dan cara pemakaiannya. Saat
peneliti mengambil data pasien liver tersebut tidak ada keterangan mengenai nilai
laboratorium normal yang dipakai sebagai acuan untuk data tersebut, maka itu
peneliti menentukan untuk mengambil salah satu nilai laboratorium normal yang
diambil dari Paramount Health Service, yaitu sebuah organisasi pelayanan
kesehatan di India yang menyediakan pelayanan inovatif terhadap kebutuhan
kesehatan. Pada Tabel 3.2 menjelaskan nilai laboratorium normal pada nilai tes
laboratorium Paramount Health Service :

III-5

Tabel 3.2 Nilai Laboratorium Normal Paramount Health Service


No
1

Nilai

Komponen

Normal

Total Bilirubin (Bilirubin Total)

0.2 1.0

Satuan
mg/dL
(milligram per deciliter)

Direct Bilirubin

0.1 1.0

(Bilirubin Langsung
3

mg/dL
(milligram per deciliter)

Alkaline Phosphatase (ALP)

20 70

u/L
(unit per liters)

Serum

Glutamic

Pyruvic

10 40

Transaminase (SGPT) / Alanin

u/L
(unit per liters)

Aminotransferase (ALT)
5

Serum

Glutamic

Oxaloacetic

0 41

Transaminase (SGOT) / Aspartate

u/L
(unit per liters)

Aminotransferase (AST)
6

Total Protein (Protein Total)

68

g/dL
(gram per deciliter)

Albumin

3.8 5.0

g/dL
(gram per deciliter)

Albumin- Globulin Ratio


(A/G Rasio)

3.2

>1

g/dL
(gram per deciliter)

Data Preparation Phase


Pada fase pengolahan data ditentukan kasus dan variabel yang akan

dianalisis. Dari data pasien liver ini, kolom yang diambil sebagai variabel
keputusannya adalah kolom Liver Patient, sedangkan kolom yang diambil sebagai
variabel penentu dalam pembentukan pohon keputusan adalah kolom :
1) Age (Usia)
2) Gender (Jenis Kelamin)
3) Total Bilirubin (Bilirubin Total)
4) Direct Bilirubin (Bilirubin Langsung)

III-6

5) Alkaline Phosphatase (ALP)


6) Serum Glutamic Pyruvic Transaminase (SGPT) / Alanin Aminotransferase
(ALT)
7) Serum Glutamic Oxaloacetic Transaminase (SGOT) / Aspartate
Aminotransferase (AST)
8) Total Protein (Protein Total)
9) Albumin

Tidak semua variabel dipilih dalam pembentukan pohon keputusan.


Variabel Albumin/Globulin Ratio tidak dilibatkan karena sudah terwakili oleh
Albumin. Berdasarkan variabel yang sudah dipilih, maka format data menjadi
seperti pada Gambar 3.2.

Gambar 3.2 Format Baru Data Pasien Liver

Setelah ditemukan format data pasien liver yang baru, peneliti melakukan
praproses dengan 2 (dua) cara sebagai berikut :

III-7

3.2.1

Praproses Menggunakan Rumus GINI


Rumus GINI digunakan untuk menentukan klasifikasi atribut yang bernilai

kontinyu. Tahap-tahap praproses menggunakan rumus GINI adalah sebagai


berikut :
1) Mengurutkan nilai-nilai pada atribut
2) Menghitung rata-rata dari setiap nilai yang bersebelahan setelah diurutkan
3) Menghitung GINI untuk semua nilai rata-rata
4) Nilai GINI paling kecil menjadi split untuk atribut tersebut
3.2.2

Praproses Pengklasifikasian Berdasarkan Referensi Kesehatan


Peneliti menggunakan referensi kesehatan dari World Health Organization

(WHO) untuk pengelompokkan usia dan nilai laboratorium normal Paramount


Health Service (PHS) untuk mengklasifikasi atribut yang lain pada data pasien
liver. Berikut adalah pengelompokkan atribut-atribut yang perlu diklasifikasikan
sebelum proses data :
1) Mengelompokkan age
Pengelompokkan age dilakukan dengan memasukkan usia pasien dalam
range seperti pada Tabel 3.3. Klasifikasi age berdasarkan pembagian umur
menurut WHO (World Health Organization).

Tabel 3.3 Klasifikasi Age


Klasifikasi

Age (Tahun)
Batas Bawah

Child
Young - Adult

Batas Atas

<=14
15

Old

49
>=50

2) Mengelompokkan nilai total bilirubin


Pengelompokkan total bilirubin dilakukan dengan memasukkan nilai
bilirubin total dalam range seperti pada Tabel 3.4.

III-8

Tabel 3.4 Klasifikasi Total Bilirubin


Klasifikasi

Total Bilirubin (mg/dL)


Batas Bawah

Batas Atas

<= 1.0

1.1

2.0

2.1

3.0

3.1

9.0

> 9.0

3) Mengelompokkan nilai direct bilirubin


Pengelompokkan direct bilirubin dilakukan dengan memasukkan nilai
bilirubin langsung dalam range seperti pada Tabel 3.5.
Tabel 3.5 Klasifikasi Direct Bilirubin
Klasifikasi

Direct Bilirubin(mg/dL)
Batas Bawah

Batas Atas

<= 1.0

1.1

2.0

2.1

5.0

> 5.0

4) Mengelompokkan nilai alkaline phosphatase/ALP


Pengelompokkan ALP dilakukan dengan memasukkan nilai ALP dalam
range seperti pada Tabel 3.6.
Tabel 3.6 Klasifikasi Alkaline Phosphatase/ ALP
Klasifikasi

Alkaline Phosphatase (u/L)


Batas Bawah

Batas Atas

<= 140

141

210

211

280

281

420

> 420

III-9

5) Mengelompokkan nilai SGPT/ALT


Pengelompokkan SGPT/ALT dilakukan dengan memasukkan nilai SGPT/
ALT dalam range seperti pada Tabel 3.7.

Tabel 3.7 Klasifikasi SGPT/ ALT


Klasifikasi

SGPT/ALT (u/L)
Batas Bawah

Batas Atas

<= 40

41

80

81

120

121

200

> 200

6) Mengelompokkan nilai SGOT/AST


Pengelompokkan SGOT/AST dilakukan dengan memasukkan nilai
SGOT/ AST dalam range seperti pada Tabel 3.8.

Tabel 3.8 Klasifikasi SGOT/AST


Klasifikasi

SGOT/AST (u/L)
Batas Bawah

Batas Atas

<=41

42

82

83

164

> 164

7) Mengelompokkan nilai total protein


Pengelompokkan total protein dilakukan dengan memasukkan nilai
protein total dalam range seperti pada Tabel 3.9.

III-10

Tabel 3.9 Klasifikasi Total Protein


Klasifikasi

Total Protein (g/dL)


Batas Bawah

Batas Atas

>= 6.0

5.0

5.9
< 5.0

8) Mengelompokkan nilai albumin


Pengelompokkan albumin dilakukan dengan memasukkan nilai albumin
dalam range seperti pada Tabel 3.10.

Tabel 3.10 Klasifikasi Albumin


Albumin (g/dL)

Klasifikasi

Batas Bawah

Batas Atas

3.8

6.0

3.0

3.7

2.0

2.9

0.0

1.9

9) Menerjemahkan nilai liver patient


Penerjemahan liver patient dilakukan dengan mengganti nilai liver patient
dengan nilai seperti pada Tabel 3.11.

Tabel 3.11 Penerjemahan Liver Patient


Liver Patient

Nilai Baru

Yes

No