Anda di halaman 1dari 12

BAB IV

HASIL DAN PEMBAHASAN

4.1 Hasil
4.1.1 Sumber Data
Sumber data pada penelitian ini menggunakan data mahasiswa
Universitas Kristen Toraja, Sulawesi Selatan dengan menggunakan
metode survey langsung ke lapangan sehingga didapatkan data dari 45
mahasiswa dari berbagai jurusan sebagai data sampling.

4.1.2 Deskripsi Variabel


Pada data yang sudah ada, akan dilakukan proses pengolahan yaitu
dengan klasifikasi dan prediksi sesuai dengan variabel yang dibutuhkan
untuk proses dalam algoritma C 4.5.

4.1.3 Proses Dalam Algoritma C 4.5


Dalam algoritma C 4.5 , metode yang digunakan adalah metode
Decision Tree yang kemudian dibentuklah sebuah pohon keputusan
(Decision Tree) dimana pohon keputusan ini digunakan untuk proses
klasifikasi dan prediksi, mengeksplorasi data untuk menemukan hubungan
tersembunyi antara sejumlah calon variabel input dengan sebuah variabel
target.

4.1.4 Analisis Data


Dalam proses analisis ini, pertama kali yang dilakukan adalah
dengan menyiapkan data samplingnya dalam bentuk tabel untuk
keseluruhan data.
Status Pekerjaan Pendapatan Jumlah
No Nama Nim Temuan IPK Program Studi Alamat
Mahasiswa Orang Tua Orang Tua Tanggungan
1 Ronal Tandi Pare 220213183 Aktif Masih Hidup 3,22 Teknik Sipil Sa'dan petani < 1.000.000 5
2 Rudolvo victor Pakolo 220213024 Aktif Masih Hidup 3,68 Teknik sipil Sa'dan Guru > 1.000.000 5
3 Enos Pabara 220213271 Aktif Masih Hidup 3,11 Teknik Sipil Sa'dan petani > 1.000.000 6
4 Alasius Ardi Sende 1218212291 Aktif Masih Hidup 3,75 Teknik Mesin Pangli Petani < 1.000.000 7
5 Perdianto Samma 217212285 Aktif Masih Hidup 3,85 Teknik Mesin Tallunglipu Petani < 1.000.000 4
6 Regon Samulung 219212050 Aktif Piatu 2,10 Teknik Mesin Tallunglipu Petani < 1.000.000 8
7 Rianto Bilolo 217212184 Aktif Yatim 2,60 Teknik Mesin Panga' Petani < 1.000.000 10
8 Rini Sande 221511035 Aktif Masih Hidup 3,39 Agroteknologi Pangli Selatan Petani > 1.000.000 2
9 Ardinata Nika 219213138 Aktif Masih Hidup 3,80 Teknik Sipil Sa'dan Petani > 1.000.000 3
10 Jendri Tangke Massolo 217611057 Aktif Masih Hidup 3,25 Teknik Informatika Sa'dan Petani < 1.000.000 1
11 Dami Anus 217212294 Aktif Masih Hidup 2,59 Teknik Mesin Rantepao Petani > 1.000.000 3
12 Juisa datu 221311136 Aktif Masih Hidup 3,62 Agroteknologi Akung Bangkelekila petani > 1.000.000 3
13 Yetri Syela Zettin 218411244 Aktif Masih Hidup 3,35 Manajemen Bolu petani > 1.000.000 4
14 Lenni Sepang 218411149 Aktif Masih Hidup 3,16 Manajemen Buntao petani > 1.000.000 5
15 Melda Palebangan 217611045 aktif Masih Hidup 3,35 Teknik Informatika Sa'dan petani > 1.000.000 2
16 Tia Lili Borong 217611063 Aktif Masih Hidup 3,65 Teknik Informatika Pangli petani < 1.000.000 5
17 Ari Borong 218611109 Aktif Masih Hidup 3,50 Teknik Informatika Pangli petani < 1.000.000 5
18 Robertus Ruben 219212117 Aktif Masih Hidup 2,75 Teknik Mesin Tiroan petani < 1.000.000 6
19 Greisanto Karangan 219212128 Aktif Masih Hidup 3,10 Teknik Mesin Kantun petani > 1.000.000 4
20 Gideon mondi Kondorura 218331071 Aktif Piatu 3,10 Agroteknologi Parinding GURU > 1.000.000 1
21 Jelson Harun 220311071 Aktif Masih Hidup 2,18 Agroteknologi Rantepao petani < 1.000.000 3
22 Jilnika sombo 220311002 Aktif Masih Hidup 3,10 Agroteknologi Buntao petani > 1.000.000 4
23 Wilyam Kondolele 220311054 Aktif Masih Hidup 3,15 Agroteknologi Bori petani < 1.000.000 5
24 Yurnengsi Palebangan 220311067 Aktif Masih Hidup 3,20 Agroteknologi Sa'dan petani > 1.000.000 2
25 Ernita 220311105 Aktif Masih Hidup 3,50 Agroteknologi Tallunglipu Guru > 1.000.000 4
26 Elma Mansado 220311061 Aktif Yatim 3,15 Agroteknologi Makale petani > 1.000.000 5
27 Deli Belo 220311041 Aktif Masih Hidup 3,10 Agroteknologi Parinding petani < 1.000.000 6
28 Masto Renden 220311100 Aktif Masih Hidup 3,50 Agroteknologi Makale petani > 1.000.000 8
29 Nova Pnglamba 221311078 Aktif Masih Hidup 3,50 Agroteknologi Rantepao petani > 1.000.000 6
30 Asriyati paberu' 219118132 Aktif Yatim 3,79 PGSD Bori Ranteletok petani < 1.000.000 6
31 Julti Silambi Kuddi 219118114 Aktif Masih Hidup 3,63 PGSD Bori Ranteletok petani > 1.000.000 1
32 Meti Payung 219118133 Aktif Yatim 3,60 PGSD Bori Ranteletok petani > 1.000.000 4
33 Orpa Deniati Pabuntang 219118107 Aktif Masih Hidup 3,39 PGSD Karua petani < 1.000.000 5
34 Yelmi Sulle 219118107 Aktif Masih Hidup 3,44 PGSD Pangli PNS > 1.000.000 2
35 Shinta Widodo 219118118 Aktif Masih Hidup 3,32 PGSD Andi Mappayukki no. 117 petani > 1.000.000 7
36 Novi Manduli 219118124 Aktif Masih Hidup 3,37 PGSD Tallunglipu petani < 1.000.000 2
37 Lina Randa 218118318 Aktif Masih Hidup 3,21 PGSD Tallunglipu petani < 1.000.000 5
38 Alfrida Tumba 219118144 Aktif Masih Hidup 3,31 PGSD Pangala petani > 1.000.000 4
39 Abi Tandi 221311106 Aktif Yatim 3,40 Agroteknologi Sa'dan petani < 1.000.000 2
40 Devi Tandi Limbong 221311083 Aktif Yatim 3,00 Agroteknologi Bori Guru > 1.000.000 3
41 Agustina Sulo Batu 122311144 Aktif Masih Hidup 3,80 Agroteknologi Makale Guru > 1.000.000 5
42 Junaldi 220311114 Aktif Masih Hidup 3,70 Agroteknologi Sangalla petani < 1.000.000 6
43 Dita Limbong Mangiwa 217611076 Aktif Masih Hidup 3,25 Teknik Informatika Sa'dan petani > 1.000.000 3
44 Yelvin Toe 217611043 Aktif Masih Hidup 3,25 Teknik Informatika Se'pon Pandanan petani < 1.000.000 4
45 Feronika Beru 217611084 Aktif Masih Hidup 3,20 Teknik Informatika Sereale petani < 1.000.000 5

Gambar 4.1. Data Keseluruhan Hasil Survey di Universitas Kristen Indonesia


Pada gambar 4.1 terdapat beberapa atribut yang nantinya akan digunakan
untuk proses penghitungan di algoritma C 4.5 yaitu antara lain :
a. No
b. Nama
c. NIM
d. Status mahasiswa
e. Temuan ( Status Orang Tua )
f. IPK
g. Jurusan
h. Alamat
i. Pekerjaan orang tua
j. Penghasilan Orang tua
k. Jumlah tanggungan orang tua dalam keluarga

Kemudian dari data sampling tersebut diklasifikasikan lagi sesuai dengan kriteria
yang sudah ditetapkan oleh pihak kampus, yaitu antara lain :
a. Nama
b. NIM
c. Status mahasiswa ( masih tercatat sebagai mahasiswa aktif )
d. Temuan ( status orang tua - yatim, piatu atau yatim piatu)
e. IPK ( minimal 3,00 )
f. Penghasilan orang tua ( penghasilan dibawah 1.000.000 )
Berdasarkan dari kriteria tersebut maka dapat dibentuk tabel klasifikasinya seperti
di bawah ini :
nama IPK pendapatan orang tua Status Temuan STATUS BEASISWA
Ronal Tandi Pare 3,22 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Rudolvo victor Pakolo 3,68 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Enos Pabara 3,11 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Alasius Ardi Sende 3,75 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Perdianto Samma 3,85 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Regon Samulung 2,10 < 1.000.000 Aktif Piatu TIDAK LOLOS
Rianto Bilolo 2,60 < 1.000.000 Aktif Yatim TIDAK LOLOS
Rini Sande 3,39 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Ardinata Nika 3,80 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Jendri Tangke Massolo 3,25 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Dami Anus 2,59 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Juisa datu 3,62 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Yetri Syela Zettin 3,35 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Lenni Sepang 3,16 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Melda Palebangan 3,35 > 1.000.000 aktif Masih Hidup TIDAK LOLOS
Tia Lili Borong 3,65 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Ari Borong 3,50 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Robertus Ruben 2,75 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Greisanto Karangan 3,10 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Gideon mondi Kondorura 3,10 > 1.000.000 Aktif Piatu TIDAK LOLOS
Jelson Harun 2,18 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Jilnika sombo 3,10 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Wilyam Kondolele 3,15 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Yurnengsi Palebangan 3,20 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Ernita 3,50 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Elma Mansado 3,15 > 1.000.000 Aktif Yatim TIDAK LOLOS
Deli Belo 3,10 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Masto Renden 3,50 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Nova Pnglamba 3,50 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Asriyati paberu' 3,79 < 1.000.000 Aktif Yatim LOLOS
Julti Silambi Kuddi 3,63 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Meti Payung 3,60 > 1.000.000 Aktif Yatim TIDAK LOLOS
Orpa Deniati Pabuntang 3,39 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Yelmi Sulle 3,44 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Shinta Widodo 3,32 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Novi Manduli 3,37 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Lina Randa 3,21 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Alfrida Tumba 3,31 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Abi Tandi 3,40 < 1.000.000 Aktif Yatim LOLOS
Devi Tandi Limbong 3,00 > 1.000.000 Aktif Yatim TIDAK LOLOS
Agustina Sulo Batu 3,80 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Junaldi 3,70 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Dita Limbong Mangiwa 3,25 > 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Yelvin Toe 3,25 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS
Feronika Beru 3,20 < 1.000.000 Aktif Masih Hidup TIDAK LOLOS

Gambar 4.2. Tabel klasifikasi data sesuai kriteria dari kampus

4.1.5 Prepruning dan Postpruning


Pada tahapan ini dilakukan dengan cara menghentikan pembangunan suatu
subtree lebih awal, yaitu dengan memutuskan untuk tidak lebih jauh
mempartisi data training jika partisi yang akan dibuat dianggap tidak
signifikan. Baru setelah itu disederhanakan lagi dengan cara membuang
beberapa cabang subtree setelah pohon selesai dibangun.

4.1.6 Langkah – Langkah Dalam Proses Data Mining Algoritma C 4.5


Berikut ini adalah langkah – langkah dalam memproses data di algoritma
C 4.5 :
1. Pilih atribut sebagai akar
2. Buat cabang untuk masing-masing nilai
3. Membagi kasus dalam cabang
4. Mengulangi proses untuk masing-masing cabang sampai semua kasus
pada cabang memiliki kelas yang sama
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain ratio
tertinggi dari atribut-atribut yang ada.
Rumus :

Gain(S , A )
[ 1 ] GainRatio ( S , A )=
SplitInfo (S , A)

n
Si Si
[2] SplitInfo ( S , A )=∑ log 2
i=1 S S

a. mencari nilai gain untuk atribut IPK

untuk atribut IPK ( node 1 = root )


diketahui :
jika IPK kurang dari 3,00 maka mahasiswa itu tidak mendapatkan
beasiswa, sedangkan jika IPK lebih dari atau sama dengan 3,00
maka mahasiswa tersebut mendapatkan beasiswa.
jumlah data (S) = 40
jumlah data IPK lebih besar atau sama dengan 3,00 dan mendapat
beasiswa (S1) = 2
jumlah data IPK lebih besar atau sama dengan 3,00 tetapi tidak
mendapat beasiswa (S2) = 38

entrophy total (S) = ¿


jumlah data (S) 40
jumlah IPK >= 3,00 dapat beasiswa (S1) 2
jumlah IPK >= 3,00 tidak dapat beasiswa (S2) 38
En1 ( S1/S) 0,05
En2 ( S2/S) 0,95

nilai entrophy (S) 0,2864

b. mencari nilai gain untuk atribut PENDAPATAN


untuk atribut PENDAPATAN ( node 2 = root )
diketahui :
jika PENDAPATAN orang tua kurang dari 1.000.000 maka
mahasiswa itu mendapatkan beasiswa, sedangkan jika
PENDAPATAN orang tua lebih dari 1.000.000 maka mahasiswa
tersebut tidak mendapatkan beasiswa.
jumlah data (S) = 20
jumlah data PENDAPATAN < 1.000.000 dan mendapat beasiswa
(S1) = 2
jumlah data PENDAPATAN < 1.000.000 tetapi tidak mendapat
beasiswa (S1) = 18
entrophy total (S) = ¿

jumlah data (S) 20


jumlah PENDAPATAN < 1.000.000 dapat beasiswa (S1) 2
jumlah PENDAPATAN < 1.000.000 tidak dapat beasiswa (S2) 18
En1 ( S1/S) 0,1
En2 ( S2/S) 0,9

nilai entrophy (S) 0,469

c. mencari nilai gain untuk atribut TEMUAN


dalam penghitungan nilai gain di atribut ini hanya dihitung untuk
“Yatim”, “Piatu”, dan “Yatim Piatu” yang mendapat beasiswa dan
tidak.
Jumlah data (S) = 8
Jumlah yatim/piatu/yatim piatu yang mendapat beasiswa (S1) = 2
Jumlah yatim/piatu/yatim piatu yang mendapat beasiswa (S2) = 6
entrophy total (S) = ¿
jumlah data (S) 8
jumlah data TEMUAN = YATIM PIATU - LOLOS (S1) 2
jumlah data TEMUAN = YATIM PIATU - TIDAK LOLOS (S2) 6
En1 ( S1/S) 0,25
En2 ( S2/S) 0,75

nilai entrophy (S) 0,81128

4.1.7 Menghitung Gain, Split Info


pada proses ini dimaksudkan untuk mencari nilai gain ratio terbesar untuk
sebagai dasar penentuan node akarnya ( Root ).

Node Atribut Nilai Atribut S Layak Beasiswa tidak layak beasiswa Entrophy Gain Split Info Gain Ratio
1 IPK nilai >= 3,00 40 2 38 0,2864
0,466 0,234 0,156
2 Pendapatan < 1.000.000 20 2 18 0,469
0,697 0,566 0,255
3 Temuan temuan yatim atau piatu 8 2 6 0,81128
0,429 0,322 0,589

Berdasarkan dari tabel diatas, maka yang memiliki nilai Gain Ratio
terbesar adalah Temuan, yaitu sebesar 0,589. Maka temuan menjadi node
akar (root).

4.1.8 Rule Yang dihasilkan

Rule terbentuk dari hasil training berjumlah 2 rules yang dijabarkan


sebagai berikut :
1. IF mahasiswa nilai IPK ( >= 3,00 ) AND PENDAPATAN (<
1.000.000) AND TEMUAN (Yatim, Piatu) mendapat beasiswa
2. Selain daripada itu tidak mendapatkan beasiswa

4.1.9 Ujicoba di Aplikasi Orange 3


pada pengujian di aplikasi orange 3 ini mengambil data dari pengujian di
aplikasi Microsoft Excel sehingga nantinya hasilnya diharapkan akan sama
atau mendekati.
BAB V
KESIMPULAN
5.1. Kesimpulan
Berdasarkan pembahasan yang telah dilakukan dengan algoritma C 4.5 dan
dilakukan pengujian dengan aplikasi Orange3, peneliti menarik beberapa
kesimpulan yang penting. Adapun kesimpulan-kesimpulan tersebut adalah sebagai
berikut :
1. Algoritma C 4.5 yang diuji cobakan pada data mahasiswa di Universitas
Kristen Indonesia di Toraja untuk digunakan sebagai dasar pengambilan
keputusan dalam pemberian beasiswa, dengan batasan IPK, pendapatan
orang tua dan temuan.
2. Proses penentuan atribut, entrophy, split info dan gain ratio digunakan
untuk menemukan node akar sebagai penentuan rules
3. Penerapan algoritma C 4.5 sangat cocok untuk proses decision tree sebagai
penentuan kebijakan dalam pemberian beasiswa oleh kampus dikarenakan
pada algoritma ini terdapat gain ratio yang hanya dimiliki oleh algoritma C
4.5 dimana nilai ini digunakan sebagai penentu atribut mana yang akan
digunakan sebagai node akarnya.

5.2. Saran
Untuk pengembangan selanjutnya, maka ada beberapa saran yang dapat
disampaikan penulis yaitu :
1. Data diskrit dan kontinyu dengan algoritma C 4.5 memiliki nilai yang
cukup besar sehingga memang harus dihitung menggunakan algoritma C
4.5
2. Pada penelitian selanjutnya dapat dikembangkan dengan metode algoritma
yang sama dimana penelitian dapat mengembangkan ke dalam objek yang
berbeda dan dengan menggunakan atribut yang lebih besar.
3. Penggunakan aplikasi orange 3 kurang akurat dikarenakan dalam
menerapkan sistem rapidnya masih terdapat selisih nilai yang lumayan
besar dengan data penghitungan manualnya, sehingga disarankan untuk
kedepannya menggunakan aplikasi RapidMiner Studio

Anda mungkin juga menyukai