Anda di halaman 1dari 19

PREDIKSI KLASIFIKASI NILAI RAPORT

PADA SMK BINA INSAN BANGSA


MENGGUNAKAN ALGORITMA DECITION TREE(C4.5) DAN
K-Nearest Neighbor (KNN)
Diajukan untuk memenuhi salah satu tugas pada mata kuliah
Data Warehouse & Data Mining

Oleh :
D11145010 Arif Fathurrohman
TI131027

Asep Subhan Suryadi

TI131013

Nur Iskandar

PROGRAM STUDI TEKNIK INFORMATIKA


POLITEKNIK TEDC BANDUNG
2016

DAFTAR ISI
DAFTAR ISI i
DAFTAR GAMBAR ii
DAFTAR TABEL
iii
BAB I PENDAHULUAN

1.1. Latar Belakang

1.2. Rumusan Masalah

1.3. Batasan Masalah

1.4. Tujuan dan Manfaat 3


1.4.1. Tujuan 3
1.4.2. Manfaat
BAB II PEMBAHASAN

3
4

2.1. Data 4
2.2. Algoritma yang digunakan

2.2.1. Decicion Tree (C4.5) 5


2.2.2. Nave Bayes 7
2.3. Evaluasi dan Hasil

2.4. Proses di Rapid Miner

10

2.4.1. Decicion Tree (C4.5) 10


2.4.2. Nave Bayes 15
2.4.3. T-Test 17
2.5. F-Measure

18

2.5.1. Decicion Tree (C4.5) 18


2.5.2. Nave Bayes 19
BAB III PENUTUP 20
3.1. Kesimpulan 20
3.2. Saran 20
DAFTAR PUSTAKA 21

DAFTAR GAMBAR

Gambar 1. Data Indeks inti, harga, dan barang


Gambar 2. Data IHK dan Inflasi

Gambar 3. Repository 10
Gambar 4. Operator 11
Gambar 5. Impor Data

11

Gambar 6. Change Role

12

Gambar 7. Validation 12
Gambar 8. Main Proses

13

Gambar 9. Akurasi

13

Gambar 10. Presisi

14

Gambar 11. Recall

14

Gambar 12. Tree Inflasi

15

Gambar 13. Main Proses 2

15

Gambar 14. Akurasi Bayes

16

Gambar 15. Presisi Bayes

16

Gambar 16. Recall Bayes

17

Gambar 17. T-Test


Gambar 18. Hasil T-Test

17
18

DAFTAR TABEL

Tabel 1. Data Set Inflasi

Tabel 2. Confusion Matrix

Tabel 3. Perhitungan Presisi dan Recall

BAB I
PENDAHULUAN

1.1

Latar Belakang
Penilaian merupakan rangkaian kegiatan untuk memperoleh, menganalisis,

dan menafsirkan hasil belajar peserta didik yang dilakukan secara sistematis dan
berkesinambungan,

sehingga

menjadi

informasi

yang

bermakna

dalam

pengambilan keputusan. Fokus penilain pendidikan adalah keberhasilan belajar


peserta didik dalam mencapai standart kompetensi yang ditentukan. Pada tingkat
mata pelajaran, kompetensi yang harus dicapai berupa Standart Kompetensi (SK)
mata pelajaran yang selanjutnya dijabarkan dalam Kompetensi Dasar (KD). Untuk
tingkat satuan pendidikan, kompetensi yang harus dicapai peserta didik adalah
Standart Kompetensi Lulusan (SKL).
Wali kelas pada saat berakhirnya ulangan umum semester akan
mempunyai pekerjaan yang sangat berat, salah satunya adalah mengisi nilai
raport. Pekerjaan ini merupakan puncak dari pekerjaan wali kelas, dimana nilai
yang didapat dari guru mata pelajaran akan dikumpulkan yang kemudian
dimasukan kedalam rumus penulisan raport yang akhirnya menjadi nilai jadi nilai
raport siswa. Tentu saja ini bukan pekerjaan yang mudah, pekerjaan ini
membutuhkan ketelitian, kecermatan dan perhitungan yang benar. Demikian juga
seorang guru dalam memberikan nilai hasil ulangan, baik nilai ulangan harian,
nilai tugas-tugas, dan nilai ulangan semesteran kepada wali kelas harus dirata-rata
sesuai dengan ketentuan yang berlaku di sekolah yang istilahnya dimasukan
dengan rumus yang telah ditentukan ke dalam daftar nilai sebelum nilai tersebut
diserahkan kepada wali kelas.
Penelitian mengenai peramalan inflasi di suatu negara mendapatkan
perhatian yang positif bagi peneliti makroekonomi. Sebagian besar bank
sentral menggunakan inflasi sebagai salah satu pertimbangan untuk
mengambil kebijakan moneter. Kebijakan moneter diambil dengan
pertimbangan nilai inflasi yang akan
1

datang. Nilai inflasi sekarang, merupakan hasil dari kebijakan yang lalu,
mungkin hanya memberikan informasi yang samar-samar. Bagi pemerintah,
peramalan inflasi merupakan jembatan penghubung untuk mengetahui nilai
inflasi yang akan datang. Penelitian ini merupakan pengembangan
peramalan inflasi di Indonesia yang dapat memberikan input bagi Bank
Indonesia sebagai pertimbangan pengambilan kebijakan.
Pada penelitian ini menggunakan perbandingan algoritma Decision
Tree (C4.5) dan algoritma Naive Baiyes untuk memprediksi tingkat inflasi
bulanan di masa yang akan datang. Data yang penulis gunakan adalah data
tingkat inflasi bulanan di indonesia yang dikeluarkan oleh Badan Pusat
Statistik.
Penulis memilih algoritma Decision Tree (C4.5) dikarenakan metode
ini menghindari munculnya permasalahan ini dengan menggunakan kriteria
yang jumlahnya lebih sedikit pada setiap node internal tanpa banyak
mengurangi kualitas keputusan yang dihasilkan dan bersifat fleksibel.
(Yuliastri, 2015).
1.2

Rumusan Masalah
Berdasarkan penjelasan uraian diatas dapat dirumuskan permasalahan

penelitian ini yaitu :


1. Apakah algoritma decision tree bisa mengklasifikasi nilai raport pada SMK
Bina Insan Bangsa ?
2. Apakah algoritma KNN bisa mengklasifikasi nilai raport pada SMK Bina
Insan Bangsa ?
3. Bagaimana hasil perbandingan algoritma decision tree dan KNN dalam
mengklasifikasi nilai raport pada SMK Bina Insan Bangsa?
1.3

Batasan Masalah
Permasalahan pada penelitian ini dibatasi yaitu :
1. Data diambil dari SMK Bina Insan Bangsa
2. Data yang diambil merupakan data nilai raport kelas X TKJ-3

3. Data yang diambil merupakan data nilai raport semester 1 tahun 2016
1.4

Tujuan dan Manfaat

1.4.1

Tujuan

Tujuan dari penelitian ini adalah :


1. Menerapkan algoritma decision tree dan KNN dalam mengklasifikasi nilai
raport pada SMK Bina Insan Bangsa.
2. Mengetahui hasil perbandingan algoritma decision tree dan nave bayes
dalam mengklasifikasi nilai raport pada SMK Bina Insan Bangsa.
1.4.2

Manfaat

Manfaat yang bisa diambil dari penelitian yang dilakukan adalah :


1. Bisa menjadi salah satu acuan untuk peneliti lain apabila ingin melakukan
penelitian dengan data yang sama akan tetapi menggunakan algoritma
yang berbeda.
2. Bisa digunakan sebagai salah satu acuan pertimbangan untuk mengambil
kebijakan.

BAB II
PEMBAHASAN
2.1

Data
Berikut adalah data set yang akan digunakan dalam proses rapid miner.

Dikarenakan data yang digunakan memiliki jumlah yang banyak, jadi hanya
ditampilkan sedikit saja untuk data yang digunakan dalam proses rapid miner.
Untuk lebih lengkapnya bisa dilihat pada Tabel 1.
Tabel 1. DataSet Nilai Raport

Data tersebut merupakan data yang diambil langsung dari SMK Bina Insan
Bangsa dan merupakan data nilai raport untuk kelas X TKJ-3.
2.2

Algoritma Yang Digunakan

2.2.1

Decision Tree (C4.5)


Secara

konsep Decision

Tree adalah

salah

satu

dari

teknik

decision analysis. Tree sendiri pertama kali diperkenalkan pada tahun 1960-an
oleh Fredkin. tree berasal dari kata retrival (pengambilan kembali) sesuai

dengan fungsinya. Secara etimologi kata ini diucapkan sebagai tree. (Yudha,
2015)
Secara singkat bahwa Decision Tree

merupakan salah satu metode

klasifikasipada Text Mining. Klasifikasi adalah proses menemukan kumpulan pola


atau fungsi-fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan
lainnya, untukdapat digunakan untuk memprediksi data yang belum memiliki
kelas data tertentu.(Yudha, 2015)
Decision Tree adalah sebuah struktur pohon, dimana setiap node
pohonmerepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu
pembagianhasil uji, dan node daun (leaf) merepresentasikan kelompok kelas
tertentu. Level nodeteratas dari sebuah Decision Tree adalah node akar (root) yang
biasanya berupa atributyang paling memiliki pengaruh terbesar pada suatu kelas
tertentu. Pada umumnyaDecision Tree melakukan strategi pencarian secara topdown untuk solusinya. Pada proses mengklasifikasi data yang tidak diketahui,
nilai atribut akan diuji dengan caramelacak jalur dari node akar (root) sampai
node akhir (daun) dan kemudian akandiprediksi kelas yang dimiliki oleh suatu
data baru tertentu. (Yudha, 2015)
Kelebihan algoritma decision tree (Yuliastri, 2015) :
1. Menghilangkan perhitungan-perhitungan yang tidak dibutuhkan. Sample
yang diuji hanya berdasarkan kriteria atau kelas tertentu.
2. Pengambilan keputusan yang sebelumnya kompleks dan sangat global
diubah lebih simpel dan spesifik.
3. Metode

ini

menghindari

munculnya

permasalahan

ini

dengan

menggunakan kriteria yang jumlahnya lebih sedikit pada setiap node


internal tanpa banyak mengurangi kualitas keputusan yang dihasilkan.
4. Bersifat fleksibel, memilih fitur dari internal node yang berbeda, fitur yang
terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain
dalam node yang sama. Kefleksibelan metode ini meningkatkan kualitas
keputusan yang dihasilkan.
Kekurangan algoritma decision tree (Yuliastri, 2015) :

1. Terjadi overlap, hal ini sering saya temui ketika menggunakan kelas-kelas
dan kriteria yang digunakan dalam jumlah besar. Hal tersebut juga dapat
menyebabkan meningkatnya waktu pengambilan keputusan dan jumlah
memori yang diperlukan.
2. Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon
keputusan yang besar.
3. Kesulitan dalam mendesain pohon keputusan yang optimal.
4. Hasil kualitas keputusan yang didapatkan dari metode pohon keputusan
sangat tergantung pada bagaimana pohon tersebut didesain.
2.2.2

K-Nearest Neighbor (KNN)


Algoritma k-nearest neighbor (KNN) adalah sebuah metode untuk

melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang


jaraknya paling dekat dengan objek tersebut. KNN termasuk algoritma supervised
learning
dimana hasil dari query instance yang baru diklasifikan berdasarkan mayoritas
dari kategori pada KNN. Nanti kelas yang paling banyak muncullah yang akan
menjadi kelas hasil klasifikasi.
Tujuan dari algoritma ini adalah mengklasifikasikan obyek baru
bedasarkan atribut dan training sample. Classifier tidak menggunakan
modelapapun untuk dicocokkan dan hanya berdasarkan pada memori. Diberikan
titik query, akan ditemukan sejumlah k obyek atau (titik training ) yang paling
dekat dengan titik query. Klasifikasi menggunakan voting terbanyak diantara
klasifikasidari k obyek. Algoritma k-nearest neighbor (KNN) menggunakan
klasifikasi ketetanggaan sebagai nilai prediksi dari query instance yang baru.
2.4

Proses di Rapid Miner

2.4.1 Decision Tree (C4.5)


Berikut adalah proses yang akan dilakukan dalam melakukan proses rapid
miner menggunakan algoritma Decision Tree (C4.5):

10

1. Gambar 3 merupakan direktori repository, dimana dataset yang telah


diimport tersimpan

Gambar 3. Repository

2. Gambar 4 merupakan tempat dimana semua operator yang akan digunakan


berada.

Gambar 4. Operator

3. Gambar 5 menunjukan proses import data.

11

Gambar 5. Import Data

4.

Gambar 6 menunjukan penentuan set role, yaitu id dan label.

Gambar 6. Change Role

12

5. Gambar 7 menunjukan proses drag dataset dan validation. Untuk dataset


merupakan data file berformat excel dan validation yang dipakai disini
merupakan X-Validation.

Gambar 7. Drag data

6. Gambar 8 menunjukan main proses dimana algoritma yang digunakan


adalah decision tree.

Gambar 8. Main Proses

7. Gambar 9 menunjukan hasil proses di rapidminer menggunakan algoritma


decision tree untuk akurasi.

13

Gambar 9. Akurasi

8. Gambar 10 menunjukan hasil proses di rapidminer menggunakan


algoritma decision tree untuk Kappa.

Gambar 10. Kappa

9. Gambar 11 menunjukan hasil proses di rapidminer menggunakan


algoritma decision tree dalam bentuk pohon keputusan.

14

Gambar 11. Tree nilai raport

Dari gambar 11 ini dapat dideskripsikan apabila nilai rata-rata K


lebih dari 81,584 maka nilai akhir adalah A. Bila rata-rata K antara 79,66 81,584 dan rata-rata P lebih besar dari 75,632 maka nilai akhir adalah B.
Bila rata-rata K kurang dari sama dengan 79,66, rata-rata P lebih besar dari
75,632, dan PABP P lebih besar dari 79 maka nilai akhir adalah B. Bila
rata-rata K kurang dari sama dengan 79,661, rata-rata P lebih besar dari
75,632, dan PABP P lebih kurang dari sama dengan 79 maka nilai akhir
adalah C. Bila rata-rata K kurang dari sama dengan 81,584, dan rata-rata P
kurang dari sama dengan 75,632 maka nilai akhir adalah C.
2.4.2

KNN
Berikut adalah proses yang akan dilakukan dalam melakukan proses rapid

miner menggunakan algoritma KNN :


1. Gambar 13 menunjukan main proses dengan menggunakan algoritma
KNN.

15

Gambar 13. Main Proses 2

2. Gambar 14 menunjukan hasil proses di rapidminer menggunakan


algoritma KNN untuk akurasi.

Gambar 14. Akurasi KNN

3. Gambar 15 menunjukan hasil proses di rapidminer menggunakan


algoritma KNN untuk Kappa.

16

Gambar 15. Kappa KNN

BAB III
PENUTUP
3.1

Kesimpulan
Dari analisis yang telah dilakukan dapat dilihat hasil dari algoritma

decision tree memiliki akurasi 82,50%, dan Kappa 0,714. Untuk algoritma KNN
memiliki akurasi 69,17%, dan Kappa 0,541. Untuk hasil perbandingan antara
algoritma decision tree dan KNN yang dilakukan maka dapat disimpulkan
algoritma decision tree lebih baik daripada KNN dalam melakukan klasifikasi
nilai raport pada SMK Bina Insan Bangsa.
3.2

Saran
Saran yang bisa diberikan dari penelitian yang telah dilakukan adalah para

peniliti lain bisa mencoba beberapa algoritma lain untuk proses data mining agar
hasil yang didapat lebih baik.

20

DAFTAR PUSTAKA
Yudha, manik kartika. (2015). Pembahasan Decision Tree. Retrieved December
20, 2016, from http://dokumen.tips/documents/pembahasan-decisiontree.html
Yuliastri, I. (2015). Konsep Pohon Keputusan [Decision Tree] Data Mining.
Retrieved December 15, 2016, from http://tutorcollection.com/konseppohon-keputusan-decision-tree-data-mining/

21

Anda mungkin juga menyukai