Prediksi Klasifikasi Nilai Raport Datamining

PREDIKSI KLASIFIKASI NILAI RAPORT
PADA SMK BINA INSAN BANGSA

MENGGUNAKAN ALGORITMA DECITION TREE(C4.5) DAN
K-Nearest Neighbor (KNN)
Diajukan untuk memenuhi salah satu tugas pada mata kuliah
Data Warehouse & Data Mining
Oleh :
D11145010 Arif Fathurrohman
TI131027
Asep Subhan Suryadi
TI131013
Nur Iskandar
PROGRAM STUDI TEKNIK INFORMATIKA

POLITEKNIK TEDC BANDUNG
2016
DAFTAR ISI
DAFTAR ISI i
DAFTAR GAMBAR ii
DAFTAR TABEL
iii
BAB I PENDAHULUAN
1.1. Latar Belakang
1.2. Rumusan Masalah
1.3. Batasan Masalah
1.4. Tujuan dan Manfaat 3

1.4.1. Tujuan 3
1.4.2. Manfaat
BAB II PEMBAHASAN
3
4
2.1. Data 4
2.2. Algoritma yang digunakan
2.2.1. Decicion Tree (C4.5) 5

2.2.2. Nave Bayes 7
2.3. Evaluasi dan Hasil
2.4. Proses di Rapid Miner
10

2.4.2. Nave Bayes 15
2.4.3. T-Test 17
2.5. F-Measure
18

2.5.2. Nave Bayes 19
BAB III PENUTUP 20
3.1. Kesimpulan 20
3.2. Saran 20
DAFTAR PUSTAKA 21
DAFTAR GAMBAR
Gambar 1. Data Indeks inti, harga, dan barang

Gambar 2. Data IHK dan Inflasi
Gambar 3. Repository 10
Gambar 4. Operator 11
Gambar 5. Impor Data
11
Gambar 6. Change Role
12
Gambar 7. Validation 12
Gambar 8. Main Proses
13
Gambar 9. Akurasi
13
Gambar 10. Presisi
14
Gambar 11. Recall
14
Gambar 12. Tree Inflasi
15
Gambar 13. Main Proses 2
15
Gambar 14. Akurasi Bayes
16
Gambar 15. Presisi Bayes
16
Gambar 16. Recall Bayes
17
Gambar 17. T-Test

Gambar 18. Hasil T-Test
17
18
DAFTAR TABEL
Tabel 1. Data Set Inflasi
Tabel 2. Confusion Matrix
Tabel 3. Perhitungan Presisi dan Recall
BAB I
PENDAHULUAN
1.1
Latar Belakang
Penilaian merupakan rangkaian kegiatan untuk memperoleh, menganalisis,
dan menafsirkan hasil belajar peserta didik yang dilakukan secara sistematis dan
berkesinambungan,
sehingga
menjadi
informasi
yang
bermakna
dalam
pengambilan keputusan. Fokus penilain pendidikan adalah keberhasilan belajar

peserta didik dalam mencapai standart kompetensi yang ditentukan. Pada tingkat
mata pelajaran, kompetensi yang harus dicapai berupa Standart Kompetensi (SK)
mata pelajaran yang selanjutnya dijabarkan dalam Kompetensi Dasar (KD). Untuk
tingkat satuan pendidikan, kompetensi yang harus dicapai peserta didik adalah
Standart Kompetensi Lulusan (SKL).
Wali kelas pada saat berakhirnya ulangan umum semester akan
mempunyai pekerjaan yang sangat berat, salah satunya adalah mengisi nilai
raport. Pekerjaan ini merupakan puncak dari pekerjaan wali kelas, dimana nilai
yang didapat dari guru mata pelajaran akan dikumpulkan yang kemudian
dimasukan kedalam rumus penulisan raport yang akhirnya menjadi nilai jadi nilai
raport siswa. Tentu saja ini bukan pekerjaan yang mudah, pekerjaan ini
membutuhkan ketelitian, kecermatan dan perhitungan yang benar. Demikian juga
seorang guru dalam memberikan nilai hasil ulangan, baik nilai ulangan harian,
nilai tugas-tugas, dan nilai ulangan semesteran kepada wali kelas harus dirata-rata
sesuai dengan ketentuan yang berlaku di sekolah yang istilahnya dimasukan
dengan rumus yang telah ditentukan ke dalam daftar nilai sebelum nilai tersebut
diserahkan kepada wali kelas.
Penelitian mengenai peramalan inflasi di suatu negara mendapatkan
perhatian yang positif bagi peneliti makroekonomi. Sebagian besar bank
sentral menggunakan inflasi sebagai salah satu pertimbangan untuk
mengambil kebijakan moneter. Kebijakan moneter diambil dengan
pertimbangan nilai inflasi yang akan
1
datang. Nilai inflasi sekarang, merupakan hasil dari kebijakan yang lalu,
mungkin hanya memberikan informasi yang samar-samar. Bagi pemerintah,
peramalan inflasi merupakan jembatan penghubung untuk mengetahui nilai
inflasi yang akan datang. Penelitian ini merupakan pengembangan
peramalan inflasi di Indonesia yang dapat memberikan input bagi Bank
Indonesia sebagai pertimbangan pengambilan kebijakan.
Pada penelitian ini menggunakan perbandingan algoritma Decision
Tree (C4.5) dan algoritma Naive Baiyes untuk memprediksi tingkat inflasi
bulanan di masa yang akan datang. Data yang penulis gunakan adalah data
tingkat inflasi bulanan di indonesia yang dikeluarkan oleh Badan Pusat
Statistik.
Penulis memilih algoritma Decision Tree (C4.5) dikarenakan metode
ini menghindari munculnya permasalahan ini dengan menggunakan kriteria
yang jumlahnya lebih sedikit pada setiap node internal tanpa banyak
mengurangi kualitas keputusan yang dihasilkan dan bersifat fleksibel.
(Yuliastri, 2015).
1.2
Rumusan Masalah
Berdasarkan penjelasan uraian diatas dapat dirumuskan permasalahan
penelitian ini yaitu :

1. Apakah algoritma decision tree bisa mengklasifikasi nilai raport pada SMK
Bina Insan Bangsa ?
2. Apakah algoritma KNN bisa mengklasifikasi nilai raport pada SMK Bina
Insan Bangsa ?
3. Bagaimana hasil perbandingan algoritma decision tree dan KNN dalam
mengklasifikasi nilai raport pada SMK Bina Insan Bangsa?
1.3
Batasan Masalah
Permasalahan pada penelitian ini dibatasi yaitu :
1. Data diambil dari SMK Bina Insan Bangsa
2. Data yang diambil merupakan data nilai raport kelas X TKJ-3
3. Data yang diambil merupakan data nilai raport semester 1 tahun 2016
1.4
Tujuan dan Manfaat
1.4.1
Tujuan
Tujuan dari penelitian ini adalah :

1. Menerapkan algoritma decision tree dan KNN dalam mengklasifikasi nilai
raport pada SMK Bina Insan Bangsa.
2. Mengetahui hasil perbandingan algoritma decision tree dan nave bayes
dalam mengklasifikasi nilai raport pada SMK Bina Insan Bangsa.
1.4.2
Manfaat
Manfaat yang bisa diambil dari penelitian yang dilakukan adalah :

1. Bisa menjadi salah satu acuan untuk peneliti lain apabila ingin melakukan
penelitian dengan data yang sama akan tetapi menggunakan algoritma
yang berbeda.
2. Bisa digunakan sebagai salah satu acuan pertimbangan untuk mengambil
kebijakan.
BAB II
PEMBAHASAN
2.1
Data
Berikut adalah data set yang akan digunakan dalam proses rapid miner.
Dikarenakan data yang digunakan memiliki jumlah yang banyak, jadi hanya
ditampilkan sedikit saja untuk data yang digunakan dalam proses rapid miner.
Untuk lebih lengkapnya bisa dilihat pada Tabel 1.
Tabel 1. DataSet Nilai Raport
Data tersebut merupakan data yang diambil langsung dari SMK Bina Insan
Bangsa dan merupakan data nilai raport untuk kelas X TKJ-3.
2.2
Algoritma Yang Digunakan
2.2.1
Decision Tree (C4.5)

Secara
konsep Decision
Tree adalah
salah
satu
dari
teknik
decision analysis. Tree sendiri pertama kali diperkenalkan pada tahun 1960-an
oleh Fredkin. tree berasal dari kata retrival (pengambilan kembali) sesuai
dengan fungsinya. Secara etimologi kata ini diucapkan sebagai tree. (Yudha,
2015)
Secara singkat bahwa Decision Tree
merupakan salah satu metode
klasifikasipada Text Mining. Klasifikasi adalah proses menemukan kumpulan pola

atau fungsi-fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan
lainnya, untukdapat digunakan untuk memprediksi data yang belum memiliki
kelas data tertentu.(Yudha, 2015)
Decision Tree adalah sebuah struktur pohon, dimana setiap node
pohonmerepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu
pembagianhasil uji, dan node daun (leaf) merepresentasikan kelompok kelas
tertentu. Level nodeteratas dari sebuah Decision Tree adalah node akar (root) yang
biasanya berupa atributyang paling memiliki pengaruh terbesar pada suatu kelas
tertentu. Pada umumnyaDecision Tree melakukan strategi pencarian secara topdown untuk solusinya. Pada proses mengklasifikasi data yang tidak diketahui,
nilai atribut akan diuji dengan caramelacak jalur dari node akar (root) sampai
node akhir (daun) dan kemudian akandiprediksi kelas yang dimiliki oleh suatu
data baru tertentu. (Yudha, 2015)
Kelebihan algoritma decision tree (Yuliastri, 2015) :
1. Menghilangkan perhitungan-perhitungan yang tidak dibutuhkan. Sample
yang diuji hanya berdasarkan kriteria atau kelas tertentu.
2. Pengambilan keputusan yang sebelumnya kompleks dan sangat global
diubah lebih simpel dan spesifik.
3. Metode
ini
menghindari
munculnya
permasalahan
ini
dengan
menggunakan kriteria yang jumlahnya lebih sedikit pada setiap node

internal tanpa banyak mengurangi kualitas keputusan yang dihasilkan.
4. Bersifat fleksibel, memilih fitur dari internal node yang berbeda, fitur yang
terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain
dalam node yang sama. Kefleksibelan metode ini meningkatkan kualitas
keputusan yang dihasilkan.
Kekurangan algoritma decision tree (Yuliastri, 2015) :
1. Terjadi overlap, hal ini sering saya temui ketika menggunakan kelas-kelas
dan kriteria yang digunakan dalam jumlah besar. Hal tersebut juga dapat
menyebabkan meningkatnya waktu pengambilan keputusan dan jumlah
memori yang diperlukan.
2. Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon
keputusan yang besar.
3. Kesulitan dalam mendesain pohon keputusan yang optimal.
4. Hasil kualitas keputusan yang didapatkan dari metode pohon keputusan
sangat tergantung pada bagaimana pohon tersebut didesain.
2.2.2
K-Nearest Neighbor (KNN)

Algoritma k-nearest neighbor (KNN) adalah sebuah metode untuk
melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang

jaraknya paling dekat dengan objek tersebut. KNN termasuk algoritma supervised
learning
dimana hasil dari query instance yang baru diklasifikan berdasarkan mayoritas
dari kategori pada KNN. Nanti kelas yang paling banyak muncullah yang akan
menjadi kelas hasil klasifikasi.
Tujuan dari algoritma ini adalah mengklasifikasikan obyek baru
bedasarkan atribut dan training sample. Classifier tidak menggunakan
modelapapun untuk dicocokkan dan hanya berdasarkan pada memori. Diberikan
titik query, akan ditemukan sejumlah k obyek atau (titik training ) yang paling
dekat dengan titik query. Klasifikasi menggunakan voting terbanyak diantara
klasifikasidari k obyek. Algoritma k-nearest neighbor (KNN) menggunakan
klasifikasi ketetanggaan sebagai nilai prediksi dari query instance yang baru.
2.4
Proses di Rapid Miner
2.4.1 Decision Tree (C4.5)

Berikut adalah proses yang akan dilakukan dalam melakukan proses rapid
miner menggunakan algoritma Decision Tree (C4.5):
10
1. Gambar 3 merupakan direktori repository, dimana dataset yang telah

diimport tersimpan
Gambar 3. Repository
2. Gambar 4 merupakan tempat dimana semua operator yang akan digunakan

berada.
Gambar 4. Operator
3. Gambar 5 menunjukan proses import data.
11
Gambar 5. Import Data
4.
Gambar 6 menunjukan penentuan set role, yaitu id dan label.
Gambar 6. Change Role
12
5. Gambar 7 menunjukan proses drag dataset dan validation. Untuk dataset

merupakan data file berformat excel dan validation yang dipakai disini
merupakan X-Validation.
Gambar 7. Drag data
6. Gambar 8 menunjukan main proses dimana algoritma yang digunakan

adalah decision tree.
Gambar 8. Main Proses
7. Gambar 9 menunjukan hasil proses di rapidminer menggunakan algoritma

decision tree untuk akurasi.
13
Gambar 9. Akurasi
8. Gambar 10 menunjukan hasil proses di rapidminer menggunakan

algoritma decision tree untuk Kappa.
Gambar 10. Kappa

algoritma decision tree dalam bentuk pohon keputusan.
14
Gambar 11. Tree nilai raport
Dari gambar 11 ini dapat dideskripsikan apabila nilai rata-rata K

lebih dari 81,584 maka nilai akhir adalah A. Bila rata-rata K antara 79,66 81,584 dan rata-rata P lebih besar dari 75,632 maka nilai akhir adalah B.
Bila rata-rata K kurang dari sama dengan 79,66, rata-rata P lebih besar dari
75,632, dan PABP P lebih besar dari 79 maka nilai akhir adalah B. Bila
rata-rata K kurang dari sama dengan 79,661, rata-rata P lebih besar dari
75,632, dan PABP P lebih kurang dari sama dengan 79 maka nilai akhir
adalah C. Bila rata-rata K kurang dari sama dengan 81,584, dan rata-rata P
kurang dari sama dengan 75,632 maka nilai akhir adalah C.
2.4.2
KNN
Berikut adalah proses yang akan dilakukan dalam melakukan proses rapid
miner menggunakan algoritma KNN :

1. Gambar 13 menunjukan main proses dengan menggunakan algoritma
KNN.
15
Gambar 13. Main Proses 2

algoritma KNN untuk akurasi.
Gambar 14. Akurasi KNN

algoritma KNN untuk Kappa.
16
Gambar 15. Kappa KNN
BAB III
PENUTUP
3.1
Kesimpulan
Dari analisis yang telah dilakukan dapat dilihat hasil dari algoritma
decision tree memiliki akurasi 82,50%, dan Kappa 0,714. Untuk algoritma KNN
memiliki akurasi 69,17%, dan Kappa 0,541. Untuk hasil perbandingan antara
algoritma decision tree dan KNN yang dilakukan maka dapat disimpulkan
algoritma decision tree lebih baik daripada KNN dalam melakukan klasifikasi
nilai raport pada SMK Bina Insan Bangsa.
3.2
Saran
Saran yang bisa diberikan dari penelitian yang telah dilakukan adalah para
peniliti lain bisa mencoba beberapa algoritma lain untuk proses data mining agar
hasil yang didapat lebih baik.
20
DAFTAR PUSTAKA
Yudha, manik kartika. (2015). Pembahasan Decision Tree. Retrieved December
20, 2016, from http://dokumen.tips/documents/pembahasan-decisiontree.html
Yuliastri, I. (2015). Konsep Pohon Keputusan [Decision Tree] Data Mining.
Retrieved December 15, 2016, from http://tutorcollection.com/konseppohon-keputusan-decision-tree-data-mining/
21

Prediksi Klasifikasi Nilai Raport Datamining

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Prediksi Klasifikasi Nilai Raport Datamining

Diunggah oleh

Hak Cipta:

Format Tersedia

PREDIKSI KLASIFIKASI NILAI RAPORT

PADA SMK BINA INSAN BANGSA

Asep Subhan Suryadi

PROGRAM STUDI TEKNIK INFORMATIKA

1.1. Latar Belakang

1.2. Rumusan Masalah

1.3. Batasan Masalah

1.4. Tujuan dan Manfaat 3

2.2.1. Decicion Tree (C4.5) 5

2.4. Proses di Rapid Miner

2.4.1. Decicion Tree (C4.5) 10

2.5.1. Decicion Tree (C4.5) 18

Gambar 1. Data Indeks inti, harga, dan barang

Gambar 6. Change Role

Gambar 10. Presisi

Gambar 11. Recall

Gambar 12. Tree Inflasi

Gambar 13. Main Proses 2

Gambar 14. Akurasi Bayes

Gambar 15. Presisi Bayes

Gambar 16. Recall Bayes

Gambar 17. T-Test

Tabel 1. Data Set Inflasi

Tabel 2. Confusion Matrix

Tabel 3. Perhitungan Presisi dan Recall

pengambilan keputusan. Fokus penilain pendidikan adalah keberhasilan belajar

penelitian ini yaitu :

Tujuan dan Manfaat

Tujuan dari penelitian ini adalah :

Manfaat yang bisa diambil dari penelitian yang dilakukan adalah :

Algoritma Yang Digunakan

Decision Tree (C4.5)

merupakan salah satu metode

klasifikasipada Text Mining. Klasifikasi adalah proses menemukan kumpulan pola

menggunakan kriteria yang jumlahnya lebih sedikit pada setiap node

K-Nearest Neighbor (KNN)

melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang

Proses di Rapid Miner

2.4.1 Decision Tree (C4.5)

1. Gambar 3 merupakan direktori repository, dimana dataset yang telah

2. Gambar 4 merupakan tempat dimana semua operator yang akan digunakan

3. Gambar 5 menunjukan proses import data.

Gambar 5. Import Data

Gambar 6 menunjukan penentuan set role, yaitu id dan label.

Gambar 6. Change Role

5. Gambar 7 menunjukan proses drag dataset dan validation. Untuk dataset

Gambar 7. Drag data

6. Gambar 8 menunjukan main proses dimana algoritma yang digunakan

Gambar 8. Main Proses

7. Gambar 9 menunjukan hasil proses di rapidminer menggunakan algoritma

8. Gambar 10 menunjukan hasil proses di rapidminer menggunakan

Gambar 10. Kappa

9. Gambar 11 menunjukan hasil proses di rapidminer menggunakan

Gambar 11. Tree nilai raport

Dari gambar 11 ini dapat dideskripsikan apabila nilai rata-rata K

miner menggunakan algoritma KNN :

Gambar 13. Main Proses 2

2. Gambar 14 menunjukan hasil proses di rapidminer menggunakan

Gambar 14. Akurasi KNN

3. Gambar 15 menunjukan hasil proses di rapidminer menggunakan

Gambar 15. Kappa KNN

Anda mungkin juga menyukai