PENDAHULUAN
1
satuan dan jenjang pendidikan, dan (2) mata pelajaran pilihan yang diikuti oleh
peserta didik sesuai dengan pilihan mereka.
Permasalahan yang sering terjadi adalah pada saat kelulusan peserta didik
mengalami kesulitan memilih peminatan mata pelajaran yang akan dipilihnya
terutama dalam melanjutkan mata pelajaran di semester berikutnya diharapkan
peserta didik SMK Negeri Purwosari mempunyai dasar / basic kosentrasi
peminatan mata pelajaran produktif yang diminati. Penelitian ini diharapkan juga
menjadi pedoman bagi SMK Negeri Purwosari untuk menentukan bidang
peminatan mata pelajaran produktif serta untuk menentukan bidang kerja pada
saat lulus nantinya.
Berdasarkan uraian diatas pada penelitian ini akan dibuat sebuah model
untuk mengklasifikasikan peminatan mata pelajaran produktif dengan cara
mengevaluasi hasil studi/raportsiswa kelas X semester satu sampai dengan kelas
XII semester satu. Pada penelitian ini digunakan data mining untuk menentukan
pola hasil studi siswa lima semester kemudian dijadikan dasar untuk menentukan
peminatan mata pelajaran produktif siswa SMK Negeri Purwosari.
Fungsi utama dari data mining adalah untuk klasifikasi, klastering,
asosiasi, prediksi dan estimasi. Dalam penerapannya, seringkali data mining
menghadapi banyak kendala, antara lain jumlah data yang tidak seimbang,
dimensi data yang terlalu banyak dan jumlah atribut data yang besar.Agar data
mining bisa menghasilkan akurasi atau model yang lebih baik lagi dan lebih cepat,
maka ada beberapa tahapan yang bisa dilalui.Salah satunya yaitu optimize
selection. Salah satu metode optimize selectionadalah backward elimination yang
merupakan salah satu teknik pengolahan data awal. Dalam teknik ini akan
dilakukan seleksi terhadap beberapa feature dari dataset.Seleksi ini diperlukan
untuk memilih feature yang dianggap relevan dan menghapus featureyang
dianggap kurang relevan. Agar seleksi feature bisa menghasilkan dataset yang
terbaik maka perlu dilakukan optimasi.[3]Setelah melalui pengolahan data awal,
kemudian data akan diolah lebih lanjut. Pada penelitian ini akan diusulkan metode
K-NN.
Data yang diperoleh melalui evaluasi mining digunakan untuk mendesain
model algoritma yang akan digunakan untuk menentukan peminatan mata
2
pelajaran produktif. Karena itu, pada penelitian ini akan dikembangkan suatu
sistem yang dapat menentukan hasil studi peserta didik dalam penerapan data
mining untuk menentukan peminatan mata pelajaran produktif menggunakan
algoritma K-NNmenggunakan backward elimination.
3
BAB II
TINJAUAN PUSTAKA
4
Klasik dengan model klasifikasi berbasis Diskriminan Kuadratik Robust untuk
penentuan minat siswa Sekolah Menengah Atas berdasarkan kemampuan
akademik dan nilai hasil tes psikologi siswa. Sama seperti algoritma C4.5, model
klasifikasi Diskriminan Kuadratik Klasik dan Diskriminan Kuadratik Robust
adalah model klasifikasi dengan cara menentukan sejumlah kelompok target yang
telah diketahui statusnya diawal proses, sehingga memaksa setiap data untuk
menjadi anggota sebuah kelompok target tertentu
2.2 Landasan Teori
2.2.1 Peminatan Mata Pelajaran
Kurikulum SMK/MAK dirancang dengan pandangan bahwa SMA/MA
dan SMK/MAK pada dasarnya adalah pendidikan menengah, pembedanya hanya
pada pengakomodasian minat peserta didik saat memasuki pendidikan menengah.
Oleh karena itu, struktur umum SMK/MAK sama dengan struktur umum
SMA/MA, yakni ada tiga kelompok Mata pelajaran: Kelompok A, B, dan C.
Peraturan Pemerintah Nomor 17 Tahun 2010 tentang Penyelenggaraan dan
Pengelolaan Pendidikan Pasal 80 menyatakan bahwa: (1) penjurusan pada SMK,
MAK, atau bentuk lain yang sederajat berbentuk bidang keahlian; (2) setiap
bidang keahlian sebagaimana dimaksud pada ayat (1) dapat terdiri atas 1 (satu)
atau lebih program studi keahlian; (3) setiap program studi keahlian sebagaimana
dimaksud pada ayat (2) dapat terdiri atas 1 (satu) atau lebih kompetensi keahlian.
Bidang keahlian pada SMK/MAK meliputi:
a. Teknologi dan Rekayasa;
b. Teknologi Informasi dan Komunikasi;
c. Kesehatan;
d. Agribisnis dan Agroteknologi;
e. Perikanan dan Kelautan;
f. Bisnis dan Manajemen;
g. Pariwisata;
h. Seni Rupa dan Kriya;
i. Seni Pertunjukan.
5
Dalam penetapan penjurusan sesuai dengan bidang/program/paket
keahlian mempertimbangan Spektrum Pendidikan Menengah Kejuruan yang
ditetapkan oleh Direktur Jenderal Pendidikan Menengah Kementerian Pendidikan
dan Kebudayaan.
Pemilihan Peminatan Bidang Keahlian dan program keahlian dilakukan
saat peserta didik mendaftar pada SMK/MAK. Pilihan pendalaman peminatan
keahlian dalam bentuk pilihan Paket Keahlian dilakukan pada semester 3,
berdasarkan nilai rapor dan/atau rekomendasi guru BK di SMK/MAK dan/atau
hasil tes penempatan (placement test) oleh psikolog.
Pada SMK/MAK, Mata Pelajaran Kelompok Peminatan (C) terdiri atas:
a. Kelompok Mata Pelajaran Dasar Bidang Keahlian (C1);
b. Kelompok Mata Pelajaran Dasar Program Keahlian (C2);
c. Kelompok Mata Pelajaran Paket Keahlian (C3).
Mata pelajaran serta KD pada kelompok C2 dan C3 ditetapkan oleh
Direktorat Jenderal Pendidikan Menengah Kementerian Pendidikan dan
Kebudayaan untuk menyesuaikan dengan perkembangan teknologi serta
kebutuhan dunia usaha dan industri.
2.2.2 Data Mining
2.2.2.1 Pengertian Data Mining
Data mining merupakan ilmu yang mempelajari cara untuk mengekstrak dan
mengeksplore suatu pengetahuan atau menemukan suatu pola dari sebuah data
dengan menggunakan beberapa metode yang sesuai. Data mining merupakan
gabungan dari beberapa bidang disiplin ilmu, antara lain statistika, information
retrieval, database, machine learning dan sebagainya. Data mining bisa diterapkan
dalam bidang kesehatan, perbankan, pendidikan, bisnis, dan lain sebagainya. Data
mining merupakan salah satu cara untuk menemukan informasi yang ada dalam
sebuah database dan merupakan bagian dari proses Knowledge Discovery in
Database (KDD).Yaitu suatu proses untuk menemukan informasi dan pola suatu
data dalam database. Rangkaian proses atau tahap data mining dapat dibagi
menjadi beberapa bagian [5], yaitu:
a. Pembersihan data, yaitu untuk membuang data yang tidak konsisten dan
membuang noise.
6
b. Integrasi data, yaitu penggabungan data dari beberapa sumber.
c. Transformasi data,yaitu data diubah dan diolah menjadi bentuk yang bisa
atau yang sesuai untuk di-mining atau proses pengolahan data berikutnya.
d. Penerapan metode atau teknik data mining, yaitu melakukan pengolahan
data dengan salah satu metode yang dipilih.
e. Evaluasi hasil atau pola yang ditemukan, yaitu untuk mengetahui kinerja
dari metode yang digunakan.
f. Presentasi pengetahuan yaitu mempublikasikan atau membuat pelaporan
tentang eksperiment secara keseluruhan.
7
C4.5, CART, Linear Discriminant Analysis, dan lain sebagainya. Contoh
penggunaan algoritma klasifikasi antara lain digunakan untuk menentukan
jenis bunga Iris.
e. Asosiasi; metode inidigunakan untuk menemukan atribut yang mempunyai
hubungan dengan atribut yang lain. Contohalgoritma association adalah A
Priori, FP-Growth, dan lain sebagainya.Contoh penerapan metode ini yaitu
untuk menentukan iklan yang sesuai bagi konsumen berdasarkan sesuatu yang
dia beli.
8
- Prediksi; contohnya neural network, support vector machine,
linear regression
- Klasifikasi; contohnya neural network, linear discriminant
analysis, random forest, CART, ID3, C4.5, k-nearest
neighbour, naïve bayes
- Klastering; contohnya fuzzy c-means, self-organizing map, k-
medoids, k-means
- Asosiasi; contohnya a priori, fp-growth
- Output (pola atau model atau knowledge); output dari pengolahan
data mining antara lain:
- Rumus atau fungsi regresi; contohnya rumus waktu tempuh =
0.5+0.6jarak+0.3lampu+0.2pesanan
- Pohon keputusan; contohnya:
cuaca
=mendung
=cerah
=hujan
yes no no yes
a b
c d e
g h f
g h
Gambar 2.3.Contoh gambar venn
- Evaluasi; beberapa contoh hasil evaluasi antara lain:
9
- Estimasi; evaluasinya berupa error yaitu RMSE(root mean square
error), MSE, MAPE
- Prediksi; evaluasinya berupa error yaitu RMSE(root mean square
error), MSE, MAPE
- Klasifikasi; evaluasinya berupa Confusion matrix yaitu akurasi dan
berupa ROC curve yaitu AUC atau area under curve
- Klastering; evaluasinya berupa internal yaitu dunn index, davies-
bouldin index dan berupa external yaitu Confusion matrix, fowlkes-
mallows index, jaccard index, f-measure, rand measure
- Aosiasi; evaluasinya berupa lift charts yaitu lift ratio dan berupa
precision and recall yaitu f-measure
2.2.3 Konversi Data
Konversi data merupakan proses awal dalam pemrosesan dataset. Proses
ini diperlukan agar dataset bisa diolah sesuai dengan kebutuhan. Konversi data
nominal dan data polynomial menjadi data numerik bisa dilakukan dengan
menetapkan ranking kepada valueyang akan di konvert. Proses penetapan ranking
data nominal tidak sama dengan data numerik. Jika pada data numerik bisa
langsung dengan melihat valueyang ada maka pada data nominal harus melalui
proses. Salah satunya dengan cara menghitung frekwensi dari data nominal
[8]yang akan di ubah menjadi numerik.
10
sejumlah k tetangga terdekat dari titik itu. Persamaan kedekatan antar tetangga
dihitung dengan similarity19]:
∑𝑛
𝑖=1 𝑓 (𝑇𝑖 ,𝑆𝑖 )∗𝑤𝑖
Similarity (T,S) = (3)
𝑤𝑖
Keterangan:
T : kasus baru
S : kasus yang ada dalam penyimpanan
n : jumlah atribut dalam setiap kasus
i : atribut individu antara 1 sampai dengan n
f : fungsi similarity atribut i antara kasus T dan kasus S
w : bobot yang diberikan pada atribut ke-i
2.2.6 Backward Elimination
Backward elimination[13]merupakan metode untuk menghapus atribut
yang tidak relevan.Prinsip backward elimination adalah memasukan semua
variabel bebas yang ada, kemudian mengeliminasi variabel satu persatu. Misal y,
x1, x2, x3, x4, maka tahapan backward elimination adalah:
- Regresikan y terhadap semua variabel bebas x1, x2, x3, x4
- Tentukan variabel bebas yang akan diuji. Variabel bebas lain ada di
dalam model hitung berikut : ryx1|x2,x3,x4; ryx2|x1,x3,x4;ryx3|x1,x2,x4;
ryx4|x1,x2,x3
- Variabel bebas dengan nilai koefisien korelasi parsial paling kecil akan
diuji pertama kali apakah akan dieliminasi atau tetap dipertahankan di
11
- Membuat model pengolahan data dengan memasukkan semua atribut
- Kemudian membuat perbandingan pengolahan data dengan
mengeluarkan salah satu atribut ke n.
- Kemudian diulangi hingga semua atribut n+1.
- Kemudian semua hasil perhitungan dibandingkan hingga didapatkan
hasil atribut manakah yang relevan dan manakah yang irrelevan.
12
2.3. Kerangka Pemikiran
Masalah
Pengumpulan Data
Nilai Hasil Studi Siswa SMK Tahun akademik 2016-2017 dari kelas X
semester 1 dan 2 sampai kelas XII semester 1 dan 2
Eksperimen
Pengujian Model
Pengukuran
Hasil
13
BAB III
METODE PENELITIAN
14
Tabel 3.1 Rentang Nilai K13
Konversi nilai akhir Predikat
Skala 100 Skala 4 (pengetahuan dan Sikap
ketrampilan)
86-100 4 A
SB
81-85 3.66 A-
76-80 3.33 B+
71-75 3.00 B B
66-70 2.66 B-
61-65 2.33 C+
56-60 2 C C
51-55 1.66 C-
46-50 1.33 D+
K
0-45 1 D
Data yang digunakan adalah data sekunder berupa nilai raport dari peserta
didiktahun pelajaran 2016/2017. Data tersebut disesuaikan dengan kurikulumnya.
Jadi nilai yang diambil adalah nilai untuk mata pelajaran dari kelas X semester 1
dan 2 sampai Kelas XII semester 1 dan 2.
Mata pelajaran Sekolah Menengah Kejuruan pada kurikulum 2013 adalah sebagai
berikut :
Tabel 3.1 Daftar Mata Pelajaran
KELAS
MATA PELAJARAN X XI XII
1 2 1 2 1 2
Kelompok A (Wajib)
1 Pendidikan Agama dan Budi Pekerti 3 3 3 3 3 3
2 Pendidikan Pancasila dan Kewarganegaraan 2 2 2 2 2 2
3 Bahasa Indonesia 4 4 4 4 4 4
4 Matematika 4 4 4 4 4 4
5 Sejarah Indonesia 2 2 2 2 2 2
6 Bahasa Inggris 2 2 2 2 2 2
15
Kelompok B (Wajib)
7 Seni Budaya 2 2 2 2 2 2
8 Prakarya dan Kewirausahaan 2 2 2 2 2 2
9 Pendidikan Jasmani, Olah Raga & Kesehatan 3 3 3 3 3 3
Kelompok C (Peminatan)
C1. Dasar Bidang Keahlian
10 Fisika 2 2 2 2 - -
11 Pemrograman Dasar 2 2 2 2 - -
12 Sistem Komputer 2 2 2 2 - -
C2. Dasar Program Keahlian
13 Perakitan Komputer 4 4 - - - -
14 Simulasi Digital 3 3 - - - -
15 Sistem Operasi 3 3 - - - -
16 Jaringan Dasar 4 4 - - - -
17 Pemrograman Web 4 4 - - - -
C3. Paket Keahlian
18 Paket Keahlian Rekayasa Perangkat Lunak - -
1. Pemodelan Perangkat Lunak - - 2 2 - -
2. Pemrograman Desktop - - 4 4 - -
3. Pemrograman Berorientasi Obyek - - 4 4 4 -
4. Basis Data - - 4 4 4 -
5. Pemrograman Web Dinamis - - 4 4 4 -
6. Pemrograman Grafik - 4 4
7. Pemrograman Perangkat Bergerak - - - - 4 4
8. Administrasi Basis Data - - - - 4 4
9. Kerja Proyek - - - - - 12
JUMLAH 18 18 24 24
16
bermanfaat. Dilakukan normalisasi untuk masing-masing data pelatihan dan data
uji.
Setelah dilakukan normalisasi data ditentukan dilakukan seleksi fitur
menggunakan Backward Elimination untuk menentukan seleksi atribut. Kedua
kelompok data percobaan tersebut kemudian dilatih menggunakan jaringan syaraf
tiruan KNN
Berdasarkan hasil pengujian kedua metode tersebut akan ditentukan
akurasi tertinggi. Terakhir, akurasi dan nilai root mean squared error (RMSE)
dari masing-masing percobaan.
Pre Prosesing
Evaluasi
17
3.5 Tahapan Penelitian
Penelitian ini terdiri dari beberapa tahapan penelitian, meliputi tahap persiapan,
tahap penelitian dan tahap akhir yang dijabarkan sebagai berikut:
1. Tahap persiapan
Pada tahap ini dilakukan berbagai persiapan dengan mengumpulkan data-data
yang diperlukan dalam penelitian seperti data hasil belajar siswa dan studi
kepustakaan mengenai literatu-literatur yang terkait dengan obyek penelitian.
2. Tahap penelitian
Tahap penelitian dalam penelitian ini adalah pemrosesan data set yang sudah
didapatkan dari metode penentuan sampel dilakukan dengan menggunakan
metode KNN. Penentuan atribut terbesar dengan menggunakan information gain
untuk meningkatkan akurasi algoritma KNN berbasis backward eliminationHasil
penentuan backward elimination akan dilakukan sekoring hingga didapatkan
tingkat akurasi dengan menggunakan algoritma K-NN.
3. Tahap akhir
Pada tahap akhir ini, berupa penyusunan hasil penelitian dalam bentuk laporan
18
JADWAL PENELITIAN
Bulan 2017
Kegiatan
Maret April Mei Juni Juli Agustus
Penyusunan proposal
Pengumpulan data
Praproses data
Implementasi Neural
Network optimasi
pemilihan fitur
Evaluasi hasil penelitian
Penyusunan Tesis dan
bahan /makalah seminar
Seminar
Sidang tugas akhir
Revisi tesis dan
penyelesaian laporan
Laporan akhir tesis
19
DAFTAR PUSTAKA
[2] Much. Rifqi Maulana,M. Adib Al Karomi, 2015. information gain untuk
mengetahui pengaruh atribut terhadap klasifikasi persetujuan kredit,
http://jurnal.pekalongankota.go.id/index.php/JP2015/article/download/29/2
4, Diakses 20 April 2017
[3] Betha Nurina Sari, 2016. implementasi teknik seleksi fitur information gain
pada algoritma klasifikasi machine learning untuk prediksi performa
akademik siswa. http://ojs.amikom.ac.id/index.php/semnasteknomedia
/article/viewFile/1352/1270, Diakses 20 April 2017
[4] Eren Bas , Vedide Rezan Uslu , Erol Egrioglu, 2015. Robust learning
algorithm for multiplicative neuron model artificial neural networks
20