UAS TI 3/3
20210120072
KATA PENGANTAR
Assalamualaikum wr wb Puji dan Syukur kami panjatkan ke Hadirat Allah Swt, karena
berkat limpahan Rahmat dan Karunia-nya sehingga kami dapat menyusun penelitian ini dengan
baik dan tepat pada waktunya. Dalam penelitian ini kami membahas laporan penelitian “algoritma
c4.5 , teknik single linkage dan algoritma apriori”.
Saya menyadari bahwa masih banyak kekurangan yang mendasar pada penelitian ini. Oleh
karena itu saya mengundang pembaca untuk memberikan saran serta kritik yang dapat membangun
saya. Kritik konstruktif dari pembaca sangat kami harapkan untuk penyempurnaan penelitian
selanjutnya.
Akhir kata semoga laporan ini dapat memberikan manfaat bagi kita sekalian. Wassallam.
DAFTAR ISI
KATA PENGANTAR.................................................................................... 1
DAFTAR ISI................................................................................................... 2
BAB I PENDAHULUAN ............................................................................... 2
1.1 Latar Belakang Masalah ..................................................................... 2
1.2 Tujuan Penelitian ................................................................................. 4
1.3 Manfaat Penelitian ............................................................................... 4
BAB II PEMBAHASAN DAN PENGUJIAN .............................................. 4
BAB III PENUTUP ........................................................................................ 18
3.1 Kesimpulan…………………………………………………………………..18
3.2 Saran…………………………………………………………………..19
BAB I
PENDAHULUAN
Dalam bidang pembelajaran mesin, beberapa algoritma yang sering digunakan untuk memecahkan
masalah klasifikasi dan clustering adalah Algoritma C4.5, Teknik Single Linkage, dan Algoritma Apriori.
Dalam makalah ini akan dijelaskan mengenai masing-masing algoritma tersebut.
Masalah ini pula yang terjadi pada para pesepeda yang ingin berolah raga dengan
menggunakan sepeda, terkadang pesepeda tidak mengetahui jika olah raga sepeda yang mereka
rencakan jauh-jauh hari bisa batal tanpa sepengetahuan oleh faktor alam yang tidak di prediksi
sebelumnya, seperti contohnya hujan atau bencana alam.
Perkembangaan ilmu teknologi dan ilmu industri mengharuskan beberapa macam masalah
muncul di kehidupan sehari-hari, seperti contoh dengan berkembangnya ilmu teknologi dan
industri yang mempengaruhi tatanan alam berubah seperti tidak terprediksinya musim kemarau
dan musim hujan yang mengakibatkan sulitnya memprediksi keadaan alam.
Data mining diartikan sebagai menambang data atau upaya untuk menggali informasi yang
berharga dan berguna pada database yang sangat besar (Agrawal, R., Srikant, 1996). Hal terpenting dalam
teknik data mining adalah aturan untuk menemukan pola frekuensi tinggi antar himpunan itemset yang
disebut fungsi Association Rules (Aturan Asosiasi). Ada beberapa algoritma yang termasuk dalam Aturan
Asosiasi adalah seperti AIS Algorithm, Apriori Algorithm, DHP Algorithm, dan Partition Algorithm (
Shuruti Aggarwal, 2013 ). Akan tetapi diantara algoritma – algoritma tersebut, penulis memilih Algoritma
Apriori sebagai aplikasi penenlitian.
Ada banyak metode Clustering yang dapat digunakan, diantaranya metode Single Linkage
Clustering, Complete Linkage Clustering, Group Average Agglomerative Clustering, K-Means
(MacQueen, 1967) , dan K-Medoids. 2 Berdasarkan metode-metode tersebut, metode yang sering
digunakan adalah metode K-Means. Kelebihan dari metode yang dikembangkan oleh McQueen ini yaitu,
mampu mengelompokkan dokumen dalam jumlah yang besar dengan waktu komputasi yang cepat. Prinsip
dari metode ini adalah mempartisi suatu koleksi dokumen menjadi beberapa cluster dan menentukan
centroid (titik pusat awal) secara acak. Tetapi, metode K-Means ini juga memiliki kelemahan yaitu sensitif
terhadap outlier.
Belakang ini algoritma apriori sudah membuktikan keakuratannya sebagai metode yang tepat untuk
menjadi solusi dalam pengambilan keputusan mencari pola frekuensi itemset pada data penjualan,
sebagaimana penelitian ini dilakukan oleh Jogi Suresh, dan T. Ramanjaneyulu ( Jogi Suresh, T.
Ramanjaneyulu, 2013 ), tentang pencarian pola frekuensi itemset pada data mining menggunakan algoritma
apriori. Di samping itu banyak lagi penelitan – penelitian yang sama menggunakan metode algoritma
apriori. Penelitian yang dilakukan oleh Rakesh Agrawal dkk ( Agrawal, R. Manilla, H. Srikant, R.
Toivonen, H. & Verkamo, I., 1996 ) yang membahas tentang cara kerja aturan asosiasi menggunakan
algoritma Apriori untuk menemukan itemset terbesar dengan menggunakan data sintetik.
Manfaat pertama yang diharapkan dari penelitian ini adalah mempermudah dan mempercepat
penyelesaian kasus untuk mengelompokkan data dalam jumlah besar dengan Modifikasi Algoritma K-
Medoids.
Manfaat kedua yaitu dapat memberikan pelayan yang maksimal terhadap pelanggan atau
konsumen serta meningkatkan penjualan barang dengan memberikan rekomendasi pembelian barang
terhadap pelanggan.
BAB II
◉ Pada step ini pilih New Local Repository sebagai tempat untuk menyimpan database. Kemudian
isi nama dan pilih Finish.
STEP 3: MASUKAN DATABASE
◉ Lalu masukkan database data Uji Kompetensi Keahlian Siswa yang telah di simpan di New Local
Repository, drag and drop database ke halaman kerja Rapid Miner
◉ Langkah selanjutnya adalah memasukkan metode decision tree kedalam halaman kerja Rapid
Miner yaitu dengan cara klik icon Repositories pilih modeling, lalu pilih classification and
regression, kemudian pilih tree induction, lalu pilih decision tree, drag and drop decision tree
kehalaman kerja. Kemudian hubungkan database dengan decision tree sampai tidak ada error.
STEP 5: OUTPUT
Software WEKA adalah sebuah perangkat lunak yang menerapkan berbagai algoritma machine
learning untuk melakukan beberapa proses berkaitan dengan Data Mining untuk melakukan
generalisasi dari sekumpulan data dengan cara calah satunya adalah clustering.
PENGUJIAN
Input data sangat berpengaruh di dalam pengisian data sehingga data yang dikehendaki dapat
diterima oleh sistem dan juga diproses untuk pembuatan laporan yang dikehendaki.
- SUMBER DATA
Langkah awal yang dilakukan adalah input data nilai kehadiran, nilai tugas, UAS, UTS dan Hasil yang
kemudian disimpan dengan type Microsoft Excel Comma Separated Values File (.csv).
sumber data.
berkestensi .csv,
lalu Open
- Akan tampil data beserta atributnya, Remove atribut “Nama”
A = 11 Mahasiswa
B = 9 Mahasiswa
C = 2 Mahasiswa
D = 2 Mahasiswa
E = 2 Mahasiswa
Cluster1 = B (9 Mahasiswa)
Cluster2 = C (2 Mahasiswa)
Cluster3 = D (2 Mahasiswa)
Cluster4 = E (2 Mahasiswa)
Apriori adalah algoritma asosiasi rule-mining untuk memecahkan masalah Frequent Itemset dalam
transaksi. Algoritma ini menggunakan teknik "A priori" yaitu menggunakan asumsi bahwa jika suatu item
tidak muncul dalam itemset yang terkait maka item tersebut juga tidak akan muncul dalam itemset yang
lebih besar.
Step 1 : Tampilan utama
BAB III
PENUTUP
3.1 Kesimpulan
Dari hasil penelitian 3 materi ini dapat ditarik kesimpulan sebagai berikut :
c. metode complete linkage (metode hierarki) memiliki kinerja yang lebih baik daripada metode
KMeans (non-hierarki) karena mempunyai rasio Sw/SB yang lebih kecil
3.2 SARAN
Dari hasil penelitian dan kesimpulan materi diatas , saya menyarankan kepada pembuat 3 mataeri
tersebut yaitu :
a. Data yang di sediakan kurang lengkap