Uas Laporan Data Mining SMT 3

LAPORAN MATERI ALGORITMA C4.
SINGLE LINGKAGE DAN ALGORITMA APRIORI
UAS TI 3/3
ACHMAD RESTU FAUZI
20210120072
KATA PENGANTAR
Assalamualaikum wr wb Puji dan Syukur kami panjatkan ke Hadirat Allah Swt, karena
berkat limpahan Rahmat dan Karunia-nya sehingga kami dapat menyusun penelitian ini dengan
baik dan tepat pada waktunya. Dalam penelitian ini kami membahas laporan penelitian “algoritma
c4.5 , teknik single linkage dan algoritma apriori”.
Saya menyadari bahwa masih banyak kekurangan yang mendasar pada penelitian ini. Oleh
karena itu saya mengundang pembaca untuk memberikan saran serta kritik yang dapat membangun
saya. Kritik konstruktif dari pembaca sangat kami harapkan untuk penyempurnaan penelitian
selanjutnya.
Akhir kata semoga laporan ini dapat memberikan manfaat bagi kita sekalian. Wassallam.
DAFTAR ISI
KATA PENGANTAR.................................................................................... 1
DAFTAR ISI................................................................................................... 2
BAB I PENDAHULUAN ............................................................................... 2
1.1 Latar Belakang Masalah ..................................................................... 2
1.2 Tujuan Penelitian ................................................................................. 4
1.3 Manfaat Penelitian ............................................................................... 4
BAB II PEMBAHASAN DAN PENGUJIAN .............................................. 4
BAB III PENUTUP ........................................................................................ 18
3.1 Kesimpulan…………………………………………………………………..18
3.2 Saran…………………………………………………………………..19
BAB I
PENDAHULUAN
1.1 Latar belakang masalah
Dalam bidang pembelajaran mesin, beberapa algoritma yang sering digunakan untuk memecahkan
masalah klasifikasi dan clustering adalah Algoritma C4.5, Teknik Single Linkage, dan Algoritma Apriori.
Dalam makalah ini akan dijelaskan mengenai masing-masing algoritma tersebut.
Kehadiran data minning di latarbelakangi beberapa macam masalah terutama data

explision yang dialami beberapa perusahaan seperti contoh beberapa perusahaan mengumpukan
data dari tahun ketahun lamanya (data pembelian, data stock barang, data mahasiswa dan data
lainya) (Rangga Gelar Guntara, 2011). Kehadiran data mining merupakan juga bidang ilmu yang
sangat luas penerapanya diantaranya penerapan dalam kehidupan sehari-hari, dengan data mining
dapat menganalisis beberapa masalah yang belum dikhetahui. data mining menurut David Hand,
Heikki Mannila, padharic Smyth dari MIT adalah analisis terhadap data ( biasanya data yang
berukuran besar ) untuk menemukan hubungan yang jelas serta menyimpulkanya yang belum
dikhetahui sebelumnya dengan cara terkini dipahami dan berguna bagi pemilik data tersebut
(Larose, 2006).
Masalah ini pula yang terjadi pada para pesepeda yang ingin berolah raga dengan
menggunakan sepeda, terkadang pesepeda tidak mengetahui jika olah raga sepeda yang mereka
rencakan jauh-jauh hari bisa batal tanpa sepengetahuan oleh faktor alam yang tidak di prediksi
sebelumnya, seperti contohnya hujan atau bencana alam.
Perkembangaan ilmu teknologi dan ilmu industri mengharuskan beberapa macam masalah
muncul di kehidupan sehari-hari, seperti contoh dengan berkembangnya ilmu teknologi dan
industri yang mempengaruhi tatanan alam berubah seperti tidak terprediksinya musim kemarau
dan musim hujan yang mengakibatkan sulitnya memprediksi keadaan alam.
Data mining diartikan sebagai menambang data atau upaya untuk menggali informasi yang
berharga dan berguna pada database yang sangat besar (Agrawal, R., Srikant, 1996). Hal terpenting dalam
teknik data mining adalah aturan untuk menemukan pola frekuensi tinggi antar himpunan itemset yang
disebut fungsi Association Rules (Aturan Asosiasi). Ada beberapa algoritma yang termasuk dalam Aturan
Asosiasi adalah seperti AIS Algorithm, Apriori Algorithm, DHP Algorithm, dan Partition Algorithm (
Shuruti Aggarwal, 2013 ). Akan tetapi diantara algoritma – algoritma tersebut, penulis memilih Algoritma
Apriori sebagai aplikasi penenlitian.
Ada banyak metode Clustering yang dapat digunakan, diantaranya metode Single Linkage
Clustering, Complete Linkage Clustering, Group Average Agglomerative Clustering, K-Means
(MacQueen, 1967) , dan K-Medoids. 2 Berdasarkan metode-metode tersebut, metode yang sering
digunakan adalah metode K-Means. Kelebihan dari metode yang dikembangkan oleh McQueen ini yaitu,
mampu mengelompokkan dokumen dalam jumlah yang besar dengan waktu komputasi yang cepat. Prinsip
dari metode ini adalah mempartisi suatu koleksi dokumen menjadi beberapa cluster dan menentukan
centroid (titik pusat awal) secara acak. Tetapi, metode K-Means ini juga memiliki kelemahan yaitu sensitif
terhadap outlier.
Belakang ini algoritma apriori sudah membuktikan keakuratannya sebagai metode yang tepat untuk
menjadi solusi dalam pengambilan keputusan mencari pola frekuensi itemset pada data penjualan,
sebagaimana penelitian ini dilakukan oleh Jogi Suresh, dan T. Ramanjaneyulu ( Jogi Suresh, T.
Ramanjaneyulu, 2013 ), tentang pencarian pola frekuensi itemset pada data mining menggunakan algoritma
apriori. Di samping itu banyak lagi penelitan – penelitian yang sama menggunakan metode algoritma
apriori. Penelitian yang dilakukan oleh Rakesh Agrawal dkk ( Agrawal, R. Manilla, H. Srikant, R.
Toivonen, H. & Verkamo, I., 1996 ) yang membahas tentang cara kerja aturan asosiasi menggunakan
algoritma Apriori untuk menemukan itemset terbesar dengan menggunakan data sintetik.
1.2 Tujuan Penelitian
Maksud dan tujuan dari penelitian ini adalah :
1. Kemungkinan terjadinya gangguan oleh factor alam

2. maka tujuan yang ingin dicapai pada tugas akhir ini adalah menemukan aturan asosiasi penjualan
dengan menggunakan metode Apriori berdasarkan data transaksi untuk mendapatkan informasi
sebagai langkah pengambilan keputusan dalam pemberian rekomendasi barang otomotif
terhadap pelanggan atau pembeli.
3. Mengetahui efektivitas Algoritma K-Means, K-Medoids, serta modifikasi algoritma K-Medoids dari
segi kecepatan waktu komputasi.
1.3 Manfaat penelitian
Manfaat pertama yang diharapkan dari penelitian ini adalah mempermudah dan mempercepat
penyelesaian kasus untuk mengelompokkan data dalam jumlah besar dengan Modifikasi Algoritma K-
Medoids.
Manfaat kedua yaitu dapat memberikan pelayan yang maksimal terhadap pelanggan atau
konsumen serta meningkatkan penjualan barang dengan memberikan rekomendasi pembelian barang
terhadap pelanggan.
BAB II
PEMBAHASAN DAN PENGUJAN

Pengujian system Algoritma c4.5 menggunakan aplikasi Rapid Miner
STEP 1 : IMPORT DATA
◉ Buka program Rapid Miner yang telah diinstal, setelah proses maka akan muncul tampilan awal
aplikasi Rapid Miner.
◉ Klik New, New berguna untuk memulai proses analisis baru.

◉ Berikut gambar dibawah hasil data import berupa format XLS
STEP 2 : BUAT DATABASE
◉ Pada step ini pilih New Local Repository sebagai tempat untuk menyimpan database. Kemudian
isi nama dan pilih Finish.
STEP 3: MASUKAN DATABASE
◉ Lalu masukkan database data Uji Kompetensi Keahlian Siswa yang telah di simpan di New Local
Repository, drag and drop database ke halaman kerja Rapid Miner
STEP 4 : DECISION TREE
◉ Langkah selanjutnya adalah memasukkan metode decision tree kedalam halaman kerja Rapid
Miner yaitu dengan cara klik icon Repositories pilih modeling, lalu pilih classification and
regression, kemudian pilih tree induction, lalu pilih decision tree, drag and drop decision tree
kehalaman kerja. Kemudian hubungkan database dengan decision tree sampai tidak ada error.
STEP 5: OUTPUT
◉ Kemudian tekan tombol F11 pada keyboard untuk

menjalankan program.
PAMBAHASAN DAN PENGUJIAN SINGLE LINKAGE CLUSTERING

Single Linkage Clustering adalah salah satu teknik clustering yang mengelompokkan objek
berdasarkan jarak terdekat/terpendek antara dua objek dalam cluster yang berbeda.
Software WEKA adalah sebuah perangkat lunak yang menerapkan berbagai algoritma machine
learning untuk melakukan beberapa proses berkaitan dengan Data Mining untuk melakukan
generalisasi dari sekumpulan data dengan cara calah satunya adalah clustering.
PENGUJIAN
- Masukan (Input) Data
Input data sangat berpengaruh di dalam pengisian data sehingga data yang dikehendaki dapat
diterima oleh sistem dan juga diproses untuk pembuatan laporan yang dikehendaki.
- SUMBER DATA
Langkah awal yang dilakukan adalah input data nilai kehadiran, nilai tugas, UAS, UTS dan Hasil yang
kemudian disimpan dengan type Microsoft Excel Comma Separated Values File (.csv).
- Tujuan pengujiannya adalah mengelompokan jumlah mahasiswa berdasarkan Hasilnya
- Sumber data berekstensi.csv
- Buka aplikasi WEKA, akan
tampilan halaman utama.

- Pilih Explorer
Setelah klik Explorer, akan
tampil halaman seperti ini.
- Pilih Open File untuk membuka
sumber data.
- Pilih sumber data yang
berkestensi .csv,
lalu Open
- Akan tampil data beserta atributnya, Remove atribut “Nama”
- Klik Visualize All untuk melihat atribut secara keseluruhan.
- Tampilan atribut secara keseluruhan

- Pilih Menu Cluster, dan pilih metode HierarchicalClusterer
- Double cklik pada kolom Choose.
- Link Type : SINGLE

- numCluster : 5 (Karena untuk menentukan jumlah pengelompokan hasil mahasiswa sesuai
Grade nilai A,B,C,D,E)
- Klik OK dan Start
Hasil sesuai Grade Nilai :
A = 11 Mahasiswa
B = 9 Mahasiswa
C = 2 Mahasiswa
D = 2 Mahasiswa
E = 2 Mahasiswa
- Klik kanan pada Result, pilih Visualize cluster assignments

- Akan tampil tampilan Cluster Visualize/ Hasil dari analisa, Klik Save
- Save dan simpan hasil dengan type file Arff

- Pada menu Tools pilih ArffViewer
- Open file yang sudah di save sebelumnya yang bertype Arff

Tampilan akhir hasil pengujian dengan
metode Single Lingkage
Cluster0 = A (11 Mahasiswa)
Cluster1 = B (9 Mahasiswa)
Cluster2 = C (2 Mahasiswa)
Cluster3 = D (2 Mahasiswa)
Cluster4 = E (2 Mahasiswa)
SELANJUTNYA PEMBAHASAN DAN PENGUJIAN PADA ALGORITMA APRIORI
Apriori adalah algoritma asosiasi rule-mining untuk memecahkan masalah Frequent Itemset dalam
transaksi. Algoritma ini menggunakan teknik "A priori" yaitu menggunakan asumsi bahwa jika suatu item
tidak muncul dalam itemset yang terkait maka item tersebut juga tidak akan muncul dalam itemset yang
lebih besar.
Step 1 : Tampilan utama
STEP 2 : MEMBUKA FILE

STEP 3 : KLIK OPEN
STEP 4 : KLIK ASSOCIATE

STEP 5 : MENGKONFIGURASI
STEP 6: MEMULAI PENGUJIAN KLIK START

STEP 7: MENAMPILKAN HASIL
BAB III
PENUTUP
3.1 Kesimpulan
Dari hasil penelitian 3 materi ini dapat ditarik kesimpulan sebagai berikut :
a. Algoritma C4.5 dapat digunakan untuk memudahkan dalam pengambilan keputusan

dengan memproyeksikan datadata yang ada ke dalam bentuk pohon keputusan,
berdasarkan nilai entropy dan gain yang dimiliki masing-masing atribut data.
b. Algoritma Apriori dapat menemukan pola-pola dalam itemset yang berguna
untuk mengambil keputusan dan memahami hubungan antar item.
c. metode complete linkage (metode hierarki) memiliki kinerja yang lebih baik daripada metode
KMeans (non-hierarki) karena mempunyai rasio Sw/SB yang lebih kecil
3.2 SARAN
Dari hasil penelitian dan kesimpulan materi diatas , saya menyarankan kepada pembuat 3 mataeri
tersebut yaitu :
a. Data yang di sediakan kurang lengkap

Uas Laporan Data Mining SMT 3

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Uas Laporan Data Mining SMT 3

Diunggah oleh

Hak Cipta:

Format Tersedia

LAPORAN MATERI ALGORITMA C4.

SINGLE LINGKAGE DAN ALGORITMA APRIORI

ACHMAD RESTU FAUZI

1.1 Latar belakang masalah

Kehadiran data minning di latarbelakangi beberapa macam masalah terutama data

1.2 Tujuan Penelitian

Maksud dan tujuan dari penelitian ini adalah :

1. Kemungkinan terjadinya gangguan oleh factor alam

1.3 Manfaat penelitian

PEMBAHASAN DAN PENGUJAN

◉ Klik New, New berguna untuk memulai proses analisis baru.

STEP 2 : BUAT DATABASE

STEP 4 : DECISION TREE

◉ Kemudian tekan tombol F11 pada keyboard untuk

PAMBAHASAN DAN PENGUJIAN SINGLE LINKAGE CLUSTERING

- Masukan (Input) Data

- Tujuan pengujiannya adalah mengelompokan jumlah mahasiswa berdasarkan Hasilnya

- Sumber data berekstensi.csv

- Buka aplikasi WEKA, akan

tampilan halaman utama.

Setelah klik Explorer, akan

tampil halaman seperti ini.

- Pilih Open File untuk membuka

- Pilih sumber data yang

- Klik Visualize All untuk melihat atribut secara keseluruhan.

- Tampilan atribut secara keseluruhan

- Double cklik pada kolom Choose.

- Link Type : SINGLE

- Klik OK dan Start

Hasil sesuai Grade Nilai :

- Klik kanan pada Result, pilih Visualize cluster assignments

- Save dan simpan hasil dengan type file Arff

- Open file yang sudah di save sebelumnya yang bertype Arff

metode Single Lingkage

Cluster0 = A (11 Mahasiswa)

SELANJUTNYA PEMBAHASAN DAN PENGUJIAN PADA ALGORITMA APRIORI

STEP 2 : MEMBUKA FILE

STEP 4 : KLIK ASSOCIATE

STEP 6: MEMULAI PENGUJIAN KLIK START

a. Algoritma C4.5 dapat digunakan untuk memudahkan dalam pengambilan keputusan

Anda mungkin juga menyukai