Anda di halaman 1dari 13

Laporan 6

PRAKTIKUM DATA MINING


“Clustering Algoritma K-Means (Rapid Miner)”

Asisten :

1. Riswandi, S.Kom.
2. Khairunnisa Atika Syahida

Oleh

Nama : Nur Annisa Safitri Yusuf

Nim : 60200118005

Kelas :A

LABORATORIUM KOMPUTER TERPADU

JURUSAN TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI ALAUDDIN MAKASSAR

2020
LEMBAR PENGESAHAN/ACC PRAKTIKUM

Laporan praktikum “DATA MINING” dengan judul “ CLUSTERING


ALGORITMA K-MEANS (RAPID MINER)” yang disusun oleh :

Nim : 60200118005

Nama : Nur Annisa Safitri Yusuf

Kelas :A

Telah diperiksa dan dikonsultasikan kepada Asisten I dan Asisten II maka


dinyatakan diterima

Makassar, 16 Januari 2021

Asisten I, Asisten II,

Riswandi, S.Kom. Khairunnisa Atika Syahida


60200117008

Mengetahui,

Dosen Penanggung Jawab

Muhammad Nur Akbar, S.T., M.T.


LEMBAR PENILAIAN LAPORAN PRAKTIKUM
Nama : Nur Annisa Safitri Yusuf
NIM : 60200118005
Praktikum : Data Mining
Judul praktikum : Clustering Algoritma K-Means (Rapid Miner)

No Komponen penilaian Nilai

I. Nilai Pelaksaan Asistensi ke 1 (100)

A. Kedisiplinan (20)

B. Keterampilan menggunakan Komputer/Software (20)


(20)
C. Keaktifan
(40)
D. Nilai laporan

II. Nilai Pelaksanaan Asistensi ke 2 (100)

A. Kedisiplinan (20)

B. Keterampilan menggunakan Komputer/Software (20)


(20)
C. Keaktifan
(40)
D. Nilai laporan

III Total Nilai laporan praktikum (Asistensi 1 + Asistensi 2)/2 (100)


.

Tanggal praktikum : 15 Januari 2021


Dikumpulkan tanggal : Januari 2021
Dikoreksi tanggal : Januari 2021
Asisten Praktikum,

Riswandi, S.Kom.
SOAL :

1. Satu angkatan Teknik Informatika UIN Alauddin Makassar 2020 terdiri 4


kelas yang masing masing kelas berisi 36 orang, sehingga total ada 144
mahasiswa baru. Pihak prodi ingin menganalisa minat dan bakat mahasiswa
baru tersebut dengan mengelompokkannya berdasarkan nilai MK semester I
dan II yaitu Algoritma dan Pemrograman, Matematika Komputer, Logika
Informatika, PTI, Fisika, Elektronika Digital, Teknologi IoT.
2. Buat tabel untuk 144 mahasiswa tersebut menjadi TIN2020.xls dengan
menggunakan fungsi =4+RAND()*6 untuk semua nilainya. Letakkan kursor
pada kanan bawah fungsi lalu tarik hingga NIM = TIN2020_144 (data ke
144). Setiap data yang dihasilkan pasti berbeda untuk tiap orangnya sehingga
hasilnya pun berbeda.

3. Lakukan clustering dan catat performanya untuk masing-masing nilai k,


sesuai dengan tabel di bawah

K Avg. within centroid Davies Bouldin


distance
3 16.533 2.110
5 13.744 1.822

7 12.282 1.682
4. Tuliskan list NIM kelompok mahasiwa dengan nilai relatif lebih baik
dibandingkan kelompok lainnya pada saat nilai k mendapat performa
terbaiknya. Misal nilai Avg. within centroid distance & Davies Bouldin
terkecil didapatkan pada saat k=5, maka ambil list NIM kelompok terbaik di
antara 5 kelompok yg ada.
 Nilai Avg. within centroid distance & Davies Bouldin terkecil didapatkan
pada saat k=7
a. Logika

b. PTI
5. Langkah Langkah Latihan Laporan 6
a. Jalankan RapidMiner
b. Import data kelasV.xls menggunakan operator Read Excel. Search “Read
Excel” pada jendela Operators. Drag and drop ke Main Process.

c. Klik operator Read Excel arahkan ke tempat file TIN2020.xls tersimpan.


d. Klik tombol Import Configuration Wizard. Tekan Next hingga Step 4 lalu
sesuaikan tipe data dan tipe kolom sesuai dengan gambar di samping lalu klik
Finish.

e. Tambahkan operator k-Means. Search “k-means” pada jendela Operators atau


dapat ditemukan pada Modelling > Clustering and Segmentation > K-Means.
Lalu drag and drop ke Main Process, klik kanan rename Clustering menjadi K-
Means. Sambungkan output dari Read Excel ke K-Means.
f. Klik K-Means lalu ubah parameter k=3 untuk menghasilkan jumlah cluster yang terbentuk
sebanyak 3

g. Drag and drop Cluster Distance Performance pada Main Process lalu susun seperti gambar
berikut. Lalu Klik RUN. Lalu klik result perspective
h. Hasil dari proses clustering dapat dilihat seperti pada gambar berikut.
i. Nilai centroid pada tiap clusternya, dapat dilihat pada tab Cluster Model > Centroid Table

j. Performa model K-Means dapat dilihat pada tab PerformanceVector > Text View.
k. Ulangi Langkahnya dengan mengganti nilai K = 5
l. Ulangi Langkahnya dengan mengganti nilai K = 7
KESIMPULAN

K-means merupakan salah satu metode clustering non hirarki yang berusaha mempartisi data yang ada ke
dalam bentuk satu atau lebih cluster. Dari hasil Avg. within centroid distance dan Davies Bouldin
berdasarkan nilai uji K= 3 , K= 5, K= 7 bisa dilihat bahwa hasilnya yaitu semakin tinggi nilai K
maka nilai Avg. within centroid distance dan Davies Bouldin semakin kecil.

Anda mungkin juga menyukai