Disusun Oleh:
Merlin Keren (1955201050)
Kartini (1955201003)
Sarah Zulvianty (1955201011)
Rahmah Melati (1955201045)
Rizka Yulianti (1955201013)
Zakia Nabila (1955201062)
Bella Rosa (1955201034)
Monica Fitriyani (1955201043)
Puji syukur penulis panjatkan kepada Tuhan Yang Maha Esa, yang telah berkenan memberi
petunjuk dan kekuatan kepada kami sehingga makalah “K-Nearest Neighbor (KNN)” ini dapat
penulis selesaikan dengan tepat waktu.
Makalah ini merupakan salah satu tugas mata kuliah Data Mining Kelas Informatika 7 Pagi
Sekolah Tinggi Teknologi Dumai.
Dalam kesempatan ini penulis menyampaikan rasa terima kasih kepada Ibu Gellysa Urva,
M.Kom selaku Dosen Mata Kuliah Data Mining yang memberikan materi dalam penyusunan
makalah ini dan semua pihak yang telah memberikan bantuan, dorongan, bimbingan dan arahan
kepada penulis.
Penulis menyadari bahwa makalah ini jauh dari kesempurnaan. Oleh karena itu, kritik dan
saran yang sifatnya membangun, kami harapkan untuk perbaikan makalah pada masa yang akan
datang. Semoga makalah ini dapat bermanfaat khususnya bagi penulis dan para pembaca pada
umumnya.
Kelompok III
ii
DAFTAR ISI
3.1 Kesimpulan......................................................................................................................... 18
iii
BAB 1
PENDAHULUAN
1
1.3 Tujuan Penulisan
Adapun tujuan dari makalah ini adalah :
1. Untuk Mengetahui Pengertian dari KNN.
2. Untuk Mengetahui Kelebihan dan Kelekurangan KNN.
3. Untuk Mengetahui Ilustrasi KNN.
4. Untuk Mengetahui Algoritma KNN.
5. Untuk Mengetahui Penyelesaian Soal Pada KNN.
6. Untuk Mengetahui Penggunaan Excel, Aplikasi Weka, dan Aplikasi Rapid Miner KNN.
2
BAB II
PEMBAHASAN
3
7. Parameter yang diperlukan sedikit, yaitu hanya jumlah tetangga yang dipertimbangkan (K),
dan metode perhitungan jaraknya (distance metrik)
8. Hasil pemodelan tidak linear, sehingga cocok untuk klasifikasi data yang batasannya tidak
linear.
Dari gambar dapat dijelaskan bahwa nilai yang dicari (?) jika k=3, tanda ? termasuk
kedalam class B (kelas B memiliki 2 poin dibanding class A yang hanya 1 poin saja),
sedangkan jika k=7, tanda ? termasuk ke dalam class A (kelas A memiliki 4 poin
disbanding class B yang hanya memiliki 3 poin).
4
2.4 Algoritma KNN
1. Tentukan jumlah tetangga (K) yang akan digunakan untuk pertimbangan penentuan
kelas.
2. Hitung jarak dari data baru ke masing-masing data point di dataset.
𝐸𝑢𝑐𝑙𝑖𝑑𝑒𝑎𝑛 = √∑(𝑥𝑖 − 𝑦𝑖 )2
𝑖=1
2. Data Testing
Tinggi Badan Berat Badan Jenis Kelamin
172 58 ?
5
Tinggi Badan Berat Badan Jenis Kelamin Euclidien Distance
4. Hasil
Maka, didapatlah: (K=3) dengan tinggi 172 dan berat 58 adalah Jenis Kelamin laki -
laki dengan 3 prediksi yaitu
1. Laki-laki dengan Ed=5.8
2. Perempuan dengan Ed=10.8
3. Laki-laki dengan Ed=11.2
6
2. Penyelesaian Tanpa Normalisasi
7
4. Penyelesaian Normalisasi MIN-MAX
8
2. Buka aplikasi Weka
3. Klik Applications Explore maka akan keluar halaman seperti gambar di bawah ini
4. Klik open file – Data F – Data Mining-KNN – Contoh KNN dengan format CSV UTF-8
(comma delimited) → sesuai kebutuhan
9
5. Klik classify – ubah folds = 5 – choose – lazy – lBk
6. Selanjutnya klik lBk tersebut lalu ubah knn menjadi 3 → sesuai kebutuhan - ok
10
7. Lalu klik start dan akan tampil hasil sebagai berikut :
8. Dari hasil terlihat bahwa nilai terendah yaitu laki-laki, maka,dapat disimpulkan dari soal
bahwa tinggi badan 172 dan berat badan 58 merupakan orang dengan jenis kelamin laki-
laki.
11
2.9 Penyelesaian Soal Pada Aplikasi Rapid Miner
Berikut contoh penyelesaian soal pada aplikasi Aplikasi Miner :
1. Import data lalu ubah masing nama data
2. Beri nama file data lalu simpan di bagian sample data dan tekan finish
12
3. Jika sudah disimpan,maka tampil data yang sudah di save di ExampleSet
4. Lalu cari data knnrapid miner dan drop ke kotak process,dan cari operator split data lalu
drop ke kotak process, next search operator k-NN and drop at to kotak process
5. Dilanjutkan search operator apply model lalu drop ke kotak process,dan yang terakhir
search operator performance classification lalu drop ke kotak process
13
6. Lalu hubungkan masing masing operator
- Knnrapidminer-split data ( out->exa)
- Split data-k-NN (par->tra)
- k-NN-Aplly model (mod->mod)
- Apply model-Perfprmance(lab->lab)
- Performace (per->res, exa->res)
14
7. Split data klik add entry dan tambah ratio , disini saya menambahkan ratio 0.8;0.2
15
9. Operator performance memakai nilai accuracy
10. lalu klik tombol run, dari kedua hasil prediction jenis kelamin k-NN menggunakan
operator apply model, didapatkanlah hasil K=2 adalah Laki-Laki
16
2.10 Penerapan KNN
Ada beberapa penerapan KNN yaitu sebagai berikut :
17
BAB III
PENUTUP
3.1 Kesimpulan
K-nearest neighbor merupakan sebuah algoritma machine learning pendekatatan
supervised learning sederhana yang dapat digunakan untuk proses klasifikasi maupun
regresi. KNN berjalan dengan menentukan jarak antara data baru terhadap data tersedia,
memilih sejumalah K titik terdekat, lalu mengkelaskan data baru sesuai dengan mayoritas
kelas yang dimiliki oleh titik K.
3.2 Saran
Untuk Lebih mengetahui dan memperdalam tentang Klassifikasi KNN dalam data
mining, diharapkan mencari banyak sumber dan membaca pustaka yang lebih rinci sehingga
tidak terjadi kesalahan dalam memahami algoritmanya. Pesan penulis yaitu banyak-banyak
berlatih agar lebih memahami dalam aplikasi yang dapat membantu pemecahan masalah
terkait soal KNN dalam data mining.
18
DAFTAR PUSTAKA
https://www.trivusi.web.id/2022/06/algoritma-knn.html
https://geospasialis.com/k-nearest-neighbor/
https://www.advernesia.com/blog/data-science/pengertian-dan-cara-kerja-algoritma-k-nearest-
neighbours-knn/
https://ilmudatapy.com/algoritma-k-nearest-neighbor-knn-untuk-klasifikasi/
https://achmadrizal.staff.telkomuniversity.ac.id/k-nearest-neighbor-k-nn/
https://medium.com/bee-solution-partners/cara-kerja-algoritma-k-nearest-neighbor-k-nn-
389297de543e
19
BAHAN SOAL
Pertanyaan :
Dari data training pemberian pinjaman yang telah diberikan diatas, cklasifikasikan apakah
kategori peminjaman customer bernama methew dengan umur 48 dengan pinjman 142000
menggunakan metode KNN.
20