Menggunakan Algoritma
Clustering K-Means
Nama : Farisa Arriyani
NPM : 10104657
Pembimbing : Ibu Sulistyo Puspitodjati,
SSi., Skom., MSc.
Latar Belakang Masalah
Perkembangan pembangunan di negara Indonesia yang
meningkat dari tahun ke tahun
banyaknya proyek-proyek pembangunan jalan raya di berbagai
tempat
diperlukan pengetahuan mengenai struktur dan jenis tanah dari
wilayah yang akan dibangun.
Banyak faktor yang mempengaruhi pemilihan jenis penelitian
tanah yang diharapkan bisa memberikan data yang cukup akurat
Pengelompokkan data tanah dengan alat sondir sulit mengenali
beberapa objek tanah yang berbeda-beda tapi mempunyai sifat
serupa
terdapat objek-objek yang masuk ke dalam kelompok yang tidak
sesuai.
dibutuhkan pengetahuan mengenai jumlah kelompok yang benar
agar objek-objek tanah tersebut dapat dikelompokkan sesuai
dengan karakteristik yang dimilikinya
Pembatasan Masalah
penelitian suatu data tanah dengan
menggunakan Pengklasteran k-Means dan
pendekatan bootstrapped method
Proses pengklasteran menggunakan
perangkat lunak Weka 3.5.7.
Data yang digunakan adalah data proyek
Ruas Jalan Pontianak-Tayan.
Jumlah klaster (k) yang dipakai dimulai dari 6,
7, 8, 9, dan 10 dan jumlah seed dimulai dari 1,
10, 20, dan 30.
Tujuan Penelitian
mengelompokkan dan menemukan jumlah
klaster(kelas) yang paling tepat/ akurat terhadap
data tanah
menganalisa hasilnya untuk menentukan
parameter-parameter batasan(berdasarkan
karakteristik) pada masing-masing klaster untuk
mengklasifikasian tanah secara umum
Diharapkan penelitian ini dapat digunakan
sebagai landasan untuk tahapan pelabelan, atau
pengklasifikasian secara rinci pada
pengembangan selanjutnya
Penulisan
Bab I : Pendahuluan
Bab II : Landasan Teori
Bab III : Metode Penelitian
Bab IV : Hasil Penelitian
Bab V : Penutup
Tanah
material yang terdiri dari :
- butiran mineral padat yang tidak tersementasi (terikat secara kimia)
satu sama lain
- bahan-bahan organik yang telah melapuk (yang berpartikel padat)
disertai zat cair & gas yang mengisi ruang-ruang kosong di antara
partikel- partikel padat tersebut
untuk mendiskripsikan tanah dibutuhkan pengetahuan tentang :
- sifat-sifat asli tanah - warna
- formasi batuannya - tekstur
- ukuran butirnya - konsistensi
Secara garis besar, tanah dibagi menjadi 3 bagian :
1. Tanah berbutir kasar: kerikil (gravel), pasir (sand)
2. Tanah berbutir halus: lanau( slit/sloam ), lempung ( clay ), lempung berat (
heavy clay )
3. tanah yang bersifat organik. Contoh: tanah gambut (peat soil)
Atribut Tanah : - kedalaman (depth(d) dalam satuan meter (m)
- tekanan konus (qc) dalam satuan (kg/cm2)
- jumlah hambatan (JH) dalam satuan (kg/cm2)
- Perlawanan gesek dalam satuan (kg/cm2)
Pengklasteran (Clustering)
pengelompokkan sejumlah data atau objek ke dalam klaster
(group) sehingga dalam setiap klaster akan berisi data yang
semirip mungkin
Termasuk unsupervised learning
Data pada teknik pengklasteran tidak diketahui keluarannya
(outputnya atau labelnya)
digunakan fungsi kriteria: jumlah dari kesalahan kuadrat (sum of
squared-error, SSE) yang dapat mengukur kualitas klastering
yang dibuat k 2
SSE d p, mi
i 1 pCi
Tugaskan lagi setiap objek dengan memakai pusat klaster yang baru.
Jika pusat klaster sudah tidak berubah lagi, maka proses
pengklasteran selesai. Atau, kembali lagi ke langkah nomor 3 sampai
pusat klaster tidak berubah lagi/ stabil atau tidak ada penurunan yang
signifikan dari nilai SSE (Sum of Squared Errors)
Contoh Algoritma k-Means
Tabel 1 Data point 1. Tentukan jumlah klaster k=2
Instances X Y 2. Tentukan centroid awal secara
A 1 3 acak misal dari data disamping
B 3 3 m1 =(1,1), m2=(2,1)
C 4 3 3. Tempatkan tiap objek ke
klaster terdekat berdasarkan
D 5 3
nilai centroid yang paling dekat
E 1 2 selisihnya(jaraknya). Pada
F 4 2 tabel 2.Didapatkan hasil:
G 1 1 anggota cluster1 = {A,E,G},
cluster2={B,C,D,F,H}. Nilai
H 2 1
SSE yaitu :
k 2
SSE d p, mi
i 1 pCi
Gambar Parameter-parameter
pada SimpleKMeans
29,1556 12,2 22,3333 4,7375 19,2 15,9 3,7053 24,8 26,1294 7,25332
37,4444 2,7619 5,6667 26,4375 3,7647 3,8125 12,7368 7,375 11,2353 56,13332
43,7778 4,1905 8,8333 40,6875 5,5882 5,5 18,9474 11,875 17,1765 64,73332
6,3333 1,4286 3,1667 14,25 1,8235 1,6875 6,2105 4,5 5,9412 8,62
107,10322 92,47932 133,7542 41,2752
11471,095 8552,421 17890,105 1703,601
39617,222
199,041
Analisis Pendekatan Kedua
(Lanjutan)