Anda di halaman 1dari 15

CLUSTERING

KELOMPOK 3

Ria Andriani P Isna Chilyati

240103101 240103101 24010310141045

UNSUPERVISED LEARNING
Merupakan pembelajan yang tidak terawasi dimana tidak memerlukan target output. Pada metode ini tidak

dapat ditentukan hasil seperti apa yang diharapkan selama proses pembelajaran, nilai bobot yang disusun dalam proses range tertentu tergantung pada nilai output yang diberikan.
Tujuannya agar kita dapat mengelompokkan unit-unit yang hampir sama dalam satu area tertentu. Pembelajaran ini biasanya sangat cocok untuk klasifikasi pola. Contoh algoritma jaringan saraf tiruan yang menggunakan metode unsupervised ini adalah Competitive Hebbian Kohonen LVQ (Learning Vector Quantization) Neocognitron

JARINGAN KOHONEN

Jaringan syaraf self organizing, yang sering disebut juga topology preserving maps, yang

mengansumsikan sebuah struktur topologi antar unit-unit cluster.


Jaringan syaraf self organizing ini pertama kali diperkenalkan oleh Tuevo Kohonen dari University of

Helsinki pada tahun 1981.


Jaringan kohonen SOM(Self Organizing Map) merupakan salah satu model jaringan syaraf yang

menggunakan metode pembelajaran unsupervised. Terdiri dari 2 lapisan(layer), yaitu lapisan input dan lapisan output. Setiap neuron dalalm lapisan input terhubung dengan setiap neuron pada lapisan output. Setiap neuron dalam lapisan output merepresentasikan kelas dari input yang diberikan.

STRUKTUR TOPOLOGI
Struktur topologi cluster unit pada SOM dapat berupa : 1. Linear array. Pada topologi ini cluster unit tersusun secara linear seperti yang terlihat pada gambar 2. Unit cluster yang menjadi pemenang (ditandai dengan #) mempunyai 2 unit tetangga yang berjarak 2 (R = 2), dan mempunyai 2 unit tetangga yang berjarak 1 (R = 1).
* * * {* (* [#] *) *} * *

Gambar 2. Linear array of cluster units


Keterangan : [ ] : R = 0 ; 2. Rectangular grid. Rectangular grid merupakan topologi dari cluster unit dalam 2 dimensi. Susunan unit - unit tetangga dari unit pemenang membentuk bujur sangkar seperti terlihat pada gambar 3. Keterangan : :R =0 : R=1 : R=2
Gambar 3. Neighbourhood for rectangular grid

(): R=1

{}: R=2

3.

Hexagonal grid. Jika topologi yang digunakan adalah hexagonal grid, maka banyaknya unit tetangga yang berjarak 1 dari unit pemenang adalah 6 (lihat gambar 4). Sedangkan dengan menggunakan topologi rectangular grid jumlah unit tetangga yang berjarak 1 dari unit pemenang adalah 8.
Keterangan : :R =0 : R=1 : R=2 Gambar 4. Neighbourhood for hexagonal grid

PROSES PEMBELAJARAN SOM


Laju pembelajaran menurun secara lambat. Kohonen menunjukkan bahwa fungsi linear cocok digunakan

sebagai fungsi penurunan laju pembelajaran.


Selama proses pembelajaran (clustering) jarak tetangga yang digunakan juga menurun. Nilai bobot wij

ditentukan secara random. X R

Penulisan istilah yang ada pada struktur jaringan kohonen SOM adalah sebagai berikut:

: vektor input pembelajaran. X = (x1, x2,, xj,..,xn) : learning rate : radius neighborhood

X1 : neuron/node input W0j : bias pada neuron output ke-j Yj C : neuron/node output ke-j : konstanta

ALGORITMA

CONTOH

Data yang digunakan adalah penelitian berupa realisasi penerimaan keuangan daerah tingkat II suatu propinsi serta jumlah penduduk pertengahan tahunnya dalam sebuah kabupaten/kota. Atribut-atribut yang digunakan dalam penelitian ini adalah: X1 = Jumlah penduduk Pendapatan Daerah Sendiri(PDS) yang terdiri dari: Pendapatan Asli Daerah(PDA) yang berupa: X2 = Pajak Daerah

X3 = Retribusi Daerah
X4 = Bagian laba usaha daerah X5 = Penerimaan lain-lain

Bagian pendapatan dari pemerintah dan instansi yang lebih tinggi yang berupa: X6 = Bagi hasil pajak X7 = Bagi hasil bukan pajak X8 = Subsidi daerah otonom X9 = Bantuan pembangunan X10= Penerimaan lainnya

Pinjaman pemerintah daerah

X11= Pinjaman Pemerintah Pusat X12= Pinjaman Lembaga Keuangan Dalam Negeri X13= Pinjaman Dari Luar Negeri
Data set yang digunakan sebagai input tersebut dinormalkan dengan nilai rata-rata sebagai acuan yang

analog dengan persamaan:


f(x)-

Berdasarkan data tersebut maka akan terlihat untuk masing-masing atribut memiliki nilai terendah, nilai

tertinggi, dan nilai rata-rata.


Selanjutnya dari nilai rata-rata tersebut maka akan menjadi acuan untuk menentukan input dari data

menuju ke input pada jaringan saraf tiruan kohonen dengan pengkodean 1 dan 0.
Kemudian data-data input tersebut akan diproses oleh JST sehingga menghasilkan output berupa

kelompok daerah tingkat II berdasarkan penerimaan daerah.


Jaringan kohonen SOM ini akan menghubungkan antara neuron input dan neuron output dengan

koneksi bobot, yang mana bobot ini selalu diperbaiki pada proses iterasi pelatihan jaringan. Kemudian aliran informasi system JST ini akan mengelompokan tingkat kesejahteraan daerah tingkat II, diawali dengan dimasukkannya data penerimaan daerah.
Data-data inilah yang akan berfungsi sebagai input awal selain parameter input berupa learning rate(),

dan radius neighborhood(R).

KELEBIHAN SOM

Dengan mempergunakan jaringan syaraf tiruan Kohonen sebagai penganalisis data, kita akan mendapatkan beberapa keuntungan yakni:
a. Penghilangan problema perkiraan jumlah kelompok

Dengan penggunaan algoritma jaringan syaraf tiruan Kohonen, prediksi jumlah kelompok yang biasa dilakukan pada metoda klasifikasi tradisional dapat dihilangkan. Hal ini bisa terjadi karena dalam algoritma jaringan syaraf tiruan Kohonen, tidak dilakukan penentuan jumlah kluster melainkan penentuan ukuran dan dimensi jaringan output. Permasalahan tersebut berbeda dengan penentuan kelompok karena nilai ukuran maupun dimensi output jaringan syaraf merupakan konsep yang berbeda dengan konsep jumlah kelompok dalam metoda konevensional. Penghilangan pemaksaan pengelompokan vektor.

b.

Pengurangan pemaksaan anggota kelompok Sejalan dengan point a, kemungkinan pemaksaan anggota kelompok juga bisa dikurangi. Hal tersebut dapat terjadi, bila nilai vektor masukan bersifat terdistribusi maka pemetaan pada jaringan keluaran juga akan terdistribusi (tidak ada pembatas kluster yang jelas), sehingga pengelompokan vektor masukan yang berbeda tidak akan terjadi. Walaupun demikian, dalam kasus tersebut analisis data tetap dapat dilakukan dengan mempergunakan nilai derajad pemetaan pada jaringan keluar. Akan tetapi di samping keuntungan diatas, penggunaan jaringan syaraf tiruan Kohonen juga mempunyai problema. Problema yang ada biasanya dikaitkan pengaturan parameter jaringan syaraf berakibat pada keakurasian hasil pengelompokan data (Kohonen, 1978). Hasil penelitian terdahulu (Budiyanto, 1997, Rao 1995) dapat dipakai sebagai acuan dalam menentukan awal parameter ukuran rentang tetangga, maupun ukuran jaringan keluaran.

PENGERTIAN SINGKAT

Unsupervised Learning adalah proses suatu system mempelajari unlabeled data berdasarkan fitur-fitur

dari data tersebut.


Tujuannya adalah mengelompok data-data ke dalam suatu grup yang berupa cluster terdiri dari data

yang memiliki kemiripan yang sama untuk satu cluster dan apabila ditemukan perbedaan dapat dikelompokkan ke dalam cluster yang lain atau dapat dianggap sebagai outlier.
Supervised Learning adalah proses suatu system mempelajari labeled data sebagai training set yang

terdiri dari fitur dan label.


Tujuannya adalah untuk mengidentifikasi label input yang baru dengan fitur yang ada pada data baru

tersebut.

PERBEDAAN
Supervised Learning Kumpulan input Unsupervised Learning berusaha membentuk target output yang sudah JST mengorganisasikan dirinya untuk membentuk vektor-vektor input

diketahui sebelumnya Perbedaan antara output yang masih salah dengan output yang diharapkan harus sekecil mungkin Biasanya lebih baik daripada unsupervised Kelemahan: pertumbuhan waktu komputasi eksponensial, data

yang serupa tanpa menggunakan data atau contohcontoh pelatihan, biasanya ke dalam suatu kategori/kelompok2 tertentu

bnyk berarti semakin lambat

Metode klasifikasi dan prediksi dinamakan supervised learning, dengan alasan ada proses supervisi,

yaitu data training disertai dengan label yang menunjukkan kelas observasi, dan data baru diklasifikasikan berdasarkan training set.
Sedangkan clustering dinamakan unsupervised learning, dengan alasan label kelas data training tidak

diketahui, dan diberikan sekelompok pengukuran, observasi, dan lain-lain, dengan tujuan mengetahui keberadaan data dalam kelas atau cluster.

Anda mungkin juga menyukai