Bab 2

BAB 2.
TINJAUAN PUSTAKA
2.1 Bencana
UU No. 24 tahun 2007 mendefinisikan bencana sebagai peristiwa atau
rangkaian peristiwa yang mengancam dan mengganggu kehidupan dan penghidupan
masyarakat yang disebabkan, baik oleh faktor atau faktor non alam maupun faktor
manusia sehingga mengakibatkan timbulnya korban jiwa manusia, kerusakan
lingkungan, kerusakan harta benda, dan dampak psikologis.
Berdasarkan penyebabnya bencana alam dibedakan menjadi tiga jenis, yaitu :
a. bencana alam geologis
Bencana alam ini disebabkan oleh gaya-gaya yang berasal dari dalam
bumi (gaya endogen). Yang termasuk dalam bencana alam geologis adalah
gempa bumi, letusan gunung berapi, dan tsunami;
b. bencana alam klimatologis
Bencana alam klimatologis merupakan bencana alam yang disebabkan
oleh faktor angin dan hujan. Contoh bencana alam klimatologis adalah banjir,
badai, banjir bandang, angin puting beliung, kekeringan, dan kebakaran alami
hutan (bukan oleh manusia). Gerakan tanah (longsor) termasuk juga bencana
alam, walaupun pemicu utamanya adalah faktor klimatologis (hujan), tetapi
gejala awalnya dimulai dari kondisi geologis (jenis dan karakteristik tanah
serta batuan dan sebagainya);
c. bencana alam ekstra-terestrial
Bencana alam ekstra-terestrial adalah bencana alam yang terjadi di luar
angkasa, contoh: hantaman/impact meteor. Bila hantaman bendabenda langit
mengenai permukaan bumi maka akan menimbulkan bencana alam yang
dahsyat bagi penduduk bumi (Eko, 2012).
5
Banjir adalah tinggi muka air melebihi normal pada sungai dan biasanya
mengalir meluap melebihi tebing sungai dan luapan airnya menggenang pada suatu
daerah genangan (Hadisusanto, 2011). Selain itu, banjir merupakan peristiwa alam
yang dapat menimbulkan kerugian harta benda penduduk serta dapat pula
menimbulkan korban jiwa.
Banjir dapat di klasifikasikan kedalam dua kategori, yaitu banjir yang
disebabkan karena faktor alam dan banjir yang disebabkan faktor manusia (kodoatei
dan sugiyanto, 2002).
Banjir yang disebabkan oleh faktor alam, seperti
1. Curah hujan : curah hujan yang tinggi dapat mengakibatkan banjir disungai
dan bila melebihi tebing sungai maka akan terjadi banjir atau genangan.
2. Pengaruh fisiografi : atau disebut geografi fisik sungai seperti bentuk, dan
kemiringan daerah aliran sungai
3. Erosi dan Sedimen : erosi didaerah pengaliran sungai berpengaruh terhadap
kapasitas penampang sungai. Besarnya sedimentasi akan sangat berpengaruh
terhadap berkurangnya kapasitas saluran.
4. Kapasitas sungai : pengurangan kapasitas aliran banjir pada sungai dapat
disebabkan oleh pengendapatan yang berasal dari erosi DAS dan erosi tanggul
sungai yang berlebihan serta sedimentasi disungai.
5. Kapasitas drainase : kapasits drainase di suatu daerah dapat menyebabkan
banjir.
6. Pengaruh air pasang : air pasang laut dapat memperlambat aliran sungai
kelaut. Pada waktu banjir bersamaan dengan air pasang yang tinggi maka
tinggi genangan menjadi tinggi karena adanya arus balik (back water).
Banjir disebabkan oleh faktor manusia, seperti
1. Perubahan kondisi Derah Aliran Sungai (DAS) : seperti pengundulan hutan,
penggunaan lahan yang kurang tepat, perluasan kota, dan tata letak yang
kurang tepat
2. Wilayah kumuh : perumahan kumuh yang berada di daerah aliran sungai
dapat menghambat aliran.
3. Sampah : sampah dapat menghambat kelancaran air.
4. Drainase lahan : drainase pada daerah bantaran banjir akan mengurangi

kemampuan dalam menampung debit air yang tinggi.
5. Bendungan : bending dan bangunan lain seperti pilar dapat meningkatkan
elevasi muka air karena adanya arus balik.
6. Kerusakan bangunan pengendali banjir : pemeliharan yang kurang memadai
dari bangunan pengendali banjir sehingga menimbulkan kerusakan dan
akhirnya tidak berfungsi dapat meningkatkan kuantitas air.
7. Perencanaan sistem pengendalian yang tidak tepat
2.2. Cluster
Clustering atau analisis cluster adalah proses pengelompokan satu set bendabenda fisik atau abstrak ke dalam kelas objek yang sama (Han and Kamber, 2006).
Baskoro (2010) menyatakan bahwa :
Clustering atau clusterisasi adalah salah satu alat bantu pada data mining yang
bertujuan mengelompokkan obyek-obyek ke dalam cluster-cluster. Cluster adalah
sekelompok atau sekumpulan obyek-obyek data yang similar satu sama lain dalam
cluster yang sama dan dissimilar terhadap obyek-obyek yang berbeda cluster. Obyek
akan dikelompokkan ke dalam satu atau lebih cluster sehingga obyek-obyek yang
berada dalam satu cluster akan mempunyai kesamaan yang tinggi antara satu dengan
lainnya. Obyek-obyek dikelompokkan berdasarkan prinsip memaksimalkan kesamaan
obyek pada cluster yang sama dan memaksimalkan ketidaksamaan pada cluster yang
berbeda. Kesamaan obyek biasanya diperoleh dari nilai-nilai atribut yang
menjelaskan obyek data, sedangkan obyek-obyek data biasanya direpresentasikan
sebagai sebuah titik dalam ruang multidimensi.
2.2.1. Metode clustering

Secara garis besar, terdapat beberapa metode clusterisasi data. Pemilihan
metode clusterisasi bergantung pada tipe data dan tujuan clusterisasi itu sendiri.
Metode-metode beserta algoritma yang termasuk didalamnya meliputi (Baskoro,

2010):
a. Partitioning Method
Membangun berbagai partisi dan kemudian mengevaluasi partisi
tersebut dengan beberapa kriteria, yang termasuk metode ini meliputi
algoritma K-Means, K-Medoid, PROCLUS, CLARA, CLARANS, dan PAM.
b. Hierarchical Methods
Membuat suatu penguraian secara hierarkikal dari himpunan data
dengan menggunakan beberapa kriteria. Metode ini terdiri atas dua macam,
yaitu Agglomerative yang menggunakan strategi bottom-up dan Disisive yang
menggunakan strategi top-down. Metode ini meliputi algoritma BIRCH,
AGNES, DIANA, CURE, dan CHAMELEON.
c. Density-based Methods
Metode ini berdasarkan konektivitas dan fungsi densitas. Metode ini
meliputi algoritma DBSCAN, OPTICS, dan DENCLU.
d. Grid-based Methods
Metode ini berdasarkan suatu struktur granularitas multi-level. Metode
clusterisasi ini meliputi algoritma STING, WaveCluster, dan CLIQUE.
e. Model-based Methods
Suatu model dihipotesakan untuk masing-masing cluster dan ide untuk
mencari best fit dari model tersebut untuk masing-masing yang lain. Metode
clusterisasi ini meliputi pendekatan statitik, yaitu algoritma COBWEB dan
jaringan syaraf tiruan, yaitu SOM.
2.2.2. Dokumen Cluter
Document clustering merupakan suatu teknik untuk mengelompokkan
dokumen-dokumen
berdasarkan
kemiripannya
dengan
tujuan
mendapatkan
sekumpulan dokumen yang tepat (Widyawati, 2010). Dokumen-dokumen tersebut

dikelompokan ke dalam cluster berdasarkan tingkat kemiripannya. Suatu cluster
dapat dikatakan bagus apabila tingkat kemiripan antar anggota cluster sangat tinggi
8
dan tingkat kemiripan antar cluster sangat rendah. Sedangkan kualitas suatu cluster
dapat diukur melalui kemampuannya dalam menemukan pola-pola yang tersembunyi.
2.2.3. Klasifikasi algoritma clustering
Algoritma clustering secara luas diklasifikasikan menjadi dua algoritma,
yaitu hierarchical clustering, dan non-hierarchical clustering (Henjaya, 2010). Han
and Kamber (2006) menyatakan bahwa hierarchical clustering adalah sebuah metode
hierarkis yang menciptakan komposisi hierarkis yang diterapkan pada objek data,
sehingga akan menghasilkan cluster-cluster yang bersarang. Algoritma hierarchical
clustering mengatur seluruh objek dalam sebuah pohon untuk melihat hubungan
antara setiap objek (Henjaya, 2010). Contoh algoritma Hierarchical clustering
adalah HAC (Hierarchical Agglomerative Clustering) (Karhendana, 2008).
Non-hierarchical clustering, pada umumnya disebut algoritma partitional
clustering, memberikan sejumlah n objek dan k yang merupakan jumlah dari cluster
yang terbentuk. Algoritma partitional clustering mengolah objek ke dalam kkelompok berdasarkan kriteria optimasi tertentu, dimana setiap kelompok merupakan
representasi sebuah cluster. Han and Kamber (2006) menyatakan bahwa contoh
algoritma partitional clustering antara lain K-Means.
2.3 Algoritma K-Means
Algoritma k-means merupakan algoritma yang membutuhkan parameter input
sebanyak k dan membagi sekumpulan n objek kedalam k cluster sehingga tingkat
kemiripan antar anggota dalam satu cluster tinggi sedangkan tingkat kemiripan
dengan anggota pada cluster lain sangat rendah. Kemiripan anggota terhadap cluster
diukur dengan kedekatan objek terhadap nilai mean pada cluster atau dapat disebut
sebagai centroid cluster atau pusat massa (Widyawati, 2010).
Agusta (2007) menyatakan bahwa K-Means merupakan salah satu metode
data clustering nonhirarki yang berusaha mempartisi data yang ada ke dalam bentuk
satu atau lebih cluster/kelompok. Metode ini mempartisi data ke dalam
9
cluster/kelompok sehingga data yang memiliki karakteristik sama dikelompokkan ke

dalam satu cluster yang sama.
Rumus pengukuran jarak menurut (santosa,2007):
2
d ( x , y ) =x y =
( xi yi)2
.(1)
i=1
Adapun rumus perhitungan jarak yang lainnya adalah sebagai berikut

2
d ( x , y ) =x y = (xi yi) +(xi yi)

2
(2)
Keterangan :
d = titik dokumen
x = data record
y = data centroid
Jarak yang terpendek antara centroid dengan dokumen menentukan posisi cluster
suatu dokumen. Misalnya dokumen A mempunyai jarak yang paling pendek ke
centroid 1 dibanding ke yang lain, maka dokumen A masuk ke group 1. Hitung
C
kembali posisi centroid baru untuk tiap-tiap centroid ( i , j ) dengan mengambil rataG
rata dokumen yang masuk pada cluster awal ( i , j ) . Iterasi dilakukan terus hingga
posisi group tidak berubah. Berikut rumus dari penentuan centroid.
C ( i )=
d x
|Gi| x C
(3)
Adapun rumus iterasi lainnya didefinisikan sebagai berikut :

C ( i )=
x1 + x 2 +x ..+ x ..
(4)
Keterangan :
10
x1
= nilai data record ke-1
x2
= nilai data record ke-2
= jumlah data record
K-Means merupakan algoritma clustering yang bersifat partitional yaitu membagi

himpunan objek data ke dalam sub himpunan (cluster) yang tidak overlap, sehingga
setiap objek data berada tepat dalam satu cluster. Strategi partitional-clustering yang
paling sering digunakan adalah berdasarkan kriteria square error. Secara umum,
tujuan kriteria square error adalah untuk memperoleh partisi (jumlah cluster tetap)
yang meminimalkan total square error. SSE (Sum Squared of Error) menyatakan total
xi
kesalahan kuadarat yang terjadi bila n data

cluster dengan pusat tiap cluster adalah
m1
,...,
,...,
xn
mk
dikelompokkan kedalam k
. Nilai SSE tergantung pada
jumlah cluster dan bagaimana data dikelompokkan ke dalam cluster-cluster tersebut.

Semakin kecil nilai SSE, semakin bagus hasil clustering-nya.
Adapun rumus SSE adalah sebagai berikut :
SSE=(Ci )2+(C i)2 +(C ..)2 +(C ..)2
...(5)
Keterangan :
Ci
= nilai centroid
2.4 Tahapan algoritma K-Means

Widyawati (2010), menyatakan :
Proses algoritma K-Means sebagai berikut :
a. Pilih secara acak objek sebanyak k, objek-objek tersebut akan
direpresentasikan sebagai mean pada cluster.
11
b. Untuk setiap objek dimasukan kedalam cluster yang tingkat kemiripan

objek terhadap cluster tersebut tinggi. Tingkat kemiripan ditentukan
dengan jarak objek terhadap mean atau centroid cluster tersebut.
c. Hitung nilai centroid yang baru pada masing-masing cluster.
d. Proses tersebut diulang hingga anggota pada kumpulan cluster tersebut
tidak berubah
Sedangkan menurut Adiningsih (2007) tahap penyelesaian algoritma K-Means
adalah sebagai berikut :
a. Menentukan K buah titik yang merepresentasikan obyek pada setiap
cluster (centroid awal).
b. Menetapkan setiap obyek pada cluster dengan posisi centroid terdekat.
c. Jika semua obyek sudah dikelompokkan maka dilakukan perhitungan
ulang dalam menentukan centroid yang baru.
d. Ulangi semua langkah ke-2 dan ke-3 sampai centroid tidak berubah.
Kurniawan dkk (2010) menyatakan :
Langkah-langkah dari algoritma K-Means yaitu :
Start
Jumlah Cluster K
Titik Pusat Cluster
Objek yang harus

dipindah
Jarak Objek
dengan Titik Pusat
12
+
Mengelompokkan data
berdasarkan jarak
End
minimum.
Gambar 2.3 Cara Kerja Algoritma K-Means (Kurniawan dkk 2010)

Berikut penjelasan dari gambar 2.3, dengan algoritma K-means dilakukan cara
berikut hingga ditemukan hasil iterasi yang stabil :
a. Menentukan data centroid, pada sistem ini, ditentukan bahwa centroid
pertama adalah n data pertama dari data-data yang akan di-cluster.
b. Menghitung jarak antara centroid dengan masing-masing data.
c. Mengelompokkan data berdasarkan jarak minimum.
d. Jika penempatan data sudah sama dengan sebelumnya, maka stop. Jika tidak,
kembali ke cara yang ke-2.
13

Bab 2

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab 2

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB 2.

4. Drainase lahan : drainase pada daerah bantaran banjir akan mengurangi

2.2.1. Metode clustering

Metode-metode beserta algoritma yang termasuk didalamnya meliputi (Baskoro,

sekumpulan dokumen yang tepat (Widyawati, 2010). Dokumen-dokumen tersebut

cluster/kelompok sehingga data yang memiliki karakteristik sama dikelompokkan ke

Adapun rumus perhitungan jarak yang lainnya adalah sebagai berikut

d ( x , y ) =x y = (xi yi) +(xi yi)

Adapun rumus iterasi lainnya didefinisikan sebagai berikut :

= nilai data record ke-1

= nilai data record ke-2

= jumlah data record

K-Means merupakan algoritma clustering yang bersifat partitional yaitu membagi

kesalahan kuadarat yang terjadi bila n data

jumlah cluster dan bagaimana data dikelompokkan ke dalam cluster-cluster tersebut.

2.4 Tahapan algoritma K-Means

b. Untuk setiap objek dimasukan kedalam cluster yang tingkat kemiripan

Titik Pusat Cluster

Objek yang harus

Gambar 2.3 Cara Kerja Algoritma K-Means (Kurniawan dkk 2010)

Anda mungkin juga menyukai