Anda di halaman 1dari 14

Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201

SPASIAL CLASIFICATION MINING UNTUK MENENTUKAN


PRAKIRAAN CURAH HUJAN BERDASARKAN KARAKTERISTIK
WILAYAH

Eva Khudzaeva

Program Studi Sistem Informasi, Fakultas Sains dan Teknologi, Universitas Islam Negeri Jakarta
UIN Jakarta. Jl. Ir. H. Juanda No.95, Ciputat Jakarta
e-mail : eva.khudzaeva@uinjkt.ac.id

ABSTRACT
Information about the condition of rainfall is one of the essential elements and a big influence on all kinds of
livelihood activities, Banten province is a region that is characteristic of the region vary, so study the spatial
patterns of the relationship between rainfall data with the characteristics of the region, will obtain the factors that
influence precipitation and can determine the bulk rainfall prediction based on its characteristics in Banten
Province. Data mining provides the desired search patterns in large databases to assist in decision making at a time
when it comes to looking for patterns of relatedness in the used mining methods using decision tree classification,
where the rainfall data will be classified with regional characteristics, so as to generate a forecast of rainfall.

Keywords: Forecast rainfall, regional characteristics, classification mining, decision tree

ABSTRAK
Informasi mengenai kondisi curah hujan adalah salah satu unsur penting dan besar pengaruhnya terhadap
segala macam aktifitas kehidupan, Provinsi Banten merupakan wilayah yang karakteritik wilayahnya berbeda-beda,
sehingga mempelajari pola spasial keterkaitan antara data curah hujan dengan karakteristik wilayah, akan
memperoleh faktor-faktor yang mempengaruhi curah hujan dan dapat menentukan prakiran curah hujn berdasarkan
karakteristik wilayah di Provinsi Banten. Data mining berisi pencarian pola yang diinginkan dalam database besar
untuk membantu dalam pengambilan keputusan diwaktu yang akan datang untuk mencari pola keterkaitan tersebut
digunakan metode classification mining menggunakan decision tree, dimana data curah hujan akan diklasifikasikan
dengan karakteristik wilyah, sehingga menghasilkan prakiraan curah hujan.

Kata Kunci : Prakiraan curah hujan, karakteristik wilyah, classification mining, decision tree

I. Pendahuluan populer karena mudah untuk diinterpretasi oleh


manusia. Dengan kemampuannya untuk mem-break
Informasi mengenai kondisi curah hujan down proses pengambilan keputusan yang kompleks
adalah salah satu unsur penting dan besar menjadi lebih simple. Pohon keputusan juga dapat
pengaruhnya terhadap segala macam aktifitas menemukan hubungan tersembunyi antara sejumlah
kehidupan, contohnya pada bidang pertanian, curah calon variabel input dengan sebuah variabel target.
hujan berpengaruh terhadap pola produktivitas Selain itu pohon keputusan dapat memadukan antara
tanaman yang tergantung terhadap informasi curah eksplorasi data dan pemodelan, sehingga sangat baik
hujan, begitu juga pengaruh curah hujan terhadap sebagai langkah awal dalam proses pemodelan.
bidang lainnya seperti, perikanan, perindustrian, Dengan menggunakan metode pohon keputusan
penerbangan, pelayanan publik, transportasi dan dapat menghindari munculnya permasalahan dengan
sebagainya. menggunakan kriteria yang jumlahnya lebih sedikit
Pohon Keputusan merupakan representasi pada setiap node internal tanpa banyak mengurangi
sederhana dari teknik klasifikasi yang merupakan kualitas keputusan yang dihasilkan. Dan kekurangan
proses pembelajaran suatu fungsi tujuan yang dari pohon keputusan diantaranya adalah terjadi
memetakan tiap himpunan atribut ke satu dari kelas overlap terutama ketika kelas-kelas dan kriteria yang
yang didefenisikan sebelumnya Pohon keputusan digunakan jumlahnya sangat banyak dan kualitas
merupakan salah satu metode klasifikasi yang paling

189
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva

hasil keputusan yang didapatkan sangat tergantung dengan masukkan data lain yang mendukung
pada bagaimana pohon tersebut didesain. analisis data.
Provinsi banten merupakan provinsi yang
berdampingan dengan Ibukota Negara, Banten resmi Menentukan Node
menjadi sebuah provinsi ke-30 di Negara Kesatuan Dalam data sampel tentukan dulu node terpilih, yaitu
Republik Indonesia (NKRI) sejak tahun 2000, dengan menghitung nilai informasi gain masing-
dibentuk melalui Undang-undang nomor 23 tahun masing atribut untuk menentukan node terpilih,
2000. Provinsi Banten berada diantara 5 07’50” – mengunakan nilai informasi gain yang paling besar,
701’11” lintang selatan dn 10501’11” – 10607’12” nilai gain diperoleh dari nilai entropy dari masing-
bujur timur yang terbagi dalam 8 daerah kota dan masing variabel, menggunakan rumus dibawah ini:
Kabupaten. Provinsi Banten bila dikaitkan dengan
posisi geografis dan kondisi toponomi pemerintahan,
maka Provinsi Banten merupakan wilayah yang
memiliki banyak kegiatan perindustrian dan ……………….............................(1)
pertanian, di wilayah Banten sendiri memiliki Dengan :
karekteristik wilayah yang berbeda dan juga curah S : Himpunan Kasus
hujan yang berbeda-beda. A : Fitur
Berdasarkan uraian diatas maka penelitian ini n : Jumlah partisi S
akan meneliti pola keterkaitan antara data curah pi : Proporsi dari Si terhadap S
hujan dengan karakteristik wilayah, sehingga faktor-
faktor yang mempengaruhi curah hujan ini akan
digunakan menentukan prakiraan curah hujan di
wilayah Banten. Proses untuk menentukan pola
keterkitan curah hujan dan karakteristik wilayah,
diolah menggunakan data mining curah hujan dan (2)
data spasial karakteristik wilayah, menggunakan S : Himpunan kasus
metode klasifikasi decision tree. A : Atribut
n : Jumlah partisi atribut A
2. Metodelogi Penelitian |Si| : Jumlah kasus pada partisi ke i
A. Bahan |S| : Jumlah kasus dalam S
1. Peta vektor Provinsi Banten dalam format
shapefile dengan ekstensi *shp II. HASIL
menggunakansistem proyeksi geografiyang A. Analisa Data Mining
dinyatakan dalam besaran sudut (derajat) lintang
dan bujur dan proyeksi Universal Transverse Data pada table 3.1 sangat banyak dan tidak
Mercator(UTM). lengkap dan inkonsisten umumnya terjadi pada
2. Peta vektor topogrfi di Provinsi Banten dalam setiap database. Data yang tidak lengkap disebabkan
format shapefile dengan ekstensi *shp karena adanya data yang kosong atau atribut yang
menggunakan sistem proyeksi geogarfi dalam salah, sehingga proses data preprocessing perlu
besaran sudut lintang dan bujur juga UTM. dilakukan sehingga database sesuai dengan
3. Data non spasial berupa data atribut curah hujan ketentuan yang diperlukan. berikut sebaran stasiun
yang telah tersedia dan diproses, ditambahkan curah hujan dan ketinggian wilayah provinsi banten.

190
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201

Gambar 1 Peta Provinsi Banten

Peta 2. Peta Kontur

191
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva

Data preprocessing merupakan hal yang proses data mining, karena akan lebih efisien
penting dalam proses data mining, hal yang termasuk terhadap data yang lebih kecil. Masalah klasifikasi
antara lain : berakhir dengan dihasilkan sebuah pengetahuan.
Masalah klasifikasi berakhir dengan
B. Data Selection dihasilkan sebuah pengetahuan yang dipresentasikan
dalam bentuk diagram pohon keputusan (decision
Data Curah Hujan dan Topografi tersebut tree) untuk menentukan, kriteria yang diperhatikan
nantinya akan menjadi kasus dalam proses adalah data curah hujan, data ketinggian, dan data
operasional data mining. Dari data yang ada, kolom lereng.
yang diambil sebagai atribut/variable keputusan
adalah survive. sedangkan kolom yang diambil D. Mengubah Data Menjadi Tree
variabel penentuan dalam pembentukan pohon
keputusan adalah: Dalam mengubah data menjadi tree terlebih
1. Koordinat x,y/nama stasiun dahulu data dinyatakan dalam bentuk tabel dengan
2. Kategori Curah hujan bulanan atribut dan record. Atribut menyatakan suatu
ditentukan dari BMKG, curah hujan bulanan parameter yang dibuat sebagai kriteria dalam
dikategorikan menjadi 4 kategori, antara lain kategori pembentukan tree.
curah hujan ringan (0 – 100 mm), kategori curah
hujan sedang (101 – 300 mm), kategori curah hujan E. Menentukan Node
tinggi (301 – 400 mm), dan kategori curah hujan
sangat tinggi (diatas 401mm) Dalam data sampel tentukan dulu node
3. Topografi ketinggian wilayah Banten ditentukan terpilih, yaitu dengan menghitung nilai informasi
dari ketinggian karakteristik wilayah yang ada gain masing-masing atribut untuk menentukan node
di provinsi Banten terpilih, gunakan nilai informasi gain yang paling
4. Topografi kelerengan wilayah Banten besar, nilai gain diperoleh dari nilai entropy dari
ditentukan dari kelerengan wilayah yang ada di masing-masing variabel, menggunakan rumus
Provinsi banten dibawah ini:
a. Menghitung jumlah kasus pada ketinggian yang
C. Data Preprocessing/Data Cleaning dijadikan sebagai acuan, jumlah kasus untuk
keputusan >=501, 301-500, 201-300, dan 0-200,
Data cleaning diterapkan untuk menambah isi dan Entropy dari semua kasus dan kasus yang
atribut yang hilang atau kosong, dan merubah data dibagi berdasarkan atribut lereng dan curah
yang tidak konsisten hujan bulan Januari. Setelah itu lakukan
1. Data Transformasi penghitungan Gain untuk masing-masing
Dalam proses ini, data ditranspormasikan ke dalam atribut.
entuk yang sesuai untuk proses data mining.
2. Data Reduction nilai total entropy adalah 1.917455,
Reduksi data dilakukan dengan sedangkan nilai Gain pada atribut lereng dan
menghilangkan atribut yang tidak diperlukan curah hujan januari diperoleh dari rumus gain,
sehingga ukuran dari database menjadi kecil dan nilai Gain lereng sebesar (0.92148) dan nilai
hanya menyertakan atribut yang diperlukan dalam Gain curah hujan adalah (1.076045). jadi nilai
proses data mining, karena akan lebih efisien gain tertinggi terdapat pada atribut hujan.
terhadap data yang lebih kecil. dengan demikian lereng dapat menjadi node
Masalah klasifikasi berakhir dengan akar. ada 4 nilai atribut dari CH jan yaitu sangat
dihasilkan sebuah pengetahuan yang dipresentasikan tinggi, tinggi, sedang dan ringan. Dari keempat
dalam bentuk diagram yang biasa disebut pohon nilai atribut tersebut atribut sedang masih perlu
keputusan (decision tree) untuk menentukan pola diperhitungkan lagi.
curah hujan terhadap karakteristik fisik, kriteria yang
diperhatikan adalah banyakny curah hujan yang
terjadi disuatu wilayah dilihat berdasarkan
karakteristik fisik wilayah dilihat dari topografi
ketinggian dan kelerengan.
Reduksi data dilakukan dengan
menghilangkan atribut yang tidak diperlukan
sehingga ukuran dari database menjadi kecil dan
hanya menyertakan atribut yang diperlukan dalam
192
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201

1
nilai total entropy adalah 1.917455,
CH sedangkan nilai Gain pada atribut lereng dan
Jan
curah hujan Maret diperoleh dari rumus gain,
Sangat tinggi
Ringan nilai Gain lereng sebesar (0.92148) dan nilai
Tinggi sedan
g Gain curah hujan adalah (0.71039). jadi nilai
1.1
>=501 301-
lereng
0-200 gain tertinggi terdapat pada atribut curah hujan.
500
dengan demikian curah hujan dapat menjadi
node akar. ada 4 nilai atribut dari CH jan yaitu
0-2% 15-40% sangat tinggi, tinggi, sedang dan ringan. Dari
2-15%
keempat nilai atribut tersebut atribut sedang
>=501 301- 201- masih perlu diperhitungkan lagi.
500 300

1
CH
b. Menghitung jumlah kasus pada ketinggian yang Jan
dijadikan sebagai acuan, jumlah kasus untuk Sangat tinggi
Ringan
keputusan >=501, 301-500, 201-300, dan 0-200, Tinggi sedan
g
dan Entropy dari semua kasus dan kasus yang 1.1
>=501 301- 0-200
dibagi berdasarkan atribut lereng dan curah 500 lereng
hujan bulan Januari. Setelah itu lakukan
penghitungan Gain untuk masing-masing
0-2% 15-40%
atribut. 2-15%

nilai total entropy adalah 1.917455, >=501 301- 201-


sedangkan nilai Gain pada atribut lereng dan 500 300

curah hujan febuaari diperoleh dari rumus gain,


nilai Gain lereng sebesar (0.92148) dan nilai
Gain curah hujan adalah (1.917455). jadi nilai
gain tertinggi terdapat pada atribut curah hujan. d. Menghitung jumlah kasus pada ketinggian yang
dengan demikian curah hujan dapat menjadi dijadikan sebagai acuan, jumlah kasus untuk
node akar. ada 4 nilai atribut dari CH jan yaitu keputusan >=501, 301-500, 201-300, dan 0-200,
sangat tinggi, tinggi, sedang dan ringan. Dari dan Entropy dari semua kasus dan kasus yang
keempat nilai atribut tersebut atribut sedang dibagi berdasarkan atribut lereng dan curah
masih perlu diperhitungkan lagi. hujan bulan april. Setelah itu lakukan
penghitungan Gain untuk masing-masing
atribut.
1
CH nilai total entropy adalah 1.917455,
Jan
Sangat sedangkan nilai Gain pada atribut lereng dan
tinggi Ringan
Tinggi sedan curah hujan April diperoleh dari rumus gain,
g 1.1 nilai Gain lereng sebesar (0.92148) dan nilai
>=501 301- 0-200
500
lereng Gain curah hujan adalah (0.39132). jadi nilai
gain tertinggi terdapat pada atribut curah hujan.
dengan demikian curah hujan dapat menjadi
0-2% 15-
2-15% 40% node akar. ada 4 nilai atribut dari CH jan yaitu
sangat tinggi, tinggi, sedang dan ringan. Dari
>=501 301- 201- keempat nilai atribut tersebut atribut sedang
500 300 masih perlu diperhitungkan lagi.

c. Menghitung jumlah kasus pada ketinggian yang


dijadikan sebagai acuan, jumlah kasus untuk
keputusan >=501, 301-500, 201-300, dan 0-200,
dan Entropy dari semua kasus dan kasus yang
dibagi berdasarkan atribut lereng dan curah
hujan bulan Maret. Setelah itu lakukan
penghitungan Gain untuk masing-masing
atribut.
193
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva

dibagi berdasarkan atribut lereng dan curah


hujan bulan Juni. Setelah itu lakukan
1 penghitungan Gain untuk masing-masing
Ler
eng
atribut.
0-2%
Ring
2- 15- an Nilai total entropy adalah 1.917455,
>=5
15
301
%
40
% 1.1 0-
sedangkan nilai Gain pada atribut lereng dan
01 - CH 200 curah hujan juni diperoleh dari rumus gain, nilai
500
Gain lereng sebesar (0.92148) dan nilai Gain
S. ring curah hujan adalah (0.0321). jadi nilai gain
Ting Ting an
g gi Sed tertinggi terdapat pada atribut curah hujan.
ang dengan demikian curah hujan dapat menjadi
>=5 301 201 0-
01 - - 20 node akar. ada 4 nilai atribut dari CH jan yaitu
500 300 0
sangat tinggi, tinggi, sedang dan ringan. Dari
e. Menghitung jumlah kasus pada ketinggian yang keempat nilai atribut tersebut atribut sedang
dijadikan sebagai acuan, jumlah kasus untuk masih perlu diperhitungkan lagi.
keputusan >=501, 301-500, 201-300, dan 0-200,
1
dan Entropy dari semua kasus dan kasus yang Lere
dibagi berdasarkan atribut lereng dan curah ng
hujan bulan Januari. Setelah itu lakukan 0-2%
Ring
penghitungan Gain untuk masing-masing 2- 15- an
atribut. 15% 40%
>=50 301- 1.1 0-
CH
nilai total entropy adalah 1.917455, 1 500 200
sedangkan nilai Gain pada atribut lereng dan
curah hujan Mei diperoleh dari rumus gain, nilai S. ringa
Gain lereng sebesar (0.92148) dan nilai Gain Ting Ting n
curah hujan adalah (0.574757). jadi nilai gain g gi Seda
ng
tertinggi terdapat pada atribut curah hujan. >=50 301- 201- 0-
dengan demikian curah hujan dapat menjadi 1 500 300 200
node akar. ada 4 nilai atribut dari CH jan yaitu
sangat tinggi, tinggi, sedang dan ringan. Dari
keempat nilai atribut tersebut atribut sedang
masih perlu diperhitungkan lagi. g. Menghitung jumlah kasus pada ketinggian yang
dijadikan sebagai acuan, jumlah kasus untuk
1
Leren keputusan >=501, 301-500, 201-300, dan 0-200,
g dan Entropy dari semua kasus dan kasus yang
0-2% dibagi berdasarkan atribut lereng dan curah
Ringan
hujan bulan Juli. Setelah itu lakukan
2-15% 15-
40% penghitungan Gain untuk masing-masing
>=501 301- 1.1 0-200 atribut.
500 CH

Nilai total entropy adalah 1.917455,


sedangkan nilai Gain pada atribut lereng dan
S. ringan curah hujan Juli diperoleh dari rumus gain, nilai
Tingg Tinggi
Sedan
Gain lereng sebesar (0.92148) dan nilai Gain
g curah hujan adalah (0.60684). jadi nilai gain
>=501 301- 201- 0-200 tertinggi terdapat pada atribut curah hujan.
500 300
dengan demikian curah hujan dapat menjadi
node akar. ada 4 nilai atribut dari CH jan yaitu
sangat tinggi, tinggi, sedang dan ringan. Dari
keempat nilai atribut tersebut atribut sedang
f. Menghitung jumlah kasus pada ketinggian yang masih perlu diperhitungkan lagi.
dijadikan sebagai acuan, jumlah kasus untuk
keputusan >=501, 301-500, 201-300, dan 0-200,
dan Entropy dari semua kasus dan kasus yang

194
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201

i. Menghitung jumlah kasus pada ketinggian yang


dijadikan sebagai acuan, jumlah kasus untuk
1
Leren keputusan >=501, 301-500, 201-300, dan 0-200,
g
dan Entropy dari semua kasus dan kasus yang
0-2%
Ringan dibagi berdasarkan atribut lereng dan curah
2-15% 15- hujan bulan Januari. Setelah itu lakukan
40%
>=501 301- 1.1 0-200
penghitungan Gain untuk masing-masing
500 CH atribut.

Nilai total entropy adalah 1.917455,


S.
Tingg
ringan sedangkan nilai Gain pada atribut lereng dan
Tinggi
Sedan curah hujan September diperoleh dari rumus
g
>=501 301- 201- 0-200
gain, nilai Gain lereng sebesar (0.92148) dan
500 300 nilai Gain curah hujan adalah (0.03233). jadi
nilai gain tertinggi terdapat pada atribut curah
hujan. dengan demikian curah hujan dapat
menjadi node akar. ada 4 nilai atribut dari CH
h. Menghitung jumlah kasus pada ketinggian yang jan yaitu sangat tinggi, tinggi, sedang dan
dijadikan sebagai acuan, jumlah kasus untuk ringan. Dari keempat nilai atribut tersebut
keputusan >=501, 301-500, 201-300, dan 0-200, atribut sedang masih perlu diperhitungkan lagi.
dan Entropy dari semua kasus dan kasus yang
1
dibagi berdasarkan atribut lereng dan curah Leren
g
hujan bulan Januari. Setelah itu lakukan
penghitungan Gain untuk masing-masing 0-2%
Ringa
atribut. 2- 15- n
15% 40%

Nilai total entropy adalah 1.917455, >=50 301- 1.1


CH
0-200
1 500
sedangkan nilai Gain pada atribut lereng dan
curah hujan agustus diperoleh dari rumus gain,
nilai Gain lereng sebesar (0.92148) dan nilai
S. ringan
Gain curah hujan adalah (0.012058). jadi nilai Tingg Tinggi
gain tertinggi terdapat pada atribut leereng. Seda
ng
dengan demikian lereng dapat menjadi node >=50 301- 201- 0-
akar. ada 3 nilai atribut dari lereng yaitu 0-2%, 1 500 300 200

2-15% dn 15-40%. Dari ketiga nilai atribut


tersebut atribut sedang masih perlu
diperhitungkan lagi.
1
j. Menghitung jumlah kasus pada ketinggian yang
Leren dijadikan sebagai acuan, jumlah kasus untuk
g
keputusan >=501, 301-500, 201-300, dan 0-200,
0-2% dan Entropy dari semua kasus dan kasus yang
Ringan
2-15% 15-
dibagi berdasarkan atribut lereng dan curah
40% hujan bulan Oktober. Setelah itu lakukan
>=501 301- 1.1 0-200 penghitungan Gain untuk masing-masing
500 CH
atribut.

Nilai total entropy adalah 1.917455,


S. ringan sedangkan nilai Gain pada atribut lereng dan
Tingg Tinggi
Sedan
curah hujan oktober diperoleh dari rumus gain,
g nilai Gain lereng sebesar (0.92148) dan nilai
>=501 301- 201- 0- Gain curah hujan adalah (0.79309). jadi nilai
500 300 200
gain tertinggi terdapat pada atribut curah hujan.
dengan demikian curah hujan dapat menjadi
node akar. ada 4 nilai atribut dari CH jan yaitu
sangat tinggi, tinggi, sedang dan ringan. Dari

195
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva

keempat nilai atribut tersebut atribut sedang


masih perlu diperhitungkan lagi. 1
Lere
ng
0-2%
Ring
2- 15- an
15% 40
>=5 301- % 1.1 0-
01 500 CH 200

1 S. ringa
Lere Ting Ting n
ng g gi Seda
0-2% ng
Ring >=5 301- 201- 0-
2- 15- an 01 500 300 200
15% 40
>=5 301- 1.1 0-
%
CH
01 500 200

l. Menghitung jumlah kasus pada ketinggian yang


S. ringa dijadikan sebagai acuan, jumlah kasus untuk
Ting Ting n keputusan >=501, 301-500, 201-300, dan 0-200,
g gi Sed
ang dan Entropy dari semua kasus dan kasus yang
>=5 301- 201- 0- dibagi berdasarkan atribut lereng dan curah
01 500 300 200 hujan bulan Desember. Setelah itu lakukan
penghitungan Gain untuk masing-masing
atribut.

k. Menghitung jumlah kasus pada ketinggian yang Nilai total entropy adalah 1.917455,
dijadikan sebagai acuan, jumlah kasus untuk sedangkan nilai Gain pada atribut lereng dan
keputusan >=501, 301-500, 201-300, dan 0-200, curah hujan Desember diperoleh dari rumus
dan Entropy dari semua kasus dan kasus yang gain, nilai Gain lereng sebesar (0.92148) dan
dibagi berdasarkan atribut lereng dan curah nilai Gain curah hujan adalah (0.90296). jadi
hujan bulan Nopember. Setelah itu lakukan nilai gain tertinggi terdapat pada atribut curah
penghitungan Gain untuk masing-masing hujan. dengan demikian curah hujan dapat
atribut. menjadi node akar. ada 4 nilai atribut dari CH
jan yaitu sangat tinggi, tinggi, sedang dan
Nilai total entropy adalah 1.917455, ringan. Dari keempat nilai atribut tersebut
sedangkan nilai Gain pada atribut lereng dan atribut sedang masih perlu diperhitungkan lagi.
curah hujan Nopember diperoleh dari rumus
gain, nilai Gain lereng sebesar (0.92148) dan
1
nilai Gain curah hujan adalah (0.87468). jadi Leren
nilai gain tertinggi terdapat pada atribut curah g

hujan. dengan demikian curah hujan dapat 0-2%


Ringan
menjadi node akar. ada 4 nilai atribut dari CH 2-15% 15-
40%
jan yaitu sangat tinggi, tinggi, sedang dan 1.1
>=501 301- 0-200
ringan. Dari keempat nilai atribut tersebut 500 CH
atribut sedang masih perlu diperhitungkan lagi.

S. ringan
Tingg Tinggi
Sedan
g
>=501 301- 201- 0-
500 300 200

196
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201

m. Menghitung jumlah kasus pada ketinggian yang


1
dijadikan sebagai acuan, jumlah kasus untuk Leren
g
keputusan >=501, 301-500, 201-300, dan 0-200,
dan Entropy dari semua kasus dan kasus yang 0-2%
Ringan
dibagi berdasarkan atribut lereng dan curah 2-15% 15-
hujan bulan Desember. Setelah itu lakukan 40%
penghitungan Gain untuk masing-masing atribut >=501 301- 1.1 0-200
500 CH

nilai total entropy adalah 1.917455,


sedangkan nilai Gain pada atribut lereng dan
curah hujan Desember diperoleh dari rumus S. ringan
Tingg Tinggi
gain, nilai Gain lereng sebesar (0.92148) dan Sedan
nilai Gain curah hujan adalah (0.90296). jadi g

nilai gain tertinggi terdapat pada atribut curah >=501 301-


500
201-
300
0-200

hujan. dengan demikian curah hujan dapat


menjadi node akar. ada 4 nilai atribut dari CH
jan yaitu sangat tinggi, tinggi, sedang dan
ringan. Dari keempat nilai atribut tersebut
atribut sedang masih perlu diperhitungkan lagi.

Ilustrasi tree view menggunakan software orange disajikan pada gambar

Gambar 2. Tree curah hujan

R1 : if CH= Sangat tinggi THEN Ketinggian >=


III. Kesimpulan 501
Kesimpulannya setelah didapatkan tree R2 : if CH= Tinggi THEN Ketinggian 301-501
kemudian rule dari prakiraan curah hujan adalah R3 : if CH= sedang ^ lereng 0-2% THEN
sebagai berikut: ketinggian >=501
R4 : if CH= sedang ^lereng 2-15% THEN
a. curah hujan januari ketinggian 301-200
197
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva

R5 : if CH=sedan ^ lereng 15-40% THEN R3 = lereng= 15-40% = CH= Sangat Tinggi


ketinggian 201-300 maka ketinggian >=501
Berikut ini adalah bentuk keterangan R4 = lereng=15-40% = CH= tinggi maka
umumnya dari rule yang sudah disederhanakan ketinggian =301-500
adalah sebagai berikut: R5= lereng= 15-40% = CH = Sedang maka
R1 = CH= Sangat tinggi maka Ketinggian >= ketinggian = 201-300
501 R6 = lereng=15-40% = CH= ringan =
R2 = CH= Tinggi maka Ketinggian 301-501 ketinggian = 0-200
R3 = CH= sedang = lereng 0-2% maka
ketinggian >=501 d. curah hujan April
R4 = CH= sedang = lereng 2-15% maka R1 : if lereng = 0-2% THEN Ketinggian=
ketinggian 301-200 >=501
R5 =CH=sedan = lereng 15-40% maka R2 : if lereng= 2-15% THEN ketinggian =301-
ketinggian 201-300 500
R3 : if lereng= 15-40% ^ CH= Sangat Tinggi
b. curah hujan februari THEN ketinggian >=501
R1 : if CH= Sangat tinggi THEN Ketinggian >= R4 : if lereng=15-40% ^ CH= tinggi THEN
501 ketinggian =301-500
R2 : if CH= Tinggi THEN Ketinggian 301-501 R5: if lereng= 15-40% ^ CH = Sedang THEN
R3 : if CH= sedang ^ lereng 0-2% THEN ketinggian = 201-300
ketinggian >=501 R6 : if lereng=15-40% ^ CH= ringan THEN
R4 : if CH= sedang ^lereng 2-15% THEN ketinggian = 0-200
ketinggian 301-200 Berikut ini adalah bentuk keterangan
R4 : if CH=sedan ^ lereng 15-40% THEN umumnya dari rule yang sudah disederhanakan
ketinggian 201-300 adalah sebagai berikut:
Berikut ini adalah bentuk keterangan R1 = lereng = 0-2% maka Ketinggian= >=501
umumnya dari rule yang sudah disederhanakan R2 = lereng= 2-15% maka ketinggian =301-500
adalah sebagai berikut: R3 = lereng= 15-40% = CH= Sangat Tinggi
R1 = CH= Sangat tinggi maka Ketinggian >= maka ketinggian >=501
501 R4 = lereng=15-40% = CH= tinggi maka
R2 = CH= Tinggi maka Ketinggian 301-501 ketinggian =301-500
R3 = CH= sedang = lereng 0-2% maka R5= lereng= 15-40% = CH = Sedang maka
ketinggian >=501 ketinggian = 201-300
R4 = CH= sedang = lereng 2-15% maka R6 = lereng=15-40% = CH= ringan =
ketinggian 301-200 ketinggian = 0-200
R5 =CH=sedan = lereng 15-40% maka
ketinggian 201-300 e. curah hujan Mei
R1 : if lereng = 0-2% THEN Ketinggian=
c. curah hujan Maret >=501
R1 : if lereng = 0-2% THEN Ketinggian= R2 : if lereng= 2-15% THEN ketinggian =301-
>=501 500
R2 : if lereng= 2-15% THEN ketinggian =301- R3 : if lereng= 15-40% ^ CH= Sangat Tinggi
500 THEN ketinggian >=501
R3 : if lereng= 15-40% ^ CH= Sangat Tinggi R4 : if lereng=15-40% ^ CH= tinggi THEN
THEN ketinggian >=501 ketinggian =301-500
R4 : if lereng=15-40% ^ CH= tinggi THEN R5: if lereng= 15-40% ^ CH = Sedang THEN
ketinggian =301-500 ketinggian = 201-300
R5: if lereng= 15-40% ^ CH = Sedang THEN R6 : if lereng=15-40% ^ CH= ringan THEN
ketinggian = 201-300 ketinggian = 0-200
R6 : if lereng=15-40% ^ CH= ringan THEN Berikut ini adalah bentuk keterangan
ketinggian = 0-200 umumnya dari rule yang sudah disederhanakan
Berikut ini adalah bentuk keterangan adalah sebagai berikut:
umumnya dari rule yang sudah disederhanakan R1 = lereng = 0-2% maka Ketinggian= >=501
adalah sebagai berikut: R2 = lereng= 2-15% maka ketinggian =301-500
R1 = lereng = 0-2% maka Ketinggian= >=501 R3 = lereng= 15-40% = CH= Sangat Tinggi
R2 = lereng= 2-15% maka ketinggian =301-500 maka ketinggian >=501
198
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201

R4 = lereng=15-40% = CH= tinggi maka R5= lereng= 15-40% = CH = Sedang maka


ketinggian =301-500 ketinggian = 201-300
R5= lereng= 15-40% = CH = Sedang maka R6 = lereng=15-40% = CH= ringan =
ketinggian = 201-300 ketinggian = 0-200
R6 = lereng=15-40% = CH= ringan =
ketinggian = 0-200 h. curah hujan Agustus
R1 : if lereng = 0-2% THEN Ketinggian=
f. curah hujan Juni >=501
R1 : if lereng = 0-2% THEN Ketinggian= R2 : if lereng= 2-15% THEN ketinggian =301-
>=501 500
R2 : if lereng= 2-15% THEN ketinggian =301- R3 : if lereng= 15-40% ^ CH= Sangat Tinggi
500 THEN ketinggian >=501
R3 : if lereng= 15-40% ^ CH= Sangat Tinggi R4 : if lereng=15-40% ^ CH= tinggi THEN
THEN ketinggian >=501 ketinggian =301-500
R4 : if lereng=15-40% ^ CH= tinggi THEN R5: if lereng= 15-40% ^ CH = Sedang THEN
ketinggian =301-500 ketinggian = 201-300
R5: if lereng= 15-40% ^ CH = Sedang THEN R6 : if lereng=15-40% ^ CH= ringan THEN
ketinggian = 201-300 ketinggian = 0-200
R6 : if lereng=15-40% ^ CH= ringan THEN Berikut ini adalah bentuk keterangan
ketinggian = 0-200 umumnya dari rule yang sudah disederhanakan
Berikut ini adalah bentuk keterangan adalah sebagai berikut:
umumnya dari rule yang sudah disederhanakan R1 = lereng = 0-2% maka Ketinggian= >=501
adalah sebagai berikut: R2 = lereng= 2-15% maka ketinggian =301-500
R1 = lereng = 0-2% maka Ketinggian= >=501 R3 = lereng= 15-40% = CH= Sangat Tinggi
R2 = lereng= 2-15% maka ketinggian =301-500 maka ketinggian >=501
R3 = lereng= 15-40% = CH= Sangat Tinggi R4 = lereng=15-40% = CH= tinggi maka
maka ketinggian >=501 ketinggian =301-500
R4 = lereng=15-40% = CH= tinggi maka R5= lereng= 15-40% = CH = Sedang maka
ketinggian =301-500 ketinggian = 201-300
R5= lereng= 15-40% = CH = Sedang maka R6 = lereng=15-40% = CH= ringan =
ketinggian = 201-300 ketinggian = 0-200
R6 = lereng=15-40% = CH= ringan =
ketinggian = 0-200 i. curah hujan September
R1 : if lereng = 0-2% THEN Ketinggian=
g. curah hujan Juli >=501
R1 : if lereng = 0-2% THEN Ketinggian= R2 : if lereng= 2-15% THEN ketinggian =301-
>=501 500
R2 : if lereng= 2-15% THEN ketinggian =301- R3 : if lereng= 15-40% ^ CH= Sangat Tinggi
500 THEN ketinggian >=501
R3 : if lereng= 15-40% ^ CH= Sangat Tinggi R4 : if lereng=15-40% ^ CH= tinggi THEN
THEN ketinggian >=501 ketinggian =301-500
R4 : if lereng=15-40% ^ CH= tinggi THEN R5: if lereng= 15-40% ^ CH = Sedang THEN
ketinggian =301-500 ketinggian = 201-300
R5: if lereng= 15-40% ^ CH = Sedang THEN R6 : if lereng=15-40% ^ CH= ringan THEN
ketinggian = 201-300 ketinggian = 0-200
R6 : if lereng=15-40% ^ CH= ringan THEN Berikut ini adalah bentuk keterangan
ketinggian = 0-200 umumnya dari rule yang sudah disederhanakan
Berikut ini adalah bentuk keterangan adalah sebagai berikut:
umumnya dari rule yang sudah disederhanakan R1 = lereng = 0-2% maka Ketinggian= >=501
adalah sebagai berikut: R2 = lereng= 2-15% maka ketinggian =301-500
R1 = lereng = 0-2% maka Ketinggian= >=501 R3 = lereng= 15-40% = CH= Sangat Tinggi
R2 = lereng= 2-15% maka ketinggian =301-500 maka ketinggian >=501
R3 = lereng= 15-40% = CH= Sangat Tinggi R4 = lereng=15-40% = CH= tinggi maka
maka ketinggian >=501 ketinggian =301-500
R4 = lereng=15-40% = CH= tinggi maka R5= lereng= 15-40% = CH = Sedang maka
ketinggian =301-500 ketinggian = 201-300
199
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva

R6 = lereng=15-40% = CH= ringan =


ketinggian = 0-200 l. curah hujan Desember
R1 : if lereng = 0-2% THEN Ketinggian=
j. curah hujan Oktober >=501
R1 : if lereng = 0-2% THEN Ketinggian= R2 : if lereng= 2-15% THEN ketinggian =301-
>=501 500
R2 : if lereng= 2-15% THEN ketinggian =301- R3 : if lereng= 15-40% ^ CH= Sangat Tinggi
500 THEN ketinggian >=501
R3 : if lereng= 15-40% ^ CH= Sangat Tinggi R4 : if lereng=15-40% ^ CH= tinggi THEN
THEN ketinggian >=501 ketinggian =301-500
R4 : if lereng=15-40% ^ CH= tinggi THEN R5: if lereng= 15-40% ^ CH = Sedang THEN
ketinggian =301-500 ketinggian = 201-300
R5: if lereng= 15-40% ^ CH = Sedang THEN R6 : if lereng=15-40% ^ CH= ringan THEN
ketinggian = 201-300 ketinggian = 0-200
R6 : if lereng=15-40% ^ CH= ringan THEN Berikut ini adalah bentuk keterangan
ketinggian = 0-200 umumnya dari rule yang sudah disederhanakan
Berikut ini adalah bentuk keterangan adalah sebagai berikut:
umumnya dari rule yang sudah disederhanakan R1 = lereng = 0-2% maka Ketinggian= >=501
adalah sebagai berikut: R2 = lereng= 2-15% maka ketinggian =301-500
R1 = lereng = 0-2% maka Ketinggian= >=501 R3 = lereng= 15-40% = CH= Sangat Tinggi
R2 = lereng= 2-15% maka ketinggian =301-500 maka ketinggian >=501
R3 = lereng= 15-40% = CH= Sangat Tinggi R4 = lereng=15-40% = CH= tinggi maka
maka ketinggian >=501 ketinggian =301-500
R4 = lereng=15-40% = CH= tinggi maka R5= lereng= 15-40% = CH = Sedang maka
ketinggian =301-500 ketinggian = 201-300
R5= lereng= 15-40% = CH = Sedang maka
ketinggian = 201-300 R6 = lereng=15-40% = CH= ringan = ketinggian = 0-
R6 = lereng=15-40% = CH= ringan = 200
ketinggian = 0-200
DAFTAR PUSTAKA
k. curah hujan Nopember
R1 : if lereng = 0-2% THEN Ketinggian= [1]. Abdullah, Atje Setiawan, (2013), Spasial Data
>=501 Mining Menggunakan Model Spatial
R2 : if lereng= 2-15% THEN ketinggian =301- Autoregressive(Sar) Dan Ekspansi Sar Untuk
500 Pemetaan Mutu Pendidikan Di Provinsi Banten,
R3 : if lereng= 15-40% ^ CH= Sangat Tinggi IndoMS Journal on Statistics, Vol.1, No. 1,
THEN ketinggian >=501 (2013), Page 63-82
R4 : if lereng=15-40% ^ CH= tinggi THEN [2]. Ahmad, Dhani., hoyyi, hasbi Yasin, (2014),
ketinggian =301-500 Ordinary Kriging Dalam Estimasi Curah Hujan
R5: if lereng= 15-40% ^ CH = Sedang THEN Di Kota Semarang, Jurnal Gausian Vol 3, No 1:
ketinggian = 201-300 Hal, 151-159
R6 : if lereng=15-40% ^ CH= ringan THEN [3]. Azmi, Zulfian & Dahria, Muhammad, Decision
ketinggian = 0-200 Tree Berbasis Algoritma Untuk Pengambilan
Berikut ini adalah bentuk keterangan Keputusan, Jurnal Ilmiyah Saintikom Sains dan
umumnya dari rule yang sudah disederhanakan Komputer, ISSN: 1978-6603
adalah sebagai berikut: [4]. Berry, M.J.A., (2004), Data Mining Techniques,
R1 = lereng = 0-2% maka Ketinggian= >=501 John Wiley & Sons
R2 = lereng= 2-15% maka ketinggian =301-500 [5]. Catur Apralis,(2010), Perbandingan Model
R3 = lereng= 15-40% = CH= Sangat Tinggi Fungsi Transfer dan Arima studi Kasus Antara
maka ketinggian >=501 Curah Hujan dengan Kelembaban Udara,
R4 = lereng=15-40% = CH= tinggi maka Universitas Islam Negri Jakarta
ketinggian =301-500 [6]. Dwi Nurmalis Fitriyani, (2010), Pengembangan
R5= lereng= 15-40% = CH = Sedang maka Sistem Manajemen Data Iklim dengan
ketinggian = 201-300 Pemodelan objek Relational Berbasis Web,
R6 = lereng=15-40% = CH= ringan = Universitas Islam Negri Jakarta
ketinggian = 0-200
200
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201

[7]. Joko Diarso, (2012), Pengembangan Sistem [9]. Sumathi, N., Geetha, R. dan Bama, S. S. 2008.
Informasi Geografis berbasis Web Pada tingkat Spatial Data Mining – Technique Trends and Its
Curah Hujan, Universitas Islam Negeri Jakarta Applications. Journal of Computer
[8]. Han, Jiawei, dan Kamber, M. 2001. Data Applications, Vol-1. Hal 28-30
Mining: Concepts and Techniques.Californnia : [10]. http://orange.biolab.si/trac/browser/orange/docs/
Academic Press reference/rst/code/

201
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva

202
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767

Anda mungkin juga menyukai