Jurnal Sistem Informasi Cuaca PDF
Jurnal Sistem Informasi Cuaca PDF
Eva Khudzaeva
Program Studi Sistem Informasi, Fakultas Sains dan Teknologi, Universitas Islam Negeri Jakarta
UIN Jakarta. Jl. Ir. H. Juanda No.95, Ciputat Jakarta
e-mail : eva.khudzaeva@uinjkt.ac.id
ABSTRACT
Information about the condition of rainfall is one of the essential elements and a big influence on all kinds of
livelihood activities, Banten province is a region that is characteristic of the region vary, so study the spatial
patterns of the relationship between rainfall data with the characteristics of the region, will obtain the factors that
influence precipitation and can determine the bulk rainfall prediction based on its characteristics in Banten
Province. Data mining provides the desired search patterns in large databases to assist in decision making at a time
when it comes to looking for patterns of relatedness in the used mining methods using decision tree classification,
where the rainfall data will be classified with regional characteristics, so as to generate a forecast of rainfall.
ABSTRAK
Informasi mengenai kondisi curah hujan adalah salah satu unsur penting dan besar pengaruhnya terhadap
segala macam aktifitas kehidupan, Provinsi Banten merupakan wilayah yang karakteritik wilayahnya berbeda-beda,
sehingga mempelajari pola spasial keterkaitan antara data curah hujan dengan karakteristik wilayah, akan
memperoleh faktor-faktor yang mempengaruhi curah hujan dan dapat menentukan prakiran curah hujn berdasarkan
karakteristik wilayah di Provinsi Banten. Data mining berisi pencarian pola yang diinginkan dalam database besar
untuk membantu dalam pengambilan keputusan diwaktu yang akan datang untuk mencari pola keterkaitan tersebut
digunakan metode classification mining menggunakan decision tree, dimana data curah hujan akan diklasifikasikan
dengan karakteristik wilyah, sehingga menghasilkan prakiraan curah hujan.
Kata Kunci : Prakiraan curah hujan, karakteristik wilyah, classification mining, decision tree
189
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva
hasil keputusan yang didapatkan sangat tergantung dengan masukkan data lain yang mendukung
pada bagaimana pohon tersebut didesain. analisis data.
Provinsi banten merupakan provinsi yang
berdampingan dengan Ibukota Negara, Banten resmi Menentukan Node
menjadi sebuah provinsi ke-30 di Negara Kesatuan Dalam data sampel tentukan dulu node terpilih, yaitu
Republik Indonesia (NKRI) sejak tahun 2000, dengan menghitung nilai informasi gain masing-
dibentuk melalui Undang-undang nomor 23 tahun masing atribut untuk menentukan node terpilih,
2000. Provinsi Banten berada diantara 5 07’50” – mengunakan nilai informasi gain yang paling besar,
701’11” lintang selatan dn 10501’11” – 10607’12” nilai gain diperoleh dari nilai entropy dari masing-
bujur timur yang terbagi dalam 8 daerah kota dan masing variabel, menggunakan rumus dibawah ini:
Kabupaten. Provinsi Banten bila dikaitkan dengan
posisi geografis dan kondisi toponomi pemerintahan,
maka Provinsi Banten merupakan wilayah yang
memiliki banyak kegiatan perindustrian dan ……………….............................(1)
pertanian, di wilayah Banten sendiri memiliki Dengan :
karekteristik wilayah yang berbeda dan juga curah S : Himpunan Kasus
hujan yang berbeda-beda. A : Fitur
Berdasarkan uraian diatas maka penelitian ini n : Jumlah partisi S
akan meneliti pola keterkaitan antara data curah pi : Proporsi dari Si terhadap S
hujan dengan karakteristik wilayah, sehingga faktor-
faktor yang mempengaruhi curah hujan ini akan
digunakan menentukan prakiraan curah hujan di
wilayah Banten. Proses untuk menentukan pola
keterkitan curah hujan dan karakteristik wilayah,
diolah menggunakan data mining curah hujan dan (2)
data spasial karakteristik wilayah, menggunakan S : Himpunan kasus
metode klasifikasi decision tree. A : Atribut
n : Jumlah partisi atribut A
2. Metodelogi Penelitian |Si| : Jumlah kasus pada partisi ke i
A. Bahan |S| : Jumlah kasus dalam S
1. Peta vektor Provinsi Banten dalam format
shapefile dengan ekstensi *shp II. HASIL
menggunakansistem proyeksi geografiyang A. Analisa Data Mining
dinyatakan dalam besaran sudut (derajat) lintang
dan bujur dan proyeksi Universal Transverse Data pada table 3.1 sangat banyak dan tidak
Mercator(UTM). lengkap dan inkonsisten umumnya terjadi pada
2. Peta vektor topogrfi di Provinsi Banten dalam setiap database. Data yang tidak lengkap disebabkan
format shapefile dengan ekstensi *shp karena adanya data yang kosong atau atribut yang
menggunakan sistem proyeksi geogarfi dalam salah, sehingga proses data preprocessing perlu
besaran sudut lintang dan bujur juga UTM. dilakukan sehingga database sesuai dengan
3. Data non spasial berupa data atribut curah hujan ketentuan yang diperlukan. berikut sebaran stasiun
yang telah tersedia dan diproses, ditambahkan curah hujan dan ketinggian wilayah provinsi banten.
190
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201
191
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva
Data preprocessing merupakan hal yang proses data mining, karena akan lebih efisien
penting dalam proses data mining, hal yang termasuk terhadap data yang lebih kecil. Masalah klasifikasi
antara lain : berakhir dengan dihasilkan sebuah pengetahuan.
Masalah klasifikasi berakhir dengan
B. Data Selection dihasilkan sebuah pengetahuan yang dipresentasikan
dalam bentuk diagram pohon keputusan (decision
Data Curah Hujan dan Topografi tersebut tree) untuk menentukan, kriteria yang diperhatikan
nantinya akan menjadi kasus dalam proses adalah data curah hujan, data ketinggian, dan data
operasional data mining. Dari data yang ada, kolom lereng.
yang diambil sebagai atribut/variable keputusan
adalah survive. sedangkan kolom yang diambil D. Mengubah Data Menjadi Tree
variabel penentuan dalam pembentukan pohon
keputusan adalah: Dalam mengubah data menjadi tree terlebih
1. Koordinat x,y/nama stasiun dahulu data dinyatakan dalam bentuk tabel dengan
2. Kategori Curah hujan bulanan atribut dan record. Atribut menyatakan suatu
ditentukan dari BMKG, curah hujan bulanan parameter yang dibuat sebagai kriteria dalam
dikategorikan menjadi 4 kategori, antara lain kategori pembentukan tree.
curah hujan ringan (0 – 100 mm), kategori curah
hujan sedang (101 – 300 mm), kategori curah hujan E. Menentukan Node
tinggi (301 – 400 mm), dan kategori curah hujan
sangat tinggi (diatas 401mm) Dalam data sampel tentukan dulu node
3. Topografi ketinggian wilayah Banten ditentukan terpilih, yaitu dengan menghitung nilai informasi
dari ketinggian karakteristik wilayah yang ada gain masing-masing atribut untuk menentukan node
di provinsi Banten terpilih, gunakan nilai informasi gain yang paling
4. Topografi kelerengan wilayah Banten besar, nilai gain diperoleh dari nilai entropy dari
ditentukan dari kelerengan wilayah yang ada di masing-masing variabel, menggunakan rumus
Provinsi banten dibawah ini:
a. Menghitung jumlah kasus pada ketinggian yang
C. Data Preprocessing/Data Cleaning dijadikan sebagai acuan, jumlah kasus untuk
keputusan >=501, 301-500, 201-300, dan 0-200,
Data cleaning diterapkan untuk menambah isi dan Entropy dari semua kasus dan kasus yang
atribut yang hilang atau kosong, dan merubah data dibagi berdasarkan atribut lereng dan curah
yang tidak konsisten hujan bulan Januari. Setelah itu lakukan
1. Data Transformasi penghitungan Gain untuk masing-masing
Dalam proses ini, data ditranspormasikan ke dalam atribut.
entuk yang sesuai untuk proses data mining.
2. Data Reduction nilai total entropy adalah 1.917455,
Reduksi data dilakukan dengan sedangkan nilai Gain pada atribut lereng dan
menghilangkan atribut yang tidak diperlukan curah hujan januari diperoleh dari rumus gain,
sehingga ukuran dari database menjadi kecil dan nilai Gain lereng sebesar (0.92148) dan nilai
hanya menyertakan atribut yang diperlukan dalam Gain curah hujan adalah (1.076045). jadi nilai
proses data mining, karena akan lebih efisien gain tertinggi terdapat pada atribut hujan.
terhadap data yang lebih kecil. dengan demikian lereng dapat menjadi node
Masalah klasifikasi berakhir dengan akar. ada 4 nilai atribut dari CH jan yaitu sangat
dihasilkan sebuah pengetahuan yang dipresentasikan tinggi, tinggi, sedang dan ringan. Dari keempat
dalam bentuk diagram yang biasa disebut pohon nilai atribut tersebut atribut sedang masih perlu
keputusan (decision tree) untuk menentukan pola diperhitungkan lagi.
curah hujan terhadap karakteristik fisik, kriteria yang
diperhatikan adalah banyakny curah hujan yang
terjadi disuatu wilayah dilihat berdasarkan
karakteristik fisik wilayah dilihat dari topografi
ketinggian dan kelerengan.
Reduksi data dilakukan dengan
menghilangkan atribut yang tidak diperlukan
sehingga ukuran dari database menjadi kecil dan
hanya menyertakan atribut yang diperlukan dalam
192
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201
1
nilai total entropy adalah 1.917455,
CH sedangkan nilai Gain pada atribut lereng dan
Jan
curah hujan Maret diperoleh dari rumus gain,
Sangat tinggi
Ringan nilai Gain lereng sebesar (0.92148) dan nilai
Tinggi sedan
g Gain curah hujan adalah (0.71039). jadi nilai
1.1
>=501 301-
lereng
0-200 gain tertinggi terdapat pada atribut curah hujan.
500
dengan demikian curah hujan dapat menjadi
node akar. ada 4 nilai atribut dari CH jan yaitu
0-2% 15-40% sangat tinggi, tinggi, sedang dan ringan. Dari
2-15%
keempat nilai atribut tersebut atribut sedang
>=501 301- 201- masih perlu diperhitungkan lagi.
500 300
1
CH
b. Menghitung jumlah kasus pada ketinggian yang Jan
dijadikan sebagai acuan, jumlah kasus untuk Sangat tinggi
Ringan
keputusan >=501, 301-500, 201-300, dan 0-200, Tinggi sedan
g
dan Entropy dari semua kasus dan kasus yang 1.1
>=501 301- 0-200
dibagi berdasarkan atribut lereng dan curah 500 lereng
hujan bulan Januari. Setelah itu lakukan
penghitungan Gain untuk masing-masing
0-2% 15-40%
atribut. 2-15%
194
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201
195
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva
1 S. ringa
Lere Ting Ting n
ng g gi Seda
0-2% ng
Ring >=5 301- 201- 0-
2- 15- an 01 500 300 200
15% 40
>=5 301- 1.1 0-
%
CH
01 500 200
k. Menghitung jumlah kasus pada ketinggian yang Nilai total entropy adalah 1.917455,
dijadikan sebagai acuan, jumlah kasus untuk sedangkan nilai Gain pada atribut lereng dan
keputusan >=501, 301-500, 201-300, dan 0-200, curah hujan Desember diperoleh dari rumus
dan Entropy dari semua kasus dan kasus yang gain, nilai Gain lereng sebesar (0.92148) dan
dibagi berdasarkan atribut lereng dan curah nilai Gain curah hujan adalah (0.90296). jadi
hujan bulan Nopember. Setelah itu lakukan nilai gain tertinggi terdapat pada atribut curah
penghitungan Gain untuk masing-masing hujan. dengan demikian curah hujan dapat
atribut. menjadi node akar. ada 4 nilai atribut dari CH
jan yaitu sangat tinggi, tinggi, sedang dan
Nilai total entropy adalah 1.917455, ringan. Dari keempat nilai atribut tersebut
sedangkan nilai Gain pada atribut lereng dan atribut sedang masih perlu diperhitungkan lagi.
curah hujan Nopember diperoleh dari rumus
gain, nilai Gain lereng sebesar (0.92148) dan
1
nilai Gain curah hujan adalah (0.87468). jadi Leren
nilai gain tertinggi terdapat pada atribut curah g
S. ringan
Tingg Tinggi
Sedan
g
>=501 301- 201- 0-
500 300 200
196
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Studia Informatika: Jurnal Sistem Informasi , 9(2), 2016, 189-201
[7]. Joko Diarso, (2012), Pengembangan Sistem [9]. Sumathi, N., Geetha, R. dan Bama, S. S. 2008.
Informasi Geografis berbasis Web Pada tingkat Spatial Data Mining – Technique Trends and Its
Curah Hujan, Universitas Islam Negeri Jakarta Applications. Journal of Computer
[8]. Han, Jiawei, dan Kamber, M. 2001. Data Applications, Vol-1. Hal 28-30
Mining: Concepts and Techniques.Californnia : [10]. http://orange.biolab.si/trac/browser/orange/docs/
Academic Press reference/rst/code/
201
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767
Spasial Classification Mining.. Khudzaeva, eva
202
Copyright ©2016, Studia Informatika: Jurnal Sistem Informasi, P-Issn 1979-0767