Anda di halaman 1dari 8

Jurnal Pelita Informatika, Volume 18, Nomor 2, April 2019

ISSN 2301-9425 (Media Cetak)


Hal: 212-219

ANALISA DATA PERTANIAN TANAMAN PANGAN UNTUK


MEMPREDIKSI HASIL PANEN DENGAN DATA MINING
ALGORITMA C.45 (STUDI KASUS : DINAS TANAMAN
PANGAN dan HOLTIKUTURA PROVINSI SUMUT)
Sri Maya Sari Sianturi1, Nelly Astuti Hasibuan2

Prodi Teknik Informatika STMIK Budi Darma, Medan, Indonesia


Jln. Sisingamangaraja No. 338 Simp. Limun Medan

ABSTRAK
Tanaman Pangan adalah segala jenis tanaman yang di dalamnya terdapat karbohidrat dan protein sebagai sumber energi manusia.
Tanaman pangan juga dapat dikatakan sebagai tanaman utama yang di konsumsi manusia, sebagai makanan untuk memberikan
asupan energi bagi tubuh. Umumnya tanaman pangan yang tumbuh dalam waktu semusim. Penelitian ini bertujuan membentuk
model pohon keputusan untuk memprediksi hasil panen dan melihat variabel yang paling berpengaruh. Obyek dalam penelitian ini
adalah tanaman padi, data yang digunakan untuk penelitian adalah data mining yang merupakan suatu proses menemukan hubungan
yang berarti, pola, dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan dengan
menggunakan teknik pengenalan pola seperti teknik statistik dan matematika. Pembentukan model prediksi menggunakan metode
C4.5. Pada algoritma C4.5 dilakukan perhitungan entropy dan information gain. Sebagai atribut sumber untuk memperoleh node
akar dan node lainnya. Berdasarkan hasil klasifikasi menggunakan algoritma C4.5 menunjukkan bahwa algoritma C4.5 cocok
digunakan untuk memprediksi hasil panen padi.
Kata Kunci : Tanaman Pangan, Algoritma C4.5, Data Mining.
Selama ini Dinas Tanaman Pangan Dan
I. PENDAHULUAN
Holtikutura Provinsi Sumut telah berupaya melakukan
Dinas Tanaman Pangan Dan Holtikutura Provinsi prediksi hasil panen berdasarkan hasil panen dari tahun
Sumut merupakan sebagai salah satu Departemen yang sebelumnya. Namun peramalan yang dilakukan belum
mempunyai kegiatan Melaksanakan Penyuluhan mempertimbangkan faktor irigasi dan iklim, dalam hal ini
Pertanian, memberikan saran-saran dalam bidang adalah tenaga kerja. Oleh karena itu dibutuhkan model
Pertanian dan pemberian tanah kepada perusahaan- prediksi produksi panen komoditas padi dengan
perusahaan bidang Pertanian. Selain itu Dinas Pertanian mempertimbangkan faktor luas lahan, irigasi dan tenaga
juga mengadakan penelitian tentang ekonomi masyarakat kerja. Berdasarkan kondisi di atas, dibutuhkan model
dan membuat laporan keadaan Pertanian termasuk prediksi hasil panen menggunakan teknik data mining
statistic. dengan algoritma C4.5. Diharapkan dengan
Data statistik Indonesia tahun 2015 menunjukkan mempertimbangkan faktor luas lahan, irigasi dan tenaga
sumatera utara merupakan provinsi penghasil padi kerja, hasil prediksi yang diperoleh dapat memberikan
terbesar ketiga setelah pulau jawa (Badan Pusat Statistik, informasi untuk peningkatan hasil panen.
2016). Ditahun 2015, luas panen Sumut mencapai 71.756
hektare dengan produksi 857.553 ton. Sedangkan ditahun II. TEORITIS
2016, dengan luas panen yang lebih sedikit, yakni 69.960 A. Kecerdasan Buatan
hektare justru produksinya tetap diatasnya, yakni
Artificial Intelligence (AI) atau kecerdasan buatan
mencapai 907.908 ton. Dilihat dari produktivitasnya,
termasuk bidang ilmu yang relatif muda. Pada tahun
tahun 2015 sebesar 119,51 ton per hektare sedangkan di
1950-an para ilmuwan dan peneliti mulai memikirkan
tahun 2016 naik menjadi 129,78 ton per hektare.
bagaimana caranya agar mesin dapat melakukan
Sumatera Utara memiliki potensi wilayah yang sangat
pekerjaannya seperti yang bisa dikerjakan oleh manusia.
besar sebagai sentral penghasil padi.
Alan Turing, seorang matematikawan dari Inggris
Dengan tingkat kesuburan tanahnya, tak heran jika
pertama kali mengusulkan adanya pengujian untuk
produksi padi Sumut hingga kini masih berada pada
melihat bisa tidaknya sebuah mesin dikatakan cerdas.
peringkat 3 di Indonesia setelah propinsi lainnya di Jawa.
Hasil pengujian tersebut kemudian dikenal dengan Turing
Upaya peningkatan produksi padi telah dilakukan 3
Test, di mana mesin tersebut menyamar seolah-olah
pemerintah dengan berbagai cara, namun lemahnya
sebagai seseorang di dalam suatu permainan yang mampu
teknologi pendukung menjadi salah satu kendala
memberikan respon terhadap serangkaian pertanyaan
peningkatan hasil panen, Kurangnya saran prediksi hasil
yang diajukan. Turing beranggapan bahwa, jika mesin
panen mengakibatkan kurangnya informasi yang
dapat membuat seseorang percaya bahwa dirinya mampu
dibutuhkan untuk meningkatkan hasil penen.

212
Jurnal Pelita Informatika, Volume 18, Nomor 2, April 2019
ISSN 2301-9425 (Media Cetak)
Hal: 212-219

berkomunikasi dengan orang lain, maka dapat dikatakan Untuk memilih atribut dengan akar, didasarkan
bahwa mesin tersebut cerdas (seperti layaknya manusia). pada nilai gain tertinggi dari atribut - tribut yang ada.
Kecerdasan buatan atau Artificial Intelligence (AI) Untuk menghitung gain digunakan rumus seperti tertera
itu sendiri dimunculkan oleh seorang professor dari dalam persamaan 1 berikut:[3]
Massachusetts Institute of Technology yang bernama
John McCarthy pada tahun 1956 pada Dartmouth
Conference yang dihadiri oleh para peneliti AI. Pada
konferensi tersebut juga didefinisikan tujuan utama dari Keterangan:
kecerdasan buatan, yaitu mengetahui dan memodelkan S : Himpunan kasus
proses-proses berpikir manusia dan mendesain mesin agar A : Atribut
dapat menirukan kelakuan manusia tersebut. [1] N : Jumlah partisi atribut A
| Si | : Jumlah kasus pada partisi ke-i
B. Data Mining | S | : Jumlah kasus dalam S
Sehingga akan diperoleh nilai gain dari atribut
Data Mining adalah suatu istilah yang digunakan
yang paling tertinggi. Gain adalah salah satu atribute
untuk menguraikan penemuan pengetahuan didalam
selection measure yang digunakan untuk memilih test
database. Data mining adalah proses yang menggunakkan
atribute tiap node pada tree. Atribut dengan information
teknik statistik, matematika, kecerdasan buatan, dan
gain tertinggi dipilih sebagai test atribute dari suatu node.
meachine learning untuk mengekstraksi dan
Sementara itu, penghitungan nilai entropi dapat dilihat
mengidentifikasi informasi yang bermanfaat dan
pada persamaan 2.
pengetahuan yang terakit dari berbagai database besar [2]
Istilah data mining dan knowledge discovery in
database (KDD) seringkali digunakan secara bergantian
untuk menjelaskan proses penggalian inormasi
Keterangan:
tersembunyi dalam suatu basis data yang besar.
S : Himpunan kasus
Sebenarnya kedua istilah tersebut memiliki konsep yang
A : Atribut
berbeda, tetapi berkaitan satu sama lain. Dan salah satu
N : Jumlah partisi S
tahapan dalam keseluruhan proses KDD adalah data
Pi : Proporsi dari Si terhadap S
mining.
D. Tanaman Pangan
C. Algoritma C4.5
Tanaman pangan adalah segala jenis tanaman yang
Algoritma C4.5 adalah algoritma klasifikasi data
di dalamnya terdapat karbohidrat dan protein sebagai
dengan teknik pohon keputusan yang memiliki kelebihan-
sumber energi manusia. Tanaman pangan juga dapat
kelebihan. Kelebihan ini misalnya dapat mengolah data
dikatakan sebagai tanaman utama yang dikonsumsi
numerik (kontinyu) dan diskret, dapat menangani nilai
manusia sebagai makanan untuk memberikan asupan
atribut yang hilang, menghasilkan aturan - aturan yang
energi bagi tubuh. Umumnya tanaman pangan adalah
mudah diintrepetasikan dan tercepat diantara algoritma-
tanaman yang tumbuh dalam waktu semusim.[4]
algoritma yang lain.[3]
Keakuratan prediksi yaitu kemampuan model
III. ANALISA
untuk dapat memprediksi label kelas terhadap data baru
A. Analisa Masalah
atau yang belum diketahui sebelumnya dengan baik.
Dalam hal kecepatan atau efisiensi waktu komputasi yang Dinas Tanaman Pangan Dan Holtikutura Provinsi
diperlukan untuk membuat dan menggunakan model. Sumut merupakan sebagai salah satu Departemen yang
Kemampuan model untuk memprediksi dengan benar mempunyai kegiatan Melaksanakan Penyuluhan
walaupun data ada nilai dari atribut yang hilang. Dan juga Pertanian, memberikan saran-saran dalam bidang
skalabilitas yaitu kemampuan untuk membangun model Pertanian dan pemberian tanah kepada perusahaan-
secara efisien untuk data berjumlah besar (aspek ini akan perusahaan bidang Pertanian. Prediksi hasil panen
mendapatkan penekanan). mengacu kepada memprediksi jumlah hasil panen dimasa
Terakhir interpretabilitas yaitu model yang mendatang berdasarkan data histori.
dihasilkan mudah dipahami. Dalam algoritma C4.5 untuk Berkaitan dengan kompetensi dan globalisasi,
membangun pohon keputusan hal pertama yang prediksi hasil panen padi memainkan peran penting pada
dilakukan yaitu memilih atribut sebagai akar. Kemudian system siklus hidup para petani. Faktor-faktor yang
dibuat cabang untuk tiaptiap nilai didalam akar tersebut. mempengaruhi hasil panen padi adalah jumlah tanaman
Langkah berikutnya yaitu membagi kasus dalam cabang. (Ha), lokasi, panen (ha) , Produktivitas (Kw/ha) dan
Kemudian ulangi proses untuk setiap cabang sampai Produksi (ton). Hubungan antara faktor-faktor yang
semua kasus pada cabang memiliki kelas yang sama. mempengaruhi hasil panen padi dengan hasil panen

213
Jurnal Pelita Informatika, Volume 18, Nomor 2, April 2019
ISSN 2301-9425 (Media Cetak)
Hal: 212-219

merupakan pendukung kelancaran hasil panen padi di satu Sas


ara
priode. Hasil panen padi yang tidak dapat memenuhi n
Hasil
Hasil
Panen Cu
kebutuhan pasar mengakibatkan kelangkaan beras yang N Kabupate Ta
(Ton)
panen
rah Ha
o n/ na Ton Kategori
akan mempengaruhi kecukupan konsumsi gizi penduduk Kota m
Okt'15-
April-
Hu ma
Maret'1 jan
Indonesia. (ha
6
Sept'16
Berdasarkan permasalahan maka muncul gagasan )

untuk membuat model baru luas panen padi yang 35,


melibatkan indikator / variabel area tambah tanam dan 9
Tap. 3
151,569 157,677
Tin Tid
Stabil
Tengah 1 ggi ak
curah hujan. Agar para petani dapat memenuhi kebutuhan 3
penduduk Indonesia, Sehingga permasalahan akan 46,
berkurang dan para petani pun dapat melakukan prediksi Tap. 0 Tin Tid
10 225,567 234,657 Stabil
Selatan 7 ggi ak
untuk tahun yang akan datang. Dimana para petani akan 0
memprediksi daerah –daerah untuk mendapatkan hasil 14,
Re
8 Tid
panen yang terbaik, Agar tidak terjadi kerusakan pada 11 Nias 53,907
4
56,079 nda
ak
Stabil
h
beras yang akan di pasarkan. 4
22,
Hal ini menjadi latar belakang penggunaan metode 6 Tin Tid Mening
prediksi menggunakan algoritma C4.5 Untuk 12 Dairi 129,268 134,477
5 ggi ak kat
mempermudah hasil prediksi tanaman padi oleh para 5
Se
petani yang akan di pasarkan, Sehingga dilakukan 13
Teb.
824 4,241 4,412 dan
Tid
Stabil
Tinggi ak
prediksi menggunakan algoritma C4.5 tersebut. g
Re
Tanj. Tid
14 480 2,186 2,274 nda Rendah
B. Penyelesaian Dengan Algoritma C4.5 Balai ak
h
3,5 Re
Tid
Berikut ini adalah hasil penen padi yang akan 15 Binjai 817,625 18,335 nda
ak
Stabil
6 h
dijadikan sampel untuk analisa dan untuk pengujian
5,7 Se
diambil bulan priode tahun 2015 -2016. 16
Pem.
133,646 35,002 dan
Tid
Stabil
Siantar ak
2 g
Tabel 1 Data Hasil Panen Priode 2015 -2016 34,
Sas Toba 8 Tin Tid
17 186,404 193,916 Stabil
ara Samosir 4 ggi ak
Hasil 3
n Hasil
Panen Cu
N Kabupate Ta panen 53,
(Ton) rah Ha
o n/ na Ton Kategori Mand. 9 Tin Tid
Okt'15- Hu ma 18 264,969 275,647 Stabil
Kota m April- Natal 1 ggi ak
Maret'1 jan
(ha Sept'16 3
6
) 10,
P.
1 Tin Tid
19 Sidempu 50,178 52,200 Stabil
3,0 Se 3 ggi ak
Tid Mening an
1 Medan 412,970 13,493 dan 7
ak kat
3 g 33,
Re
89, Nias 5 Tid
Se 20 156,123 162,414 nda Stabil
0 Tid Mening Selatan 3 ak
2 Langkat 484,040 503,547 dan h
6 ak kat 1
g
4 27,
H.
106 0 Tin Tid
21 Hasundut 128,487 133,665 Stabil
, Se 0 ggi ak
Deli Tid Mening an
3 584,057
2 607,595 dan 7
Serdang ak kat
6 g 82,
Se
5 S. 9 Tid Mening
22 453,400 471,672 dan
99, Bedagai 4 ak kat
g
Simalung 4 Tin Tid Mening 9
4 580,793 604,199
un 7 ggi ak kat 2,8
Pakpak Tin Tid
3 23 212,025 12,509 Rendah
Bharat ggi ak
25, 3
Tanah 5 Tin Tid Mening 12,
5 145,416 151,276
Karo 1 ggi ak kat 0 Tin Tid
24 Samosir 59,323 61,714 Stabil
5 6 ggi ak
19, 8
9 Tin Tid Mening 40,
6 Asahan 106,222 110,503 Re
0 ggi ak kat 8 Tid
25 Batubara 210,373 218,851 nda Stabil
9 5 ak
h
30, 0
9 Tin Tid Mening 21,
7 Lab. Batu 144,289 150,104 Re
0 ggi ak kat Padang 8 Tid
26 92,837 96,579 nda Stabil
5 Lawas 0 ak
h
34, 3
Tap. 3 Tin Tid Mening Re
8 169,969 176,819 P. Lawas 42, Tid
Utara 9 ggi ak kat 27 174,436 181,466 nda Stabil
Utara 0 ak
9 h

214
Jurnal Pelita Informatika, Volume 18, Nomor 2, April 2019
ISSN 2301-9425 (Media Cetak)
Hal: 212-219

Sas
ara
3. Curah Hujan
Hasil Curah hujan dibagi menjadi tiga golongan :
n Hasil
Panen Cu
N Kabupate Ta
(Ton)
panen
rah Ha Tinggi : -20%
o n/ na Ton Kategori
Kota m
Okt'15-
April-
Hu ma Hasil panen dengan curah hujan yang tinggi berkurang
Maret'1 jan
(ha
6
Sept'16 20% dari rata-rata hasil panen maksimal
)
Sedang : 20%
5 Hasil panen dengan curah hujan yang sedang
5 berambah 20% dari rata-rata hasil panen maksimal
42,
L. Batu 3
Se
Tid Rendah : 22,5%
28 176,325 183,431 dan Stabil
Utara 1
g
ak Hasil panen dengan curah hujan rendah bertambah
2
1,0 Re
20% dari rata-rata hasil panen maksimal
L. Batu Tid
29
Selatan
75,092 5,298 nda
ak
Stabil 4. Hama
2 h
13,
Hama dibagi menjadi dua golongan :
Re
30
Nias 9
46,144 48,004 nda
Tid
Stabil
Ya : -20%
Utara 1 ak Hasil panen yang terserang hama akan mengalami
h
8
5,9 Re menurunan sebesar 20% Tidak : 20%
Nias Tid
31 423,638 24,591 nda Stabil
Barat ak
8 h
5,4 Re
Pembentukan pohon keputusan pada dasarnya
Gunung Tid
32
Sitoli
326,845 27,927 nda
ak
Stabil memiliki tahap awal menentukan node awal sebagai akar
5 h pohon keputusan. Langkah-langkah penentuan akar (node
awal) adalah :
Data yang digunakan dalam penelitian ini adalah data 1. Dalam metode decision tree dengan algoritma C4.5,
hasil panen tahun 2015-2016 yang memberikan informasi penentuan simpul awal dilakukan melalui perhitungan
hasil panen dengan status meningkat, stabil dan menurun,. jumlah kasus. Jumlah kasus dengan hasil panen
Setelah data terkumpul dilakukan analisa data untuk meningkat, stabil dan menurun untuk setiap atribut,
menghasilkan kesimpulan berdasarkan rule. Analisis data entropy dari semua kasus dan gain dari setiap atribut.
tersebut dilakukan berdasarkan klasifikasi dan decision Berikut tabel pembagian kasus dari atribut sasaran
tree dengan algoritma C4.5. Data keseluruhan yang tanam (luas, sedang, sempit), hasil panen (meningkat,
digunakan sebanyak. stabil, menurun), curah hujan (tinggi, sedang rendah),
hama (ya, tidak).
Penentuan Atribut Table 4. Pembagian Khusus
Pada tahap ini dilakukan penentuan atribut untuk Jumlah Meningka Stabi Menuru
Atribut Nilai
membentuk pohon keputusan dari kasus. Adapun atribut kasus t l n
prediksi hasil panen adalah sebagai berikut : 32 10 20 2
<50 25 6 18 1
1. Sasaran tanam Sasaran 50-
Dari data sasaran tanam yang didapat Dinas Tanaman 4 3 1 0
tanam 100
Pangan Dan Holtikutura Provinsi Sumut seperti >100 3 1 1 1
tertera pada table 2. berikut. Hasil <50 10 1 7 2
Tabel 2. Jumlah daerah berdasarkan rencanan panen Panen 50-
4 0 4 0
Priode 100
(ha) Okt'15-
Rencana Panen (ha) Kategori >100 18 9 9 0
Maret'16
< 50.000 Sempit Hasil <50 10 1 7 2
Panen 50-
=50.000 Sedang Priode 4 0 4 0
100
>50.000 Luas April-
>100 18 9 9 0
Sept'16
Ting
2. Hasil Panen gi
14 6 7 1
Dari data hasil panen yang didapat Dinas Tanaman Curah Seda
Pangan Dan Holtikutura Provinsi Sumut seperti 7 4 3 0
hujan ng
tertera pada table 3 berikut. Rend
11 0 10 1
ah
Tabel 3. Jumlah Daerah berdasarkan Hasil produksi Ya 0 0 0 0
(Ton) Hama Tida
32 10 20 2
k
Hasil Panen (/Ton) Kategori
< 50.000 Menurun 2. Menghitung nilai entropy total dari semua kasus
dengan menggunakan persamaan
=50.000 Stabil
Entropy(S)=∑𝑎𝑖−1 −𝑝𝑖 ∗ 𝑙𝑜𝑔2 𝑝𝑖
>50.000 Meningkat

215
Jurnal Pelita Informatika, Volume 18, Nomor 2, April 2019
ISSN 2301-9425 (Media Cetak)
Hal: 212-219

10 10
Entropy(Total) = (- 32*log2(32))+( -
20 20
*log2(32)) +( - = -0.0030+ -0.1475 +-0.0120
32
2 2 =-0.1625
*log2(32)) Entropy(Hasil panen /Ton April-Sept'16 50-100)
32
= (-0.3125 * log2 0.3125) +(-0.625 * log2 0.625) 4 4
= (- 4*log2(4))
+(-0.1 * log2 0.1)
= (-1 * Log2 1)
= -0.1225 + (-0.1176) + (-0.0030)
= -0.301
=- 0.2431
Entropy(Hasil panen/ Ton April-Sept'16 >100)
3. Menghitung nilai entropy tiap atribut (instance) dan 9 9 9 9
gain tiap atribut. Berikut adalah perhitungan nilai = (- 18*log2(18))+( - 18*log2(18))
entropy dari atribut sasaran panen yaitu <50, 50-100 = (-0.5 * Log2 0.5) +(-0.5* log2 0.5)
dan >100. = -0.0753+ -0.0753
Entropy(sasaran panen<50) =-0.1506
6 6 18 18
= (- 25*log2(25))+(- 25*log2(25))+ Entropy(curah hujan tinggi)
6 6 7 7
1 1 = (- 14*log2(14))+( - 14*log2(14)) +( -
( - 25*log2(25))
1 1
= (-0.24 * Log2 0.24) +(-0.72* log2 0.72) +(- *log2( ))
14 14
0.04*Log2 0.04) = (-0.4283 * Log2 0.4283) +(-0.5* log2 0.5)
= -0.0173 + -0.1560 + -0.1871 + (-0.0714* log2 0.0714)
=-0.3604 = -0.0097+ -0.0753 + -0.0015
Entropy(sasaran panen 50-100) =-0.0865
3 3 1 1
= (- *log2( ))+( - *log2( )) Entropy(curah hujan sedang)
4 4 4 4 4 4 3 3
= (-0.75 * Log2 0.75) +(-0.25* log2 0.25) = (- 7*log2(7))+( - 7*log2(7))
= -0.1694+ -0.1882 = (-0.5714 * Log2 0.5714) +(-0.4286* log2
=-0.3576 0.4286)
Entropy(sasaran panen >100) = -0.0987+ -0.0320
1 1 1 1 1 1
= (- 3*log2(3))+( - 3*log2(3)) +( - 3*log2(3)) =-0.1307
Entropy(curah hujan rendah)
= (-0.3333 * Log2 0.3333) + 10 10 1 1
(-0.3333* log2 0.3333) + = (- 11*log2(11))+( - 11*log2(11))
(-0.3333* log2 0.3333) = (-0.9091 * Log2 0.9091) +(-0.0909 * Log2
= -0.0334+ -0.0334 +-0.0334 0.0909)
=-0.1002 = -0.2485+ -0.0025
Entropy(Hasil panen Ton Okt'15-Maret'16 <50) =-0.251
1 1 7 7
= (- *log2( ))+( - *log2( )) +( - Entropy(hama tidak)
10 10 10 10 10 10 20 20 2 2
2 2 = (- 32*log2(32))+( - 32*log2(32)) +( - 32*log2(32))
*log2(10))
10
= (-0.3125 * log2 0.3125) +(-0.625 * log2 0.625) +(-0.1 *
= (-0.1 * Log2 0.1) +(-0.7* log2 0.7) +(-0.2*
log2 0.1)
log2 0.2)
= -0.1225 + (-0.1176) + (-0.0030)
= -0.0030+ -0.1475 +-0.0120
=- 0.2431
=-0.1625
Entropy(Hasil panen Ton Okt'15-Maret'16 50-100)
4 4 Berikut adalah hasil perhitungan entropy yang diletakkan
= (- 4*log2(4)) pada Tabel 5.
= (-1 * Log2 1)
= -0.301 Tabel 5. Sample perhitungan entropy Condition
Entropy(Hasil panen/ Ton Okt'15-Maret'16 >100) Jum
9 9 9 9 Atri Nila lah Menin Sta Menu
= (- 18*log2(18))+( - 18*log2(18)) entropy
but i kasu gkat bil run
= (-0.5 * Log2 0.5) +(-0.5* log2 0.5) s
= -0.0753+ -0.0753 32 10 20 2 -0.2431
=-0.1506 <50 25 6 18 1 -0.3604
Entropy(Hasil panen /Ton April-Sept'16 <50) Sasar
50- -0.3576
1 1 7 7 an 4 3 1 0
= (- *log2( ))+( - *log2( )) +( - 100
10 10 10 10 tana
>10 -0.1002
2 2
*log2(10)) m 3 1 1 1
10 0
= (-0.1 * Log2 0.1) +(-0.7* log2 0.7) +(-0.2* Hasil <50 10 1 7 2 -0.1625
log2 0.2) Pane 50- -0.301
4 0 4 0
n 100

216
Jurnal Pelita Informatika, Volume 18, Nomor 2, April 2019
ISSN 2301-9425 (Media Cetak)
Hal: 212-219

Jum 32
= -0.2431 – ((32 x-0.2431)
Atri Nila lah Menin Sta Menu
entropy = -0.2431 – (-0.2431)
but i kasu gkat bil run
s =0
Priod -0.1506 Tabel 7. Perhitungan note Akar
e
Okt'1 >10
18 9 9 0
5- 0
Mare
t'16
Hasil <50 10 1 7 2 -0.1625
Pane 50- -0.301
4 0 4 0
n 100
Priod -0.1506
e
April >10
18 9 9 0
- 0
Sept'
16
Ting -0.0865
14 6 7 1
gi
Cura
Seda 0.1307
h 7 4 3 0
ng
hujan
Ren -0.251
11 0 10 1
dah
Ya 0 0 0 0 0
Ham
Tida -0.2431
a 32 10 20 2
k
4. Menghitung nilai gain dari atribut, nilai gain pada
atribut condition dihitung dengan persamaan sebagai
berikut.
Gain(S,A)=Entropy(S) -
𝑛
Si
∑ xEntropy(𝑆𝑖 )……………………..(3.3)
𝑖− S
Gain(Total Nilai sasaran panen)
25 4
= -0.2431 – (( x-0.3604) + ( x -0.3576) + ( x -
3 Dari hasil Tabel dapat diketahui bahwa atribut dengan
32 32 32 gain tertinggi adalah curah hujan yaitu sebesar -0.3201.
0.1002))
dengan demikian, Perilaku menjadi Node akar. Ada tiga
= -0.2431 – (- 0.2816) +(-0.0447) +(-0.0094)
atribut pada curah hujan, yaitu tinggi, sedang dan rendah.
= -0.0156
Dari tiga nilai atribut tersebut, nilai atribut baik sedang
Gain(Total Nilai Hasil Panen Priode Okt'15-Maret'16)
10 4 dan turun sudah mengklasifikasikan menjadi satu, yaitu
= -0.2431 – ((32 x-0.0508) + (32 x -0.301) stabil dan menurun, sehingga tidak perlu dilakukan
18
+ (32 x -0.1506)) perhitungan lebih lanjut, tetapi untuk nilai atribut tertinggi
masih perlu dilakukan perhitungan lagi.
= -0.2431 – (- 0.2816) +(-0.0376) +(-0.08471)
Dari hasil tersebut dapat digambarkan Pohon Keputusan
= -0.0838
semestaranya tampak pada gambar berikut:
Gain(Total Nilai Hasil Panen Priode April-Sept'16)
10 4
= -0.2431 – ((32 x-0.0508) + (32 x -0.301) CURAH
18 HUJAN
+ (32 x -0.1506))
= -0.2431 – (- 0.2816) +(-0.0376) +(-0.08471) Tinggi
sedang turun
= -0.0838
Gain(Total Nilai curah hujan) Satbil
Node 1.1 Menurun
14 7
= -0.2431 – ((32 x-0.0865) + (32 x -0.1307) +
11
(32 x -0.251)) Gambar 1. Pohon keputusan hasil perhitungan node 1
= -0.2431 – (- 0.0378) +(-0.0286) +(-0.0862)
= -0.3201 Node berikutnya dapat dipilih pada bagian yang
Gain(Total Nilai hama) mempunyai atau memiliki nilai antara meningkat, stabil

217
Jurnal Pelita Informatika, Volume 18, Nomor 2, April 2019
ISSN 2301-9425 (Media Cetak)
Hal: 212-219

dan dan menurun, pada node 1 diatas atribut sedang dan Entropy(Hasil panen Ton Okt'15-Maret'16 50-100)
turun sudah memiliki keputusan stabil dan 2
= (- 2*log2(2))
2

menurun,sehinga tidak perlu dijelaskan lagi.


= (-1 * Log2 1)
Berikut merupakan Hasil perhitungan untuk node 1
= -0.3010
dengan menggunakan persamaan (3.2) dan persamaan
Entropy(Hasil panen/ Ton Okt'15-Maret'16 >100)
(3.3) terlihat pada Tabel 8. 6 6 5 5
Tabel 8. Perhitungan node 1 = (- 11*log2(11))+( - 11*log2(11))
= (-0.5455 * Log2 0.5455)+(-0.4545* log2 0.4545)
= -0.0896 + -0.0622
=-0.1518
Entropy(Hasil panen /Ton April-Sept'16 <50)
1 1
= (- 1*log2(1))
= (-1 * Log2 1)
= -0.0030+ -0.1475 +-0.0120
=-0.3010
Entropy(Hasil panen /Ton April-Sept'16 50-100)
2 2
= (- 2*log2(2))
= (-1 * Log2 1)
= -0.3010
Entropy(Hasil panen/ Ton April-Sept'16 >100)
6 6 5 5
= (- 11*log2(11))+( - 11*log2(11))
= (-0.5455 * Log2 0.5455)+(-0.4545* log2 0.4545)
= -0.0896 + -0.0622
=-0.1518
Entropy(hama tidak)
6 6 7 7 1 1
= (- 14*log2(14))+( - 14*log2(14)) +( - 14*log2(14))
= (-0.4286 * Log2 0.4286) +(-0.5* log2 0.5) +(-
0.0714*Log2 0.0714)
= -0.0553 + -0.0753 + -0.0215
=-0.1501
Menghitung nilai gain dari atribut, nilai gain pada atribut
Entropy(total node 1)
6 6 7 7 1 1 condition dihitung dengan persamaan (3.3) sebagai
= (- 14*log2(14))+( - 14*log2(14)) +( - 14*log2(14)) berikut.
= (-0.4286 * Log2 0.4286) +(-0.5* log2 0.5) +(- Gain(Total Nilai sasaran panen)
0.0714*Log2 0.0714) 12 2
= -0.1501– ((14 x-0.1379) + (14 x -0.1506)
= -0.0553 + -0.0753 + -0.0215
= -0.2431 – (- 0.1181) +(-0.0215)
=-0.1501
= -0.1035
Entropy(sasaran panen<50)
4 4 7 7 1 1 Gain(Total Nilai Hasil Panen Priode Okt'15-Maret'16)
= (- 12*log2(12))+( - 12*log2(12)) +( - 12*log2(12)) 1 2 11
= -0.1501– ((14 x-0.3010) + (14 x -0.3010) + (14 x -
= (-0.3333 * Log2 0.3333) + (-0.5833* log2 0.5833) +(-
0.1518)
0.0833*Log2 0.0833)
= -0.1501– (- 0.0214) +(-0.0430) +(-0.1193)
= -0.0334 + -0.1024 + -0.0021
= -0.291
=-0.1379
Gain(Total Nilai Hasil Panen Priode April-Sept'16)
Entropy(sasaran panen 50-100) 1 2 11
1 1 1 1 = -0.1501– ((14 x-0.3010) + (14 x -0.3010) + (14 x -
= (- 2*log2(2)) +(- 2*log2(2))
0.1518)
= (-0.5 * Log2 0.5) +(-0.5 * Log2 0.5)
= -0.1501– (- 0.0214) +(-0.0430) +(-0.1193)
= -0.0753 +-0.0753
= -0.291
=-0.1506
Gain(Total Nilai hama)
Entropy(Hasil panen Ton Okt'15-Maret'16 <50) 32
1 1 = -0.2431 – ((32 x-0.2431)
= (- 1*log2(1))
= -0.2431 – (-0.2431)
= (-1 * Log2 1)
=0
= -0.0030+ -0.1475 +-0.0120
=-0.3010

218
Jurnal Pelita Informatika, Volume 18, Nomor 2, April 2019
ISSN 2301-9425 (Media Cetak)
Hal: 212-219

Dari hasil Tabel dapat diketahui bahwa atribut dengan REFERENCES


gain tertinggi adalah hasil panen yaitu sebesar 0.291
dengan demikian, Nilai total hasil panen menjadi Node [1] Edi Wijaya, Analisis Penggunaan Algoritma Breadth First
Search Dalam Konsep Artificial Intellegencia , 2013, Vol. II No
akar. Ada tiga atribut atribut pada Nilai Akhir, yaitu <50, 2 : 18-26,
50-100 dan >50. Dari tiga nilai atribut tersebut, ketiga [2] Kusrini, luthfi taufiq Emha, Algoritma Data Mining, 2009,
atribut tersebut sudah mengklasifikasikan menjadi satu, Penerbit Andi, Yogyakarta.
yaitu meningkat [3] Larose D, T., Data Mining Methods and Models, 2006, Jhon
Wiley & Sons, Inc. Hoboken New Jersey
Dari hasil tersebut dapat digambarkan Pohon [4] Poerwadarminta, W.J.S., Kamus Besar Bahasa Indonesia. 1991,
Keputusan semestaranya tampak pada gambar berikut: Jakarta: P.N Balai Pustaka
[5] Prabowo Pudjo Widodo, Herlawati. Menggunakan UML.
CURAH
HUJAN 2011.Informatika.Bandung wo
[6] Julsam,Handryawan Adnan
Tinggi
sedang
Mooduto,Alexyusandri,Penambangan Data Format Text Excel
turun
dengan Software Tanagra.Elektron Vol.1 No.1,Edisi :juni
Hasil panen Stabil Menurun
2009.ISSN:2085-6989
[7] Adi Kusrianto, Memanfaatkan Formula dan Fungsi Microsoft
excel 2007, 2007, Jakarta: PT. Elex Media Komputindo
>100 50-100 <100

Menigkat Stabil Menurun

Gambar 2. Pohon keputusan hasil perhitungan node 1.1

IV. Kesimpulan
Dari hasil penelitian yang penulis lakukan pada
DINAS TANAMAN PANGAN dan HOLTIKUTURA
PROVINSI SUMUT, maka penulis mengambil
kesimpulan penentuan untuk memprediksi hasil panen
padi menggunakan metode data mining khususnya
algoritma C4.5 akan bermanfaat sekali dalam
memprediksi data tanaman pangan pada DINAS
TANAMAN PANGAN dan HOLTIKUTURA
PROVINSI SUMUT. Maka dapat disimpulkan bahwa:
1. Dengan algoritma C4.5 dan pengujian dengan
Tanagra menghasilkan pola kombinasi itemsets dan
rules sehingga ilmu pengetahuan dan informasi
penting dari data prediksi dapat mempengaruhi di
Dinas Tanaman Pangan dan Holtikutura Provinsi
Sumut .
2. Proses untuk menghasilkan kombinasi item
menggunakan algoritma C4.5 dilakukan dengan
menetapkan nilai Entropy dan nilai Gain. Untuk
pembentukan pohon keputusan.
3. Pengujian yang telah dilakukan dapat disimpulkan
bahwa data mining classification dengan
menggunakan metode pohon keputusan algoritma
C4.5 untuk membentuk pohon keputusan dalam
memprediksi hasil panen padi dapat diterapkan
menggunakan tanagra dan mendapatkan hasil yang
maksimal.

219

Anda mungkin juga menyukai