1
Januari 2015
ISSN : 2085 – 1669
e-ISSN : 2460 – 0288
Website : jurnal.ftumj.ac.id/index.php/jurtek
Email : jurnalteknologi@ftumj.ac.id
U N I V E R S I T A S M U H A M M A D I Y A H J A K A R T A
Popy Meilina1,*
1
Jurusan Teknik Informatika, Fakultas Teknik, Universitas Muhammadiyah Jakarta
Jl. Cempaka Putih Tengah 27 Jakarta 10510
*E-mail: popy.meilina@gmail.com
ABSTRAK
Konversi Bahan Bakar Minyak (BBM) ke Bahan Bakar Gas (BBG) yang dilakukan pemerintah bermula atas
melimpahnya gas di bumi Indonesia. kabupaten Cilacap melakukan survey terhadap masyarakat untuk
menentukan masyarakat mana yang lebih diprioritaskan untuk mendapatkan bantuan pemberian kompor gas
beserta tabungnya. Berdasarkan survey pada tahun 2010 di Kabupaten Cilacap Kecamatan Kroya terdapat 17
kelurahan dengan 28.131 data dengan 31 field atau kolom. Data diolah dengan beberapa tahapan yaitu :
pengecekan data, integrasi data, target data, preprocessing, visualisasi, proses data mining, dan pengetahuan.
Pada proses data mining dilakukan proses decision tree, regresi, dan k means untuk clustering yang ditampilkan
dalam bentuk scatter plot. Berdasarkan decision tree maka diperoleh data kelurahan yang menjadi prioritas
untuk diberi bantuan yaitu : Kelurahan Bajing Kulon, Kedawung, Pekuncen, dan Pesanggarahan. Atribut yang
digunakan untuk proses regresi yaitu per kelurahan dengan variabel x yaitu pendidikan atau pekerjaan dan
variabel y yaitu penghasilan.
ABSTRACK
A conversion from oil fuel to gas fuel that done by Indonesian Government are based on the overwhelming gas
in Indonesia. Cilacap District has done a survey to people that live there in order to determine which people that
would be consider to be prioritized to get subsidiary gas stove and gas tube. Based on survey in 2010 at Kroya
an administrative area on Cilacap District, that have 17 villages with 28.131 data and 13 field aply. Data was
processed with several stages, which is: data checking, data integration, data target, preprocessing, visualize
and data mining process. In data mining process, there were comparison of three methods that are Decision
Tree, Regression, and K-Means Clustering which visualize in a form of Scatter Plot. Results with decision tree
method gain that subsidiary priorities are following villages; Bajing Kulon, Kedawung, Pekuncen and
Pesanggrahan. While on Regression method using education and job status for x variable and income for y
variable.
program konversi BBM ke Bahan Bakar Gas membentuk pohon yang berakar, semua node
(BBG). memiliki satu masukan. Node yang keluar
Diawali dengan keinginan pemerintah disebut node tes. Node yang lain disebut node
untuk mengkonversi Bahan Bakar Minyak keputusan atau sering disebut node daun.
(BBM) ke Bahan Bakar Gas (BBG), sehingga Setiap simpul internal membagi dua atau lebih
BUMN (Badan Usaha Milik Negara) sub-ruang sesuai dengan kategori attribut dan
khususnya di kabupaten Cilacap pada tahun akan dipartisi sesuai dengan nilai kategori
2009 berusaha untuk memaksimalkan kasus. Kasus-kasus tersebut membentuk pohon
keinginan pemerintah yang kemudian akan keputusan yang menghasilkan problem
memberikan secara cuma-cuma kompor gas solving.
dan tabung gas untuk golongan yang tidak Klasifikasi data mining adalah
mampu, dan kemudian BUMN pun melakukan penempatan objek-objek ke salah satu dari
survey secara menyeluruh untuk mendapatkan beberapa kategori yang telah ditetapkan
data yang valid kelompok masyarakat mana sebelumnya. Klasifiksi banyak digunakan
yang diprioritaskan pertama untuk untuk memprediksi kelas pada suatu label
mendapatkan bantuan tersebut. tertentu, yaitu dengan mengklasifikasi data
Berdasarkan data survey yang (membangun model) berdasarkan training set
dilakukan BUMN Peneliti bermaksud dan nilai-nilai (label kelas) dalam
menggunakannya untuk mendapatkan mengklasifikasikan atribut tertentu dan
pengetahuan sehingga bisa dimanfaatkan oleh menggunakannya dalam mengklasifikasikan
berbagai pihak untuk kepentingan tertentu data yang baru. Pohon keputusan biasanya
khususnya dalam hal ini pemerintah terkait. digunakan untuk mendapatkan informasi untuk
Analisa yang dilakukan menggunakan Data tujuan pengambilan sebuah keputusan. Pohon
Mining berdasarkan dari karakteristik data keputusan dimulai dengan sebuah root node
yang diperoleh seperti Pekerjaan, Pendidikan, (titik awal) yang digunakan oleh user untuk
Penghasilan dan atau Pengeluaran sehingga mengambil tindakan. Berdasarkan node root
hasil yang didapat diharapkan lebih tepat ini, user memecahkan leaf node sesuai dengan
sasaran. algoritma decision tree. Regresi linier adalah
Data Mining (Penambangan data) metode statistika yang digunakan untuk
merupakan bidang ilmu multidisplin, membentuk model hubungan antara variabel
menggambarkan area-area kerja yang termasuk terikat (dependen) dengan satu atau lebih
didalamnya adalah teknologi basis data, variabel bebas (independen). Apabila
pembelajaran mesin, statistik, pengenalan pola, banyaknya variabel bebas hanya ada satu,
pengambilan informasi, jaringan saraf tiruan, disebut sebagai regresi linier sederhana,
sistem berbasis pengetahuan, kecerdasan sedangkan apabila terdapat lebih dari 1
buatan, komputasi kinerja-tinggi, dan variabel bebas, disebut sebagai regresi linier
visualisasi data [Han & Kamber, 2006]. berganda [Xin Yan dan Xiao Gang Su, 2009).
Ada banyak metodologi Data Mining, Berikut di bawah ini adalah tampilan
salah satu yang populer adalah Pohon data yang Peneliti gunakan.
Keputusan (Decision Tree). Pohon keputusan
merupakan salah satu metode klasifikasi yang
sangat menarik yang melibatkan konstruksi
pohon keputusan yang terdiri dari node
keputusan yang di hubungkan dengan cabang-
cabang dari simpul akar sampai ke node daun
(akhir). Pada node keputusan attribut akan
diuji, dan setiap hasil akan menghasilkan
cabang. Setiap cabang akan diarahkan ke node
lain atau ke node akhir untuk menghasilkan
suatu keputusan (Larose, 2005).
Menurut Maimon (2005), pohon
keputusan adalah salah satu metode klasifikasi
yang dinyatakan sebagai partisi rekursif.
Pohon keputusan terdiri dari node yang
12
Poppy Meilina : Penerapan Data Mining Dengan Metode Kalsifikasi Menggunakan Decision Tree Dan Regresi
Jurnal Teknologi 7 (1) pp 11 – 20 © 2015
Gambar 1. Tampilan sumber data (data mentah) pendidikan, pekerjaan, pengeluaran, jumlah
hasil survey Pihak BUMN pada Kabupaten Cilacap keluarga, masak, liter, dan lain-lain. Data yang
Kecamatan Kroya ada yaitu 28.131 survey data dengan 31 field
Seperti terlihat pada gambar 1 terdapat atau kolom.
beberapa field yang dijadikan pedoman bagi Dibawah ini adalah field-field yang
pihak BUMN yaitu: Kategori, kabupaten, diambil dari data kependudukan Kecamatan
kecamatan, kelurahan, dusun, rt, rw, nama, no Kroya yang ada pada data MS. Excell.
id, no ktp, no kk, alamat, no sk, jenis kelamin,
13
Jurnal Teknologi Volume 7 No. 1 Januari 2015 ISSN : 2085 – 1669
Website : jurnal.ftumj.ac.id/index.php/jurtek e-ISSN : 2460 – 0288
7. Pengetahuan
3. Target Data Diharapkan setelah melalui setiap tahapan
Tahap ini merupakan penjelasan maka akan dihasilkan sebuah pengetahuan
mengenai data yang siap digunakan dalam yang dapat dimanfaatkan untuk kepentingan
proses data mining, dimana target data menjadi pemerintah dan masyarakat.
input untuk proses-proses selanjutnya.
Mulai
4. Preprocess
Sebelum diproses data mining sering kali
Sumber Data
diperlukan preprocessing. Datapreprocessing
menerangkan tipe-tipe proses yang
melaksanakan data mentah untuk Cek Data
Cleaning
mempersiapkan proses prosedur yang lainnya. (Cleaning)
numerik.
c. Remove missing
d. Continuize
Selesai
e. Impute
f. Feature selection
Gambar 2. Metodologi Penelitian
5. Visualisasi
Tahap selanjutnya adalah visualisasi data, HASIL DAN PEMBAHASAN
yaitu melihat data dengan menggunakan Penelitian yang dilakukan melalui beberapa
penjabaran secara grafis seperti Histogram, proses yaitu :
distribution diagram, diagram titik atau PreProcessing
penjabaran secara lokasi seperti mean, median, PreProcessing yang dilakukan yaitu proses
modus, kuartil dan persentil. pembersihan data mengalami tiga tahap
pembersihan yaitu: Incomplete, Noisy dan
6. Proses Data Mining Inconsisten. Berikut dibawah ini penjelasan
Tahap ini merupakan tahap pembentukan dan prosesnya.
decision tree, regresi, dan klasifikasi K-means. 1. Incomplete
Proses yang dilakukan pada decision tree Pada tahap ini, penulis membersihkan
menggunakan software orange dan proses data berdasarkan data yang tidak lengkap atau
untuk mencari regresi serta K-Means data yang tidak terisi. Kesimpulan dari tahap
menggunakan software matlab. ini adalah pembersihan data, dalam artian
14
Poppy Meilina : Penerapan Data Mining Dengan Metode Kalsifikasi Menggunakan Decision Tree Dan Regresi
Jurnal Teknologi 7 (1) pp 11 – 20 © 2015
bahwa jika attribute data tersebut kosong atau sama seperti pada langkah-langkah
tidak terdapat nilai didalamnya maka attribute sebelumnya.
data tersebut akan dihapus. Hal tersebut di atas
dikarenakan penulis tidak memiliki data Tabel 4. Transformasi data Kecamatan
pendukung untuk mengisi attribute data yang Data awal Konversi data numerik
kosong. Kroya 102
2. Noisy dan Inkonsistensi Data
Merupakan suatu data yang memiliki Disini penulis mengubah data kecamatan
kelainan, hal ini dikarenakan karena kesalahan Kroya menjadi bentuk numeric “102” untuk
operator dalam memasukkan data kedalam memudahkan dalam pengenalan pada 17
database, permasalahan pada pentransmisian kelurahan yang ada pada kecamatan tersebut.
data, keterbatasan teknologi, atau tidak yang akan ditampilkan pada tabel dibawah ini.
dilakukannya penyeragaman data, seperti data
wilayah, jenis kelamin, dan lain sebagainya. Tabel 5. Transformasi data Kelurahan
Proses pembersihan data ini Data awal Konversi
menggunakan suatu tools data mining yaitu Kecamatan data numerik
Orange. Ayamalas 10201
Pengubahan Data menjadi Numeric Bajing 10202
Pada langkah selanjutnya data yang sudah Bajing Kulon 10203
dibersihkan akan diubah value nya menjadi Buntu 10204
bentuk numeric, hal ini dimaksudkan agar Gentasari 10205
pengolahan data pada MatLab dapat lebih Karangmangu 10206
Karang Turi 10207
mudah dan cepat, karena MatLab hanya
Kedawung 10208
memproses data-data numeric. Kroya 10209
Mergawati 10210
Kategori Mujur 10211
Pada attribute kategori data akan diubah Mujur Lor 10212
menjadi numeric dari 1-3, berikut dibawah ini Pekuncen 10213
tabel pengintegrasian data pada attribute Pesanggrahan 10214
kategori. Pucung Kidul 10215
Pucung Lor 10216
Tabel 2 Pengintegrasian data Kategori Sikampuh 10217
Data awal Konversi data
numeric Pendidikan
Rumah Tangga 1.00 Pada attribute Pendidikan data akan diubah
Tetap menjadi numeric dari 1-5, berikut dibawah ini
UKM 2.00 tabel pengintegrasian data pada attribute
Rumah Tangga 3.00 Pendidikan.
Musiman
Tabel 6. Transformasi data Pendidikan
Kabupaten Data awal Konversi data
Sama seperti halnya pada langkah pertama numerik
maka data atau attribute kabupaten Cilacap SD 1
akan diubah menjadi bentuk numeric. Seperti SLTP 2
terlihat pada tabel dibawah. SLTA 3
Universitas 4
Tabel 3. Transformasi data Kabupaten Lainnya 5
Data awal Konversi data
numeric
Cilacap 1 Pekerjaan
Pada attribute Pekerjaan data akan diubah
Kecamatan menjadi numeric dari 1-3, berikut dibawah ini
Pengubahan pun berlanjut pada data atau tabel pengintegrasian data pada attribute
attribute Kecamatan, hal yang dilakukan pun Pekerjaan.
Tabel 7.Transformasi data Pekerjaan
15
Jurnal Teknologi Volume 7 No. 1 Januari 2015 ISSN : 2085 – 1669
Website : jurnal.ftumj.ac.id/index.php/jurtek e-ISSN : 2460 – 0288
Transformasi Data
Tahapan Transformasi data adalah pengubahan
format data tersimpan menjadi bentuk standar
format file yang sesuai dengan aplikasi yang
akan digunakan. Pada penelitian kali ini,
penulis menggunakan aplikasi MatLab untuk
melakukan proses data mining dengan Proses Gambar 3. Tampilan Widget File pada Orange
Aturan Prediksi menggunakan Regresi Linear,
aturan Klasifikasi menggunakan Decision Setelah Widget File berada pada kanvas,
Tree. Pengubahan atau Transformasi data ke maka selanjutnya.
dalam format file yang sesuai adalah
mengubah format file data sebelumnya yang b. klik dua kali pada widget File tersebut
merupakan bentuk file Tab Delimited yaitu untuk melihat propertiesnya dan memilih
Text atau .txt menjadi bentuk .dat. file data yang terdapat pada direktori
tersimpan, terlihat pada gambar dibawah
Proses Data Mining ini.
Pada tahapan ini Peneliti mencoba
membuat proses aturan klasifikasi pada data
mining menggunakan decision tree. Algoritma
klasifikasi akan menggunakan data tersebut
16
Poppy Meilina : Penerapan Data Mining Dengan Metode Kalsifikasi Menggunakan Decision Tree Dan Regresi
Jurnal Teknologi 7 (1) pp 11 – 20 © 2015
17
Jurnal Teknologi Volume 7 No. 1 Januari 2015 ISSN : 2085 – 1669
Website : jurnal.ftumj.ac.id/index.php/jurtek e-ISSN : 2460 – 0288
Proses Aplikasi
Prediksi pada Klasifikasi dengan Rumus
Regresi linear untuk menentukan mana
kelurahan yang memiliki prioritas untuk
diberikan bantuan dari 17 kelurahan yang ada
di kecamatan kroya.
1. Membuka Aplikasi berbentuk *.fig pada
yang ditunjukkan lingkaran merah pada
gambar di bawah ini :
Gambar 8. Tampilan Widget Classification
Tree Viewer pada Orange.
18
Poppy Meilina : Penerapan Data Mining Dengan Metode Kalsifikasi Menggunakan Decision Tree Dan Regresi
Jurnal Teknologi 7 (1) pp 11 – 20 © 2015
19
Jurnal Teknologi Volume 7 No. 1 Januari 2015 ISSN : 2085 – 1669
Website : jurnal.ftumj.ac.id/index.php/jurtek e-ISSN : 2460 – 0288
9. Proses Clustering K-means yang hasil dari proses tersebut satu per satu
dilakukan yaitu menentukan secara Kelurahan yang ada di Kecamatan Kroya akan
random letak tiga buah k dan menentukan dibandingan secara keseluruhan. Hasil dari
anggota yang termasuk kedalamnya. Di regresi linear ini adalah mencari nilai dari
bawah ini adalah tampilan scatter diagram Variabel Y terkecil di kelurahan yang ada.
untuk k-means.
KESIMPULAN
20