364 709 1 SM PDF

Volume 7 No.
1
Januari 2015
ISSN : 2085 – 1669
e-ISSN : 2460 – 0288
Website : jurnal.ftumj.ac.id/index.php/jurtek
Email : jurnalteknologi@ftumj.ac.id
U N I V E R S I T A S M U H A M M A D I Y A H J A K A R T A
PENERAPAN DATA MINING DENGAN METODE KALSIFIKASI

MENGGUNAKAN DECISION TREE DAN REGRESI
Popy Meilina1,*
1
Jurusan Teknik Informatika, Fakultas Teknik, Universitas Muhammadiyah Jakarta
Jl. Cempaka Putih Tengah 27 Jakarta 10510
*E-mail: popy.meilina@gmail.com
Diterima: 31 Agustus 2014 Direvisi: 23 September 2014 Disetujui: 11 Nopember 2014
ABSTRAK
Konversi Bahan Bakar Minyak (BBM) ke Bahan Bakar Gas (BBG) yang dilakukan pemerintah bermula atas
melimpahnya gas di bumi Indonesia. kabupaten Cilacap melakukan survey terhadap masyarakat untuk
menentukan masyarakat mana yang lebih diprioritaskan untuk mendapatkan bantuan pemberian kompor gas
beserta tabungnya. Berdasarkan survey pada tahun 2010 di Kabupaten Cilacap Kecamatan Kroya terdapat 17
kelurahan dengan 28.131 data dengan 31 field atau kolom. Data diolah dengan beberapa tahapan yaitu :
pengecekan data, integrasi data, target data, preprocessing, visualisasi, proses data mining, dan pengetahuan.
Pada proses data mining dilakukan proses decision tree, regresi, dan k means untuk clustering yang ditampilkan
dalam bentuk scatter plot. Berdasarkan decision tree maka diperoleh data kelurahan yang menjadi prioritas
untuk diberi bantuan yaitu : Kelurahan Bajing Kulon, Kedawung, Pekuncen, dan Pesanggarahan. Atribut yang
digunakan untuk proses regresi yaitu per kelurahan dengan variabel x yaitu pendidikan atau pekerjaan dan
variabel y yaitu penghasilan.
Kata kunci: data mining, decision tree, regresi
ABSTRACK
A conversion from oil fuel to gas fuel that done by Indonesian Government are based on the overwhelming gas
in Indonesia. Cilacap District has done a survey to people that live there in order to determine which people that
would be consider to be prioritized to get subsidiary gas stove and gas tube. Based on survey in 2010 at Kroya
an administrative area on Cilacap District, that have 17 villages with 28.131 data and 13 field aply. Data was
processed with several stages, which is: data checking, data integration, data target, preprocessing, visualize
and data mining process. In data mining process, there were comparison of three methods that are Decision
Tree, Regression, and K-Means Clustering which visualize in a form of Scatter Plot. Results with decision tree
method gain that subsidiary priorities are following villages; Bajing Kulon, Kedawung, Pekuncen and
Pesanggrahan. While on Regression method using education and job status for x variable and income for y
variable.
Keywords : data mining, decision tree, regression
PENDAHULUAN kekayaan ini. Masyarakat masih memandang

Bahan Bakar Minyak (BBM) sebagai energi
Indonesia dengan kekayaan gas alam yang utama dalam kegiatan sehari-harinya.
yang sangat besar, seharusnya pengadaan Jumlah subsidi untuk BBM yang
enegi gas dapat dimaksimalkan untuk sangat besar, dan kondisi Indonesia yang sudah
memenuhi kebutuhan dalam negeri. Namun menjadi net importir minyak menjadi beberapa
masyarakat masih sedikit yang memanfaatkan alasan bagi Indonesia untuk segera melakukan
Jurnal Teknologi Volume 7 No. 1 Januari 2015 ISSN : 2085 – 1669
Website : jurnal.ftumj.ac.id/index.php/jurtek e-ISSN : 2460 – 0288
program konversi BBM ke Bahan Bakar Gas membentuk pohon yang berakar, semua node
(BBG). memiliki satu masukan. Node yang keluar
Diawali dengan keinginan pemerintah disebut node tes. Node yang lain disebut node
untuk mengkonversi Bahan Bakar Minyak keputusan atau sering disebut node daun.
(BBM) ke Bahan Bakar Gas (BBG), sehingga Setiap simpul internal membagi dua atau lebih
BUMN (Badan Usaha Milik Negara) sub-ruang sesuai dengan kategori attribut dan
khususnya di kabupaten Cilacap pada tahun akan dipartisi sesuai dengan nilai kategori
2009 berusaha untuk memaksimalkan kasus. Kasus-kasus tersebut membentuk pohon
keinginan pemerintah yang kemudian akan keputusan yang menghasilkan problem
memberikan secara cuma-cuma kompor gas solving.
dan tabung gas untuk golongan yang tidak Klasifikasi data mining adalah
mampu, dan kemudian BUMN pun melakukan penempatan objek-objek ke salah satu dari
survey secara menyeluruh untuk mendapatkan beberapa kategori yang telah ditetapkan
data yang valid kelompok masyarakat mana sebelumnya. Klasifiksi banyak digunakan
yang diprioritaskan pertama untuk untuk memprediksi kelas pada suatu label
mendapatkan bantuan tersebut. tertentu, yaitu dengan mengklasifikasi data
Berdasarkan data survey yang (membangun model) berdasarkan training set
dilakukan BUMN Peneliti bermaksud dan nilai-nilai (label kelas) dalam
menggunakannya untuk mendapatkan mengklasifikasikan atribut tertentu dan
pengetahuan sehingga bisa dimanfaatkan oleh menggunakannya dalam mengklasifikasikan
berbagai pihak untuk kepentingan tertentu data yang baru. Pohon keputusan biasanya
khususnya dalam hal ini pemerintah terkait. digunakan untuk mendapatkan informasi untuk
Analisa yang dilakukan menggunakan Data tujuan pengambilan sebuah keputusan. Pohon
Mining berdasarkan dari karakteristik data keputusan dimulai dengan sebuah root node
yang diperoleh seperti Pekerjaan, Pendidikan, (titik awal) yang digunakan oleh user untuk
Penghasilan dan atau Pengeluaran sehingga mengambil tindakan. Berdasarkan node root
hasil yang didapat diharapkan lebih tepat ini, user memecahkan leaf node sesuai dengan
sasaran. algoritma decision tree. Regresi linier adalah
Data Mining (Penambangan data) metode statistika yang digunakan untuk
merupakan bidang ilmu multidisplin, membentuk model hubungan antara variabel
menggambarkan area-area kerja yang termasuk terikat (dependen) dengan satu atau lebih
didalamnya adalah teknologi basis data, variabel bebas (independen). Apabila
pembelajaran mesin, statistik, pengenalan pola, banyaknya variabel bebas hanya ada satu,
pengambilan informasi, jaringan saraf tiruan, disebut sebagai regresi linier sederhana,
sistem berbasis pengetahuan, kecerdasan sedangkan apabila terdapat lebih dari 1
buatan, komputasi kinerja-tinggi, dan variabel bebas, disebut sebagai regresi linier
visualisasi data [Han & Kamber, 2006]. berganda [Xin Yan dan Xiao Gang Su, 2009).
Ada banyak metodologi Data Mining, Berikut di bawah ini adalah tampilan
salah satu yang populer adalah Pohon data yang Peneliti gunakan.
Keputusan (Decision Tree). Pohon keputusan
merupakan salah satu metode klasifikasi yang
sangat menarik yang melibatkan konstruksi
pohon keputusan yang terdiri dari node
keputusan yang di hubungkan dengan cabang-
cabang dari simpul akar sampai ke node daun
(akhir). Pada node keputusan attribut akan
diuji, dan setiap hasil akan menghasilkan
cabang. Setiap cabang akan diarahkan ke node
lain atau ke node akhir untuk menghasilkan
suatu keputusan (Larose, 2005).
Menurut Maimon (2005), pohon
keputusan adalah salah satu metode klasifikasi
yang dinyatakan sebagai partisi rekursif.
Pohon keputusan terdiri dari node yang
12
Poppy Meilina : Penerapan Data Mining Dengan Metode Kalsifikasi Menggunakan Decision Tree Dan Regresi
Jurnal Teknologi 7 (1) pp 11 – 20 © 2015
Gambar 1. Tampilan sumber data (data mentah) pendidikan, pekerjaan, pengeluaran, jumlah
hasil survey Pihak BUMN pada Kabupaten Cilacap keluarga, masak, liter, dan lain-lain. Data yang
Kecamatan Kroya ada yaitu 28.131 survey data dengan 31 field
Seperti terlihat pada gambar 1 terdapat atau kolom.
beberapa field yang dijadikan pedoman bagi Dibawah ini adalah field-field yang
pihak BUMN yaitu: Kategori, kabupaten, diambil dari data kependudukan Kecamatan
kecamatan, kelurahan, dusun, rt, rw, nama, no Kroya yang ada pada data MS. Excell.
id, no ktp, no kk, alamat, no sk, jenis kelamin,
Tabel 1 Tabel Data Penduduk

Atribut Keterangan
Kategori Didalamnya mencakup data yang terdiri dari : Rumah
Tangga tetap, Usaha Kecil Menengah (UKM), Rumah
Tangga Musiman
Kelurahan Mencakup 17 macam Kelurahan yang ada pada
Kecamatan Kroya
Jenis Kelamin Merupakan jenis kelamin penduduk yang bersangkutan
Pendidikan Merupakan jenjang pendidikan akhir yang diselesaikan
oleh penduduk yang bersangkutan
Pekerjaan Jenis pekerjaan yang dilakoni oleh setiap penduduknya
Pengeluaran Seberapa banyak pengeluaran yang dikeluarkan oleh
setiap keluarga perbulannya
Jumlah keluarga Banyaknya jumlah anggota setiap keluarga
Masak Dengan menggunakan apa setiap penduduknya memasak
Liter Jumlah liter yang dihabiskan oleh penduduknya jika
memasak dengan menggunakan kompor minyak
Rupiah Jumlah pengeluaran untuk minyak tanah yang harus
dibeli oleh penduduk yang memasak dengan
menggunakan kompor minyak.
METODE - Noisy : berisi kesalahan atau nilai-nilai

Sumber data untuk penelitian merupakan outlier yang menyimpang yang tidak
data hasil survey yang dilakukan oleh sesuai dengan data yang lainnya
BUMN Kabupaten Cilacap Kecamatan Kroya - Inconsisten : ketidakcocokan dalam
pada tahun 2009. Data yang digunakan dalam penggunaan kode atau nama. Disini
penelitian ini sebanyak 28.131 data pada kualitas data yang baik didasarkan oleh
Kecamatan Kroya yang terdiri dari 17 keputusan yang baik dan data warehouse
kelurahan. Langkah-langkah yang digunakan memerlukan integrasi kualitas data yang
dalam penelitian ini adalah sebagai berikut : konsisten.
Pada tahap ini proses Pembersihan data
1. Pengecekan Data (Proses Pembersihan menggunakan dua tools yaitu, Microsoft
Data) Excell dan Orange.
Dalam Penelitian kali ini dicari hubungan
beberapa atribut dari data yang ada. Karena 2. Proses Pengintegrasian Data
tidak semua tabel yang digunakan maka perlu Integrasi data merupakan penggabungan
dilakukan pembersihan data yang akan diolah data dari berbagai database ke
benar-benar relevan dengan yang dalamsatu database baru. Disini proses
dibutuhkan. mengapa data perlu di bersihkan mengubah data atau konversi data dalam
sebelum diproses ? Hal ini terjadi karena bentuk numerik. Sama seperti tahap
biasanya data yang akan digunakan belum sebelumnya, pada tahap ini proses
baik, penyebabnya antara lain : pengintegrasian data menggunakan dua tools
- Incomplete : kekurangan nilai-nilai pada yang saling mendukung satu sama lain, yaitu
atribut atau atribut tertentu lainnya. Microsoft Excell dan Orange.
13
7. Pengetahuan
3. Target Data Diharapkan setelah melalui setiap tahapan
Tahap ini merupakan penjelasan maka akan dihasilkan sebuah pengetahuan
mengenai data yang siap digunakan dalam yang dapat dimanfaatkan untuk kepentingan
proses data mining, dimana target data menjadi pemerintah dan masyarakat.
input untuk proses-proses selanjutnya.
Mulai
4. Preprocess
Sebelum diproses data mining sering kali
Sumber Data
diperlukan preprocessing. Datapreprocessing
menerangkan tipe-tipe proses yang
melaksanakan data mentah untuk Cek Data
Cleaning
mempersiapkan proses prosedur yang lainnya. (Cleaning)
Tujuannya preprocessing dalam data mining

adalah mentransformasi data ke suatu format
yang prosesnya lebih mudah dan efektif untuk Pengintegrasian
Integrasi Data
Data
kebutuhan pemakai, dengan indikator sebagai
berikut :
 Mendapatkan hasil yang lebih akurat Proses Pemilihan
 Pengurangan waktu komputasi Data
untuk large scale problem

 Membuat nilai data menjadi lebih kecil Target Data
tanpa merubah informasi yang

dikandungnya.
 Terdapat beberapa metode yang Preprocess
digunakan untuk preprocessing seperti :

a. Sampling, menyeleksi subset Visualisasi Data
representatif dari populasi data yang
besar. Proses Data
b. Diskretisasi, Bagian dari data reduksi Mining
tetapi memiliki arti penting

tersendiri, terutama untuk data Pengetahuan
numerik.
c. Remove missing
d. Continuize
Selesai
e. Impute
f. Feature selection
Gambar 2. Metodologi Penelitian
5. Visualisasi
Tahap selanjutnya adalah visualisasi data, HASIL DAN PEMBAHASAN
yaitu melihat data dengan menggunakan Penelitian yang dilakukan melalui beberapa
penjabaran secara grafis seperti Histogram, proses yaitu :
distribution diagram, diagram titik atau  PreProcessing
penjabaran secara lokasi seperti mean, median, PreProcessing yang dilakukan yaitu proses
modus, kuartil dan persentil. pembersihan data mengalami tiga tahap
pembersihan yaitu: Incomplete, Noisy dan
6. Proses Data Mining Inconsisten. Berikut dibawah ini penjelasan
Tahap ini merupakan tahap pembentukan dan prosesnya.
decision tree, regresi, dan klasifikasi K-means. 1. Incomplete
Proses yang dilakukan pada decision tree Pada tahap ini, penulis membersihkan
menggunakan software orange dan proses data berdasarkan data yang tidak lengkap atau
untuk mencari regresi serta K-Means data yang tidak terisi. Kesimpulan dari tahap
menggunakan software matlab. ini adalah pembersihan data, dalam artian
14
bahwa jika attribute data tersebut kosong atau sama seperti pada langkah-langkah
tidak terdapat nilai didalamnya maka attribute sebelumnya.
data tersebut akan dihapus. Hal tersebut di atas
dikarenakan penulis tidak memiliki data Tabel 4. Transformasi data Kecamatan
pendukung untuk mengisi attribute data yang Data awal Konversi data numerik
kosong. Kroya 102
2. Noisy dan Inkonsistensi Data
Merupakan suatu data yang memiliki Disini penulis mengubah data kecamatan
kelainan, hal ini dikarenakan karena kesalahan Kroya menjadi bentuk numeric “102” untuk
operator dalam memasukkan data kedalam memudahkan dalam pengenalan pada 17
database, permasalahan pada pentransmisian kelurahan yang ada pada kecamatan tersebut.
data, keterbatasan teknologi, atau tidak yang akan ditampilkan pada tabel dibawah ini.
dilakukannya penyeragaman data, seperti data
wilayah, jenis kelamin, dan lain sebagainya. Tabel 5. Transformasi data Kelurahan
Proses pembersihan data ini Data awal Konversi
menggunakan suatu tools data mining yaitu Kecamatan data numerik
Orange. Ayamalas 10201
Pengubahan Data menjadi Numeric Bajing 10202
Pada langkah selanjutnya data yang sudah Bajing Kulon 10203
dibersihkan akan diubah value nya menjadi Buntu 10204
bentuk numeric, hal ini dimaksudkan agar Gentasari 10205
pengolahan data pada MatLab dapat lebih Karangmangu 10206
Karang Turi 10207
mudah dan cepat, karena MatLab hanya
Kedawung 10208
memproses data-data numeric. Kroya 10209
Mergawati 10210
 Kategori Mujur 10211
Pada attribute kategori data akan diubah Mujur Lor 10212
menjadi numeric dari 1-3, berikut dibawah ini Pekuncen 10213
tabel pengintegrasian data pada attribute Pesanggrahan 10214
kategori. Pucung Kidul 10215
Pucung Lor 10216
Tabel 2 Pengintegrasian data Kategori Sikampuh 10217
Data awal Konversi data
numeric  Pendidikan
Rumah Tangga 1.00 Pada attribute Pendidikan data akan diubah
Tetap menjadi numeric dari 1-5, berikut dibawah ini
UKM 2.00 tabel pengintegrasian data pada attribute
Rumah Tangga 3.00 Pendidikan.
Musiman
Tabel 6. Transformasi data Pendidikan
 Kabupaten Data awal Konversi data
Sama seperti halnya pada langkah pertama numerik
maka data atau attribute kabupaten Cilacap SD 1
akan diubah menjadi bentuk numeric. Seperti SLTP 2
terlihat pada tabel dibawah. SLTA 3
Universitas 4
Tabel 3. Transformasi data Kabupaten Lainnya 5
numeric
Cilacap 1  Pekerjaan
Pada attribute Pekerjaan data akan diubah
 Kecamatan menjadi numeric dari 1-3, berikut dibawah ini
Pengubahan pun berlanjut pada data atau tabel pengintegrasian data pada attribute
attribute Kecamatan, hal yang dilakukan pun Pekerjaan.
Tabel 7.Transformasi data Pekerjaan
15
Data awal Konversi data untuk menghasilkan pengetahuan.

numeric Pengetahuan yang hendak dihasilkan dalam
PETANI 1 klasifikasi adalah untuk menggolongkan
SWASTA 2 bagaimana ketentuan seorang warga
Lainnya 3 mendapatkan suatu bantuan, baik itu bantuan
PNS 4 secara materiil ataupun bantuan yang bersifat
TNI/POLRI 5 pelatihan agar warga tersebut dapat
meningkatkan kesejahteraan hidupnya. Pada
 Pengeluaran proses ini, Peneliti mengambil attribute
Pada attribute Pengeluaran data akan diubah kelurahan, pendidikan, pekerjaan dan
menjadi numeric dari 1-3, berikut dibawah ini pengeluaran untuk menentukan siapa warga
tabel pengintegrasian data pada attribute yang memiliki ketentuan tersebut diatas berhak
Pengeluaran. menerima bantuan. Berikut ini merupakan
tahapan awal sampai akhir proses klasifikasi
Tabel 8. Transformasi data Pengeluaran dengan decision tree dengan menggunakan
Data awal Konversi data Orange.
numeric 1. Input Data
500 Ribu 1 Langkah awal proses ini adalah
500 Ribu – 1 2
memasukan data yang telah dianalisa dan
Juta
1 Juta – 1,5 3
diproses dengan metode Cleansing
Juta (Pembersihan Data). Data tersebut merupakan
>1,5 juta 4 data valid yang dibutuhkan untuk proses
klasifikasi dengan menggunakan Orange.
 Masak Berikut dibawah ini adalah langkah-
Pada attribute Masak data akan diubah menjadi langkahnya.
numeric dari 1-3, berikut dibawah ini tabel a. Pilih Widget File pada tabulasi Data di
pengintegrasian data pada attribute Pekerjaan. Orange, seperti terlihat pada gambar
dibawah ini.
Tabel 9. Transformasi data Masak
numerik
Minyak Tanah 1
Kayu Bakar 2
Lainnya 3
Transformasi Data
Tahapan Transformasi data adalah pengubahan
format data tersimpan menjadi bentuk standar
format file yang sesuai dengan aplikasi yang
akan digunakan. Pada penelitian kali ini,
penulis menggunakan aplikasi MatLab untuk
melakukan proses data mining dengan Proses Gambar 3. Tampilan Widget File pada Orange
Aturan Prediksi menggunakan Regresi Linear,
aturan Klasifikasi menggunakan Decision Setelah Widget File berada pada kanvas,
Tree. Pengubahan atau Transformasi data ke maka selanjutnya.
dalam format file yang sesuai adalah
mengubah format file data sebelumnya yang b. klik dua kali pada widget File tersebut
merupakan bentuk file Tab Delimited yaitu untuk melihat propertiesnya dan memilih
Text atau .txt menjadi bentuk .dat. file data yang terdapat pada direktori
tersimpan, terlihat pada gambar dibawah
 Proses Data Mining ini.
Pada tahapan ini Peneliti mencoba
membuat proses aturan klasifikasi pada data
mining menggunakan decision tree. Algoritma
klasifikasi akan menggunakan data tersebut
16
Gambar 6. Tampilan Properties Widget Data

Gambar 4. Tampilan Properties Widget File Table pada Orange.
pada Orange
3. Proses Klasifikasi
2. Lihat Data Untuk melakukan Proses Klasifikasi pada
Untuk melihat data yang telah dipilih data yang ada, dapat dipilih widget
pada langkah pertama, dapat dilakukan dengan Classification Tree pada Tabulasi Classify dan
meletakkan widget Data Table di kanvas yang letakkan pada kanvas Orange seperti terlihat
terdapat pada tabulasi yang sama dengan pada gambar dibawah. Dan kemudian
widget File yaitu tabulasi Data. hubungkan dengan Widget File.
Gambar 5. Tampilan Widget Data Table pada

Orange. Gambar 7. Tampilan Widget Classification
Tree pada Orange.
Setelah Widget Data Table diletakkan 4. View Klasifikasi
pada kanvas maka hubungkanlah dengan Untuk melihat hasil yang didapatkan pada
widget File, hal ini dilakukan agar data yang langkah sebelumnya, bisa dilakukan view
dipilih pada langkah sebelumnya dapat terlihat dengan widget Classification Tree Viewer dan
pada widget Data Table. Seperti gambar letakkan di kanvas, kemudian hubungkan
dibawah ini. dengan widget Classification Tree
17
Output dengan menggunakan Classification

Tree graph dapat terlihat pada gambar dibawah
ini.
 Proses Aplikasi
Prediksi pada Klasifikasi dengan Rumus
Regresi linear untuk menentukan mana
kelurahan yang memiliki prioritas untuk
diberikan bantuan dari 17 kelurahan yang ada
di kecamatan kroya.
1. Membuka Aplikasi berbentuk *.fig pada
yang ditunjukkan lingkaran merah pada
gambar di bawah ini :
Gambar 8. Tampilan Widget Classification
Tree Viewer pada Orange.
Langkah selanjutnya adalah meng-klik

dua kali pada widget Classification Tree
Viewer tersebut untuk melihat output yang ada.
output tersebut ditampilkan pada gambar
dibawah ini.
Gambar 11. Tampilan awal MatLab dengan

lingkaran merah untuk membuka file Figure
yang telah dibuat.
2. Kemudian akan muncul tabel dialog seperti

di bawah, pilih Open Exiting GUI. Akan
Gambar 9. Tampilan Properties Widget tampil daftar file *.fig yang telah kita buat.
Classification Tree Viewer pada Orange. Pilih file TAela.fig.
5. View Pohon Klasifikasi / Decision Tree

Berikut ini adalah tampilan hasil yang
berbentuk suatu pohon klasifikasi dengan
menggunakan widget classification tree graph
yang dihubungkan dengan widget
classification tree yang ada di kanvas, seperti
terlihat di bawah ini.
Gambar 12. Tampilan dialogue box open file

figure
3. kemudian jalankan aplikasi dengan

mengklik icon Run Figure, seperti yang
ditampilkan pada gambar di bawah yang
ditunjukkan oleh likngkaran merah.
Gambar 10. Tampilan Properties Widget
Classification Tree Viewer pada Orange.
18
Gambar 16. Tampilan Dialogue Box Import

Wizard
Gambar 13. Tampilan Aplikasi data Mining
dengan lingkaran merah untuk menjalankan 7. Pilih file yang ingin di import, kemudian
Program klik finish.
4. Akan muncul table dialog deperti gambar

di bawah, kemudian klik Lihat Data
Gambar 17. Tampilan Dialogue Box Import

Gambar 14. Tampilan Aplikasi Data Mining Wizard
untuk melihat data
8. Untuk melakukan Proses Regresi terlebih
5. Pilihlah file yang berbentuk *.dat yang dahulu pilihlah variable x dan variable y
ingin diproses. Dan klik open. yang ingin diproses, untuk gambar di
bawah variable x yang dipilih adalah
pendidikan dan variable y adalah
pengeluaran, sehingga akan muncul
persamaan garis linear seperti yang
ditunjukkan oleh lingkaran merah di
bawah.
Gambar 15. Tampilan Dialogue Box Open File
6. Muncullah tabel dialog Import Wizard di

bawah ini, klik next.
Gambar 18. Tampilan Proses Regresi
19
9. Proses Clustering K-means yang hasil dari proses tersebut satu per satu
dilakukan yaitu menentukan secara Kelurahan yang ada di Kecamatan Kroya akan
random letak tiga buah k dan menentukan dibandingan secara keseluruhan. Hasil dari
anggota yang termasuk kedalamnya. Di regresi linear ini adalah mencari nilai dari
bawah ini adalah tampilan scatter diagram Variabel Y terkecil di kelurahan yang ada.
untuk k-means.
KESIMPULAN
Dapat disimpulkan bahwa dengan

menggunakan decision tree prioritas kelurahan
yang dapat diberi bantuan yaitu: Kelurahan
Bajing Kulon, Kedawung, Pekuncen, dan
Pesanggarahan.
Proses pada regresi berdasarkan per
kelurahan dengan atribut untuk variabel x
adalah pekerjaan atau pendidikan dan atribut
untuk variabel y adalah penghasilan.
Terlepas dari penjelasan pada
paragraph di atas, Peneliti sadari masih banyak
kekurangan dalam penelitian ini, hal ini
Gambar 19. Tampilan Scatter Diagram dikarenakan karena variable data yang terlalu
luas dan proses pembersihan data yang
Penarikan Informasi memakan waktu lama, sehingga pemilihan
Berdasarkan hasil yang didapat pada 3 langkah proses data mining dengan penggunaan
data mining diatas, maka dapat ditarik algoritma yang diterapkan mungkin memiliki
beberapa kesimpulan atau informasi yang kelemahan dalam keakuratan hasil data yang
dapat dijadikan pengetahuan untuk diambil ada, tetapi hasil yang didapatkan tidak
suatu keputusan, informasi tersebut dapat mengurangi keakuratan algoritma atau rumus
dijabarkan sebagai berikut. yang diterapkan.
1. Klasifikasi dengan Pohon
Keputusan/Decision Tree.
Berdasarkan proses software Orange DAFTAR PUSTAKA
dengan menggunakan widget Classification Han, Jiawei and Kamber, Micheline (2006),
Tree Viewer dan Classification Tree Graph Penambangan data: Concepts and
bahwa keputusan yang dapat diambil oleh Techniques. Elsevier
kepala kecamatan tentang kelurahan yang akan Xin Yan, & Xiao Gang Su, (2009), Linear
diberikan bantuan dengan skala prioritas Regression Analysis. London: World
adalah Kelurahan Bajing Kulon, Kedawung, Scientific Publishing Co. Pte. Ltd.,
Pekuncen, Pesanggarahan dan seterusnya. Covent Garden
Larose, & Daniel T. (2005). Discovering
2. Klasifikasi dengan Regresi Linear knowledge in data: an introduction to
Untuk mendapatkan informasi yang data mining, John Wiley and Sons, USA
dibutuhkan dalam pengambilan keputusan Lior Rokach, & Oded Maimon, (2005), Data
dengan menggunakan Regresi Linear maka Mining With Decision Tree. World
data yang ada yaitu data Pada Kecamatan Scientific Publishing Co. Pte. Ltd, Series
Kroya dengan 17 kelurahannya harus di pecah in Machine Perception Artificial
menjadi data per kelurahan saja. Data per Intelligence Volume 69
Kelurahan inilah nantinya akan dihitung
dengan regresi linear pada Aplikasi Data
Mining yang Peneliti rancang, yang kemudian
20

364 709 1 SM PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

364 709 1 SM PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Volume 7 No.

PENERAPAN DATA MINING DENGAN METODE KALSIFIKASI

Diterima: 31 Agustus 2014 Direvisi: 23 September 2014 Disetujui: 11 Nopember 2014

Kata kunci: data mining, decision tree, regresi

Keywords : data mining, decision tree, regression

PENDAHULUAN kekayaan ini. Masyarakat masih memandang

Tabel 1 Tabel Data Penduduk

METODE - Noisy : berisi kesalahan atau nilai-nilai

Tujuannya preprocessing dalam data mining

untuk large scale problem

tanpa merubah informasi yang

digunakan untuk preprocessing seperti :

tetapi memiliki arti penting

Data awal Konversi data untuk menghasilkan pengetahuan.

Gambar 6. Tampilan Properties Widget Data

Gambar 5. Tampilan Widget Data Table pada

Output dengan menggunakan Classification

Langkah selanjutnya adalah meng-klik

Gambar 11. Tampilan awal MatLab dengan

2. Kemudian akan muncul tabel dialog seperti

5. View Pohon Klasifikasi / Decision Tree

Gambar 12. Tampilan dialogue box open file

3. kemudian jalankan aplikasi dengan

Gambar 16. Tampilan Dialogue Box Import

4. Akan muncul table dialog deperti gambar

Gambar 17. Tampilan Dialogue Box Import

Gambar 15. Tampilan Dialogue Box Open File

6. Muncullah tabel dialog Import Wizard di

Gambar 18. Tampilan Proses Regresi

Dapat disimpulkan bahwa dengan

Anda mungkin juga menyukai