SKRIPSI
Oleh :
MIKAEL ADITYA WAHYU KRISNA MURTI
125314047
i
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
A THESIS
By :
MIKAEL ADITYA WAHYU KRISNA MURTI
125314047
i
PLAGIAT MERUPAKAN TINDAKAN TIDAK
HALAMAN
PERSETUJUAN SKRIPSI
Oleh :
Telah disetujui
HALAMAN PENGESAHAN
SKRIPSI
………………
Anggota : Dr. Cyprianus Kuntoro Adi, S.J. M.A.,M.Sc.
………………
Yogyakarta, 2 Februari
2017 Fakultas Sains dan
Teknologi Universitas
Sanata Dharma Dekan,
PLAGIAT MERUPAKAN TINDAKAN TIDAK
MOTTO
“Warisan cita-cita, takdir waktu, dan impian manusia adalah hal yang tidak akan
pernah berakhir. Selama manusia terus mencari arti kebebasannya, hal ini tidak
akan pernah bisa dicegah!” – Gold D Roger
“Orang lemah tidak bisa memilih cara mereka untuk mati!” – Trafalgar D.Watel
Law
“Hidup tak harus menyenangkan” – Sakata Gintoki
v
PLAGIAT MERUPAKAN TINDAKAN TIDAK
PERNYATAAN KEASLIAN
KARYA
Yogyakart
a, Penulis
Yang menyatakan,
ABSTRAK
v
PLAGIAT MERUPAKAN TINDAKAN TIDAK
ABSTRACT
i
PLAGIAT MERUPAKAN TINDAKAN TIDAK
KATA PENGANTAR
Puji dan syukur kepada Tuhan Yang Maha Esa atas segala berkat dan
karunia-Nya, sehingga penulis dapat menyelesaikan tugas akhir yang berjudul "
Penerapan Metode K-Means Clustering Untuk Memetakan Potensi Produksi Buah
- buahan di Provinsi Daerah Istimewa Yogyakarta ". Tugas akhir ini merupakan
salah satu mata kuliah wajib dan sebagai syarat akademik untuk memperoleh gelar
sarjana komputer Program Studi Teknik Informatika Universitas Sanata Dharma
Yogyakarta.
Penulis menyadari bahwa selama proses penelitian dan penyusunan
laporan tugas akhir ini, banyak pihak yang telah membantu penulis, sehingga pada
kesempatan ini penulis ingin mengucapkan terima kasih antara lain kepada :
1. Tuhan Yang Maha Esa, yang telah memberikan pertolongan dan
kekuatan dalam proses pembuatan tugas akhir.
2. Bapak Dr. Cyprianus Kuntoro Adi, S.J. M.A.,M.Sc. selaku dosen
pembimbing tugas akhir, atas kesabarannya dan nasehat dalam
membimbing penulis, meluangkan waktunya, memberi dukungan,
motivasi, serta saran yang sangat membantu penulis.
3. Sudi Mungkasi, S.Si., M.Math.Sc., Ph.D. selaku Dekan Fakultas Sains
dan Teknologi, atas bimbingan, kritik dan saran yang telah diberikan
kepada penulis.
4. Dr. Anastasia Rita Widiarti, M.Kom. selaku Ketua Program Studi Teknik
Informatika atas bimbingan, kritik, dan saran yang telah diberikan
kepada penulis.
5. Iwan Binanto M.Cs. selaku dosen pembimbing akademik.
6. Keluarga tercinta, kedua orang tua Modestus Adi Sulistyana dan
Anastasia Endang Murtiasih, serta kakak saya Vitalista Epifani Tyas
Murtiasih dan adik saya Elisabeth Dhian Novitasari.
7. Agatha Secondy Christy Gratia yang selalu memberikan doa, semangat
dan motivasi.
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK
8. Warga ITIL Alvin, Bayu, Dion, Haris, Henry, Hugo, Kevin, Anjar, Dio,
Seto, Cahyo, Daniel, Alex, Tobi, Willy, Wisnu, Xave, dan Yosua yang
selalu memberikan semangat.
9. Anaknya Mo Kun Wiga, Desa Nada, Bondan, Echo, Nita, April, Okta,
Riyadlah, dan Agustin yang selalu memberikan dukungan.
10. Teman Anime Young, Ari, Eca, dan Theo.
11. Teman PES 2016 Rudi, Blasius, Parta, Ari Ori, Theo, Dika Gd, Ahok,
Dika Kc, dan Aldy.
12. Semua teman-teman Basis Data 2012 yang selalu kompak sampai akhir.
13. Teman – teman Teknik Informatika semua angkatan dan khususnya TI
angkatan 2012 yang selalu memberikan motivasi dan bantuan hingga
penulis menyelesaikan tugas akhir ini.
14. Reza Oktovian , The Jooomers , PokoPow, MiawAug, Erix Soekamti,
Tara Arts Game Indonesia, Bagoes Kresnawan, dan Picky Picks yang
selalu memberikan tontonan yang menarik.
Penulis
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK
DAFTAR ISI
HALAMAN PERSETUJUAN.............................................................................iii
HALAMAN PENGESAHAN...............................................................................iv
MOTTO..................................................................................................................v
PERNYATAAN KEASLIAN KARYA...............................................................vi
LEMBAR PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK
KEPENTINGAN AKADEMIS...........................................................................vii
ABSTRAK...........................................................................................................viii
ABSTRACT...........................................................................................................ix
KATA PENGANTAR............................................................................................x
DAFTAR ISI........................................................................................................xii
DAFTAR TABEL...............................................................................................xiv
DAFTAR GAMBAR............................................................................................xv
BAB I.......................................................................................................................1
PENDAHULUAN...................................................................................................1
1.1 Latar Belakang..........................................................................................1
1.2 Rumusan Masalah.....................................................................................2
1.3 Tujuan Penelitian.......................................................................................3
1.4 Manfaat Penelitian.....................................................................................3
1.5 Batasan Masalah........................................................................................3
1.6 Metode Penelitian......................................................................................3
1.7 Sistematika Penulisan................................................................................4
BAB II.....................................................................................................................5
LANDASAN TEORI..............................................................................................5
2.1 Data mining...............................................................................................5
2.1.1 Pengertian Data mining Dalam Berbagai Disiplin Ilmu....................5
2.1.2 Posisi Data mining Dalam Berbagai Disiplin Ilmu...........................7
2.1.3 Data, Informasi, dan Pengetahunan (Knowledge)..............................7
2.1.5 Clustering.........................................................................................10
2.2 Teorema K-Means...................................................................................11
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK
DAFTAR TABEL
Tabel 3. 1 Inisialisasi nama buah...........................................................................19
Tabel 3. 2 Inisialisasi nama Kabupaten.................................................................20
Tabel 3. 3 Contoh data Jumlah Pohon dan Produksi Buah – buahan....................21
Tabel 3. 4 Contoh data Jumlah Pohon dan Produksi Buah – buahan....................21
Tabel 3. 5 Tabel Hasil Perhitungan Jarak Pusat Cluster........................................22
Tabel 3. 6 Tabel Pengelompokan Group...............................................................23
Tabel 3. 7 Tabel Hasil Perhitungan Jarak Pusat Cluster........................................25
Tabel 3. 8 Tabel Pengelompokan Group...............................................................26
Tabel 4. 1 Jumlah data masing – masing cluster...................................................30
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK
DAFTAR GAMBAR
Gambar 2. 1 Tahap penemuan Knowledge pada Data mining (KDD) Han, Jiawei
(2011).......................................................................................................................6
Gambar 3. 1 Block Diagram..................................................................................18
Gambar 3. 2 User Interface....................................................................................27
Gambar 4. 1 Implementasi – K-Means clustering dengan tiga cluster..................29
Gambar 4. 2 Tampilan keseluruhan sistem............................................................30
Gambar 4. 3 Input dokumen...................................................................................31
Gambar 4. 4 Implementasi – Hasil proses K-Means clustering.............................31
x
PLAGIAT MERUPAKAN TINDAKAN TIDAK
BAB I
PENDAHULUAN
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK
Di sisi lain, keragaman karakteristik lahan, agroklimat serta sebaran wilayah yang luas
memungkinkan wilayah Indonesia digunakan untuk pengembangan hortikultura tropis dan
sub tropis.
Indonesia merupakan salah satu negara penghasil buah tropis yang memiliki
keanekaragaman dan keunggulan cita rasa yang cukup baik bila dibandingkan dengan buah-
buahan dari negara-negara penghasil buah tropis lainnya. Produksi buah dalam negeri
diharapkan dapat memenuhi semua kebutuhan masyarakat. Karena dengan berhasilnya
produksi buah berarti pemerintah tidak memerlukan tindakan untuk menimpor buah dari
negara lain. Akan tetapi dalam kenyataannya, Indonesia dalam pemenuhan kebutuhan akan
buah masih tergantung pada impor dari Negara lain. Produksi buah dari tahun ke tahun
mengalami penurunan.
Penurunan produksi buah tersebut antara lain disebabkan karena menipisnya stok di
beberapa daerah karena belum memasuki masa panen atau juga dikarenakan impor buah yag
dilakukan oleh pemerintah untuk memenuhi kebutuhan belum teralisasi.
Produksi buah di Indonesia dari tahun ke tahun mengalami penurunan. Untuk itu dalam
rangka memenuhi kebutuhan buah, peran dinas pertanian untuk mengelompokan daerah
yang menghasilkan produksi buah di daerah Indonesia khususnya Provinsi Daerah Istimewa
Yogyakarta agar dapat mengoptimalkan produksi buah, tidak semata mengutamakan
keuntungan pribadi tetapi mendukung peningkatan nilai tambah produk dan peningkatan
pendapatan petani.
Pengelompokan tersebut dapat menggunakan metode pengelompokan dengan
algoritma K-Means. Dengan data yang sudah dikelompokkan menggunakan algoritma K-
Means diharapkan dapat mempermudah dinas pertanian dalam menghitung hasil pertanian di
tiap daerahnya agar mengetahuni daerah mana yang menghasilkan buah terbanyak, sedang,
dan sedikit.
Bab V. Penutup
Dalam bab ini berisi tentang kesimpulan dan saran dari seluruh penulisan tugas akhir.
PLAGIAT MERUPAKAN TINDAKAN TIDAK
BAB II
LANDASAN TEORI
Pada Bab II ini akan dipaparkan mengenai landasan teori yang medukung penelitian yang
dilakukan oleh penulis. Dalam Bab ini akan dijelaskan pengertian dan metode yang akan
digunakan oleh penulis.
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
Knowledge
Evaluation and
Presentation
Selection and
Transformation
Data Warehouse
Cleaning
Flat File
Datab
Gambar 2. 1 Tahap penemuan Knowledge pada Data mining (KDD) Han, Jiawei (2011)
f. Pattern Evaluation
Untuk mengidentifikasi pola-pola menarik yang menjelaskan mengenai ukuran
dasar pengetahunan yang ada.
g. Knowledge Presentation
Visualisasi dan teknik representasi knowledge digunakan untuk menyajikan
knowledge yang telah diolah untuk pengguna.
atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam
pemilihan presiden. Deskripsi dari pola dan kecenderungan sering memberikan
kemungkinan penjelasan untuk suatu pola atau kecenderungan.
b. Estimasi (Estimation)
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih ke
arah numerik daripada ke arah kategori. Model dibangun menggunakan record
lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat
berdasarkan nilai variabel prediksi. Sebagai contoh, akan dilakukan estimasi
tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis
kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan
darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan
menghasilan model estimasi. Model estimasi yang dihasilkan dapat digunakan
untuk kasus baru lainnya.
c. Prediksi (Prediction)
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam
prediksi nilai dari hasil akan ada di masa datang. Contoh prediksi dalam bisnis dan
penelitian adalah prediksi harga beras dalam tiga bulan yang akan datang, prediksi
persentase kenaikan kecelakaan lalu lintas tahun depan jika batas bawah kecepatan
dinaikkan. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan
estimasi dapat pula digunakan untuk prediksi.
d. Klasifikasi (Classification)
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh, penggolongan
pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi,
pendapatan sedang dan pendapatan rendah.
Contoh lain klasifikasi dalam bisnis dan penelitian adalah menentukan apakah suatu
transaksi kartu kredit merupakan transaksi yang curang atau bukan, memperkirakan
apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit yang baik
PLAGIAT MERUPAKAN TINDAKAN TIDAK
atau buruk, dan mendiagnosis penyakit seorang pasien untuk mendapatkan kategori
penyakit apa.
e. Pengklusteran (Clustering)
Pengklusteran merupakan pengelompokan record , pengamatan atau
memperhatikan dan membentuk kelas objek – objek yang memiliki kemiripan.
Cluster adalah kumpulan record yang memiliki kemiripan satu dengan yang
lainnya dan memiliki ketidakmiripan dengan record – record dalam cluster lain.
Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam
Pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi,
mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma
Pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data
menjadi kelompok-kelompok yang memiliki kemiripan (homogen), yang mana
kemiripan record dalam satu kelompok akan bernilai maksimal, sedangkan
kemiripan dengan record dalam kelompok lain akan bernilai minimal. Contoh
Pengklusteran dalam bisnis dan penelitian adalah melakukan Pengklusteran
terhadap ekspresi dari gen, untuk mendapatkan kemiripan perilaku dari gen dalam
jumlah besar. Mendapatkan kelompok – kelompok konsumen untuk target
pemasaran dari suatu produk bagi perusahaan yang tidak memiliki dana pemasaran
yang besar, dan untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap
perilaku finansial dalam keadaan baik atau mencurigakan.
f. Asosiasi (Assosiation)
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul dalam
satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.
Contoh asosiasi dalam bisnis dan penelitian adalah menemukan barang dalam
supermarket yang dibeli secara bersamaan dan barang yang tidak pernah dibeli
secara bersamaan, dan meneliti jumlah pelanggan dari perusahaan telekomunikasi
seluler yang diharapkan untuk memberikan respons posistif terhadap penawaran
upgrade layanan yang diberikan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK
2.1.5 Clustering
Clustering data dapat dibedakan menjadi dua tujuan (Tan et al,2006), yaitu
clustering untuk pemahaman dan clustering untuk penggunaan. Jika tujuan untuk
pemahaman maka cluster yang terbentuk harus menangkap struktur alami data.
Biasanya proses clustering dalam tujuan ini hanya sebagai proses awal untuk kemudian
dilanjutkan dengan pekerjaan ini seperti summarization (rata-rata, standar deviasi),
pelabelan kelas pada setiap kelompok untuk kemudian digunakan sebagai data latih
klasifikasi, dan sebagainya. Sementara jika tujuannya untuk penggunaan, biasanya
tujuan utama untuk mencari prototype cluster yang paling representative terhadap data
dan memberikan abstraksi dan setiap objek data dalam cluster di mana sebuah data
terletak didalamnya.
Banyak metode clustering yang sudah dikembangkan oleh para ahli. Masing –
masing metode mempunyai karakter, kelebihan, dan kekurangan. Clustering dapat
dibedakan menurut stuktur cluster, keanggotaan data dalam cluster dan kekompakan
data dalam cluster.
Metode clustering menurut strukturnya dibagi menjadi dua yaitu pengelompokan
hirarki dan partitioning. Pengelompokan hirarki memiliki aturan satu data tunggal bisa
dianggap sebagai sebuah kelompok, dua atau lebih kelompok kecil dapat bergabung
menjadi satu kelompok besar dan begitu seterusnya hingga semua data dapat bergabung
menjadi satu kelompok. Metode clustering hirarki merupakan satu-satunya metode yang
masuk ke dalam kategori pengelompokan hirarki. Metode clustering partitioning
membagi set data ke dalam sejumlah kelompok yang tidak tumpang tindih (overlap)
antara satu kelompok dengan kelompok yang lain artinya setiap data hanya menjadi
anggota satu kelompok. Metode seperti K-Means dan DBSCAN masuk dalam kategori
pengelompokan partitioning.
Metode clustering menurut keanggotaan dalam kelompok dibagi menjadi dua, yaitu
eksklusif dan tumpang-tindih. Metode tersebut termasuk kategori eksklusif jika sebuah
data hanya menjadi anggota satu kelompok dan tidak menjadi anggota kelompok yang
lain. Metode clustering yang masuk dalam kategori ini adalah K-Means dan DBSCAN
sedangkan yang masuk kategori tumpang – tindih adalah Metode clustering yang
PLAGIAT MERUPAKAN TINDAKAN TIDAK
membolehkan sebuah data menjadi anggota di lebih dari satu kelompok, misalnya Fuzzy
C-Means.
Metode clustering menurut kategori kekompakan terbagi menjadi dua yaitu
komplet dan parsial. Semua data bisa dikatakan kompak menjadi satu kelompok jika
semua data bisa bergabung menjadi satu (dalam konteks penyekatan) namun jika ada
sedikit data yang tidak ikut bergabung dalam kelompok mayoritas data tersebut
dikatakan mempunyai perilaku menyimpang. Data yang menyimpang ini dikenal
dengan sebutan noise. Metode yang tangguh untuk mendeteksi noise ini adalah
DBSCAN (Eko Prasetyo, 2014).
𝑑i𝑘 𝑚
j=1(𝑥ij − 𝑐ij) (1)
2
=
Suatu data akan menjadi anggota dari cluster ke-k apabila jarak data tersebut ke
pusat cluster ke-k bernilai paling kecil jika dibandingkan dengan jarak ke pusat cluster
lainnya. Hal ini dapat dihitung dengan menggunakan persamaan (2) Selanjutnya,
kelompokkan data-data yang menjadi anggota pada setiap cluster.
𝑘
𝑘=1 𝑑i𝑘 = (𝑥ij − 𝑐ij)2 (2)
Min
√∑𝑚 j
Nilai pusat cluster yang baru dapat dihitung dengan cara mencari nilai rata-rata
dari data-data yang menjadi anggota pada cluster tersebut, dengan menggunakan rumus
pada persamaan (3):
𝑝
∑
𝑐ij = i= 𝑥ij
1 (3)
𝑝
kerajaan, sedangkan level terendah adalah spesies. Satu jenis hewan mempunyai
nama spesies sendiri. Dua hewan dengan spesies berbeda dapat mempunyai genus
yang sama. Sejumlah hewan dengan genus berbeda dapat mempunyai suku yang
sama. Begitu juga dengan ordo, kelas, filum, dan kerajaan. Semua hewan berada
dalam kelompok yang sama (satu kelompok) di level kerajaan, yaitu hewan. Contoh
teknik pengelompkan dalam bidang biologi yang lain adalah pengelompokan gen –
gen yang fungsinya sama.
b. Information retrieval
Situs web di internet berjumlah miliaran. Ketika di-query, mesin pencari akan
memberikan hasil ribuan halaman. Teknik pengelompokan dapat digunakan untuk
mengelompokkan hasil halaman yang diberikan mesin pencari ke dalam kelompok
yang lebih kecil di mana setiap kelompok berisi halaman yang berkarakteristik
sama atau mirip. Misalnya, dengan kata kunci query “movie” dapat diberikan hasil
halaman yang dibedakan dalam kategori seperti “genre”, “star”,”theaters”, dan
sebagainya. Setiap kategori dapat dipecah kembali menjadi subkategori yang
membentuk hierarki sehingga membatu pengguna mengekspolarsi hasil query.
c. Klimatologi
Pemahaman cuaca di bumi memerlukan pencarian pola atmosfer dan lautan.analisis
kelompok dapat diterapkan untuk menemukan pola tekanan udara di wilayah kutub
dan lautan yang berpengaruh besar pada cuaca di daratan.
d. Bisnis
Perusahaan biasanya mempunyai data informasi dalam jumlah yang besar tentang
seluruh pelanggan saat itu dan pelanggan yang berpotensi. Pengelompokan dapat
diterapkan untuk memecah pelanggan ke dalam kelompok – kelompok kecil untuk
analisis dan strategi pemasaran.
PLAGIAT MERUPAKAN TINDAKAN TIDAK
b. Kompresi
Data – data yang bergabung dalam setiap kelompok dapat dianggap berkarakter
sama atau mirip sehingga data – data dalam kelompok yang sama dapat dikompresi
dengan diwakili oleh indeks prototype dari setiap kelompok. Setiap objek
diresprentasikan dengan indeks prototype yang dikaitkan dengan sebuah kelompok.
Teknik kompresi ini dikenal dengan kuatisasi vektor (vector quatization).
16
dibandingkan satu sama lain, sedangkan warna kulit tidak bisa dibandingkan karena
menggunakan nilai yang sifatnya kualitatif. Umumnya, tipe atribut ada dua, yaitu
kategoris (kualitatif) dan numeric (kuantitatif).
PLAGIAT MERUPAKAN TINDAKAN TIDAK
BAB III
METODE PENELITIAN
Berdasarkan pada landasan teori yang berada pada Bab II yang telah disampaikan oleh
penulis. Pada bab ini menjelaskan cara kerja algoritma yang digunakan dan proses yang akan
dibangun untuk melakukan pengelompokan.
17
PLAGIAT MERUPAKAN TINDAKAN TIDAK
K-means Transformasi
Selesai Clustering
]
Gambar 3. 1 Block Diagram
Pada gambar 3.1 proses clustering di mulai dari input data mentah yang
berupa data produksi buah – buahan yang berektensi .xlsx akan mengalami
representasi dari data. Tahap kedua yaitu tahap data pembersihan (cleaning)
untuk membuang data yang tidak konsisten. Apabila sudah selesai maka
didapatkan data yang sudah diproses atau data matang siap untuk ke tahap
selanjutnya. Tahap ke tiga yaitu tranformasi data, data yang berjenis alfabet
seperti nama buah dan kabupaten harus dilakukan proses inisialisasi data terlebih
dahulu ke dalam bentuk angka/numerikal. Tahap ke empat yaitu K-Means
clutering disini tahap K-Means clustering adalah menggelompokan data yang
sudah ada ke dalam tiga kelompok yaitu banyak, sedang, dan rendah.
3.2 Data
Data yang akan digunakan untuk mengelompokan adalah data produksi yang
diperoleh dari data produksi buah – buahan selama lima tahun yang terkumpul
sebanyak 450 data. Data tersebut diambil langsung dari Dinas Pertanian Provinsi
Daerah Istimewa Yogyakarta.
PLAGIAT MERUPAKAN TINDAKAN TIDAK
Sukun 7
Belimbing 8
Durian 9
Jambu Biji 10
Manggis 11
Sawo 12
Pepaya 13
Pisang 14
Nanas 15
Salak 16
Nangka 17
Semangka 18
Kabupaten Inisalisasi
Kabupaten Bantul 1
Kabupaten Gunungkidul 2
Kota Yogyakarta 3
Kabupaten Kulonprogo 4
Kabupaten Sleman 5
JUMLAH PRODUKSI
POHON
14634913 57476
9772771 123229
4534595 67329
1680899 1766
1031988 13870
360286 18743
256227 7984
123129 213
81180 4079
80960 296
79262 11704
76956 3477
75434 4157
PLAGIAT MERUPAKAN TINDAKAN TIDAK
73069 10337
C1 C2 C3
1
1
1
1
1
1
1
1
1
1
1
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK
1
1
1
C1 C2 C3
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
PLAGIAT MERUPAKAN TINDAKAN TIDAK
Pada perhitungan ini iterasi berhenti pada iterasi ke-9 karena kelompok
data 3 sama dengan kelompok data 2 dari hasil clustering, dan telah
mencapai stabil dan konvergen.
28
BAB IV
IMPLEMENTASI SISTEM DAN ANALISISA HASIL
Bab ini berisikan tentang implementasi dan analisis keluaran dari system
dengan algoritma yang telah digunakan serta perancangan antarmuka.
4.1 Implemantasi
Landasan teori dan metodologi yang telah disampaikan berkurang manfaatnya
jika disertai dengan implementasi. Implementasi dibagi kedalam dua bagian,
yaitu berkaitan dengan pengolahaan data dan user interface system.
29
PLAGIAT MERUPAKAN TINDAKAN TIDAK
Cluster Jumlah
1 142
2 176
3 127
Dalam proses pengelompokan data terdapat dua langkah utama, yaitu input
data dan proses K-Means clustering.
PLAGIAT MERUPAKAN TINDAKAN TIDAK
Ketika tombol “proses” seperti pada gambar 4.4 di klik maka akan muncul
hasil proses clustering metode K-Means.
2. Mangga
Untuk produksi mangga Kabupaten Bantul, termasuk dalam kelompok
produksi sedang pada tahun 2005, 2006, dan 2009. Itu diketahui karena
terdapat pada cluster ke 2. Untuk produksi mangga tahun 2007 dan 2008
Kabupaten Bantul termasuk dalam kelompok produksi sedikit. Untuk
produksi mangga Kabupaten Gunung Kidul, termasuk dalam kelompok
produksi sedang pada tahun 2005, 2006, 2008 ,dan 2009. Itu diketahui
karena terdapat pada cluster ke 2. Untuk produksi mangga tahun 2007
Kabupaten Gunung Kidul termasuk dalam kelompok produksi banyak
terdapat pada cluster ke 3. Kota Yogyakarta termasuk dalam kelompok
produksi sedikit pada tahun 2005 sampai 2009 banyak terdapat pada
cluster ke 1. Kulonprogo termasuk dalam kelompok produksi sedikit
pada tahun 2005 banyak terdapat pada cluster ke 1, pada tahun 2006
sampai 9 Kulonprogo termasuk dalam kelompok produksi sedang
terdapat pada cluster ke 2. Kabupaten Sleman termasuk dalam kelompok
produksi sedang terdapat pada cluster ke 2 pada tahun 2005 sampai
2009.
3. Rambutan
Untuk produksi rambutan Kabupaten Bantul, dalam kelompok
produksi sedikit terdapat pada cluster ke 3 pada tahun 2005 sampai 2009,
Kabupaten Gunung Kidul pada tahun 2005,2006, dan 2008 kelompok
produksi banyak terdapat pada cluster ke 1, pada tahun 2007 dan 2008
kelompok produksi banyak terdapat pada cluster ke 1. Kota Yogyakarta
termasuk dalam kelompok produksi sedikit pada tahun 2005 sampai 2009
sedikit terdapat pada cluster ke 3, Kulonprogo Yogyakarta termasuk
dalam kelompok produksi sedikit pada tahun 2005 sampai 2009 banyak
terdapat pada cluster ke 1, dan Kabupaten Sleman termasuk dalam
PLAGIAT MERUPAKAN TINDAKAN TIDAK
kelompok produksi yang sedang pada tahun 2005 sampai dengan tahun
2009. Itu diketahui karena terdapat pada cluster ke 2.
4. Duku
Untuk produksi duku Kabupaten Bantul, Kabupaten Gunung Kidul,
Kota Yogyakarta, termasuk dalam kelompok produksi sedang pada tahun
2005 sampai dengan tahun 2009. Itu diketahui karena terdapat pada
cluster ke 2. Kulonprogo pada tahun 2005, 2008 dan 2009 karena
terdapat pada cluster ke 3, pada tahun 2006 termasuk dalam produksi
sedang karena masuk cluster ke 2, pada tahun 2007 termasuk dalam
produksi sedang karena masuk cluster ke 2, Sleman termasuk dalam
kelompok produksi yang banyak pada tahun 2005 masuk cluster ke 1
dan Kabupaten Sleman termasuk dalam kelompok produksi yang sedikit
pada tahun 2006 sampai dengan tahun 2009. Itu diketahui karena terdapat
pada cluster ke 3.
5. Jeruk
Untuk produksi jeruk Kabupaten Bantul, Kabupaten Gunung Kidul,
Kota Yogyakarta, termasuk dalam kelompok produksi sedang pada tahun
2005 sampai dengan tahun 2009. Itu diketahui karena terdapat pada
cluster ke 2. Kulonprogo, termasuk dalam kelompok produksi yang
sedikit pada tahun 2005, 2008 dan 2009 Itu diketahui karena terdapat
pada cluster ke 3. pada tahun 2006 dan 2007 kelompok produksi yang
banyak . Itu diketahui karena terdapat pada cluster ke 1. Kabupaten
Sleman termasuk dalam kelompok produksi yang sedikit pada tahun
2005, 2006, 2008 dan 2009 Itu diketahui karena terdapat pada cluster ke
3. pada tahun 2007 kelompok produksi yang banyak. Itu diketahui karena
terdapat pada cluster ke 1.
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6. Sirsak
Untuk produksi sirsak Kabupaten Bantul termasuk dalam kelompok
produksi yang sedikit pada tahun 2005, 2006, 2007 dan 2008, itu
diketahui karena terdapat pada cluster ke 3. Sedangkan tahun 2009
termasuk dalam kelompok produksi yang banyak karena terdapat pada
cluster ke 1. Kabupaten Gunung Kidul tahun 2005 termasuk dalam
kelompok produksi yang sedikit karena terdapat pada cluster ke 3.
Sedangkan tahun 2006 sampai 2009 termasuk dalam kelompok produksi
yang sedang karena terdapat pada cluster ke 2, Kota Yogyakarta tahun
2005 sampai 2009 termasuk dalam kelompok produksi yang banyak
karena terdapat pada cluster ke 1, Kulonprogo tahun 2005, 2006, 2008,
dan 2009 termasuk dalam kelompok produksi yang banyak karena
terdapat pada cluster ke 1, pada tahun 2007 termasuk kelompok produksi
yang sedikit karena terdapat pada cluster ke 3 dan Kabupaten Sleman
termasuk dalam kelompok produksi yang sedikit pada tahun 2005 sampai
dengan tahun 2009. Itu diketahui karena terdapat pada cluster ke 3.
7. Sukun
Untuk produksi suku Kabupaten Bantul dan Kota Yogyakarta
termasuk kelompok produksi yang sedikit karena terdapat pada cluster
ke 3 pada tahun 2005 sampai dengan tahun 2009 , Kabupaten Gunung
Kidul termasuk kelompok produksi yang sedikit karena terdapat pada
cluster ke 3 pada tahun 2005 dan 2006, tahun 2007 sampai 2009
termasuk kelompok produksi yang sedang karena terdapat pada cluster
ke 2, Kulonprogo termasuk kelompok produksi yang sedikit karena
terdapat pada cluster ke 3 pada tahun 2005 dan 2006, tahun 2008, tahun
2007 termasuk kelompok produksi yang sedang karena terdapat pada
cluster ke 2, dan tahun 2009 termasuk kelompok produksi yang banyak
karena terdapat pada cluster ke 1 dan Kabupaten Selaman tahun 2005,
PLAGIAT MERUPAKAN TINDAKAN TIDAK
2006, 2008, dan 2009 termasuk dalam kelompok produksi yang banyak
karena terdapat pada cluster ke 1, pada tahun 2007 termasuk kelompok
produksi yang sedikit karena terdapat pada cluster ke 3.
8. Belimbing
Untuk produksi belimbing Kabupaten Bantul tahun 2005 dan 2006
termasuk kelompok produksi yang sedang karena terdapat pada cluster
ke 2, pada tahun 2007 termasuk kelompok produksi yang sedikit karena
terdapat pada cluster ke 3, pada tahun 2008 dan 2009 termasuk
kelompok produksi yang banyak karena terdapat pada cluster ke 1.
Kabupaten Gunung Kidul, Kulonprogo dan Kabupaten Sleman tahun
2005, 2006, 2008, dan 2009 termasuk dalam kelompok produksi yang
sedang karena terdapat pada cluster ke 2, pada tahun 2007 termasuk
kelompok produksi yang sedikit karena terdapat pada cluster ke 3, Kota
Yogyakarta termasuk kelompok produksi yang banyak karena terdapat
pada cluster ke 1 pada tahun 2005 sampai dengan tahun 2009.
9. Durian
Untuk produksi durian Kabupaten Bantul, Kabupaten Gunung Kidul,
Kota Yogyakarta , pada tahun 2007 termasuk kelompok produksi yang
sedikit karena terdapat pada cluster ke 3, Kulonprogo tahun 2005, 2007,
2008, dan 2009 termasuk kelompok produksi yang sedang karena
terdapat pada cluster ke 2, dan termasuk kelompok produksi yang banyak
karena terdapat pada cluster ke 1 pada tahun 2006. Kabupaten Sleman
termasuk dalam kelompok produksi yang sedang pada tahun 2005
sampai dengan tahun 2009. Itu diketahui karena terdapat pada cluster ke
2.
PLAGIAT MERUPAKAN TINDAKAN TIDAK
11. Manggis
Untuk produksi manggis Kabupaten Bantul, Kabupaten Gunung Kidul,
Kota Yogyakarta tahun 2005 sampai 2009 termasuk dalam kelompok
produksi yang sedang karena terdapat pada cluster ke 2, Kulonprogo
termasuk kelompok produksi yang sedikit karena terdapat pada cluster
ke 3 pada tahun 2005, 2006 dan 2009 dan Kabupaten Sleman termasuk
dalam kelompok produksi yang banyak pada tahun 2005 sampai dengan
tahun 2009. Itu diketahui karena terdapat pada cluster ke 1.
PLAGIAT MERUPAKAN TINDAKAN TIDAK
12. Sawo
Untuk produksi sawo Kabupaten Bantul, Kabupaten Gunung Kidul
Kulonprogo, dan Kabupaten Sleman tahun 2005, 2006, 2008, dan 2009
termasuk dalam kelompok produksi yang banyak karena terdapat pada
cluster ke 1, tahun 2007 termasuk dalam kelompok produksi yang
sedang karena terdapat pada cluster ke 2. Kota Yogyakarta termasuk
dalam kelompok produksi yang sedikit pada tahun 2005 sampai dengan
tahun 2009. Itu diketahui karena terdapat pada cluster ke 3.
13. Pepaya
Untuk produksi pepaya Kabupaten Bantul tahun 2005, 2006, 2008, dan
2009 termasuk dalam kelompok produksi yang sedikit karena terdapat
pada cluster ke 3, tahun 2006 termasuk dalam kelompok produksi yang
banyak karena terdapat pada cluster ke 1, Kabupaten Gunung Kidul
tahun 2005, 2006, 2008, dan 2009 termasuk dalam kelompok produksi
yang sedikit karena terdapat pada cluster ke 3, tahun 2007 termasuk
dalam kelompok produksi yang sedang karena terdapat pada cluster ke
2. Kota Yogyakarta, dan Kulonprogo, termasuk dalam kelompok
produksi yang sedikit pada tahun 2005 sampai dengan tahun 2009. Itu
diketahui karena terdapat pada cluster ke 3. Kabupaten Sleman tahun
2005, 2006, 2008, dan 2009 termasuk dalam kelompok produksi yang
sedikit karena terdapat pada cluster ke 3, tahun 2007 termasuk dalam
kelompok produksi yang banyak karena terdapat pada cluster ke 1.
14. Pisang
Untuk produksi pisang Kabupaten Bantul termasuk dalam kelompok
produksi yang sedang pada tahun 2005 sampai dengan tahun 2009. Itu
diketahui karena terdapat pada cluster ke 2. Kabupaten Gunung Kidul,
Kulonprogo, dan Kabupaten Sleman tahun 2005, 2006, 2008, dan 2009
PLAGIAT MERUPAKAN TINDAKAN TIDAK
15. Nanas
Untuk produksi nanas Kabupaten Bantul dan Kota Yogyakarta
termasuk dalam kelompok produksi yang sedang pada tahun 2005
sampai dengan tahun 2009. Itu diketahui karena terdapat pada cluster ke
2. Kabupaten Gunung Kidul tahun 2005, 2006, 2008, dan 2009 termasuk
dalam kelompok produksi yang sedang karena terdapat pada cluster ke
2, tahun 2007 termasuk dalam kelompok produksi yang banyak karena
terdapat pada cluster ke 1. Kulonprogo, dan Kabupaten Sleman tahun
2005, 2006, 2008, dan 2009 termasuk dalam kelompok produksi yang
banyak karena terdapat pada cluster ke 1, tahun 2007 termasuk dalam
kelompok produksi yang sedikit karena terdapat pada cluster ke 3.
16. Salak
Untuk produksi salak Kabupaten Bantul, Kabupaten Gunung Kidul,
dan Kota Yogyakarta termasuk dalam kelompok produksi yang sedang
pada tahun 2005 sampai dengan tahun 2009. Itu diketahui karena terdapat
pada cluster ke 2. Kabupaten Kulonprogo, termasuk dalam kelompok
produksi yang sedikit pada tahun 2005 sampai dengan tahun 2009. Itu
diketahui karena terdapat pada cluster ke 3. Kabupaten Sleman ,
termasuk dalam kelompok produksi yang banyak pada tahun 2005 sampai
dengan tahun 2009. Itu diketahui karena terdapat pada cluster ke 1.
PLAGIAT MERUPAKAN TINDAKAN TIDAK
40
17. Nangka
Untuk produksi nangka Kabupaten Bantul tahun 2005 dan 2007
termasuk dalam kelompok produksi yang banyak karena terdapat pada
cluster ke 1, tahun 2006, 2008, dan termasuk dalam kelompok produksi
yang sedikit karena terdapat pada cluster ke 3. Kabupaten Gunung Kidul
dan Kabupaten Sleman tahun 2005, 2006, 2008, dan 2009 termasuk
dalam kelompok produksi yang banyak karena terdapat pada cluster ke
1, tahun 2007 termasuk dalam kelompok produksi yang sedang karena
terdapat pada cluster ke 2. Kota Yogyakarta termasuk dalam kelompok
produksi yang sedikit pada tahun 2005 sampai dengan tahun 2009. Itu
diketahui karena terdapat pada cluster ke 3. Kabupaten Kulonprogo
termasuk dalam kelompok produksi yang banyak pada tahun 2005 sampai
dengan tahun 2009. Itu diketahui karena terdapat pada cluster ke 1.
18. Semangka
Untuk produksi semangka Kabupaten Bantul, Kabupaten Gunung
Kidul termasuk dalam kelompok produksi yang sedikit pada tahun 2005
sampai dengan tahun 2009. Itu diketahui karena terdapat pada cluster ke
3. Kota Yogyakarta tahun 2005, 2006, 2008, dan 2009 termasuk dalam
kelompok produksi yang sedikit karena terdapat pada cluster ke 3, tahun
2007 termasuk dalam kelompok produksi yang banyak karena terdapat
pada cluster ke 1. Kabupaten Kulonprogo termasuk dalam kelompok
produksi yang banyak pada tahun 2005 sampai dengan tahun 2009. Itu
diketahui karena terdapat pada cluster ke 1. Kabupaten Sleman tahun
2005, 2006, 2007, dan 2009 termasuk dalam kelompok produksi yang
sedang karena terdapat pada cluster ke 2, tahun 2008 termasuk dalam
kelompok produksi yang sedikit karena terdapat pada cluster ke 3.
PLAGIAT MERUPAKAN TINDAKAN TIDAK
BAB V
PENUTUP
5.2 Saran
Saran yang diperlukan untuk pengembangan system lebih lanjut sebagai
berikut :
1. Penelitian selanjutnya dapat dikembangkan pada jenis data yang serupa
dengan metode yang lebih baik seperti menggunakan algoritma Fuzzy C-
Means.
41
PLAGIAT MERUPAKAN TINDAKAN TIDAK
42
DAFTAR PUSTAKA
Gorunescu, Florin (2011). Data mining: Concepts, Models, and Techniques. Verlag
Berlin Heidelberg: Springer
Han, Jiawei & Micheline Kamber. 2006. Second Edition. Data mining : Concepts
and Techniques. New York : Morgan Kaufman
Han, Jiawei & Micheline Kamber. 2012. Third Edition. Data mining : Concepts and
Techniques. New York : Morgan Kaufman
Kusrini, dan Luthfi, Emha. Taufiq. (2009). Algoritma Data mining. Yogyakarta: Andi
Publishing.
Larose, Daniel. T. (2005).Discovering Knowledge in Data. New Jersey: John Willey
& Sons, Inc.
Lee, Finn. S. dan Santana, Juan (2010). Data mining : Meramalkan Bisnis
Perusahaan. Jakarta: Elex Media Komputindo
Liao. (2007). Recent Advances in Data mining of Enterprise Data: Algorithms and
Application. Singapore: World Scientific Publishing
Prasetyo Eko. 2014. Data mining Mengolah Data menjadi Informasi Menggunakan
Matlab. Yogyakarta : CV.ANDI OFFSET
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK
LAMPIRAN
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK
4
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK
6
PLAGIAT MERUPAKAN TINDAKAN TIDAK
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK
5 3 74 26 2009 2
5 4 16219 1239 2005 1
5 4 29777 1216 2006 3
5 4 58807 1114 2007 3
5 4 17561 957 2008 1
5 4 23400 1078 2009 1
5 5 10009 944 2005 1
5 5 8281 710 2006 1
5 5 29061 899 2007 3
5 5 11258 849 2008 1
5 5 11740 893 2009 1
6 1 9144 628 2005 1
6 1 6933 416 2006 1
6 1 16983 246 2007 1
6 1 7304 133 2008 1
6 1 5253 127 2009 3
6 2 16547 869 2005 1
6 2 24399 1242 2006 2
6 2 48498 475 2007 2
6 2 28019 522 2008 2
6 2 44429 918 2009 2
6 3 115 10 2005 3
6 3 166 8 2006 3
6 3 489 5 2007 3
6 3 149 6 2008 3
6 3 136 5 2009 3
6 4 3901 139 2005 3
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK
7
PLAGIAT MERUPAKAN TINDAKAN TIDAK
15 2 33211 45 2007 3
15 2 8175 35 2008 2
15 2 13362 72 2009 2
15 3 53 1 2005 2
15 3 55 1 2006 2
15 3 25 0 2007 2
15 3 66 1 2008 2
15 3 40 1 2009 2
15 4 36380 206 2005 3
15 4 53348 251 2006 3
15 4 80960 296 2007 1
15 4 51538 311 2008 3
15 4 52204 291 2009 3
15 5 66122 217 2005 3
15 5 53112 179 2006 3
15 5 123129 213 2007 1
15 5 38176 205 2008 3
15 5 39460 177 2009 3
16 1 6655 91 2005 2
16 1 4617 39 2006 2
16 1 7008 20 2007 2
16 1 3202 36 2008 2
16 1 3689 45 2009 2
16 2 1449 12 2005 2
16 2 1463 36 2006 2
16 2 4036 8 2007 2
16 2 1287 12 2008 2
8
PLAGIAT MERUPAKAN TINDAKAN TIDAK
16 2 1594 10 2009 2
16 3 129 1 2005 2
16 3 60 1 2006 2
16 3 90 0 2007 2
16 3 10 0 2008 2
16 3 0 0 2009 2
16 4 100057 1379 2005 1
16 4 116189 1551 2006 1
16 4 237151 1386 2007 1
16 4 118433 1527 2008 1
16 4 116414 2138 2009 1
16 5 9772771 123229 2005 3
16 5 4534595 67329 2006 3
16 5 14634913 57476 2007 3
16 5 4521909 58353 2008 3
16 5 4755612 60379 2009 3
17 1 39123 4073 2005 3
17 1 16302 1405 2006 1
17 1 44705 2189 2007 3
17 1 11964 556 2008 1
17 1 20279 833 2009 1
17 2 63963 6461 2005 3
17 2 64387 4407 2006 3
17 2 120656 5650 2007 2
17 2 70582 3570 2008 3
17 2 93616 3838 2009 3
17 3 961 119 2005 1
8
PLAGIAT MERUPAKAN TINDAKAN TIDAK
8
PLAGIAT MERUPAKAN TINDAKAN TIDAK
18 3 0 0 2008 1
18 3 0 0 2009 1
18 4 593 9242 2005 3
18 4 569 9659 2006 3
18 4 599 10742 2007 3
18 4 185 6493 2008 3
18 4 367 6660 2009 3
18 5 66 1460 2005 2
18 5 60 1247 2006 2
18 5 42 945 2007 2
18 5 11 493 2008 1
18 5 34 619 2009 2