TEKNIK DATA MINING DALAM CLUSTERING PRODUKSI SUSU SEGAR DI INDONESIA

TEKNIK DATA MINING DALAM CLUSTERING
PRODUKSI SUSU SEGAR DI INDONESIA

DENGAN ALGORITMA K-MEANS
SKRIPSI
Diajukan Guna Memenuhi Salah Satu Syarat

Untuk Menyelesaikan Pendidikan Strata 1
Program Studi Sistem Informasi
Oleh :
ILHAM SAFITRA DAMANIK

NIM : 1502047
SEKOLAH TINGGI ILMU KOMPUTER

STIKOM TUNAS BANGSA
PEMATANGSIANTAR
2019
ABSTRAK
Susu adalah salah satu asupan penting untuk memenuhi kebutuhan nutrisi. Baik di
konsumsi oleh anak anak, dan orang dewasa . Indonesia mempunyai banyak daerah
penghasil susu segar, tetapi belum cukup untuk memenuhi kebutuhan susu nasional.
Data mining adalah suatu keilmuan dalam bidang komputer yang banyak di gunakan
dalam penelitian. salah satu teknik data mining ialah Clustering. Clustering adalah
metode dengan melakukan pengelompokan data. Metode Clustering akan lebih
optimal bila mengggunakan banyak data. Data yang akan di gunakan adalah data
provinsi di indonesia di mulai dari tahun 2000 sampai tahun 2017 yang diperoleh dari
Badan Pusat Statistik. Hasil dari penelitian ini adalah di Cluster berdasarkan 2
kelompok daerah penghasil susu, yaitu daerah penghasil susu tinggi dan daerah
penghasil susu rendah.
Kata kunci: Susu segar, Clustering, Produksi susu segar
ii
ABSTRACT
Milk is an important intake to meet nutritional needs. Good for consumption by

children, and adults. Indonesia has many milk-producing regions fresh, but not
enough to meet national milk needs. Data mining is a science in the field of computers
that is widely used in research. one of Data mining techniques are Clustering.
Clustering is a method of doing data grouping. The Clustering method will be more
optimal if you use a lot of data. The data that will be used is data from 34 provinces in
Indonesia starting from 2000 until 2017 obtained from the Central Statistics Agency.
The results of this study are in the Cluster based on 2 groups of milk-producing
regions, namely high-milk producing regions and low milk producing regions.
Keywords: Fresh milk, Clustering, Fresh milk production
iii
DAFTAR ISI
Halaman
Halaman Judul ................................................................................................ i
Abstrak ........................................................................................................... ii
Abstract .......................................................................................................... iii
Daftar Isi ......................................................................................................... iv
Daftar Tabel ................................................................................................... vi
Daftar Gambar ................................................................................................ vii
Daftar Lampiran ............................................................................................. viii
BAB 1 PENDAHULUAN ........................................................................ 1
1.1. Latar Belakang Masalah ....................................................... 1
1.2. Perumusan Masalah ............................................................. 3
1.3. Batasan Masalah ................................................................... 4
1.4. Tujuan Penelitian ................................................................. 5
1.5. Manfaat Penelitian ............................................................... 5
1.6. Sistematika Penelitian .......................................................... 6
BAB 2 TINJAUAN PUSTAKA .............................................................. 8
2.1. Data Mining ......................................................................... 8
2.2. Clustering ............................................................................. 10
2.3. Algoritma K-Means .............................................................. 11
2.4. Susu Segar ............................................................................ 12
2.5. Rapidminer Studio ............................................................... 13
2.6. UML (Unified Modelling Language) ................................... 15
iv
2.7. Flowchart ............................................................................. 19
2.8. Penelitian Terdahulu ........................................................... 21
BAB 3 METODOLOGI PENELITIAN ................................................. 23
3.1. Metode Penelitian .................................................................. 23
3.1.1. Metode Pengumpulan Data ...................................... 23
3.1.2. Analisis Data ............................................................ 25
3.1.3. Kontribusi Penelitian ................................................ 25
3.1.4. Lokasi Penelitian dan Waktu Pengumpulan Data .... 25
3.2. Analisis dan Perancangan Sistem ......................................... 26
3.2.1. Analisa Permasalahan .............................................. 26
3.2.2. Algoritma K-Means .................................................. 26
3.2.3. Perhitungan Metode K-Means ................................. 28
3.2.4. Data Olahan .............................................................. 31
3.2.5. Iterasi 1 ...................................................................... 32
3.2.6. Iterasi 2 ...................................................................... 34
3.2.7. Perancangan Penelitian ............................................ 36
3.2.8. Pemodelan di RapidMiner ........................................ 38
Daftar Pustaka ................................................................................................ 39
Lampiran
v
DAFTAR TABEL
Halaman
Tabel 2.1. Simbol-Simbol Use Case Diagram .......................................... 16
Tabel 2.2. Simbol-Simbol Activity Diagram ............................................. 18
Tabel 2.3. Simbol-simbol Flowchart ......................................................... 19
Tabel 2.4. Penelitian Terdahulu ................................................................. 21
Tabel 3.1. Data Mentah .............................................................................. 28
Tabel 3.2. Data Olahan .............................................................................. 31
Tabel 3.3. Iterasi 1 ..................................................................................... 32
Tabel 3.4. Iterasi 2 ..................................................................................... 34
vi
DAFTAR GAMBAR
Halaman
Gambar 2.1. Tahapan Proses Data Mining .................................................. 8
Gambar 2.2. Tampilan RapidMiner Studio versi 8.1 .................................. 14
Gambar 3.1. Data Statistik Produksi Susu Segar Tahun 2000 - 2017 .......... 24
Gambar 3.2. Tahapan Algoritma K-Means .................................................. 36
Gambar 3.3. Flowchart Perancangan Penelitian .......................................... 36
Gambar 3.4. Tampilan di RapidMiner Dengan Menggunakan Clustering . 38
vii
DAFTAR LAMPIRAN
Halaman
Fotokopi Surat Permohonan Seminar Proposal ............................................. L-1
Fotokopi Persetujuan ACC ............................................................................ L-2
viii
1
BAB 1
PENDAHULUAN
1.1. Latar Belakang Masalah
Data mining merupakan suatu langkah dalam knowlegde discovery in
databases (KDD) Yang memiliki teknik menganalisa data untuk digali informasi
tersembunyi dalam jumlah besar dan kompleks,sehingga menghasilkan output
berupa karakteristik atau pola dari data tersebut (Darmi and Setiawan, 2016). Susu
adalah cairan berwana putih yang disekresikan oleh kelenjar mammae (ambing)
pada binatang mamalia betina, untuk bahan makanan dan sumber gizi anaknya.
Sebagian besar susu yang dikonsumsi manusia berasal dari sapi, yang biasa
disebut susu sapi. Sedangkan susu ternak lain biasanya di ikuti nama ternak
tersebut, misal susu kerbau, susu kambing, susu unta dan sebagianya dan susu
manusia disebut ASI atau dapat disebut air susu ibu. (Ii & Pustaka, 2004). Di
indonesia dan di berbagai negara lain, susu merupakan salah satu bahan pangan
yang sangat penting bagi pemenuhan kebutuhan gizi masyarakat. Susu berperan
sebagai asupan penting untuk kesehatan, kecerdasan, dan pertumbuhan,
khususnya anak-anak.
Produksi susu segar di indonesia untuk memenuhi kebutuhan susu
nasional masih belum tercukupi. Produksi susu lokal hanya mampu memenuhi
20% angka kebutuhan susu nasional, sedangkan 80% masih impor. Beberapa
negara negara pengimpor susu kepada indonesia ialah: Amerika Serikat,
Australia, Selandia Baru, Belgia, Kanada. Dewan Persusuan Nasional

2
mengatakan indonesia darurat susu segar. Mengingat Tingginya nilai impor susu
indonesia dari luar negeri berakibat menimbulkan kerugian langsung pada
peternak sapi perah di seluruh Indonesia. Selain hal itu banyaknya nilai impor
susu membuat terkurasnya devisa nasional, serta penduduk indonesia kehilangan
kesempatan terbaik mereka untuk bekerja dan tidak dimanfaatkannya potensi
sumber daya yang ada untuk pengembangan agribisnis persususan, serta
hilangnya potensi pendapatan negara indonesia dari pajak apabila agribisnis
persusuan dikembangkan lebih optimal. Melihat potensi sumber daya alam
Indonesia yang sangat besar bagi pengembangan agribisnis persusuan, ironis
sekali jika sebagian besar dari total kebutuhan susu Indonesia masih harus
diimpor. Berangkat dari hal itu, penulis membuat suatu penelitian dengan data
mining metode clustering untuk mengelompokkan daerah penghasil susu segar di
Indonesia. Yang nantinya akan menghasilkan 2 kelompok daerah penghasil susu
yaitu: Daerah penghasil susu tinggi, dan daerah penghasil susu rendah. Maka
daerah yang termasuk dalam penghasil susu rendah akan lebiih di tingkatkan lagi
produksinya sehingga di harapkan akan memperkecil jumlah impor susu dan
menambah hasil produksi susu segar di indonesia, agar produksi susu lokal bisa
memenuhi kebutuhan susu nasional.
Kajian Peneliti terdahulu (Lestari, 2016) yang berjudul “Perancangan
Sistem Clustering Susu Sapi Dengan Menggunakan Metode K-Means”
menyimpulkan bahwa, Aplikasi clustering yang menggunakan metode KMeans
berhasil dibuat untuk membantu dalam mengelompokkan data susu sesuai dengan
karakteristik yang serupa berdasarkan variabel yang ditentukan. Begitu juga

3
dengan penelitian (Riveranda, Nengsih, Kom, & Kom, 2017) yang berjudul “K-
Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia” menyimpulkan
bahwa, Berdasarkan hasil analisis kluster pada data kasus HIV dan AIDS yang
ada di Indonesia, dapat ditarik kesimpulan bahwa provinsi DKI Jakarta, Jawa
Timur dan Papua berada dalam kondisi yang sangat kritis dan sangat rentan akan
penyebaran virus HIV/AIDS. Hal itu dikarenakan jumlah kasus HIV dan AIDS
terbanyak ada pada ketiga provinsi tersebut. Untuk itu, kampanye dan kebijakan
pemerintah dapat difokuskan secara langsung kepada ketiga provinsi itu.
Berdasarkan uraian latar belakang permasalahan di atas, maka penulis
menggunakan teknik data mining dengan algoritma k-means clustering untuk
mengangkat sebuah judul yaitu “Tekhnik Data Mining dalam Clustering
Produksi Susu Segar di Indonesia Dengan Metode K-Means”. Diharapkan
penelitian ini dapat memberikan manfaat dan rekomendasi bagi pemerintah yg
khususnya Kementrian Pertanian dan Direktorat Jendral Perternakan yang
menangani persoalan susu segar di indonesia agar dapat meningkatkan hasil
produksi susu segar di indonesia sehingga impor susu juga dapat di kurangi.
1.1. Perumusan Masalah
Berdasarkan penjelasan latar belakang di atas maka perumusan masalah
dalam penelitian ini yaitu,:

4
1. Bagaimana menerapkan algoritma K-Means Clustering untuk
mengelompokan produksi susu segar pada setiap provinsi di
indonesia?
2. Bagaimana mengelompokan produksi susu segar pada setiap
provinsi di indonesia dengan menggunakan aplikasi rapidminer?
1.2. Batasan Masalah
Adapun batasan masalah dalam penelitian ini adalah sebagai berikut:
1. Metode yang digunakan Data Mining dan algoritma yang digunakan
K-Means Clustering dalam menentukan jumlah produksi susu segar
di indonesia yang nantinya di kelompokan menjadi beberapa bagian
menggunkan algoritma K-Means Clustering.
2. Aplikasi yang digunakan adalah RapidMiner
3. Hasil akhir dari penelitian ini adalah menjadikan daerah penghasil
susu di indonesia menjadi 2 cluster kelompok daerah penghasil susu,
yaitu: Daerah penghasil susu tinggi, dan daerah penghasil susu
rendah. Serta daerah yang menjadi produksi rendah akan lebih di
tingkatkan produksinya agar bisa mengurai nilai impor susu.

5
1.3. Tujuan Penelitian
Berdasarkan penjelasan latar belakang dan perumusan masalah diatas,
maka tujuan yang ingin dicapai dalam penelitian ini adalah :
1. Menjadikan daerah penghasil susu di indonesia menjadi 2 bagian
kelompok daerah penghasil susu, yaitu: Daerah penghasil susu
tinggi, dan daerah penghasil susu rendah dengan metode data mining
dan menggunakan algortima K-Means Clustering.
2. Menguji hasil dari algoritma K-Means Clustering dengan
menggunakan aplikasi Rapidminer pada data Badan Pusat Statistika
(BPS).
1.4. Manfaat Penelitian
Adapun manfaat dalam pembuatan penelitian skripsi ini adalah sebagai
berikut:
1. Diharapkan dengan adanya penelitian ini dapat menjadi masukan
bagi pemerintah untuk lebih memperhatikan daerah produksi susu
rendah, dan meningkatkan produksi susu segar lokal sehingga
mengurangi nilai impor susu segar.
2. Menjadikan penelitian ini sebagai referensi bagi penelitian lain
untuk melakukan penelitian mengenai susu segar di indonesia
menggukan metode data mining dengan algoritma K-Means
Clustering
6
1.5. Sistemtika Penelitian
Tahapan lima bab dalam sistematika penelitian penulis pada penelitian
ini adalah sebagai berikut:
BAB I : PENDAHULUAN
Pada Bab ini menjelaskan tentang latar belakang masalah penelitian,
perumusan masalah, batasan masalah, tujuan penelitian, manfaat
penelitian, dan sistematika penulisan penelitan.
BAB II : TINJAUAN PUSTAKA
Pada Bab ini menjelaskan tentang teori teori dalam beberapa referensi
yang berhubungan dan mendukung dalam pembuatan penelitian.
Menguraikan tentang referensi teori yang relevan yang digunakan
penulis dalam melakukan penelitian.
BAB III : METODOLOGI PENELITIAN
Pada Bab ini menjelaskan tentang cara penerapan konsep dasar yang di
uraikan pada Bab 2, untuk menganalisis dan merancang sesuai tahap-
tahap penyelesaian pada masalah tersebut menggunakan algoritma K-
Means Clustering mulai dari proses penentuan sumber data, proses
pengolahan data yang digunakan dalam penelitian.

7
BAB IV : HASIL DAN PEMBAHASAN
Pada Bab ini membahas tentang hasil penelitian yang dilakukan
menggunakan Aplikasi RapidMiner Studio dan untuk mengetahui
validasi hasil penelitian.
BAB V : KESIMPULAN DAN SARAN
Pada Bab ini membahas tentang kesimpulan dari hasil penelitian yang
dibuat dan saran.

8
BAB 2
TINJAUAN PUSTAKA
2.1. Data Mining
Data Mining adalah proses yang mempekerjakan satu atau lebih teknik
pembelajaran computer (machine learning) unutuk menganalisis dan
mengekstraksi pengetahuan (knowledge) secara otomatis. (Sadewo, Windarto, &
Hartama, 2016) Berikut tahapan proses data mining dalam penemuan pengetahuan
berulang dalam database dapat dilihat pada gambar 2.1.
Gambar 2.1. Tahapan Proses Data Mining
(Sumber : (Darmi and Setiawan, 2016)

9
Beberapa tahapan dari proses Knowledge Discovery in Database, yaitu :
1. Seleksi Data (Data Selection)
Data yang diperoleh dari sumber data sering kali tidak semuanya digunakan,
karena hal tersebut maka hanya data yang sesuai dengan kebutuhan penelitian lah
yang akan diambil dari sumber data mentah.
2. Pembersihan Data (Data Cleaning)
Merupakan proses menghilangkan data yang tidak relevan ataupun tidak
diperlukan. Data yang di peroleh dari sumber data baik dari database ataupun dari
sumber data lainnya memiliki isian dari atribut yang tidak sempurna, misalnya
data yang hilang, data yang tidak valid dan hanya sekedar salah dalam pengetikan
data. Data-data yang tidak relevan itu sebaiknya dibuang. Pembersihan data juga
dapat mempengaruhi performasi dari teknik data mining karena data yang
ditangani akan berkurang jumlah dan kompleksitasnya.
3. Transformasi Data (Data Transformation)
Data diubah atau digabung ke dalam format yang sesuai dengan kebutuhan
penelitian untuk diproses. Proses ini sering disebut transformasi data.
4. Proses Mining
Merupakan suatu proses utama saat metode diterapkan untuk menemukan
pengetahuan berharga dan tersembunyi dari data.
5. Integrasi Data (Data Integration)
Integrasi data merupakan penggabungan data dari berbagai
database ke dalam satu database yang baru. Integrasi data haruslah dilakukan
secara cermat karena tingkat kesalahan pada integrasi data bisa menghasilkan
10
hasil yang menyimpang atau salah dan bahkan bisa menyesatkan pengambilan
aksi nantinya.
6. Evaluasi Pola (Pattern Evaluation)
Untuk dapat mengidentifikasi pola-pola baru yang menarik kedalam knowledge
based yang ditemukan. Dalam tahap Evaluasi Pola (Pattern Evaluation) ini
hasilnya merupakan temuan temuan pola-pola yang khas maupun model prediksi
dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai.
7. Presentasi Pengetahuan (Knowledge Presentation)
Tahap ini merupakan visualisasi dan penyajian pengetahuan mengenai metode
yang digunakan didalam penelitian yang dilakukan untuk memperoleh
pengetahuan yang diperoleh pengguna. Tahapan terakhirnya adalah bagaimana
memformulasikan keputusan atau aksi dari hasil analisis yang didapat dari
penelitian yang dilakukan. Karenanya presentasi dalam bentuk pengetahuan yang
bisa dipahami semua orang adalah satu tahapan yang diperlukan. Dalam
presentasi ini, visualisasi juga bisa membantu mengkomunikasikan hasil temua
yang di dapat dalam data mining.
2.2. Clustering
Data mining di bagi dalam beberapa kelompok berdasarkan tujuan dan
hasil yang akan di peroleh, berikut adalah pembagian data mining : Asosiasi Rules
(Aturan Asosiasi), Clasification (Klasifikasi), Clustering (Pengelompokan),
Prediction (Prediksi), Forecasting (Peramalan). Perbedaan Clustering dan
Clasification adalah didalam pembagian data mining, Metode C45 dan Naive
11
Bayes adalah metode Clasification, Sedangkan Metode K-Means dan K-Medoids
adalah metode Clustering
Clustering merupakan pengelompokan terhadap record, yang berfungsi
memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.
(Luvia, Windarto, Solikhun, & Hartama, 2017) Clustering dapat juga dikatakan
sebagai identifikasi kelas objek yang memiliki kemiripan. Dengan menggunakan
teknik clustering kita bisa lebih lanjut mengidentifikasi kepadatan dan jarak
daerah dalam objek ruang dan dapat menemukan secara menyeluruh pola
distribusi dan korelasi antara atribut. K-Means Clustering merupakah suatu
algoritma yang berusaha untuk mempartisi / memisahkan atribut yang ada
kedalam satu atau lebih cluster atau kelompok atribut berdasarkan
karakteristiknya dan kesamaan yang hampir mirip, sehingga atribut yang
mempunyai karakteristik yang sama dapat dikelompokan dalam satu cluster yang
sama dan atribut yang mempunyai karakteristik yang berbeda dikelompokan
kedalam cluster yang lain. Cluster yang dihasilkan dapat memberikan knowledge
atau pengetahuan baru dan menarik, sehingga dapat digunakan dalam suatu
pengambilan keputusan.
2.3.Algoritma K-Means
Algoritma adalah urutan langkah langkah logis yang disusun secara
sistematis untuk menyelesaikan suatu masalah secara. Algoritma K-Means adalah
metode clustering berbasis jarak yang membagi data ke dalam sejumlah cluster
dan algoritma ini haya bekerja pada atribut numeric. Algoritma K-Means
12
termasuk partitioning clustering yang memisahkan data ke k daerah bagian yang
terpisah. Algoritma K-Means sangat terkenal karena kemudahan dan
kemampuannya untuk mengcluster data yang besar dan data outlier dengan sangat
cepat. (Darmi and Setiawan, 2016) Untuk itu digunakan algoritma K-Means yang
didalamnya membuat aturan sebagai berikut:
1) Jumlah Cluster perlu diinputkan
2) Hanya memiliki atribut bertip numeric.
Algoritma K-Means merupakan metode non-hierarki yang pada awalnya
mengambil sebagian banyaknya komponen populasi untuk dijadikan pusat cluster
awal. Pada tahap ini pusat cluster dipilih secara acak dari sekumpulan populasi
data. Berikutnya K-Means menguji masing-masing komponen di dalam populasi
data dan menandai komponen tersebut ke salah satu pusat cluster yang telah
didefinisikan tergantung dari jarak minimum antar komponen dengan tiap-tiap
cluster.Posisi puasat cluster akan dihitung kembali sampai semua komponen data
digolongkan kedalam tiap-tiap pusat cluster dan terakhir akan terbentuk posisi
pusat cluster yang baru
Dalam prosedur pembentukan K-Means Clustering terdapat langkah-langkah yang
dapat dilakukan, antara lain:
1) Tentukan k sebagai jumlah cluster yang ingin dibentuk.
2) Bangkitkan k centroid (titik pusat cluster) awal secara random.
3) Hitung jarak setiap data ke masing-masing centroid.
4) Setiap data memilih centroid yang terdekat.

13
5) Tentukan posisi centroid yang baru dengan cara menghitung nilai rata-rata dari
data-data yang terletak pada centroid yang sama.
6) Kembali ke langkah-3 jika posisi centroid baru dengan centroid yang lama
tidak sama.
2.4. Susu
Susu adalah cairan berwarna putih yang disekresikan oleh kelenjar
mammae (ambing) pada binatang mamalia betina, untuk bahan makanan dan
sumber gizi bagi anaknya. Susu adalah cairan berwarna putih yang disekresikan
oleh kelenjar mammae (ambing) pada binatang mamalia betina, untuk bahan
makanan dan sumber gizi bagi anaknya. Sebagian besar susu yang dikonsumsi
manusia berasal dari sapi, yang biasa disebut susu sapi. Sedangkan susu ternak
lain biasanya di ikuti nama ternak asal tersebut, misalnya susu kerbau, susu
kambing, susu unta dan sebagainya dan susu manusia disebut ASI atau dapat
disebut air susu ibu.
2.5.Susu Segar
Susu segar ialah cairan yang berasal dari ambing sapi sehat dan bersih,
yang di peroleh dengan cara pemerahan yang benar, yang kandungan alami nya
tidak dikurangi atau di tambah sesuatu apapun dan belum mendapatkan perlakuan
apapun kecuali pendinginan. (Indonesia & Nasional, 2011) Susu merupakan
bahan makanan yang istimewa bagi manusia karena kelezatan rasa dan
komposisinya yang ideal selain air susu mengandung semua zat yang dibutuhkan
14
oleh tubuh manusi, semua zat makanan yang terkandung didalam air susu dapat
diserap oleh darah dan dimanfaatkan oleh tubuh untuk memenuhi kebutuhan gizi
manusia. Susu juga salah satu asupan penting untuk memenuhi kebutuhan nutrisi.
Baik di konsumsi oleh anak anak, dan orang dewasa, dan susu juga mengambil
peranan penting dalam tingkat kecerdasan manusia. Hampir seluruh susu yang
dikonsumsi manusia berasal dari sapi perah, karena ternak sapi perah ini adalah
penghasil susu yang potensial. Beberapa ternak lain seperti kerbau, kambing, domba
dan kuda juga menghasilkan susu, tetapi masih dalam jumlah sedikit dan terbatas.
Susu yang berasal dari sapi perah lazim disebut susu, sedangkan susu dari ternak yang
lain diberi sebutan sesuai dengan nama hewan penghasilnya. Sebagai contoh, susu
dari kerbau disebut susu kerbau dan susu dari kambing disebut susu kambing.
Berdasarkan hasil penelitian Lely Anggriani Nababan, I Ketut Suada, Ida Bagus
Ngurah Swacita dalam jurnalnya yg berjudul “Ketahanan Susu Segar pada
Penyimpanan Suhu Ruang Ditinjau dari Uji Tingkat Keasaman, Didih, dan Waktu
Reduktase” menyimpulkan bahwa ketahanan susu segar pada suhu ruang selama
(4) empat jam ditinjau dari uji tingkat keasaman (pH), uji didih dan waktu
reduktase. (Nababan, Suada, Bagus, & Swacita, 2014) Dan juga berdasarkan hasil
penelitian Elisa Putri dalam jurnal nya yang berjudul “Kualitas protein susu sapi
segar berdasarkan waktu penyimpanan” menyimpulkan bahwa susu sapi segar
yang masih baik dikonsumsi sesuai dengan SNI susu segar No.01-3141-1992
sampai umur penyimpanan 6 jam di dalam lemari es pada suhu 4oC. (Putri, 2016)
15
2.5. Rapidminer Studio
Rapidminer merupakan perangkat lunak yang dibuat oleh Dr. Markus
Hofmann dari Institute of Technologi Blanchardstown dan Ralf Klinkenberg dari
rapid-i.com dengan tampilan GUI (Graphical User Interface) sehingga
memudahkan pengguna dalam menggunakan perangkat lunak ini. Perangkat lunak
ini bersifat open source dan dibuat dengan menggunakan program Java di bawah
lisensi GNU Public Licence dan Rapid Miner dapat dijalankan di sistem operasi
manapun. Dengan menggunakan Rapid Miner, tidak dibutuhkan kemampuan
koding khusus, karena semua fasilits sudah disediakan. Rapid Miner dikhususkan
untuk penggunaan data mining. Model yang disediakan juga cukup banyak dan
lengkap, seperti Model Bayesian, Modelling, Tree Induction, Neural Network dan
lain-lain (Haryati, Sudarsono and Suryana, 2015).
Penelitian yang dilakukan penulis menggunakan tool RapidMiner Studio versi
5.3, tampilan RapidMiner Studio versi 5.3 terdapat pada gambar 2.2. :
Gambar 2.2. Tampilan RapidMiner Studio versi 5.3

16
Keterangan pada Gambar 2.2. adalah :
a. Menu Bar, merupakan menu utama yang terletak dibawah Title Bar yang
berfungsi sebagai menu perintah untuk mengoperasikan tool RapidMiner
Studio versi 5.3
b. Repository View, merupakan komponen penting dalam Design Perspective
untuk mengolah dan menata proses serta dapat digunakan sebagai sumber
data.
c. Operator View, merupakan komponen yang digunakan untuk operator dalam
RapidMiner yang terdiri dari Data Access, Blending, Cleansing, dan lainnya
untuk dalam hal proses analisis.
d. Process View, merupakan langkah-langkah dalam proses analisis, sebagai
penghubung langkah-langkah proses dan sebagai media desain proses
langkah-langkah analisis.
e. Parameters View, merupakan komponen dalam hal menentukan parameter
dari operator yang digunakan, beberapa operator membutuhkan satu atau
lebih parameter agar dapat diindikasikan sebagai fungsionalitas yang baik dan
benar.
f. Help dan Comment View, merupakan komponen yang menunjukkan
penjelasan setiap operator yang digunakan.
g. Toolbox, merupakan komponen yang digunakan untuk proses penyimpanan,
membuat proses baru, proses eksekusi analisis, dan untuk mencari data,
operator dan membuka proses yang sudah ada.

17
2.6. UML (Unified Modelling Language)
UML (Unified Modelling Language) merupakan suatu metode
pemodelan secara visual untuk sarana perancangan sistem berorientasi objek
(Kurniawan, 2018). Beberapa tujuan atau fungsi dari penggunaan UML, antara
lain:
1. Dapat memberikan bahasa permodelan visual kepada pengguna dari berbagai
macam pemrograman maupun proses rekayasa.
2. Dapat menyatukan praktek-praktek terbaik yang ada dalam permodelan.
3. Bahasa permodelan visual yang ekspresif untuk mengembangkan sistem dan
untuk saling menukar model secara mudah.
4. Dapat berguna sebagai blue print, yang nantinya akan diketahui informasi
detail mengenai kode suatu program.
5. Dapat memodelkan sistem yang berkonsep berorientasi objek, tidak hanya
digunakan untuk memodelkan perangkat lunak (software) saja.
6. Dapat menciptakan suatu bahasa permodelan yang dapat dipergunakan oleh
manusia maupun oleh mesin.
Aplikasi ini menggunakan empat diagram UML diantaranya yaitu:
a. Use Case Diagram
Use case diagram merupakan interaksi antara sistem dan aktor, use case
diagram juga dapat mendeskripsikan tipe interaksi antara si pemakai sistem

18
dengan sistemnya. Berikut tabel simbol – simbol Use Case Diagram yang
tertera pada tabel 2.1 :
Tabel 2.1. Simbol-simbol Use Case Diagram
(Sumber: Urva and Siregar, 2015)
No. Gambar Nama Komponen Deskripsi
Menerangkan apa yang

1 Use Case
dikerjakan sistem
Menggambarkan orang,
2 Actor
sistem atau eksternal entitas.
Menggambarkan jangkauan
3 System Boundary
sistem.
Menggambarkan bagaimana
4 Association
actor terlibat dalam use case.
19
No. Gambar Nama Komponen Deskripsi
Dibuat ketika ada sebuah
5 Generalization keadaan yang lain/perlakuan
khusus.
<< Extend >> Perluasan dari use case lain
jika kondisi atau syarat

6 Extend
terpenuhi.
Menjelaskan bahwa use case

<< include >>
7 Include termasuk didalam use case
lain.
Hubungan dimana perubahan
terjadi pada suatu elemen
mandiri (independent) akan

8 Dependency
mempengaruhi elemen yang
bergantung padanya elemen
yang tidak mandiri.
Interaksi aturan dan elemen
lain yang bekerja sama untuk
9 Collaboration menyediakan perilaku yang
lebih besar dari jumlah dan
elemen-elemennya (sinergi).
20
b. Activity Diagram
Activity diagram atau diagram aktivitas merupakan salah satu jenis diagram
pada UML yang dapat memodelkan proses-proses apa saja yang terjadi pada
sistem. Berikut tabel simbol – simbol Activity Diagram yang tertera pada
tabel 2.2 :
Tabel 2.2. Simbol-simbol Activity Diagram
(Sumber: Urva and Siregar, 2015)
No. Simbol Nama Keterangan
Bagaimana objek dibentuk atau di

1 Titik Awal
awali.
Bagaimana objek dibentuk dan di

2 Titik Akhir
akhiri.
Masing-masing kelas antarmuka saling

3 Activity
berinteraksi satu sama lain
Digunakan untuk menggambarkan suatu
4 Decision keputusan/tindakan yang harus diambil
pada kondisi tertentu.
Untuk menggabungkan dua kegiatan

5 Fork
parallel menjadi satu
Line Digunakan untuk menghubungkan satu

6
Connector simbol dengan simbol lainnya.
21
c. Sequence Diagram
Sequence diagram merupakan interaksi objek berdasarkan urutan waktu, yang
dapat menghasilkan suatu tahapan seperti pada use case diagram.
d. Class Diagram
Class diagram digunakan untuk menampilkan kelas-kelas maupun paket-paket
yang ada pada suatu sistem yang nantinya akan digunakan.
e. Package Diagram
Package Diagram digunakan untuk mengelompokkan elemen diagram UML
ke dalam tingkat pembangunan yang lebih tinggi yaitu berupa sebuah paket.
2.7 Flowchart
Flowchart atau bagan alir merupakan skema yang menggambarkan
urusan kegiatan dari suatu program dari awal sampai akhir. Berikut tabel simbol –
simbol Flowchart yang tertera pada tabel 2.4 :
Tabel 2.3. Simbol-simbol Flowchart
No. Simbol Fungsi
Terminal yaitu start dan stop atau end suatu

1
alur proses.
Preparation atau persiapan yaitu pemberian

2
awal dan deklarasi variabel lain-lain.
22
No Simbol Fungsi
Input/output yaitu proses pemasukan atau

3
pengeluaran.
Process yaitu proses pengolahan data yang

4
dilakukan komputer.
Decision yaitu proses pengambilan keputusan
5 untuk memilih satu keputusan diantara dua
atternatif.
6 Subroutine yaitu kumpulan langkah-langkah.
On Page Connector yaitu tanda penghubing

7
dalam halaman yang sama.
Document yaitu menyatakan simbol untuk

8
data yang berbentuk kertas maupun informasi
Off Page Connector yaitu tanda peghubung

9
kehalaman lain
10 Arrow yaitu petunjuk arah aliran algoritma
(Sumber: Urva and Siregar 2015)

23
2.8. Penelitian Terdahulu
Beberapa peneilitan terdahulu tentang Clustering dapat dilihat pada tabel
2.5. berikut ini :
Tabel 2.4. Penelitian Terdahulu
No. Autor Judul Resume
1. (Sadewo, PENERAPAN DATA Data diolah untuk memperolah
Windarto, MINING PADA nilai dari populasi ayam ras
& Hartama, POPULASI DAGING pedaging menurut provinsi.
2016) AYAM RAS Data tersebut diolah
PEDAGING DI menggunakan Ms. Excel untuk
INDONESIA ditentukan nilai centroid dalam
BERDASARKAN 3 cluster yaitu cluster tingkat
PROVINSI populasi tinggi, cluster tingkat
MENGGUNAKAN populasi sedang dan cluster
K-MEANS tingkat populasi rendah.
CLUSTERING
2. (Bastian et PENERAPAN Hasil dari metode Algoritma

al., n.d.)
ALGORITMA K- K-means clustering data
MEANS mining dapat digunakan untuk
CLUSTERING metode pengendalian
ANALYSIS PADA persediaan pada Puskesmas
PENYAKIT Pandanaran, sehingga apabila

24
MENULAR akan dilakukan pengadaan
MANUSIA (STUDI persediaan obat pada tahun
KASUS 2014, petugas dapat
KABUPATEN melihat daftar Puskesmas
MAJALENGKA) terbanyak yang menderita
penyakit menular.
3. (Gaussian,
2015) PENGELOMPOKAN Berdasarkan nilai yang
PROVINSI DI diperoleh dari Davies-Bouldin
INDONESIA Index untuk jumlah klaster dua,
BERDASARKAN tiga, empat, dan lima diperoleh
KARAKTERISTIK hasil bahwa jumlah klaster tiga
KESEJAHTERAAN adalah yang terbaik. Hal ini
RAKYAT diketahui karena jumlah klaster
MENGGUNAKAN tiga memiliki nilai DBI
METODE K-MEANS terkecil.
CLUSTER
4. (Nasari, Penerapan Algoritma Pusat cluster yang diperoleh

Jhony, &
Sianturi, K-Means Clustering yaitu cluster pertama dan
n.d.)
Untuk kedua . Pusat cluster pertama
Pengelompokkan merupakan daerah penyebaran

25
Penyebaran Diare Di diare untuk jumlah penderita
Kabupaten Langkat tingkat menengah. Pusat
cluster kedua merupakan
daerah-daerah pusat
penyebaran diare, untuk itu
pada daerah-daerah pusat
cluster kedua harus menjadi
daerah perhatian pemerintah
untuk penanganan diare.
5. (Metisen & ANALISIS Proses cluster secara hirarki

Sari, 2015)
CLUSTERING
dengan menggunakan metode
MENGGUNAKAN
K-means menghasilkan sebuah
METODE K-MEANS
informasi gambaran penjualan
DALAM
PENGELOMPOKKA terkluster atau terkelompok.
N PENJUALAN
Hasil dari pemrosesan data
PRODUK PADA
menggunakan beberapa
SWALAYAN
software data mining tersebut
FADHILA
pada intinya sama. Laris dan
kurang laris
BAB 3
METODOLOGI PENELITIAN
3.1. Metode Penelitian
Metode penelitian merupakan langkah yang dimiliki dan harus dilakukan
oleh peneliti dalam rangka untuk mengumpulkan informasi atau data serta
melakukan investigasi pada data yang telah didapatkan. Metode penelitian
memberikan gambaran rancangan penelitian yang meliputi antara lain: metode
pengumpulan data, analisa data, sumber data, kontribusi penelitian, lokasi
penelitian dan waktu pengumpulan data.
3.1.1. Metode Pengumpulan Data
Pengumpulan data dilakukan untuk memperoleh informasi yang
dibutuhkan dalam rangka mencapai tujuan penelitian. Berikut beberapa hal yang
dilakukan penulis dalam mengumpulkan data, yaitu :
1. Data yang dikumpulkan dalam penelitian ini merupakan data sekunder.
Biasanya data sekunder merupakan data yang telah tersedia dalam
berbagai bentuk seperti statistik atau data yang sudah diolah sedemikian
rupa sehingga sudah siap digunakan
2. Dokumentasi adalah pengumpulan data yang dilakukan untuk
mendapatkan data sekunder dari dokumen-dokumen berupa buku dan
jurnal yang relavan dengan penelitian ini.

24
3. Adapun data yang digunakan adalah data produksi susu segar di indonesia
mulai dari tahun 2000 hingga tahun 2017 yang di peroleh dari badan pusat
statistik.
Data yang digunakan dalam penelitian ini dapat dilihat pada gambar 3.1 :
Gambar 3.1 Data Statistik Hasil Produksi Susu Segar di Indoneisa

tahun 2000 - 2017
(Sumber : Badan Pusat Statistik)
28
3.1.2. Analisis Data
Analisis data merupakan upaya atau cara untuk mengolah data menjadi
informasi sehingga karakteristik data tersebut bisa dipahami dan bermanfaat untuk
solusi permasalahan, tertutama masalah yang berkaitan dengan penelitian. Data
yang diperoleh untuk penelitian ini adalah produksi susu segar di indonesia per
provinsi dari tahun 2000 hingga 2017. Didalam penelitian ini hanya
menggunakan 27 provinsi di indonesia yaitu provinsi : Aceh, Sumatera Utara,
Sumatera Barat, Riau, Jambi, Sumatra Selatan, Bengkulu, Lampung, Kep.Bangka
Belitung, DKI Jakarta, Jawa Barat, Jawa Tengah, Daerah Istimewa Yogyakarta,
Jawa Timur, Banten, Bali, NTT, NTB, Kalimantan Barat, Kalimantan Selatan,
Kalimantan Timur, Kalimantan Utara, Sulawesi Selatan, Sulawasi Tenggara,
Gorontalo, Sulawesi Barat, Papua. Provinsi lainnya seperti : Kepulauan Riau,
Kalimantan Tengah, Sulawesi Utara, Sulawesi Tengah, Maluku, Maluku Utara,
dan Papua Barat tidak dimasukan ke dalam penelitian dikarenakan tidak
mempunyai data produksi susu segar yang valid.
3.1.3. Kontribusi Penelitian
Diharapkan penelitian ini dapat membantu mengelompokan daerah di
indonesia yang memproduksi susu segar. Dengan mengkluster hasil produksi susu
segar di indoneis menjadi 2 bagian yaitu cluster tinggi, dan cluster rendah.
Sehingga daerah dengan cluster rendah akan lebih di perhatikan dan lebih di
tingkatan produksi susu segarnya. Dan semua upaya itu akan berakibat penurunan
24
nilai impor susu segar di indonesia, serta untuk memenuhi kebutuhan susu
nasional cukup dengan mengonsumsi susu segar hasil produksi dalam negri.
3.1.4. Lokasi Penelitian dan Waktu Pengumpulan Data
Penetapan lokasi penelitian merupakan tahap yang sangat penting dalam
penelitian, karena dengan ditetapkannya lokasi penelitian berarti objek dan tujuan
sudah ditetapkan sehingga mempermudah penulis dalam melakukan penelitian.
Lamanya waktu yang dibutuhkan untuk menyelesaikan pengumpulan data
penelitian ini selama 1 bulan yang dimulai pada 1 Oktober 2018 sampai dengan 1
November 2018.
3.2. Analisis dan Perancangan Sistem
Di dalam analisis dan metode perancangan sistem terdapat rancangan
yang digunakan dalam membangun sistem atau perhitungan-perhitungan
algoritma dari metode K-Means Clustering.
3.2.1. Analisa Permasalahan
Permasalahan yang menjadi dasar dilakukannya penelitian ini adalah
bagaimana mengelompokkan daerah penghasil susu segar dalam 2 cluster yaitu
tinggi dan rendah. Sehingga daerah produksi susu segar yang tinggi dan daerah
produksi susu segar yang rendah.

24
3.2.2. Algoritma K-Means
Permasalahan yang sudah dianalisa, selanjutnya penulis menganalisa
daerah penghasil susu segar di indonesia dengan menggunakan Data Mining
algoritma K-Means Clustering. Algoritma K-Means selanjutnya akan melakukan
pengulangan langkah-langkah berikut sampai terjadi kestabilan :
1. Menentukan banyak cluster
Pada penelitian ini, terdapat tiga cluster yaitu cluster untuk daerah penghasil susu
tinggi (C1) dan daerah penghasil susu rendah(C2).
2. Menentukan titik pusat (centroid)
Langkah selanjutnya yaitu dengan menetukan titik pusat (centroid) dari tiap-tiap
cluster.
3. Menghitung jarak setiap objek ke titik pusat (centroid)
Selanjutnya untuk melakukan cluster setelah menentukan titik pusat adalah
dengan menghitung jarak setiap data dengan titik pusat yang sudah ditentukan
sebelumnya. Rumus untuk menghitung jarak setiap objek ke titik pusat adalah :
Dimana x adalah dataset jumlah produksi susu segar, dataset yang digunakan
untuk perhitungan Datamining ini adalah produksi susu segar tinggi dan rendah.
Sedangkan y adalah titik pusat yang sudah ditentukan secara acak (random).
4. Menghitung jarak setiap data hasil produksi per provisi terhadap pusat cluster
menggunakan rumus (3).
5. Menentukan posisi cluster masing-masing data hasil produksi per provisi
berdasarkan jarak minimum data terhadap pusat cluster.

24
6. Menghitung nilai titik pusat centroid hasil iterasi dengan menggunakan rumus
(2).
7. Memeriksa kondisi berhenti proses iterasi, jika nilai centroid hasil iterasi
dengan nilai centroid sebelumnya bernilai sama atau nilai centroid sudah
optimal serta posisi cluster data hasil produksi tidak mengalami perubahan
lagi maka proses iterasi berhenti.
Kerangka algoritma K-Means Clustering dapat dilihat pada gambar 3.2 :
Gambar 3.2 Tahapan Algoritma K-Means

24
Perhitungan Metode K-Means
Data Olahan
No Provinsi Rata - Rata

1 ACEH 570,7255556 Parameter Nilai Ket
2 SUMUT 2809,743889 Cluster : 2 (Max/Min)
3 SUMBAR 964,8061111 Data : 27 (Provinsi)
4 RIAU 100,2954545 Atribut : 18 (Tahun)
5 JAMBI 13,61
6 SUMSEL 191,1594444
7 BENGKULU 694,534375
8 LAMPUNG 253,6533333
9 KEP. BABEL 150,791
10 DKI 34537,86444
11 JABAR 239845,3428
12 JATENG 92421,30111
13 DIY 6233,501111
14 JATIM 372695,6029
15 BANTEN 29,00818182
16 BALI 114,7569231
17 NTB 28
18 NTT 9,2825
19 KALBAR 85,02411765
20 KALSEL 161,4816667
21 KALTIM 77,634
22 KALUT 3
23 SULSEL 14089,70533
24 SULTENG 27,5225
25 GORONTALO 22,33333333
26 SULBAR 50,75
27 PAPUA 46,18
24
Iterasi 1
No Provinsi Rata - Rata C1 C2

1 ACEH 570,7255556 372124,8773 567,7255556
2 SUMUT 2809,743889 369885,859 2806,743889
3 SUMBAR 964,8061111 371730,7968 961,8061111
4 RIAU 100,2954545 372595,3074 97,2954545
5 JAMBI 13,61 372681,9929 10,61
6 SUMSEL 191,1594444 372504,4435 188,1594444
7 BENGKULU 694,534375 372001,0685 691,534375
8 LAMPUNG 253,6533333 372441,9496 250,6533333
9 KEP. BABEL 150,791 372544,8119 147,791
10 DKI 34537,86444 338157,7385 34534,86444
11 JABAR 239845,3428 132850,2601 239842,3428
12 JATENG 92421,30111 280274,3018 92418,30111
13 DIY 6233,501111 366462,1018 6230,501111
14 JATIM 372695,6029 0 372692,6029
15 BANTEN 29,00818182 372666,5947 26,00818182
16 BALI 114,7569231 372580,846 111,7569231
17 NTB 28 372667,6029 25
18 NTT 9,2825 372686,3204 6,2825
19 KALBAR 85,02411765 372610,5788 82,02411765
20 KALSEL 161,4816667 372534,1212 158,4816667
21 KALTIM 77,634 372617,9689 74,634
22 KALUT 3 372692,6029 0
23 SULSEL 14089,70533 358605,8976 14086,70533
24 SULTENG 27,5225 372668,0804 24,5225
25 GORONTALO 22,33333333 372673,2696 19,33333333
26 SULBAR 50,75 372644,8529 47,75
27 PAPUA 46,18 372649,4229 43,18
24
Jarak Pusat
No Nilai
Terpendek Hasil C1 C2 Cluster
1 567,7255556 C2 1 Iterasi 1
2 2806,743889 C2 1 C1= Max 372695,6
3 961,8061111 C2 1 C2= Min 3,0
4 97,2954545 C2 1
5 10,61 C2 1 Cluster Provinsi Hasil
6 188,1594444 C2 1 C1 (11 ,14) 2
7 691,534375 C2 1 (1,2,3,4,5,6,7
8 250,6533333 C2 1 8,9,10,12,13
9 147,791 C2 1 14,15,16,17,
10 34534,86444 C2 1 C2 19,20,21,22 25
11 132850,2601 C1 1 23,24,25,26,27
12 92418,30111 C2 1
13 6230,501111 C2 1
14 0 C1 1
15 26,00818182 C2 1
16 111,7569231 C2 1
17 25 C2 1
18 6,2825 C2 1
19 82,02411765 C2 1
20 158,4816667 C2 1
21 74,634 C2 1
22 0 C2 1
23 14086,70533 C2 1
24 24,5225 C2 1
25 19,33333333 C2 1
26 47,75 C2 1
27 43,18 C2 1
24
Iterasi 2
Nilai Rata-
No Provinsi
C1 C2 Rata C1 C2
1 ACEH 1 570,7255556 305699,7473 5576,741019
2 SUMUT 1 2809,743889 303460,729 3337,722686
3 SUMBAR 1 964,8061111 305305,6667 5182,660464
4 RIAU 1 100,2954545 306170,1774 6047,171121
5 JAMBI 1 13,61 306256,8629 6133,856575
6 SUMSEL 1 191,1594444 306079,3134 5956,307131
7 BENGKULU 1 694,534375 305575,9385 5452,9322
8 LAMPUNG 1 253,6533333 306016,8195 5893,813242
9 KEP. BABEL 1 150,791 306119,6819 5996,675575
10 DKI 1 34537,86444 271732,6084 28390,39786
11 JABAR 1 239845,3428 66425,13005 233697,8762
12 JATENG 1 92421,30111 213849,1717 86273,83453
13 DIY 1 6233,501111 300036,9717 86,03453594
14 JATIM 1 372695,6029 66425,13005 366548,1363
15 BANTEN 1 29,00818182 306241,4647 6118,458393
16 BALI 1 114,7569231 306155,7159 6032,709652
17 NTB 1 28 306242,4729 6119,466575
18 NTT 1 9,2825 306261,1904 6138,184075
19 KALBAR 1 85,02411765 306185,4487 6062,442457
20 KALSEL 1 161,4816667 306108,9912 5985,984908
21 KALTIM 1 77,634 306192,8389 6069,832575
22 KALUT 1 3 306267,4729 6144,466575
23 SULSEL 1 14089,70533 292180,7675 7942,238755
24 SULTENG 1 27,5225 306242,9504 6119,944075
25 GORONTALO 1 22,33333333 306248,1395 6125,133242
26 SULBAR 1 50,75 306219,7229 6096,716575
27 PAPUA 1 46,18 306224,2929 6101,286575
24
Jarak Pusat
No Nilai
Terpendek Hasil C1 C2 Cluster
1 5576,741019 C2 1 Iterasi 2
2 3337,722686 C2 1 C1= Max 306270,5
3 5182,660464 C2 1 C2= Min 6147,5
4 6047,171121 C2 1
5 6133,856575 C2 1 Cluster Provinsi Hasil
6 5956,307131 C2 1 C1 (11 ,14) 2
7 5452,9322 C2 1 (1,2,3,4,5,6,7
8 5893,813242 C2 1 8,9,10,12,13
9 5996,675575 C2 1 14,15,16,17,
10 28390,39786 C2 1 C2 19,20,21,22 25
11 66425,13005 C1 1 23,24,25,26,27
12 86273,83453 C2 1
13 86,03453594 C2 1
14 66425,13005 C1 1
15 6118,458393 C2 1
16 6032,709652 C2 1
17 6119,466575 C2 1
18 6138,184075 C2 1
19 6062,442457 C2 1
20 5985,984908 C2 1
21 6069,832575 C2 1
22 6144,466575 C2 1
23 7942,238755 C2 1
24 6119,944075 C2 1
25 6125,133242 C2 1
26 6096,716575 C2 1
27 6101,286575 C2 1
Hasil dari iterasi 1 dan 2 menyatakan nilai yg sama, yaitu Cluster tinggi dengan 2
provinsi dan Cluster rendah dengan 25 provinsi. Jika hasil cluster sudah stabil dan
tidak mengalami perubahan hasil iterasi, maka proses iterasi berhenti

24
3.2.3 Perancangan Penelitian
Diagram alir model penelitian disajikan dalam rancangan flowchart pada
gambar 3.3.
Gambar 3.3 Flowchart Perancangan Penelitian
Proses alur flowchart pada gambar 3.3 adalah sebagai berikut :
1. Identifikasi Masalah
Merupakan pengenalan suatu masalah, dan tahap awal dalam proses penelitian.
Permasalahan penelitian ini bagaimana menentukan daerah penghasil susu tinggi
dan daerah penghasil susu rendah.
2. Teknik Pengumpulan Data
Data penelitian ini diperoleh dari Badan Pusat Statistik
3. Pengolahan Data
Pada tahap ini, data diolah untuk mendapatkan hasil yang kemudian dapat diolah
ke tahap berikutnya sehingga menghasilkan informasi yang tepat.

24
4. Transformasi dengan Metode K-Means Clustering
Transformasi data, data yang berjenis alfabet seperti nama blok harus dilakukan
proses inisialisasi data terlebih dahulu ke dalam bentuk angka/numerikal.
Kemudian mengelompokkan data yang sudah ada dalam dua kelompok yaitu
tinggi dan rendah, dengan metode K-Means Clustering.
5. Olah Data di Rapidminer
Pengujian disini kita menggunakan sebuah software Rapidminer, dengan
pengujian data menggunakan software kita akan membandingkan bagaimana hasil
pengolahan data secara manual dengan hasil pengolahan data menggunakan
sebuah software
3.2.4. Permodelan Di RapidMiner
Berikut ini langkah – langkah pengujian data K-Means Clustering pada
Rapidminer :
1. Retrieve sebagai tempat penyimpanan data cluster
2. K-Means untuk proses clustering
3. Cluster distance performance untuk tampilan output cluster
Pengujian menggunakan algoritma K-Means Clustering dengan
menggunakan Rapidminer dapat dilihat pada Gambar 3.4 :

24
Gambar 3.4 Tampilan di RapidMiner Dengan Menggunakan Clustering

24
BAB 4
HASIL DAN PEMBAHASAN
4.1. Hasil
Hasil penelitian ini disajikan sesuai penelitian yang dilakukan. Data yang
digunakan dalam penelitian ini adalah data hasil produksi susu segar per provinsi
di Indonesia dimulai dari tahun 2000 hingga tahun 2017. Data yang diperoleh
untuk penelitian ini adalah produksi susu segar di indonesia per provinsi dari
tahun 2000 hingga 2017. Didalam penelitian ini hanya menggunakan 27 provinsi
di indonesia . 7 Provinsi lainnya tidak dimasukan ke dalam penelitian dikarenakan
tidak mempunyai data produksi susu segar yang valid. Data tersebut di
kelompokkan menjadi 2 bagian yaitu : daerah penghasil susu tinggi dan daerah
penghasil susu rendah.
Kumpulan data yang diperoleh digunakan sebagai data masukan dalam
membuat model aturan menggunakan algoritma K-Means Clustering
menggunakan software rapidminer. Dalam mengetahui provinsi mana saja yang
masuk ke dalam kelompok daerah penghasil susu tinggi dan daerah penghasil
susu rendah. penulis akan menampilkan gambaran model aturan dalam
mengkelompokn hasil produksi susu segar menggunakan algoritma K-Means
Clustering.
24
4.1.1. Menu
Berikut akan dijelaskan bagian dari menu awal pada tools rapidminer
seperti tampilan awal dari rapidminer dan akan dimulai dengan menu new
process.
Gambar 4.1. Tampilan Awal Rapidminer
Pada tampilan berikut terdapat beberapa menu pilihan seperti New
Process, Open Recent Process, Open Process, Open Template dan Online
Tutorial. Penjelasan dari menu diatas adalah sebagai berikut :
1. New Process Menu ini berisikan tampilan awal jika kita akan membuat
proses baru dengan data baru yang belum pernah ada dalam tools ini.
2. Open Recent Process Berfungsi untuk menampilkan dan membuka
proses yang baru saja dibuat dengan jangka waktu tertentu, biasanya
akan langsung muncul pada tampilan awal tools tanpa harus mencari
pada penyimpanan lokal.
3. Open Process Menu ini berfugsi untuk membuka proses yang telah
dibuat sebelumnya yang telah kita simpang di penyimpanan lokal.

24
4. Open Template Menu ini berisikan pilihan-pilihan proses lain yang
telah disediakan oleh tools rapidminer.
5. Online Tutorial Menu ini digunakan untuk memulai tutorial atau
tahapan secara online. Tutorial berfungsi untuk memberikan
pengenalan dan beberapa konsep data mining.
Dikarenakan data yang akan diuji adalah data baru, maka pilih New
Process. Maka akan muncul jendela seperti gambar berikut :
Gambar 4.2. New Process untuk Import Data Excel
4.1.2. Masukan (Input)
Sistem Menjelaskan cara memasukkan data baru yang akan dieksekusi
lebih lanjut, pada hal ini data yang akan di eksekusi berupa data excel. Tahapan
dapat dilihat pada gambar dibawah ini.

24
Gambar 4.3. Input Data Read Excel
Klik pada bagian kiri bawah tab repositories lalu pilih “Import Read
Excel”. Kemudian akan muncul tampilan sperti gambar 4.4.
Gambar 4.4. Tampilan Data Import Tahap 1
Pada data import configuration wizard kemudian pilih tempat kita
menyimpan data yang akan digunakan. Selanjutnya pilih file name data yang
digunakan. Kemudian klik next pada bagian kanan bawah.

24
Selanjutnya akan muncul tampilan seperti gambar berikut :
Gambar 4.5. Data Import Tahap 2
Gambar diatas menunjukkan isi data yang akan di proses. Pilih sheet
pada data serta blok data yang akan di proses. Pilih next next hinga finish dan
kemudian simpan file.

24
Pada tahap 4 dilakukan pemilihan tipe data dimana pada bagian No
atribute diubah menjadi tipe”id” dan Keterangan diberi tipe “label”.Lalu pilih
next.
4.1.3. Pemrosesan Sistem
Pada tahap ini akan dijelaskan tahapan-tahapan proses penggunaan K-
Means di dalam Rapidminerdata yang telah di import. Tahapan pertama dengan
meng klik Clustering and Segmentation lalu pilih K-Means dapat dilihat pada
gambar 4.8. berikut :

24
Gambar 4.8. Pemrosesan Data Tahap 1
Drag atau klik dan tahan data yang telah disimpan pada repositories ke
lembar kerja main process. Untuk membentuk pengelompokan, data perlu
dihubungkan dengan operator Clustering. Dapat dilihat pada gambar 4.9.
Gambar 4.9. Pemrosesan Data Tahap 2

24
4.1.4. Keluaran (Output) Sistem
Untuk mendapatkan hasil pengelompokan maka pada tahap selanjutnya
dapat dilakukan dengan cara mengklik tada panah biru yang terdapat diposisi
tengah atas pada bagian toolbar. Pada tahap ini akan menampilkan hasil akhir
serta langkah terakhir dalam penggunaan tools rapidminer ini. Dapat dilihat pada
gambar 4.10.
Gambar 4.10. Nilai Cluster Model
Keterangan :
1. Jumlah Cluster 0 (Rendah) berjumlah 25 items
2. Jumlah Cluster 1 (Tinggi) berjumlah 2 items
3. Jumlah keseluruhan items adalah 27
Sehingga dapat diketahui hasil pengelompokan dari rapidminer 5.3 berikut ini
dapat dilihat pada gambar 4.11.

24
Gambar 4.11. Hasil Pengelompokan
Berdasarkan pada gambar 4.11. dapat diketahui bahwa pada kelompok
tinggi memiliki banyak node yaitu 2, sedangkan pada kelompok rendah memiliki
25 node.
4.2. Pembahasan
Berdasarkan dari penjelasan diatas mengenai tahap-tahap penggunaan
serta hasil yang telah ditampilkan maka berikut akan dibahas mengenai
keterkaitan dari hasil yang didapat antara perhitungan manual algoritma dengan
hasil yang ditampilkan oleh tools rapidminer.
4.2.1. Validasi Data
Dalam melakukan validasi data terdapat hal-hal yang harus diperhatikan
diantaranya : perhitungan manual algoritma harus telah menampilkan hasil akhir
berupa Cluster, serta data yang digunakan haruslah data yang valid dan sama
dengan yang dipakai pada tools rapidminer.

24
Gambar 4.12. Tampilan Data Perhitungan Manual
Gambar 4.12. menampilkan data yang digunakan dalam penelitian manual
Gambar 4.13. Tampilan Data Perhitungan Tools Rapidminer
Gambar 4.13. menampilkan data pada perhitungan atau pengujian data
dengan tools rapidminer.

24
4.2.2. Spesifikasi Kebutuhan Sistem
1. Kebutuhan Software
Beberapa software yang mendukung untuk proses perancangan hingga
penyelesaian diantaranya :
a. Microsoft Excel 2010.
b. Rapidminer versi 5.3.
2. Kebutuhan Hardware
Untuk spesifikasi hardware pendukung program yang digunakan :

a. Komputer dengan prossecor Dual Core .
b. Memory dengan kapasitas 2 GB sebagai pengatur kecepatan
program saat dijalankan.
c. Harddisk dengan kapasitas 100 GB sebagai tempat penyimpanan
data yang cukup besar.
4.2.3 Prosedur Kerja Sistem
Adapun prosedur kerja sistem mengelompokan produksi susu segar di
indonesia berdasarkan provinsi menggunakan tools rapidminer sebagai berikut:
1. User menggunakan komputer untuk memulai/ start tools rapidminer.
2. Klik bagian kiri bawah tab repositories lalau pilih “ Import Read
Excel”.
3. Klik Import configuration wizard Pilih data yg ingin digunakan. Klik
next hingga finish.

24
4. Klik bagian kiri bawah tab repositories lalau pilih “ Clustering and
segmentation” lalu pilih K-Means.
5. Hubungkan Operator Excel dengan Operator K-Means.
6. Klik Tanda Panah biru untuk memproses pengelompokan K-Means.
7. Muncul hasil dari pengelompokan.
4.2.3. Kelemahan dan Kelebihan Sistem
Adapun kelemahan dan kelebihan sistem sebagai berikut:
1. Kelemahan Sistem
Adapun kelemahan sistem tergantung pada data awal yang digunakan.
Perhitungan algoritma K-Means tidak efektif jika data memiliki nilai 0.
2. Kelebihan Sistem
Sedangkan kelebihan sistem adalah sangat efektif untuk
mengelompokan data dengan jumlah banyak.

24
BAB 5
KESIMPULAN DAN SARAN
5.2. Kesimpulan
Adapun kesimpulan yang dapat diambil pada sistem pakar untuk
mendiagnosa penyakit kelapa sawit ini adalah sebagai berikut:
1. Algoritma K-Means Clustering ini dapat membantu peneliti
mengelompokan produksi susu segar pada setiap provinsi di
indonesia.
2. Aplikasi Rapidminer ini dapat membantu peneliti mengelompokan
produksi susu segar pada setiap provinsi di indonesia.
5.2. Saran
Beberapa saran yang dapat penulis berikan untuk dapat mengembangkan
penelitian ini lebih jauh,ada beberapa saran yang harus diterapkan guna
pengembangan lebih lanjut sebagai berikut:
1. Gunakan lah data yaang tidak memiliki nilai nol, sehingga perhitungan
algoritma K-Means Clustering akan lebih optimal.
2. Penelitian ini masih memiliki banyak kekurangan. Diharapkan kepada
para peneliti yang lain untuk dapat menggunakan penelitian ini sebagai
bahan ilmiah untuk melanjutkan mengelompokan produksi susu segar
pada setiap provinsi di indonesia.

24
DAFTAR PUSTAKA
Darmi, Y., & Setiawan, A. (2016). PENERAPAN METODE CLUSTERING K-

MEANS DALAM, 12(2), 148–157
Haryati, S., Sudarsono, A. and Suryana, E. (2015) ‘Implementasi Data Mining untuk
Memprediksi Masa Studi Mahasiswa Menggunakan Algoritma C4.5’, Jurnal
Media Infotama, 11(2), pp. 130–138.
Ii, B. A. B., & Pustaka, T. (2004). Faktor-faktor yang..., Ratu Nurchoiriah, FKM UI,
2009 10.
Indonesia, S. N., & Nasional, B. S. (2011). Susu segar-Bagian 1: Sapi.
Kurniawan, T. A. (2018) ‘PEMODELAN USE CASE (UML) : EVALUASI
TERHADAP BEBERAPA KESALAHAN DALAM PRAKTIK’, Jurnal
Teknologi Informasi dan Ilmu Komputer (JTIIK), 5(1), pp. 77–86. doi:
10.25126/jtiik.201851610.
Lestari, D. P. (2016). PERANCANGAN SISTEM CLUSTERING SUSU SAPI
DENGAN MENGGUNAKAN METODE K - MEANS.
Luvia, Y. S., Windarto, A. P., Solikhun, S., & Hartama, D. (2017). Penerapan Algoritma
C4.5 Untuk Klasifikasi Predikat Keberhasilan Mahasiswa Di Amik Tunas
Bangsa. Jurasik (Jurnal Riset Sistem Informasi Dan Teknik Informatika), 1(1),
75. https://doi.org/10.30645/jurasik.v1i1.12
Riveranda, O., Nengsih, W., Kom, S., & Kom, M. (2017). K-Means Analysis
Klasterisasi Kasus HIV / AIDS di Indonesia K-Means Analysis Klasterisasi
Kasus HIV / AIDS di Indonesia, (September 2016).
Sadewo, M. G., Windarto, A. P., & Hartama, D. (2016). PENERAPAN DATAMINING
PADA POPULASI DAGING AYAM RAS PEDAGING DI INDONESIA
BERDASARKAN PROVINSI MENGGUNAKAN K-MEANS, 60–67.
Urva, G. & Siregar, H.F. 2015, ‘Pemodelan UML E-Marketing Minyak Goreng’, Jurnal
Teknologi dan Sistem Informasi, vol. 1, no. 9, pp. 92–101

TEKNIK DATA MINING DALAM CLUSTERING PRODUKSI SUSU SEGAR DI INDONESIA

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

TEKNIK DATA MINING DALAM CLUSTERING PRODUKSI SUSU SEGAR DI INDONESIA

Diunggah oleh

Hak Cipta:

Format Tersedia

TEKNIK DATA MINING DALAM CLUSTERING

PRODUKSI SUSU SEGAR DI INDONESIA

Diajukan Guna Memenuhi Salah Satu Syarat

ILHAM SAFITRA DAMANIK

SEKOLAH TINGGI ILMU KOMPUTER

Milk is an important intake to meet nutritional needs. Good for consumption by

Halaman Judul ................................................................................................ i

Abstract .......................................................................................................... iii

Daftar Isi ......................................................................................................... iv

Daftar Tabel ................................................................................................... vi

Daftar Gambar ................................................................................................ vii

Daftar Lampiran ............................................................................................. viii

BAB 1 PENDAHULUAN ........................................................................ 1

1.1. Latar Belakang Masalah ....................................................... 1

1.2. Perumusan Masalah ............................................................. 3

1.3. Batasan Masalah ................................................................... 4

1.4. Tujuan Penelitian ................................................................. 5

1.5. Manfaat Penelitian ............................................................... 5

1.6. Sistematika Penelitian .......................................................... 6

BAB 2 TINJAUAN PUSTAKA .............................................................. 8

2.1. Data Mining ......................................................................... 8

2.2. Clustering ............................................................................. 10

2.3. Algoritma K-Means .............................................................. 11

2.4. Susu Segar ............................................................................ 12

2.5. Rapidminer Studio ............................................................... 13

2.6. UML (Unified Modelling Language) ................................... 15

2.8. Penelitian Terdahulu ........................................................... 21

BAB 3 METODOLOGI PENELITIAN ................................................. 23

3.1. Metode Penelitian .................................................................. 23

3.1.1. Metode Pengumpulan Data ...................................... 23

3.1.2. Analisis Data ............................................................ 25

3.1.3. Kontribusi Penelitian ................................................ 25

3.1.4. Lokasi Penelitian dan Waktu Pengumpulan Data .... 25

3.2. Analisis dan Perancangan Sistem ......................................... 26

3.2.1. Analisa Permasalahan .............................................. 26

3.2.2. Algoritma K-Means .................................................. 26

3.2.3. Perhitungan Metode K-Means ................................. 28

3.2.4. Data Olahan .............................................................. 31

3.2.5. Iterasi 1 ...................................................................... 32

3.2.6. Iterasi 2 ...................................................................... 34

3.2.7. Perancangan Penelitian ............................................ 36

3.2.8. Pemodelan di RapidMiner ........................................ 38

Daftar Pustaka ................................................................................................ 39

Tabel 2.1. Simbol-Simbol Use Case Diagram .......................................... 16

Tabel 2.2. Simbol-Simbol Activity Diagram ............................................. 18

Tabel 2.3. Simbol-simbol Flowchart ......................................................... 19

Tabel 2.4. Penelitian Terdahulu ................................................................. 21

Tabel 3.1. Data Mentah .............................................................................. 28

Tabel 3.2. Data Olahan .............................................................................. 31

Tabel 3.3. Iterasi 1 ..................................................................................... 32

Tabel 3.4. Iterasi 2 ..................................................................................... 34

Gambar 2.1. Tahapan Proses Data Mining .................................................. 8

Gambar 2.2. Tampilan RapidMiner Studio versi 8.1 .................................. 14

Gambar 3.2. Tahapan Algoritma K-Means .................................................. 36

Gambar 3.3. Flowchart Perancangan Penelitian .......................................... 36

Gambar 3.4. Tampilan di RapidMiner Dengan Menggunakan Clustering . 38

Fotokopi Surat Permohonan Seminar Proposal ............................................. L-1

Fotokopi Persetujuan ACC ............................................................................ L-2

1.1. Latar Belakang Masalah

Data mining merupakan suatu langkah dalam knowlegde discovery in

tersembunyi dalam jumlah besar dan kompleks,sehingga menghasilkan output

sebagai asupan penting untuk kesehatan, kecerdasan, dan pertumbuhan,