Anda di halaman 1dari 61

TEKNIK DATA MINING DALAM CLUSTERING

PRODUKSI SUSU SEGAR DI INDONESIA


DENGAN ALGORITMA K-MEANS

SKRIPSI

Diajukan Guna Memenuhi Salah Satu Syarat


Untuk Menyelesaikan Pendidikan Strata 1
Program Studi Sistem Informasi

Oleh :

ILHAM SAFITRA DAMANIK


NIM : 1502047

SEKOLAH TINGGI ILMU KOMPUTER


STIKOM TUNAS BANGSA
PEMATANGSIANTAR
2019
ABSTRAK

Susu adalah salah satu asupan penting untuk memenuhi kebutuhan nutrisi. Baik di
konsumsi oleh anak anak, dan orang dewasa . Indonesia mempunyai banyak daerah
penghasil susu segar, tetapi belum cukup untuk memenuhi kebutuhan susu nasional.
Data mining adalah suatu keilmuan dalam bidang komputer yang banyak di gunakan
dalam penelitian. salah satu teknik data mining ialah Clustering. Clustering adalah
metode dengan melakukan pengelompokan data. Metode Clustering akan lebih
optimal bila mengggunakan banyak data. Data yang akan di gunakan adalah data
provinsi di indonesia di mulai dari tahun 2000 sampai tahun 2017 yang diperoleh dari
Badan Pusat Statistik. Hasil dari penelitian ini adalah di Cluster berdasarkan 2
kelompok daerah penghasil susu, yaitu daerah penghasil susu tinggi dan daerah
penghasil susu rendah.
Kata kunci: Susu segar, Clustering, Produksi susu segar

ii
ABSTRACT

Milk is an important intake to meet nutritional needs. Good for consumption by


children, and adults. Indonesia has many milk-producing regions fresh, but not
enough to meet national milk needs. Data mining is a science in the field of computers
that is widely used in research. one of Data mining techniques are Clustering.
Clustering is a method of doing data grouping. The Clustering method will be more
optimal if you use a lot of data. The data that will be used is data from 34 provinces in
Indonesia starting from 2000 until 2017 obtained from the Central Statistics Agency.
The results of this study are in the Cluster based on 2 groups of milk-producing
regions, namely high-milk producing regions and low milk producing regions.
Keywords: Fresh milk, Clustering, Fresh milk production

iii
DAFTAR ISI

Halaman

Halaman Judul ................................................................................................ i

Abstrak ........................................................................................................... ii

Abstract .......................................................................................................... iii

Daftar Isi ......................................................................................................... iv

Daftar Tabel ................................................................................................... vi

Daftar Gambar ................................................................................................ vii

Daftar Lampiran ............................................................................................. viii

BAB 1 PENDAHULUAN ........................................................................ 1

1.1. Latar Belakang Masalah ....................................................... 1

1.2. Perumusan Masalah ............................................................. 3

1.3. Batasan Masalah ................................................................... 4

1.4. Tujuan Penelitian ................................................................. 5

1.5. Manfaat Penelitian ............................................................... 5

1.6. Sistematika Penelitian .......................................................... 6

BAB 2 TINJAUAN PUSTAKA .............................................................. 8

2.1. Data Mining ......................................................................... 8

2.2. Clustering ............................................................................. 10

2.3. Algoritma K-Means .............................................................. 11

2.4. Susu Segar ............................................................................ 12

2.5. Rapidminer Studio ............................................................... 13

2.6. UML (Unified Modelling Language) ................................... 15

iv
2.7. Flowchart ............................................................................. 19

2.8. Penelitian Terdahulu ........................................................... 21

BAB 3 METODOLOGI PENELITIAN ................................................. 23

3.1. Metode Penelitian .................................................................. 23

3.1.1. Metode Pengumpulan Data ...................................... 23

3.1.2. Analisis Data ............................................................ 25

3.1.3. Kontribusi Penelitian ................................................ 25

3.1.4. Lokasi Penelitian dan Waktu Pengumpulan Data .... 25

3.2. Analisis dan Perancangan Sistem ......................................... 26

3.2.1. Analisa Permasalahan .............................................. 26

3.2.2. Algoritma K-Means .................................................. 26

3.2.3. Perhitungan Metode K-Means ................................. 28

3.2.4. Data Olahan .............................................................. 31

3.2.5. Iterasi 1 ...................................................................... 32

3.2.6. Iterasi 2 ...................................................................... 34

3.2.7. Perancangan Penelitian ............................................ 36

3.2.8. Pemodelan di RapidMiner ........................................ 38

Daftar Pustaka ................................................................................................ 39

Lampiran

v
DAFTAR TABEL

Halaman

Tabel 2.1. Simbol-Simbol Use Case Diagram .......................................... 16

Tabel 2.2. Simbol-Simbol Activity Diagram ............................................. 18

Tabel 2.3. Simbol-simbol Flowchart ......................................................... 19

Tabel 2.4. Penelitian Terdahulu ................................................................. 21

Tabel 3.1. Data Mentah .............................................................................. 28

Tabel 3.2. Data Olahan .............................................................................. 31

Tabel 3.3. Iterasi 1 ..................................................................................... 32

Tabel 3.4. Iterasi 2 ..................................................................................... 34

vi
DAFTAR GAMBAR

Halaman

Gambar 2.1. Tahapan Proses Data Mining .................................................. 8

Gambar 2.2. Tampilan RapidMiner Studio versi 8.1 .................................. 14

Gambar 3.1. Data Statistik Produksi Susu Segar Tahun 2000 - 2017 .......... 24

Gambar 3.2. Tahapan Algoritma K-Means .................................................. 36

Gambar 3.3. Flowchart Perancangan Penelitian .......................................... 36

Gambar 3.4. Tampilan di RapidMiner Dengan Menggunakan Clustering . 38

vii
DAFTAR LAMPIRAN

Halaman

Fotokopi Surat Permohonan Seminar Proposal ............................................. L-1

Fotokopi Persetujuan ACC ............................................................................ L-2

viii
1

BAB 1

PENDAHULUAN

1.1. Latar Belakang Masalah

Data mining merupakan suatu langkah dalam knowlegde discovery in

databases (KDD) Yang memiliki teknik menganalisa data untuk digali informasi

tersembunyi dalam jumlah besar dan kompleks,sehingga menghasilkan output

berupa karakteristik atau pola dari data tersebut (Darmi and Setiawan, 2016). Susu

adalah cairan berwana putih yang disekresikan oleh kelenjar mammae (ambing)

pada binatang mamalia betina, untuk bahan makanan dan sumber gizi anaknya.

Sebagian besar susu yang dikonsumsi manusia berasal dari sapi, yang biasa

disebut susu sapi. Sedangkan susu ternak lain biasanya di ikuti nama ternak

tersebut, misal susu kerbau, susu kambing, susu unta dan sebagianya dan susu

manusia disebut ASI atau dapat disebut air susu ibu. (Ii & Pustaka, 2004). Di

indonesia dan di berbagai negara lain, susu merupakan salah satu bahan pangan

yang sangat penting bagi pemenuhan kebutuhan gizi masyarakat. Susu berperan

sebagai asupan penting untuk kesehatan, kecerdasan, dan pertumbuhan,

khususnya anak-anak.

Produksi susu segar di indonesia untuk memenuhi kebutuhan susu

nasional masih belum tercukupi. Produksi susu lokal hanya mampu memenuhi

20% angka kebutuhan susu nasional, sedangkan 80% masih impor. Beberapa

negara negara pengimpor susu kepada indonesia ialah: Amerika Serikat,

Australia, Selandia Baru, Belgia, Kanada. Dewan Persusuan Nasional


2

mengatakan indonesia darurat susu segar. Mengingat Tingginya nilai impor susu

indonesia dari luar negeri berakibat menimbulkan kerugian langsung pada

peternak sapi perah di seluruh Indonesia. Selain hal itu banyaknya nilai impor

susu membuat terkurasnya devisa nasional, serta penduduk indonesia kehilangan

kesempatan terbaik mereka untuk bekerja dan tidak dimanfaatkannya potensi

sumber daya yang ada untuk pengembangan agribisnis persususan, serta

hilangnya potensi pendapatan negara indonesia dari pajak apabila agribisnis

persusuan dikembangkan lebih optimal. Melihat potensi sumber daya alam

Indonesia yang sangat besar bagi pengembangan agribisnis persusuan, ironis

sekali jika sebagian besar dari total kebutuhan susu Indonesia masih harus

diimpor. Berangkat dari hal itu, penulis membuat suatu penelitian dengan data

mining metode clustering untuk mengelompokkan daerah penghasil susu segar di

Indonesia. Yang nantinya akan menghasilkan 2 kelompok daerah penghasil susu

yaitu: Daerah penghasil susu tinggi, dan daerah penghasil susu rendah. Maka

daerah yang termasuk dalam penghasil susu rendah akan lebiih di tingkatkan lagi

produksinya sehingga di harapkan akan memperkecil jumlah impor susu dan

menambah hasil produksi susu segar di indonesia, agar produksi susu lokal bisa

memenuhi kebutuhan susu nasional.

Kajian Peneliti terdahulu (Lestari, 2016) yang berjudul “Perancangan

Sistem Clustering Susu Sapi Dengan Menggunakan Metode K-Means”

menyimpulkan bahwa, Aplikasi clustering yang menggunakan metode KMeans

berhasil dibuat untuk membantu dalam mengelompokkan data susu sesuai dengan

karakteristik yang serupa berdasarkan variabel yang ditentukan. Begitu juga


3

dengan penelitian (Riveranda, Nengsih, Kom, & Kom, 2017) yang berjudul “K-

Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia” menyimpulkan

bahwa, Berdasarkan hasil analisis kluster pada data kasus HIV dan AIDS yang

ada di Indonesia, dapat ditarik kesimpulan bahwa provinsi DKI Jakarta, Jawa

Timur dan Papua berada dalam kondisi yang sangat kritis dan sangat rentan akan

penyebaran virus HIV/AIDS. Hal itu dikarenakan jumlah kasus HIV dan AIDS

terbanyak ada pada ketiga provinsi tersebut. Untuk itu, kampanye dan kebijakan

pemerintah dapat difokuskan secara langsung kepada ketiga provinsi itu.

Berdasarkan uraian latar belakang permasalahan di atas, maka penulis

menggunakan teknik data mining dengan algoritma k-means clustering untuk

mengangkat sebuah judul yaitu “Tekhnik Data Mining dalam Clustering

Produksi Susu Segar di Indonesia Dengan Metode K-Means”. Diharapkan

penelitian ini dapat memberikan manfaat dan rekomendasi bagi pemerintah yg

khususnya Kementrian Pertanian dan Direktorat Jendral Perternakan yang

menangani persoalan susu segar di indonesia agar dapat meningkatkan hasil

produksi susu segar di indonesia sehingga impor susu juga dapat di kurangi.

1.1. Perumusan Masalah

Berdasarkan penjelasan latar belakang di atas maka perumusan masalah

dalam penelitian ini yaitu,:


4

1. Bagaimana menerapkan algoritma K-Means Clustering untuk

mengelompokan produksi susu segar pada setiap provinsi di

indonesia?

2. Bagaimana mengelompokan produksi susu segar pada setiap

provinsi di indonesia dengan menggunakan aplikasi rapidminer?

1.2. Batasan Masalah

Adapun batasan masalah dalam penelitian ini adalah sebagai berikut:

1. Metode yang digunakan Data Mining dan algoritma yang digunakan

K-Means Clustering dalam menentukan jumlah produksi susu segar

di indonesia yang nantinya di kelompokan menjadi beberapa bagian

menggunkan algoritma K-Means Clustering.

2. Aplikasi yang digunakan adalah RapidMiner

3. Hasil akhir dari penelitian ini adalah menjadikan daerah penghasil

susu di indonesia menjadi 2 cluster kelompok daerah penghasil susu,

yaitu: Daerah penghasil susu tinggi, dan daerah penghasil susu

rendah. Serta daerah yang menjadi produksi rendah akan lebih di

tingkatkan produksinya agar bisa mengurai nilai impor susu.


5

1.3. Tujuan Penelitian

Berdasarkan penjelasan latar belakang dan perumusan masalah diatas,

maka tujuan yang ingin dicapai dalam penelitian ini adalah :

1. Menjadikan daerah penghasil susu di indonesia menjadi 2 bagian

kelompok daerah penghasil susu, yaitu: Daerah penghasil susu

tinggi, dan daerah penghasil susu rendah dengan metode data mining

dan menggunakan algortima K-Means Clustering.

2. Menguji hasil dari algoritma K-Means Clustering dengan

menggunakan aplikasi Rapidminer pada data Badan Pusat Statistika

(BPS).

1.4. Manfaat Penelitian

Adapun manfaat dalam pembuatan penelitian skripsi ini adalah sebagai

berikut:

1. Diharapkan dengan adanya penelitian ini dapat menjadi masukan

bagi pemerintah untuk lebih memperhatikan daerah produksi susu

rendah, dan meningkatkan produksi susu segar lokal sehingga

mengurangi nilai impor susu segar.

2. Menjadikan penelitian ini sebagai referensi bagi penelitian lain

untuk melakukan penelitian mengenai susu segar di indonesia

menggukan metode data mining dengan algoritma K-Means

Clustering
6

1.5. Sistemtika Penelitian

Tahapan lima bab dalam sistematika penelitian penulis pada penelitian

ini adalah sebagai berikut:

BAB I : PENDAHULUAN

Pada Bab ini menjelaskan tentang latar belakang masalah penelitian,

perumusan masalah, batasan masalah, tujuan penelitian, manfaat

penelitian, dan sistematika penulisan penelitan.

BAB II : TINJAUAN PUSTAKA

Pada Bab ini menjelaskan tentang teori teori dalam beberapa referensi

yang berhubungan dan mendukung dalam pembuatan penelitian.

Menguraikan tentang referensi teori yang relevan yang digunakan

penulis dalam melakukan penelitian.

BAB III : METODOLOGI PENELITIAN

Pada Bab ini menjelaskan tentang cara penerapan konsep dasar yang di

uraikan pada Bab 2, untuk menganalisis dan merancang sesuai tahap-

tahap penyelesaian pada masalah tersebut menggunakan algoritma K-

Means Clustering mulai dari proses penentuan sumber data, proses

pengolahan data yang digunakan dalam penelitian.


7

BAB IV : HASIL DAN PEMBAHASAN

Pada Bab ini membahas tentang hasil penelitian yang dilakukan

menggunakan Aplikasi RapidMiner Studio dan untuk mengetahui

validasi hasil penelitian.

BAB V : KESIMPULAN DAN SARAN

Pada Bab ini membahas tentang kesimpulan dari hasil penelitian yang

dibuat dan saran.


8

BAB 2

TINJAUAN PUSTAKA

2.1. Data Mining

Data Mining adalah proses yang mempekerjakan satu atau lebih teknik

pembelajaran computer (machine learning) unutuk menganalisis dan

mengekstraksi pengetahuan (knowledge) secara otomatis. (Sadewo, Windarto, &

Hartama, 2016) Berikut tahapan proses data mining dalam penemuan pengetahuan

berulang dalam database dapat dilihat pada gambar 2.1.

Gambar 2.1. Tahapan Proses Data Mining

(Sumber : (Darmi and Setiawan, 2016)


9

Beberapa tahapan dari proses Knowledge Discovery in Database, yaitu :

1. Seleksi Data (Data Selection)

Data yang diperoleh dari sumber data sering kali tidak semuanya digunakan,

karena hal tersebut maka hanya data yang sesuai dengan kebutuhan penelitian lah

yang akan diambil dari sumber data mentah.

2. Pembersihan Data (Data Cleaning)

Merupakan proses menghilangkan data yang tidak relevan ataupun tidak

diperlukan. Data yang di peroleh dari sumber data baik dari database ataupun dari

sumber data lainnya memiliki isian dari atribut yang tidak sempurna, misalnya

data yang hilang, data yang tidak valid dan hanya sekedar salah dalam pengetikan

data. Data-data yang tidak relevan itu sebaiknya dibuang. Pembersihan data juga

dapat mempengaruhi performasi dari teknik data mining karena data yang

ditangani akan berkurang jumlah dan kompleksitasnya.

3. Transformasi Data (Data Transformation)

Data diubah atau digabung ke dalam format yang sesuai dengan kebutuhan

penelitian untuk diproses. Proses ini sering disebut transformasi data.

4. Proses Mining

Merupakan suatu proses utama saat metode diterapkan untuk menemukan

pengetahuan berharga dan tersembunyi dari data.

5. Integrasi Data (Data Integration)

Integrasi data merupakan penggabungan data dari berbagai

database ke dalam satu database yang baru. Integrasi data haruslah dilakukan

secara cermat karena tingkat kesalahan pada integrasi data bisa menghasilkan
10

hasil yang menyimpang atau salah dan bahkan bisa menyesatkan pengambilan

aksi nantinya.

6. Evaluasi Pola (Pattern Evaluation)

Untuk dapat mengidentifikasi pola-pola baru yang menarik kedalam knowledge

based yang ditemukan. Dalam tahap Evaluasi Pola (Pattern Evaluation) ini

hasilnya merupakan temuan temuan pola-pola yang khas maupun model prediksi

dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai.

7. Presentasi Pengetahuan (Knowledge Presentation)

Tahap ini merupakan visualisasi dan penyajian pengetahuan mengenai metode

yang digunakan didalam penelitian yang dilakukan untuk memperoleh

pengetahuan yang diperoleh pengguna. Tahapan terakhirnya adalah bagaimana

memformulasikan keputusan atau aksi dari hasil analisis yang didapat dari

penelitian yang dilakukan. Karenanya presentasi dalam bentuk pengetahuan yang

bisa dipahami semua orang adalah satu tahapan yang diperlukan. Dalam

presentasi ini, visualisasi juga bisa membantu mengkomunikasikan hasil temua

yang di dapat dalam data mining.

2.2. Clustering

Data mining di bagi dalam beberapa kelompok berdasarkan tujuan dan

hasil yang akan di peroleh, berikut adalah pembagian data mining : Asosiasi Rules

(Aturan Asosiasi), Clasification (Klasifikasi), Clustering (Pengelompokan),

Prediction (Prediksi), Forecasting (Peramalan). Perbedaan Clustering dan

Clasification adalah didalam pembagian data mining, Metode C45 dan Naive
11

Bayes adalah metode Clasification, Sedangkan Metode K-Means dan K-Medoids

adalah metode Clustering

Clustering merupakan pengelompokan terhadap record, yang berfungsi

memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.

(Luvia, Windarto, Solikhun, & Hartama, 2017) Clustering dapat juga dikatakan

sebagai identifikasi kelas objek yang memiliki kemiripan. Dengan menggunakan

teknik clustering kita bisa lebih lanjut mengidentifikasi kepadatan dan jarak

daerah dalam objek ruang dan dapat menemukan secara menyeluruh pola

distribusi dan korelasi antara atribut. K-Means Clustering merupakah suatu

algoritma yang berusaha untuk mempartisi / memisahkan atribut yang ada

kedalam satu atau lebih cluster atau kelompok atribut berdasarkan

karakteristiknya dan kesamaan yang hampir mirip, sehingga atribut yang

mempunyai karakteristik yang sama dapat dikelompokan dalam satu cluster yang

sama dan atribut yang mempunyai karakteristik yang berbeda dikelompokan

kedalam cluster yang lain. Cluster yang dihasilkan dapat memberikan knowledge

atau pengetahuan baru dan menarik, sehingga dapat digunakan dalam suatu

pengambilan keputusan.

2.3.Algoritma K-Means

Algoritma adalah urutan langkah langkah logis yang disusun secara

sistematis untuk menyelesaikan suatu masalah secara. Algoritma K-Means adalah

metode clustering berbasis jarak yang membagi data ke dalam sejumlah cluster

dan algoritma ini haya bekerja pada atribut numeric. Algoritma K-Means
12

termasuk partitioning clustering yang memisahkan data ke k daerah bagian yang

terpisah. Algoritma K-Means sangat terkenal karena kemudahan dan

kemampuannya untuk mengcluster data yang besar dan data outlier dengan sangat

cepat. (Darmi and Setiawan, 2016) Untuk itu digunakan algoritma K-Means yang

didalamnya membuat aturan sebagai berikut:

1) Jumlah Cluster perlu diinputkan

2) Hanya memiliki atribut bertip numeric.

Algoritma K-Means merupakan metode non-hierarki yang pada awalnya

mengambil sebagian banyaknya komponen populasi untuk dijadikan pusat cluster

awal. Pada tahap ini pusat cluster dipilih secara acak dari sekumpulan populasi

data. Berikutnya K-Means menguji masing-masing komponen di dalam populasi

data dan menandai komponen tersebut ke salah satu pusat cluster yang telah

didefinisikan tergantung dari jarak minimum antar komponen dengan tiap-tiap

cluster.Posisi puasat cluster akan dihitung kembali sampai semua komponen data

digolongkan kedalam tiap-tiap pusat cluster dan terakhir akan terbentuk posisi

pusat cluster yang baru

Dalam prosedur pembentukan K-Means Clustering terdapat langkah-langkah yang

dapat dilakukan, antara lain:

1) Tentukan k sebagai jumlah cluster yang ingin dibentuk.

2) Bangkitkan k centroid (titik pusat cluster) awal secara random.

3) Hitung jarak setiap data ke masing-masing centroid.

4) Setiap data memilih centroid yang terdekat.


13

5) Tentukan posisi centroid yang baru dengan cara menghitung nilai rata-rata dari

data-data yang terletak pada centroid yang sama.

6) Kembali ke langkah-3 jika posisi centroid baru dengan centroid yang lama

tidak sama.

2.4. Susu

Susu adalah cairan berwarna putih yang disekresikan oleh kelenjar

mammae (ambing) pada binatang mamalia betina, untuk bahan makanan dan

sumber gizi bagi anaknya. Susu adalah cairan berwarna putih yang disekresikan

oleh kelenjar mammae (ambing) pada binatang mamalia betina, untuk bahan

makanan dan sumber gizi bagi anaknya. Sebagian besar susu yang dikonsumsi

manusia berasal dari sapi, yang biasa disebut susu sapi. Sedangkan susu ternak

lain biasanya di ikuti nama ternak asal tersebut, misalnya susu kerbau, susu

kambing, susu unta dan sebagainya dan susu manusia disebut ASI atau dapat

disebut air susu ibu.

2.5.Susu Segar

Susu segar ialah cairan yang berasal dari ambing sapi sehat dan bersih,

yang di peroleh dengan cara pemerahan yang benar, yang kandungan alami nya

tidak dikurangi atau di tambah sesuatu apapun dan belum mendapatkan perlakuan

apapun kecuali pendinginan. (Indonesia & Nasional, 2011) Susu merupakan

bahan makanan yang istimewa bagi manusia karena kelezatan rasa dan

komposisinya yang ideal selain air susu mengandung semua zat yang dibutuhkan
14

oleh tubuh manusi, semua zat makanan yang terkandung didalam air susu dapat

diserap oleh darah dan dimanfaatkan oleh tubuh untuk memenuhi kebutuhan gizi

manusia. Susu juga salah satu asupan penting untuk memenuhi kebutuhan nutrisi.

Baik di konsumsi oleh anak anak, dan orang dewasa, dan susu juga mengambil

peranan penting dalam tingkat kecerdasan manusia. Hampir seluruh susu yang

dikonsumsi manusia berasal dari sapi perah, karena ternak sapi perah ini adalah

penghasil susu yang potensial. Beberapa ternak lain seperti kerbau, kambing, domba

dan kuda juga menghasilkan susu, tetapi masih dalam jumlah sedikit dan terbatas.

Susu yang berasal dari sapi perah lazim disebut susu, sedangkan susu dari ternak yang

lain diberi sebutan sesuai dengan nama hewan penghasilnya. Sebagai contoh, susu

dari kerbau disebut susu kerbau dan susu dari kambing disebut susu kambing.

Berdasarkan hasil penelitian Lely Anggriani Nababan, I Ketut Suada, Ida Bagus

Ngurah Swacita dalam jurnalnya yg berjudul “Ketahanan Susu Segar pada

Penyimpanan Suhu Ruang Ditinjau dari Uji Tingkat Keasaman, Didih, dan Waktu

Reduktase” menyimpulkan bahwa ketahanan susu segar pada suhu ruang selama

(4) empat jam ditinjau dari uji tingkat keasaman (pH), uji didih dan waktu

reduktase. (Nababan, Suada, Bagus, & Swacita, 2014) Dan juga berdasarkan hasil

penelitian Elisa Putri dalam jurnal nya yang berjudul “Kualitas protein susu sapi

segar berdasarkan waktu penyimpanan” menyimpulkan bahwa susu sapi segar

yang masih baik dikonsumsi sesuai dengan SNI susu segar No.01-3141-1992

sampai umur penyimpanan 6 jam di dalam lemari es pada suhu 4oC. (Putri, 2016)
15

2.5. Rapidminer Studio

Rapidminer merupakan perangkat lunak yang dibuat oleh Dr. Markus

Hofmann dari Institute of Technologi Blanchardstown dan Ralf Klinkenberg dari

rapid-i.com dengan tampilan GUI (Graphical User Interface) sehingga

memudahkan pengguna dalam menggunakan perangkat lunak ini. Perangkat lunak

ini bersifat open source dan dibuat dengan menggunakan program Java di bawah

lisensi GNU Public Licence dan Rapid Miner dapat dijalankan di sistem operasi

manapun. Dengan menggunakan Rapid Miner, tidak dibutuhkan kemampuan

koding khusus, karena semua fasilits sudah disediakan. Rapid Miner dikhususkan

untuk penggunaan data mining. Model yang disediakan juga cukup banyak dan

lengkap, seperti Model Bayesian, Modelling, Tree Induction, Neural Network dan

lain-lain (Haryati, Sudarsono and Suryana, 2015).

Penelitian yang dilakukan penulis menggunakan tool RapidMiner Studio versi

5.3, tampilan RapidMiner Studio versi 5.3 terdapat pada gambar 2.2. :

Gambar 2.2. Tampilan RapidMiner Studio versi 5.3


16

Keterangan pada Gambar 2.2. adalah :

a. Menu Bar, merupakan menu utama yang terletak dibawah Title Bar yang

berfungsi sebagai menu perintah untuk mengoperasikan tool RapidMiner

Studio versi 5.3

b. Repository View, merupakan komponen penting dalam Design Perspective

untuk mengolah dan menata proses serta dapat digunakan sebagai sumber

data.

c. Operator View, merupakan komponen yang digunakan untuk operator dalam

RapidMiner yang terdiri dari Data Access, Blending, Cleansing, dan lainnya

untuk dalam hal proses analisis.

d. Process View, merupakan langkah-langkah dalam proses analisis, sebagai

penghubung langkah-langkah proses dan sebagai media desain proses

langkah-langkah analisis.

e. Parameters View, merupakan komponen dalam hal menentukan parameter

dari operator yang digunakan, beberapa operator membutuhkan satu atau

lebih parameter agar dapat diindikasikan sebagai fungsionalitas yang baik dan

benar.

f. Help dan Comment View, merupakan komponen yang menunjukkan

penjelasan setiap operator yang digunakan.

g. Toolbox, merupakan komponen yang digunakan untuk proses penyimpanan,

membuat proses baru, proses eksekusi analisis, dan untuk mencari data,

operator dan membuka proses yang sudah ada.


17

2.6. UML (Unified Modelling Language)

UML (Unified Modelling Language) merupakan suatu metode

pemodelan secara visual untuk sarana perancangan sistem berorientasi objek

(Kurniawan, 2018). Beberapa tujuan atau fungsi dari penggunaan UML, antara

lain:

1. Dapat memberikan bahasa permodelan visual kepada pengguna dari berbagai

macam pemrograman maupun proses rekayasa.

2. Dapat menyatukan praktek-praktek terbaik yang ada dalam permodelan.

3. Bahasa permodelan visual yang ekspresif untuk mengembangkan sistem dan

untuk saling menukar model secara mudah.

4. Dapat berguna sebagai blue print, yang nantinya akan diketahui informasi

detail mengenai kode suatu program.

5. Dapat memodelkan sistem yang berkonsep berorientasi objek, tidak hanya

digunakan untuk memodelkan perangkat lunak (software) saja.

6. Dapat menciptakan suatu bahasa permodelan yang dapat dipergunakan oleh

manusia maupun oleh mesin.

Aplikasi ini menggunakan empat diagram UML diantaranya yaitu:

a. Use Case Diagram

Use case diagram merupakan interaksi antara sistem dan aktor, use case

diagram juga dapat mendeskripsikan tipe interaksi antara si pemakai sistem


18

dengan sistemnya. Berikut tabel simbol – simbol Use Case Diagram yang

tertera pada tabel 2.1 :

Tabel 2.1. Simbol-simbol Use Case Diagram

(Sumber: Urva and Siregar, 2015)

No. Gambar Nama Komponen Deskripsi

Menerangkan apa yang


1 Use Case
dikerjakan sistem

Menggambarkan orang,
2 Actor
sistem atau eksternal entitas.

Menggambarkan jangkauan
3 System Boundary
sistem.

Menggambarkan bagaimana
4 Association
actor terlibat dalam use case.
19

No. Gambar Nama Komponen Deskripsi

Dibuat ketika ada sebuah

5 Generalization keadaan yang lain/perlakuan

khusus.

<< Extend >> Perluasan dari use case lain

jika kondisi atau syarat


6 Extend
terpenuhi.

Menjelaskan bahwa use case


<< include >>
7 Include termasuk didalam use case

lain.

Hubungan dimana perubahan

terjadi pada suatu elemen

mandiri (independent) akan


8 Dependency
mempengaruhi elemen yang

bergantung padanya elemen

yang tidak mandiri.

Interaksi aturan dan elemen

lain yang bekerja sama untuk

9 Collaboration menyediakan perilaku yang

lebih besar dari jumlah dan

elemen-elemennya (sinergi).
20

b. Activity Diagram

Activity diagram atau diagram aktivitas merupakan salah satu jenis diagram

pada UML yang dapat memodelkan proses-proses apa saja yang terjadi pada

sistem. Berikut tabel simbol – simbol Activity Diagram yang tertera pada

tabel 2.2 :

Tabel 2.2. Simbol-simbol Activity Diagram

(Sumber: Urva and Siregar, 2015)

No. Simbol Nama Keterangan

Bagaimana objek dibentuk atau di


1 Titik Awal
awali.

Bagaimana objek dibentuk dan di


2 Titik Akhir
akhiri.

Masing-masing kelas antarmuka saling


3 Activity
berinteraksi satu sama lain

Digunakan untuk menggambarkan suatu

4 Decision keputusan/tindakan yang harus diambil

pada kondisi tertentu.

Untuk menggabungkan dua kegiatan


5 Fork
parallel menjadi satu

Line Digunakan untuk menghubungkan satu


6
Connector simbol dengan simbol lainnya.
21

c. Sequence Diagram

Sequence diagram merupakan interaksi objek berdasarkan urutan waktu, yang

dapat menghasilkan suatu tahapan seperti pada use case diagram.

d. Class Diagram

Class diagram digunakan untuk menampilkan kelas-kelas maupun paket-paket

yang ada pada suatu sistem yang nantinya akan digunakan.

e. Package Diagram

Package Diagram digunakan untuk mengelompokkan elemen diagram UML

ke dalam tingkat pembangunan yang lebih tinggi yaitu berupa sebuah paket.

2.7 Flowchart

Flowchart atau bagan alir merupakan skema yang menggambarkan

urusan kegiatan dari suatu program dari awal sampai akhir. Berikut tabel simbol –

simbol Flowchart yang tertera pada tabel 2.4 :

Tabel 2.3. Simbol-simbol Flowchart

No. Simbol Fungsi

Terminal yaitu start dan stop atau end suatu


1
alur proses.

Preparation atau persiapan yaitu pemberian


2
awal dan deklarasi variabel lain-lain.
22

No Simbol Fungsi

Input/output yaitu proses pemasukan atau


3
pengeluaran.

Process yaitu proses pengolahan data yang


4
dilakukan komputer.

Decision yaitu proses pengambilan keputusan

5 untuk memilih satu keputusan diantara dua

atternatif.

6 Subroutine yaitu kumpulan langkah-langkah.

On Page Connector yaitu tanda penghubing


7
dalam halaman yang sama.

Document yaitu menyatakan simbol untuk


8
data yang berbentuk kertas maupun informasi

Off Page Connector yaitu tanda peghubung


9
kehalaman lain

10 Arrow yaitu petunjuk arah aliran algoritma

(Sumber: Urva and Siregar 2015)


23

2.8. Penelitian Terdahulu

Beberapa peneilitan terdahulu tentang Clustering dapat dilihat pada tabel

2.5. berikut ini :

Tabel 2.4. Penelitian Terdahulu

No. Autor Judul Resume

1. (Sadewo, PENERAPAN DATA Data diolah untuk memperolah

Windarto, MINING PADA nilai dari populasi ayam ras

& Hartama, POPULASI DAGING pedaging menurut provinsi.

2016) AYAM RAS Data tersebut diolah

PEDAGING DI menggunakan Ms. Excel untuk

INDONESIA ditentukan nilai centroid dalam

BERDASARKAN 3 cluster yaitu cluster tingkat

PROVINSI populasi tinggi, cluster tingkat

MENGGUNAKAN populasi sedang dan cluster

K-MEANS tingkat populasi rendah.

CLUSTERING

2. (Bastian et PENERAPAN Hasil dari metode Algoritma


al., n.d.)
ALGORITMA K- K-means clustering data

MEANS mining dapat digunakan untuk

CLUSTERING metode pengendalian

ANALYSIS PADA persediaan pada Puskesmas

PENYAKIT Pandanaran, sehingga apabila


24

No. Autor Judul Resume

MENULAR akan dilakukan pengadaan

MANUSIA (STUDI persediaan obat pada tahun

KASUS 2014, petugas dapat

KABUPATEN melihat daftar Puskesmas

MAJALENGKA) terbanyak yang menderita

penyakit menular.

3. (Gaussian,
2015) PENGELOMPOKAN Berdasarkan nilai yang

PROVINSI DI diperoleh dari Davies-Bouldin

INDONESIA Index untuk jumlah klaster dua,

BERDASARKAN tiga, empat, dan lima diperoleh

KARAKTERISTIK hasil bahwa jumlah klaster tiga

KESEJAHTERAAN adalah yang terbaik. Hal ini

RAKYAT diketahui karena jumlah klaster

MENGGUNAKAN tiga memiliki nilai DBI

METODE K-MEANS terkecil.

CLUSTER

4. (Nasari, Penerapan Algoritma Pusat cluster yang diperoleh


Jhony, &
Sianturi, K-Means Clustering yaitu cluster pertama dan
n.d.)
Untuk kedua . Pusat cluster pertama

Pengelompokkan merupakan daerah penyebaran


25

No. Autor Judul Resume

Penyebaran Diare Di diare untuk jumlah penderita

Kabupaten Langkat tingkat menengah. Pusat

cluster kedua merupakan

daerah-daerah pusat

penyebaran diare, untuk itu

pada daerah-daerah pusat

cluster kedua harus menjadi

daerah perhatian pemerintah

untuk penanganan diare.

5. (Metisen & ANALISIS Proses cluster secara hirarki


Sari, 2015)
CLUSTERING
dengan menggunakan metode
MENGGUNAKAN
K-means menghasilkan sebuah
METODE K-MEANS
informasi gambaran penjualan
DALAM

PENGELOMPOKKA terkluster atau terkelompok.

N PENJUALAN
Hasil dari pemrosesan data
PRODUK PADA
menggunakan beberapa
SWALAYAN
software data mining tersebut
FADHILA

pada intinya sama. Laris dan

kurang laris
BAB 3

METODOLOGI PENELITIAN

3.1. Metode Penelitian

Metode penelitian merupakan langkah yang dimiliki dan harus dilakukan

oleh peneliti dalam rangka untuk mengumpulkan informasi atau data serta

melakukan investigasi pada data yang telah didapatkan. Metode penelitian

memberikan gambaran rancangan penelitian yang meliputi antara lain: metode

pengumpulan data, analisa data, sumber data, kontribusi penelitian, lokasi

penelitian dan waktu pengumpulan data.

3.1.1. Metode Pengumpulan Data

Pengumpulan data dilakukan untuk memperoleh informasi yang

dibutuhkan dalam rangka mencapai tujuan penelitian. Berikut beberapa hal yang

dilakukan penulis dalam mengumpulkan data, yaitu :

1. Data yang dikumpulkan dalam penelitian ini merupakan data sekunder.

Biasanya data sekunder merupakan data yang telah tersedia dalam

berbagai bentuk seperti statistik atau data yang sudah diolah sedemikian

rupa sehingga sudah siap digunakan

2. Dokumentasi adalah pengumpulan data yang dilakukan untuk

mendapatkan data sekunder dari dokumen-dokumen berupa buku dan

jurnal yang relavan dengan penelitian ini.


24

3. Adapun data yang digunakan adalah data produksi susu segar di indonesia

mulai dari tahun 2000 hingga tahun 2017 yang di peroleh dari badan pusat

statistik.

Data yang digunakan dalam penelitian ini dapat dilihat pada gambar 3.1 :

Gambar 3.1 Data Statistik Hasil Produksi Susu Segar di Indoneisa


tahun 2000 - 2017
(Sumber : Badan Pusat Statistik)
28

3.1.2. Analisis Data

Analisis data merupakan upaya atau cara untuk mengolah data menjadi

informasi sehingga karakteristik data tersebut bisa dipahami dan bermanfaat untuk

solusi permasalahan, tertutama masalah yang berkaitan dengan penelitian. Data

yang diperoleh untuk penelitian ini adalah produksi susu segar di indonesia per

provinsi dari tahun 2000 hingga 2017. Didalam penelitian ini hanya

menggunakan 27 provinsi di indonesia yaitu provinsi : Aceh, Sumatera Utara,

Sumatera Barat, Riau, Jambi, Sumatra Selatan, Bengkulu, Lampung, Kep.Bangka

Belitung, DKI Jakarta, Jawa Barat, Jawa Tengah, Daerah Istimewa Yogyakarta,

Jawa Timur, Banten, Bali, NTT, NTB, Kalimantan Barat, Kalimantan Selatan,

Kalimantan Timur, Kalimantan Utara, Sulawesi Selatan, Sulawasi Tenggara,

Gorontalo, Sulawesi Barat, Papua. Provinsi lainnya seperti : Kepulauan Riau,

Kalimantan Tengah, Sulawesi Utara, Sulawesi Tengah, Maluku, Maluku Utara,

dan Papua Barat tidak dimasukan ke dalam penelitian dikarenakan tidak

mempunyai data produksi susu segar yang valid.

3.1.3. Kontribusi Penelitian

Diharapkan penelitian ini dapat membantu mengelompokan daerah di

indonesia yang memproduksi susu segar. Dengan mengkluster hasil produksi susu

segar di indoneis menjadi 2 bagian yaitu cluster tinggi, dan cluster rendah.

Sehingga daerah dengan cluster rendah akan lebih di perhatikan dan lebih di

tingkatan produksi susu segarnya. Dan semua upaya itu akan berakibat penurunan
24

nilai impor susu segar di indonesia, serta untuk memenuhi kebutuhan susu

nasional cukup dengan mengonsumsi susu segar hasil produksi dalam negri.

3.1.4. Lokasi Penelitian dan Waktu Pengumpulan Data

Penetapan lokasi penelitian merupakan tahap yang sangat penting dalam

penelitian, karena dengan ditetapkannya lokasi penelitian berarti objek dan tujuan

sudah ditetapkan sehingga mempermudah penulis dalam melakukan penelitian.

Lamanya waktu yang dibutuhkan untuk menyelesaikan pengumpulan data

penelitian ini selama 1 bulan yang dimulai pada 1 Oktober 2018 sampai dengan 1

November 2018.

3.2. Analisis dan Perancangan Sistem

Di dalam analisis dan metode perancangan sistem terdapat rancangan

yang digunakan dalam membangun sistem atau perhitungan-perhitungan

algoritma dari metode K-Means Clustering.

3.2.1. Analisa Permasalahan

Permasalahan yang menjadi dasar dilakukannya penelitian ini adalah

bagaimana mengelompokkan daerah penghasil susu segar dalam 2 cluster yaitu

tinggi dan rendah. Sehingga daerah produksi susu segar yang tinggi dan daerah

produksi susu segar yang rendah.


24

3.2.2. Algoritma K-Means

Permasalahan yang sudah dianalisa, selanjutnya penulis menganalisa

daerah penghasil susu segar di indonesia dengan menggunakan Data Mining

algoritma K-Means Clustering. Algoritma K-Means selanjutnya akan melakukan

pengulangan langkah-langkah berikut sampai terjadi kestabilan :

1. Menentukan banyak cluster

Pada penelitian ini, terdapat tiga cluster yaitu cluster untuk daerah penghasil susu

tinggi (C1) dan daerah penghasil susu rendah(C2).

2. Menentukan titik pusat (centroid)

Langkah selanjutnya yaitu dengan menetukan titik pusat (centroid) dari tiap-tiap

cluster.

3. Menghitung jarak setiap objek ke titik pusat (centroid)

Selanjutnya untuk melakukan cluster setelah menentukan titik pusat adalah

dengan menghitung jarak setiap data dengan titik pusat yang sudah ditentukan

sebelumnya. Rumus untuk menghitung jarak setiap objek ke titik pusat adalah :

Dimana x adalah dataset jumlah produksi susu segar, dataset yang digunakan

untuk perhitungan Datamining ini adalah produksi susu segar tinggi dan rendah.

Sedangkan y adalah titik pusat yang sudah ditentukan secara acak (random).

4. Menghitung jarak setiap data hasil produksi per provisi terhadap pusat cluster

menggunakan rumus (3).

5. Menentukan posisi cluster masing-masing data hasil produksi per provisi

berdasarkan jarak minimum data terhadap pusat cluster.


24

6. Menghitung nilai titik pusat centroid hasil iterasi dengan menggunakan rumus

(2).

7. Memeriksa kondisi berhenti proses iterasi, jika nilai centroid hasil iterasi

dengan nilai centroid sebelumnya bernilai sama atau nilai centroid sudah

optimal serta posisi cluster data hasil produksi tidak mengalami perubahan

lagi maka proses iterasi berhenti.

Kerangka algoritma K-Means Clustering dapat dilihat pada gambar 3.2 :

Gambar 3.2 Tahapan Algoritma K-Means


24

Perhitungan Metode K-Means

Data Olahan

No Provinsi Rata - Rata


1 ACEH 570,7255556 Parameter Nilai Ket
2 SUMUT 2809,743889 Cluster : 2 (Max/Min)
3 SUMBAR 964,8061111 Data : 27 (Provinsi)
4 RIAU 100,2954545 Atribut : 18 (Tahun)
5 JAMBI 13,61
6 SUMSEL 191,1594444
7 BENGKULU 694,534375
8 LAMPUNG 253,6533333
9 KEP. BABEL 150,791
10 DKI 34537,86444
11 JABAR 239845,3428
12 JATENG 92421,30111
13 DIY 6233,501111
14 JATIM 372695,6029
15 BANTEN 29,00818182
16 BALI 114,7569231
17 NTB 28
18 NTT 9,2825
19 KALBAR 85,02411765
20 KALSEL 161,4816667
21 KALTIM 77,634
22 KALUT 3
23 SULSEL 14089,70533
24 SULTENG 27,5225
25 GORONTALO 22,33333333
26 SULBAR 50,75
27 PAPUA 46,18
24

Iterasi 1

No Provinsi Rata - Rata C1 C2


1 ACEH 570,7255556 372124,8773 567,7255556
2 SUMUT 2809,743889 369885,859 2806,743889
3 SUMBAR 964,8061111 371730,7968 961,8061111
4 RIAU 100,2954545 372595,3074 97,2954545
5 JAMBI 13,61 372681,9929 10,61
6 SUMSEL 191,1594444 372504,4435 188,1594444
7 BENGKULU 694,534375 372001,0685 691,534375
8 LAMPUNG 253,6533333 372441,9496 250,6533333
9 KEP. BABEL 150,791 372544,8119 147,791
10 DKI 34537,86444 338157,7385 34534,86444
11 JABAR 239845,3428 132850,2601 239842,3428
12 JATENG 92421,30111 280274,3018 92418,30111
13 DIY 6233,501111 366462,1018 6230,501111
14 JATIM 372695,6029 0 372692,6029
15 BANTEN 29,00818182 372666,5947 26,00818182
16 BALI 114,7569231 372580,846 111,7569231
17 NTB 28 372667,6029 25
18 NTT 9,2825 372686,3204 6,2825
19 KALBAR 85,02411765 372610,5788 82,02411765
20 KALSEL 161,4816667 372534,1212 158,4816667
21 KALTIM 77,634 372617,9689 74,634
22 KALUT 3 372692,6029 0
23 SULSEL 14089,70533 358605,8976 14086,70533
24 SULTENG 27,5225 372668,0804 24,5225
25 GORONTALO 22,33333333 372673,2696 19,33333333
26 SULBAR 50,75 372644,8529 47,75
27 PAPUA 46,18 372649,4229 43,18
24

Jarak Pusat
No Nilai
Terpendek Hasil C1 C2 Cluster
1 567,7255556 C2 1 Iterasi 1
2 2806,743889 C2 1 C1= Max 372695,6
3 961,8061111 C2 1 C2= Min 3,0
4 97,2954545 C2 1
5 10,61 C2 1 Cluster Provinsi Hasil
6 188,1594444 C2 1 C1 (11 ,14) 2
7 691,534375 C2 1 (1,2,3,4,5,6,7
8 250,6533333 C2 1 8,9,10,12,13
9 147,791 C2 1 14,15,16,17,
10 34534,86444 C2 1 C2 19,20,21,22 25
11 132850,2601 C1 1 23,24,25,26,27
12 92418,30111 C2 1
13 6230,501111 C2 1
14 0 C1 1
15 26,00818182 C2 1
16 111,7569231 C2 1
17 25 C2 1
18 6,2825 C2 1
19 82,02411765 C2 1
20 158,4816667 C2 1
21 74,634 C2 1
22 0 C2 1
23 14086,70533 C2 1
24 24,5225 C2 1
25 19,33333333 C2 1
26 47,75 C2 1
27 43,18 C2 1
24

Iterasi 2

Nilai Rata-
No Provinsi
C1 C2 Rata C1 C2
1 ACEH 1 570,7255556 305699,7473 5576,741019
2 SUMUT 1 2809,743889 303460,729 3337,722686
3 SUMBAR 1 964,8061111 305305,6667 5182,660464
4 RIAU 1 100,2954545 306170,1774 6047,171121
5 JAMBI 1 13,61 306256,8629 6133,856575
6 SUMSEL 1 191,1594444 306079,3134 5956,307131
7 BENGKULU 1 694,534375 305575,9385 5452,9322
8 LAMPUNG 1 253,6533333 306016,8195 5893,813242
9 KEP. BABEL 1 150,791 306119,6819 5996,675575
10 DKI 1 34537,86444 271732,6084 28390,39786
11 JABAR 1 239845,3428 66425,13005 233697,8762
12 JATENG 1 92421,30111 213849,1717 86273,83453
13 DIY 1 6233,501111 300036,9717 86,03453594
14 JATIM 1 372695,6029 66425,13005 366548,1363
15 BANTEN 1 29,00818182 306241,4647 6118,458393
16 BALI 1 114,7569231 306155,7159 6032,709652
17 NTB 1 28 306242,4729 6119,466575
18 NTT 1 9,2825 306261,1904 6138,184075
19 KALBAR 1 85,02411765 306185,4487 6062,442457
20 KALSEL 1 161,4816667 306108,9912 5985,984908
21 KALTIM 1 77,634 306192,8389 6069,832575
22 KALUT 1 3 306267,4729 6144,466575
23 SULSEL 1 14089,70533 292180,7675 7942,238755
24 SULTENG 1 27,5225 306242,9504 6119,944075
25 GORONTALO 1 22,33333333 306248,1395 6125,133242
26 SULBAR 1 50,75 306219,7229 6096,716575
27 PAPUA 1 46,18 306224,2929 6101,286575
24

Jarak Pusat
No Nilai
Terpendek Hasil C1 C2 Cluster
1 5576,741019 C2 1 Iterasi 2
2 3337,722686 C2 1 C1= Max 306270,5
3 5182,660464 C2 1 C2= Min 6147,5
4 6047,171121 C2 1
5 6133,856575 C2 1 Cluster Provinsi Hasil
6 5956,307131 C2 1 C1 (11 ,14) 2
7 5452,9322 C2 1 (1,2,3,4,5,6,7
8 5893,813242 C2 1 8,9,10,12,13
9 5996,675575 C2 1 14,15,16,17,
10 28390,39786 C2 1 C2 19,20,21,22 25
11 66425,13005 C1 1 23,24,25,26,27
12 86273,83453 C2 1
13 86,03453594 C2 1
14 66425,13005 C1 1
15 6118,458393 C2 1
16 6032,709652 C2 1
17 6119,466575 C2 1
18 6138,184075 C2 1
19 6062,442457 C2 1
20 5985,984908 C2 1
21 6069,832575 C2 1
22 6144,466575 C2 1
23 7942,238755 C2 1
24 6119,944075 C2 1
25 6125,133242 C2 1
26 6096,716575 C2 1
27 6101,286575 C2 1

Hasil dari iterasi 1 dan 2 menyatakan nilai yg sama, yaitu Cluster tinggi dengan 2

provinsi dan Cluster rendah dengan 25 provinsi. Jika hasil cluster sudah stabil dan

tidak mengalami perubahan hasil iterasi, maka proses iterasi berhenti


24

3.2.3 Perancangan Penelitian

Diagram alir model penelitian disajikan dalam rancangan flowchart pada

gambar 3.3.

Gambar 3.3 Flowchart Perancangan Penelitian

Proses alur flowchart pada gambar 3.3 adalah sebagai berikut :

1. Identifikasi Masalah

Merupakan pengenalan suatu masalah, dan tahap awal dalam proses penelitian.

Permasalahan penelitian ini bagaimana menentukan daerah penghasil susu tinggi

dan daerah penghasil susu rendah.

2. Teknik Pengumpulan Data

Data penelitian ini diperoleh dari Badan Pusat Statistik

3. Pengolahan Data

Pada tahap ini, data diolah untuk mendapatkan hasil yang kemudian dapat diolah

ke tahap berikutnya sehingga menghasilkan informasi yang tepat.


24

4. Transformasi dengan Metode K-Means Clustering

Transformasi data, data yang berjenis alfabet seperti nama blok harus dilakukan

proses inisialisasi data terlebih dahulu ke dalam bentuk angka/numerikal.

Kemudian mengelompokkan data yang sudah ada dalam dua kelompok yaitu

tinggi dan rendah, dengan metode K-Means Clustering.

5. Olah Data di Rapidminer

Pengujian disini kita menggunakan sebuah software Rapidminer, dengan

pengujian data menggunakan software kita akan membandingkan bagaimana hasil

pengolahan data secara manual dengan hasil pengolahan data menggunakan

sebuah software

3.2.4. Permodelan Di RapidMiner

Berikut ini langkah – langkah pengujian data K-Means Clustering pada

Rapidminer :

1. Retrieve sebagai tempat penyimpanan data cluster

2. K-Means untuk proses clustering

3. Cluster distance performance untuk tampilan output cluster

Pengujian menggunakan algoritma K-Means Clustering dengan

menggunakan Rapidminer dapat dilihat pada Gambar 3.4 :


24

Gambar 3.4 Tampilan di RapidMiner Dengan Menggunakan Clustering


24

BAB 4
HASIL DAN PEMBAHASAN

4.1. Hasil

Hasil penelitian ini disajikan sesuai penelitian yang dilakukan. Data yang

digunakan dalam penelitian ini adalah data hasil produksi susu segar per provinsi

di Indonesia dimulai dari tahun 2000 hingga tahun 2017. Data yang diperoleh

untuk penelitian ini adalah produksi susu segar di indonesia per provinsi dari

tahun 2000 hingga 2017. Didalam penelitian ini hanya menggunakan 27 provinsi

di indonesia . 7 Provinsi lainnya tidak dimasukan ke dalam penelitian dikarenakan

tidak mempunyai data produksi susu segar yang valid. Data tersebut di

kelompokkan menjadi 2 bagian yaitu : daerah penghasil susu tinggi dan daerah

penghasil susu rendah.

Kumpulan data yang diperoleh digunakan sebagai data masukan dalam

membuat model aturan menggunakan algoritma K-Means Clustering

menggunakan software rapidminer. Dalam mengetahui provinsi mana saja yang

masuk ke dalam kelompok daerah penghasil susu tinggi dan daerah penghasil

susu rendah. penulis akan menampilkan gambaran model aturan dalam

mengkelompokn hasil produksi susu segar menggunakan algoritma K-Means

Clustering.
24

4.1.1. Menu

Berikut akan dijelaskan bagian dari menu awal pada tools rapidminer
seperti tampilan awal dari rapidminer dan akan dimulai dengan menu new
process.

Gambar 4.1. Tampilan Awal Rapidminer

Pada tampilan berikut terdapat beberapa menu pilihan seperti New

Process, Open Recent Process, Open Process, Open Template dan Online

Tutorial. Penjelasan dari menu diatas adalah sebagai berikut :

1. New Process Menu ini berisikan tampilan awal jika kita akan membuat

proses baru dengan data baru yang belum pernah ada dalam tools ini.

2. Open Recent Process Berfungsi untuk menampilkan dan membuka

proses yang baru saja dibuat dengan jangka waktu tertentu, biasanya

akan langsung muncul pada tampilan awal tools tanpa harus mencari

pada penyimpanan lokal.

3. Open Process Menu ini berfugsi untuk membuka proses yang telah

dibuat sebelumnya yang telah kita simpang di penyimpanan lokal.


24

4. Open Template Menu ini berisikan pilihan-pilihan proses lain yang

telah disediakan oleh tools rapidminer.

5. Online Tutorial Menu ini digunakan untuk memulai tutorial atau

tahapan secara online. Tutorial berfungsi untuk memberikan

pengenalan dan beberapa konsep data mining.

Dikarenakan data yang akan diuji adalah data baru, maka pilih New
Process. Maka akan muncul jendela seperti gambar berikut :

Gambar 4.2. New Process untuk Import Data Excel

4.1.2. Masukan (Input)

Sistem Menjelaskan cara memasukkan data baru yang akan dieksekusi

lebih lanjut, pada hal ini data yang akan di eksekusi berupa data excel. Tahapan

dapat dilihat pada gambar dibawah ini.


24

Gambar 4.3. Input Data Read Excel

Klik pada bagian kiri bawah tab repositories lalu pilih “Import Read

Excel”. Kemudian akan muncul tampilan sperti gambar 4.4.

Gambar 4.4. Tampilan Data Import Tahap 1

Pada data import configuration wizard kemudian pilih tempat kita

menyimpan data yang akan digunakan. Selanjutnya pilih file name data yang

digunakan. Kemudian klik next pada bagian kanan bawah.


24

Selanjutnya akan muncul tampilan seperti gambar berikut :

Gambar 4.5. Data Import Tahap 2

Gambar diatas menunjukkan isi data yang akan di proses. Pilih sheet

pada data serta blok data yang akan di proses. Pilih next next hinga finish dan

kemudian simpan file.

Gambar 4.6. Data Import Tahap 3


24

Gambar 4.7. Data Import Tahap 4

Pada tahap 4 dilakukan pemilihan tipe data dimana pada bagian No

atribute diubah menjadi tipe”id” dan Keterangan diberi tipe “label”.Lalu pilih

next.

4.1.3. Pemrosesan Sistem

Pada tahap ini akan dijelaskan tahapan-tahapan proses penggunaan K-

Means di dalam Rapidminerdata yang telah di import. Tahapan pertama dengan

meng klik Clustering and Segmentation lalu pilih K-Means dapat dilihat pada

gambar 4.8. berikut :


24

Gambar 4.8. Pemrosesan Data Tahap 1

Drag atau klik dan tahan data yang telah disimpan pada repositories ke

lembar kerja main process. Untuk membentuk pengelompokan, data perlu

dihubungkan dengan operator Clustering. Dapat dilihat pada gambar 4.9.

Gambar 4.9. Pemrosesan Data Tahap 2


24

4.1.4. Keluaran (Output) Sistem

Untuk mendapatkan hasil pengelompokan maka pada tahap selanjutnya

dapat dilakukan dengan cara mengklik tada panah biru yang terdapat diposisi

tengah atas pada bagian toolbar. Pada tahap ini akan menampilkan hasil akhir

serta langkah terakhir dalam penggunaan tools rapidminer ini. Dapat dilihat pada

gambar 4.10.

Gambar 4.10. Nilai Cluster Model

Keterangan :

1. Jumlah Cluster 0 (Rendah) berjumlah 25 items

2. Jumlah Cluster 1 (Tinggi) berjumlah 2 items

3. Jumlah keseluruhan items adalah 27

Sehingga dapat diketahui hasil pengelompokan dari rapidminer 5.3 berikut ini

dapat dilihat pada gambar 4.11.


24

Gambar 4.11. Hasil Pengelompokan

Berdasarkan pada gambar 4.11. dapat diketahui bahwa pada kelompok

tinggi memiliki banyak node yaitu 2, sedangkan pada kelompok rendah memiliki

25 node.

4.2. Pembahasan

Berdasarkan dari penjelasan diatas mengenai tahap-tahap penggunaan

serta hasil yang telah ditampilkan maka berikut akan dibahas mengenai

keterkaitan dari hasil yang didapat antara perhitungan manual algoritma dengan

hasil yang ditampilkan oleh tools rapidminer.

4.2.1. Validasi Data

Dalam melakukan validasi data terdapat hal-hal yang harus diperhatikan

diantaranya : perhitungan manual algoritma harus telah menampilkan hasil akhir

berupa Cluster, serta data yang digunakan haruslah data yang valid dan sama

dengan yang dipakai pada tools rapidminer.


24

Gambar 4.12. Tampilan Data Perhitungan Manual

Gambar 4.12. menampilkan data yang digunakan dalam penelitian manual

Gambar 4.13. Tampilan Data Perhitungan Tools Rapidminer

Gambar 4.13. menampilkan data pada perhitungan atau pengujian data

dengan tools rapidminer.


24

4.2.2. Spesifikasi Kebutuhan Sistem

1. Kebutuhan Software

Beberapa software yang mendukung untuk proses perancangan hingga

penyelesaian diantaranya :

a. Microsoft Excel 2010.

b. Rapidminer versi 5.3.

2. Kebutuhan Hardware

Untuk spesifikasi hardware pendukung program yang digunakan :


a. Komputer dengan prossecor Dual Core .

b. Memory dengan kapasitas 2 GB sebagai pengatur kecepatan

program saat dijalankan.

c. Harddisk dengan kapasitas 100 GB sebagai tempat penyimpanan

data yang cukup besar.

4.2.3 Prosedur Kerja Sistem

Adapun prosedur kerja sistem mengelompokan produksi susu segar di

indonesia berdasarkan provinsi menggunakan tools rapidminer sebagai berikut:

1. User menggunakan komputer untuk memulai/ start tools rapidminer.

2. Klik bagian kiri bawah tab repositories lalau pilih “ Import Read

Excel”.

3. Klik Import configuration wizard Pilih data yg ingin digunakan. Klik

next hingga finish.


24

4. Klik bagian kiri bawah tab repositories lalau pilih “ Clustering and

segmentation” lalu pilih K-Means.

5. Hubungkan Operator Excel dengan Operator K-Means.

6. Klik Tanda Panah biru untuk memproses pengelompokan K-Means.

7. Muncul hasil dari pengelompokan.

4.2.3. Kelemahan dan Kelebihan Sistem

Adapun kelemahan dan kelebihan sistem sebagai berikut:

1. Kelemahan Sistem

Adapun kelemahan sistem tergantung pada data awal yang digunakan.

Perhitungan algoritma K-Means tidak efektif jika data memiliki nilai 0.

2. Kelebihan Sistem

Sedangkan kelebihan sistem adalah sangat efektif untuk

mengelompokan data dengan jumlah banyak.


24

BAB 5

KESIMPULAN DAN SARAN

5.2. Kesimpulan

Adapun kesimpulan yang dapat diambil pada sistem pakar untuk

mendiagnosa penyakit kelapa sawit ini adalah sebagai berikut:

1. Algoritma K-Means Clustering ini dapat membantu peneliti

mengelompokan produksi susu segar pada setiap provinsi di

indonesia.

2. Aplikasi Rapidminer ini dapat membantu peneliti mengelompokan

produksi susu segar pada setiap provinsi di indonesia.

5.2. Saran

Beberapa saran yang dapat penulis berikan untuk dapat mengembangkan

penelitian ini lebih jauh,ada beberapa saran yang harus diterapkan guna

pengembangan lebih lanjut sebagai berikut:

1. Gunakan lah data yaang tidak memiliki nilai nol, sehingga perhitungan

algoritma K-Means Clustering akan lebih optimal.

2. Penelitian ini masih memiliki banyak kekurangan. Diharapkan kepada

para peneliti yang lain untuk dapat menggunakan penelitian ini sebagai

bahan ilmiah untuk melanjutkan mengelompokan produksi susu segar

pada setiap provinsi di indonesia.


24

DAFTAR PUSTAKA

Darmi, Y., & Setiawan, A. (2016). PENERAPAN METODE CLUSTERING K-


MEANS DALAM, 12(2), 148–157
Haryati, S., Sudarsono, A. and Suryana, E. (2015) ‘Implementasi Data Mining untuk
Memprediksi Masa Studi Mahasiswa Menggunakan Algoritma C4.5’, Jurnal
Media Infotama, 11(2), pp. 130–138.
Ii, B. A. B., & Pustaka, T. (2004). Faktor-faktor yang..., Ratu Nurchoiriah, FKM UI,
2009 10.
Indonesia, S. N., & Nasional, B. S. (2011). Susu segar-Bagian 1: Sapi.
Kurniawan, T. A. (2018) ‘PEMODELAN USE CASE (UML) : EVALUASI
TERHADAP BEBERAPA KESALAHAN DALAM PRAKTIK’, Jurnal
Teknologi Informasi dan Ilmu Komputer (JTIIK), 5(1), pp. 77–86. doi:
10.25126/jtiik.201851610.
Lestari, D. P. (2016). PERANCANGAN SISTEM CLUSTERING SUSU SAPI
DENGAN MENGGUNAKAN METODE K - MEANS.
Luvia, Y. S., Windarto, A. P., Solikhun, S., & Hartama, D. (2017). Penerapan Algoritma
C4.5 Untuk Klasifikasi Predikat Keberhasilan Mahasiswa Di Amik Tunas
Bangsa. Jurasik (Jurnal Riset Sistem Informasi Dan Teknik Informatika), 1(1),
75. https://doi.org/10.30645/jurasik.v1i1.12
Riveranda, O., Nengsih, W., Kom, S., & Kom, M. (2017). K-Means Analysis
Klasterisasi Kasus HIV / AIDS di Indonesia K-Means Analysis Klasterisasi
Kasus HIV / AIDS di Indonesia, (September 2016).
Sadewo, M. G., Windarto, A. P., & Hartama, D. (2016). PENERAPAN DATAMINING
PADA POPULASI DAGING AYAM RAS PEDAGING DI INDONESIA
BERDASARKAN PROVINSI MENGGUNAKAN K-MEANS, 60–67.
Urva, G. & Siregar, H.F. 2015, ‘Pemodelan UML E-Marketing Minyak Goreng’, Jurnal
Teknologi dan Sistem Informasi, vol. 1, no. 9, pp. 92–101

Anda mungkin juga menyukai