SKRIPSI
Oleh :
Susu adalah salah satu asupan penting untuk memenuhi kebutuhan nutrisi. Baik di
konsumsi oleh anak anak, dan orang dewasa . Indonesia mempunyai banyak daerah
penghasil susu segar, tetapi belum cukup untuk memenuhi kebutuhan susu nasional.
Data mining adalah suatu keilmuan dalam bidang komputer yang banyak di gunakan
dalam penelitian. salah satu teknik data mining ialah Clustering. Clustering adalah
metode dengan melakukan pengelompokan data. Metode Clustering akan lebih
optimal bila mengggunakan banyak data. Data yang akan di gunakan adalah data
provinsi di indonesia di mulai dari tahun 2000 sampai tahun 2017 yang diperoleh dari
Badan Pusat Statistik. Hasil dari penelitian ini adalah di Cluster berdasarkan 2
kelompok daerah penghasil susu, yaitu daerah penghasil susu tinggi dan daerah
penghasil susu rendah.
Kata kunci: Susu segar, Clustering, Produksi susu segar
ii
ABSTRACT
iii
DAFTAR ISI
Halaman
Abstrak ........................................................................................................... ii
iv
2.7. Flowchart ............................................................................. 19
Lampiran
v
DAFTAR TABEL
Halaman
vi
DAFTAR GAMBAR
Halaman
Gambar 3.1. Data Statistik Produksi Susu Segar Tahun 2000 - 2017 .......... 24
vii
DAFTAR LAMPIRAN
Halaman
viii
1
BAB 1
PENDAHULUAN
databases (KDD) Yang memiliki teknik menganalisa data untuk digali informasi
berupa karakteristik atau pola dari data tersebut (Darmi and Setiawan, 2016). Susu
adalah cairan berwana putih yang disekresikan oleh kelenjar mammae (ambing)
pada binatang mamalia betina, untuk bahan makanan dan sumber gizi anaknya.
Sebagian besar susu yang dikonsumsi manusia berasal dari sapi, yang biasa
disebut susu sapi. Sedangkan susu ternak lain biasanya di ikuti nama ternak
tersebut, misal susu kerbau, susu kambing, susu unta dan sebagianya dan susu
manusia disebut ASI atau dapat disebut air susu ibu. (Ii & Pustaka, 2004). Di
indonesia dan di berbagai negara lain, susu merupakan salah satu bahan pangan
yang sangat penting bagi pemenuhan kebutuhan gizi masyarakat. Susu berperan
khususnya anak-anak.
nasional masih belum tercukupi. Produksi susu lokal hanya mampu memenuhi
20% angka kebutuhan susu nasional, sedangkan 80% masih impor. Beberapa
mengatakan indonesia darurat susu segar. Mengingat Tingginya nilai impor susu
peternak sapi perah di seluruh Indonesia. Selain hal itu banyaknya nilai impor
sekali jika sebagian besar dari total kebutuhan susu Indonesia masih harus
diimpor. Berangkat dari hal itu, penulis membuat suatu penelitian dengan data
yaitu: Daerah penghasil susu tinggi, dan daerah penghasil susu rendah. Maka
daerah yang termasuk dalam penghasil susu rendah akan lebiih di tingkatkan lagi
menambah hasil produksi susu segar di indonesia, agar produksi susu lokal bisa
berhasil dibuat untuk membantu dalam mengelompokkan data susu sesuai dengan
dengan penelitian (Riveranda, Nengsih, Kom, & Kom, 2017) yang berjudul “K-
bahwa, Berdasarkan hasil analisis kluster pada data kasus HIV dan AIDS yang
ada di Indonesia, dapat ditarik kesimpulan bahwa provinsi DKI Jakarta, Jawa
Timur dan Papua berada dalam kondisi yang sangat kritis dan sangat rentan akan
penyebaran virus HIV/AIDS. Hal itu dikarenakan jumlah kasus HIV dan AIDS
terbanyak ada pada ketiga provinsi tersebut. Untuk itu, kampanye dan kebijakan
produksi susu segar di indonesia sehingga impor susu juga dapat di kurangi.
indonesia?
tinggi, dan daerah penghasil susu rendah dengan metode data mining
(BPS).
berikut:
Clustering
6
BAB I : PENDAHULUAN
Pada Bab ini menjelaskan tentang teori teori dalam beberapa referensi
Pada Bab ini menjelaskan tentang cara penerapan konsep dasar yang di
Pada Bab ini membahas tentang kesimpulan dari hasil penelitian yang
BAB 2
TINJAUAN PUSTAKA
Data Mining adalah proses yang mempekerjakan satu atau lebih teknik
Hartama, 2016) Berikut tahapan proses data mining dalam penemuan pengetahuan
Data yang diperoleh dari sumber data sering kali tidak semuanya digunakan,
karena hal tersebut maka hanya data yang sesuai dengan kebutuhan penelitian lah
diperlukan. Data yang di peroleh dari sumber data baik dari database ataupun dari
sumber data lainnya memiliki isian dari atribut yang tidak sempurna, misalnya
data yang hilang, data yang tidak valid dan hanya sekedar salah dalam pengetikan
data. Data-data yang tidak relevan itu sebaiknya dibuang. Pembersihan data juga
dapat mempengaruhi performasi dari teknik data mining karena data yang
Data diubah atau digabung ke dalam format yang sesuai dengan kebutuhan
4. Proses Mining
database ke dalam satu database yang baru. Integrasi data haruslah dilakukan
secara cermat karena tingkat kesalahan pada integrasi data bisa menghasilkan
10
hasil yang menyimpang atau salah dan bahkan bisa menyesatkan pengambilan
aksi nantinya.
based yang ditemukan. Dalam tahap Evaluasi Pola (Pattern Evaluation) ini
hasilnya merupakan temuan temuan pola-pola yang khas maupun model prediksi
memformulasikan keputusan atau aksi dari hasil analisis yang didapat dari
bisa dipahami semua orang adalah satu tahapan yang diperlukan. Dalam
2.2. Clustering
hasil yang akan di peroleh, berikut adalah pembagian data mining : Asosiasi Rules
Clasification adalah didalam pembagian data mining, Metode C45 dan Naive
11
(Luvia, Windarto, Solikhun, & Hartama, 2017) Clustering dapat juga dikatakan
teknik clustering kita bisa lebih lanjut mengidentifikasi kepadatan dan jarak
daerah dalam objek ruang dan dapat menemukan secara menyeluruh pola
mempunyai karakteristik yang sama dapat dikelompokan dalam satu cluster yang
kedalam cluster yang lain. Cluster yang dihasilkan dapat memberikan knowledge
atau pengetahuan baru dan menarik, sehingga dapat digunakan dalam suatu
pengambilan keputusan.
2.3.Algoritma K-Means
metode clustering berbasis jarak yang membagi data ke dalam sejumlah cluster
dan algoritma ini haya bekerja pada atribut numeric. Algoritma K-Means
12
kemampuannya untuk mengcluster data yang besar dan data outlier dengan sangat
cepat. (Darmi and Setiawan, 2016) Untuk itu digunakan algoritma K-Means yang
awal. Pada tahap ini pusat cluster dipilih secara acak dari sekumpulan populasi
data dan menandai komponen tersebut ke salah satu pusat cluster yang telah
cluster.Posisi puasat cluster akan dihitung kembali sampai semua komponen data
digolongkan kedalam tiap-tiap pusat cluster dan terakhir akan terbentuk posisi
5) Tentukan posisi centroid yang baru dengan cara menghitung nilai rata-rata dari
6) Kembali ke langkah-3 jika posisi centroid baru dengan centroid yang lama
tidak sama.
2.4. Susu
mammae (ambing) pada binatang mamalia betina, untuk bahan makanan dan
sumber gizi bagi anaknya. Susu adalah cairan berwarna putih yang disekresikan
oleh kelenjar mammae (ambing) pada binatang mamalia betina, untuk bahan
makanan dan sumber gizi bagi anaknya. Sebagian besar susu yang dikonsumsi
manusia berasal dari sapi, yang biasa disebut susu sapi. Sedangkan susu ternak
lain biasanya di ikuti nama ternak asal tersebut, misalnya susu kerbau, susu
kambing, susu unta dan sebagainya dan susu manusia disebut ASI atau dapat
2.5.Susu Segar
Susu segar ialah cairan yang berasal dari ambing sapi sehat dan bersih,
yang di peroleh dengan cara pemerahan yang benar, yang kandungan alami nya
tidak dikurangi atau di tambah sesuatu apapun dan belum mendapatkan perlakuan
bahan makanan yang istimewa bagi manusia karena kelezatan rasa dan
komposisinya yang ideal selain air susu mengandung semua zat yang dibutuhkan
14
oleh tubuh manusi, semua zat makanan yang terkandung didalam air susu dapat
diserap oleh darah dan dimanfaatkan oleh tubuh untuk memenuhi kebutuhan gizi
manusia. Susu juga salah satu asupan penting untuk memenuhi kebutuhan nutrisi.
Baik di konsumsi oleh anak anak, dan orang dewasa, dan susu juga mengambil
peranan penting dalam tingkat kecerdasan manusia. Hampir seluruh susu yang
dikonsumsi manusia berasal dari sapi perah, karena ternak sapi perah ini adalah
penghasil susu yang potensial. Beberapa ternak lain seperti kerbau, kambing, domba
dan kuda juga menghasilkan susu, tetapi masih dalam jumlah sedikit dan terbatas.
Susu yang berasal dari sapi perah lazim disebut susu, sedangkan susu dari ternak yang
lain diberi sebutan sesuai dengan nama hewan penghasilnya. Sebagai contoh, susu
dari kerbau disebut susu kerbau dan susu dari kambing disebut susu kambing.
Berdasarkan hasil penelitian Lely Anggriani Nababan, I Ketut Suada, Ida Bagus
Penyimpanan Suhu Ruang Ditinjau dari Uji Tingkat Keasaman, Didih, dan Waktu
Reduktase” menyimpulkan bahwa ketahanan susu segar pada suhu ruang selama
(4) empat jam ditinjau dari uji tingkat keasaman (pH), uji didih dan waktu
reduktase. (Nababan, Suada, Bagus, & Swacita, 2014) Dan juga berdasarkan hasil
penelitian Elisa Putri dalam jurnal nya yang berjudul “Kualitas protein susu sapi
yang masih baik dikonsumsi sesuai dengan SNI susu segar No.01-3141-1992
sampai umur penyimpanan 6 jam di dalam lemari es pada suhu 4oC. (Putri, 2016)
15
ini bersifat open source dan dibuat dengan menggunakan program Java di bawah
lisensi GNU Public Licence dan Rapid Miner dapat dijalankan di sistem operasi
koding khusus, karena semua fasilits sudah disediakan. Rapid Miner dikhususkan
untuk penggunaan data mining. Model yang disediakan juga cukup banyak dan
lengkap, seperti Model Bayesian, Modelling, Tree Induction, Neural Network dan
5.3, tampilan RapidMiner Studio versi 5.3 terdapat pada gambar 2.2. :
a. Menu Bar, merupakan menu utama yang terletak dibawah Title Bar yang
untuk mengolah dan menata proses serta dapat digunakan sebagai sumber
data.
RapidMiner yang terdiri dari Data Access, Blending, Cleansing, dan lainnya
langkah-langkah analisis.
lebih parameter agar dapat diindikasikan sebagai fungsionalitas yang baik dan
benar.
membuat proses baru, proses eksekusi analisis, dan untuk mencari data,
(Kurniawan, 2018). Beberapa tujuan atau fungsi dari penggunaan UML, antara
lain:
4. Dapat berguna sebagai blue print, yang nantinya akan diketahui informasi
Use case diagram merupakan interaksi antara sistem dan aktor, use case
dengan sistemnya. Berikut tabel simbol – simbol Use Case Diagram yang
Menggambarkan orang,
2 Actor
sistem atau eksternal entitas.
Menggambarkan jangkauan
3 System Boundary
sistem.
Menggambarkan bagaimana
4 Association
actor terlibat dalam use case.
19
khusus.
lain.
elemen-elemennya (sinergi).
20
b. Activity Diagram
Activity diagram atau diagram aktivitas merupakan salah satu jenis diagram
pada UML yang dapat memodelkan proses-proses apa saja yang terjadi pada
sistem. Berikut tabel simbol – simbol Activity Diagram yang tertera pada
tabel 2.2 :
c. Sequence Diagram
d. Class Diagram
e. Package Diagram
ke dalam tingkat pembangunan yang lebih tinggi yaitu berupa sebuah paket.
2.7 Flowchart
urusan kegiatan dari suatu program dari awal sampai akhir. Berikut tabel simbol –
No Simbol Fungsi
atternatif.
CLUSTERING
penyakit menular.
3. (Gaussian,
2015) PENGELOMPOKAN Berdasarkan nilai yang
CLUSTER
daerah-daerah pusat
N PENJUALAN
Hasil dari pemrosesan data
PRODUK PADA
menggunakan beberapa
SWALAYAN
software data mining tersebut
FADHILA
kurang laris
BAB 3
METODOLOGI PENELITIAN
oleh peneliti dalam rangka untuk mengumpulkan informasi atau data serta
dibutuhkan dalam rangka mencapai tujuan penelitian. Berikut beberapa hal yang
berbagai bentuk seperti statistik atau data yang sudah diolah sedemikian
3. Adapun data yang digunakan adalah data produksi susu segar di indonesia
mulai dari tahun 2000 hingga tahun 2017 yang di peroleh dari badan pusat
statistik.
Data yang digunakan dalam penelitian ini dapat dilihat pada gambar 3.1 :
Analisis data merupakan upaya atau cara untuk mengolah data menjadi
informasi sehingga karakteristik data tersebut bisa dipahami dan bermanfaat untuk
yang diperoleh untuk penelitian ini adalah produksi susu segar di indonesia per
provinsi dari tahun 2000 hingga 2017. Didalam penelitian ini hanya
Belitung, DKI Jakarta, Jawa Barat, Jawa Tengah, Daerah Istimewa Yogyakarta,
Jawa Timur, Banten, Bali, NTT, NTB, Kalimantan Barat, Kalimantan Selatan,
indonesia yang memproduksi susu segar. Dengan mengkluster hasil produksi susu
segar di indoneis menjadi 2 bagian yaitu cluster tinggi, dan cluster rendah.
Sehingga daerah dengan cluster rendah akan lebih di perhatikan dan lebih di
tingkatan produksi susu segarnya. Dan semua upaya itu akan berakibat penurunan
24
nilai impor susu segar di indonesia, serta untuk memenuhi kebutuhan susu
nasional cukup dengan mengonsumsi susu segar hasil produksi dalam negri.
penelitian, karena dengan ditetapkannya lokasi penelitian berarti objek dan tujuan
penelitian ini selama 1 bulan yang dimulai pada 1 Oktober 2018 sampai dengan 1
November 2018.
tinggi dan rendah. Sehingga daerah produksi susu segar yang tinggi dan daerah
Pada penelitian ini, terdapat tiga cluster yaitu cluster untuk daerah penghasil susu
Langkah selanjutnya yaitu dengan menetukan titik pusat (centroid) dari tiap-tiap
cluster.
dengan menghitung jarak setiap data dengan titik pusat yang sudah ditentukan
sebelumnya. Rumus untuk menghitung jarak setiap objek ke titik pusat adalah :
Dimana x adalah dataset jumlah produksi susu segar, dataset yang digunakan
untuk perhitungan Datamining ini adalah produksi susu segar tinggi dan rendah.
Sedangkan y adalah titik pusat yang sudah ditentukan secara acak (random).
4. Menghitung jarak setiap data hasil produksi per provisi terhadap pusat cluster
6. Menghitung nilai titik pusat centroid hasil iterasi dengan menggunakan rumus
(2).
7. Memeriksa kondisi berhenti proses iterasi, jika nilai centroid hasil iterasi
dengan nilai centroid sebelumnya bernilai sama atau nilai centroid sudah
optimal serta posisi cluster data hasil produksi tidak mengalami perubahan
Data Olahan
Iterasi 1
Jarak Pusat
No Nilai
Terpendek Hasil C1 C2 Cluster
1 567,7255556 C2 1 Iterasi 1
2 2806,743889 C2 1 C1= Max 372695,6
3 961,8061111 C2 1 C2= Min 3,0
4 97,2954545 C2 1
5 10,61 C2 1 Cluster Provinsi Hasil
6 188,1594444 C2 1 C1 (11 ,14) 2
7 691,534375 C2 1 (1,2,3,4,5,6,7
8 250,6533333 C2 1 8,9,10,12,13
9 147,791 C2 1 14,15,16,17,
10 34534,86444 C2 1 C2 19,20,21,22 25
11 132850,2601 C1 1 23,24,25,26,27
12 92418,30111 C2 1
13 6230,501111 C2 1
14 0 C1 1
15 26,00818182 C2 1
16 111,7569231 C2 1
17 25 C2 1
18 6,2825 C2 1
19 82,02411765 C2 1
20 158,4816667 C2 1
21 74,634 C2 1
22 0 C2 1
23 14086,70533 C2 1
24 24,5225 C2 1
25 19,33333333 C2 1
26 47,75 C2 1
27 43,18 C2 1
24
Iterasi 2
Nilai Rata-
No Provinsi
C1 C2 Rata C1 C2
1 ACEH 1 570,7255556 305699,7473 5576,741019
2 SUMUT 1 2809,743889 303460,729 3337,722686
3 SUMBAR 1 964,8061111 305305,6667 5182,660464
4 RIAU 1 100,2954545 306170,1774 6047,171121
5 JAMBI 1 13,61 306256,8629 6133,856575
6 SUMSEL 1 191,1594444 306079,3134 5956,307131
7 BENGKULU 1 694,534375 305575,9385 5452,9322
8 LAMPUNG 1 253,6533333 306016,8195 5893,813242
9 KEP. BABEL 1 150,791 306119,6819 5996,675575
10 DKI 1 34537,86444 271732,6084 28390,39786
11 JABAR 1 239845,3428 66425,13005 233697,8762
12 JATENG 1 92421,30111 213849,1717 86273,83453
13 DIY 1 6233,501111 300036,9717 86,03453594
14 JATIM 1 372695,6029 66425,13005 366548,1363
15 BANTEN 1 29,00818182 306241,4647 6118,458393
16 BALI 1 114,7569231 306155,7159 6032,709652
17 NTB 1 28 306242,4729 6119,466575
18 NTT 1 9,2825 306261,1904 6138,184075
19 KALBAR 1 85,02411765 306185,4487 6062,442457
20 KALSEL 1 161,4816667 306108,9912 5985,984908
21 KALTIM 1 77,634 306192,8389 6069,832575
22 KALUT 1 3 306267,4729 6144,466575
23 SULSEL 1 14089,70533 292180,7675 7942,238755
24 SULTENG 1 27,5225 306242,9504 6119,944075
25 GORONTALO 1 22,33333333 306248,1395 6125,133242
26 SULBAR 1 50,75 306219,7229 6096,716575
27 PAPUA 1 46,18 306224,2929 6101,286575
24
Jarak Pusat
No Nilai
Terpendek Hasil C1 C2 Cluster
1 5576,741019 C2 1 Iterasi 2
2 3337,722686 C2 1 C1= Max 306270,5
3 5182,660464 C2 1 C2= Min 6147,5
4 6047,171121 C2 1
5 6133,856575 C2 1 Cluster Provinsi Hasil
6 5956,307131 C2 1 C1 (11 ,14) 2
7 5452,9322 C2 1 (1,2,3,4,5,6,7
8 5893,813242 C2 1 8,9,10,12,13
9 5996,675575 C2 1 14,15,16,17,
10 28390,39786 C2 1 C2 19,20,21,22 25
11 66425,13005 C1 1 23,24,25,26,27
12 86273,83453 C2 1
13 86,03453594 C2 1
14 66425,13005 C1 1
15 6118,458393 C2 1
16 6032,709652 C2 1
17 6119,466575 C2 1
18 6138,184075 C2 1
19 6062,442457 C2 1
20 5985,984908 C2 1
21 6069,832575 C2 1
22 6144,466575 C2 1
23 7942,238755 C2 1
24 6119,944075 C2 1
25 6125,133242 C2 1
26 6096,716575 C2 1
27 6101,286575 C2 1
Hasil dari iterasi 1 dan 2 menyatakan nilai yg sama, yaitu Cluster tinggi dengan 2
provinsi dan Cluster rendah dengan 25 provinsi. Jika hasil cluster sudah stabil dan
gambar 3.3.
1. Identifikasi Masalah
Merupakan pengenalan suatu masalah, dan tahap awal dalam proses penelitian.
3. Pengolahan Data
Pada tahap ini, data diolah untuk mendapatkan hasil yang kemudian dapat diolah
Transformasi data, data yang berjenis alfabet seperti nama blok harus dilakukan
Kemudian mengelompokkan data yang sudah ada dalam dua kelompok yaitu
sebuah software
Rapidminer :
BAB 4
HASIL DAN PEMBAHASAN
4.1. Hasil
Hasil penelitian ini disajikan sesuai penelitian yang dilakukan. Data yang
digunakan dalam penelitian ini adalah data hasil produksi susu segar per provinsi
di Indonesia dimulai dari tahun 2000 hingga tahun 2017. Data yang diperoleh
untuk penelitian ini adalah produksi susu segar di indonesia per provinsi dari
tahun 2000 hingga 2017. Didalam penelitian ini hanya menggunakan 27 provinsi
tidak mempunyai data produksi susu segar yang valid. Data tersebut di
kelompokkan menjadi 2 bagian yaitu : daerah penghasil susu tinggi dan daerah
masuk ke dalam kelompok daerah penghasil susu tinggi dan daerah penghasil
Clustering.
24
4.1.1. Menu
Berikut akan dijelaskan bagian dari menu awal pada tools rapidminer
seperti tampilan awal dari rapidminer dan akan dimulai dengan menu new
process.
Process, Open Recent Process, Open Process, Open Template dan Online
1. New Process Menu ini berisikan tampilan awal jika kita akan membuat
proses baru dengan data baru yang belum pernah ada dalam tools ini.
proses yang baru saja dibuat dengan jangka waktu tertentu, biasanya
akan langsung muncul pada tampilan awal tools tanpa harus mencari
3. Open Process Menu ini berfugsi untuk membuka proses yang telah
Dikarenakan data yang akan diuji adalah data baru, maka pilih New
Process. Maka akan muncul jendela seperti gambar berikut :
lebih lanjut, pada hal ini data yang akan di eksekusi berupa data excel. Tahapan
Klik pada bagian kiri bawah tab repositories lalu pilih “Import Read
menyimpan data yang akan digunakan. Selanjutnya pilih file name data yang
Gambar diatas menunjukkan isi data yang akan di proses. Pilih sheet
pada data serta blok data yang akan di proses. Pilih next next hinga finish dan
atribute diubah menjadi tipe”id” dan Keterangan diberi tipe “label”.Lalu pilih
next.
meng klik Clustering and Segmentation lalu pilih K-Means dapat dilihat pada
Drag atau klik dan tahan data yang telah disimpan pada repositories ke
dapat dilakukan dengan cara mengklik tada panah biru yang terdapat diposisi
tengah atas pada bagian toolbar. Pada tahap ini akan menampilkan hasil akhir
serta langkah terakhir dalam penggunaan tools rapidminer ini. Dapat dilihat pada
gambar 4.10.
Keterangan :
Sehingga dapat diketahui hasil pengelompokan dari rapidminer 5.3 berikut ini
tinggi memiliki banyak node yaitu 2, sedangkan pada kelompok rendah memiliki
25 node.
4.2. Pembahasan
serta hasil yang telah ditampilkan maka berikut akan dibahas mengenai
keterkaitan dari hasil yang didapat antara perhitungan manual algoritma dengan
berupa Cluster, serta data yang digunakan haruslah data yang valid dan sama
1. Kebutuhan Software
penyelesaian diantaranya :
2. Kebutuhan Hardware
2. Klik bagian kiri bawah tab repositories lalau pilih “ Import Read
Excel”.
4. Klik bagian kiri bawah tab repositories lalau pilih “ Clustering and
1. Kelemahan Sistem
2. Kelebihan Sistem
BAB 5
5.2. Kesimpulan
indonesia.
5.2. Saran
penelitian ini lebih jauh,ada beberapa saran yang harus diterapkan guna
1. Gunakan lah data yaang tidak memiliki nilai nol, sehingga perhitungan
para peneliti yang lain untuk dapat menggunakan penelitian ini sebagai
DAFTAR PUSTAKA