Anda di halaman 1dari 26

LAPORAN PRAKTIKUM

ANALISIS MULTIVARIAT

MODUL 4

ANALISIS CLUSTER PADA DATA PEMELIHARAAN TERNAK SAPI


MENGGUNAKAN METODE HIERARKI DAN NON-HIERARKI

Oleh:
Marita Qori’atunnadyah 06211640000001
Niam Zuhdi Yuliarto 06211640000061

Asisten Dosen :
Sri Hidayati

Dosen:
Dr. Bambang Widjanarko Otok., S.Si., M.Si.

PROGRAM STUDI SARJANA


DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA, KOMPUTASI, DAN SAINS DATA
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
SURABAYA
2019

i
ABSTRAK

Sektor peternakan memiliki peluang pasar yang sangat baik, dimana pasar domestik akan terus meningkat
seiring dengan pertumbuhan penduduk yang semakin pesat. Keberhasilan suatu usaha peternakan sangat
dipengaruhi oleh baik tidaknya tatalaksana pemeliharaan. Tatalaksana pemeliharaan ternak sapi dimulai dari
pemilihan bibit sapi, pemberian pakan dan suplemen, pencegahan penyakit, tenaga kerja, dan lain-lain.
Dikarenakan beberapa observasi memiliki karakteristik yang sama maka perlu dilakukan pengelompokan
observasi tersebut sehingga terbentuk kluster atau kelompok baru yang mewakili variabilitas observasi-
observasi yang ada. Sebelum melakukan analisis cluster terlebih dahulu data harus memenuhi asumsi
independen. Pada praktikum ini akan dilakukan analisis cluster untuk mengelompokkan ternak sapi
berdasarkan faktor-faktor yang mempengaruhi berat sapi ketika dijual. Metode hierarki yang paling baik
untuk mengelompokkan ternak sapi berdasarkan faktor-faktor yang mempengaruhi berat sapi ketika dijual
adalah metode single linkage dengan jumlah cluster optimum yang dapat terbentuk yaitu sebanyak 6 cluster.
Metode non-hierarki yang digunakan adalah K-Means dengan 6 cluster. Metode cluster yang paling sesuai
untuk mengelompokkan ternak sapi berdasarkan faktor-faktor yang mempengaruhi berat sapi ketika dijual
adalah metode K-Means dengan 6 cluster.
Kata Kunci : Analisis Cluster, Complete Linkage, K-Means, Single Linkage

ii
DAFTAR ISI

HALAMAN JUDUL ............................................................................................................ i


ABSTRAK ............................................................................................................................ ii
DAFTAR ISI ....................................................................................................................... iii
DAFTAR TABEL ............................................................................................................... iv
DAFTAR GAMBAR ........................................................................................................... v
DAFTAR LAMPIRAN ...................................................................................................... vi
BAB I PENDAHULUAN .................................................................................................... 1
1.1 Latar Belakang ........................................................................................................... 1
1.2 Rumusan Masalah ...................................................................................................... 2
1.3 Tujuan ........................................................................................................................ 2
1.4 Manfaat ...................................................................................................................... 2
1.5 Batasan Masalah ........................................................................................................ 2
BAB II TINJAUAN PUSTAKA ......................................................................................... 3
2.1 Analisis Cluster ......................................................................................................... 3
2.2 Pemilihan Jumlah Cluster Optimum ......................................................................... 4
2.3 Pemilihan Metode Cluster Terbaik ............................................................................ 5
2.4 Dendogram ................................................................................................................ 5
2.5 Pemeliharaan Ternak Sapi .......................................................................................... 5
BAB III METODOLOGI PENELITIAN .......................................................................... 6
3.1 Sumber Data .............................................................................................................. 6
3.2 Variabel Penelitian dan Struktur Data ....................................................................... 6
3.3 Langkah Analisis ....................................................................................................... 6
3.4 Diagram Alir .............................................................................................................. 7
BAB IV ANALISIS DAN PEMBAHASAN ...................................................................... 8
4.1 Analisis Cluster Metode Hierarki .............................................................................. 8
4.2 Analisis Cluster Metode Non-Hierarki .................................................................... 11
4.3 Perbandingan Analisis Cluster Metode Hierarki dan Metode Non-Hierarki .......... 13
BAB V KESIMPULAN DAN SARAN ............................................................................ 15
5.1 Kesimpulan .............................................................................................................. 15
5.2 Saran ........................................................................................................................ 15
DAFTAR PUSTAKA ........................................................................................................ 16
LAMPIRAN ....................................................................................................................... 17

iii
DAFTAR TABEL

Tabel 3. 1 Variabel Penelitian............................................................................................... 6


Tabel 3. 2 Struktur Data ........................................................................................................ 6
Tabel 4. 1 Perbandingan Jumlah Cluster yang Mungkin Terbentuk pada Metode Single
Linkage ............................................................................................................... 9
Tabel 4. 2 Hasil Pengelompokan Menggunakan Metode Single Linkage dengan 7 Cluster
(Optimum) .......................................................................................................... 9
Tabel 4. 3 Perbandingan Jumlah Cluster yang Mungkin Terbentuk pada Metode Complete
Linkage ............................................................................................................. 10
Tabel 4. 4 Hasil Pengelompokan Menggunakan Metode Complete Linkage dengan 3
Cluster (Optimum) ............................................................................................ 11
Tabel 4. 5 Perbandingan Metode Single Linkage dan Complete Linkage ......................... 11
Tabel 4. 6 Initial Cluster Centers Metode K-Means ........................................................... 12
Tabel 4. 7 Jumlah Iterasi pada K-Means 6 Cluster ............................................................. 12
Tabel 4. 8 Final Cluster Centers Metode K-Means ............................................................ 12
Tabel 4. 9 Jumlah Observasi tiap Cluster pada K-Means 6 Cluster ................................... 13
Tabel 4. 10 ANOVA ........................................................................................................... 13
Tabel 4. 11 Hasil Pengelompokan Menggunakan Metode Single Linkage dengan 7 Cluster
(Optimum) ........................................................................................................ 13
Tabel 4. 12 Perbandingan Metode Single Linkage dan K-Means ...................................... 14

iv
DAFTAR GAMBAR

Gambar 3. 1 Diagram Alir ................................................................................................... 7


Gambar 4. 1 Dendogram dengan Single Linkage ................................................................ 8
Gambar 4. 2 Dendogram dengan Single Linkage .............................................................. 10

v
DAFTAR LAMPIRAN

Lampiran 1. Data Pemeliharaan Ternak Sapi .................................................................... 17


Lampiran 2. Output SPSS untuk Case Processing Summary ............................................ 17
Lampiran 3. Output SPSS untuk Agglomeration Schedule Single Linkage ...................... 17
Lampiran 4. Output SPSS untuk Anggota Cluster Single Linkage ................................... 18
Lampiran 5. Output SPSS untuk Agglomeration Schedule Complete Linkage ................. 18
Lampiran 6. Output SPSS untuk Anggota Cluster Complete Linkage .............................. 19
Lampiran 7. Output SPSS untuk Initial Cluster Centers K-Means ................................... 19
Lampiran 8. Output SPSS untuk Iteration History K-Means ............................................ 19
Lampiran 9. Output SPSS untuk ANOVA K-Means......................................................... 20
Lampiran 10. Output SPSS untuk Number of Cases in each Cluster ................................ 20

vi
BAB I
PENDAHULUAN

1.1 Latar Belakang


Sektor peternakan adalah sektor yang memberikan kontribusi tinggi dalam
pembangunan pertanian. Sektor ini memiliki peluang pasar yang sangat baik, dimana pasar
domestik akan terus meningkat seiring dengan pertumbuhan penduduk yang semakin pesat.
Semakin meningkatnya pendapatan penduduk maka permintaan produk-produk peternakan
mengalami peningkatan. Hal ini disebabkan karena meningkatnya pendapatan seseorang
maka konsumsi terhadap sumber karbohidrat akan menurun dan konsumsi berbagai macam
makanan yang kaya akan protein akan meningkat. Subsektor peternakan memiliki peranan
penting dalam menopang perekonomian regional maupun nasional. Masalah peternakan ini
sudah tidak dapat dinomorduakan karena hal tersebut akan dominan ikut menentukan
kelangsungan hidup suatu negara ataupun bangsa (Saragih, 2008).
Sapi merupakan hewan yang memiliki potensi sebagai penghasil daging paling besar
dari kelompok ruminansia terhadap produksi daging nasional sehingga usaha ternak ini
berpotensi untuk dikembangkan sebagai usaha menguntungkan. Sapi memiliki kelebihan,
yaitu daya adaptasi terhadap lingkungan tinggi, mampu memanfaatkan pakan berkualitas
rendah, dan mempunyai daya reproduksi yang baik. Berat sapi menjadi hal yang sangat
penting dalam penjualan produk peternakan. Potensi dan kelebihan sapi ini bisa
dimanfaatkan secara optimal sehingga mampu menghasilkan suatu capaian keberhasilan.
Keberhasilan suatu usaha peternakan sangat dipengaruhi oleh baik tidaknya tatalaksana
pemeliharaan. Tatalaksana pemeliharaan ternak sapi dimulai dari pemilihan bibit sapi,
pemberian pakan dan suplemen, pencegahan penyakit, tenaga kerja, dan lain-lain.
Dikarenakan beberapa observasi memiliki karakteristik yang sama maka perlu dilakukan
pengelompokan observasi tersebut sehingga terbentuk kluster atau kelompok baru yang
mewakili variabilitas observasi-observasi yang ada.
Dalam statistika, salah satu metode untuk mengelompokan objek atau observasi adalah
analisis cluster. Analisis cluster digunakan untuk mengelompokkan objek-objek atau
observasi berdasarkan kemiripan karakteristik yang dimilikinya. Dimana tingkat kemiripan
karakteristik objek-objek dalam suatu kelompok (cluster) sangat tinggi sedangkan tingkat
kemiripan karakteristik objek antar cluster satu dengan yang lainnya rendah. Dalam analisis
cluster terdapat tiga metode yaitu hierarki yang terdiri dari single linkage, complete linkage,
dan average linkage serta non-hierarki yaitu K-means method. Sebelum melakukan analisis

1
cluster terlebih dahulu data harus memenuhi asumsi independen (Hair, 2010). Pada
praktikum ini akan dilakukan analisis cluster untuk mengelompokkan ternak sapi
berdasarkan faktor-faktor yang mempengaruhi berat sapi ketika dijual. Diharapkan dalam
pembuatan laporan praktikum ini, mahasiswa dapat mengetahui dan memahami tahapan-
tahapan dalam analisis cluster.
1.2 Rumusan Masalah
Permasalahan yang digunakan sebagai acuan analisis pada penelitian ini adalah sebagai
berikut.
1. Bagaimana analisis cluster data pemeliharaan ternak sapi menggunakan metode hierarki
(single linkage dan complete linkage)?
2. Bagaimana analisis cluster data pemeliharaan ternak sapi dengan menggunakan metode
non-hierarki (K-means)?
3. Bagaimana menentukan metode cluster terbaik untuk data pemeliharaan ternak sapi?

1.3 Tujuan
Tujuan yang akan dicapai berdasarkan rumusan masalah adalah sebagai berikut.
1. Mengetahui analisis cluster data pemeliharaan ternak sapi menggunakan metode
hierarki (single linkage dan complete linkage).
2. Mengetahui analisis cluster data pemeliharaan ternak sapi dengan menggunakan metode
non-hierarki (K-means).
3. Mengetahui metode cluster terbaik untuk data pemeliharaan ternak sapi.

1.4 Manfaat
Manfaat yang didapatkan dari praktikum kali ini, khususnya bagi penulis adalah dapat
memahami penggunaan ilmu tentang analisis pengelompokan atau clustering, pengerjaan
laporan ini dapat meningkatkan pemahaman mengenai penerapan analisis clustering dalam
kasus atau persoalan nyata. Sedangkan bagi pembaca, hasil praktikum ini diharapkan dapat
menjadi salah satu referensi penerapan analisis clustering dalam bidang peternakan.

1.5 Batasan Masalah


Batasan masalah yang digunakan dalam penelitian ini adalah data pemeliharaan ternak
sapi. Data diasumsikan memenuhi asumsi independen. Metode cluster hierarki yang
digunakan adalah Single Linkage dan Complete Linkage, sedangkan metode cluster non-
hierarki yang digunakan adalah K-means. Jarak pembeda yang digunakan adalah jarak
Euclidean.

2
BAB II
TINJAUAN PUSTAKA

2.1 Analisis Cluster


Analisis cluster merupakan salah satu analisis multivariat yang bertujuan untuk
mengelompokkan objek-objek berdasarkan kemiripan karakteristik yang dimilikinya.
Tingkat kemiripan karakteristik yang dimaksud adalah objek-objek dalam suatu kelompok
(cluster) sangat tinggi sedangkan tingkat kemiripan karakteristik objek antar cluster satu
dengan yang lainnya rendah (Johnson & Wicherin, 2007). Terdapat 2 metode cluster yaitu
hierarki dan non-hierarki.
1. Metode Hierarki
Metode clustering hierarki dapat dilakukan berdasarkan pendekatan aglomeratif
(penggabungan) dan devisif (pemisahan/kebalikan dari aglomeratif). Pendekatan
aglomeratif menggabungkan satu per satu objek menjadi cluster-cluster baru yang telah
ditentukan kedekatan antar clusternya. Proses penentuan kedekataan dilakukan dengan
menghitung jarak antar cluster. Pendekatan devisif yaitu memulai banyaknya cluster
sebanyak satu cluster beranggotakan seluruh objek, kemudian dipisahkan menjadi dua
berdasarkan criteria kedekatan. Metode hierarki yang akan digunakan dalam analisis adalah
metode single linkage dengan rumus sebagai berikut (Johnson & Wicherin, 2007)
 Metode Single Linkage merupakan metode yang menggunakan jarak terdekat dan
dirumuskan dengan
d (ij ) k  min(dik , d jk ) (2.1)

 Metode Complete Linkage merupakan metode cluster yang menggunakan jarak terjauh
dan dirumuskan dengan
d (ij ) k  max(dik , d jk ) (2.2)

2. Metode non-hierarki
Metode Non hirarki yang sering digunakan adalah metode K-Means. Metode K-Means
merupakan salah satu metode analisis cluster nonhierarki yang dapat digunakan untuk
mempartisi objek kedalam kelompok-kelompok berdasarkan kedekatan karakteristik,
sehingga objek yang mempunyai karakteristik yang sama dikelompokan dalam satu cluster
yang sama dan objek yang mempunyai karakteristik yang berbeda dikelompokan kedalam
cluster yang lain (Johnson & Wicherin, 2007). Tujuan pengelompokan adalah untuk
meminimalkan objective function yang di set dalam proses pengelompokan, yang pada
dasarnya berusaha untuk meminimalkan variasi dalam satu cluster dan memaksimalkan
3
variasi antar cluster (Suliyanto, 2005). Kelebihan metode K-Means adalah efisien untuk data
yang besar. Kelemahan metode K-Means adalah jumlah/ banyaknya cluster dapat ditentukan
di awal oleh peneliti.
Algoritma K-Means dapat dilakukan sebagai berikut:
a. Menentukan besarnya k (banyaknya cluster yang akan dibentuk) serta centroid awal
di tiap cluster. Penentuan centroid awal dapat dilakukan secara acak dari k buah
observasi.
b. Menghitung jarak antara setiap objek dengan centroid awal, kemudian memasukkan
objek-objek ke suatu cluster berdasarkan jarak terdekat dengan centroid yang
bersesuaian. Umumnya perhitungan jarak dilakukan berdasarkan jarak euclidean.
c. Menghitung kembali centroid dari cluster yang baru dibentuk.
d. Mengulangi langkah (b) dan (c) sampai tidak ada lagi objek yang berpindah cluster.

2.2 Pemilihan Jumlah Cluster Optimum


Pemilihan jumlah kelompok optimum dapat digunakan kriteria nilai Pseudo Fstatistics.
Berikut adalah persamaan yang digunakan untuk menghitung nilai Pseudo Fstatistics.
 R2 
 
k 1 
Pseudo Fstatistics   (2.3)
 1  R2 
 
 nk 

dimana
 SST  SSW 
R2  (2.4)
SST
p
SST    xijk  x j 
n c
2
(2.5)
i 1 j 1 k 1

p
SSW    xijk  x jk 
n c
2
(2.6)
i 1 j 1 k 1

Keterangan:
SST = Total jumlah dari kuadrat jarak sampel terhadap rata-rata keseluruhan
SSW = Total jumlah dari kuadrat jarak sampel terhadap rata-rata kelompoknya
n = banyaknya sampel
c = banyaknya variabel
p = banyaknya kelompok
xijk = sampel ke-i pada variabel ke-j kelompok ke-k

xj = rata-rata seluruh sampel pada variabel ke-j

4
x jk = rata-rata sampel pada variabel ke-j dan kelompok ke-k
Nilai Pseudo Fstatistics tertinggi menunjukkan bahwa jumlah kelompok yang digunakan
untuk memartisi data telah optimal (Orpin, 2006).

2.3 Pemilihan Metode Cluster Terbaik


Pemilihan metode cluster terbaik dapat menggunakan nilai icdrate. Nilai icdrate
menunjukkan bahwa semakin kecil nilainya maka akan semakin baik hasil dari
pengelompokan (cluster) (Mingoti & Lima, 2006). Perhitungan nilai icdrate adalah sebagai
berikut.
SSB SST  SSW
icdrate  1   1  1  R2 (2.7)
SST SST
Keterangan:
SSB : Sum Square Between (SST-SSW)
SST : Total jumlah dari kuadrat jarak terhadap rata-rata keseluruhan
SSW : Total jumlahdari kuadrat jarak sampel terhadap rata-rata kelompoknya
R2 : Recovery rate (SSB/SST)
k : Banyak kelompok
n : Banyak observasi

2.4 Dendogram
Dendrogram merupakan suatu grafik pohon yang terstruktur yang digunakan untuk
memetakan atau memvisualisasi hasil perhitungan cluster. Hasil pengelompokan akan
disajikan dalam bentuk diagram, sebagai jarak atau kesamaan antara baris atau kolom
tergantung pada ukuran jarak yang dipilih (Johnson & Wicherin, 2007).

2.5 Pemeliharaan Ternak Sapi


Pemeliharaan sapi mencakup penyediaan pakan (ransum) dan pengelolaan kandang.
Pakan merupakan sumber energi utama untuk pertumbuhan dan pembangkit tenaga. Makin
baik mutu dan jumlah pakan yang diberikan, makin besar tenaga yang ditimbulkan dan
masih besar pula energi yang tersimpan dalam bentuk daging. Kandang dalam pemeliharaan
sapi berfungsi melindungi sapi dari hujan dan panas matahari, mempermudah perawatan
dan pemantauan, menjaga keamanan dan kesehatan sapi (Bappenas, 2013)

5
BAB III
METODOLOGI PENELITIAN

3.1 Sumber Data


Sumber data yang digunakan dalam praktikum ini berasal dari sumber data sekunder
yang diperoleh dari data pemeliharaan ternak sapi. Sumber data ini didapatkan dari
penelitian Heru Wiryanto yang diakses pada :
Hari/Tanggal : Senin, 7 April 2018
Pukul : 10.46 WIB
Tempat : Dept. Statistika ITS

3.2 Variabel Penelitian dan Struktur Data


Variabel yang digunakan dalam praktikum ini sebanyak 7 variabel dengan jumlah 60
pengamatan. Adapun variabel penelitian yang digunakan dalam praktikum ini adalah sebagai
berikut.
Tabel 3. 1 Variabel Penelitian
Variabel Keterangan Satuan
Berat bibit awal yang Kg
X1
dipelihara
X2 Makanan hijauan Kg
X3 Makanan kering jerami Kg
X4 Makanan dedak Kg
X5 Suplemen Kg
X6 Obat Dosis
X7 Tenaga Kerja Jam
Struktur data yang digunakan dalam praktikum ini adalah sebagai berikut.
Tabel 3. 2 Struktur Data
Variabel
n
X1 X2 X3 X4 X5 X6 X7
1 X1,1 X2,1 X3,1 X4,1 X5,1 X6,1 X7,1
2 X1,2 X2,2 X3,2 X4,2 X5,2 X6,2 X7,2
3 X1,3 X2,3 X3,3 X4,3 X5,3 X6,3 X7,3
. . . . . . . .
. . . . . . . .
. . . . . . . .
44 X1,44 X2,44 X3,44 X4,44 X5,44 X6,44 X7,44
45 X1,45 X2,45 X3,45 X4,45 X5,45 X6,45 X7,45

3.3 Langkah Analisis


Langkah analisis yang digunakan dalam penelitian ini adalah :
1. Merumuskan masalah dan studi literature.
2. Mengumpulkan data.

6
3. Melakukan analisis cluster dengan menggunakan metode hierarki (single linkage dan
complete linkage).
4. Melakukan analisis cluster dengan menggunakan metode non-hierarki (K-means).
5. Menentukan model cluster terbaik berdasarkan nilai icdrate.
6. Menarik kesimpulan dan memberikan saran.

3.4 Diagram Alir


Diagram alir menggambarkan alur perjalanan pembuatan laporan ini. mulai dari proses
perumusan masalah hingga pemberian kesimpulan dan saran. Diagram alir yang dipakai
dalam laporan ini adalah :

Mulai

Merumuskan Masalah dan Studi


literature

Mengumpulkan Data

Menganalisis cluster dengan


menggunakan metode hierarki (single
linkage dan complete linkage)

Menganalisis cluster dengan


menggunakan metode non-hierarki
(K-means)

Menentukan model cluster terbaik


berdasarkan nilai icdrate

Kesimpulan dan Saran

Selesai

Gambar 3. 1 Diagram Alir

7
BAB IV
ANALISIS DAN PEMBAHASAN

4.1 Analisis Cluster Metode Hierarki


Analisis cluster untuk metode hierarki pada praktikum ini menggunakan metode single
linkage dan complete linkage. Adapun hasil analisis dari masing-masing metode hierarki
adalah sebagai berikut.
1. Single Linkage
Pengelompokan pada metode single linkage ini dilakukan dengan menggunakan jarak
terkecil square euclidean. Dalam menentukan kemungkinan jumlah cluster yang terbentuk
dapat dilihat melalui dendrogram yang telah disajikan pada Gambar 4.1.

Gambar 4. 1 Dendogram dengan Single Linkage

8
Berdasarkan Gambar 4.1, jumlah cluster yang mungkin terbentuk yaitu 3 cluster, 6
cluster dan 9 cluster. Berikut merupakan perbandingan untuk masing-masing jumah cluster
yang mungkin terbentuk dilihat dari nilai Pseudo Fstatisticsnya.
Tabel 4. 1 Perbandingan Jumlah Cluster yang Mungkin Terbentuk pada Metode Single Linkage
Jumlah Cluster yang Mungkin
Nilai
Terbentuk Berdasarkan
Pseudo
Dendrogram
3 Cluster 26,5358
6 Cluster 51,9516
9 Cluster 50,4147
Berdasarkan Tabel 4.1 diatas dapat diketahui bahwa jumlah cluster optimum yang dapat
terbentuk menggunakan metode single linkage yaitu sebanyak 6 cluster, sebab dengan 6
cluster dihasilkan nilai Pseudo Fstatistics paling tinggi dibandingkan cluster yang lainnya.
Adapun hasil pengelompokan ternak sapi dengan 7 cluster pada metode single linkage
disajikan pada Tabel 4.2.
Tabel 4. 2 Hasil Pengelompokan Menggunakan Metode Single Linkage dengan 7 Cluster (Optimum)
Jumlah Cluster Cluster ke- Anggota Cluster (Observasi)
1 1 – 14
2 15
3 16 – 27
6
4 28 – 35
5 36 – 42
6 43 – 45
Tabel 4.2 memberikan informasi bahwa jumlah anggota masing-masing cluster pada
pengelompokan 6 cluster memiliki jumlah anggota yang tidak seimbang. Dimana cluster ke-
1 pada pengelompokan 6 cluster memiliki anggota paling banyak daripada yang lainnya
yaitu sebanyak 14 ternak sapi, sedangkan anggota paling sedikit terdapat pada cluster ke-2
yaitu 1 ternak sapi.
2. Complete Linkage
Pengelompokan pada metode complete linkage ini dilakukan dengan menggunakan
jarak terkecil square euclidean. Dalam menentukan kemungkinan jumlah cluster yang
terbentuk dapat dilihat melalui dendrogram yang telah disajikan pada Gambar 4.2.

9
Gambar 4. 2 Dendogram dengan Single Linkage

Berdasarkan dendrogram diatas, jumlah cluster yang mungkin terbentuk yaitu 2


cluster, 3 cluster dan 4 cluster. Berikut merupakan perbandingan untuk masing-masing
jumah cluster yang mungkin terbentuk dilihat dari nilai Pseudo Fstatisticsnya.
Tabel 4. 3 Perbandingan Jumlah Cluster yang Mungkin Terbentuk pada Metode Complete Linkage
Jumlah Cluster yang Mungkin
Nilai
Terbentuk Berdasarkan
Pseudo
Dendrogram
2 Cluster 45,8339
3 Cluster 67,3915
4 Cluster 63,5181

10
Berdasarkan Tabel 4.3 diatas dapat diketahui bahwa jumlah cluster optimum yang dapat
terbentuk menggunakan metode complete linkage yaitu sebanyak 3 cluster, sebab dengan 3
cluster dihasilkan nilai Pseudo Fstatistics paling tinggi dibandingkan cluster yang lainnya.
Adapun hasil pengelompokan ternak sapi dengan 3 cluster pada metode complete linkage
disajikan pada Tabel 4.4.
Tabel 4. 4 Hasil Pengelompokan Menggunakan Metode Complete Linkage dengan 3 Cluster (Optimum)
Jumlah Cluster Cluster ke- Anggota Cluster (Observasi)
1 1 – 10 dan 16 – 27
7 2 11 – 15 dan 28 – 39
3 40 – 45
Tabel 4.4 memberikan informasi bahwa jumlah anggota masing-masing cluster pada
pengelompokan 3 cluster memiliki jumlah anggota yang tidak seimbang. Dimana cluster ke-
1 pada pengelompokan 7 cluster memiliki anggota paling banyak daripada yang lainnya
yaitu sebanyak 22 ternak sapi, sedangkan anggota paling sedikit terdapat pada cluster ke-3
yaitu masing-masing dengan 6 ternak sapi.
3. Perbandingan Single linkage dan Complete linkage
Dari hasil analisis sebelumnya telah diketahui bahwa jumlah cluster optimum untuk
metode single linkage yaitu 7 cluster, sedangkan jumlah cluster optimum untuk metode
complete linkage yaitu 3 cluster. Langkah selanjutnya yaitu menentukan metode terbaik
dengan meninjau nilai R2 dan nilai icdrate yang disajikan pada Tabel 4.5 berikut.
Tabel 4. 5 Perbandingan Metode Single Linkage dan Complete Linkage
Jumlah Cluster Optimum
Metode Nilai R2 Nilai icdrate
yang terbentuk
Single Linkage 6 Cluster 0,86946 0,13054
Complete Linkage 3 Cluster 0,76242 0,23758
Hasil perbandingan pada Tabel 4.5 memberikan kesimpulan bahwa metode hierarki
yang paling baik untuk mengelompokkan ternak sapi berdasarkan faktor-faktor yang
mempengaruhi berat sapi ketika dijual adalah metode single linkage dengan jumlah cluster
optimum yang dapat terbentuk yaitu sebanyak 6 cluster. Dipilihnya single linkage sebagai
metode terbaik daripada complete linkage sebab metode single linkage memiliki nilai R2
lebih tinggi (0,88012) dan nilai icdrate lebih kecil (0,11988) daripada metode complete
linkage.

4.2 Analisis Cluster Metode Non-Hierarki


Pada praktikum ini, analisis cluster dengan metode non-hierarki dilakukan
menggunakan metode K-Means. Dimana pada analisis sebelumnya diperoleh informasi
bahwa jumlah cluster optimum yang dapat terbentuk adalah sebanyak 6 cluster, sehingga
11
pada analisis cluster dengan metode k-means digunakan 𝑘 sebanyak 6 dengan data yang
telah di standardize menggunakan z-score. Adapun hasil analisis metode k-means sebagai
berikut.
Tabel 4. 6 Initial Cluster Centers Metode K-Means
Cluster ZX1 ZX2 ZX3 ZX4 ZX5 ZX6 ZX7
1 -0,28364 -0,13763 0,64086 0,39185 0,41514 1,15109 -0,01508
2 -0,39453 -0,80971 -1,10814 -1,23167 -1,04057 -1,07949 -1,88472
3 1,76780 0,87051 -0,37198 -0,62285 -0,31271 -0,58381 -0,22463
4 -1,02059 -0,58569 -0,24846 -0,21697 -0,49468 -0,33596 -0,88866
5 -1,59351 -1,25777 -1,13778 -0,82579 -0,79795 -0,83165 0,20036
6 1,640474 2,88677 1,38196 2,21832 2,23477 1,89462 1,31594
Output pada Tabel 4.6 memberikan informasi mengenai centroid awal atau inisial yang
dipilih secara acak, sedangkan untuk banyak iterasi yang dibutuhkan untuk membentuk 6
cluster ditampilkan pada Tabel 4.7 berikut ini.
Tabel 4. 7 Jumlah Iterasi pada K-Means 6 Cluster
Change in Iteration
Cluster
Centers 1 2 3
1 0,902 0,000 0,000
2 0,747 0,000 0,000
3 0,435 0,000 0,000
4 0,745 0,214 0,000
5 0,630 0,509 0,000
6 1,132 0,000 0,000
Berdasarkan hasil iterasi pada metode k-means dengan 6 cluster dapat diketahui bahwa
untuk membentuk 6 cluster diperlukan 3 kali proses iterasi. Berikut disajikan pula nilai akhir
pusat cluster pada Tabel 4.8.
Tabel 4. 8 Final Cluster Centers Metode K-Means
Cluster ZX1 ZX2 ZX3 ZX4 ZX5 ZX6 ZX7
1 -0,08304 0,09574 0,82202 0,59479 0,61732 0,75867 0,65535
2 -0,01150 -0,54760 -1,11110 -1,02873 -0,99204 -1,12906 -1,34021
3 1,48134 0,60167 -0,45103 -0,65893 -0,38543 -0,53424 -0,36481
4 -1,00846 -0,62613 -0,28181 -0,21697 -0,49468 -0,33596 0,03767
5 -1,59005 -1,31378 -0,93027 -0,82579 -0,79795 -0,58381 -0,21171
6 1,35543 1,93050 1,57959 1,91391 1,93150 1,64677 1,31791
Tabel 4.8 diatas memberikan informasi mengenai final cluster centers yang digunakan
untuk mengelompokkan observasi. Adapun jumlah observasi untuk setiap cluster yaitu
sebagai berikut.

12
Tabel 4. 9 Jumlah Observasi tiap Cluster pada K-Means 6 Cluster
Cluster Jumlah
1 12
2 10
3 5
4 8
5 4
6 6
Valid 45
Missing 0
Berdasarkan Tabel 4.9 dapat diketahui bahwa cluster ke-1 memiliki anggota terbanyak
yaitu 12 ternak sapi (observasi) sedangkan cluster yang memiliki anggota paling sedikit
adalah cluster ke-5 dengan 4 ternak sapi (observasi). Selain itu pula dilakukan pengujian
ANOVA dan didapatkan hasil sebagai berikut.
Tabel 4. 10 ANOVA
Cluster Error F Sig
Mean Squae df Mean Squae df
Zscore(X1) 8,066 5 0,094 39 85,664 0,000
Zscore(X2) 7,464 5 0,171 39 43,578 0,000
Zscore(X3) 8,108 5 0,089 39 91,358 0,000
Zscore(X4) 8,416 5 0,049 39 171,113 0,000
Zscore(X5) 8,409 5 0,050 39 167,834 0,000
Zscore(X6) 7,924 5 0,112 39 70,544 0,000
Zscore(X7) 6,879 5 0,246 39 27,923 0,000
Pada tabel ANOVA diatas diperoleh informasi bahwa nilai p-value untuk semua
variabel sebesar 0,000 dimana nilai tersebut kurang dari taraf signifikan 0,05 yang artinya
bahwa semua variabel berpengaruh signifikan terhadap pengelompokan. Berikut merupakan
hasil pengelompokan dengan menggunakan metode k-means 6 cluster.
Tabel 4. 11 Hasil Pengelompokan Menggunakan Metode Single Linkage dengan 7 Cluster (Optimum)
Jumlah Cluster Cluster ke- Anggota Cluster (Observasi)
1 28 – 39
2 1 – 10
3 11 – 15
6
4 20 – 27
5 16 – 19
6 40 – 45
Tabel 4.11 memberikan informasi mengenai anggota dari tiap cluster. Jumlah dari
anggota tiap cluster tersebut sudah sama dengan hasil yang didapatkan pada Tabel 4.9.

4.3 Perbandingan Analisis Cluster Metode Hierarki dan Metode Non-Hierarki


Perbandingan antara cluster hierarki dan non-hierarki bertujuan untuk mendapatkan
metode terbaik dengan cara menghitung nilai R2 dan nilai icdrate untuk masing-masing

13
metode. Adapun tabel perbandingan untuk menentukan metode terbaik disajikan pada Tabel
4.12.
Tabel 4. 12 Perbandingan Metode Single Linkage dan K-Means
Jumlah Cluster Optimum
Metode Nilai R2 Nilai icdrate
yang terbentuk
Single Linkage 6 Cluster 0,86946 0,13054
K-Means 6 Cluster 0,87495 0,12505
Berdasarkan Tabel 4.12 dapat diketahui bahwa nilai R2 tertinggi yaitu sebesar 0,87495
dan nilai icdrate yang paling kecil adalah 0,12505. Dimana nilai R2 tertinggi dan nilai icdrate
terkecil tersebut dimiliki oleh metode K-Means sehingga dapat disimpulkan bahwa metode
cluster yang paling sesuai untuk mengelompokkan ternak sapi berdasarkan faktor-faktor
yang mempengaruhi berat sapi ketika dijual adalah metode K-Means dengan 6 cluster.

14
BAB V
KESIMPULAN DAN SARAN

5.1 Kesimpulan
Berdasarkan hasil analisis dapat diperoleh kesimpulan sebagai berikut.
1. Metode hierarki yang paling baik untuk mengelompokkan ternak sapi berdasarkan
faktor-faktor yang mempengaruhi berat sapi ketika dijual adalah metode single linkage
dengan jumlah cluster optimum yang dapat terbentuk yaitu sebanyak 6 cluster dimana
cluster ke-1 pada pengelompokan 6 cluster memiliki anggota paling banyak daripada
yang lainnya yaitu sebanyak 14 ternak sapi, sedangkan anggota paling sedikit terdapat
pada cluster ke-2 yaitu 1 ternak sapi.
2. Metode non-hierarki yang digunakan adalah K-Means dengan 6 cluster dimana cluster
ke-1 memiliki anggota terbanyak yaitu 12 ternak sapi (observasi) sedangkan cluster
yang memiliki anggota paling sedikit adalah cluster ke-5 dengan 4 ternak sapi
(observasi) serta semua variabel berpengaruh signifikan terhadap pengelompokan.
3. Metode cluster yang paling sesuai untuk mengelompokkan ternak sapi berdasarkan
faktor-faktor yang mempengaruhi berat sapi ketika dijual adalah metode K-Means
dengan 6 cluster.

5.2 Saran
Saran yang dapat diberikan kepada penelitian selanjutnya, khususnya untuk peneliti
adalah agar melakukan pre-processing data dan menguji asumsi normal multivariate serta
uji independensi terlebih dahulu, agar proses analisis cluster lebih efisien dan hasil dari
analisis cluster lebih sesuai dengan kondisi kasus nyata sehingga hasil analisis cluster dapat
diterapkan dalam menyelesaikan masalah nyata yang bersangkutan.

15
DAFTAR PUSTAKA

Bappenas, 2013. Sistem Pemeliharaan Sapi Potong. [Online] Available at:


https://ipteks/bappenas/11/Sistem Pemeliharaan Sapi Potong.html
[Diakses Rabu Maret 2019].
Hair, J. F. e. a., 2010. Multivariate Data Analysis. Sevent Edition penyunt. United State of
America: Prentice Hall.
Johnson, R. A. & Wicherin, D. W., 2007. Applied Multivariate Statistical Analysis Sixth
Edition. s.l.:New Jersey: Prentice Hall.
Mingoti, S. & Lima, J., 2006. Comparing SOM Neural Network with Fuzy C-Means, K-
Means and Traditional Hierarchical Algorithm. s.l.:s.n.
Morrison, D. F., 1967. Multivariate Statistical Methods. Third Edition penyunt. USA:
McGRAW-Hill Book Company.
Orpin, A. R., & Kostylev, V. E. (2006). Toward a Statistically Valid Method of Textural
Sea Floor Charcterization of Benthic Habitats. Marine Geology , 209-222.
Saragih, 2008. Kumpulan Pemikiran Agribisnis Berbasis Peternakan. IPB Bogor: USESE
Foundation dan Pusat Studi Pembangunan.
Suliyanto, 2005. Analisis Data dalam Aplikasi Pemasaran. Bogor: Ghalia Indonesia.

16
LAMPIRAN

Lampiran 1. Data Pemeliharaan Ternak Sapi


No X1 X2 X3 X4 X5 X6 X7
1 1158 32400 12600 720 27 4 112,5
2 1065 30600 12960 720 28,8 4 101,25
3 1138 34200 12600 900 30,6 5 123,75
4 1117 34560 11520 900 27 3 108
5 1125 36000 9000 900 25,2 2 112,5
. . . . . . . .
. . . . . . . .
. . . . . . . .
41 1690 63000 45000 3240 108 15 202
42 1781 66600 39600 3240 108 14 180
43 1932 75600 54000 3780 126 16 232,20
44 1938 88200 45000 3780 126 15 209,70
45 1946 90000 43200 3780 126 16 209,70

Lampiran 2. Output SPSS untuk Case Processing Summary


Case Processing Summarya
Cases
Valid Missing Total
N Percent N Percent N Percent

45 100.0% 0 0.0% 45 100.0%

Lampiran 3. Output SPSS untuk Agglomeration Schedule Single Linkage


Agglomeration Schedule
Cluster Combined Stage Cluster First Appears

Stage Cluster 1 Cluster 2 Coefficients Cluster 1 Cluster 2 Next Stage

1 20 22 .072 0 0 12
2 17 18 .294 0 0 11
3 44 45 .310 0 0 38
4 23 27 .318 0 0 12
5 1 6 .333 0 0 7
. . . . . . .
. . . . . . .
. . . . . . .
39 36 40 1.362 35 32 41
40 1 15 1.457 36 0 43
41 36 43 1.516 39 38 42
42 28 36 1.525 25 41 44
43 1 16 1.635 40 37 44
44 1 28 1.687 43 42 0

17
Lampiran 4. Output SPSS untuk Anggota Cluster Single Linkage
Cluster Membership
9 8 7 6 5 4 3 2
Case 10 Clusters Clusters Clusters Clusters Clusters Clusters Clusters Clusters Clusters

1:Case 1 1 1 1 1 1 1 1 1 1
2:Case 2 1 1 1 1 1 1 1 1 1
3:Case 3 1 1 1 1 1 1 1 1 1
4:Case 4 1 1 1 1 1 1 1 1 1
5:Case 5 1 1 1 1 1 1 1 1 1
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
40:Case 40 8 7 6 6 5 4 4 3 2
41:Case 41 8 7 6 6 5 4 4 3 2
42:Case 42 8 7 6 6 5 4 4 3 2
43:Case 43 9 8 7 7 6 5 4 3 2
44:Case 44 10 9 8 7 6 5 4 3 2
45:Case 45 10 9 8 7 6 5 4 3 2

Lampiran 5. Output SPSS untuk Agglomeration Schedule Complete Linkage


Agglomeration Schedule
Cluster Combined Stage Cluster First Appears

Stage Cluster 1 Cluster 2 Coefficients Cluster 1 Cluster 2 Next Stage

1 20 22 .072 0 0 14
2 17 18 .294 0 0 8
3 44 45 .310 0 0 31
4 23 27 .318 0 0 21
5 1 6 .333 0 0 13
. . . . . . .
. . . . . . .
. . . . . . .
39 40 43 2.280 34 31 44
40 11 15 2.729 30 0 42
41 1 16 3.228 36 37 43
42 11 28 4.591 40 38 43
43 1 11 5.783 41 42 44
44 1 40 8.359 43 39 0

18
Lampiran 6. Output SPSS untuk Anggota Cluster Complete Linkage
Cluster Membership
Case 8 Clusters 7 Clusters 6 Clusters 5 Clusters 4 Clusters 3 Clusters 2 Clusters

1:Case 1 1 1 1 1 1 1 1
2:Case 2 1 1 1 1 1 1 1
3:Case 3 1 1 1 1 1 1 1
4:Case 4 1 1 1 1 1 1 1
5:Case 5 1 1 1 1 1 1 1
. . . . . . . .
. . . . . . . .
. . . . . . . .
39:Case 39 6 5 5 4 3 2 1
40:Case 40 7 6 6 5 4 3 2
41:Case 41 7 6 6 5 4 3 2
42:Case 42 7 6 6 5 4 3 2
43:Case 43 8 7 6 5 4 3 2
44:Case 44 8 7 6 5 4 3 2
45:Case 45 8 7 6 5 4 3 2

Lampiran 7 Output SPSS untuk Initial Cluster Centers K-Means

Initial Cluster Centers


Cluster

1 2 3 4 5 6

Zscore(X1) -.28364 -.39453 1.76780 -1.02059 -1.59351 1.64074


Zscore(X2) -.13763 -.80971 .87051 -.58569 -1.25777 2.88677
Zscore(X3) .64086 -1.10814 -.37198 -.24846 -1.13778 1.38196
Zscore(X4) .39185 -1.23167 -.62285 -.21697 -.82579 2.21832
Zscore(X5) .41514 -1.04057 -.31271 -.49468 -.79795 2.23477
Zscore(X6) 1.15109 -1.07949 -.58381 -.33596 -.83165 1.89462
Zscore(X7) -.01508 -1.88472 -.22463 -.88866 .20036 1.31594

Lampiran 8 Output SPSS untuk Iteration History K-Means

Iteration Historya
Change in Cluster Centers

Iteration 1 2 3 4 5 6

1 .902 .747 .435 .745 .630 1.132


2 .000 .000 .000 .214 .509 .000
3 .000 .000 .000 .000 .000 .000

19
a. Convergence achieved due to no or small change in cluster centers. The maximum absolute
coordinate change for any center is .000. The current iteration is 3. The minimum distance
between initial centers is 1.861.

Lampiran 9 Output SPSS untuk ANOVA K-Means

ANOVA
Cluster Error

Mean Square Df Mean Square df F Sig.

Zscore(X1) 8.066 5 .094 39 85.664 .000


Zscore(X2) 7.464 5 .171 39 43.578 .000
Zscore(X3) 8.108 5 .089 39 91.358 .000
Zscore(X4) 8.416 5 .049 39 171.113 .000
Zscore(X5) 8.409 5 .050 39 167.834 .000
Zscore(X6) 7.924 5 .112 39 70.544 .000
Zscore(X7) 6.879 5 .246 39 27.923 .000

The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize
the differences among cases in different clusters. The observed significance levels are not corrected for this
and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.

Lampiran 10 Output SPSS untuk Number of Cases in each Cluster

Number of Cases in each Cluster


Cluster 1 12.000

2 10.000

3 5.000

4 8.000
5 4.000

6 6.000
Valid 45.000
Missing .000

20

Anda mungkin juga menyukai