LAPORAN PRAKTIKUM
Statistika Multivariat Terapan
Modul 5 : Analisis Kelompok Hirarki
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2021
i
Daftar Isi
Daftar Isi.............................................................................................................. ii
Daftar Tabel........................................................................................................iii
Daftar Gambar .................................................................................................... iv
1 Pendahuluan ................................................................................................. 5
2 Deskripsi Kerja ............................................................................................ 7
2.1 Studi Kasus ............................................................................................ 7
2.2 Langkah Kerja ....................................................................................... 8
3 Pembahasan ............................................................................................... 14
4 Penutup ...................................................................................................... 24
4.1 Kesimpulan.......................................................................................... 24
4.2 Saran ................................................................................................... 24
5 Daftar Pustaka ............................................................................................ 25
ii
Daftar Tabel
Tabel 2.1. Data Hasil Tanaman Sayuran di Indonesia Tahun 2018 (Ton) ............. 7
Tabel 3.1. Keputusan Uji No Multikolinieritas................................................... 16
Tabel 3.2. Pengelompokan, Provinsi dan Jumlah Anggota ................................. 22
Tabel 3.3. Profilisasi.......................................................................................... 22
iii
Daftar Gambar
iv
1 Pendahuluan
5
perhitungan ulang centroid hingga terbentuk kluster tetap, dan metode ward dimana
metode ini mencoba meminimumkan varians dalam kelompok dan cenderung
digunakan untuk melakukan kombinasi kelompok-kelompok dengan jumlah yang
kecil. (Nafisah & Chandra, 2017)
Asumsi analisis kluster hirarki adalah no-multikolinieritas atau tidak adanya
hubungan antar variabel pengamatan. Dalam pengujian asumsi no multikolinieritas
ini dapat menggunakan nilai Variance Inflation Factor (VIF) dan matriks korelasi
variabel pengamatan. Menghitung koefisien korelasi antar variabel, jika terdapat
nilai korelasi yang mencapai atau melebihi 0,8 maka terjadi multikolinearitas. Pada
kasus nilai VIF, jika nilai VIF melebihi 10 maka menunjukkan multikolinearitas.
Jika terjadi gejala multikolinearitas, maka dapat menanganinya dengan melakukan
analisis Principle Component Analysis (PCA).
Metode yang sering digunakan dalam analisis kluster hirarki adalah tipe
agglomerative. Secara umum, algoritma kluster hirarki aglomerative untuk
mengelompokkan n objek adalah sebagai berikut (Neil H. Timm, 2002):
1. Memulai dengan n kluster, masing-masing kluster mengandung unsur
tunggal.
2. Menentukan jarak untuk pasangan kluster yang terdekat. Pasangan yang
dipilih dikaitkan dengan elemen jarak, misalkan jarak antara objek U dan V
adalah dUV.
3. Menggabungkan objek U dan V ke dalam kluster baru (UV) menggunakan
beberapa kriteriadan mengurangi jumlah kluster satu persatu dengan
menghapus baris dan kolom untuk objek U dan V. Menghitung jarak antara
kluster (UV) dan semua kluster yang tersisa menggunakan kriteria, dan
menambahkan baris dan kolom ke matriks jarak yang baru.
4. Ulangi langkah 2 dan 3 sebanyak (n-1) kali sampai semua objek akan berada
dalam kluster tunggal (membentuk satu kluster).
(Muhajir, 2021)
6
2 Deskripsi Kerja
Pada laporan ini praktikan akan mengerjakan studi kasus yang diberikan
mengenai analisis kelompok hirarki, berikut merupakan data Hasil tanaman sayuran
tahun 2018 di Indonesia berdasarkan provinsi.
Tabel 2.1. Data Hasil Tanaman Sayuran di Indonesia Tahun 2018 (Ton)
No Provinsi Sawi Bayam Melinjo Petai Jengkol Jamur
1 ACEH 2661 3427 10094 774 1929 49219
SUMATERA
2 UTARA 62831 20244 2621 5926 3871 23493
SUMATERA
3 BARAT 28973 4028 10726 7151 8269 40110
4 RIAU 1968 11183 1513 1998 3542 72849
5 JAMBI 6290 4644 2003 1909 4101 17417
SUMATERA
6 SELATAN 3614 4271 1882 3851 5616 91776
7 BENGKULU 29816 756 415 1704 3602 8500
8 LAMPUNG 7872 6933 12169 13794 12991 280971
KEP. BANGKA
9 BELITUNG 1364 1287 236 594 109 672
10 KEP. RIAU 3110 4618 137 458 378 664
11 DKI JAKARTA 2664 3297 97 9 0 0
12 JAWA BARAT 201004 29809 31606 72024 13246 16992355
JAWA
13 TENGAH 88740 10942 51213 92497 10913 4431144
DI
14 YOGYAKARTA 3241 1438 13926 3688 126 392416
15 JAWA TIMUR 72562 11065 41623 78673 176 8071803
16 BANTEN 8535 10022 54273 10198 9950 164558
17 BALI 34192 1228 501 1 0 136310
NUSA
TENGGARA
18 BARAT 1571 564 1179 1 0 49700
NUSA
TENGGARA
19 TIMUR 10188 3247 59 330 0 0
KALIMANTAN
20 BARAT 2961 2440 652 4063 5416 18006
7
No Provinsi Sawi Bayam Melinjo Petai Jengkol Jamur
KALIMANTAN
21 TENGAH 1478 1403 417 1074 1011 23511
KALIMANTAN
22 SELATAN 2375 1565 224 2837 927 82290
KALIMANTAN
23 TIMUR 8595 4738 690 773 1473 11051
KALIMANTAN
24 UTARA 4614 1965 123 403 23 0
SULAWESI
25 UTARA 15613 1233 271 0 0 0
SULAWESI
26 TENGAH 7661 1467 51 0 28 349
SULAWESI
27 SELATAN 10579 6515 83 0 23 83944
SULAWESI
28 TENGGARA 1047 1911 71 0 106 355
29 GORONTALO 16 51 0 0 0 0
SULAWESI
30 BARAT 558 724 0 0 5 8084
31 MALUKU 2645 1379 0 0 10 0
MALUKU
32 UTARA 107 201 0 0 0 0
33 PAPUA BARAT 954 651 0 0 2 24
34 PAPUA 5591 3031 0 0 11 0
8
Gambar 2.1. Shortcut R studio.
2. Meng-input data ke dalam R studio dengan menggunakan perintah
read.delim(“clipboard”)dan memberi nama objek yang berisi data yang
summary(lp5_rahmi)
str(lp5_rahmi)
9
library(car) #Mengaktifkan packages car
attach(lp5_rahmi) #agar memudahkan sintaks berikut2nya bahwa
dataset yg digunakan adalah objek modul5
#Multiko SAWI dengan variabel lainnya
multiko1=vif(lm(Sawi~Bayam+Melinjo+Petai+Jengkol+Jamur))
multiko1
#Untuk melihat nilai VIF antar variabel BAYAM dengan variabel
lainnya
multiko2=vif(lm(Bayam~Sawi+Melinjo+Petai+Jengkol+Jamur))
multiko2
#Untuk melihat nilai VIF antar variabel MELINJO dengan variabel
lainnya
multiko3=vif(lm(Melinjo~Sawi+Bayam+Petai+Jengkol+Jamur))
multiko3
#Untuk melihat nilai VIF antar variabel PETAI dengan variabel
lainnya
multiko4=vif(lm(Petai~Sawi+Bayam+Melinjo+Jengkol+Jamur))
multiko4
#Untuk melihat nilai VIF antar variabel JENGKOL dengan variabel
lainnya
multiko5=vif(lm(Jengkol~Sawi+Bayam+Melinjo+Petai+Jamur))
multiko5
#Untuk melihat nilai VIF antar variabel JAMUR dengan variabel
lainnya
multiko6=vif(lm(Jamur~Sawi+Bayam+Melinjo+Petai+Jengkol))
multiko6
korelasi.rahmi=cor(lp5_rahmi[,3:8])
View(korelasi.rahmi)
10
6. Kemudian membuat objek baru dengan nama data.lp5.rahmi yang berisi
variabel dengan tipe data numerik yang selanjutnya akan dibuat
pengelompokan.
metode_al.rahmi<-
hclust(dist(scale(data.lp5.rahmi)),method="ave")
metode_sl.rahmi<-hclust(dist(scale(data.lp5.rahmi)), method =
"single")
plot(metode_sl.rahmi)
metode_cl.rahmi<-hclust(dist(scale(data.lp5.rahmi)),
method="complete")
plot(metode_cl.rahmi)
metode_ward.rahmi<-
hclust(dist(scale(data.lp5.rahmi)),method="ward.D")
plot(metode_ward.rahmi)
11
#metode centroid method
metode_centroid.rahmi<-hclust(dist(scale(data.lp5.rahmi)),
method="centroid")
plot(metode_centroid.rahmi)
anggota.rahmi<-cutree(metode_ward.rahmi,3)
tabel.rahmi=data.frame(lp5_rahmi,anggota.rahmi)
tabel.rahmi
10. Selanjutnya akan diekspor data frame yang telah dibuat dengan tabel.rahmi
dalam bentuk xlsx untuk memudahkan dalam proses profilisasi, untuk
mengekspor data tersebut dibutuhkan packages “xlsx” maka praktikan akan
mengaktifkannya terlebih dahulu dengan menjalankan fungsi library().
library(xlsx)
xlsx::write.xlsx(x=tabel.rahmi,file="LP5_Rahmi.xlsx")
12
11. Selanjutnya membuka file xlxs yang telah diekspor dan melakukan profilasasi
dengan menyatukan provinsi-privindi ke dalam kelompoknya masing-masing
dan kemudian menghitung rata-rata pervariabel dalam kelompoknya masing-
masing menggunakan formula =AVERAGE(number1; [number2]; …).
13
3 Pembahasan
Pada bab ini akan dibahas lebih detail mengenai hasil yang diperoleh dari
deskripsi kerja yang ada pada bab sebelumnya.
Gambar 3.1. Struktur Data Hasil Tanaman Sayuran di Indonesia Tahun 2018
Pada laporan ini digunakan data Hasil tanaman sayuran di Indonesia tahun
2018 yang terdiri dari 34 objek dengan 8 variabel, yakni No, Provinsi, Sawi,
Bayam, Melinjo, Petai, Jengkol, dan Jamur yang memiliki tipe data numerik
terkecuali variabel Provinsi dengan tipe data nominal.
Selanjutnya akan dilakukan pengecekan data missing, uji asumsi no
multikolinearitas, pengelompokan analisis kluster hirarki dan profilisasi.
1. Pengecekan Data Missing
Berdasarkan ringkasan data pada Gambar 3.2. tidak terdapat missing value
(NA’s) pada setiap variabel, maka tidak perlu ada data yang dihilangkan. Pada
ringkasan statistik (summary) terdapat beberapa nilai deskriptif statistika untuk
14
masing-masing yakni data minimum dan maksimum yang merupakan nilai terkecil
dan terbesar yang terdapat dalam variabel tersebut, kuartil 1, kuartil 2/median,
kuartil 3 yang merupakan Kuartil (K) adalah nilai-nilai yang membagi serangkaian
data atau suatu distribusi frekuensi menjadi empat (4) bagian yang sama. Ada tiga
Kuartil yaitu kuartil pertama (K1), kuartil kedua (K2), dan kuartil ketiga (K3),
kemudian terdapat mean menggambarkan tentan g nilai rata-rata dari suatu sample.
Karena tidak terdapat data hilang atau missing value maka data tidak ada yang
dihilangkan dan keseluruhan data akan digunakan dalam analisis.
2. Uji Asumsi No Multikolinieritas
15
v. Keputusan
Tabel 3.1. Keputusan Uji No Multikolinieritas
Pengujian Variabel VIF Tanda Pembanding Keputusan
Multiko1(Sawi) Bayam 3.17 < Gagal tolak 𝐻0
Melinjo 3.58 < Gagal tolak 𝐻0
Petai 5.87 < Gagal tolak 𝐻0
Jengkol 2.01 < Gagal tolak 𝐻0
Jamur 4.67 < Gagal tolak 𝐻0
Multiko2(Bayam) Sawi 8.90 < Gagal tolak 𝐻0
Melinjo 3.78 < Gagal tolak 𝐻0
Petai 6.21 < Gagal tolak 𝐻0
Jengkol 2.02 < Gagal tolak 𝐻0
Jamur 8.21 < Gagal tolak 𝐻0
Multiko3(Melinjo) Sawi 11.02 > Tolak 𝐻0
Bayam 4.15 < Gagal tolak 𝐻0
Petai 3.34 < Gagal tolak 𝐻0
Jengkol 1.85 < Gagal tolak 𝐻0
Jamur 8.21 < Gagal tolak 𝐻0
10
Multiko4(Petai) Sawi 10.65 > Tolak 𝐻0
Bayam 4.00 < Gagal tolak 𝐻0
Melinjo 1.97 < Gagal tolak 𝐻0
Jengkol 2.16 < Gagal tolak 𝐻0
Jamur 7.78 < Gagal tolak 𝐻0
Multiko5(Jengkol) Sawi 11.72 > Tolak 𝐻0
Bayam 4.02 < Gagal tolak 𝐻0
Melinjo 3.36 < Gagal tolak 𝐻0
Petai 6.65 < Gagal tolak 𝐻0
Jamur 7.87 < Gagal tolak 𝐻0
Multiko6(Jamur) Sawi 6.91 < Gagal tolak 𝐻0
Bayam 4.33 < Gagal tolak 𝐻0
Melinjo 3.95 < Gagal tolak 𝐻0
Petai 6.37 < Gagal tolak 𝐻0
Jengkol 2.09 < Gagal tolak 𝐻0
vi. Kesimpulan
Dengan menggunakan tingkat kepercayaan sebesar 95%, data yang ada
mendukung untuk gagal tolak H0 hampir pada keseluruhan variabel namun
terdapat tolak H0 untuk variabel Melinjo dengan Sawi, Petai dengan Sawi,
dan Jengkol dengan Sawi. Artinya masih terdapat hubungan yang linier antar
variabel Melinjo dengan Sawi, Petai dengan Sawi, dan Jengkol dengan Sawi
dan mengindikasikan bahwa asumsi no multikolinieritas untuk data Hasil
tanaman sayuran di Indonesia 2018 tidak terpenuhi.
16
Selanjutnya akan dilakukan pengecekan dengan cara kedua, yaitu dengan
melihat nilai korelasi antar variabel.
Berdasarkan pada Gambar 3.4. dapat dilihat matriks korelasi antar variabel
sayuran. Terlihat bahwa nilai korelasi antar variabel lebih dominan bernilai tinggi,
seperti nilai korelasi variabel petai dengan sawi sebesar 0.799, korelasi variabel
bayam dengan jamur sebesar 0.764, dan terdapat pula pasangan variabel yang nilai
korelasinya sangat tinggi melebihi 0.8 atau 80%, sehingga pasangan variabel yang
memiliki nilai korelasi sangat tinggi tersebut mengakibatkan terjadinya gejala
multikolinearitas atau terdapat hubungan antar variabel yakni variabel Melinjo
dengan Sawi, Petai dengan Sawi, dan Jengkol dengan Sawi. Sehingga secara
keseluruhan, dapat dikatakan data Hasil tanaman sayuran di Indonesia tahun 2018
memiliki korelasi antar variabelnya (asumsi no multikolinearitas tidak terpenuhi).
Namun demikian, dalam studi kasus ini akan diasumsikan bahwa keseluruhan
variabel tidak memiliki korelasi antar variabelnya sehingga asumsi no
multikolinieritas terpenuhi.
3. Hasil Pengelompokan Analisis Kluster Hirarki
Selanjutnya akan dilakukan pengelompokan berdasarkan hasil analisis
kluster hirarki, dalam pengelompokkan ini akan digunakan diagram dendogram
berdasarkan metode analisis kluster hirarki agglomerative yang terdiri dari
beberapa metode.
17
Gambar 3.5. Dendogram Metode Average
18
Gambar 3.7. Dendogram Metode Complete
19
Gambar 3.9. Dendogram Metode Centroid
Dendogram dari kelima metode tersebut akan dipilih dan digunakan untuk
klusterisasi yang dilakukan bertujuan untuk mengelompokkan provinsi-provinsi
berdasarkan hasil Hasil tanaman sayuran di Indonesia pada tahun 2018 (ribu ton)
adalah dendogram dari metode Ward’s dengan alasan pada dendogram wrd tersebut
lebih rapid an tidak pemunpuk hanya pada satu sisi. Dari hasil dendogram metode
ward’s terlihat bahwa k=3 memberikan hasil pengelompokkan yang baik, yaitu
dengan melihat jarak yang dekat di dalam kelompoknnya dan memiliki jarak yang
cukup jauh antar kelompoknya yang dapat dilihat pada Gambar 3.10.
20
Gambar 3.10. Cluster Dendogram Metode Ward’s
21
Dari output pada Gambar 3.10. dan Gambar 3.11. diperoleh anggota-
anggota dalam kelompok sebagai berikut:
4. Profilisasi
Profilisasi
Kelompok Sawi Bayam Melinjo Petai Jengkol Jamur
1 6549,57 2030,26 1242,35 549,83 424,48 36829,96
2 16358,43 7677,57 4509,43 5527,43 6258,00 77803,14
3 92710,25 15459,50 44678,75 63348,00 8571,25 7414965,00
22
Kelompok pertama adalah provinsi-provinsi penghasil terendah tanaman
sayuran di Indonesia tahun 2018 pada seluruh jenis sayuran yang diteliti yaitu sawi,
bayam, melinjo, petai, jengkol dan jamur.
Kelompok kedua adalah provinsi-provinsi penghasil sedang tanaman sayuran
di Indonesia tahun 2018 pada seluruh jenis sayuran yang diteliti yaitu sawi, bayam,
melinjo, petai, jengkol dan jamur.
Kelompok ketiga adalah provinsi-provinsi penghasil tertinggi tanaman
sayuran di Indonesia tahun 2018 pada seluruh jenis sayuran yang diteliti yaitu sawi,
bayam, melinjo, petai, jengkol dan jamur.
23
4 Penutup
4.1 Kesimpulan
Kesimpulan dari studi kasus yang telah dikerjakan adalah sebagai berikut:
kelompok tiga adalah provinsi-provinsi penghasil tertinggi tanaman sayuran
di Indonesia pada tahun 2018, kelompok dua penghasil sedang tanaman sayuran di
Indonesia pada tahun 2018, sedangkan kelompok satu adalah provinsi-provinsi
penghasil terendah tanaman sayuran di Indonesia pada tahun 2018.
4.2 Saran
24
5 Daftar Pustaka
25