SMT 5

Kelas A
LAPORAN PRAKTIKUM
Statistika Multivariat Terapan
Modul 5 : Analisis Kelompok Hirarki
Nomor Tanggal Tanda Tangan

Nama Praktikan Praktikan
Mahasiswa Kumpul
Rahmi Novika Harahap 18611099 03/05/2021
Tanggal Tanda tangan

Nama Penilai Nilai
Koreksi Asisten Dosen
Fadhila Senjaliana
Nabila Puspa Hariani
Muhammad Muhajir, S.Si.,
M.Sc.
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2021
i
Daftar Isi
Daftar Isi.............................................................................................................. ii
Daftar Tabel........................................................................................................iii
Daftar Gambar .................................................................................................... iv
1 Pendahuluan ................................................................................................. 5
2 Deskripsi Kerja ............................................................................................ 7
2.1 Studi Kasus ............................................................................................ 7
2.2 Langkah Kerja ....................................................................................... 8
3 Pembahasan ............................................................................................... 14
4 Penutup ...................................................................................................... 24
4.1 Kesimpulan.......................................................................................... 24
4.2 Saran ................................................................................................... 24
5 Daftar Pustaka ............................................................................................ 25
ii
Daftar Tabel
Tabel 2.1. Data Hasil Tanaman Sayuran di Indonesia Tahun 2018 (Ton) ............. 7
Tabel 3.1. Keputusan Uji No Multikolinieritas................................................... 16
Tabel 3.2. Pengelompokan, Provinsi dan Jumlah Anggota ................................. 22
Tabel 3.3. Profilisasi.......................................................................................... 22
iii
Daftar Gambar
Gambar 2.1. Shortcut R studio. ........................................................................... 9

Gambar 2.2. Formula Rata-rata Pada Ms.Excel................................................. 13
Gambar 3.1. Struktur Data Hasil Tanaman Sayuran di Indonesia Tahun 2018 ... 14
Gambar 3.2. Ringkasan Data ............................................................................ 14
Gambar 3.3. Nilai VIF ...................................................................................... 15
Gambar 3.4. Nilai Korelasi Antar Variabel ....................................................... 17
Gambar 3.5. Dendogram Metode Average ........................................................ 18
Gambar 3.6. Dendogram Metode Single ........................................................... 18
Gambar 3.7. Dendogram Metode Complete ...................................................... 19
Gambar 3.8. Dendogram Metode Ward’s.......................................................... 19
Gambar 3.9. Dendogram Metode Centroid ....................................................... 20
Gambar 3.10. Cluster Dendogram Metode Ward’s ........................................... 21
Gambar 3.11. Cluster Data ............................................................................... 21
iv
1 Pendahuluan
Analisis Cluster adalah salah satu teknik multivariat yang bertujuan

mengklasifikasi suatu objek-objek ke dalam suatu kelompok-kelompok yang
berbeda antara lain antara kelompok satu dengan lainnya. Objek-objek yang telah
memiliki kedekatan jarak relatif sama dengan objek lainnya (Narimawati, 2008).
Analisis cluster adalah analisis untuk mengclusterkan elemen yang mirip sebagai
objek penelitian cluster yang berbeda dan independent (tidak saling berhubungan).
Berbeda dengan analisis diskriminan dimana cluster sudah ditentukan, kemudian
suatu fungsi diskriminan dapat dipergunakan untuk menentukan suatu elemen atau
obyek harus masuk cluster yang mana (Supranto, 2004).
Prosedur pembentukan cluster terbagi menjadi 2, yaitu hirarki dan nonhirarki.
Pembentukan cluster hirarki mempunyai sifat sebagai pengembangan suatu hirarki
atau struktur mirip pohon bercabang. Metode cluster hirarki merupakan metode
pengelompokan yang mana jumlah kelompok yang akan dibuat belum diketahui.
Teknik ini diproses dengan baik melalui penggabungan berurutan (agglomerative)
atau pembagian berurutan (divissive). Analisis cluster dengan metode hirarki adalah
analisis yang pengclusteran datanya dilakukan dengan cara mengukur jarak
kedekatan pada setiap obyek yang kemudian membentuk sebuah dendogram. Jenis
analisis cluster dengan metode hirarki ada beberapa macam, diantaranya yaitu
metode single linkage yang merupakan prosedur pengelompokkan agglomerative
yang didasarkan pada jarak minimum/jarak terdekat antar objek., metode complete
linkage yang pengelompokkan yang sama seperti single linkage, namun dengan
cara mengelompokkan objek yang memiliki jarak terjauh atau kesamaan yang
sedikit., metode average linkage yang merupakan pengelompokkan yang dibentuk
berdasarkan nilai rata-rata jarak seluruh individu dalam satu kelompok dengan rata-
rata jarak seluruh individu pada kelompok lainnya., metode centroid merupakan
metode yang mendefinisikan kesamaan antar kluster dari jarak diantara dua
centroid kluster-kluster yang ada. Centroid adalah rata-rata jarak yang ada pada
sebuah kluster yang didapat dengan melakukan rata-rata pada semua anggota suatu
kluster tertentu. Dengan metode ini, setiap terjadi kluster baru, akan terjadi
5
perhitungan ulang centroid hingga terbentuk kluster tetap, dan metode ward dimana
metode ini mencoba meminimumkan varians dalam kelompok dan cenderung
digunakan untuk melakukan kombinasi kelompok-kelompok dengan jumlah yang
kecil. (Nafisah & Chandra, 2017)
Asumsi analisis kluster hirarki adalah no-multikolinieritas atau tidak adanya
hubungan antar variabel pengamatan. Dalam pengujian asumsi no multikolinieritas
ini dapat menggunakan nilai Variance Inflation Factor (VIF) dan matriks korelasi
variabel pengamatan. Menghitung koefisien korelasi antar variabel, jika terdapat
nilai korelasi yang mencapai atau melebihi 0,8 maka terjadi multikolinearitas. Pada
kasus nilai VIF, jika nilai VIF melebihi 10 maka menunjukkan multikolinearitas.
Jika terjadi gejala multikolinearitas, maka dapat menanganinya dengan melakukan
analisis Principle Component Analysis (PCA).
Metode yang sering digunakan dalam analisis kluster hirarki adalah tipe
agglomerative. Secara umum, algoritma kluster hirarki aglomerative untuk
mengelompokkan n objek adalah sebagai berikut (Neil H. Timm, 2002):
1. Memulai dengan n kluster, masing-masing kluster mengandung unsur
tunggal.
2. Menentukan jarak untuk pasangan kluster yang terdekat. Pasangan yang
dipilih dikaitkan dengan elemen jarak, misalkan jarak antara objek U dan V
adalah dUV.
3. Menggabungkan objek U dan V ke dalam kluster baru (UV) menggunakan
beberapa kriteriadan mengurangi jumlah kluster satu persatu dengan
menghapus baris dan kolom untuk objek U dan V. Menghitung jarak antara
kluster (UV) dan semua kluster yang tersisa menggunakan kriteria, dan
menambahkan baris dan kolom ke matriks jarak yang baru.
4. Ulangi langkah 2 dan 3 sebanyak (n-1) kali sampai semua objek akan berada
dalam kluster tunggal (membentuk satu kluster).
(Muhajir, 2021)
6
2 Deskripsi Kerja
2.1 Studi Kasus
Pada laporan ini praktikan akan mengerjakan studi kasus yang diberikan
mengenai analisis kelompok hirarki, berikut merupakan data Hasil tanaman sayuran
tahun 2018 di Indonesia berdasarkan provinsi.
Tabel 2.1. Data Hasil Tanaman Sayuran di Indonesia Tahun 2018 (Ton)
No Provinsi Sawi Bayam Melinjo Petai Jengkol Jamur
1 ACEH 2661 3427 10094 774 1929 49219
SUMATERA
2 UTARA 62831 20244 2621 5926 3871 23493
SUMATERA
3 BARAT 28973 4028 10726 7151 8269 40110
4 RIAU 1968 11183 1513 1998 3542 72849
5 JAMBI 6290 4644 2003 1909 4101 17417
SUMATERA
6 SELATAN 3614 4271 1882 3851 5616 91776
7 BENGKULU 29816 756 415 1704 3602 8500
8 LAMPUNG 7872 6933 12169 13794 12991 280971
KEP. BANGKA
9 BELITUNG 1364 1287 236 594 109 672
10 KEP. RIAU 3110 4618 137 458 378 664
11 DKI JAKARTA 2664 3297 97 9 0 0
12 JAWA BARAT 201004 29809 31606 72024 13246 16992355
JAWA
13 TENGAH 88740 10942 51213 92497 10913 4431144
DI
14 YOGYAKARTA 3241 1438 13926 3688 126 392416
15 JAWA TIMUR 72562 11065 41623 78673 176 8071803
16 BANTEN 8535 10022 54273 10198 9950 164558
17 BALI 34192 1228 501 1 0 136310
NUSA
TENGGARA
18 BARAT 1571 564 1179 1 0 49700
NUSA
TENGGARA
19 TIMUR 10188 3247 59 330 0 0
KALIMANTAN
20 BARAT 2961 2440 652 4063 5416 18006
7
No Provinsi Sawi Bayam Melinjo Petai Jengkol Jamur
KALIMANTAN
21 TENGAH 1478 1403 417 1074 1011 23511
KALIMANTAN
22 SELATAN 2375 1565 224 2837 927 82290
KALIMANTAN
23 TIMUR 8595 4738 690 773 1473 11051
KALIMANTAN
24 UTARA 4614 1965 123 403 23 0
SULAWESI
25 UTARA 15613 1233 271 0 0 0
SULAWESI
26 TENGAH 7661 1467 51 0 28 349
SULAWESI
27 SELATAN 10579 6515 83 0 23 83944
SULAWESI
28 TENGGARA 1047 1911 71 0 106 355
29 GORONTALO 16 51 0 0 0 0
SULAWESI
30 BARAT 558 724 0 0 5 8084
31 MALUKU 2645 1379 0 0 10 0
MALUKU
32 UTARA 107 201 0 0 0 0
33 PAPUA BARAT 954 651 0 0 2 24
34 PAPUA 5591 3031 0 0 11 0
Peneliti ingin mengelompokan hasil tanaman sayur di Indonesia tahun 2018

dibagi menjadi 3 kelompok dengan menggunakan analisis kluster hirarki yaitu
dengan kelompok Penghasil tanaman sayur tinggi, sedang dan rendah. Kerjakan
sesuai urutan langkah hingga kesimpulan. Buat dengan semua metode
agglomerative, lalu pilih dendogram terbaik serta interpretasikan hasil yang terbaik.
2.2 Langkah Kerja
Kali ini untuk menyelesikan studi kasus yang diberikan, praktikan

menggunakan bantuan software R.
1. Pertama membuka software R studio.
8
Gambar 2.1. Shortcut R studio.
2. Meng-input data ke dalam R studio dengan menggunakan perintah
read.delim(“clipboard”)dan memberi nama objek yang berisi data yang
digunakan dengan nama lp5_rahmi dan kemudian menampilkan data yang

telah berhasil di-input-kan kedalam R.
lp5_rahmi=read.delim("clipboard") #input data

View(lp5_rahmi) #menampilkan data
3. Kemudian melakukan pengecekan data missing dapat dilakukan dengan

mengecek ringkasan data dengan menggunakan perintah
summary(lp5_rahmi) serta menampilkan struktur dari data yang akan
digunakan.
summary(lp5_rahmi)
str(lp5_rahmi)
4. Selanjutnya melakukan pengecekan no multikolinearitas dapat menampilkan

nilai VIF dari masing-masing variabel dengan tipe data numerik terhadap
variabel lainya, maka akan dilakukan pengujian sebanyak enam kali. Pada
pengujian ini dibutuhkan packages “car” maka pertama praktikan akan
mengaktifkan packages “car” terlebih dahulu dengan menggunakan fungsi
library().
9
library(car) #Mengaktifkan packages car
attach(lp5_rahmi) #agar memudahkan sintaks berikut2nya bahwa
dataset yg digunakan adalah objek modul5
#Multiko SAWI dengan variabel lainnya
multiko1=vif(lm(Sawi~Bayam+Melinjo+Petai+Jengkol+Jamur))
multiko1
#Untuk melihat nilai VIF antar variabel BAYAM dengan variabel
lainnya
multiko2=vif(lm(Bayam~Sawi+Melinjo+Petai+Jengkol+Jamur))
multiko2
#Untuk melihat nilai VIF antar variabel MELINJO dengan variabel
lainnya
multiko3=vif(lm(Melinjo~Sawi+Bayam+Petai+Jengkol+Jamur))
multiko3
#Untuk melihat nilai VIF antar variabel PETAI dengan variabel
lainnya
multiko4=vif(lm(Petai~Sawi+Bayam+Melinjo+Jengkol+Jamur))
multiko4
#Untuk melihat nilai VIF antar variabel JENGKOL dengan variabel
lainnya
multiko5=vif(lm(Jengkol~Sawi+Bayam+Melinjo+Petai+Jamur))
multiko5
#Untuk melihat nilai VIF antar variabel JAMUR dengan variabel
lainnya
multiko6=vif(lm(Jamur~Sawi+Bayam+Melinjo+Petai+Jengkol))
multiko6
5. Selanjutnya akan dilakukan pengecekan multikolinearitas dengan melihat

nilai matriks korelasi. Data yang digunakan dalam uji korelasi ini adalah data
pada kolom ke-3 sampai 8 yang merupakan data numerik, dengan
menggunakan perintah berikut.
korelasi.rahmi=cor(lp5_rahmi[,3:8])
View(korelasi.rahmi)
10
6. Kemudian membuat objek baru dengan nama data.lp5.rahmi yang berisi
variabel dengan tipe data numerik yang selanjutnya akan dibuat
pengelompokan.
data.lp5.rahmi=lp5_rahmi[,3:8] #berisi data lp5_rahmi dengan

data numerik
7. Selanjutnya dilakukan analisis kluster hirarki dengan tipe agglomerative yang

terdiri dari metode single linkage, average linkage, complete linkage, ward’s
method, dan centroid method serta menampilkan dendogram dari setiap
metode tersebut. Data yang digunakan dalam analisis kluster hirarki ini
adalah data yang telah disimpan pada objek data.lp5.rahmi yakni data pada
kolom ke-3 sampai kolom 8 yang merupakan data numerik dengan
menggunakan perintah berikut.
#metode average linkage
metode_al.rahmi<-
hclust(dist(scale(data.lp5.rahmi)),method="ave")
plot(metode_al.rahmi) #menampilkan hasil dendogram
#metode single linkage
metode_sl.rahmi<-hclust(dist(scale(data.lp5.rahmi)), method =
"single")
plot(metode_sl.rahmi)
#metode complete linkage
metode_cl.rahmi<-hclust(dist(scale(data.lp5.rahmi)),
method="complete")
plot(metode_cl.rahmi)
#dengan ward’s method
metode_ward.rahmi<-
hclust(dist(scale(data.lp5.rahmi)),method="ward.D")
plot(metode_ward.rahmi)
11
#metode centroid method
metode_centroid.rahmi<-hclust(dist(scale(data.lp5.rahmi)),
method="centroid")
plot(metode_centroid.rahmi)
8. Berdasarkan dendogram dari kelima metode kluster hirarki yang telah

dilakukan, maka praktikan memilih metode ward’s untuk analisis selanjutnya
dengan alasan bahwa dendogram metode ward’s memberikan hasil yang baik
atau paling teratur dan rapi. Dendogram dengan metode ward’s dibentuk
menjadi 3 kelompok dengan membuat garis merah pengelompokan pada
dendogram tersebut menggunakan perintah berikut.
#membuat garis merah pengelompokan pada dendogram

#menentukan banyak kelompok
rect.hclust(metode_ward.rahmi,3)
9. Kemudian mengelompokkan data dalam format data frame menggunakan

perintah berikut.
anggota.rahmi<-cutree(metode_ward.rahmi,3)
tabel.rahmi=data.frame(lp5_rahmi,anggota.rahmi)
tabel.rahmi
10. Selanjutnya akan diekspor data frame yang telah dibuat dengan tabel.rahmi
dalam bentuk xlsx untuk memudahkan dalam proses profilisasi, untuk
mengekspor data tersebut dibutuhkan packages “xlsx” maka praktikan akan
mengaktifkannya terlebih dahulu dengan menjalankan fungsi library().
library(xlsx)
xlsx::write.xlsx(x=tabel.rahmi,file="LP5_Rahmi.xlsx")
12
11. Selanjutnya membuka file xlxs yang telah diekspor dan melakukan profilasasi
dengan menyatukan provinsi-privindi ke dalam kelompoknya masing-masing
dan kemudian menghitung rata-rata pervariabel dalam kelompoknya masing-
masing menggunakan formula =AVERAGE(number1; [number2]; …).
Gambar 2.2. Formula Rata-rata Pada Ms.Excel
13
3 Pembahasan
Pada bab ini akan dibahas lebih detail mengenai hasil yang diperoleh dari
deskripsi kerja yang ada pada bab sebelumnya.
Gambar 3.1. Struktur Data Hasil Tanaman Sayuran di Indonesia Tahun 2018
Pada laporan ini digunakan data Hasil tanaman sayuran di Indonesia tahun
2018 yang terdiri dari 34 objek dengan 8 variabel, yakni No, Provinsi, Sawi,
Bayam, Melinjo, Petai, Jengkol, dan Jamur yang memiliki tipe data numerik
terkecuali variabel Provinsi dengan tipe data nominal.
Selanjutnya akan dilakukan pengecekan data missing, uji asumsi no
multikolinearitas, pengelompokan analisis kluster hirarki dan profilisasi.
1. Pengecekan Data Missing
Gambar 3.2. Ringkasan Data
Berdasarkan ringkasan data pada Gambar 3.2. tidak terdapat missing value
(NA’s) pada setiap variabel, maka tidak perlu ada data yang dihilangkan. Pada
ringkasan statistik (summary) terdapat beberapa nilai deskriptif statistika untuk
14
masing-masing yakni data minimum dan maksimum yang merupakan nilai terkecil
dan terbesar yang terdapat dalam variabel tersebut, kuartil 1, kuartil 2/median,
kuartil 3 yang merupakan Kuartil (K) adalah nilai-nilai yang membagi serangkaian
data atau suatu distribusi frekuensi menjadi empat (4) bagian yang sama. Ada tiga
Kuartil yaitu kuartil pertama (K1), kuartil kedua (K2), dan kuartil ketiga (K3),
kemudian terdapat mean menggambarkan tentan g nilai rata-rata dari suatu sample.
Karena tidak terdapat data hilang atau missing value maka data tidak ada yang
dihilangkan dan keseluruhan data akan digunakan dalam analisis.
2. Uji Asumsi No Multikolinieritas
Pengujian asumsi no multikolinearitas dapat dilakukan dengan

membandingkan nilai VIF atau dapat pula dilakukan berdasarkan nilai korelasi.
Pertama akan dilakukan pengujian dengan membandingkan nilai VIF, berikut
merupakan pengujian dan hasil yang diperoleh.
i. Hipotesis
H0 : Tidak terdapat multikolinieritas
H1 : Terdapat multikolinieritas
ii. Tingkat signifikansi
𝛼 = 5 % = 0,05
iii. Daerah kritis
𝐻0 ditolak apabila VIF > 10
iv. Statistik uji
Gambar 3.3. Nilai VIF
15
v. Keputusan
Tabel 3.1. Keputusan Uji No Multikolinieritas
Pengujian Variabel VIF Tanda Pembanding Keputusan
Multiko1(Sawi) Bayam 3.17 < Gagal tolak 𝐻0
Melinjo 3.58 < Gagal tolak 𝐻0
Petai 5.87 < Gagal tolak 𝐻0
Jengkol 2.01 < Gagal tolak 𝐻0
Jamur 4.67 < Gagal tolak 𝐻0
Multiko2(Bayam) Sawi 8.90 < Gagal tolak 𝐻0
Multiko3(Melinjo) Sawi 11.02 > Tolak 𝐻0
Bayam 4.15 < Gagal tolak 𝐻0
10
Multiko4(Petai) Sawi 10.65 > Tolak 𝐻0
Multiko5(Jengkol) Sawi 11.72 > Tolak 𝐻0
Multiko6(Jamur) Sawi 6.91 < Gagal tolak 𝐻0
vi. Kesimpulan
Dengan menggunakan tingkat kepercayaan sebesar 95%, data yang ada
mendukung untuk gagal tolak H0 hampir pada keseluruhan variabel namun
terdapat tolak H0 untuk variabel Melinjo dengan Sawi, Petai dengan Sawi,
dan Jengkol dengan Sawi. Artinya masih terdapat hubungan yang linier antar
variabel Melinjo dengan Sawi, Petai dengan Sawi, dan Jengkol dengan Sawi
dan mengindikasikan bahwa asumsi no multikolinieritas untuk data Hasil
tanaman sayuran di Indonesia 2018 tidak terpenuhi.
16
Selanjutnya akan dilakukan pengecekan dengan cara kedua, yaitu dengan
melihat nilai korelasi antar variabel.
Gambar 3.4. Nilai Korelasi Antar Variabel
Berdasarkan pada Gambar 3.4. dapat dilihat matriks korelasi antar variabel
sayuran. Terlihat bahwa nilai korelasi antar variabel lebih dominan bernilai tinggi,
seperti nilai korelasi variabel petai dengan sawi sebesar 0.799, korelasi variabel
bayam dengan jamur sebesar 0.764, dan terdapat pula pasangan variabel yang nilai
korelasinya sangat tinggi melebihi 0.8 atau 80%, sehingga pasangan variabel yang
memiliki nilai korelasi sangat tinggi tersebut mengakibatkan terjadinya gejala
multikolinearitas atau terdapat hubungan antar variabel yakni variabel Melinjo
dengan Sawi, Petai dengan Sawi, dan Jengkol dengan Sawi. Sehingga secara
keseluruhan, dapat dikatakan data Hasil tanaman sayuran di Indonesia tahun 2018
memiliki korelasi antar variabelnya (asumsi no multikolinearitas tidak terpenuhi).
Namun demikian, dalam studi kasus ini akan diasumsikan bahwa keseluruhan
variabel tidak memiliki korelasi antar variabelnya sehingga asumsi no
multikolinieritas terpenuhi.
3. Hasil Pengelompokan Analisis Kluster Hirarki
Selanjutnya akan dilakukan pengelompokan berdasarkan hasil analisis
kluster hirarki, dalam pengelompokkan ini akan digunakan diagram dendogram
berdasarkan metode analisis kluster hirarki agglomerative yang terdiri dari
beberapa metode.
17
Gambar 3.5. Dendogram Metode Average
Gambar 3.6. Dendogram Metode Single
18
Gambar 3.7. Dendogram Metode Complete
Gambar 3.8. Dendogram Metode Ward’s
19
Gambar 3.9. Dendogram Metode Centroid
Dendogram dari kelima metode tersebut akan dipilih dan digunakan untuk
klusterisasi yang dilakukan bertujuan untuk mengelompokkan provinsi-provinsi
berdasarkan hasil Hasil tanaman sayuran di Indonesia pada tahun 2018 (ribu ton)
adalah dendogram dari metode Ward’s dengan alasan pada dendogram wrd tersebut
lebih rapid an tidak pemunpuk hanya pada satu sisi. Dari hasil dendogram metode
ward’s terlihat bahwa k=3 memberikan hasil pengelompokkan yang baik, yaitu
dengan melihat jarak yang dekat di dalam kelompoknnya dan memiliki jarak yang
cukup jauh antar kelompoknya yang dapat dilihat pada Gambar 3.10.
20
Gambar 3.10. Cluster Dendogram Metode Ward’s
No Provinsi Sawi Bayam Melinjo Petai Jengkol Jamur anggota.rahmi

1 ACEH 2661 3427 10094 774 1929 49219 1
7 BENGKULU 29816 756 415 1704 3602 8500 1
9 KEP. BANGKA BELITUNG 1364 1287 236 594 109 672 1
10 KEP. RIAU 3110 4618 137 458 378 664 1
11 DKI JAKARTA 2664 3297 97 9 0 0 1
14 DI YOGYAKARTA 3241 1438 13926 3688 126 392416 1
17 BALI 34192 1228 501 1 0 136310 1
18 NUSA TENGGARA BARAT 1571 564 1179 1 0 49700 1
19 NUSA TENGGARA TIMUR 10188 3247 59 330 0 0 1
21 KALIMANTAN TENGAH 1478 1403 417 1074 1011 23511 1
22 KALIMANTAN SELATAN 2375 1565 224 2837 927 82290 1
23 KALIMANTAN TIMUR 8595 4738 690 773 1473 11051 1
24 KALIMANTAN UTARA 4614 1965 123 403 23 0 1
25 SULAWESI UTARA 15613 1233 271 0 0 0 1
26 SULAWESI TENGAH 7661 1467 51 0 28 349 1
27 SULAWESI SELATAN 10579 6515 83 0 23 83944 1
28 SULAWESI TENGGARA 1047 1911 71 0 106 355 1
29 GORONTALO 16 51 0 0 0 0 1
30 SULAWESI BARAT 558 724 0 0 5 8084 1
31 MALUKU 2645 1379 0 0 10 0 1
32 MALUKU UTARA 107 201 0 0 0 0 1
33 PAPUA BARAT 954 651 0 0 2 24 1
34 PAPUA 5591 3031 0 0 11 0 1
2 SUMATERA UTARA 62831 20244 2621 5926 3871 23493 2
3 SUMATERA BARAT 28973 4028 10726 7151 8269 40110 2
4 RIAU 1968 11183 1513 1998 3542 72849 2
5 JAMBI 6290 4644 2003 1909 4101 17417 2
6 SUMATERA SELATAN 3614 4271 1882 3851 5616 91776 2
8 LAMPUNG 7872 6933 12169 13794 12991 280971 2
20 KALIMANTAN BARAT 2961 2440 652 4063 5416 18006 2
12 JAWA BARAT 201004 29809 31606 72024 13246 16992355 3
13 JAWA TENGAH 88740 10942 51213 92497 10913 4431144 3
15 JAWA TIMUR 72562 11065 41623 78673 176 8071803 3
16 BANTEN 8535 10022 54273 10198 9950 164558 3
Gambar 3.11. Cluster Data
21
Dari output pada Gambar 3.10. dan Gambar 3.11. diperoleh anggota-
anggota dalam kelompok sebagai berikut:
Tabel 3.2. Pengelompokan, Provinsi dan Jumlah Anggota
Pengelompokan Provinsi Jumlah Anggota

Kelompok 1 Aceh, Bengkulu, Kep. Bangka Belitung,
Kep. Riau, DKI Jakarta, DI Yogyakarta,
Bali, Nusa Tenggara Barat, Nusa
Tenggara Timur, Kalimantan Tengah,
Kalimantan Selatan, Kalimantan Timur, 23
Kalimantan Utara, Sulawesi Utara,
Sulawesi Selatan, Sulawesi Tenggara,
Gorontalo, Maluku, Maluku Utara,
Papua Barat, dan Papua.
Kelompok 2 Sumatra Utara, Sumatra Barat, Riau, 6
Jambi, Sumatra Selatan, dan Lampung.
Kelompok 3 Kalimantan Barat, Jawa Barat, Jawa 5
Tengah, Jawa Timur, dan Banten.
4. Profilisasi
Hasil profilisasi data Hasil tanaman sayuran di Indonesia tahun 2018

menggunakan metode ward’s adalah sebagai berikut.
Tabel 3.3. Profilisasi
Profilisasi
Kelompok Sawi Bayam Melinjo Petai Jengkol Jamur
1 6549,57 2030,26 1242,35 549,83 424,48 36829,96
2 16358,43 7677,57 4509,43 5527,43 6258,00 77803,14
3 92710,25 15459,50 44678,75 63348,00 8571,25 7414965,00
Berdasarkan Tabel 3.3. di atas warna kuning merupakan kelompok yang

memiliki karakteristik hasil tanaman sayuran di Indonesia tahun 2018 tertinggi,
warna biru menunjukkan kelompok dengan karakteristik hasil tanaman sayuran di
Indonesia tahun 2018 sedang dan warna hijau menunjukkan kelompok dengan
karakteristik hasil tanaman sayuran di Indonesia tahun 2018 terendah.
22
Kelompok pertama adalah provinsi-provinsi penghasil terendah tanaman
sayuran di Indonesia tahun 2018 pada seluruh jenis sayuran yang diteliti yaitu sawi,
bayam, melinjo, petai, jengkol dan jamur.
Kelompok kedua adalah provinsi-provinsi penghasil sedang tanaman sayuran
di Indonesia tahun 2018 pada seluruh jenis sayuran yang diteliti yaitu sawi, bayam,
melinjo, petai, jengkol dan jamur.
Kelompok ketiga adalah provinsi-provinsi penghasil tertinggi tanaman
sayuran di Indonesia tahun 2018 pada seluruh jenis sayuran yang diteliti yaitu sawi,
bayam, melinjo, petai, jengkol dan jamur.
23
4 Penutup
4.1 Kesimpulan
Kesimpulan dari studi kasus yang telah dikerjakan adalah sebagai berikut:
kelompok tiga adalah provinsi-provinsi penghasil tertinggi tanaman sayuran
di Indonesia pada tahun 2018, kelompok dua penghasil sedang tanaman sayuran di
Indonesia pada tahun 2018, sedangkan kelompok satu adalah provinsi-provinsi
penghasil terendah tanaman sayuran di Indonesia pada tahun 2018.
4.2 Saran
a. Lakukan pemeriksaan data sebelum melakukan analisis.

b. Dalam penulisan sintaks harus lebih diperhatikan agar tidak terdapat error.
24
5 Daftar Pustaka
Muhajir, M. (2021). Modul Praktikum SMT UII. Yogyakarta: UII.

Narimawati, U. (2008). “Metodologi Penelitian Kualitatif dan Kuantitatif, Teori
dan Aplikasi”. Bandung: Agung Media.
Nafisah, Q., & Chandra, N. E. (2017). Analisis Cluster Average Linkage
Berdasarkan Faktor-Faktor Kemiskinan di Provinsi Jawa Timur . Zeta Vol.3
No.2.
Supranto, J. (2004). “Analisis Multivariat Arti dan Interpretasi”. Jakarta: Rineka
Cipta.
25

SMT 5

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

SMT 5

Diunggah oleh

Hak Cipta:

Format Tersedia

Kelas A

Nomor Tanggal Tanda Tangan

Rahmi Novika Harahap 18611099 03/05/2021

Tanggal Tanda tangan

Gambar 2.1. Shortcut R studio. ........................................................................... 9

Analisis Cluster adalah salah satu teknik multivariat yang bertujuan

2.1 Studi Kasus

Peneliti ingin mengelompokan hasil tanaman sayur di Indonesia tahun 2018

2.2 Langkah Kerja

Kali ini untuk menyelesikan studi kasus yang diberikan, praktikan

1. Pertama membuka software R studio.

digunakan dengan nama lp5_rahmi dan kemudian menampilkan data yang

lp5_rahmi=read.delim("clipboard") #input data

3. Kemudian melakukan pengecekan data missing dapat dilakukan dengan

4. Selanjutnya melakukan pengecekan no multikolinearitas dapat menampilkan

5. Selanjutnya akan dilakukan pengecekan multikolinearitas dengan melihat

data.lp5.rahmi=lp5_rahmi[,3:8] #berisi data lp5_rahmi dengan

7. Selanjutnya dilakukan analisis kluster hirarki dengan tipe agglomerative yang

#metode average linkage

plot(metode_al.rahmi) #menampilkan hasil dendogram

#metode single linkage

#metode complete linkage

#dengan ward’s method

8. Berdasarkan dendogram dari kelima metode kluster hirarki yang telah

#membuat garis merah pengelompokan pada dendogram

9. Kemudian mengelompokkan data dalam format data frame menggunakan

Gambar 2.2. Formula Rata-rata Pada Ms.Excel

Gambar 3.2. Ringkasan Data

Pengujian asumsi no multikolinearitas dapat dilakukan dengan

Gambar 3.3. Nilai VIF

Gambar 3.4. Nilai Korelasi Antar Variabel

Gambar 3.6. Dendogram Metode Single

Gambar 3.8. Dendogram Metode Ward’s

No Provinsi Sawi Bayam Melinjo Petai Jengkol Jamur anggota.rahmi

Gambar 3.11. Cluster Data

Tabel 3.2. Pengelompokan, Provinsi dan Jumlah Anggota

Pengelompokan Provinsi Jumlah Anggota

Hasil profilisasi data Hasil tanaman sayuran di Indonesia tahun 2018

Tabel 3.3. Profilisasi

Berdasarkan Tabel 3.3. di atas warna kuning merupakan kelompok yang

a. Lakukan pemeriksaan data sebelum melakukan analisis.

Muhajir, M. (2021). Modul Praktikum SMT UII. Yogyakarta: UII.

Anda mungkin juga menyukai