LAPORAN PRAKTIKUM
Statistika Multivariat Terapan
Modul 7 : K-Means
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2020
i
Daftar Isi
ii
Daftar Gambar
iii
1 Pendahuluan
1
2 Deskripsi Kerja
2
Gambar 2.4. Uji Normal Multivariat dan Uji Multikoleniaritas
5. Mengahapus kolom luas panen dan melakukan tranformasi data dengan
menggunakan sintaks pada Gambar 2.5 berikut.
3
9. Membuat visualisasi cluster dalam bentuk plot cluster menggunakan
perintah pada Gambar 2.9 berikut
4
3 Pembahasan
Pada bagian ini akan dijelaskan hasil analisis dan visualisasi clustering
dengan K-Meand yang telah dilakukan pada bagian sebelumnya.
Data yang digunakan dalam analisis cluster menggunakan K-Medoids ini adalah
data Luas Lahan, jumlah Produksi, dan Rata-rata Produksi tanaman Padi menurut
Kabupaten/Kota di Provinsi Sulawesi Utara tahun 2015.
5
Berdasarkan Gambar 3.2, diketahui bahwa tidak terdapat data hilang. Hal ini
dapat dilihat dari seluruh data (15 data) berargumen FALSE. Jika terdapat data
yang hilang, maka akan ditampilakn pada argumen TRUE. Langkah selanjutnya
yang perlu dilakukan sebelum melakukan analisis clustering dengan K-Means
adalah perlu dilakukan uji Normalitas Multivariat dan Uji Multikoleniaritas.
i. Hipotesis
: Data berdistribusi normal multivariat
: Data tidak berdistribusi normal multivariat
ii. Tingkat Signifikansi
= 0.05
iii. Daerah Kritis
Tolak jika p-value <
iv. Statistik Uji
Berdasarkan Gambar 3.3, diperoleh p-value = 2.023.
v. Keputusan
Karena nilai p-value =2.023 < = 0.05, maka tolak
vi. Kesimpulan
Dengan menggunakan tingakat kepercayaan 95%, diperoleh kesimpulan
tolak yang artinya data yang ada mendukung hipotesis yang
menyatakan bahwa data tidak berdistribusi normal multivariat.
Kemudian berdasarkan uji normalitas masing-masing variabel
menggunakan uji Shapiro wilk yang ditunjukkan pada Gambar 3.3, diperoleh
bahwa data semua variabel tidak signifikan atau tidak berdistribusi normal. Hal
6
ini dapat dilihat dari nilai p-value masing-masing variabel yang kurang dari
.
Analisis cluster adalah salah satu analisis yang masuk dalam teknik
Machine Learning Unsupervised, yang mana variabel dalam penelitian ini hanya
terdiri dari variabel-variabel independen. Sehingga, antar variabel tidak boleh
saling berhubungan (independen). Untuk mendeteksi ada tidaknya hubungan antar
variabel, maka dapat menggunakan uji multikoleniaritas dengan melihat plot
korelasi antar variabel.
Berdasarkan Plot korelasi pada Gambar 3.4 diatas, dapat diketahui bahwa
variabel yang saling berkorelasi adalah antara Luas Panen dan Produksi dengan
nilai korelasi sebesar 1. Nilai korelasi yang dihasilkan ini sangatlah kuat dan
berkorelasi positif. Sedangkan antara Luas Panen Dengan Rata-rata Produksi,
kemudian antara Produksi dan Rata-rata Produksi semuanya tidak saling
berkorelasi. Beberapa literatur menyatakan bahwa antar variabel diakatan
berkorelasi, jika memiliki nilai korelasi lebih dari 0.5 baik bernilai negatif
maupun postif.
7
Oleh karena antar Luas Panen Dan Produksi saling berhubungan, maka salah
satu variabelnya harus dikelurkan. Dalam analisis ini, praktikan mengeluarkan
variabel Produksi karena nilai korelasinya dengan Rata-rata Produksi lebih besar
dibandingkan dengan antara Luas Panen dengan Rata-rata Produksi.
8
Gambar 3.6. Visualisai Jarak Antar Kabupaten/Kota
9
sebanyak 12 anggota yaitu, Minahasa, Kepulauan Sangihe, Kepulauan Talaud,
Minahasa Selatan, Minahasa Utara, Bolaang Mongondow Utara, Minahasa
tenggara, Bolaang Mongondow Selatan, Bolaang Mongondow Timur, Kota
Bitung, Kota Tomohon, dan Kota Mombagu. Sedangkan pada cluster 3 hanya
teridir dari 1 anggota yaitu kabupaten Bolaang Mongondow. Kemudian, dapat
pula dilihat nilai Within dan Between Cluster pada Gambar 3.8 berikut.
10
dan warna biru menunjukkan cluster ketiga. Kemudian antara cluster memiliki
jarak yang cukup berjauhan.
11
Gambar 3.11. Barplot
12
4 Penutup
4.1 Kesimpulan
13
5 Daftar Pustaka
14