i
Prodi Matematika FST, UINAM, Wahidah.alwi@uin-alauddin.ac.id
ii
Mahasiswa Program Studi Matematika-FST, UINAM
35
JURNAL MSA VOL. 6 NO. 1 ED. JAN-JUNI 2018
atau memutuskan kebijakan dan strategi yang yang berdasarkan kemiripan karakteristik yang
baik/tepat sasaran dalam pembangunan dimilikinya. Analisis clusterakan membagi
Analisis multivariat merupakan salah satu solusi sejumlah data pada satu atau beberapa cluster
dalam hal mengelompokkan objek-objek yang tertentu. Sebuah cluster yang baik adalah cluster
mempunyai kesamaan karakteristik. Salah satu yang memiliki :
dari analisis multivariat yang dapat digunakan • Homogenitas (kesamaan) yang tinggi
yaitu analisis klaster. Analisis klaster bertujuan antara anggota dalam satu cluster(within-
untuk mengelompokkan objek-objek cluster).
pengamatan berdasarkan karakteristik yang • Heterogenitas (perbedaan) yang tinggi
dimiliki. Ukuran kesamaan yang digunakan antara cluster yang satu dengan cluster
adalah ukuran jarak antar objek. Kedua objek lainnya (between cluster).
yang memiliki jarak paling dekatakan bergabung Prosedur Analisis Cluster
menjadi satu klaster. Kedekatan jarak yang Rumusan Masalah
dimiliki menunjukkan bahwa kedua objek Dalam hal ini dilakukan pemilihan variabel-
tersebut memiliki tingkat kesamaan variabel yang akan digunakan untuk
karakteristik. Objek penelitian ini adalah tingkat pengelompokan (pembentukan cluster). Tahap
kesejahteraan rakyat dengan 11 indikator yaitu ini merupakan tahap yang penting karena
PDRB Tiap Kabupaten/Kota (X1), Kepadatan memilih satu atau dua variabel yang tidak sesuai
Penduduk (X2 ), Jumlah Penduduk Miskin (X3 ), dengan masalah pengelompokan dan akan
Daya Beli (X4 ), Jumlah Angkatan Kerja (X5 ), menyebabkan penyimpangan pada hasil peng-
Angka Harapan Hidup (X6 ), Angka Melek Huruf clusteran.
(X7 ), Rata-Rata Lama Sekolah (X8 ), Angka Data Outliers
Harapan Lama Sekolah (X9 ), Tingkat Outliers adalah data pengamatan dengan nilainya
Pengangguran Terbuka (X10 ), Kepemilikan “ekstrim” yang muncul karena memiliki
Rumah Sendiri (X11 ). karakteristik yang unik atau terlihat sangat jauh
berbeda dari observasi-observasi lainnya.
2. TINJAUAN PUSTAKA Deteksi data yang outlier dapat dilakukan dengan
melakukan standarisasi data (Z-Score) setelah itu
Analisis Multivariat melakukan pengecekan dimana dikatakan sebuah
Analisis multivariat yaitu analisis yang data outlier apabila nilainya tidak terletak dalam
digunakan terhadap data yang terdiri dari banyak selang (-2,5; +2,5).
variabel, dimana variabelnya saling berkorelasi Standarisasi Data
satu sama lain, dengan I = 1, 2, … n dan j = 1, 2, Perlunya dilakukan proses standarisasi data
…,p. Data multivariat dengan n pengamatan dengan transformasi pada data asli sebelum
pada p variabel ditampilkan sebagai berikut dianalisis lebih lanjut apabila variabel yang
x11 x12 x1k x1 p diteliti memiliki perbedaan ukuran satuan yang
x besar. Standarisasi dilakukan terhadap variabel
21 x 22 x 2 k x 2 p yang relevan ke dalam bentuk z-score.
Asumsi-Asumsi
X= Matriks X
x j1 x j 2 x jk x jp Terdapat dua asumsi yang harus dipenuhi dalam
analisis cluster yaitu sampel mewakili populasi
dan tidak terjadi multikolinearitas.Untuk
x n1 x n 2 x nk x np mengetahui apakah sampel yang diambil
berisi data yang terdiri dari semua pengamatan benar-benar dapat mewakili populasi yang ada
terhadap semua variabeldimana n baris dan p dibutuhkan nilai Kaiser-Meyer Olkin (KMO).
kolom. Dimana nilai KMO kurang dari 0.5 menandakan
Analisis Cluster bahwa sampel yang diambil tidak dapat mewakili
Analisi cluster adalah salah satu teknik dari populasi yang ada, (Machfudhoh,2013).
analisis multivariat yang mempunyai tujuan Sedangkan untuk mendeteksi ada atau tidaknya
utama yaitu untuk mengelompokkan objek-objek multikolinearitas dapat dilakukan dengan
36
JURNAL MSA VOL. 6 NO. 1 ED. JAN-JUNI 2018
37
JURNAL MSA VOL. 6 NO. 1 ED. JAN-JUNI 2018
N:Jumlah objek dalam cluster yang dicari nilai betul-betul sudah milik kepala rumah tangga atau
centroid salah satu seorang anggota rumah tangga.
Dalam penelitian ini digunakan analisis cluster
3. METODOLOGI PENELITIAN hirarki agglomerative dengan metode Averge
Linkage, dengan langkah-langkah sebagai
Data yang digunakan dalam penelitian ini adalah berikut: (1) Menentukan objek bersesuaian yang
data sekunder yang diperoleh dari BPS Provinsi memiliki jarak terdekat dalam matriks jarak D =
Sulawesi Selatan yaitu data indikator {𝑑𝑑𝑖𝑖𝑖𝑖 }, (2) Menggabungkan objek yang
kesejahteraan rakyat Tahun 2015. Dengan teknik bersesuaian tersebut, katakanlah objek U dan
pengumpulan data yaitu (1). Dokumentasi, (2) objek V, yang kemudian didapatkan cluster (UV),
Observasi, dan (3) wawancara. (3) Menghitung jarak antara cluster (UV) dengan
Adapun variabel yang digunakan yaitu objek lain katakanlah W yang belum bergabung
PDRB(X1) yaitu jumlah nilai barang dan jasa dan menghitung kembali matriks jarak baru, (4)
akhir dalam satuan Rupiah yang dihasilkan oleh Mengulangi langkah 2 sampai bergabung
seluruh unit ekonomi pada suatu daerah, menjadi satu cluster. Hasil dari Average Linkage
kepadatan penduduk (X2) yaitu perbandingan ini dapat ditampilkan dalam bentuk dendogram
jumlah penduduk dengan luas wilayahnya dalam atau diagram pohon
satuan Jiwa/Km2, jumlah penduduk miskin (X3) Adapun prosedur dari analisis cluster dalam
yaitu jumlah penduduk yang memiliki rata-rata penelitian ini disajikan dalam diagram alur
pengeluaran dibawah garis kemiskinan dalam sebagai berikut:
satuan Jiwa, daya beli (X4) yaitu kemampuan
masyarakat dalam membelanjakan uangnya
dalam bentuk barang maupun jasa dengan satuan
Rupiah, jumlah angkatan kerja (X5) yaitu jumlah
penduduk usia kerja (15 tahun dan lebih) yang
bekerja, atau punya pekerjaan namun sementara
tidak bekerja dan pengangguran dalam satuan
Jiwa, angka harapan hidup (X6) yaitu rata-rata
tahun hidup dalam satuan Tahun yang masih
akan dijalani oleh seseorang yang telah berhasil
mencapai umur x, pada suatu tahun tertentu,
dalam situasi mortalitas yang berlaku di
lingkngan masyarakatnya, angka melek huruf
(X7) yaitu persentase penduduk usia 10 tahun ke
atas yang dapat membaca dan menulis dalam
huruf latin atau lainnya, dan rata-rata lama
sekolah (X8) yaitu jumlah tahun belajar
penduduk usia 15 tahun ke atas yang telah
diselesaikan dalam pendidikan formal (tidak
termasuk tahun yang mengulang) dengan satuan
Tahun, angka harapan lama sekolah (X9) yaitu
lamanya sekolah yang diharapkan akan dirasakan
oleh anak pada umur tertentu di masa mendatang 4. HASIL PENELITIAN
dalam satuan Tahun, tingkat pengangguran
terbuka (X10) yaitu Persentase pengangguran Statistika Deskriptif
terhadap jumlah angkatan kerja, dan kepemilikan Sebelum dilakukan analisis cluster terlebih
rumah sendiri (X11) yaitu Persentase jumlah dahulu dianalisis secara deskriptif.
rumah tangga dengan status kepemilikan rumah Tabel 4.1 Statistika Deskriptif Indikator
sendiri. Dimana rumah sendiri merupakan jika Kesejahteraan Rakyat Tahun 2015
tempat tinggal tersebut pada waktu pendataan
38
JURNAL MSA VOL. 6 NO. 1 ED. JAN-JUNI 2018
∑∑r + ∑∑ ρ ij
2 2
apabila terdapat perbedaan satuan yang ij
i =1 j =1 i =1 j =1
signifikan diantara variabel-variabel yang
diteliti. Karena dalam penelitian ini, data yang Pengambilan keputusan : nilai KMO> 0,5 maka
digunakan satuan variabelnya berbeda maka tolak H0.
dilakukan stndarisasi data terlebih dahulu. Tabel 4.3 Uji KMO
Selanjutnya, berdasarkan data penelitian yang Uji Nilai
telah distandarisasi, jika ada data yang nilainya KMO 0,694
Approx. Chi- 237,71
tidak berada diantara ± 2,5 berarti data tersebut Square
outlier. Hasil pengamatan terhadap data yang Bartlett’s
Test Of Df 55
outlier ditampilkan dalam Tabel 4.15 sebagai Sphericity Sig 2.2e-16
berikut : Berdasarkan Tabel 4.3 menunjukkan bahwa nilai
Tabel 4.2. Deteksi Outlier KMO sebesar 0,694. Karena 0,694 > 0,5 berarti
Kab/Kota Variabel Nilai tolak Ho sehingga dapat disimpulkan sampel
Bone ZX 5 2,94652 digunakan sudah cukup untuk dianalisis lebih
ZX 1 4,5801 lanjut.
Zx 2 4,61067 Uji Multikolinearitas
Makassar
ZX 4 2,87021 Dalam mengetahui ada tidaknya
ZX 8 2,61633 multikolinearitas dapat dilihat dari nilai koefisien
korelasi sederhana (korelasi Pearson). Jika
Berdasarkan Tabel 4.2 diperoleh data outlie, terdapat nilai yang mencapai atau melebihi ± 0,8
langkah berikutnya adalah tetap maka terjadi multikolinearitas. Setelah dilakukan
mempertahankan data outlier tersebut karena perhitungan menggunakan program R diperoleh
merupakan representasi dari populasi yang hasil bahwa variabel X1 dengan X2,X7 dengan X8,
diteliti. Data yang outlier ini memberikan X8 dengan X9, X8 dengan X11 serta X9 dengan X11
gambaran bahwa Kabupaten Bone dan Kota mengalami multikolinearitas karena nilai
Makassar pada variabel tertentu sangat berbeda korelasi lebih dari ±0,80. Maka dari itu dilakukan
karakteristiknya dibanding dengan analisis komponen utama atau principal
kabupaten/kota lainnya yaitu: jumlah angkatan component analysis untuk mengatasi masalah
kerja (ZX5) di Kab. Bone sangat berbeda dengan tersebut.
kabupaten yang lain, begitupula PDRB (ZX1) IV.3 Principal Component Analysis
Kota Makassar sangat berbeda dengan PDRB di
39
JURNAL MSA VOL. 6 NO. 1 ED. JAN-JUNI 2018
Dalam analisis komponen utama ada perhitungan nilai MSA dari kesebelas variabel
beberapa asumsi yang harus terpenuhi yaitu : yang ditampilkan dalam Tabel 4.5.
a. Uji Kecukupan Sampel Berdasarkan Tabel 4.5 dari sebelas variabel yang
Uji ini telah dilakukan sebelumnya dan ada, variabel X3 dan X5 masing-masing memliki
diperoleh nilai KMO sebesar 0,694 (Tabel 4.2) nilai MSA kurang dari 0,5 sehingga hanya
dan telah memenuhi asumsi. kesembilan variabel yang layak untuk dilakukan
b. Uji Bartlett PCA.
Uji ini bertujuan untuk mengetahui ada Selanjutnya melakukan analisis komponen
tidaknya korelasi antar variabel utama dengan langkah-langkah sebagai berikut :
Hipotesis : 1. Membuat matrks Z yang berisi data variabel
H0 :R = I (Tidak ada korelasi) yang distandarisasi
H1 :R ≠ I (Terdapat korelasi) 2. Membuat matriks korelasi R yaitu dengan
Statistik uji : rumus :
2 p + 5 1
χ 2 hitung = −n − 1 − ln R R= Z' Z
6 n −1
Pengambilan keputusan : Tolak H0 jika 3. Mencari nilai eigen λ1, λ2,..., λp yang
χ 2 hitung > χ 2 1 atau sig. < α=0,05 memenuhi persamaan
α ; p ( p −1)
2 R − λI = 0
Adapun hasil pengujian Bartlett dapat di 4. Mencari eigen vector (𝑒𝑒̂𝑖𝑖 ) yang bersesuaian
lihat pada Tabel 4.3 sebagai berikut : dengan nilai eigen dan memenuhi persamaan
Tabel 4.4 Uji Bartlett (R − λI ).eˆ i = 0
Uji Nilai
Approx.
5. Menentukan banyaknya komponen yang
237,71
Chi- dipilih berdasarkan nilai eigen yang
Square menjelaskan besarnya kontrobusi keragaman
Bartlett’s df 55 atau varian masing-masing komponen utama.
Test sig 2.2e-16 Nilai eigen selalu diurutkan dari yang
Berdasarkan Tabel 4.4 menunjukkan terbesar ke terkecil.
bahwa nilai p-value sebesar 2.2e-16. Karena p- 6. Bentuk persamaan komponen (PC) seperti
value< 0,05 berarti tolak Ho sehingga dapat berikut :
disimpulkan terdapat korelasi antar variabel. PC i = eˆ i z = eˆi1 z1 + eˆi1 z1 + + eˆip z p
c. Nilai MSA Setelah dilakukan langkah-langkah seperti di atas
Tabel 4.5 Nilai MSA diperoleh bahwa Komponen 1 dan Komponen 2
Var MSA secara bersama-sama telah dapat menjelaskan
X1 0,609 keragaman atau variansi dari kesembilan variabel
X2 0,645 sebesar 79,89 %.Selanjutnya menentukan eigen
X3 0,341 vector atau koefisien dari principal component
X4 0,768 yang akan digunakan untuk membentuk
X5 0,424
persamaan PC sebagai berikut :
X6 0,568
X7 0,682 PC1 = 0,287z1 + 0,313z2 + 0,313z4 + 0,246z6 +
X8 0,783 0,345z7 + 0,394z8 + 0,372z9 +0,329z10 -
X9 0,802
0,376z11
X10 0,813
X11 0,78
PC2 = -0,510z1 - 0,450z2 - 0,341z4 + 0,467z6 +
0,224z7 + 0,171z8 + 0,217z9 - 0,121z10 -
Nilai MSA digunakan untuk mengetahui 0,249z11
variabel-variabel mana saja yang layak dilakukan Selanjutnya adalah menghitung PCscore dari
PCA. Nilai MSA yang kurang dari 0,5 kedua persaman PC. Nilai PC score inilah yang
menunjukkan bahwa variabel tersebut tidak digunakan untuk analisis lebih lanjut.
layak untuk dianalisis PCA. Adapun hasil
40
JURNAL MSA VOL. 6 NO. 1 ED. JAN-JUNI 2018
41
JURNAL MSA VOL. 6 NO. 1 ED. JAN-JUNI 2018
6. DAFTAR PUSTAKA
42