Anda di halaman 1dari 10

TUGAS

MULTIVARIATE

Oleh
WISNU SETIA NUGROHO
166090500011004

PROGRAM STUDI MAGISTER STATISTIKA


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
MALANG
2017
Analisis korelasi kanonik (canonical analysis) pertama kali diperkenalkan oleh
Hotelling (1936), sebagai suatu teknik statistika peubah ganda (Multivariat) yang menyelidiki
keeratan hubungan antara dua gugus variabel. Gugus maksudnya disini kelompok. Satu
gugus variabel diidentifikasikan sebagai gugus variabel penduga (independent variables),
sedangkan gugus variabel lainnya diperlakukan sebagai gugus variabel respon (dependent
variabel). Dan melalui ketergantungan (dependency) antar kedua gugus variabel tersebut
dapat dijelaskan pengaruh dari satu gugus variabel terhadap gugus variabel lainnya.

Hair, et al, memberikan langkah-langkah dalam membentuk analisis korelasi kanonik, yaitu:

1. Menentukan tujuan dan menspesifikasikan masing-masing kumpulan peubah. Data


yang tepat untuk analisis korelasi kanonik adalah dua kumpulan peubah baik metrik
maupun nonmetrik. Diasumsikan bahwa tiap kumpulan dapat diberikan beberapa arti
teoritis, setidaknya satu kumpulan dapat didefenisikan sebagai kumpulan peubah
dependen dan kumpulan yang lain sebagai kumpulan peubah independen.
2. Menentukan jumlah observasi per peubah dan total ukuran sampel.
Sampel yang sedikit tidak akan merepresentasikan peubah dengan baik. Demikian
juga sampel yang besar akan memiliki kecenderungan signifikan secara statistik
dalam segala hal, namun secara praktik tidak mengindikasikan signifikan. Peneliti
diharapkan untuk mempertahankan setidaknya sepuluh pengamatan per peubah.
3. Pengujian asumsi.
Sebelum proses lebih lanjut terlebih dahulu diuji berbagai asumsi yang harus dipenuhi
meliputi linieritas, berdistribusi multivariat normal, homoskedastisitas dan
nonmultikolinieritas.
1. Adanya hubungan yang bersifat linier antara dua peubah
Untuk mengetahui ukuran kelinieran dari dua peubah dapat dilihat dari
koefisien determinasi (R2). Koefisien determinasi menyatakan proporsi
keragaman total nilai-nilai peubah dependen yang dapat dijelaskan oleh nilai-
nilai peubah independen melalui hubungan linear tersebut. Nilai koefisien
determinasi terletak antara 0 dan 1. Jika semua observasi terletak sepanjang
garis linier maka koefisien determinasi bernilai 1. Jika slope dari garis regresi
yang sesuai adalah 0 dan koefisien determinasi 0, berarti tidak ada hubungan
linier antara independen dan dependen, dan peubah bebas independen tidak
membantu dalam mengurangi keragaman dependen dengan regresi linear.
2. Perlunya data menyebar multivariat normal
Pemeriksaan asumsi multivariat normal dapat dilakukan dengan analisis grafik
dan tes statistik dengan nilai skewness dan kurtosis. Metode pengujian
multivariat normal dengan test based on skewness dan kurtosis statistic terdiri
atas dua statistik uji, yaitu skewness dan kurtosis,

Tidak ada multikolinieritas antar anggota kelompok peubah, baik peubah tidak bebas
maupun peubah bebas. Ada dua metode untuk mendeteksi terjadinya multikolinieritas,
yaitu metode informal dan formal. Metode formal dengan melihat nilai VIF.
Memilih fungsi kanonikMaksimum fungsi kanonik yang terbentuk adalah minimum
jumlah peubah dalam setiap kumpulan. Penentuan fungsi yang akan dipilih adalah
berdasarkan tingkat signifikansinya. Ketika semua fungsi signifikan dapat melihat
korelasi kanoniknya, tidak ada ukuran yang pasti mengenai seberapa besar hubungan
yang harus terbentuk, faktor loading mungkin menjadi alternatif dalam menentukan
ukuran yang bermakna. Faktor loading lebih besar dari 0,5. Selain hal ini, jika dilihat
masih terlalu banyak fungsi yang harus didefenisikan, maka dapat melihat redundancy-
nya. Jhonson dan Wichern, 2002 menyatakan dapat menggunakan ukuran yang terdapat
pada analisis komponen utama mengenai keragaman kumulatif dari pasangan peubah
kanonik dalam menerangkan keragaman data yang akan dianalisis lebih lanjut yaitu
minimum keragaman kumulatif sebesar 80 persen.
Menginterpretasikan peubah kanonik.
Ada tiga metode yang dapat digunakan antara lain canonical weight (bobot kanonik),
canonical loading (beban kanonik), dan canonical cross-loading.

1. Bobot kanonik

Bobot kanonik menggambarkan besarnya kontribusi peubah asal dalam peubah


kanoniknya dalam satu kumpulan. Peubah yang memiliki angka koefisien yang besar
maka memberikan kontribusi lebih pada peubah kanoniknya, begitu pula sebaliknya.
Kemudian untuk peubah yang memiliki bobot yang berlawanan tanda,
menggambarkan hubungan kebalikan dengan peubah kanonik lainnya, dan peubah
yang memiliki tanda sama memiliki hubungan langsung atau searah. Bobot kanonik
memiliki beberapa kelemahan yang menjadikannya jarang digunakan untuk
interpretasi fungsi kanonik. Kelemahannya adalah sifat yang hanya menggambarkan
besarnya kontribusi peubah-peubah asal terhadap peubah kanoniknya. Kontribusi
tersebut dinilai tidak akurat dalam merefleksikan hubungan antar peubah. Selain itu,
nilai ini dikatakan tidak akurat untuk menggambarkan hubungan antar peubah karena
rentan/sensitif terhadap adanya multikolinieritas. Selain itu sangat tidak stabil dari
satu sampel ke sampel lain.

2. Beban kanonik

Beban kanonik juga disebut sebagai korelasi struktur, mengukur korelasi linier yang
sederhana antara data observasi di peubah independen atau dependen dengan
kumpulan peubah kanoniknya. Dalam SPSS, nilai beban kanonik dapat dilihat pada
korelasi antara peubah dependen maupun peubah independen dengan peubah
kanoniknya. Peubah asal yang memiliki nilai beban kanonik besar (>0,5) akan
dikatakan memiliki peranan besar dalam kumpulan peubahnya. Sedangkan tanda
beban kanonik menunjukkan arah hubungannya. Semakin besar nilai beban kanonik
maka akan semakin penting peranan peubah asal tersebut dalam kumpulan
peubahnya. Beban kanonik lebih baik dalam menginterpretasikan hubungan antar
peubah dari pada bobot kanonik karena kelemahan-kelamahan yang ada pada bobot
kanonik.

3. Canonical cross-loading

Bobot kanonik dan beban kanonik hanya melihat kontribusi dan korelasi terhadap
peubah kanoniknya dalam satu kumpulan. Sedangkan cross loading digunakan untuk
melihat korelasi antar peubah asal dalam satu kumpulan dengan peubah kanonik pada
kumpulan yang lainnya. Semakin besar nilai ini, maka dapat menggambarkan
semakin erat pula hubungan antara kedua kumpulan.
STUDI KASUS ANALISIS KORELASI KANONIK
HUBUNGAN ANTARA INDIKATOR GIZI BURUK DENGAN FASILITAS KESEHATAN

No Kabupaten/kota X1 X2 X3 X4 Y1 Y2
1 Nias 28,99 83,43 14,1 5,8 21 66
2 Mandailing Natal 48,45 78,76 13,6 10,41 45 141
3 Tapanuli Selatan 16,25 94,82 7,7 3,12 35 58
4 Tapanuli Tengah 27,74 92,38 6,8 5,85 47 73
5 Tapanuli Utara 52,14 54,85 11,1 11,52 81 104
6 Toba Samosir 10,33 94,28 3,1 3,67 27 108
7 Labuhan Batu 33,95 86,48 8,3 25,67 23 180
8 Asahan 15,45 74,73 4,9 4,14 61 174
9 Simalungun 32,49 76,37 12,1 1,12 49 245
10 Dairi 30,37 76,05 4,9 21,1 24 79
11 Karo 43,45 85,19 7,1 2,11 54 116
12 Deli Serdang 41,95 91,39 5,2 0 71 963
13 Langkat 36,72 77,6 9,7 7,11 89 210
14 Nias Selatan 66,33 0 15,9 12,13 63 38
15 Humbang Hasundutan 14,65 64,91 8,4 8,37 17 47
16 Pakpak Bharat 67,09 85,78 7,4 23,26 9 36
17 Samosir 57,71 99,99 1,5 35,56 24 76
18 Serdang Bedagai 27,96 97,23 11,5 1,26 30 260
19 Batu Bara 47,94 98,12 12 0,28 36 65
20 Padang Lawas Utara 85,05 78,6 14,3 17,94 17 77
21 Padang Lawas 33,01 83,92 12,6 9,9 28 66
22 Labuhan Batu Selatan 39,6 40,83 9,1 1,66 25 104
23 Labuhan Batu Utara 74,83 64,68 12,3 17,79 25 155
24 Nas Utara 7,97 73,09 23,8 21,83 44 12
25 Nias Barat 10,2 39,36 17,2 23,95 29 10
26 Sibolga 78,55 85,05 8,8 0 27 124
27 Tanjung Balai 8,58 60,32 8,5 4,96 22 83
28 Pematang Siantar 11,75 54,58 3,4 0,35 42 222
29 Tebing Tinggi 36,35 83,71 5,9 0 23 180
30 Medan 26,22 83,32 4,2 0 172 3750
31 Binjai 13,98 99,36 13,5 0,13 37 212
32 Padang Sidempuan 60,29 75,33 11,3 0,16 24 77
33 Gunung Sitoli 67,79 57,95 3 3,07 36 20
Ket:
X1= Persentase balita yang tidak mendapat ASI Eksklusif
X2= Persentase balita yang tidak mendapat Vitamin A
X3= Persentase balita yang kurang energi protein
X4= Persentase rumah tangga yang sumber air minum
Y1= Jumlah Clinic
Y2= Jumlah Dokter
HASIL ANALISIS MENGGUNAKAN SOFTWARE R

1. Korelasi Kanonik Antara Kemiskinan dengan Angka Partisipasi Sekolah


Dari hasil perhitungan menggunakan software R, diperoleh output sebagai berikut :

> cc1$cor
[1] 0.3590543 0.3164000

Interpretasi :
Korelasi kanonik pertama, ru1v1 = 0.3590543, nilainya cukup tinggi. Sedangkan korelasi
kanonik kedua ru2v1=0.3164000. Dari sini dapat dilihat bahwa nilai korelasi kanonik pertama
dan kedua memiliki tinggi yang sama. Angka koefisien korelasi kanonik ini bukan
menunjukkan keeratan hubungan antara himpunan variabel. Angka ini menunjukkan keeratan
hubungan antar dua variabel kanonik yang masing-masing merupakan kombinasi liner.

2. Koefisien Kanonik Mentah


Dari hasil perhitungan menggunakan software R, diperoleh output sebagai berikut :

$xcoef
[,1] [,2]
X1 -0.002272846 0.01080968
X2 -0.037429280 0.01000656
X3 0.093722498 0.10206597
X4 -0.031550675 0.07831101

$ycoef
[,1] [,2]
Y1 0.053534352 -0.0214308177
Y2 -0.002601105 -0.0006164063

Interpretasi :
Dari output di atas dapat dituliskan kombinasi linier bagi variabel kanonik U dan variabel
kanonik V sebagai berikut :

U1 = -0.002272846 X1-0.037429280 X2+ 0.093722498 X3-0.031550675 X4


U2 = 0.01080968 X1+0.01000656 X2+ 0.10206597 X3 +0.07831101 X4

V1 = 0.053534352 X1-0.002601105 X2
V2 = -0.0214308177 X1 -0.0006164063 X2
3. Menguji Koefisien Kanonik (Uji Dimensi)
Pengujian I
H0 : 1 = 1 = 1 = 0
H1 : i 0
Jika pengujian I memberikan hasil yang signifikan, maka lanjut ke pengujian II, sedangkan
jika hasil pengujian I tidak signifikan, maka proses selesai.

Pengujian II
H0 : 2 = 3 = 0
H1 : i 0
Jika pengujian II memberikan hasil yang signifikan, maka lanjut ke pengujian III, sedangkan
jika hasil pengujian II tidak signifikan, maka proses selesai.

Pengujian III
H0 : 3 = 0
H1 : 3 0

Berdasarkan hasil perhitungan menggunakan software R, diperoleh output sebagai berikut :

WilksL F df1 df2 p


[1,] 0.7838771 0.8739457 8 54 0.5441183-02
[2,] 0.8998910 1.0382928 3 28 0.3908562

Interpetasi :
Dari hasil pengujian di atas, dapat dilihat bahwa nilai p untuk pengujian pertama
bernilai lebih besar dari taraf nyata 0.05 (signifikan), sedangkan pada pengujian kedua nilai p
value lebih besar dari 0.05 (tidak signifikan). Dengan demikian, dapat disimpulkan bahwa
hanya rU1V1 saja yang signfikan. Dengan kata lain, variabel kanonik yang digunakan hanya
pada dimensi pertama, yakni U1 dan V1.

4. Menghitung Canonical Loadings


Dari hasil perhitungan menggunakan software R, diperoleh output sebagai berikut :

$corr.X.xscores
[,1] [,2]
X1 -0.02052392 0.35264756
X2 -0.87100650 -0.02623309
X3 0.60930968 0.57055033
X4 -0.14828625 0.85992851

$corr.Y.xscores
[,1] [,2]
Y1 0.08279512 -0.3078732
Y2 -0.13344109 -0.2937377

$corr.X.yscores
[,1] [,2]
X1 -0.007369204 0.111577690
X2 -0.312738658 -0.008300149
X3 0.218775282 0.180522131
X4 -0.053242822 0.272081390

$corr.Y.yscores
[,1] [,2]
Y1 0.2305922 -0.9730505
Y2 -0.3716460 -0.9283745
LAMPIRAN SYNTAX ANALISIS KORELASI KANONIK PADA SOFTWARE R

> wsn<-read.csv("D:/wisnu.csv",sep=';',header=TRUE)
> wsn
X1 X2 X3 X4 Y1 Y2
1 28.99 83.43 14.1 5.80 21 66
2 48.45 78.76 13.6 10.41 45 141
3 16.25 94.82 7.7 3.12 35 58
4 27.74 92.38 6.8 5.85 47 73
5 52.14 54.85 11.1 11.52 81 104
6 10.33 94.28 3.1 3.67 27 108
7 33.95 86.48 8.3 25.67 23 180
8 15.45 74.73 4.9 4.14 61 174
9 32.49 76.37 12.1 1.12 49 245
10 30.37 76.05 4.9 21.10 24 79
11 43.45 85.19 7.1 2.11 54 116
12 41.95 91.39 5.2 0.00 71 963
13 36.72 77.60 9.7 7.11 89 210
14 66.33 0.00 15.9 12.13 63 38
15 14.65 64.91 8.4 8.37 17 47
16 67.09 85.78 7.4 23.26 9 36
17 57.71 99.99 1.5 35.56 24 76
18 27.96 97.23 11.5 1.26 30 260
19 47.94 98.12 12.0 0.28 36 65
20 85.05 78.60 14.3 17.94 17 77
21 33.01 83.92 12.6 9.90 28 66
22 39.60 40.83 9.1 1.66 25 104
23 74.83 64.68 12.3 17.79 25 155
24 7.97 73.09 23.8 21.83 44 12
25 10.20 39.36 17.2 23.95 29 10
26 78.55 85.05 8.8 0.00 27 124
27 8.58 60.32 8.5 4.96 22 83
28 11.75 54.58 3.4 0.35 42 222
29 36.35 83.71 5.9 0.00 23 180
30 26.22 83.32 4.2 0.00 172 3750
31 13.98 99.36 13.5 0.13 37 212
32 60.29 75.33 11.3 0.16 24 77
33 67.79 57.95 3.0 3.07 36 20
> colnames(wsn) <- c("X1", "X2", "X3", "X4", "Y1", "Y2")
> summary(wsn)
X1 X2 X3
Min. : 7.97 Min. : 0.00 Min. : 1.500
1st Qu.:16.25 1st Qu.:64.91 1st Qu.: 5.900
Median :33.95 Median :78.76 Median : 8.800
Mean :38.00 Mean :75.53 Mean : 9.491
3rd Qu.:52.14 3rd Qu.:86.48 3rd Qu.:12.300
Max. :85.05 Max. :99.99 Max. :23.800
X4 Y1 Y2
Min. : 0.000 Min. : 9.00 Min. : 10.0
1st Qu.: 1.120 1st Qu.: 24.00 1st Qu.: 66.0
Median : 4.960 Median : 30.00 Median : 104.0
Mean : 8.613 Mean : 41.12 Mean : 246.4
3rd Qu.:12.130 3rd Qu.: 47.00 3rd Qu.: 180.0
Max. :35.560 Max. :172.00 Max. :3750.0
> giziburuk <- wsn[, 1:4]
> fakes <- wsn[, 5:6]
> ggpairs(giziburuk)

> ggpairs(fakes)
> # correlations
> matcor(giziburuk, fakes)
$Xcor
X1 X2 X3 X4
X1 1.000000000 -0.10548606 0.002739422 0.17882667
X2 -0.105486065 1.00000000 -0.277427760 -0.09963742
X3 0.002739422 -0.27742776 1.000000000 0.18651784
X4 0.178826672 -0.09963742 0.186517837 1.00000000

$Ycor
Y1 Y2
Y1 1.0000000 0.8176566
Y2 0.8176566 1.0000000

$XYcor
X1 X2 X3 X4
X1 1.000000000 -0.10548606 0.002739422 0.17882667
X2 -0.105486065 1.00000000 -0.277427760 -0.09963742
X3 0.002739422 -0.27742776 1.000000000 0.18651784
X4 0.178826672 -0.09963742 0.186517837 1.00000000
Y1 -0.110270007 -0.06403862 -0.125209280 -0.27702631
Y2 -0.100847152 0.12393370 -0.248899098 -0.23280596
Y1 Y2
X1 -0.11027001 -0.1008472
X2 -0.06403862 0.1239337
X3 -0.12520928 -0.2488991
X4 -0.27702631 -0.2328060
Y1 1.00000000 0.8176566
Y2 0.81765665 1.0000000

> cc1 <- cc(giziburuk, fakes)


>
> # display the canonical correlations
> cc1$cor
[1] 0.3590543 0.3164000
>
> # raw canonical coefficients
> cc1[3:4]
$xcoef
[,1] [,2]
X1 -0.002272846 0.01080968
X2 -0.037429280 0.01000656
X3 0.093722498 0.10206597
X4 -0.031550675 0.07831101

$ycoef
[,1] [,2]
Y1 0.053534352 -0.0214308177
Y2 -0.002601105 -0.0006164063

> # compute canonical loadings


> cc2 <- comput(giziburuk, fakes, cc1)
>
> # display canonical loadings
> cc2[3:6]
$corr.X.xscores
[,1] [,2]
X1 -0.02052392 0.35264756
X2 -0.87100650 -0.02623309
X3 0.60930968 0.57055033
X4 -0.14828625 0.85992851

$corr.Y.xscores
[,1] [,2]
Y1 0.08279512 -0.3078732
Y2 -0.13344109 -0.2937377

$corr.X.yscores
[,1] [,2]
X1 -0.007369204 0.111577690
X2 -0.312738658 -0.008300149
X3 0.218775282 0.180522131
X4 -0.053242822 0.272081390
$corr.Y.yscores
[,1] [,2]
Y1 0.2305922 -0.9730505
Y2 -0.3716460 -0.9283745

> # tests of canonical dimensions


> ev <- (1 - cc1$cor^2)
>
> n <- dim(giziburuk)[1]
> p <- length(giziburuk)
> q <- length(fakes)
> k <- min(p, q)
> m <- n - 3/2 - (p + q)/2
>
> w <- rev(cumprod(rev(ev)))
>
> # initialize
> d1 <- d2 <- f <- vector("numeric", k)
>
> for (i in 1:k) {
+ s <- sqrt((p^2 * q^2 - 4)/(p^2 + q^2 - 5))
+ si <- 1/s
+ d1[i] <- p * q
+ d2[i] <- m * s - p * q/2 + 1
+ r <- (1 - w[i]^si)/w[i]^si
+ f[i] <- r * d2[i]/d1[i]
+ p <- p - 1
+ q <- q - 1
+}
>
> pv <- pf(f, d1, d2, lower.tail = FALSE)
> (dmat <- cbind(WilksL = w, F = f, df1 = d1, df2 = d2, p = pv))
WilksL F df1 df2 p
[1,] 0.7838771 0.8739457 8 54 0.5441183-02
[2,] 0.8998910 1.0382928 3 28 0.3908562
> # standardized gizi buruk canonical coefficients diagonal matrix of gizi buruk sd's
> s1 <- diag(sqrt(diag(cov(giziburuk))))
> s1 %*% cc1$xcoef
[,1] [,2]
[1,] -0.05042494 0.2398215
[2,] -0.78183085 0.2090192
[3,] 0.44866045 0.4886016
[4,] -0.30085172 0.7467352
> # standardized fasilitas kesehatan canonical coefficients diagonal matrix of fasilitas kesehatan sd's
> s2 <- diag(sqrt(diag(cov(fakes))))
> s2 %*% cc1$ycoef
[,1] [,2]
[1,] 1.612584 -0.6455480
[2,] -1.690186 -0.4005379
>

Anda mungkin juga menyukai