MULTIVARIAT Analisis Korelasi Kanonik
MULTIVARIAT Analisis Korelasi Kanonik
PENDAHULUAN
1. 1 Latar Belakang
kumpulan antara dua himpunan dari variabel. Analisis korelasi kanonik fokus pada
korelasi antara sebuah kombinasi linear dari variabel dalam satu himpunan dan
kombinasi linear dari variabel dalam himpunan lainnya. Ide pertama adalah untuk
menentukan bagian dari kombinasi linear yang memiliki korelasi terbesar. Berikutnya,
kita menentukan bagian dari kombinasi linear yang memiliki korelasi terbesar diantara
semua bagian yang tidak berkorelasi dengan bagian yang dipilih di awal. Proses
berlanjut. Bagian dari kombinasi linear dinamakan variabel kanonik, dan korelasi yang
sekelompok variabel kemampuan, hubungan antara indeks harga dan indeks produksi.
Disamping hubungan fungsional yang dinyatakan dengan persamaan regresi, ada juga
yang perlu dipersoalkan yaitu ukuran kuat lemahnya antara dua kelompok variabel.
peramal dan sekelompok variabel tanggapan dikenal sebagai Analisis Korelasi Kanonik.
Korelasi kanonik mengukur kekuatan kumpulan antara dua himpunan dari variabel.
Aspek terbesar dari suatu teknik merepresentasikan sebuah percobaan ke sebuah intisari
yang berdimensi tinggi dengan hubungan antara dua himpunan dari variabel ke dalam
peramal yang dipandang dapat paling baik menjelaskan variasi dan variabel-variabel
tanggapan. Sedangkan pada Analisis Korelasi Kanonik dicari kombinasi linear dari
bersifat bahwa koefisien korelasi momen hasil kali antara kedua kombinasi linear itu
mencapai nilai maksimum. Koefisien korelasi yang maksimum itu disebut koefisien
korelasi kanonik antara kedua kelompok variabel tersebut dan koefisien-koefisien dari
bobot-bobot kanonis.
Dalam makalah ini penulis mencoba untuk mengambil satu kasus sehingga judul
Setiap kegiatan yang dilakukan oleh individu dan kelompok tidak terlepas dari
tujuan yang hendak dicapai. Demikian pula dengan penulisan makalah ini, dimana
penulisan makalah ini bertujuan untuk lebih memahami cara penentuan pasangan variasi
berikut:
BAB I : PENDAHULUAN
kanonik sampel.
BAB IV : KESIMPULAN
Kita akan tertarik dalam mengukur dari kumpulan antara dua kelompok variabel.
Kelompok pertama dari p variabel diwakili oleh (p x 1) vektor acak X (1). Kelompok
kedua dari q variabel diwakili oleh (q x 1) vektor acak X (2). Kita asumsi, dalam
pengembangan teoritis, bahwa X(1) mewakili himpunan yang lebih kecil, sehingga p q.
Vektor acaknya :
X 11
1
X2
X 1 X p1
X 2 2 (2-2)
(( p q ) x1)
X X1
2
X1
X q 2
Vektor rata-ratanya :
E X
E X 1 1
2 2
p q x1
E X
(2-3)
variabel dari X(1), satu variabel dari X(2) yang termuat di S12 atau ekuivalen di S 21 . pq
elemen dari S12 mengukur kumpulan antara dua himpunan. Ketika p dan q relatif besar,
menginterpretasikan elemen dari S12 secara bersamaan biasanya adalah percuma. Selain
itu, sering bahwa kombinasi linear dari variabel itu menarik dan berguna untuk
memprediksi atau membandingkan tujuan. Tugas pokok dari analisis korelasi kanonik
adalah meringkaskan kumpulan antara himpunan X(1) dan X(2) dalam syarat-syarat yang
variabel. Himpunan
U a ' X 1
dan (2-5)
2
V b' X
Untuk beberapa bagian dari koefisien vektor a dan b. Dengan menggunakan (2-5) dan
Z E Z E CX C X
Z Cov Z Cov CX C X C '
Sehingga,
a ' 12 b
Corr U , V (2-7)
a ' 11 a b' 22 b
Definisi:
Bagian pertama pasangan dari variabel kanonik adalah bagian dari kombinasi
linear U1, V1 yang mempunyai unit variansi, yang memaksimalkan korelasi (2-7);
Bagian kedua dari variabel kanonik adalah bagian dari kombinasi linear U2, V2 yang
pilihan yang tidak berkorelasi dengan bagian pertama dari variabel kanonik.
Bagian ke-k pasangan dari variabel kanonik adalah bagian dari kombinasi linear Uk,
semua pilihan yang tidak berkorelasi dengan bagian k-1 sebelumnya dari pasangan
variabel kanonik.
Korelasi antara bagian ke-k dari variabel kanonik dinamakan korelasi kanonik ke-k.
Akibat 2.1. Misalkan p q dan vektor acak X(1) dan X(2) mempunyai,
U 1 e1' 11
1 / 2
X 1 dan V1 f 1' 221 / 2 X 2 ,
vektor eigen (q x 1), f1,f2, ..., fp. Tiap fi adalah proporsi untuk
1 / 2
11
12
1
22 21
1 / 2
11 ei ). Variasi kanonik mempunyai sifat sebagai berikut:
untuk k, l = 1, 2, ..., p.
Z 2 Z1 2 , Z 2 2 ,..., Z q 2 maka variabel kanonik berbentuk:
'
dan 1 2 ... p adalah vektor eigen tak nol dari matriks 111 / 2 12 22 21 111 / 2
2 2 2 1
Variabel kanonik secara umumnya artifisal. Jika variabel awal X(1) dan X(2)
digunakan, koefisien kanonik a dan b mempunyai unit proporsi dari himpunan X (1) dan
X(2). Jika variabel awal yang distandardisasikan mempunyai rata-rata nol dan unit
varians, maka koefisien kanonik tidak mempunyai unit dari pengukuran, dan pasti
bentuk variabel pokok. Identifikasi sering dibantu dengan menghitung korelasi antara
Misalkan A = [a1, a2, ..., ap]’ dan B = [b1, b2, ..., bp]’, sehingga vektor dari
(2-11)
Cov U , X 1 oleh var X k 1 kk
1/ 2
. Secara ekuivalen,
Corr U i , X k 1 Cov (U i , kk1 / 2 X k 1 .
bentuk matriks,
pxp
U , X 1 A 11 V111 / 2 , U , X 1 B 22 V221 / 2 ,
pxp qxq
(2-12)
U , X 1 A 12 V 1 / 2
22 , U , X 1 B 21V111 / 2 ,
pxq qxp
menghitung korelasi.
U ,Z 1 AZ 11 V ,Z 2 BZ 22
(2-13)
U ,Z 2 AZ 12 V ,Z 1 BZ 21
dimana A Z dan B Z adalah matriks yang barisnya memuat koefisien kanonik untuk
pxp qxq
himpunan Z(1) dan Z(2) secara berurut. Korelasi pada matriks yang ditunjukkan (2-13)
Ketika X(1) dan X(2) masing-masing terdiri dari variabel tunggal, sehingga p = q = 1,
Corr 1 1 , 12 Corr a 1 1 , b 12 untuk semua a, b. Oleh karena itu variasi kanonik
memiliki komponen lebih, kondisi a ' 0,...,0,1,0,...,0 dengan 1 pada posisi ke-i dan
Corr i 1 , 2k Corr a ' 1 1 , b' 12 max Corr a ' 1 1 , b' 12 1
a ,b
(2-14)
yaitu bahwa korelasi kanonik yang pertama lebih besar dari harga mutlak semua elemen
16)
yaitu bahwa korelasi kanonik juga merupakan perkalian koefisien korelasi dari Uk
kuadrat, k , adalah sebanding dengan varians dari variasi kanonik Uk yang dijelaskan
2
oleh himpunan X(2) dan juga sebanding dengan varians dari variasi kanonik Vk yang
dijelaskan oleh himpunan X(1). Oleh karena itu, k seringkali dinamakan varians
2
bersama antara dua himpunan X(1) dan X(2). Untuk nilai yang semakin besar, k ,
2
kadang-kadang dianggap sebagai ukuran dari himpunan yang overlap (tumpang tindih).
dimana (Ui, Vi) memiliki korelasi nol dengan pasangan (Ui, Vi), (U2, V2), ..., (Ui-1, Vi-1).
Korelasi antara himpunan X(1) dan X(2) telah dimasukkan kedalam pasangan variabel
kanonik.
tidak perlu menampilkan variabel penaksir himpunan bagian dari kovarian 11 dan
kesimpulan yang kecil dari variabilitas dalam 11 dan 22 , maka tidaklah jelas
U AX 1
komponen utama yang berasal dari X(1) saja. Matriks A11 / 2 P1' 1 memiliki ke-i baris
1
Pi ' 1 , yang komponen utama ke-i nya ditetapkan memiliki varians I. Yaitu
i
Cov A11 / 2 P1' 1 A11 / 2 P1' 11 P1 A11 / 2 A11 / 2 P1' P1 A1 P1' P1 A11 / 2 A11 / 2 A1 A11 / 2 1
x 1 1 1 n
2 1 n 2
x 2 dimana x
p q x1
x n
x
j 1
j
1
dan x xj
n j 1
(2-18)
S kl
1 n k
j
n 1 j 1
x x
k
x
l
j x
l '
, k,l = 1, 2 (2-19)
' '
Kombinasi linear U a x 1 , V b x 2 (2-20)
'
a S12 b
memiliki korelasi sampel r (2-21)
U ,V ' '
a S12 a b S12 b
Pasangan pertama dari variasi kanonik sampel dalam kombinasi linear U 1 dan
V 1 memiliki unit varian sampel yang memaksimumkan rasio (2-21). Pada umumnya,
ke-k pasangan variasi kanonik sampel adalah pasangan dari kombinasi linear U k dan
Vk yang memiliki unit varian sampel yang memaksimumkan (2-21) diantara
kombinasi linear yang tidak berkorelasi dengan k-1 variasi kanonik sampel yang
sebelumnya.
Korelasi sampel antara U k dan V k dinamakan korelasi kanonik sampel.
Variasi sampel kanonik dan korelasi kanonik sampel dapat diperoleh dari matriks
kovarian sampel S11, S12 = S21’, dan S22 dengan cara yang bersesuaian dengan persoalan
S111 / 2 S12 S 22
1
S 21 S111 / 2 vektor eigen yang berkoresponden dengan e1, e 2 ,...,e p dimana
S kl didefinisikan pada (2-19) dan p q. Misalkan f 1 , f 2 ,...., f q
menjadi vektor
1 / 2
eigen dari S 22 S 21 S111 S12 S 22
1 / 2
dimana p yang pertama f 's diperoleh dari
1 1 / 2 1 / 2
f k S 22 S 21 S11 S e k , k 1,2,..., p. Pasangan variasi kanonik sampel ke-k
k
'
U e S 1 / 2 x 1 dan V k f k' S 22
1 / 2 2
x
adalah k k 11 dimana x(1) dan x(2) adalah nilai variabel
' '
ak bk
dari X(1) dan X(2) untuk unit ekperimen khusus. Variasi kanonik sampel pertama
mempunyai korelasi sampel maksimum r 1 . Untuk pasangan ke-k r k
U 1 ,V 1 U k ,V k
dan korelasi ini merupakan kemungkinan terbesar diantara kombinasi linear yang tidak
berkorelasi dengan k-1 variasi kanonik sampel sebelumnya. Jumlah 1 , 2 ,..., p
adalah korelasi kanonik sampel. Jika p rank S12 p1 , maka korelasi kanonik sampel
tak nol adalah 1 , 2 ,..., p1 .
Z 1 z j1
Z 2 z1 , z 2 ,..., z n dengan z j 2 dan variasi kanonik sampel menjadi :
Z z j
U A z z 1 ; V B z z 2 (2-22)
px1 qx1
dimana A z A D111 / 2 dan B z B D22
1/ 2
. Korelasi kanonik sampel tidak efektif dengan
dalam bagian variasi kanonik dan korelasinya. Ini berguna untuk mendapatkan ukuran
masing himpunan. Dan juga berguna ketika menghitung proporsi varian dalam suatu
himpunan variabel yang dijelaskan oleh variasi kanonik dari himpunan lain.
^ i ^ ^
^ 1 ^ 1
1
U Ax
dan menotasikan ke-i kolom dari dan berturut-turut. Karena dan
b A B
^ ^
2 maka,
V Bx
1 1
1 2
x A U ; x B V (2-23)
px1 pxp px1 qx1 qxq qx1
^ ^ ^' ^ ^ ^'
^^ ^ ^
Karena sampel CovU,V AS12 B , sampel
CovU SA 1 A I dan sampel
CovV B S2 B I
pxp qxq
1 0 0
1 1 1 ' 2 2 ' p p'
2 0 0 B a b a b ... a b
1
S12 A 0 1 2 p (2-24)
0 0 p
'
1 1 2 2 p p
' ' '
1 1
S11
A A a
a a a ... a a
'
1 1 2 2 p p
' ' '
1 1
S 22
B
B b b b b ... b b
1
A memuat kovarian sampel dari r variasi kanonik pertama U 1 , U 2 ,..., U r dengan
1 1 1 1
variabel komponennya X 1 , X 2 ,..., X p . Demikian pula r kolom pertama dari B
memuat kovarian sampel V 1 , V 2 ,..., V r dengan variabel komponennya. Jika pasangan r
U 1 V1
1 1 2 r 2 1 2 r
x a a a U 2 dan x b b b V2 (2-25)
U r Vr
1 1 ' 2 2
'
r r
'
r 1 r 1
'
q q
'
1 1 ' 2 2
'
r r
'
r 1 r 1 ' p p
'
S 12 1 a b 2 a b ... r a b
r 1 a b ... p a b
dari gambaran seberapa baik r variasi kanonik sampel yang pertama menghasilkan
matriks kovarian sampel. Pola entry yang terbesar dalam baris atau kolom dari
penaksiran matriks kesalahan menandakan hal yang kurang baik terhadap variabel
koresponding.
elemen dari S12 = S’12 daripada elemen dari S11 atau S22. Secara matematis, ini terjadi
karena matriks sisa pada persoalan yang lalu secara langsung berhubungan dengan p – r
korelasi sampel kanonik terkecil. Korelasi ini biasanya tertutup terhadap nol. Disisi lain,
matriks sisa bersesuaian dengan penaksiran matriks S11 dan S22 hanya bergantung pada p
– r yang sebelumnya dan q – r vektor koefisien. Elemen-elemen dalam vektor ini relatif
besar, dan karena itu matriks sisa memiliki entry yang besar.
korelasi Rkl. Vektor koefisien kanonik merupakan baris dari matriks A z dan B z serta
1 1
kolom A z
dan B z
yang merupakan korelasi sampel antara variasi kanonik dan
1 1
sampel Cov z 1 , U sampel Cov
A z U ,U
AZ
dan
1 1
sampel Cov z 2 , V sampel Cov
B z V ,V
BZ
r 1 r r
U 2 , x1 1 U p , x1 1
U 1,x1
1
1 2 p
rU 1,x 1 r
U 2 , x2 1
r
U p , x2 1
AZ a z , a z ,..., a z 2
r r r
U 1,xp1 U 2 , xp1 U p , xp1
dimana rU
i,x
1
k
dan r
V i , x k 2 adalah koefisien korelasi sampel antara elemen yang ditulis.
1 1 ' 2 2
'
p p
'
tr R11 tr a z a z a z a z ... a z a z p
1 1 ' 2 2
'
q q
'
1 1
Karena korelasi dalam r < p kolom pertama dari A z
dan B z
hanya melibatkan
variasi kanonik sampel U 1 ,U 2 ,..., U r dan V 1 , V 2 ,..., V r berturut-turur, kita
definisikan kontribusi dari r variasi kanonik yang pertama terhadap total varians sampel
1 1 ' 2 2 ' p p
' r p
1 1 ' 2 2 ' q q
'
r p
tr R 22 tr b z b z b z b z ... b z b z r 2
.
2
i 1 k 1 V i , xk
Proporsi dari total varian sampel standar dijelaskan dengan r variasi kanonik yang
pertama menjadi:
i1 k 1 k
tr R22 q
(2-29)
1 1 1 r r
' '
tr R11 a z a z ... a z a z 1 R2
p
z 1 U 1 ,U 2 ,...,U r
1 1 1 r r
' '
tr R22 b z b z ... b z b z 1 R 2 2
q
z V 1 ,V 2 ,...,V r
Ketika ∑12 = 0 maka a’X(1) dan b’X(2) memiliki kovarians a’∑12b = 0 untuk
semua vektor a dan b. Akibatnya semua korelasi kanonik haruslah nol sehingga analisis
kanonik tidak diteruskan lagi. Hasil selanjutnya memberikan cara untuk menguji ∑ 12 = 0
X j1
Misalkan: j 2 , j 1,2,..., n merupakan sampel acak dari populasi N(p+q)(μ, ∑)
X
X j
11
pxp 12
pxq
dengan
21 22
qxp qxq
S11 S 22 p
2
yang besar dari 2 ln n ln n ln 1 - i (2-30) dimana
S
i 1
BAB III
Dalam sebuah sekolah dasar terdapat beberapa siswa yang diukur kemampuan
X 2 1 Kekuatan Membaca
X 1 2 Kecepatan Berhitung
8,00 2,00
i) R11
2,00 5,00
ii) R11 I 0
8,00 2,00 1 0
2,00 0
5,00 0 1
8,00 2,00
0
2,00 5,00
8,00 5,00 2,00 2 0
13,00 36,00 0
2
0,89
Jadi, e1
0,45
Untuk 2 4,00
k
iv) R111 / 2 i ei ei'
i 1
k
1
R111 / 2 ei ei'
i 1 i
1 1
e1e1' e2 e2'
1 2
1 0,89 1 0,45
0,45 0,89 0,45 0,45 0,89
9 4 0,89
0,26 0,13 0,10 0,20 0,36 0,07
0,13 0,07 0,20 0,40 0,07 0,47
6,00 2,00
R22
2,00 7,00
2 2
Nilai eigen 1 dan 2 diperoleh dari:
0,26 0,04 1 0
0,04 0,28 0 1 0
0,26 0,04
0 0,26 0,28 0,04 2 0
0,04 0,28
2 0,54 0,07 0
Jadi,
2
1 1 0,32 1 0,57
2
2 2 0,22 2 0,46
Pasangan variasi kanonik U 1 ,V 1
dan U 2 ,V
2
adalah sebagai berikut:
Diketahui 1 0,57 dan vektor eigen e1 nya yaitu :
0,13
Jadi, e1
0,99
1 / 2
f1 R22 R21 R111 / 2 e1 dan b1 R22
1 / 2
f 1 , maka
1
0,18 0,05 3 1 0,12
b1 R22 R21 a 1
0,05 0,16 1 3 0,47
0,59 0,03 0,12 0,08
0,31 0,43 0,47 0,16
' 2 '
Var V 1 Var
b1 z
b 1 R22 b 1 1
6,00 2,00 0,08 0,08
0,08 0,16 0,80 1,28 0,27
2, 00 7,00
0,16 0,16
pasangan variasi kanonik sampel pertama yaitu U 1 ,V 1
sebagai berikut:
'
U 1 a 1 z 1 0,12 z1 1 0,47 z 2 1
1 0,57 , '
V 1 b1 z 2 0,15 z1 2 0,31z 2 2
Diketahui 2 0,46 dan vektor eigen e2 nya yaitu :
0,20
Jadi, e2
0,98
1 / 2
f 2 R22 R21 R111 / 2 e2 dan b 2 R22
1 / 2
f 2 , maka
1
0,18 0,05 3 1 0,14
b 2 R22 R21 a 2
0,05 0,16 1 3 0,47
0,59 0,03 0,14 0,10
0,31 0,43 0,47 0,16
' 2 '
Var V 2 Var
b2 z
b 2 R22 b 2 1
6,00 2,00 0,10 0,10
0,10 0,16 0,92 1,32 0,57
2,00 7,00
0,16 0,16
pasangan variasi kanonik kedua yaitu U 2 ,V
2
sebagai berikut:
1
1 0,12 0,47 3,85 3,85
sampel Cov z 1 , U A z
0,14 0,47 1,17 1
dan 1
1
0,15 0,31 23,86 35,23
sampel Cov z 2 , V B
z 0,13 0,21 14,77 17,05
1 1 ' r r
'
tr a z a z ... a z a z
r p
r 2
1
2 i 1 k 1 U i , z k
R dan proporsi dari total
tr R11
z 1 U 1 ,U 2 ,...,U r p
1
4
3,85 2 3,85 2 1,17 2 1 2 8,00
varian sampel standar yang kedua adalah :
tr b z b z ... b z b z
r q
r
2
1
2 i 1 k 1 V i , z k
R 2 . Sehingga terlihat
tr R22
z V 1 ,V 2 ,...,V r q
1
4
23,86 2 35,23 2 14,77 2 17,05 2 581,54
Test signifikansi dari relasi kanonik kemampuan membaca dan berhitung siswa.
berhitung siswa.
siswa.
H0 ditolak jika 1 2 0 , karena 1 0,57 dan 2 0,46 , dua korelasi
kanonik 1 dan 2 terlihat nonzero, atau dengan kata lain 1 0dan 2 0 ,
jadi H0 diterima.
BAB IV
KESIMPULAN
4.1 Kesimpulan
pasangan variasi kanonik yaitu korelasi kanonik 1 0,57 dengan pasangan
R 2 1 8,00
Proporsi dari total varian sampel standar z
U 1 ,U 2 ,...,U r dan
R 2 2 581,54
z
V 1 ,V 2 ,...,V r , sehingga Sehingga terlihat bahwa proporsi dari total
varian sampel standar yang kedua lebih baik dari proporsi dari total varian
H0 diterima karena 1 0,57 dan 2 0,46 , dua korelasi kanonik 1 dan 2
terlihat nonzero yang artinya tidak ada hubungan antara kemampuan membaca