Anda di halaman 1dari 39

ANALISIS KORELASI KANONIK

Oleh kelompok 9:
Ismail jauhari (1006469)
Afiefah Rahmah (0905715)
Pendahuluan
Analisis korelasi kanonik ditemukan untuk mengidentifikasi dan
mengukur kumpulan antara dua himpunan dari variabel. Analisis
korelasi kanonik fokus pada korelasi antara sebuah kombinasi
linear dari variabel dalam satu himpunan dan kombinasi linear dari
variabel dalam himpunan lainnya. Ide pertama adalah untuk
menentukan pasangan dari kombinasi linear yang memiliki
korelasi terbesar.
Berikutnya, kita menentukan pasangan dari kombinasi linear yang
memiliki korelasi terbesar diantara semua pasangan yang tidak
berkorelasi dengan pasangan yang dipilih di awal. Proses
berlanjut. Pasangan dari kombinasi linear dinamakan variabel
kanonik, dan korelasinya dinamakan korelasi kanonik.
Variabel Kanonik dan Korelasi Kanonik
dalam mengukur hubungan antara dua kelompok variabel.
Kelompok pertama dari p variabel diwakili oleh (p x 1) vektor
acak X
(1)
. Kelompok kedua dari q variabel diwakili oleh (q x
1) vektor acak X
(2)
.
dalam pengembangan teoritis, bahwa X
(1)
mewakili himpunan
yang lebih kecil, sehingga p q.
Misalkan untuk vektor acak X
(1)
dan X
(2)
:






Kovarian antara pasangan variabel-variabel dari himpunan
berbeda yaitu satu variabel dari X
(1)
, satu variabel dari X
(2)
yang termuat di
12
atau ekuivalen di
21
. ini menunjukan pq
elemen dari
12
mengukur kumpulan antara dua himpunan.
ketika p dan q relatif besar, menginterpreatsikan elemen dari

12
secara bersamaan biasanya percuma.
Tugas pokok dari analisis korelasi kanonik adalah
meringkaskan kumpulan antara himpunan X
(1)
dan X
(2)

dimanana sedikit berhati-hati dalam memilih kovarian (atau
korelasi) dari kovarian pq di
12
. Kombinasi linear
menyediakan ringkasan sederhana mengukur suatu himpunan
dari variabel. Himpunan
dan (10-5)
Untuk beberapa bagian dari koefisien vektor a dan b. Dengan
menggunakan (10-5) dan kombinasi linear Z = CX dimana,









) 1 (
' X a U =
) 2 (
' X b V =
x
C CX E Z E
z
= = = ) ( ) (

= = =
x z
C C CX Cov Z Cov ' ) ( ) (
Sehingga,

(10-6)

Kemudian dapat dicari koefisien vektor a dan b sedemikian
sehingga,
(10-7)
sebisa mungkin bernilai besar.
Definisi :
Bagian pertama pasangan dari variabel kanonik adalah bagian
dari kombinasi linear yang mempunyai unit variansi,
yang memaksimalkan korelasi (10-7);
Bagian kedua dari variabel kanonik adalah bagian dari
kombinasi linear yang mempunyai unit variansi, yang
memaksimalkan korelasi (10-7) diantara semua pilihan yang
tidak berkorelasi dengan bagian pertama dari variabel kanonik.

= =
11
) 1 (
' ) ( ' ) ( a a a X Cov a U Var

= =
22
) 1 (
' ) ( ' ) ( b b b X Cov b V Var

= =
12
) 2 ( ) 1 (
' ) , ( ' ) , ( b a b X X Cov a V U Cov


=
22 11
12
' '
'
) , (
b b a a
b a
V U Corr
1 1
,V U
2 2
,V U
Pada langkah ke-k :
Bagian ke-k pasangan dari variabel kanonik adalah bagian
dari kombinasi linear yang mempunyai unit variansi,
yang memaksimalkan korelasi (10-7) diantara semua
pilihan yang tidak berkorelasi dengan bagian k-1
sebelumnya dari pasangan variabel kanonik.
Korelasi antara bagian ke-k dari variabel kanonik dinamakan
korelasi kanonik ke-k.

Akibat 10.1 Misalkan p q dan vektor acak X
(1)
dan X
(2)
mempunyai dan
dimana mempunyai rank
lengkap. Untuk koefisien vector dan , bentuk kombinasi
linear U = aX(1) dan V = bX(2). Maka
Diperoleh dengan kombinasi linear (variabel kanonik bag pertama)
dan



k k
V U ,

= =
) ( ) (
22
) 2 (
11
) 1 (
) ( . ) (
pxp qxq
X Cov X Cov

=
) (
12
) 2 ( ) 1 (
) , (
pxq
X X Cov
a
px ) 1 (
b
qx ) 1 (
*
1 ,
) , ( = V U Corr Max
b a

=
2 / 1
11
) 1 (
1 1
X e U

=
2 / 1
22
) 2 (
1 1
X f V
Pasangan ke-k dari variabel kanonik, k = 2,3,.,p,
dan memaksimumkan diantara
kombinasi linear yang tidak berkorelasi dengan variabel kanonik
1,2,,k-1 sebelumnya.
adalah nilai eigen dari
dan adalah vektor eigen (p x 1). (Jumlah
juga nilai eigen p paling besar dari matriks
yang bersesuaian dengan vektor eigen (q x 1), f
1
,f
2
,,f
p
. Tiap f
1
adalah proporsi untuk ). Variasi kanonik
mempunyai sifat sebagai berikut:





untuk k,l = 1,2,.,p.

=
2 / 1
11
) 1 (
X e U
k k

=
2 / 1
22
) 2 (
X f V
k k
*
) , (
k k k
V U Corr =
2 * 2 *
2
2 *
1
...
p
> > >
2 / 1
11 21
1
22 12
2 / 1
11


p
e e e ,..., ,
2 1
2 / 1
22 12
1
11 21
2 / 1
22


i
e
2 / 1
22 12
1
11 21
2 / 1
22


2 * 2 *
2
2 *
1
,...., ,
p

Jika variabel awal distandardisasikan dengan
dan maka variabel kanonik berbentuk :

(10-8)
Disini dan e
k

dan f
k
adalah vektor-vektor eigen dari dan
secara berurut.
Korelasi kanonik memenuhi,
, dimana k = 1,2,.,p (10-9)
dan adalah vektor eigen tak nol dari matriks
atau matriks .
| |
) 1 ( ) 1 (
2
) 1 (
1
) 1 (
,...., ,
p
Z Z Z Z =
| |
) 2 ( ) 2 (
2
) 2 (
1
) 2 (
,...., ,
p
Z Z Z Z =
21 12
) 2 ( ) 1 (
22
) 2 (
11
) 1 (
) , ( , ) ( , ) ( = = = = Z Z Cov Z Cov Z Cov
2 / 1
11 21
1
22 12
2 / 1
11


2 / 1
22 12
1
11 21
2 / 1
22


*
k

*
) , (
k k k
V U Corr =
2 * 2 *
2
2 *
1
...
p
> > >
2 / 1
11 21
1
22 12
2 / 1
11


2 / 1
22 12
1
11 21
2 / 1
22


Menginterpretasikan Populasi Variabel
Kanonik
Variabel kanonik secara umumnya, artifisal. Jika
variabel awal X
(1)
dan X
(2)
digunakan, koefisien
kanonik a dan b mempunyai unit proporsi dari
himpunan X
(1)
dan X
(2)
. Jika variabel awal yang
distandardisasikan mempunyai rata-rata nol dan
unit varians, maka koefisien kanonik tidak
mempunyai unit dari pengukuran, dan pasti
diinterpretasikan ke dalam bentuk variabel yang
distandarkan.
Mengidentifikasi variabel kanonik
Walaupun variabel kanonik artifisal, variabel kanonik dapat
diidentifikasi dalam bentuk variabel pokok. Identifikasi sering
dibantu dengan menghitung korelasi antara variabel kanonik dan
variabel awal.
Misalkan A = [a
1
,a
2
,,a
p
] dan B = [b
1
,b
2
,,b
p
], sehingga
vektor dari variabel kanonik adalah
dan (2-10)
Dimana kita awalnya tertarik di variabel kanonik pertama p di V.
maka,
(2-11)

) 1 (
) 1 (
AX U
px
=
) 2 (
) 1 (
BX V
qx
=
11
) 1 ( ) 1 ( ) 1 (
) , ( ) , ( = = A X AX Cov X U Cov
Karena diperoleh dengan membagi
oleh . Secara ekuivalen,
Dengan mengenalkan matriks diagonal(p x p) dimana
elemen diagonal ke-k dalam bentuk matriks,

Perhitungan yang sama untuk bagian dan
menghasilkan

(2-12)

dimana adalah matriks diagonal (q x q) dengan elemen ke-i
.
) , ( , 1 ) (
) 1 (
1 1 k
X U Corr U Var = ) , (
) 1 (
X U Cov
2 / 1 ) 1 (
) var(
kk k
X o =
) , ( ) , (
) 1 ( 2 / 1
1
) 1 (
1 k kk k
X U Cov X U Corr

= o
2 / 1
11

V
2 / 1
kk
o
) , ( ), , (
) 2 ( ) 2 (
X V X U ) , (
) 1 (
X V
2 / 1
22

V
) var(
) 2 (
i
X
Variabel kanonik diturunkan dari variabel standard
diinterpretasikan dengan menghitung korelasi.

(2-13)
dimana dan adalah matriks yang barisnya memuat
koefisien kanonik untuk himpunan Z
(1)
dan Z
(2)
secara
berurut. Korelasi pada matriks yang ditunjukkan (2-13)
mempunyai nilai numerik sama dengan yang dimunculkan
(2-12), yakni dan seterusnya. Mengikuti ini,
korelasi
tidak dipengaruhi oleh standaridisasi


) ( pxp
z
A
) ( qxq
z
B
) 1 ( ) 1 (
, , Z U X U
=
Korelasi Kanonik Sebagai Perluasan Dari Koefisien Korelasi
Lainnya
Pertama-tama, koefisien korelasi menyamaratakan korelasi antara dua variabel.
Ketika X
(1)
dan X
(2)
masing-masing terdiri dari variabel tunggal, sehingga p=q=1
untuk setiap a,b

Oleh karena itu variasi kanonik dan memiliki korelasi
. Dimana, X
(1)
dan X
(2)
memiliki komponen lebih, dengan kondisi
dengan 1 pada posisi ke-i dan dengan 1 pada posisi
ke-k.


yaitu bahwa korelasi kanonik yang pertama lebih besar dari harga mutlak semua
elemen dalam


kedua, perkalian koefisien korelasi adalah persoalan
khusus dari korelasi kanonik ketika X
(1)
memiliki elemen
tunggal . ,menimbulkan
(10-22)

Ketika p >1, lebih besar dari setiap perkalian korelasi
dari dengan X
(2)
atau perkalian korelasi dengan X
(1)
.
Sehingga dapat ditulis

dengan k=1,2.p. (10-23)
dengan k=1,2.p. (10-24)
yaitu korelasi kanonik juga adalah perkalian koefisien korelasi dari
U
k
dengan X
(2)
atau perkalian koefisien korelasi dari V
k
dengan X
(1)
.
r Variabel Kanonik Pertama Sebagai Sebuah
Rinngkasan Dari Perubahan
Interpretasi Geometrik dari Analisis Korelasi
Kanonik Populasi
Variasi Kanonik Sampel dan Korelasi
Kanonik sampel
Sampel acak dari n observasi pada masing-masing variabel dari variabel X
(1),
X
(2)
yaitu (p + q) dapat digabungkan kedalam ((p + q) x n) data matriks



Dimana

Vektor rata-rata sampel nya adalah
dimana dan

Matriks Kovarian sampel
dimana



Kombinasi Linear dan
Memiliki sampel korelasi

.(10-29)



Pada umumnya, pasangan ke-k variasi
kanonik sampel adalah pasangan dari
kombinasi linear yang memiliki unit
varian sampel yang memaksimumkan (10-29)
diantara kombinasi linear yang tidak
berkorelasi dengan k-1 variasi kanonik sampel
yang sebenarnya.
Korelasi sampel antara dinamakan
korelasi kanonik sampel. Variasi sampel
kanonik dan korelasi kanonik sampel dapat di
peroleh dari matriks kovarian sampel S
11
,S
12
=
S
21
dan S
22
dengan cara yang bersesuaian
dengan persoalan yang di bahas dalam 10.1
7)
CONTOH SOAL diambil dari Example 10.4
Diberikan matrix sampel korelasi
(
(
(
(
(

=
(
(
(

=
1 926 , 0
926 , 0 1
467 , 0 602 , 0
0422 569 , 0
. .......... .......... ..... ... ... .....
467 , 0 422 , 0
602 , 0 569 , 0
1 505 , 0
505 , 0 1
22 21
12 11

R R
R R
R
Kita peroleh dua himpunan korelasi kanonik dan variabel
.
.
=
1
*
1
631 , 0 U
) 2 ( ) 2 (
) 1 ( ) 1 (
2 1
2 1
944 , 0 060 , 0
345 , 0 781 , 0
z z
z z
+ =
+ =
.
1
V
.
.
=
2
*
2
631 , 0 U
) 2 ( ) 2 (
) 1 ( ) 1 (
2 1
2 1
475 , 2 648 , 2
106 , 1 856 , 0
z z
z z
+ =
+ =
.
2
V
Dimana adalah nilai data yang telah distandarirdisasi
untuk himpunan 1 dan 2 berturut-turut
2 , 1 , 2 , 1 ,
) 2 ( ) 1 (
= = i dan i
z z i i
(


=
(


=
(

.
0227 , 0 9997 , 0
3564 , 0 9394 , 0
6739 , 0 7388 , 0
2974 , 0 9548 , 0
106 , 1 856 . 0
345 , 0 781 , 0
1
1
1
z
z
B
A
Hasilnya, matriks error dari pendekatan dibuat dengan hanya menggunakan kanonikal
pertama
| | 227 , 0 3564 , 0
6739 , 0
2974 , 0
) 57 , 0 ( )
~
,
~
(
) 2 ( ) 1 (
12

(

= z z Cov sample R
(


=
001 , 0 014 , 0
000 , 0 006 , 0
| | 6739 , 0 2974 , 0
6739 , 0
2974 , 0
)
~
(
) 1 (
11

(

= z Cov sample R
(


=
454 , 0 200 , 0
200 , 0 088 , 0
| | 0227 , 0 3564 , 0
0227 , 0
3564 , 0
)
~
(
) 2 (
22

(

= z Cov sample R
(


=
001 , 0 008 , 0
008 , 0 127 , 0
Dimana
) 2 ( ) 1 (
~
,
~
z z
Diberikan dari (10-38)
dengan r=1 dan
) 1 ( ) 1 (
) 1 ( ) 1 (

,
an menggantik

,
b a
b a
z z
P
CONTOH SOAL diambil dari Example 10.5
Simak tabel karakteristik pekerjaan kepuasan dalam bekerja
Gunakan tabel koefisien sampel korelasi pada tabel tersebut, kita dapat
| |
| |

=
=
= + + + = =
= + + + = =
7
1
2 2 2 2
,

|
5
1
2 2 2 2
,

|
37 , 0 ) 50 , 0 ( ..... ) 65 , 0 ( ) 75 , 0 (
7
1
7
1
58 , 0 ) 85 , 0 ( ..... ) 74 , 0 ( ) 83 , 0 (
5
1
5
1
) 2 (
1 1
) 2 (
) 1 (
1 1
) 1 (
k
z V V z
k
z U U z
k
k
r R
r R
Dalam analisis kanonik kita menguji hipotesis dengan metode likelihood.
Ketika maka dan memiliki untuk semua
vektor a dan b. Akibatnya semua korelasi kanonikal bernilai nol dan tidak
ada titik dalam analisis korelasi kanonikal. Cara untuk menguji
untuk sampel besar.
0
12
=
) 1 (
' X a
) 2 (
' X b
0 '
12
= b a
0
12
=
Inti dari Korelasi Kanonik
Untuk mengetahui seberapa erat hubungan
antar dua variabel
Variabel variabel tersebut seajar artinya tidak
ada prediktor atau respon
Tujuan korelasi kanonik yaitu untuk
membentuk kombinasi linear (fungsi linear).
Kemudian akan dicari pasangan kombinasi
linear yang memiliki nilai korelasi yang
terbesar
Asumsi-asumsi Analisis Korelasi
Kanonik
Banyaknya variabel kanonik berskala interval
Uji multikolinearitas
Uji normalitas
Uji linearitas
Langkah-langkah Melakukan Analisis
Korelasi Kanonik
Uji asumsi-asumsi korelasi kanonik
matriks kovarian
Deteksi pencilan
Tentukan nilai eigen
Tentukan vektor eigen atau pembobot kanonik
Tentukan korelasi kanonik
Tentukan proporsi keragaman

Anda mungkin juga menyukai