Anda di halaman 1dari 38

ANALISIS PEUBAH GANDA

ANALISIS KOMPONEN UTAMA

Hazmira Yozza
Jurusan Matematika FMIPA Universitas Andalas

LOGO

www.themegallery.com

Analisis Komponen Utama


Suatu analisis statistika yang berguna untuk mereduksi p peubah menjadi r peubah
baru yang disebut Komponen Utama(r p) dengan tetap mempertahankan
besarnya keragaman dari peubah asal

Karl Pearson (1901)


 Memperkenalkan AKU
 Belum memberikan metode praktis perhitungan untuk kasus
dengan lebih dari dua peubah

Hotelling (1933)
 Memberikan metode perhitungan
praktis dalam menentukan KU
 Dalam prakteknya, masih
terbatas untuk sedikit peubah

Perkembangan Komputer
 Memungkinkan perhitungan untuk kasus banyak peubah

Company Logo

www.themegallery.com

Input Data
Dilakukan pengamatan/pengukuran p peubah (X1, X2, , Xp)
terhadap n objek pengamatan
Diperoleh data :
Objek

X1

X2

Xp

x11

x21

xp1

x12

x22

xp2

x13

x23

xp3

x1n

x2n

xpn

Company Logo

www.themegallery.com

X1, X2, , Xp

AKU

Y1, Y2, , Yr

1. Y1, Y2, , Yr adalah kombinasi linier dari peubah asal


Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX
:

Y=AX

Yr = ar1X1 + ar2 X2 + +arp Xp = arTX


2. Y1, Y2, , Yr tidak saling berkorelasi

corr (Yi , Y j ) = 0 cov(Yi , Y j ) = 0


3. Y1, Y2, , Yr tertata menurut pentingnya
Var(Y1) Var(Y2) Var(Yr) 0
diharapkan k KU pertama (k sekecil mungkin) sudah mampu menjelaskan
sebahagian besar keragaman data
Company Logo

www.themegallery.com

Catatan :
AKU tidak selalu berhasil dalam mereduksi
banyaknya peubah
AKU tidak bermanfaat bila peubah-peubah yang
dianalisis tidak saling berkorelasi. Dalam hal ini,
KU yang dihasilkan akan sama dengan peubah
asal, tapi terurut berdasarkan pentingnya peubah
tersebut (atau terurut berdasarkan keragamannya)
Hasil terbaik adalah jika terdapat korelasi yang
tinggi antar peubah Pembentukan matriks
korelasi mrp analisis pendahuluan pada AKU

Company Logo

www.themegallery.com

Pembentukan Komponen Utama Pertama


Peubah Asal
X = [X1, X2, , Xp]
dengan = Var(X) (matriks ragam peragam dari X)
Komponen Utama Pertama
Y1 = a11X1 + a12 X2 + +a1p Xp= a1TX

diinginkan Y1 dengan Var (Y1) maksimum


Var(Y1) = Var(a1TX) = a1T Var(X) a1= a1T a1
Kendala a1T a1 = 1
Company Logo

www.themegallery.com

Pembentukan Komponen Utama Pertama


Masalah : menentukan a sehingga diperoleh :
Max a1T a1
T

Max f(a1 )=a1 a1 (a1T a1 1)

Kendala a1T a1 = 1
Agar f maksimum, maka :
f
=0
a 1

dan

T
T
a1 a1 1(a1 a1 1) = 0

T
T
a1 a1 1(a1 a1 1) = 0
a1

a1T a1 + 1 = 0

2a1 21a1 + 0 = 0

a1T a1 = 1

2a1 = 21a1
( 1I)a1 = 0

f
=0

(2)

(1)
Company Logo

www.themegallery.com

Pembentukan Komponen Utama Pertama


Persamaan (1)
1 : akar karakteristik dari

( 1I)a1 = 0

a1 : vektor karakteristik
padanannya

Persamaan (1)

( 1I)a1 = 0
a1 = 1Ia1

(kalikan dengan a1T)

a1T a1 = a1T 1Ia1


= 1a1T a1

(dari (2) diketahui a1T a1 = 1 )

= 1
Fs yang akan
dimaksimumkan

Agar maksimum,
maka 1

1 : akar karakteristik
terbesar dari
a1 : vektor karakteristik
padanannya

Company Logo

www.themegallery.com

Pembentukan Komponen Utama Kedua


KU Kedua

Y2 = a21X1 + a22 X2 ++ a2p Xp= a2TX

Syarat :
 Y2 memiliki keragaman terbesar kedua setelah Y1
Var(Y2) = Var(a2TX) = a2T Var(X) a2= a2T a2
 a2T a2 = 1
 Y2 tidak berkorelasi dengan Y1

Corr (Y2 , Y1 ) = Cov (Y2 , Y1 ) = Cov (a T2 X , a1T X ) = 0


a T2 Var ( X )a1 = 0
a T2 a 1 = 0

Company Logo

www.themegallery.com

Pembentukan Komponen Utama Kedua


a T2 a 1 = 0
Dari Persamaan (1)

a1 = 1a1
aT2 a1 = aT2 1a1
= 1aT2 a1
T
Jika a 2 a

= 0

maka

1aT2 a1 = aT2 a1 = 0
aT2 a1 = 0

(a2 dan a1 saling orthogonal)


Company Logo

www.themegallery.com

Pembentukan Komponen Utama Kedua


Masalah : menentukan a2 sehingga diperoleh :
Max

a2T a2

Kendala a2T a2 = 1
a2T a1 = 0
Masalah : menentukan a2, 2 dan sehingga diperoleh :
Max f(a2,,)=a2T a2 2(a2T a2 1)- a2T a1
Agar f maksimum, maka :

f
=0
a 2

f
=0

dan

f
=0

Company Logo

www.themegallery.com

Pembentukan Komponen Utama Kedua


f
=0
a 2

f
=0
2

T
T
T
a2 a2 2 (a2 a2 1) a2 a1 = 0
a2

T
T
T
a 2 a 2 2 (a 2 a 2 1) a 2 a1 = 0
2

2a2 22a2 a1 = 0

(3)

Kalikan (3) dengan a1T

2a1Ta2 22a1Ta2 a1Ta1 = 0


2a1Ta2 = 0
=0

1
;

a1Ta2 = a1Ta2 = 0

(6)

(6) Subs ke (3) : 2a2 22a2 = 0

aT2 a2 + 1 = 0

(4)

f
=0

T
T
T
a 2 a 2 2 (a 2 a 2 1) a 2 a1 = 0

(5)

aT2 a1 = 0 a1T a2 = 0

( 2I)a2 = 0 (7)
Company Logo

www.themegallery.com

Pembentukan Komponen Utama Kedua


Persamaan (7)
2 : akar karakteristik dari

( 2I)a2 = 0

a2 : vektor karakteristik
padanannya

Persamaan (7)

( 2I)a2 = 0
a2 = 2Ia2

(kalikan dengan a2T)

aT2 a2 = aT2 2Ia2


= 2aT2 a2
= 2
Fs yang akan
dimaksimumkan

(dengan mensubst (6) ke (4) didapat :

aT2 a2 = 1

Agar maksimum, maka :


2 : akar karakteristik ke-2 terbesar dari
a2 : vektor karakteristik padanannya

Company Logo

www.themegallery.com

Pembentukan KU berikutnya
Dilakukan dengan pendekatan yang sama dengan
Pembentukan komponen utama 1 dan 2

Didapat bahwa :
i : akar karakteristik ke-i terbesar dari
ai : vektor karakteristik padanannya

Company Logo

www.themegallery.com

Langkah-langkah dalam AKU


 Tentukan matrisk . Karena data yang dimiliki adalah data
contoh, maka matriks ini diduga dari matriks ragam
peragam contoh S
 Tentukan a1, a2, ,ar yang merupakan vektor karakteristik
yang berpadanan dengan akar karakteristik tak nol dari
matriks ragam peragam , 1, 2, , r (1 2 r 0
 Ortonormalkan vektor a1, a2, ,ar
Orthogonalkan dengan POGS
Normalkan dengan membagi setiap unsur dengan norm-nya
 Tentukan Komponen Utama :
Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX
:
Yr = ap1X1 + ap2 X2 + +app Xp = arTX
Company Logo

www.themegallery.com

Keragaman Total KU
Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX
:
Yr = ap1X1 + ap2 X2 + +app Xp = arTXc

atau

T
T
Y1 a1 X a1
Y2 a T2 X a T2
M = M = M X
Y T T
r a r X a r

Bila dinyatakan A = [a1 , a2 , L, ar ] maka :

Y = AT X
Var (Y) = Var ( A T X)
= A T Var ( X) A
= A T A

1 0
0 2
Var(Y) =
M M
0 0

L
L
O
L

0
0
M
r

Company Logo

www.themegallery.com

Keragaman Total KU

Misal

1 0

= Var(Y) = 0 2
M M
0 0

L
L
O
L

0
0
M
r

Total keragaman Y = i = trace((


)
i =1
T

trace( ) = trace ( A A ) = trace ( AA

= trace ( ) =

Var

(X i)

i =1

= total keragaman

Company Logo

www.themegallery.com

Keragaman Total KU
Bila Var(Yi) = i, maka dapat dikatakan
bahwa :
r
 KU Yi mampu menerangkan i i dari total
i =1
keragaman seluruh komponen utama
r
 KU Yi mampu menerangkan i i dari total
i =1
keragaman data asal
Dg demikian, kk KU pertama,
Y1, Y2, , Yk mampu
r
menerangkan i i dari total keragaman data asal
i =1

i =1

Bila nilai ini sudah cukup besar, maka cukup digunakan


k KU saja.
Company Logo

www.themegallery.com

Berapa besar k????????


 Pilih KU dengan akar karakteristik lebih besar dari 1
(hanya jika menggunakan matriks korelasi)
 Pilih k KU sehingga
r

i =1

> 80%

i =1

 Scree plot
i

2 KU

curam
landai

i
1 2 3 4

Company Logo

www.themegallery.com

Peubah berbeda satuan atau keragaman sangat


berbeda
Peubah yang memiliki keragaman lebih besar dianggap
lebih penting dibanding yang lain
Pada kondisi ini, peubah dibakukan dulu sehingga setiap
peubah memiliki nilai tengah 0 dan ragam 1

Z ij =

X ij X j
sj

Jd semua peubah sama pentingnya

1 r12 L r1 p

Matriks S menjadi matriks korelasi R = r21 1 L r2 p


M O M
M
rp1 rp 2 L 1
Penurunan matematis sama shg prosedur analisis sama
ai dan i yang diperoleh berbeda
Total keragaman Y = total keragaman Z = p = # peubah
Company Logo

www.themegallery.com

Skor komponen
Skor komponen
T

Y = A ( X x)
Skor komponen untuk objek ke-m
T

ym = A (x m x)

Company Logo

www.themegallery.com

Beberapa catatan
1. Dugaan KU
 diduga dari S, sehingga yang didapat dalam
analisis adalah 1 ,..., r dan a 1 ,..., a r
 Tidak ada asumsi tentang X, sehingga sifat dari
penduga tidak dapat diturunkan
 AKU dipandang sebagai suatu teksik statistika
yang tidak didasarkan pada suatu model
apapun, shg KU yang diperoleh tetap dipandang
sebagai KU, bukan hanya sekedar dugaan

Company Logo

www.themegallery.com

Beberapa catatan
2. Akar karakteristik 0
 Terjadi jika terdapat keterkaitan linier antara
peubah (jarang terjadi)
 KU yang dihasilkan tidak digunakan
3. Akar karakteristik kecil
 Terjadi jika terdapat korelasi yang cukup erat
antar peubah.
 KU nya dapat diabaikan

Company Logo

www.themegallery.com

Output AKU
1. Diinterpretasikan langsung
2. Sebagai input bagi analisis statistika lainnya
 Analisis Regresi (jk terjadi multikolonier antara
peubah)
 Analisis gerombol untuk mengelompokkan objek
 Analisis diskriminan

Company Logo

www.themegallery.com

Langkah-langkah dalam AKU


 Tentukan matrisk ragam peragam S (dan/atau matriks
korelasi R) dari data
 Periksa (dari matriks korelasinya) apakah peubah perlu
ditransformasi dengan AKU
 Tentukan 1, 2, , r dan a1, a2, ,ar yang merupakan akar
dari matriks S (atau matriks R) dimana 1 2 r 0
dan a1, a2, ,ar saling orthogonal
 Tentukan banyaknya KU yang dapat diambil
 Tentukan Komponen Utama :
Y1 = a11X1 + a12 X2 ++ a1p Xp= a1TX
:
Yk = ak1X1 + ak2 X2 + +akp Xp = akTX
 Periksa apakah KU yang dihasilkan memiliki interpretasi yang
berarti
 Hitung skor komponen, bila ingin melalukan analisis lanjutan
Company Logo

www.themegallery.com

Contoh Penerapan AKU


Dilakukan pengukuran morfologi tubuh terhadap 49 ekor burung betet .
Peubah yang diukur adalah :
X1 = Total panjang burung
X2 = bentangan sayap
X3 = Panjang paruh dan kepala X4 = Panjang tulang sayap atas
X5 = Panjang keel of sternum (tulang tempat melekatnya otot untuk terbang)
Diperoleh data :
Objek

X1

X2

X3

X4

X5

156

245

31.6

18.5

20.5

154

240

30.4

17.9

19.6

153

240

31.0

18.4

20.6

49

164

248

32.3

18.8

20.9
Company Logo

www.themegallery.com

Ragam Peragam
X1

X2

X3

X4

X5

X1

13.2527

X2

8.7985

25.6828

X3

1.9221

1.8886

0.6316

X4

1.3306

1.6394

0.3443

0.3184

X5

2.1922

2.2745

0.4147

0.3394

Nilainya relatif lebih besar jika dibandingkan dengan ragam peubah-peubah lain
Terdapat kecendrungan bahwa dua peubah
(X1 dan X2) akan mendominasi pembentukan KU

0.9828

Bakukan Data
. Z ij =

X ij X j
sj

Matriks ragam
peragam (Z) adalah
matriks korelasi dari
X

MTB>Cova X1-X5 m1
Company Logo

www.themegallery.com

Objek

X1

X2

X3

X4

X5

156

245

31.6

18.5

20.5

154

240

30.4

17.9

19.6

153

240

31.0

18.4

20.6

Data Baku
Z 23 =

49

164

248

32.3

18.8

20.9

Rata2

157.98

241.33

31.46

18.47

20.83

Stdev

3.65

5.07

0.79

0.56

0.99

X 23 X 2
s2
240 241.33
= 0.26176
5.07

Objek

Z1

Z2

Z3

Z4

Z5

-0.54172

0.72486

0.17718

0.05425

-0.32937

-1.08902

-0.26176

-1.33272

-1.00904

-1.23720

-1.36267

-0.57777

-0.1229

-0.22850

1.05796

0.585895

0.074108
6

-0.26176

:
49

1.64750

1.31683

MTB>Center x1-x5 c6-c10


Company Logo

www.themegallery.com

Matriks Korelasi

X1

X2

X3

X4

X1

1.00000

X2

0.73496

1.00000

X3

0.66181

0.67374

1.00000

X4

0.64528

0.76851

0.76319

1.00000

X5

0.60512

0.52901

0.52627

0.60665

X5

1.00000

Korelasi antar peubah cukup besar


AKU akan berguna dalam mereduksi data
Untuk selanjutnya, AKU dilakukan dengan menggunakan matriks ini

MTB>Corr x1-x5 m2
Company Logo

www.themegallery.com

Penentuan Akar dan Vektor Karakteristik


a 1T
KU

Z1

Z2

Z3

Z4

Z5

%kum

Y1

3.61598

0.452

0.462

0.451

0.471

0.397 72.3% 72.3%

Y2

0.53150

0.051 -0.300 -0.325 -0.185

0.876 10.6% 82.9%

Y3

0.38642

0.690

Y4

0.30157 -0.420

Y5

0.16453

0.341 -0.454 -0.411 -0.178

7.7% 90.7%

0.548 -0.606

6.0% 96.7%

0.374 -0.530 -0.343

0.388

0.069

0.652 -0.192

3.2% 100%

Y1 = 0 .452 Z 1 + 0 .462 Z 2 + 0 .451 Z 3 + 0 .471 Z 4 + 0 .397 Z 5


Y 2 = 0 .051 Z 1 0 .300 Z 2 0 .325 Z 3 0 .185 Z 4 + 0 .876 Z 5
Y3 = 0 .690 Z 1 + 0 .341 Z 2 0 .454 Z 3 0 .411 Z 4 0 .178 Z 5

Y4 = 0 .420 Z 1 + 0 .548 Z 2 0 .606 Z 3 + 0 .388 Z 4 + 0 .069 Z 5

Y5 = 0 .374 Z 1- 0 .530 Z 2 - 0 .343 Z 3 + 0 .652 Z 4 - 0 .192 Z 5


MTB>Eigen m2 c11 m3
(lakukan analisis eigen untuk matriks m2, akar
karakteristik di c11, vektor karakteristik di m3)
Company Logo

www.themegallery.com

Berapa KU
1. Berdasarkan nilai akar karakteristik
Hanya Y1 yang akar karakteristiknya lebih dari 1
Diambil hanya KU-1, Y1
2. Berdasarkan % keragam yang dijelaskan KU
Y1, Y2, , Y5 mampu menjelaskan sebesar masing-masing
72.3%, 10.6%, 7.7%, 6.0% dan 3.2% dari total keragaman
data asal
Bila 72.3% dianggap cukup besar, gunakan anya Y1
Bila tidak, gunakan juga Y2. Y1 dan Y2 mampu menjelaskan
86.9% dari total keragaman data (sudah cukup besar)

Company Logo

www.themegallery.com

Berapa KU
3. Berdasarkan scree plot

curam

Scree Plot of X1, ..., X5


4

landai

E
Eigenvalue

0
1

3
Component Number

Diambil 1 KU, Y1

Company Logo

www.themegallery.com

Y1 = 0 .452 Z 1 + 0 .462 Z 2 + 0 .451 Z 3 + 0 .471 Z 4 + 0 .397 Z 5


Y 2 = 0 .051 Z 1 0 .300 Z 2 0 .325 Z 3 0 .185 Z 4 + 0 .876 Z 5
Y3 = 0 .690 Z 1 + 0 .341 Z 2 0 .454 Z 3 0 .411 Z 4 0 .178 Z 5

Y4 = 0 .420 Z 1 + 0 .548 Z 2 0 .606 Z 3 + 0 .388 Z 4 + 0 .069 Z 5

Y5 = 0 .374 Z 1 - 0 .530 Z 2 - 0 .343 Z 3 + 0 .652 Z 4 - 0 .192 Z 5

Company Logo

www.themegallery.com

Skor Komponen
Objek

Y1

Y2

Y3

Y4

Y5

0.06429

-0.600837

-0.171233

0.515826

0.548790

-2.18031

-0.442301

0.400070

0.645460

0.231077

-1.14557

0.01925

-0.676127

0.716298

0.208871

2.13422

-0.697546

0.851168

-0.380029

0.077126

:
49

Y11 = 0.452 Z 11 + 0.462 Z 21 + 0.451Z 31 + 0.471Z 41 + 0.397 Z 51


= 0.452 ( 0.542 ) + 0.462 (0.725 ) + 0.451(0.177 ) + 0.471(0.054 ) + 0.397 ( 0.329 )
= 0.064

Company Logo

www.themegallery.com

Plot antara Y1 dan Y2


3

Surv iv ors
Non-surv iv ors

Y2

-1

-2
-5

-4

-3

-2

-1

0
Y1

Company Logo

www.themegallery.com

AKU dengan Minitab


Stat>Multivariate>Principle Components
Isikan nama peubah atau kolom tempat
menyimpan peubah

Isikan banyak KU yang akan


dihitung skornya(max sama
dengan banyak peubah asal)
Pilih (hanya salah satu)
matriks yang digunakan
sebagai dasar analisis
(default : matriks korelasi)

Option untuk membuat grafik

Option untuk menyimpan


hasil perhitungan

Company Logo

www.themegallery.com

Menampilkan scree plot


Menampilkan diagram
pencar antara skor KU-1
dan skor KU-2
Menampilkan plot
loading untuk KU-1 dan
KU-2
Hasil analisis biplot

Company Logo

www.themegallery.com

Isikan kolom-kolom untuk menyimpan


koefisien (vektor karakteristik) (banyak
kolom harus sama dengan banyaknya
peubah asal)

Isikan kolom-kolom
untuk menyimpan skor
komponen (banyak
kolom harus sama
dengan banyaknya KU)
Diperlukan jika output
AKU akan dianalisis
lebih lanjut

Isikan kolom (hanya 1


kolom) untuk menyimpan
akar karakteristik

Company Logo

Anda mungkin juga menyukai