∑ ei=σ ii e i
Pola lainnya dari matriks kovarians yang biasa pada variabel biologi berbentuk :
σ ⋯ ρσ 2
[
Σ= ⋮ ⋱
ρσ 2 ⋯
⋮
σ ]
Sedangkan matriks korelasi nya
1 ⋯ ρ
[ ]
ρ= ⋮ ⋱ ⋮
ρ ⋯ 1
1 1 1
Saat ρpositif, maka λ 1=1+( p−1) ρ. Vektor eigen e ' 1=[ , ,… , ] dan nilai eigen
√p √p √p
λ 2=λ3= … = λ p=1−ρ
p
1
Y 1=e ' 1 Z= ∑Z
√ p i=1 i
Proporsi terhadap penjumlahan p variabel yang distandardisasikan. Ini bisa disebut “indeks”
apabila diberi penimbang.
Komponen utama ini menjelaskan tentang proporsi dari total variasi populasi.
Pembahasan ini bertujuan untuk membangun kombinasi linier tidak terkorelasi dari karkater
yang telah diukur yang mencatat banyaknya variasi pada sampel. Kombinasi yang tidak
terkorelasi ini selanjutnya disebut sampel komponen utama.
Misalkan X 1 , X 2 ,… , X p berasal dari n independen populasi dengan rata-rata μ dan matriks
kovarians Σ. Objek dibentuk dari kombinasi linier yang tidak berkorelasi. Data tersebut
menghasilkan vektor rata-rata sampel x̄ , matriks kovarians sampel S, dan matriks korelasi
R. Komponen utama sampel dibagi kedalam beberapa kombinasi linier yang
memaksimumkan varian sampel.
Kombinasi tidak berkorelasi dengan varians paling besar disebut komponen utama sampel.
Jika S =
{si , k } berukuran p x p adalah matriks kovarians sampel dengan nilai eigen dan
vektor eigen yang saling berpasangan ( ^λ¿ ¿1 , e^ 1) ¿, ( ^λ¿ ¿ 2, e^ 2)¿, …, ( ^λ¿ ¿ p e^ p )¿..
Persamaan komponen utama sampel ke-i :
^y i= e^ i x=^e i1 x 1+ e^ i 2 x 2 +…+ e^ ip x p i=1,2 , … , p
p
Total Varians Sampel ∑ s ii= ^λ1 + ^λ2 +…+ ^λ p
i=1
e^ ik √ λ^ i
dan r ^y , x = i, k =1,2 , … , p
i k
√ s kk
Standardisasi Komponen Utama Sampel
Komponen utama sampel, secara umum, tidak invarian sehubungan dengan perubahan skala.
x j 1− x́ 1
−1
2
z j =D ( x j−x́ )=
[ ]
√ s 11
⋮
x jp − x́ p
√ s pp
j=1,2 , … , n
[][
Z= ⋮ = ⋮ ⋱
^z n z n1 ⋯
⋮
z np ]
Vektor rata-rata sampel :
n
x j 1−x́ 1
[ ]
∑
1 ' 1 1
j=1 √ s 11
ź= ( 1' Z ) = Z ' 1= ⋮ =0
n n n n
x jp −x́ p
∑
j=1 √ s pp
'
1 1
S z=
n−1 (
Z− 1 1' Z
n ) ( Z− 1n 1 1 Z )= n−1
'1 '
ZZ
[ ]
⋯
s 11 √ s 11 √ s pp
1
¿ ⋮ ⋱ ⋮ =R
n−1
(n−1) s 1 p (n−1)s pp
⋯
√ s11 √ s pp s pp
Dimana ( ^λ1 , e^ 1 ) adalah nilai eigen dan vektor eigen yang saling berpasangan dari R
dengan λ 1 ≥ λ2 ≥… ≥ λ p ≥ 0.Juga :
r ^y , z = e^ ik √ ^λ i i , k=1,2 , … , p
i k
Dan proporsi dari varians sampel terstandarisasi sampel komponen utama ke-i adalah :
^λi
i=1,2 , … , p
p
Untuk membantu memeriksa asumsi normalitas, buat scatter diagrams untuk pasangan dari
beberapa komponen utama pertama. Selain itu, buat Q-Q plot dari nilai sampel yang
dihasilkan oleh masing-masing komponen utama.
Buat scatter diagrams dan Q-Q plot untuk beberapa komponen utama terakhir. Ini membantu
mengidentifikasi pengamatan yang dicurigai.
Komponen utama terakhir dapat membantu menduga ketepatan observasi. Setiap observasi dapat
diekspresikan sebagai kombinasi linier.
dari sekumpulan vector eigen e^ 1 , e^ 2, …,e^ p dari S. Jadi, besarnya komponen utama menentukan
seberapa baik pengamatan yang pertama sesuai dengan observasi. Artinya
^y j1 e^ 1+ ^y j 2 e^ 2 +…+ ^y j .q−1 e^ q−1berbeda dengan x j oleh ^y j1 e^ 1+ ^y j 2 e^ 2 +…+ ^y jp e^ p, panjangnya adalah
^
y 2 jq +…+ ^
y 2 jp
Kita telah mengetahui , nilai eigen dan vektor eigen dari matriks kovarians merupakan inti dari
analisis komponen utama. Tugas dari vector eigen untuk menentukan arah variabilitas
mkasimum dan nilai eigen untuk menentukan varians. Ketika beberapa nilai eigen pertama jauh
lebih besar disbanding nilai-nilai eigen lainnya, varians total bernilai kurang dari dimensi p.