Pca PDF
Pca PDF
Siana Halim
p Component
Gunakan Principal p y
Analysis
(PCA).
7 8 0 4 1
θ = 43.261
43 261
8 7 -1 6 3
1 8 5 9.253 -1.841
2 4 7 7.710 2.356
3 5 3 5.697 -1.242
4 3 -1 1.499 -2.784
5 2 5 4.883 2.271
6 1 -4 -2.013 -3.598
7 0 1 0.685 0.728
8 -1 3 1.328 2.870
9 -3 -6 -6.297 -2.313
10 -5 -4 -6.382 0.514
11 -6 -6 -8.481 -0.257
12 -8 -3 -7.882 3.298
Mean 0 0 0.000 0.000
⎡38.576 0 ⎤ ⎡1 0⎤
SS 424.334 61.666 S=⎢ ⎥ R=⎢ ⎥
⎣ 0 61 .666 ⎦ ⎣0 1 ⎦
Variance 38.576 5.606
Objective dari PCA
Dalam PCA
` Variable-variable baru disebut sebagai principle
component dan nilai-nilai
nilai nilai bentukan dari varible ini
disebut sebagai principle component score.
` Variable yang baru merupakan kombinasi linear dari
variable-variable asli.
asli
` Variable baru pertama berhubungan dengan variance
maximum dari data.
` Variable baru kedua menunjukkan variance maximum
yang belum terhitung pada variable pertama
` Variable baru ketiga menunjukkan variance maximum
yang belum terhitung pada kedua variable pertama
` Variable baru ke-p menunjukkan variance maximum
yang belum terhitung pada p-1 variable terdahulu.
` Seluruh p variable baru tidak berkorelasi.
Loadings
` Loadings adalah korelasi antara variable asli dengan variable
baru.
` Loadings memberikan indikasi variable original mana yang
sangat penting atau mempengaruhi pembentukan variable baru
` Semakin tinggi nilai Loading maka variable lama ybs semakin
memiliki ppengaruh
g terhadapp pembentukan
p variable baru.
` Loading dapat pula dihitung dengan menggunakan rumus sbb:
w ij
l ij = λi
sj
` Lij adalah loading dari variable ke-j untuk principal component
ke i wij adalah bobot dari variable ke-j
ke-i, ke j terhadap principal
component ke-i, λi adalah nilai eigen dari principal component
ke-i dan sj adalah standard deviasi dari variable ke-j
Hal-hal
Hal hal yang berhubungan dengan PCA
1. Adakah effect dari type data (misalnya mean
corrected ataupun
p data yyangg telah di-standard-kan))
terhadap PCA ?
2. Apakah PCA merupakan teknik yang memadai ?
3. Berapakah jumlah Principal Component yang harus
dipilih ?
4
4. B i
Bagaimana menginterpretasikan
i t t ik PCA ?
5. Bagaimana penggunaan dari Principal Component
Scores ?
1. Adakah effect dari type data (misalnya mean corrected ataupun data
yang telah di-standard-kan) terhadap PCA ?
` Secara umum, bobot yang dibebankan /diberikan pada
sebuah variable dipengaruhi oleh variance relative dari
variable karena itu data seharusnya distandardkan s.d.h.
variable, sdh
variance untuk setiap variable menjadi sama (yaitu satu).
` Namun demikian, pilihan antara memproses data awal
dengan
e ga mean ea co
corrected
ecte atau data
ata ya
yangg distandardkan
sta a a juga
tergantung pada faktor-faktor lain.
` Sebagai contoh, jika tidak ada alasan yang memaksa
seorangg p pengambil
g keputusan
p untuk menganggap
g gg p sebuah
variable
i bl lebih
l bih penting
i dari
d i variable
i bl yang lain
l i maka
k analisa
li
akan lebih baik jika kita menggunakan data yang
distandardkan.
` Namun demikian bila, bila ada alasan bahwa variance dari
suatu variable menunjukkan tingkat kepentingan dari
variable tersebut, maka analisa akan lebih baik jika kita
menggunakan
gg mean corrected data.
2.Apakah PCA merupakan teknik yang memadai ?