Anda di halaman 1dari 5

Analisis Komponen Utama

Pertemuan 8

Komponen utama mentransformasi himpunan variabel asal ke dalam himpunan kombinasi linear
yang lebih kecil yang memuat paling banyak variansi dari himpunan variabel asal. Analisis
komponen utama dilakukan untuk menyederhanakan sekumpulan variabel yang saling
berhubungan.

Tujuan dari analisis komponen utama yaitu :

1. Reduksi Data
2. Interpretasi

Xp→ Yq dengan q<p dapat dilakukan reduksi variabel, sehingga dapat dengan mudah
mendeskripsikan data (misal clustering dan deteksi outlier).

Bentuk umumnya adalah

di mana : Ai adalah bobot atau koefisien untuk variabel ke-i

Xi adalah variabel ke-i

Y adalah kombinasi linier dari variabel X

Secara prinsip pembentukan komponen utama merupakan pembentukan kombinasi linier dari
variabel-variabel yang diamati. Dalam analisis komponen utama ditentukan suatu metode untuk
mendapatkan nilai-nilai koefisien atau bobot dari kombinasi linier variabel-variabel
pembentuknya dengan ketentuan-ketentuan sebagai berikut :

a. Ada sebanyak p komponen utama, yaitu sebanyak variabel yang diamati dan setiap
komponen utama adalah kombinasi linier dari variabel-variabel tersebut.
b. Setiap komponen utama saling orthogonal (tegak lurus) dan saling bebas.
c. Komponen utama dibentuk berdasarkan urutan varians dari yang terbesar hingga yang
terkecil, dalam arti sebagai berikut :
1. Komponen utama pertama (KU1) merupakan kombinasi linier dari seluruh variabel
yang diamati dan memiliki varians terbesar.
2. Komponen utama kedua (KU2) merupakan kombinasi linier dari seluruh variabel
yang diamati yang bersifat orthogonal terhadap KU1 dan memiliki varians kedua
terbesar.
3. Komponen utama ke- p (KUp) merupakan kombinasi linier dari seluruh variabel yang
diamati bersifat orthogonal terhadap KU1, KU2, … , KUp-1 dan memiliki varians
terkecil.

Untuk memilih komponen utama dapat melalui 3 pendekatan:

1. Nilai lamda
2. Nilai proporsi total varian explained varians cum. ≥ 80% - 90%.
3. Screeplott, lihat berapa banyak komponen yang ada sebelum grafiknya melandai (terlalu
subjektif).

8.1 Population Principal Components

Komponen utama dapat menjadi input untuk banyak regresi (lihat bab 7) atau analisis cluster
(lihat bab 12). KU salah satu faktorisasi dari dari matriks kovarians (bab 9). Kesimpulan dapat
dibuat dari sampel komponen ketika populasi multivariate normal.

Vektor acak memiliki matriks kovarians I dengan nilai eigen

Komponen utama adalah kombinasi linier tidak berkorelasi Y1, Y2, … , Yp yang variansnya besar.
Andaikan adalah vector peubah acak asal yang diamati dengan matriks
ragam peragam ( ∑ ).

Komponen Utama (Y) : Komponen utama terboboti dari peubah asal yang saling orthogonal.

Komponen utama ke-i :

dengan

= eigen vector ke-I dari matriks ∑,

ei = eigen vector ternormalkan ke-i berpadanan dengan kar cirri

Ciri KU :

1. Tertata berdasarkan pentingnya ragam =


Berurut dari terbesar ke terkecil
Semakin besar ragam semakin penting KU dalam menerangkan keragaman data
2. Antar KU tidak saling berkorelasi

Teori Kergaman Data

mempunyai matriks kovarians ∑ dengan pasangan eigenvalue-


eigenvector di mana

adalah komponen utama, sehingga :

Total populasi varians :

Proporsi total keragaman data yang dapat diterangkan KU ke-k :


Hubungan antara peubah asal dan KU

Penamaan bagi komponen utama sebagai peubah baru tersebut dapat dipengaruhi oleh peubah
asal yang mempunyai korelasi yang tinggi. Peubah-peubah satuannya skala pengukuran tidak
sama, maka matriks

Xpxn ditransformasi Zpxn (standardization) sehingga komponen utama dilandaskan matriks


korelasi ρ sebagai pengganti matriks rel yangagam-peragam ∑.

Principal Components Obtained From Standardized Variables

Penurunan komponen utama dari matriks korelasi dilakukan apabila data sudah terlebih dahulu
ditransformasikan ke dalam bentuk baku Z. Transformasi ini dilakukan terhadap data yang
satuan pengamatannya tidak sama. Bila variabel yang diamati ukurannya pada skala dengan
perbedaan yang sangat lebar atau satuan ukurannya tidak sama maka variabel tersebut perlu
dibakukan (standardized).

Variabel baku (Z) didapat dari transformasi terhadap variabel asal dalam matriks berikut :

adalah matriks simpangan baku dengan unsur diagonal utama adalah (αii)1/2 sedangkan
unsur lainnya adalah nol. Nilai harapan E(Z) = 0 dan keragamnnya adalah

Denga demikian komponen utama dari Z dapat ditentukan dari vector cirri yang didapat melalui
matriks korelasi variabel asal ρ. Untuk mencari akar ciri dan menentukan vector pembobotnya
sama seperti pada matriks ∑.
Principal Components for Covariance Matrices with Special Structutres