Anda di halaman 1dari 6

Pengantar AKU

Analisis Komponen Utama (AKU, Principal Componen Analysis) bermula dari tulisan Karl
Pearson pada tahun 1901 untuk peubah non-stokastik. Analisis ini kemudian ditetapkan menjadi
peubah stokastik oleh Harold Hotelling pada tahun 1933 dan merupakan analisis yang tertua.
Perhitungan dalam analisis ini pada waktu tersebut merupakan pekerjaan yang sukar walaupun
hanya menggunakan beberapa peubah. Analisis ini baru berkembang penggunaannya setelah
tersedianya fasilitas komputasi elektronik. Satu buku yang khusus membahas AKU telah ditulis oleh
Jolliffe 1986.
Analisis komponen utama merupakan teknik statistik yang dapat digunakan untuk
menjelaskan struktur variansi-kovariansi dari sekumpulan variabel melalui beberapa variabel baru
dimana variabel baru ini saling bebas, dan merupakan kombinasi linier dari variabel asal. Selanjutnya
variabel baru ini dinamakan komponen utama. Secara teknis, analisis komponen utama merupakan
suatu teknik mereduksi data multivariat (multivariable) yang mengubah (mentranformasi) peubah
asal yang saling berkorelasi menjadi peubah baru yang tidak saling berkorelasi dengan mereduksi
peubah tersebut sehingga mempunyai dimensi yang lebih kecil, namun dapat menerangkan
sebagian besar keragaman peubah aslinya.
Misalkan saja terdapat p buah variabel yang terdiri atas n buah objek. Misalkan pula bahwa
dari p buah variabel tersebut dibuat sebanyak k buah komponen utama (dengan k <= p) yang
merupakan kombinasi linier atas p buah variabel tersebut. k komponen utama tersebut dapat
menggantikan p buah variabel yang membentuknya tanpa kehilangan banyak informasi mengenai
keseluruhan variabel. Umumnya analisis komponen utama merupakan analisis intermediate yang
berarti hasil komponen utama dapat digunakan untuk analisis selanjutnya.
Dalam bentuk matematis, katakan saja bahwa Y merupakan kombinasi linier dari variabelvariabel X1, X2, , Xp yang dapat dinyatakan sebagai:
Y = e1X1 + e2X2 + e3X3 + ... + epXp
Dengan:
ei adalah bobot atau koefisien untuk variabel ke i
Xi adalah variabel ke i
Y adalah kombinasi linier dari variabel X
AKU tidak selalu bermanfaat digunakan untuk mereduksi banyaknya peubah asal menjadi
beberapa peubah baru yang dapat menjelaskan dengan baik keragaman data asal. Bila tidak ada
korelasi antara peubah asal, AKU tidak akan memberikan hasil yang diinginkan, karena peubah baru
yang diperoleh hanyalah peubah asal yang ditata berdasarkan besar keragamannya. Makin erat
korelasi (baik positif maupun negatif) antar peubah, makin baik pula hasil yang diperoleh dari AKU.
Menurut Koutsoyiannis (1973) serta Draper dan Smith (1981), metode komponen utama cocok
untuk dua kasus, pertama bila jumlah variabel yang dimasukkan ke dalam fungsi relatif besar
dibandingkan jumlah sampel, kedua sebagai penyelesaian masalah multikolinieritas antar variabel
bebas. Komponen Utama tidak memerlukan adanya anggapan tentang sebaran dari peubah asal
sehingga tidak ada hipotesis dan model yang mendasari. Semua peubah dalam AKU merupakan
peubah dengan skala interval/rasio (metrik).

Tujuan utama analisis komponen utama ialah menjelaskan sebanyak mungkin jumlah varian
data asli dengan sedikit mungkin komponen utama. Analisis Komponen Utama biasanya digunakan
untuk :
1. Identifikasi peubah baru yang mendasari data peubah ganda
2. Mengurangi banyaknya dimensi himpunan peubah yang biasanya terdiri atas peubah yang
banyak dan saling berkolerasi dengan mempertahankan sebanyak mungkin keragaman
dalam himpunan data tersebut, dan
3. Menghilangkan peubah-peubah asal yang mempunyai sumbangan informasi yang relatif
kecil.
4. Sebagai input bagi analisis statistika lainnya, diantaranya
Plot skor Komponen utama 2 dimensi sebagai alat awal diagnosis pada analisis
cluster
Komponen Utama yang saling bebas mengatasi masalah multikolinear dalam analisis
regresi
Analisis diskriminan, analisis faktor dll
Dalam analisis komponen utama ditentukan suatu metode untuk mendapatkan nilai-nilai
koefisien atau bobot dari kombinasi linier variabel-variabel pembentuknya dengan ketentuan
sebagai berikut:
1) Ada sebanyak p komponen utama, yaitu sebanyak variabel yang diamati dan setiap
komponen utama adalah kombinasi linier dari variabel-variabel tersebut
2)

Setiap komponen utama saling ortogonal (tegak lurus) dan saling bebas.

3) Komponen utama dibentuk berdasarkan urutan varians dari yang terbesar hingga yang
terkecil, dalam arti sebagai berikut:

komponen utama pertama (KU1) merupakan kombinasi linier dari seluruh variabel
yang diamati dan memiliki varians terbesar

komponen utama kedua (KU2) merupakan kombinasi linier dari seluruh variabel
yang diamati yang bersifat ortogonal terhadap KU1 dan memiliki varians kedua
terbesar

komponen utama ketiga (KU3) merupakan kombinasi linier dari seluruh variabel
yang diamati yang bersifat ortogonal baik terhadap KU1 maupun KU2, dan memiliki
varians ketiga terbesar
:
:

Prosedur

komponen utama ke p (KUp) merupakan kombinasi linier dari seluruh variabel yang
diamati yang bersifat ortogonal terhadap KU1, KU2, , KU(p-1) dan memiliki varians
yang terkecil.

Andaikan X = (X1, X2, ..., Xp) merupakan vektor peubah acak yang diamati dengan matriks
ragam-peragam [ ] , maka komponen utama (Y) didefinisikan sebagai kombinasi linier
terboboti dari peubah asal yang saling orthogonal. Secara umum, komponen utama ke-i dapat
dituliskan sebagai:
; i =1,2,3,...,p
Dengan:
Var(Yi) = i

dan

Cov(Yi-1,Yi) = 0

i : akar ciri (eigen value) ke-i dari matriks , dimana 1 2 3 ... p 0


ei : vektor ciri (eigen vector) ternormalkan ke-i yang berpadanan dengan akar cirinya

dimana Y1 adalah komponen pertama yang memenuhi maksimum nilai


. Y2 adalah
komponen utama kedua yang memenuhi sisa keragaman selain komponen pertama dengan

memaksimumkan nilai
. Yp adalah komponen ke-p yang memenuhi sisa keragaman
selain Y1, Y2,..., Yp dengan memaksimumkan nilai
. Urutan Y1, Y2,..., Yp harus memenuhi
persyaratan 1 2 3 ... p .
Penyusutan dimensi dari peubah asal dilakukan dengan mengambil sejumlah kecil
komponen yang mampu menerangkan sebagian besar informasi yang terkandung dalam peubah asal
atau memberikan sumbangan yang besar terhadap keragaman peubah asal. Jika dari data asal yang
memiliki p variabel bebas diambil sebanyak k komponen, k < p, maka persentase keragaman yang
dapat diterangkan oleh masing-masing komponen adalah:
(

Dan persentase keragaman kumulatif yang diterangkan oleh k komponen adalah:

Penggunaan Matriks ragam-peragam dalam komponen utama memerlukan persyaratan


bahwa peubah yang diamati memiliki ukuran pada skala dengan perbedaan yang tidak besar atau
jika satuan ukurannya sama. Komponen utama sangat ditentukan oleh keragaman peubah asal,
dimana peubah asal yang memiliki keragaman yang besar akan cenderung dipilih menjadi komponen
utama yang pertama. Perbedaan keragaman yang besar dapat terjadi karena adanya perbedaan
skala dan satuan ukuran peubah yang diamati. Sehingga bila peubah yang diamati ukurannya pada
skala dengan perbedaan yang sangat lebar atau satuannya tidak sama, maka analisis komponen
utama tidak menggunakan matriks ragam-peragam, tetapi harus menggunakan matriks korelasi R.
Matriks korelasi R ini dapat diperoleh dengan cara mentransformasi setiap variabel asal x ij
yang merupakan nilai pengamatan pada individu ke-i dan variabel ke-j ke skor baku zij terlebih
dahulu dengan rumus:
(

Dimana: adalah matriks simpangan baku dengan unsur diagonal utama adalah (ii)1/2 sedangkan
unsur lainnya adalah 0.

Nilai harapan E(Z) = 0 dan keragamannya adalah

Dengan demikian komponen utama ke-i (Yi) yang dibentuk berdasarkan variabel-variabel
yang telah dibakukan Z = (Z1, Z2, ..., Zp) dapat ditentukan dari vektor ciri yang didapat melalui
matriks korelasi peubah asal yang didefinisikan sebagai berikut:
; i =1,2,3,...,p
Yang unik dari akar ciri yang didapat dari matriks korelasi adalah jumlah seluruh akar ciri adalah
sama dengan banyaknya peubah yang dianalisis.

Dengan k adalah nilai eigen dari .


Sementara itu, proporsi total variansi yang dapat dijelaskan oleh komponen utama ke-k berdasarkan
variabel bebas yang telah dibakukan didefinisikan sebagai berikut:

Sehingga total persentase/proporsi =

Jika jumlah komponen yang diambil sebagai k komponen, dimana k < p, maka persentase keragaman
kumulatif yang diterangkan oleh m komponen adalah:

Untuk keperluan reduksi variabel tentu harus ditentukan berapa banyak komponen utama yang
harus diambil. Ada beberapa cara untuk menentukan banyaknya komponen utama diantaranya
adalah
1. Kriteria persentase keragaman kumulatif dari komponen utama
Keragaman total KU =

Menurut Morison (1990), banyak komponen utama yang sudah memadai apabila komponen
utama tersebut mempunyai persentase keragaman kumulatif tidak kurang dari 75%
keragaman data. Jhonson & Wischern (1992) mengisyaratkan komponen utama dengan
persentase kumulatif 80-90, dapat menggambarkan data asalnya. Sedangkan menurut
Supranto (2004) ekstraksi faktor dihentikan kalau kumulatif persentase varians sudah
mencapai paling sedikit 60 atau 75 persen dari seluruh varians peubah asli.
2. Dengan menggunakan scree plot yaitu plot antara i dengan i
pemilihan nilai k berdasarkan scree plot ditentukan dengan melihat letak terjadinya belokan
dengan menghapus komponen utama yang menghasilkan beberapa nilai eigen kecil yang
membentuk pola garis lurus (Rencher, 1998). Intrepetasi terhadap plot ini bersifat subjektif.
3. Kriteria Akar Ciri

Hanya bisa diterapkan pada penggunaan matriks korelasi. Metode ini disarankan oleh Kaiser
(1960) bahwa pemilihan Komponen utama berdasarkan pendekatan akar ciri yang nilainya
>1. Namun Jollife (1972) setelah melakukan studi mengatakan bahwa cut off yang lebih baik
adalah 0,7.
Peubah baru yang disebut komponen utama mempunyai ciri:

Merupakan kombinasi linier dari peubah asal

Jumlah kuadrat koefisien dalam kombinasi linier bernilai 1 (

Mempunyai ragam/varians yang berurut dari yang terbesar ke yang terkecil


Var(Y1) Var(Y2) ... Var(Yi)

dimana Var(Yi) =

, i= 1,2,..., p

Antar komponen utama tidak saling berkorelasi.

Langkah pertama sebelum melakukan Analisis Komponen Utama adalah membentuk matriks
korelasi dari data pengamatan kemudian melakukan pengujian terhadap matriks korelasi dengan
menggunakan uji Bartlett. Uji Bartlett digunakan untuk menguji hipotesis bahwa variabel tidak saling
berkorelasi (uncorrelated) dalam populasi. Dengan perkataan lain matriks korelasi populasi
merupakan matriks identitas. Hal ini bertujuan agar penyusutan dimensi dari peubah ganda menjadi
lebih sederhana dan bermanfaat, dengan tanpa banyak kehilangan informasi sebelumnya.
Matriks Korelasi

Misalkan matriksnya adalah: Rpxp =


[

Semua diagonal utama = 1 dan diluar diagonal utama 1, (0 rxixj 1). Korelasi (rxixj) diperoleh
dengan rumus:

Uji Bartlett
Langkah-Langkahnya:
Hipotesis yang akan diuji adalah:
H0 : matriks korelasi merupakan matriks identitas
H1 : matriks korelasi bukan matriks identitas
Statistik uji:
[
Dimana: n = jumlah observasi
P = jumlah peubah

| |

lRl = determinan matriks korelasi


Keputusan:
Uji Bartlett akan menolak H0, terima H1 apabila

: matriks korelasi bukan matriks

identitas.
Jika matriks korelasi bukan matriks identitas maka penyusutan dimensi terhadap peubah ganda
tersebut bermakna untuk dilakukan analisis dengan Analisis Komponen Utama
Langkah-Langkah dalam AKU:
1. Tentukan matriks ragam-peragam S (atau matriks korelasi R) dari data
2. Periksa (dari matriks korelasinya) apakah peubah perlu ditransformasi dengan AKU
3. Tentukan 1,2, 3,.. , p dan e1,e2,e3,..,ep yang merupakan akar ciri dan vektor ciri dari
matriks S (atau matriks R) dimana 1 2 3 ... p 0 dan e1,e2,e3,..,ep saling orthogonal
4. Tentukan banyaknya KU yang dapat diambil
5. Tentukan Komponen Utama:
:
6. Periksa apakah KU yang dihasilkan memiliki interpretasi yang berarti
7. Hitung skor komponen, bila ingin melakukan analisis lanjutan

Anda mungkin juga menyukai