Anda di halaman 1dari 8

ANALISIS MULTIVARIAT

“Analisis Komponen Utama”

OLEH :

Kelompok 1

Delvika Gusdiani (15030002)

Vivian Guswinda (15030056)

Nafiha Irsyam (16030076)

Dosen : Admi Salma, S.Pd. M.Si

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN


ALAM

UNIVERSITAS NEGERI PADANG

2019
ANALISIS KOMPONEN UTAMA

Analisis komponen utama merupakan suatu teknik statistik untuk mengubah


dari sebagian besar variabel asli yang digunakan yang saling berkorelasi satu
dengan yang lainnya menjadi satu set variabel baru yang lebih kecil dan saling
bebas (tidak berkorelasi lagi). Jadi analisis komponen utama berguna untuk
mereduksi data, sehingga lebih mudah untuk menginterpretasikan data-data
tersebut.

Umumnya analisis komponen utama merupakan analisis intermediate yang


berarti hasil komponen utama dapat digunakan untuk analisis selanjutnya.
Analisis komponen utama merupakan analisis antara dari suatu proses penelitian
yang besar atau suatu awalan dari analisis berikutnya, bukan merupakan suatu
analisis yang langsung berakhir. Misalnya komponen utama bisa merupakan
masukan untuk regresi berganda atau analisis gerombol.

Secara aljabar linier Komponen Utama adalah kombinasi linier khusus dari
p peubah acak X 1 , X 2 ,..., X p . Secara geometris kombinasi linier ini merupakan

sistem koordinat baru yang didapat dari rotasi sistem semula dengan X 1 , X 2 ,..., X p

sebagai sumbu koordinat. Sumbu baru tersebut merupakan arah dengan variansi
maksimum dan memberikan kovariansi yang lebih sederhana.

Komponen utama tergantung sepenuhnya pada matriks kovarian yang


disimbolkan dengan  (atau matriks korelasi  ) dari komponen utama

peubah-peubah X 1 , X 2 ,..., X p . pengembangan komponen utama tidak memerlukan

asumsi multivariat normal.

Komponen utama dapat dibentuk menggunakan matriks kovarian atau



matriks korelasi. Misalkan vektor acak X T  X1 , X 2 ,..., X p  memiliki matriks

kovarian dengan nilai eigen 1  2  ...   p  0 . Maka kombinasi linearnya

adalah
Y1  a1 X  a11 X 1  a12 X 2  ...  a1 p X p
T

Y2  a2 X  a21 X 1  a22 X 2  ...  a2 p X p


T

.
.
.
Yp  a p X  a p1 X 1  a p 2 X 2  ...  a pp X p
T

Untuk mencari variansi Yi dan kovariansi (Yi , Yk ) digunakan persamaan

var(Yi )  ai  ai untuk i  1,2,..., p

Cov(Yi , Kk )  ai  ak untuk i, k  1,2,..., p

Komponen utama merupakan kombinasi linier Y1 , Y2 ,..., Y p yang tidak

memiliki korelasi. Untuk selnjutnya jika menggunakan matriks kovarian dengan


nilai eigen-vektor eigen berpasangan (1 , e1 ), (2 , e2 ),..., (i , ei ) dimana

1  2  ...   p  0 . Sehingga komponen utama ke- i adalah

Yi  ei X  ai1 X 1  ai 2 X 2  ...  aip X p untuk i  1,2,..., p

Maka

var(Yi )  ei  ei  i untuk i  1,2,..., p

Cov(Yi , Kk )  ei  ek  0 untuk i  k

Jika beberapa i sama, maka pilihan vektor yang sesuai adalah ei sehingga Yi
tidak tunggal. Rumusan ini merupakan persamaan komponen utama yang tidak
berkorelasi dan memiliki variansi sama terhadap nilai eigen pada matriks
kovarian.

Y1 adalah komponen pertama yang memenuhi maksimum nilai e1  e1  1 .

Y2 adalah komponen kedua yang memenuhi sisa keragaman selain komponen

pertama dengan memaksimumkan nilai e2  e2  2 . Y p adalah komponen ke- p


yang memenuhi sisa keragaman selain Y1 , Y2 ,..., Y p dengan memaksimumkan nilai

e p  e p   p . Urutan Y1 , Y2 ,..., Yp harus memenuhi 1  2  ...   p  0 .

Sementara itu, total variansi populasi komponen utama adalah

p p
 11   22  ...   pp   var( X i )  1  2  ...   p  var(Yi )
i 1 i 1

Dari persamaan diatas, dapat dikatakan bahwa

Total Variansi Populasi   11   22  ...   pp


 1  2  ...   p

Sehingga proporsi total variansi populasi yang dijelaskan oleh komponen


utama ke- k adalah

k
 untuk k  1,2,..., p
1  2  ...   p

Jika Y1  e1 X , Y2  e2 X ,..., Yp  e p X merupakan komponen utama yang

terbentuk dari matriks kovarian, maka

eik i
Y , X  untuk i, k  1,2,..., p
i k
 kk

Merupakan koefisien korelasi antara komponen Yi dan variabel X k ,dimana

(1 , e1 ), (2 , e2 ),..., (i , ei ) pasangan nilai eigen dan vektor eigen.

Bila variabel yang diamati ukurannya pada skala dengan perbedaan yang
sangat lebar atau satuan ukurannya tidak sama, maka peubah tersebut perlu
dibakukan (standardized) sehingga komponen utama ditentukan dari peubah baku
( xi  x )
dengan menggunakan persamaan Z i  atau matriks korelasi  .
 ii

koefisien korelasi digambarkan dalam kaitannya antara kovarian  ik dengan

varians  ii dan  kk yaitu


 ik
ik  untuk i, k  1,2,..., p
 ii  kk

Dan matriks korelasi populasi. Total variansi dari matriks korelasi adalah

k
 untuk k  1,2,..., p
p

Pembentukan komponen utama dapat menggunakan matriks korelasi ataupun


matriks varian-kovarian. Dalam beberapa literatur, sering dianjurkan
menggunakan matriks korelasi, kecuali ada dukungan yang cukup bahwa
variabel-variabel yang ada diukur menggunakan range skala yang sama dan
memiliki besaran varian yang tidak terlalu jauh berbeda. Perbedaan satuan
pengukuran menjadi salah satu pertimbangan utama menggunakan matriks
korelasi.

Permasalahan Umum dalam Analisis Komponen Utama

1. Penentuan Komponen Utama menggunakan matriks varian-kovarian atau


matriks korelasi.

Secara umum ini merupakan hal yang sulit karena tidak ada hubungan yang
jelas antara nilai eigen dan vektor eigen matriks varian-kovarian dengan matriks
korelasi, dan komponen utama yang dihasilkan oleh keduanya sangat berbeda.
Demikian juga dengan berapa banyak komponen utama yang digunakan.

Perbedaan satuan pengukuran yang umumnya berimplikasi pada perbedaan


keragaman peubah, menjadi salah satu pertimbangan utama penggunaan matriks
korelasi. Meskipun ada juga beberapa pendapat yang mengatakan untuk
menggunakan selalu matriks korelasi.

Penggunaan matriks korelasi memang cukup efektif kecuali dua hal.

a) Secara teori pengujian statistik terhadap nilai eigen dan vektor eigen
matriks korelasi jauh lebih rumit.
b) Dengan menggunakan matriks korelasi kita memaksakan setiap peubah
memiliki varian yang sama sehingga tujuan mendapatkan peubah yang
kontribusinya paling besar tidak tercapai.

2. Penentuan banyaknya Komponen Utama

Menentukan atau membentuk komponen utama dapat menggunakan


matriks varians-kovarians ataupun matriks korelasi. Namun, tidak semua
komponen utama yang terbentuk, dapat digunakan sebagai variabel baru. Tidak
ada kriteria yang pasti mengenai banyaknya dimensi peubah. Tetapi, penentuan
banyaknya komponen utama dapat didasarkan pada proporsi keragaman data yang
dapat diterangkan oleh komponen utama. Idealnya, kontribusi dari beberapa
komponen utama dari keragaman variabel haruslah besar.

Ada tiga metode umum yang digunakan untuk menentukan banyaknya


komponen utama yang dapat digunakan sebagai variabel baru yaitu:

1. Berdasarkan proporsi kumulatif total keragaman yang mampu dijelaskan.


Metode ini diterapkan pada matriks korelasi ataupun matriks varian-kovarian.
Minimum persentase keragaman yang mampu dijelaskan ditentukan terlebih
dahulu,dan selanjutnya banyaknya komponen yang paling kecil hingga batas
itu terpenuhi dijadikan sebagai banyaknya komponen utama yang digunakan.
Tidak ada patokan baku berapa batas minimum tersebut. Namun, sebagian
menyebutkan 70%, 80% bahkan ada yang 90%.

2. Berdasarkan nilai eigen dari komponen utama. Tapi hanya bisa diterapkan
pada matriks korelasi, yaitu jika nilai eigen lebih atau sama dengan satu.

3. Berdasarkan scree plot. Dengan menggunakan metode ini, banyaknya


komponen utama yang dipilih, yaitu k , adalah jika pada titik k tersebut
plotnya curam ke kiri tapi tidak curam ke kanan. Ide yang ada dibelakang
metode ini adalah bahwa banyaknya komponen utama yang dipilih
sedemikian rupa sehingga selisih antara nilai eigen yang berurutan sudah
tidak besar lagi.
5.

Langkah-langkah analisis data menggunakan analisis komponen utama

1) Menghitung korelasi antar variabel.

2) Melakukan analisis komponen utama dari matriks korelasi.

3) Menentukan banyaknya komponen utama yang digunakan sebagai variabel


baru.

4) Menaksir nilai-nilai dari komponen utama yang terbentuk.

Anda mungkin juga menyukai