Anda di halaman 1dari 8

Analisis Komponen Utama dan Analisis Faktor

Analisis Komponen Utama Dalam statistika, analisis komponen utama (principal component analysis / PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi linier sehingga terbentuk sistem koordinat baru dengan varians maksimum. PCA dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan. Analisis komponen utama merupakan suatu tehnik statistik untuk mengubah dari sebagian besar variabel asli yang digunakan yang saling berkorelasi satu dengan yang lainnya menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelasi lagi). Jadi analisis komponen utama berguna untuk mereduksi data, sehingga lebih mudah untuk menginterpretasikan data-data tersebut (Johnson & Wichern, 1982). Analisis komponen utama merupakan analisis antara dari suatu proses penelitian yang besar atau suatu awalan dari analisis berikutnya, bukan merupakan suatu analisis yang langsung berakhir. Misalnya komponen utama bisa merupakan masukan untuk regresi berganda atau analisis faktor. Dilihat secara aljabar linier, komponen utama adalah kombinasi linier-kombinasi linier tertentu dari p peubah acak x1,x2,x3, .,xp. Secara geometris kombinasi linier ini merupakan sistem koordinat baru yang didapat dari rotasi sistem semula dengan x1,x2, .,xp sebagai sumbu koordinat. Sumbu baru tersebut merupakan arah dengan variabilitas maksimum dan memberikan kovariansi yang lebih sederhana. Menurut Johnson dan Dean, Analisis Komponen Utama terkonsentrasi pada penjelasan struktur variansi dan kovariansi melalui suatu kombinasi linear variabel-variabel asal, dengan tujuan utama melakukan reduksi data dan membuat interpretasi. Analisis komponen utama lebih baik digunakan jika variabel-variabel asal saling berkorelasi (1988: 340). Contoh: Examination scores for graduate students in Mathematics
No Diffgeom complex open book 1 2 3 4 36 62 31 76 58 54 42 78 43 50 41 69 algebra close book 36 46 40 66 37 52 29 81 reals statistics

5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

46 12 39 30 22 9 32 40 64 36 24 50 42 2 56 59 28 19 36 54 14

56 42 46 51 32 40 49 62 75 38 46 50 42 35 53 72 50 46 56 57 35

52 38 51 54 43 47 54 51 70 58 44 54 52 32 42 70 50 49 56 59 38

56 38 54 52 28 30 37 40 66 62 55 52 38 22 40 66 42 40 54 62 29

40 28 41 32 22 24 52 49 63 62 49 51 50 16 32 62 63 30 52 58 20

Dengan menggunakan program Minitab, dilakukan analisis data diatas sebagai berikut: Dari menu pilih menu Stat, kemudian pilih Multivariate, dan pilih Principal Components. Sebagai input variabel, masukkan variabel diffgeom, complex, algebra, reals dan statistics. Jumlah komponen yang akan dihitung 5, dengan menggunakan type matriks hubungan Covariance (karena memiliki skala

ukuran yang sama). Output yang dihasilkan sebagai berikut: Statistik Deskriptif
Descriptive Statistics: diffgeom, complex, algebra, reals, statistics
Variable diffgeom complex algebra reals N N* Mean SE Mean StDev Minimum Q1 3.74 2.41 1.95 2.58 18.68 2.00 Median Q3

25 0 36.76 25 0 50.60 25 0 50.68 25 0 46.04

23.00 36.00 52.00 42.00 50.00 56.50 43.00 51.00 55.00 37.50 42.00 55.50

12.07 32.00 9.77 32.00 12.92 22.00

statistics 25 0 43.80 3.30 16.51 16.00 29.50 49.00 55.00 Variable Maximum diffgeom 76.00 complex algebra reals 78.00 70.00 66.00

statistics 81.00

Analisis Komponen Utama


Principal Component Analysis: diffgeom, complex, algebra, reals, statistics
Eigenanalysis of the Correlation Matrix Eigenvalue 4.0812 0.3739 0.2166 0.2048 0.1236 Proportion 0.816 Cumulative 0.816 Variable diffgeom complex PC1 0.075 0.891 PC2 0.043 0.934 PC3 0.041 0.025 0.975 1.000 PC4 PC5

0.443 0.473 -0.352 -0.615 -0.279 0.437 0.616 0.368 0.424 0.339

algebra reals

0.462 -0.276 0.210

0.338 -0.743 0.367 0.347

0.445 -0.470 0.470 -0.476

statistics 0.449 -0.317 -0.690 0.318

Dengan scree plot sebagai berikut:


The image cannot be displayed. Your computer may not have enough memory to open the image, or the image may have been corrupted. Restart your computer, and then open the file again. If the red x still appears, you may have to delete the image and then insert it again.

Terlihat bahwa hanya komponen PC1 yang memiliki varians (atau eigenvalue) lebih besar dari 1, yaitu 4,0812. Komponen pertama ini (PC1) ini dapat menjelaskan 81,6 persen keragaman data. Skor untuk komponen yang dibentuk bisa dihitung dengan melihat nilai koefisien untuk masing-masing variabel. Untuk komponen PC1, skornya bisa dihitung sebagai berikut: PC1 = 0,443 diffgeom + 0.437 complex + 0.462 algebra + 0.445 reals + 0.449 statistics Komponen kedua (PC2) memiliki eigenvalue 0.3739 dan dapat menjelaskan 7,5 persen keragaman. Bersama dengan komponen pertama (PC1), keduanya merepresentasikan 89,1 persen dari keragaman total. Skor untuk PC2 dihitung sebagai berikut: PC2 = 0,473 diffgeom + 0.616 complex 0.276 algebra 0.470 reals 0.317 statistics Penentuan jumlah komponen yang akan digunakan sangat subjektif. Dalam kasus ini, kedua komponen PC1 dan PC2 yang merepresentasikan 89,1 persen keragaman total bisa dinilai telah cukup menangkap struktur data. Atau bahkan hanya dengan menggunakan komponen pertama pun telah cukup menangkap struktur data, jika dilihat dengan kriteria nilai eigenvalue lebih besar dari 1. Komponenkomponen lainnya memiliki proporsi keragaman yang kecil bisa dianggap tidak penting. Analisis Faktor Analisis faktor adalah alat analisis statistik yang dipergunakan untuk mereduksi faktor-faktor yang mempengaruhi suatu variabel menjadi beberapa set indikator saja, tanpa kehilangan informasi yang berarti. Sebagai ilustrasi, terdapat 50 indikator yang diidentifikasi mempunyai pengaruh terhadap keputusan pembelian konsumen. Dengan analisis faktor, ke-50 indikator tersebut akan dikelompokkan menjadi beberapa sub set indikator yang sejenis. Masing-masing kelompok sub set tersebut kemudian diberi nama sesuai dengan indikator yang mengelompok. Pengelompokan berdasarkan kedekatan korelasi antar masing-masing indikator dan penentuan banyaknya sub set berdasarkan nilai eigen values, yang biasanya diambil di atas 1. Analisis faktor digunakan untuk penelitian awal di mana faktor-faktor yang mempengaruhi suatu variabel belum diidentifikasikan secara baik (explanatory research). Konsep dasar analisis faktor: 1. Bukan mengkaitkan antara dependen variabel dengan independen variabel, TAPI membuat REDUKSI atau ABSTRAKSI atau MERINGKAS dari BANYAK variabel menjadi SEDIKIT variabel. 2. Teknik yang digunakan adalah TEKNIK INTERDEPENSI, yakni SELURUH set HUBUNGAN yang interdependen diteliti. Prinsipnya menggunakan KORELASI r = 1 dan r = 0. Dipergunakan dalam hal mengidentifikasi variabel yang berKORELASI dan yang tidak/kecil KORELASI-nya.

3. Analisis Faktor menekankan adanya COMMUNALITY= jumlah varian yang disumbangkan oleh suatu variabel pada variabel lainnya. 4. Kovariasi antar-variabel yang diuraikan akan memunculkan COMMON FACTORS (jumlahnya sedikit) dan UNIQUE FACTORS setiap variabel. (FAKTOR-FAKTOR tidak secara jelas terlihat). 5. Adanya koefisien nilai faktor (factor score coefficient), sehingga faktor 1 menyerab sebagian besar seluruh variabel, faktor 2 menyerab sebagian besar sisa varian setelah diambil untuk faktor 1. Faktor 2 TIDAK berkorelasi dengan faktor 1. Contoh: Dengan menggunakan data pada contoh diatas, kita akan melakukan Analisis Faktor berikut dengan menggunakan program SPSS 16: Dari menu pilih Analyze Data Reduction Factor..

Pilih kelima variabel sebagai variabel analisis. Klik Descriptive, pada bagian Correlation Matrix beri tanda cek pada Coefficient dan KMO and Bartlett s test of sphericity. Klik Continue. Kemudian klik pada Extraction dan pastikan pilihan Analyze pada correlation matrix dan pada bagian Display beri tanda cek pada kedua pilihan. Sebagai kriteria ekstaksi (Extraction) kita akan menggunakan eigenvalue, yaitu Eigenvalues over: 1. Klik Continue. Klik Rotation lalu pilih Varimax dan pada Display pilih Rotated Solution. Klik Continue. Klik Scores, lalu beri tanda cek Save as Variables dengan Method: Regression dan Display factor score coefficient matrix, agar kita bisa melihat nilai variabel/faktor baru yang terbentuk. Klik Continue. Berikut output dari SPSS:
Correlation Matrix

diffgeom

complex

algebra

reals

statistics

Correlation

Diffgeom Complex Algebra Reals Statistics

1.000 .806 .754 .733 .758

.806 1.000 .774 .695 .715

.754 .774 1.000 .841 .838

.733 .695 .841 1.000 .785

.758 .715 .838 .785 1.000

KMO and Bartletts Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .871

Bartletts Test of Sphericity

Approx. ChiSquare Df Sig.

102.847

10 .000

Terlihat bahwa antar kelima variabel tersebut memiliki korelasi yang kuat satu sama lain. Uji Bartlett s Test of Sphericity juga menunjukkan kelima variabel tersebut saling berkorelasi.
Communalities Initial Diffgeom Complex Algebra Reals Statistics 1.000 1.000 1.000 1.000 1.000 Extraction .803 .778 .870 .807 .824

Extraction Method: Principal Component Analysis.

Extraction Communalities mengestimasi variansi setiap variabel yang dijelaskan oleh komponen terbentuk. Dari output terlihat semua variabel memiliki Extraction Communalities yang besar sehingga komponen yang terbentuk (terekstraksi) sudah cukup mewakili variabel-variabel dengan baik.
Total Variance Explained Component Total Initial Eigenvalues % of Variance Cumulative % Total Extraction Sums of Squared Loadings % of Variance Cumulative %

1 2 3 4 5

4.081 .374 .217 .205 .124

81.623 7.477 4.331 4.096 2.473

81.623 89.100 93.431 97.527 100.000

4.081

81.623

81.623

Extraction Method: Principal Component Analysis.

Terlihat bahwa hanya komponen/faktor pertama yang memenuhi kriteria eigenvalue lebih besar dari 1. Komponen pertama memiliki nilai eigenvalue (varians) sebesar 4.081 dan memiliki proporsi keragaman sebesar 81,623 persen dari keragaman total. Jadi untuk mereduksi variabel cukup dengan menggunakan satu komponen/faktor.
The image cannot be displayed. Your computer may not have enough memory to open the image, or the image may have been corrupted. Restart your computer, and then open the file again. If the red x still appears, you may have to delete the image and then insert it again.

Dari screeplot juga jelas terlihat hanya komponen pertama yang memiliki nilai eigenvalue lebih dari 1.
Component Matrixa Component 1 Diffgeom Complex Algebra Reals Statistics .896 .882 .933 .898 .908

Extraction Method: Principal Component Analysis. a. 1 components extracted.

Rotated Component Matrixa a. Only one component was extracted. The solution cannot be rotated.

Hanya satu komponen yang terekstrak, sehingga tidak bisa dirotasi. Dari Component Matrix terlihat bahwa semua variabel berkorelasi kuat dengan komponen pertama.
Component Score Coefficient Matrix Component 1 Diffgeom .220

Complex Algebra Reals Statistics

.216 .229 .220 .222

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores.

Dari Component Score Coefficient Matrix, bisa dihitung skor untuk setiap case, yaitu dengan mengalikan nilai variabel case yang telah distandardisasi dengan koefisien skor faktornya. Faktor_1 = 0.220 diffgeomstd + 0.216 complexstd + 0.229 algebrastd + 0.220 realsstd + 0.222 statisticsstd Seperti halnya dalam Analisis Komponen Utama, penentuan jumlah faktor juga sangat subjektif. Jika kita tidak puas dengan hasil diatas yang hanya mengekstrak satu komponen, maka kita bisa saja membuat kriteria agar terekstrak dua komponen, yaitu dengan menandai pilihan Extract sesuai keinginan pada kotak dialog seperti terlihat pada gambar di bawah ini.
The image cannot be displayed. Your computer may not have enough memory to open the image, or the image may have been corrupted. Restart your computer, and then open the file again. If the red x still appears, you may have to delete the image and then insert it again.

***