Anda di halaman 1dari 10

ANALISIS FAKTOR

(FACTOR ANALYSIS)

Teori Singkat
Analisis faktor adalah analisis statistika yang bertujuan untuk mereduksi dimensi
data dengan cara menyatakan variabel asal sebagai kombinasi linear sejumlah faktor,
sedemikian hingga sejumlah faktor tersebut mampu menjelaskan sebesar mungkin
keragaman data yang dijelaskan oleh variabel asal.

Model analisis faktor adalah :

X1 = c11 F1 + c12 F2 + c13 F3 + ... + c1m Fm + ε 1


X2 = c21 F1 + c22 F2 + c23 F3 + ... + c2m Fm + ε 2
X3 = c31 F1 + c32 F2 + c33 F3 + ... + c3m Fm + ε 3
...
Xp = cp1 F1 + cp2 F2 + cp3 F3 + ... + cpm Fm + ε p

atau
 X1   c1 c1 c12 .3 c.1m  F.1   ε 1 
     
X 2  c2 c21 c2 . 3 c.2m  F.2   ε 2
 X3 =  c3 c31 c32 . 3 c.3m  F.3   ε 3
     
.  . . . . . . .   .   . . .
 X   c c c . c.   F.   ε 
p   p1 p2 p3 p   m  p 
(p x 1) (p x m) (m x1)

dan
X1, X2,..., Xp adalah variabel asal
F1, F2,..., Fm adalah faktor bersama (common factor)
cij adalah bobot (loading) dari variabel asal ke-i pada faktor ke-j
ε 1, ε 2, ..., ε p adalah error

Hubungan antara varians variabel asal dengan, varians faktor dan varians error
adalah sebagai berikut :
var(Xi)= varians yang dijelaskan oleh faktor untuk variabel asal ke-i + var(error)
= communality + specific variance
= hi2 +ψ i
= (ci1 + ci 2 + ci 3 + ... + cim ) +ψ i
2 2 2 2

Besarnya bobot cij dapat diduga dengan menggunakan metode komponen utama
ataupun kemungkinan maksimum (maximum likelihood). Metode komponen utama
terbagi menjadi dua metode yaitu non-iteratif dan iteratif. Nilai dugaan cij yang diperoleh
dengan metode non-iteratif adalah :
a ji λ j
cij = atau cij = a ji λj untuk variabel asal yang dibakukan
s xi
dan
cuj adalah bobot (loading) dari variabel asal ke-i pada faktor ke-j
a ji adalah koefisien variabel asal ke-i untuk komponen utama ke-j
λj adalah eigen value untuk komponen utama ke-j
s x adalah simpangan baku (standard of deviation) variabel asal ke-j
i

Algoritma untuk metode komponen utama iteratif adalah sebagai berikut :


1. Mulai
2
2. Tentukan nilai awal communality untuk seluruh variabel asal ( hi , i=1,...,p),
0 ≤ hi2 ≤ 1
Ganti nilai diagonal matriks korelasi dengan nilai hi ( rii = hi )
2 2
3.
4. Tentukan nilai eigen-value dan eigen-vector dari matriks korelasi
5. Tentukan nilai bobot (loading) cij = a ji λj
Temtukan nilai communality hi = (ci1 + ci 2 + ci 3 + ... + cim )
2 2 2 2 2
6.
7. Jika nilai communality pada dua iterasi terakhir dianggap sama maka pergi ke
9
8. Pergi ke 3
9. Selesai
Untuk kepentingan intepretasi, seringkali diperlukan untuk memberi nama
masing-masing faktor sesuai dengan besar harga mutlak bobot cuj . Diharapkan setiap
variabel asal hanya dominan di salah satu faktor saja (Nilai harga mutlak bobot variabel
asal mendekati 1 di salah satu faktor dan mendekati o untuk faktor lainnya). Harapan ini
kadang-kadang tidak dapat dipenuhi, untuk mengatasi hal ini diperlukan rotasi dari
matriks bobot C. Beberapa macam teknik rotasi yang tersedia di program paket statistika
adalah : varimax, quartimax, equamax, parsimax (MINITAB). Formula untuk masing-
masing rotasi i ni adalah :
 1 m  p  c  2 γ  p c 
2

max ∑ ∑   −  ∑  
ij ij

 p j =1  i =1  hi  p  i =1 hi  

γ rotasi
0 Quartimax
1 Varimax
m/2 Equamax
p ( m −1) parsimax
p +m −2
Matriks bobot hasil rotasi (C*) dapat dinyatakan sebagai C*=CT, T adalah
matriks transformasi.
Besarnya skor faktor dapat dinyatakan sebagai :

F = C' S −1 ( X j − X) , j=1,...,n

Kegiatan Praktikum

Analisis komponen utama dari data kependudukan negara-negara di Asia


MTB > pca c2-c8;
SUBC> ncomp 2.
Eigenanalysis of the Correlation Matrix
Eigenvalue 5.3171 1.1709 0.2921 0.1163 0.0813 0.0195
Proportion 0.760 0.167 0.042 0.017 0.012 0.003
Cumulative 0.760 0.927 0.969 0.985 0.997 1.000
Eigenvalue 0.0027
Proportion 0.000
Cumulative 1.000
Variable PC1 PC2
DENSITY 0.257 -0.668
URBAN 0.393 -0.277
LIFEEXPF 0.422 0.198
LIFEEXPM 0.423 0.136
LITERACY 0.354 0.485
BABYMORT -0.412 -0.233
GDP_CAP 0.357 -0.360

Amalisis Faktor dari data kependudukan Negara-negara di Asia

MTB > factor c2-c8;


SUBC> nfactor 2.
Principal Component Factor Analysis of the Correlation Matrix
Unrotated Factor Loadings and Communalities
Variable Factor1 Factor2 Communality
DENSITY 0.593 -0.723 0.874
URBAN 0.905 -0.299 0.909
LIFEEXPF 0.972 0.214 0.991
LIFEEXPM 0.976 0.147 0.974
LITERACY 0.817 0.525 0.943
BABYMORT -0.951 -0.252 0.967
GDP_CAP 0.823 -0.389 0.829
Variance 5.3171 1.1709 6.4880
% Var 0.760 0.167 0.927

Besarnya bobot untuk faktor1 adalah : λ1 (koefisien PC1)

 0.2  5  0.57  9 3
 0.3  9  0.93  0 5
  
 0.4  2  0.92  7 2
  
5.3  01.4 7 2=  01.93  7 6
 0.3  5  0.84  1 7
  
 − 0.4  1 − 0.92  5 1
 0.3  5  0.87  2 3
  
Besarnya bobot untuk faktor2 adalah : λ2 (koefisien PC2)

Variable Factor1 Factor2


DENSITY 0.593 -0.723
URBAN 0.905 -0.299
LIFEEXPF 0.972 0.214
LIFEEXPM 0.976 0.147
LITERACY 0.817 0.525
BABYMORT -0.951 -0.252
GDP_CAP 0.823 -0.389

Variabel asal (density, urban, lifeexpf, lifeexpm, literacy, babymort, gdp_cap)


dapat dinyatakan dalam kombinasi linear faktor 1 dan faktor 2 sebagai berikut :

 d e  n 0.5 s −90i.7 t 3 y2 3
 u r  b 0.9 a −00n.2 5 9 9
  
 l ei f x e  0.p9 70.2 2 1 4
     F 1 a k t o r
l ei mf x=e  0.p9 70.1 6  4 7
 F 2 a k t o r
 l i t  e  0.8r a10.5 c7 2 y 5
  
 b a   b− 0.9 y 05.2m  15 o 2 r t
 g _ cd  a p0.8 p −20.3 3 8 9
  
Nilai communality untuk density adalah : 0.5932 +(-0.723)2 = 0.874 yang berarti
faktor1 dan faktor2 mampu menjelaskan sebesar 87.4 % keragaman data yang dijelaskan
oleh variabel density.
Dari harga mutlak nilai bobot tiap variable pada tiap faktor, dapat diintepretasikan
bahwa faktor 2 adalah faktor kepadatan penduduk dan faktor 1 adalah faktor urbanisasi
dan kualitas penduduk. Kualitas penduduk semakin baik dicirikan oleh semakin
tingginya lifeexpf, lifeexpm, literacy, gdp_cap dan semakin rendahnya babymort. Dari
contoh ini terlihat bahwa analisis faktor dapat digunakan untuk tujuan pengelompokan
variabel. Hasil pengelompokan variabel dengan menggunakan analisis faktor ini sesuai
dengan hasil pengelompkam variabel dengam menggunakan metode single-linkage.
MTB > Cluv 'DENSITY'-'GDP_CAP';
SUBC> Abscorr;
SUBC> Dendrogram.

Nilai bobot setelah dilakukan rotasi varimax adalah :


MTB > factor c2-c8;
SUBC> nfactor 2;
SUBC> vmax.
Variable Factor1 Factor2
DENSITY 0.058 -0.933
URBAN 0.559 -0.772
LIFEEXPF 0.914 -0.395
LIFEEXPM 0.878 -0.452
LITERACY 0.969 -0.052
BABYMORT -0.918 0.352
GDP_CAP 0.44 -0.797
Hasil pengelompokan variabel dengan menggunakan analisis faktor rotasi
varimax sesuai dengan hasil pengelompokan dengan menggunakan metode complete-
linkage
MTB > Cluv 'DENSITY'-'GDP_CAP';
SUBC> Complete;
SUBC> Abscorr;
SUBC> Dendrogram.
Nilai skor faktor untuk setiap negara di Asia adalah sebagai berikut :
MTB > Factor 'DENSITY'-'GDP_CAP';
SUBC> NFactors 2;
SUBC> Scores c9-c10.
MTB > name c9 'FACT1' C10 'FACT2'
MTB > PRINT C1 C9 C10
Nomer COUNTRY FACT1 FACT2
1 Afghanistan -1.80314 -1.21553
2 Bangladesh -1.16613 -0.83735
3 Cambodia -1.34366 -0.60378
4 China -0.11590 0.81265
5 Hong Kong 1.54091 -2.13451
6 India -0.72722 -0.12959
7 Indonesia -0.35320 0.53269
8 Japan 1.40112 0.18927
9 Malaysia 0.17626 0.70587
10 N. Korea 0.39556 1.00416
11 Pakistan -0.92428 -0.57199
12 Philippines -0.01959 0.74105
13 S. Korea 0.66625 0.50490
14 Singapore 1.52131 -1.65357
15 Taiwan 0.86501 0.55149
16 Thailand 0.05224 1.13501
17 Vietnam -0.16554 0.96922
Nilai skor faktor dengan menggunakan rotasi varimax untuk setiap negara di Asia
adalah sebagai berikut :
MTB > Factor 'DENSITY'-'GDP_CAP';
SUBC> NFactors 2;
SUBC> VMax;
SUBC> Scores c11-c12.
MTB > name c11 'F1' c12 'F2'
MTB > print c1 c11 c12
Nomer COUNTRY F1 F2
1 Afghanistan -2.17348 0.06927
2 Bangladesh -1.43562 0.00324
3 Cambodia -1.44293 0.29653
4 China 0.38149 0.72684
5 Hong Kong 0.00072 -2.63258
6 India -0.66557 0.32040
7 Indonesia 0.02525 0.63865
8 Japan 1.24700 -0.66630
9 Malaysia 0.55594 0.46930
10 N. Korea 0.90832 0.58290
11 Pakistan -1.08422 0.07693
12 Philippines 0.41770 0.61242
13 S. Korea 0.83572 0.01964
14 Singapore 0.26622 -2.23110
15 Taiwan 1.02417 -0.05887
16 Thailand 0.70646 0.88988
17 Vietnam 0.43284 0.88286

Secara visual, hasil pengelompokan Negara-negara di Asia dengan menggunakan


skor komponen ataun skor faktor adalah sama.
Hasil pengelompokan negara-negara di Asia dengan menggunakan analisis
komponen utama dan analisis faktor ternyata sama dengan hasil dari cluster analysis
dengan menggunakan metode complete linkage

* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * *

Dendrogram using Complete Linkage

Rescaled Distance Cluster Combine

C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+

China 4 
Philippines 12 
Vietnam 17 
Malaysia 9 
Indonesia 7  
N. Korea 10  
Thailand 16 

S. Korea 13   
Taiwan 15  

Japan 8  
Hong Kong 5


Singapore 14   
Bangladesh 2  
Cambodia 3  
Pakistan 11   
India 6 

Afghanistan 1 