ABSTRAK
Pada makalah ini dibahas tentang analisa beberapa sektor saham yang ada di Indonesia. Data diambil dari
Bursa Efek Jakarta ( BEJ ) dan menggunakan data pada bulan Januari 2008 sampai dengan Januari 2010.
Analisa menggunakan PCA (Principal Component Analysis). Metode ini dilakukan dengan cara menyusun
matriks kovariansi dari data.Variabel mula-mula X ditransformasi menjadi variabel baru Y dengan P=XY dan
P adalah matriks yang vektor-vektor kolomnya adalah vektor eigen dari matriks kovariansi. Vektor eigen dari
nilai eigen terbesar disebut komponen prinsip dan merupakan bobot penyusun variabel baru sebagai
kombinasi linear dari variabel yang lama.
Data menunjukkan bahwa ada 8 variabel sebagai sektor sektor yang memiliki nilai sahan cukup tinggi.
Variabel tersebut adalah pertanian, industri dasar, aneka industri, barang konsumsi, keuangan, pertambangan,
properti, dan perdagangan. Seluruh variabel diuji untuk mendapatkan variabel yang dominan. Diperoleh
bahwa properti dan perdagangan adalah variabel yang dominan yang ditunjukkan dengan variansi terbesar
melalui Principal Component Analysis. Jika variabel distandarisasi maka tidak dapat ditunjukkan variabel
yang dominan.
Kata Kunci : komponen prinsip, nilai eigen, vektor eigen.
PENDAHULUAN
Saham merupakan bagian terpenting didalam dunia bisnis dan cukup menjanjikan. Keuntungan
yang didapat dari menanamkan uang dalam bentuk uang cukup besar, begitu pula kerugian yang
dapat diterima. Oleh karena itu banyak orang berlomba lomba untuk menanamkan sebagian
kekayaan yang dimiliki dalam bentuk saham. Saham sendiri terbagi kedalam beberapa sektor /
bidang seperti pertanian, industri, pertambangan, keuangan, konsumsi / bahan pangan, property dan
perdagangan. Penulis melakukan observasi data di website bursa efek untuk mengetahui variabel
yang dapat memberikan keuntungan cukup besar dan meminimalkan kerugian yang didapat.
Agar semua variabel yang ada pada data saham tersebut dapat diketahui mana yang berpengaruh
terhadap untung rugi yang didapat maka penulis mencari variabel variabel yang dominan terhadap
saham tersebut. Semua variabel dominan yang mempengaruhi nilai saham tersebut dipilih
menggunakan metode Principal Component Analisys ( PCA ).
658
Pada makalah ini teori yang digunakan ditunjukkan pada bagian PCA sedangkan penjelasan metode
yang digunakan ditunjukkan pada Bab 3. Hasil analisa dijelaskan pada Bab 4 dan kesimpulan
dituliskan pada bagian akhir makalah ini.
PCA (PRINCIPAL COMPONENT ANALYSIS)
PCA telah digunakan oleh berbagai peneliti untuk memilih variabel yang dominan agar variabel
yang banyak dapat tereduksi. Sebagai salah satu contoh adalah mencari variabel dominan pada
berbagai jenis variabel pakan yang diberikan pada sapi untuk mengenali variabel yang dominan
yang berpengaruh terhadap berat sapi optimum untuk memproduksi susu sapi ( Parhusip dan
Siska. 2009). Teori yang telah diulas pada literatur tersebut ditulis kembali pada makalah
ini. Akan tetapi pada makalah ini ditambahkan penyusunan komponen prinsip dengan PCA
untuk variabel yang telah distandarisasi.
Secara aljabar PCA merupakan suatu kombinasi linear khusus untuk p variabel random X1, . . . , Xp.
Secara geometri, kombinasi linear menyatakan pemilihan sistem koordinat baru yang diperoleh dari
merotasi sistem mula-mula X1, . . . , Xp sebagai sumbu-sumbu koordinat. Sumbu koordinat yang
baru sangat tergantung dari matriks kovariansi (atau matrik korelasi). Matriks kovariansi pada
makalah ini disimbolkan
Definisi 1.
dan haruslah positif tegas (positive definite). Istilah ini dijelaskan pada
Definisi 1: (Peressini,1988)
Misalkan
sebuah matriks simetri
maka matriks
positif (negatif) tegas
(definite positive (negative)) jika dan hanya jika semua nilai eigennya positif (negatif) . Sedangkan
mattriks yang semipositif (seminegatif) tegas jika dan hanya jika semua nilai eigennya taknegatif
(takpositif) .
Teorema 2. (Johnson , and Wichern, 2002)
Sebutlah matriks X = [X1, . . . , Xp] adalah matriks yang vektor-vektor kolomnya adalah vektor
random (dianggap berdistribusi normal) yang mempunyai matriks kovariansi
positif tegas (positive definite)) dengan nilai eigen
(simetris dan
adalah
i= 1,2,...,p .
(1.a)
, i =1,2,...,p ,
)=
(1.b)
(1.c)
yang saling ortogonal adalah bahwa kita dapat menyusun kombinasi linear
dengan basis {
}. Jika beberapa
ada yang sama maka pemilihan vektor eigen ada yang
sama. Sebenarnya dapat dipilih vektor eigen yang berbeda dengan menggunakan generalisasi vektor
eigen (generalized eigenvector) tetapi tidak dibahas pada makalah ini. Oleh karena itu
tunggal.
659
tidak
dan
adalah
dan
(1.d)
menyatakan variansi populasi yang ke-ii.
Bukti :
Diketahui dari aljabar linear bahwa jumlahan elemen diagonal dari suatu matriks disebut sebagai
trace (tr) matriks tersebut (Lay,2003). Dalam hal ini berarti
.
Kita dapat menuliskan
adalah
dan P =
Jadi
.
Akibat 1 menyatakan bahwa total variansi populasi =
menyatakan ukuran pentingnya variabel ke-k terhadap komponen prinsip ke-i. Secara
khusus,
menyatakan korelasi antara komponen-komponen
ditunjukkan pada Teorema 5.
dan variabel-variabel
. Hal ini
Teorema 5.
Jika
X,
kovariansi
maka
X,...,
660
i,k =1,2,...,p
dan variabel-variabel
(2a)
.
(2b)
=
Komponen prinsip secara geometri memenuhi persamaan ellipsoida
dan
. Matriks
, c : konstan .
Karena
(2c)
(3)
Untuk selanjutnya akan ditentukan variabel dominan yang mempengaruhi nilai saham di berbagai
sektor maka dapat digunakan PCA dengan menyusun matriks kovariansi terlebih dahulu dengan
mengasumsikan bahwa data disimpan dalam sebuah vektor random X dimana elemen baris
menyatakan N observasi X= [X1...Xp] dan banyaknya kolom menyatakan p variabel X1, . . . , Xp
pada matriks p x N. Rata-rata untuk vektor X didefinisikan sebagai
.
Akan dicari
untuk k=1....p, dimana:
Sehingga kolom matriks N x p dapat ditulis sebagai:
(4.a)
(4.b)
B=[
...
]
(4.c)
dimana B merupakan bentuk deviasi rata-rata untuk setiap X yang diperoleh dari persamaan (4.b).
Sedangkan matriks kovariansi matriks adalah p x p matriks S yang didefinisikan sebagai:
(4.d)
661
merupakan matriks positive definite (nilai eigen matriks tersebut semua positif) sesuai dengan
Teorema 1.
Total variansi didefinisikan sebagai jumlahan semua variansi sebagaimana ditunjukkan pada
persamaan (1.d). Hal ini diperoleh dengan cara jumlahan dari elemen diagonal matriks S. Jumlahan
dari semua diagonal matriks S yang dikuadratkan merupakan trace dari matriks S ( tr(S) ) .
Nilai eigen dari S harus diurutkan dari besar ke kecil agar diketahui variabel apa yang paling
dominan yang mempengaruhi nilai saham.
Untuk selanjutnya perlu disusun matriks P = X Y dengan P adalah matriks yang terdiri dari vektorvektor kolom dari setiap vektor eigen yang diperoleh. Vektor eigen ini diperoleh dengan
menyelesaikan
, i = 1,...,p
dengan n banyaknya sampel saham. Sedangkan nilai eigen
dengan menyelesaikan persamaan karakteristik yaitu det(S-
(5a)
perlu diperoleh terlebih dahulu
(5b)
(V1/2)-1 =
(5c)
(5d)
(5e).
(V1/2)-1 (X -
) , i =1,2,..., p .
diberikan
(5g)
Selain itu
dan
,
i,k = 1,2, ... , p.
Pada Teorema ini nilai eigen dan vektor eigen diperoleh dari matriks korelasi (5f).
662
(5h)
Agar PCA dapat diperkenalkan dengan jelas berikut ini diberikan contoh penggunaaannya dengan
menggunakan bantuan MATLAB.
Contoh : Misal data yang diperoleh saham dari sektor Pertanian, Industri Dasar, Aneka Industri dan
Barang Konsumsi ditunjukkan pada Tabel 1.
2008
2009
2010
Akhir Periode
Pertanian
Industri Dasar
Aneka Industri
Barang Konsumsi
2006
1218.45
147.1
284.12
392.46
2007
2754.76
238.05
477.35
436.04
September
1489.57
162.93
326.15
381.36
Oktober
738.17
112.18
199.97
321.92
November
803.89
114.45
215.82
320.9
Desember
918.77
134.99
214.94
326.84
Januari
969.43
126.39
246.57
337.85
Februari
1046.64
124.08
220.41
346.16
Maret
1094.59
134.66
287.9
352.8
April
1333.25
151.15
316.67
381.32
Mei
1576.52
182.05
362.72
433.73
Juni
1527
192.92
416.21
495.73
Juli
1659.55
222.8
504.6
591.2
Agustus
1797.12
229.12
538.05
559.18
September
1784.21
238.46
584.96
597.63
Oktober IV
1823.1
256.83
572.19
591.66
November I
1733.43
260.78
533.45
595.51
November II
1760.16
259.53
267.64
608.09
November III
1786.82
263.74
578.61
631.32
November IV
1745.19
252.88
261.22
625.73
Desember I
1838.58
260.48
271.65
661.59
Desember II
1831.67
264.47
587.64
651.07
Desember III
1785.5
268.77
598.88
654.62
Desember IV
1753.09
273.93
601.47
671.31
Januari I
1952.19
284.24
596.89
684.48
Januari II
1935.65
283.42
624.27
690.27
Januari III
1901.58
282.08
595.27
702.4
Januari IV
1850.31
280.11
626.53
699.78
663
Tahun
2008
2009
2010
0.4423
0.5175
0.4535
0.5587
2007
1.0000
0.8375
0.7619
0.6208
September
0.5407
0.5732
0.5206
0.5429
Oktober
0.268
0.3947
0.3192
0.4583
November
0.2918
0.4027
0.3445
0.4569
Desember
0.3335
0.4749
0.3431
0.4653
Januari
0.3519
0.4447
0.3935
0.481
Februari
0.3799
0.4365
0.3518
0.4928
Maret
0.3973
0.4738
0.4595
0.5023
April
0.0484
0.5318
0.5054
0.5429
Mei
0.5723
0.6405
0.5789
0.6175
Juni
0.5543
0.6787
0.6643
0.7058
Juli
0.6024
0.7838
0.8054
0.8417
Agustus
0.6524
0.8061
0.8588
0.7961
September
0.6477
0.8389
0.9337
0.8508
Oktober IV
0.6618
0.9036
0.9133
0.8423
November I
0.6292
0.9175
0.8514
0.8478
November II
0.639
0.9131
0.4272
0.8657
November III
0.6486
0.9279
0.9235
0.8988
November IV
0.6335
0.8897
0.4169
0.8908
Desember I
0.6674
0.9164
0.4336
0.9419
Desember II
0.6649
0.9304
0.9379
0.9269
Desember III
0.6482
0.9456
0.9559
0.932
Desember IV
0.6364
0.9637
0.96
0.9557
Januari I
0.7087
1.0000
0.9527
0.9745
Januari II
0.7027
0.9971
0.9964
0.9827
Januari III
0.6903
0.9924
0.9501
1.0000
Januari IV
0.6717
0.9855
1.0000
0.9963
664
Data pada Tabel 1 perlu dinyatakan dalam bentuk tak berdimensi. Hal ini dilakukan dengan cara
membagi data tiap baris dengan maksimum per baris yang ditunjukkan pada Tabel 2.
Matriks kovariansi dari Tabel 2 dapat dicari dengan menghitung rata-rata data tiap baris yang
disebut dalam vektor M dan dicari matriks deviasi B menggunakan bantuan MATLAB. Sehingga
matriks kovariansinya adalah
S=
Setelah matriks kovariansi(S) diperoleh, maka dapat dicari nilai eigennya. yaitu
(persamaan 5b) dengan
menggunakan
bantuan
harus memenuhi
, agar
=0 (Lay,2003).
MATLAB
maka
dapat
diperoleh
dan
nilai
eigen
diperoleh
nilai
vektor eigen
dan
=-0.0383;
=0.3852;
665
=0.0267;
= 0.9425.
Tahun
2008
2009
Akhir
Periode
Pertania
n
2006
1218.45
147.1
284.12
392.46
206.57
2007
2754.76
238.05
477.35
436.04
September
1489.57
162.93
326.15
Properti
Perdagangan
933.33
122.92
275.08
260.57
3270.09
251.82
392.24
381.36
203.37
1833.24
142.42
261.33
Oktober
738.17
112.18
199.97
321.92
151.79
1095.87
101.35
158.76
November
803.89
114.45
215.82
320.9
150.9
897.51
105.63
137.78
Desember
918.77
134.99
214.94
326.84
176.33
877.68
103.49
148.33
Januari
969.43
126.39
246.57
337.85
161.24
922.16
96.03
147.6
Februari
1046.64
124.08
220.41
346.16
145.95
963.89
96.56
147.9
Maret
1094.59
134.66
287.9
352.8
172.71
1045.31
100.54
161.37
April
1333.25
151.15
316.67
381.32
215.73
1444.46
112.32
185.56
Mei
1576.52
182.05
362.72
433.73
227.65
1818.96
130.99
205.21
Juni
1527
192.92
416.21
495.73
243.66
1848.54
144.79
217.84
Juli
1659.55
222.8
504.6
591.2
272.79
2144.91
159398
250.01
Agustus
1797.12
229.12
538.05
559.18
280.46
2140.43
157.96
259.85
September
Oktober
IV
November
I
November
II
November
III
November
IV
Desember
I
Desember
II
1784.21
238.46
584.96
597.63
300.7
2238.59
162.29
277.4
1823.1
256.83
572.19
591.66
288.32
2231.36
159.22
272.33
1733.43
260.78
533.45
595.51
293.81
2068.46
156.21
256.74
1760.16
259.53
267.64
608.09
296.37
2129.23
152.96
256.38
1786.82
263.74
578.61
631.32
298.2
2230.38
153.95
264.14
1745.19
252.88
261.22
625.73
293.48
2129.87
143.64
248.47
1838.58
260.48
271.65
661.59
301.75
2248.63
147.95
255.4
1831.67
264.47
587.64
651.07
300.32
2211.08
146.86
260.62
666
2010
Desember
III
Desember
IV
1785.5
268.77
598.88
654.62
296.4
2152.68
144.28
267.77
1753.09
273.93
601.47
671.31
301.42
2203.48
146.8
275.76
Januari I
1952.19
284.24
596.89
684.48
306.24
2409.81
150.37
287.02
Januari II
1935.65
283.42
624.27
690.27
310.84
2375.03
154.26
306.99
Januari III
1901.58
282.08
595.27
702.4
311.05
2294.4
152.99
301.17
Januari IV
1850.31
280.11
626.53
699.78
311.66
2236.4
153.49
299.44
0.0292
0.0471
0.0445
0.0420
0.0402
0.0354
0.0011
0.0268
0.0285
0.0445
0.0644
0.0397
0.0382
0.0346
0.0047
0.0280
0.0229
0.0420
0.0397
0.0398
0.0363
0.0286
0.0034
0.0213
0.0250
0.0402
0.0382
0.0363
0.0356
0.0303
0.0024
0.0232
0.0287
0.0354
0.0346
0.0286
0.0303
0.0346
0.0031
0.0256
0.0010
0.0011
0.0047
0.0034
0.0024
0.0031
0.0357
0.0008
0.0227
0.0268
0.0280
0.0213
0.0232
0.0256
0.0008
0.0238
Tampak bahwa matriks kovariansi S adalah matriks simetris. Kita dapat mencari nilai eigen
sebagaimana ditunjukkan pada Teori Ujinormalitas dan dengan menggunakan bantuan MATLAB
maka nilai eigen adalah
Sedangkan vektor eigen untuk tiap nilai eigen diperoleh berturut-turut ditunjukkan pada tiap kolom
pada Tabel 5 dan dapat ditunjukkan bahwa vektor eigen tersebut saling ortonormal.
Tabel 5. Nilai Vektor eigen untuk data Tabel 3.
0.4043
-0.6881
0.0070
0.5947
-0.0354
-0.0487
-0.0402
-0.0635
0.6699
0.3835
0.0086
-0.0871
-0.2525
-0.5485
0.0456
-0.1726
0.1841
-0.2473
0.0249
-0.3955
0.8242
-0.2184
0.0044
-0.1445
-0.1714
-0.0466
-0.0667
0.1113
0.0760
-0.5459
0.0324
0.8043
-0.2206
0.3426
-0.5731
0.5286
0.3240
-0.1750
0.0360
-0.2987
0.4298
-0.0002
-0.6643
-0.2029
0.0055
0.4399
0.1035
0.3585
-0.0566
-0.0703
0.0763
0.0152
-0.0212
-0.0096
0.9910
-0.0563
0.2965
0.4402
0.4683
0.3861
0.3800
0.3562
0.0336
0.2785
Menurut Bab 2, maka perlu didefinisikan variabel random yang disusun berdasarkan vektor-vektor
kolom dari matriks kovariansi S, yaitu
667
Karena komponen prinsip yang terpenting adalah yang pertama maka komponen prinsip pertama
adalah
Dapat ditunjukkan bahwa
dan
dan
= 0.0442;
= 0.3266.
dan
) = 0.
= 0.0419;
= 0.2132;
( properti ) dan
= 0.0027
= 0.0301;
= 0.9931;
= 0.8682.
-0.1618,
dengan
-0.1421,
-0.1521,
-0.1607,
-0.1573 ,
-0.0132 dan
-0.1496. Kita menyimpulkan bahwa semua
variabel mempunyai makna yang sama atau tidak ada yang dominan.
668
Dari hasil ini disimpulkan bahwa menggunakan standardisasi variabel tidak dapat menunjukkan
dominasi salah satu variabel. Hal ini juga ditunjukkan pada literatur (Johnson and Wichern, 2002) .
Pemilihan variabel dengan standarisasi dilakukan bila data mempunyai perbedaan yang sangat
signifikan ataupun dengan satuan yang berbeda. Hal ini belum diselidiki lebih lanjut.
KESIMPULAN DAN SARAN
Pada makalah ini telah ditunjukkan pemilihan variabel dominan dengan menggunakan Principal
Component Analysis untuk 8 variabel .Variabel tersebut adalah pertanian, industri dasar, aneka
industri, barang konsumsi, keuangan, pertambangan, properti, dan perdagangan. Seluruh variabel
diuji untuk mendapatkan variabel yang dominan. Diperoleh bahwa properti dan perdagangan adalah
variabel yang dominan yang ditunjukkan dengan variansi terbesar melalui Principal Component
Analysis.
Analisa dapat pula dilakukan dengan menstandarisasi variabel menggunakan persamaan (5c)
sehingga komponen prinsip merupakan kombinasi linear antar variabel yang telah distandarisasi
menurut Teorema 6. Diperoleh bahwa dominasi variabel tidak dapat dikenali.
DAFTAR PUSTAKA
[1] Johnson ,R.A., and Wichern, D.W. 2002. Applied Multivariate Statistical Analysis, 6th ed.
Prentice Hall, ISBN 0-13-187715-1.
[2] Lay, D. C. 2003. Linear Algebra and Ist Applications, Third Edition, Addison Wesley, pp.482491.
[3]
Parhusip H. A., dan Siska A. 2009. Principal Component Analysis (PCA) untuk
Analisis Perlakukan Pemberian Pakan dan Mineral terhadap Produksi Susu Sapi,
Prosiding Seminar Nasioanal Matematika UNPAR, ISSN 1907-3909, Vol 4, hal.AA
42-51.
[3] Peressini, A.L., Sullivan, F.E.,Uhl, J.J.,1988. The Mathematics of Nonlinear Programming,
Springer-Verlag, New-York.
http //: bankindonesia/statistic/moneter/semi11
669