Anda di halaman 1dari 21

TUGAS PRAKTIKUM 1

“Analisis Komponen Utama”


Diajukan untuk Memenuhi Tugas Mata Kuliah Analisis Multivariat II

Dosen : Titi Purwandari , Dra., MS.

Disusun oleh :

Nabilla Clarissa Salma (140610190015)


Nadiyah Nisrina (140610190022)

Kelas : A

Aslab :

Alisya Aqmarina Adelya Putri

Helni Nurhidayat

PROGRAM STUDI S1 STATISTIKA


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
JATINANGOR
2021
1.RINGKASAN MATERI

Analisis komponen utama merupakan suatu tehnik statistik untuk mengubah dari
sebagian besar variabel asli yang digunakan yang saling berkorelasi satu dengan yang lainnya
menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelas berkorelasi
lagi). Jadi analisis komponen analisis komponen utama berguna untuk mereduksi data,
sehingga lebih mudah untuk menginterpretasikan data-data tersebut (Johnson & Wichern,
1982). Reduksi dimensi dari variabel acak X dilakukan dengan mendefinisikan p-variat
variabel acak baru Y. Model matematisnya dapat dinyatakan dalam bentuk berikut:

Y = W1X1+ W2X2+ … + WpXp

Dimana :
Wi adalah bobot atau koefisien untuk variabel ke i
Xi adalah variabel ke-i
Y adalah kombinasi linier dari variabel X

Banyaknya komponen utama yang terbentuk sama dengan banyaknya variabel asli.
Pereduksian (penyederhanaan) dimensi dilakukan dengan kriteria persentase keragaman data
yang diterangkan oleh beberapa k beberapa komponen u omponen utama pert tama pertama.
Apabila beberapa komponen utama pertama telah menerangkan lebih dari 75% angkan lebih
dari 75% keragaman data asli, keragaman data asli, maka analisis cukup dilakukan sampai
dengan komponen utama tersebut.

Himpunan variabel asal disusun pada vektor acak X dengan vektor rata-rata μ =
(μ1, μ2, … , μp), matriks kovarians Σ, dan eigen values λ1 ≥ λ2 ≥ ⋯ ≥ λp ≥ 0. Sehingga
komponen utama merupakan kombinasi linier yang berbentuk Y = EX dengan:
𝑌1 𝑒11 … 𝑒1𝑝 𝑋1

Y = [ ], E = [ ⋮ ⋱ ⋮ ], X = [ ⋮ ]
𝑌𝑝 𝑒𝑝1 … 𝑒𝑝𝑝 𝑋𝑝

Dari bentuk di atas didapat kombinasi linier komponen utama yaitu sebagai berikut:
Maka Var(Yi ) = ei'Σei dan Cov(Yi,Yk ) = ei'Σei di mana i,k = 1, 2, ... , p.

Syarat untuk membentuk komponen utama yang merupakan kombinasi linier dari
variabel acak X agar mempunyai varians maksimum adalah dengan memilih vektor ciri
(eigen vector) yaitu e = (e1, e2, …, ep) sedemikian sehingga Var(Yi) = ei'Σei maksimum
dan ei'ei = 1.

• Komponen utama pertama adalah kombinasi linear e1'X yang memaksimumkan


Var(e1'X) dengan syarat e1'e1 = 1.
• Komponen utama kedua adalah kombinasi linier e2'X yang memaksimumkan
Var(e2'X) dengan syarat e2'e2 = 1
• Komponen utama ke-i adalah kombinasi linear ei'X yang memaksimumkan Var(ei'X)
dengan syarat ei'ek = 1 dan Cov(ei'ek)=0 untuk k < 1.

Untuk vektor acak X dengan matriks kovarians Σ dan eigenvalue-eigenvector pairs


(λ1, e1),…, (λp, ep) di mana λ1 ≥ λ2 ≥ ⋯ ≥ λp , 𝜎11 + ⋯ + 𝜎𝑝𝑝 = ∑𝑝𝑖=1 𝑉𝑎𝑟(𝑋𝑖 ) = λ1+…+ λp =
∑𝑝𝑖=1 𝑉𝑎𝑟(𝑌𝑖 ) dapat dilihat seberapa baik suatu komponen utama Yi merangkum variabel acak
Xi dengan menggunakan metode berikut:

𝜆𝑘
𝑝
∑𝑖=1 𝜆𝑖

Kemudian dapat diketahui pula korelasi dari variabel acak Xk dengan komponen utama Yi
dengan menggunakan rumus berikut:

𝑒𝑖𝑘 √𝜆
𝑖
𝜌𝑦𝑖,𝑥𝑘 =
√𝜎𝑘𝑘
2.CONTOH KASUS

Tabel 2.1. Pengamatan Bulanan Konsentrasi 𝐂𝐎𝟐 di Atmosfer

Konsentrasi 𝐂𝐎𝟐 Konsentrasi 𝐂𝐎𝟐 Konsentrasi 𝐂𝐎𝟐


Konsentrasi 𝐂𝐎𝟐
bulanan dalam dengan dengan siklus
dengan noise yang
bagian per juta penyesuaian musiman yang
dihilangkan (𝐗 𝟑 )
(𝐗 𝟏 ) musiman (𝐗 𝟐 ) dihapus (𝐗 𝟒 )
316.9 316.88 317.22 317.19
317.7 317.09 317.87 317.26
318.54 317.25 318.63 317.32
319.48 317.15 319.75 317.41
320.58 317.78 320.3 317.49
319.77 317.65 319.69 317.59
318.57 317.87 318.34 317.67
316.79 318.05 316.47 317.76
314.99 317.87 314.94 317.84
315.31 318.31 314.93 317.92
316.1 317.99 316.12 317.99
317.01 317.79 317.29 318.06
319.44 319.42 319.71 319.68
320.44 319.82 320.34 319.71
320.89 319.58 321.08 319.76
322.14 319.77 322.2 319.82
322.16 319.32 322.74 319.9
321.87 319.71 322.13 319.99
321.21 320.5 320.77 320.09
318.87 320.14 318.9 320.2
317.82 320.75 317.39 320.32
317.3 320.35 317.4 320.43
318.87 320.79 318.65 320.55
319.42 320.21 319.88 320.66
320.62 320.61 320.81 320.78
321.59 320.97 321.54 320.91
322.39 321.07 322.34 321.01
322.39 321.68 322.09 321.41
320.36 321.64 320.17 321.48
318.64 321.58 318.59 321.55
318.1 321.16 318.57 321.62
319.79 321.71 319.77 321.68
321.03 321.82 320.96 321.74
322.32 322.31 321.83 321.8
Source: https://www.kaggle.com/ucsandiego/carbon-dioxide
Pada Tabel 2.1. di atas menunujukan data pengamatan bulanan konsentrasi karbon
dioksida (atau CO2) di atmosfer dari Observatorium Mauna Loa (Hawaii) pada garis lintang
19,5, garis bujur -155,6, dan ketinggian 3397 meter yang terdiri dari 4 variabel kelompok
yaitu Konsentrasi CO2 bulanan dalam bagian per juta (X1 ), Konsentrasi CO2 dengan
penyesuaian musiman (X2 ), Konsentrasi CO2 dengan noise yang dihilangkan (X3 ), dan
Konsentrasi CO2 dengan siklus musiman yang dihapus (X4 ). Terdapat sampel sebanyak 34
unit observasi untuk masing-masing variabelnya.

Dari data di atas akan digunakan metode analisis komponen utama untuk mereduksi
data yang berasal dari 4 variabel yang ada menjadi beberapa komponen utama yang paling
berpengaruh dan banyaknya komponen utama tersebut lebih sedikit dari banyaknya jumlah
variabel yang ada, sehingga kedepannya ketika akan dilakukan analisis data secara
multivariate akan menjadi lebih efisien.
Misal :
X1 = Konsentrasi CO2 bulanan dalam bagian per juta
X2 = Konsentrasi CO2 dengan penyesuaian musiman
X3 = Konsentrasi CO2 dengan noise yang dihilangkan
X4 = Konsentrasi CO2 dengan siklus musiman yang dihapus
PENGUJIAN ASUMSI
Sebelumya akan dilakukan pengujian asumsi yaitu uji normalitas multivariat dan uji
homogenitas varians yaitu sebagai berikut.

• Uji Normalitas Data Multivariat Secara Simultan


Asumsi normalitas multivariat artinya residu dari data yang akan dianalisis
menggunakan Analisis Komponen Utama harus berdistribusi normal multivariat.
Pengujian normalitas multivariate akan dilakukan menggunakan Uji Mardia Skewness
dan Mardia Kurtosis, dengan langkah – langkah pengujian adalah sebagai berikut :

Hipotesis

H0 : Data pengamatan bulanan konsentrasi CO2 berdistribusi normal multivariat

H1 : Data pengamatan bulanan konsentrasi CO2 tidak berdistribusi normal multivariat

Taraf Signifikan

𝛼 = 5%

Statistik Uji

Dengan menggunakan syntax pada software R

#input data

> setwd("D:/Documents/")

> data = read.csv("konsentrasi.csv", header = T, sep = ";")

> attach(data)

#asumsi normalitas

> library(MVN)

> summary(data)

X1 X2 X3 X4

Min. :315.0 Min. :316.9 Min. :314.9 Min. :317.2

1st Qu.:317.9 1st Qu.:317.9 1st Qu.:318.0 1st Qu.:317.9

Median :319.5 Median :319.8 Median :319.7 Median :319.9

Mean :319.4 Mean :319.6 Mean :319.4 Mean :319.6

3rd Qu.:321.0 3rd Qu.:320.9 3rd Qu.:320.9 3rd Qu.:320.9

Max. :322.4 Max. :322.3 Max. :322.7 Max. :321.8


> mvn(data=data, mvnTest="mardia")

$multivariateNormality

Test Statistic p value Result

1 Mardia Skewness 8.25280904078767 0.990058674949821 YES

2 Mardia Kurtosis -1.89536248334424 0.0580443954202434 YES

3 MVN <NA> <NA> YES

$univariateNormality

Test Variable Statistic p value Normality

1 Shapiro-Wilk X1 0.9601 0.2442 YES

2 Shapiro-Wilk X2 0.9289 0.0290 NO

3 Shapiro-Wilk X3 0.9636 0.3079 YES

4 Shapiro-Wilk X4 0.8844 0.0018 NO

$Descriptives

n Mean Std.Dev Median Min Max 25th 75th Skew

X1 34 319.3941 2.100915 319.460 314.99 322.39 317.8900 320.9950 -0.2924096

X2 34 319.6056 1.650141 319.795 316.88 322.31 317.9000 320.9250 -0.1577933

X3 34 319.3944 2.114628 319.730 314.93 322.74 317.9875 320.9225 -0.3545287

X4 34 319.6056 1.609325 319.945 317.19 321.80 317.8600 320.8775 -0.2240288

Kurtosis

X1 -0.9361822

X2 -1.4117648

X3 -0.7752302

X4 -1.5304532
Kriteria Uji

Tolak H0 jika p-value < 𝛼 Bersarkan hasil output multivariate normality, residu dapat
dikatakan berdistribusi normal apabila p – value Mardia Skewness dan p – value Mardia
Kurtosis < 𝛼. Apabila salah satu di antaranya tidak memenuhi kriteria tersebut, maka
residu dikatakan tidak berdistribusi normal. Hal yang demikian berlaku juga pada hasil
output univariate normality (Shapiro - Wilk) Data dikatakan berdistribusi normal (H0
Diterima ) jika : -1,96 < Skewnees & Kurtosis z-values < +1,96.

Kesimpulan

Dari hasil perhitungan menggunakan software R di atas pada output “Multivariate


Normality”, terlihat bahwa pada Uji Skewness dan Kurtosis menghasilkan p-value yang
lebih besar dari pada taraf signifikannya yaitu 5%, selain itu pada kolom result
menunjukan hasil “yes” sehingga H0 diterima, artinya dengan taraf signifikan 5%
pendapat mendukung bahwa data pengamatan bulanan konsentrasi CO2 di atmosfer pada
tabel 4.1 yang terdiri dari 4 variabel memiliki distribusi normal multivariat, sehingga
untuk asumsi yang pertama terpenuhi

• Uji Homogenitas Varians


Asumsi homogenitas varians akan dilakukan menggunakan Uji Bartlett test dengan
langkah – langkah pengujian adalah sebagai berikut :
Hipotesis
H0 : Ke-4 variabel pada data memiliki varians yang homogen
H1 : Ke-4 variabel pada data memiliki varians yang heterogen (berbeda secara signifikan)

Taraf Signifikan

𝛼 = 5%

Statistik Uji

Dengan menggunakan syntax pada software R


> variabel=as.factor(rep(c("X1","X2","X3","X4"),each=34))

> dataCO2=c(X1,X2,X3,X4)

> data2=data.frame(variabel,dataCO2)

> bartlett.test(dataCO2~variabel,data2)
Bartlett test of homogeneity of variances

data: dataCO2 by variabel

Bartlett's K-squared = 4.2848, df = 3, p-value = 0.2323

Kriteria Uji

Tolak H0 jika p – value < 𝛼

Kesimpulan

Dari Uji Bartlett pada output software R di atas menghasilkan p-value yang lebih
besar dari pada taraf signifikannya (0.2323 > 0.05) maka H0 diterima, artinya dengan
taraf signifikan 5% pendapat mendukung bahwa ke-4 variabel tersebut memiliki varians
yang homogen (tidak berbeda secara signifikan), sehingga untuk asumsi yang kedua
terpenuhi.
ANALISIS KOMPONEN UTAMA

Karena asumsi normalitas maupun asumsi homogenitas keduanya sama-sama


terpenuhi maka analisis komponen utama dapat dilanjutkan melalui langkah-langkah sebagai
berikut:

1. Input data
2. Mengubah data ke dalam vector
3. Mengubah data vektor ke dalam matriks (m x n)
4. Mencari matriks varians kovarians
• Untuk populasi
2 2 2
𝜎11 𝜎12 … 𝜎1𝑝
𝜎2 2
𝜎22 2
… 𝜎2𝑝
Σ = 21
⋮ ⋮ ⋱ ⋮
2 2 2
[𝜎𝑝1 𝜎𝑝2 … 𝜎𝑝𝑝 ]
• Untuk sampel
2 2 2
𝑠11 𝑠12 … 𝑠1𝑝
𝑠2 2
𝑠22 2
… 𝑠2𝑝
∆ = 21
⋮ ⋮ ⋱ ⋮
2 2 2
[𝑠𝑝1 𝑠𝑝2 … 𝑠𝑝𝑝 ]
5. Mencari nilai eigen (𝜆)

Nilai eigen menggambarkan varians data

𝜆1 0 … 0
0 𝜆2 … ⋮
𝜆= [ ]
⋮ ⋮ ⋱ ⋮
0 … … 𝜆𝑝
6. Mencari vektor eigen (𝑣)

|𝛴 − 𝜆𝐼| = 0

Keterangan :

𝜆 : nilai eigen

𝐼 : matriks identitas

𝛴 : nilai matriks
7. Membuat persamaan kombinasi linear dari variabel-variabel baru

𝑌=𝑧𝑥𝑣

𝑌𝑝 = 𝑎̃𝑝′ 𝑥̃ = 𝑎𝑝1 𝑥1 + 𝑎𝑝2 𝑥2 + ⋯ + 𝑎𝑝𝑝 𝑥𝑝

• Untuk populasi, varians sama dengan nilai eigen nya


𝜎11 = 𝜎22 = 𝜎33 = 𝜆11 = 𝜆22 = 𝜆33
• Untuk sampel, standar deviasi sama dengan nilai eigen nya
𝑠11 = 𝑠22 = 𝑠33 = 𝜆11 = 𝜆22 = 𝜆33

8. Mencari proporsi tiap variable

𝜆𝑘
𝜏𝑘 = 𝑝
∑𝑖=1 𝜆𝑖

9. Mencari kumulatif proporsi


𝜏 = 𝜏1 + 𝜏2 …..

10. Mencari nilai korelasi masing-masing antara variabel baru dan komponen utama

𝑒𝑖𝑘 √𝜆
𝑖
𝜌𝑦𝑖,𝑥𝑘 =
√𝜎𝑘𝑘

11. Membuat matriks korelasi


• Untuk populasi

𝜌𝑦1,𝑥1 𝜌𝑦2,𝑥1 … 𝜌𝑦𝑖 ,𝑥𝑘


𝜌𝑦 ,𝑥 𝜌𝑦2,𝑥2 … ⋮
𝑅 = [ 1⋮ 2 ⋮ ⋱ ⋮ ]
𝜌𝑦𝑖 ,𝑥𝑘 … … 𝜌𝑦𝑖 ,𝑥𝑘

• Untuk sampel

𝑟𝑦1,𝑥1 𝑟𝑦2,𝑥1 … 𝑟𝑦𝑖 ,𝑥𝑘


𝑟𝑦 ,𝑥 𝑟𝑦2,𝑥2 … ⋮
𝑅 = [ 1⋮ 2 ⋮ ⋱ ⋮ ]
𝑟𝑦𝑖 ,𝑥𝑘 … … 𝑟𝑦𝑖 ,𝑥𝑘
Perhitungan Analisis Komponen Utama dilakukan dengan menggunakan software R
sebagai berikut :

1. Input Data ke dalam software R


Dengan menggunakan syntax pada software R
> data<-read.csv(file.choose(),header=T,sep=";")

> attach(data)

> str(data)

'data.frame': 34 obs. of 4 variables:

$ X1: num 317 318 319 319 321 ...

$ X2: num 317 317 317 317 318 ...

$ X3: num 317 318 319 320 320 ...

$ X4: num 317 317 317 317 317 ...

> head(data)

X1 X2 X3 X4

1 316.90 316.88 317.22 317.19

2 317.70 317.09 317.87 317.26

3 318.54 317.25 318.63 317.32

4 319.48 317.15 319.75 317.41

5 320.58 317.78 320.30 317.49

6 319.77 317.65 319.69 317.59

Standarisasi Data

Standarisasi data bertujuan untuk menyamakan satuan, jadi nilai standar tidak lagi
tergantung pada satuan pengukuran melainkan menjadi nilai baku.

> data_standardized<-scale(x=data)

> data_standardized

X1 X2 X3 X4

[1,] -1.18715790 -1.65173067 -1.0282718 -1.50099423

[2,] -0.80637141 -1.52446880 -0.7208890 -1.45749775

[3,] -0.40654558 -1.42750738 -0.3614877 -1.42021505


[4,] 0.04087855 -1.48810827 0.1681564 -1.36429100

[5,] 0.56445998 -1.10632268 0.4282495 -1.31458073

⋮ ⋮ ⋮ ⋮ ⋮

[30,] -0.35894727 1.19651106 -0.3804035 1.20821538

[31,] -0.61597816 0.94198733 -0.3898615 1.25171186

[32,] 0.18843332 1.27529221 0.1776144 1.28899456

[33,] 0.77865239 1.34195319 0.7403612 1.32627726

[34,] 1.39267061 1.63889754 1.1517812 1.36355996

attr(,"scaled:center")

X1 X2 X3 X4

319.3941 319.6056 319.3944 319.6056

attr(,"scaled:scale")

X1 X2 X3 X4

2.100915 1.650141 2.114628 1.609325

2. Menghitung Nilai Matriks Varians dan Kovarians


> data_covariance<-cov(data_standardized)

> data_covariance

X1 X2 X3 X4

X1 1.0000000 0.5346448 0.9915288 0.5458177

X2 0.5346448 1.0000000 0.5016128 0.9866080

X3 0.9915288 0.5016128 1.0000000 0.5336965

X4 0.5458177 0.9866080 0.5336965 1.0000000

3. Menghitung Nilai Eigen


> data_eigen<-eigen(data_covariance)

> data_eigen

eigen() decomposition

$values

[1] 3.047118e+00 9.317165e-01 2.114443e-02 2.154701e-05


$vectors

[,1] [,2] [,3] [,4]

[1,] 0.5042646 -0.4869041 -0.4497319 0.5535186

[2,] 0.4958508 0.5123283 -0.5436778 -0.4427936

[3,] 0.4968681 -0.5116481 0.4249978 -0.5574184

[4,] 0.5029626 0.4885288 0.5670384 0.4322450

Output yang dihasilkan dari fungsi eigen terdiri atas :

• Value yaitu nilai eigen yang sudah diurutkan dari yang tertinggi ke yang
terendah. Nilai ini bisa digunakan untuk melihat seberapa besar varians yang
dapat dijelaskan oleh komponen utama.
• Vectors yaitu vektor eigen. Nilai ini merupakan nilai loadings yang digunakan
untuk membuat persamaan komponen utama.

4. Analisis Komponen Utama


> fit_pca=princomp(data_standardized,cor=FALSE)

> summary(fit_pca)

Importance of components:

Comp.1 Comp.2 Comp.3 Comp.4

Standard deviation 1.7197373 0.9509538 0.143256871 4.573103e-03

Proportion of Variance 0.7617794 0.2329291 0.005286106 5.386751e-06

Cumulative Proportion 0.7617794 0.9947085 0.999994613 1.000000e+00

Interpretasi

Proporsi varians kumulatif Komponen pertama dapat menjelaskan 76% total


varians dan bila ditambahkan komponen kedua menjadi 99.4% dan bila ditambahkan
komponen ketiga menjadi 99.9%,Artinya kita cukup mengambil dua komponen saja
yaitu komponen pertama dan kedua.

> loadings(fit_pca)

Loadings:

Comp.1 Comp.2 Comp.3 Comp.4

X1 0.504 0.487 0.450 0.554

X2 0.496 -0.512 0.544 -0.443


X3 0.497 0.512 -0.425 -0.557

X4 0.503 -0.489 -0.567 0.432

Comp.1 Comp.2 Comp.3 Comp.4

SS loadings 1.00 1.00 1.00 1.00

Proportion Var 0.25 0.25 0.25 0.25

Cumulative Var 0.25 0.50 0.75 1.00

Interpretasi

Nilai-nilai loading yang ditampilkan pada hasil di atas adalah nilai vektor
eigen dari matriks kovarians,Sehingga Fungsi komponen utamanya adalah sebagai
berikut :

AKU1 = 0.504 X1 + 0.496 X2 + 0.497 X 3 + 0.503 X4

AKU2 = 0.487 X1 − 0.512 X2 + 0.512 X 3 − 0.489 X4

AKU3 = 0.450 X1 + 0.544 X2 − 0.425 X 3 − 0.567 X4

AKU4 = 0.554 X1 − 0.443 X2 − 0.557 X 3 + 0.432 X4

5. Plot Analisis Komponen Utama


> plot(fit_pca,type="l")
Interpretasi

Dari scree plot tersebut terlihat bahwa kurva mulai landai pada titik comp 3
artinya bahwa dengan dua komponen saja sudah mencukupi untuk mewakili keempat
variabel tersebut.

Perhitungan Analisis Komponen Utama dilakukan dengan menggunakan function


pada software R sebagai berikut :

> PCA=function(x, standardize=FALSE){

+ data=as.matrix(x)

+ S = cov(data)

+ if(standardize == TRUE){

+ S = cor(data)

+ }

+ eigen_val = eigen(S)$values

+ eigen_vec = eigen(S)$vector

+ n = length(eigen_val)

+ prop = c()

+ for (i in (1:n)){

+ prop[i] = (eigen_val[i])/sum(eigen_val)

+ }

+ q = length(prop)

+ propcum = c()

+ for (i in 1:q){

+ propcum[i]=sum(prop[1:i])

+ }

+ p = nrow(eigen_vec)

+ corr = matrix(0,p,p)

+ for (i in (1:p)){
+ for (j in (1:p)){

+ corr[i,j] = (eigen_vec[i,j]*sqrt(eigen_val[i]))/S[j,j]

+ }

+ }

+ plot(eigen_val, main="Scree Plot", type="o")

+ hasil = list("Matriks Varkov/Korelasi"=S, "Eigen Value"=eigen_val,

+ "Eigen Vector"=eigen_vec, "Proporsi Komponen"=prop,

+ "Proporsi Kumulatif Komponen"=propcum, "Matriks


Korelasi Y dan X"=corr)

+ print(hasil)

+ }

> PCA(data_standardized)

$`Matriks Varkov/Korelasi`

X1 X2 X3 X4

X1 1.0000000 0.5346448 0.9915288 0.5458177

X2 0.5346448 1.0000000 0.5016128 0.9866080

X3 0.9915288 0.5016128 1.0000000 0.5336965

X4 0.5458177 0.9866080 0.5336965 1.0000000

$`Eigen Value`

[1] 3.047118e+00 9.317165e-01 2.114443e-02 2.154701e-05

$`Eigen Vector`

[,1] [,2] [,3] [,4]

[1,] 0.5042646 -0.4869041 -0.4497319 0.5535186

[2,] 0.4958508 0.5123283 -0.5436778 -0.4427936

[3,] 0.4968681 -0.5116481 0.4249978 -0.5574184

[4,] 0.5029626 0.4885288 0.5670384 0.4322450


$`Proporsi Komponen`

[1] 7.617794e-01 2.329291e-01 5.286106e-03 5.386751e-06

$`Proporsi Kumulatif Komponen`

[1] 0.7617794 0.9947085 0.9999946 1.0000000

$`Matriks Korelasi Y dan X`

[,1] [,2] [,3] [,4]

[1,] 0.88024402 -0.84993947 -0.785051724 0.966221849

[2,] 0.47862224 0.49452725 -0.524787555 -0.427408580

[3,] 0.07225020 -0.07439938 0.061799454 -0.081054889

[4,] 0.00233469 0.00226769 0.002632121 0.002006427

Output

1. Matrix Korelasi
Matrix korelasi yang dihasilkan dari data pada terlihat bahwa hubungan/korelasi
yang memiliki tingkat keeratan cukup erat adalah :

• Variabel Konsentrasi CO2 bulanan dalam bagian per juta (X1) dengan
Variabel Konsentrasi CO2 dengan noise yang dihilangkan (X3), dengan nilai
korelasi sebesar 0.9915288
• Variabel Konsentrasi CO2 dengan penyesuaian musiman (X2) dengan
Variabel Konsentrasi CO2 dengan siklus musiman yang dihapus (X4),
dengan nilai korelasi sebesar 0.9866080
• Variabel Konsentrasi CO2 dengan noise yang dihilangkan (X3) dengan
Variabel Konsentrasi CO2 bulanan dalam bagian per juta (X1), dengan nilai
korelasi sebesar 0.9915288
• Variabel Konsentrasi CO2 dengan siklus musiman yang dihapus (X4) dengan
Variabel Konsentrasi CO2 dengan penyesuaian musiman (X2), dengan nilai
korelasi sebesar 0.9866080
2. Fungsi Komponen Utama
Karena data pada data memiliki 4 variabel, maka akan menghasilkan 4 nilai
eigen dan 4 vektor eigen dengan dimensi 4×1, dari vector eigen yang dihasilkan
maka akan terbentuk 4 fungsi komponen utama yaitu sebagai berikut :
AKU1 = 0.504 X1 + 0.496 X2 + 0.497 X3 + 0.503 X4

AKU2 = 0.487 X1 − 0.512 X2 + 0.512 X3 − 0.489 X4

AKU3 = 0.450 X1 + 0.544 X2 − 0.425 X3 − 0.567 X4

AKU4 = 0.554 X1 − 0.443 X2 − 0.557 X3 + 0.432 X4


3. Kumulatif Proporsi Pengaruh Komponen Utama terhadap Data
Proporsi varians kumulatif Komponen pertama dapat menjelaskan 76% total
varians dan bila ditambahkan komponen kedua menjadi 99.4% dan bila
ditambahkan komponen ketiga menjadi 99.9%,Artinya kita cukup mengambil dua
komponen saja yaitu komponen pertama dan kedua.Dengan dua komponen utama
saja sudah mencukupi untuk mewakili keempat variabel tersebut berikut nilai
(score) komponen utama dengan menggunakan function pada software R

PCA Score
> #PCA SCORE

> baku=function(X){

+ x=as.matrix(X)

+ n=nrow(x)

+ p=ncol(x)

+ a=matrix(0,n,p)

+ for (j in (1:p)) {

+ for (i in (1:n)) {

+ a[i,j]=(x[i,j]-mean(x[,j]))/sd(x[,j])

+ }

+ }

+ print(a)

+ }

> baku(data_standardized)

[,1] [,2] [,3] [,4]

[1,] -1.18715790 -1.65173067 -1.0282718 -1.50099423

[2,] -0.80637141 -1.52446880 -0.7208890 -1.45749775

[3,] -0.40654558 -1.42750738 -0.3614877 -1.42021505

[4,] 0.04087855 -1.48810827 0.1681564 -1.36429100


[5,] 0.56445998 -1.10632268 0.4282495 -1.31458073

[6,] 0.17891366 -1.18510383 0.1397826 -1.25244289

[7,] -0.39226609 -1.05178188 -0.4986277 -1.20273263

[8,] -1.23951605 -0.94270028 -1.3829441 -1.14680857

[9,] -2.09628566 -1.05178188 -2.1064758 -1.09709831

[10,] -1.94397107 -0.78513797 -2.1112048 -1.04738804

[11,] -1.56794440 -0.97906081 -1.5484579 -1.00389155

[12,] -1.13479976 -1.10026259 -0.9951690 -0.96039507

[13,] 0.02183923 -0.11246812 0.1492406 0.04623786

[14,] 0.49782235 0.12993543 0.4471654 0.06487921

[15,] 0.71201475 -0.01550670 0.7971088 0.09594813

[16,] 1.30699365 0.09963499 1.3267529 0.13323083

[17,] 1.31651332 -0.17306901 1.5821170 0.18294110

[18,] 1.17847821 0.06327446 1.2936501 0.23886515

[19,] 0.86432935 0.54202147 0.6505109 0.30100298

[20,] -0.24947115 0.32385827 -0.2338056 0.36935460

[21,] -0.74925343 0.69352369 -0.9478793 0.44392000

[22,] -0.99676465 0.45112014 -0.9431504 0.51227162

[23,] -0.24947115 0.71776404 -0.3520297 0.58683703

[24,] 0.01231956 0.36627890 0.2296330 0.65518864

[25,] 0.58349931 0.60868245 0.6694267 0.72975405

[26,] 1.04520294 0.82684564 1.0146412 0.81053323

[27,] 1.42598943 0.88744653 1.3929584 0.87267107

[28,] 1.42598943 1.25711195 1.2747343 1.12122241

[29,] 0.45974370 1.23287159 0.3667730 1.16471889

[30,] -0.35894727 1.19651106 -0.3804035 1.20821538

[31,] -0.61597816 0.94198733 -0.3898615 1.25171186

[32,] 0.18843332 1.27529221 0.1776144 1.28899456

[33,] 0.77865239 1.34195319 0.7403612 1.32627726

[34,] 1.39267061 1.63889754 1.1517812 1.36355996


3.KESIMPULAN
Maka kesimpulan yang bisa didapatkan dari hasil reduksi data di atas baik secara
manual maupun dengan function sofwere R adalah cukup dengan 2 komponen utama yaitu X1
dan X2, dengan besar kontribusi yang dihasilkan adalah sebesar 99.4% bisa mewakili ke-4
variabel yang ada. Sehingga jika kedepannya akan dilakukan analisis secara multivariat
(deskriptif maupun inferensial) tidak perlu sebanyak 4 variabel untuk menganalisisnya, tetapi
cukup dengan 2 komponen tadi hasil analisis akan memberikan informasi yang cukup untuk
mewakili ke-4 variabel tersebut dan proses analisis akan menjadi lebih efisien.Kedua fungsi
komponen utama yang dipakai tersebut adalah sebagai berikut :

Fungsi Komponen Utama yang terbentuk

AKU1 = 0.504 X1 + 0.496 X2 + 0.497 X3 + 0.503 X4

AKU2 = 0.487 X1 − 0.512 X2 + 0.512 X3 − 0.489 X4

Anda mungkin juga menyukai