A TUGAS 1 Kelompok 12

TUGAS PRAKTIKUM 1
“Analisis Komponen Utama”

Diajukan untuk Memenuhi Tugas Mata Kuliah Analisis Multivariat II
Dosen : Titi Purwandari , Dra., MS.
Disusun oleh :
Nabilla Clarissa Salma (140610190015)

Nadiyah Nisrina (140610190022)
Kelas : A
Aslab :
Alisya Aqmarina Adelya Putri
Helni Nurhidayat
PROGRAM STUDI S1 STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
JATINANGOR
2021
1.RINGKASAN MATERI
Analisis komponen utama merupakan suatu tehnik statistik untuk mengubah dari
sebagian besar variabel asli yang digunakan yang saling berkorelasi satu dengan yang lainnya
menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelas berkorelasi
lagi). Jadi analisis komponen analisis komponen utama berguna untuk mereduksi data,
sehingga lebih mudah untuk menginterpretasikan data-data tersebut (Johnson & Wichern,
1982). Reduksi dimensi dari variabel acak X dilakukan dengan mendefinisikan p-variat
variabel acak baru Y. Model matematisnya dapat dinyatakan dalam bentuk berikut:
Y = W1X1+ W2X2+ … + WpXp
Dimana :
Wi adalah bobot atau koefisien untuk variabel ke i
Xi adalah variabel ke-i
Y adalah kombinasi linier dari variabel X
Banyaknya komponen utama yang terbentuk sama dengan banyaknya variabel asli.
Pereduksian (penyederhanaan) dimensi dilakukan dengan kriteria persentase keragaman data
yang diterangkan oleh beberapa k beberapa komponen u omponen utama pert tama pertama.
Apabila beberapa komponen utama pertama telah menerangkan lebih dari 75% angkan lebih
dari 75% keragaman data asli, keragaman data asli, maka analisis cukup dilakukan sampai
dengan komponen utama tersebut.
Himpunan variabel asal disusun pada vektor acak X dengan vektor rata-rata μ =
(μ1, μ2, … , μp), matriks kovarians Σ, dan eigen values λ1 ≥ λ2 ≥ ⋯ ≥ λp ≥ 0. Sehingga
komponen utama merupakan kombinasi linier yang berbentuk Y = EX dengan:
𝑌1 𝑒11 … 𝑒1𝑝 𝑋1
⋮
Y = [ ], E = [ ⋮ ⋱ ⋮ ], X = [ ⋮ ]
𝑌𝑝 𝑒𝑝1 … 𝑒𝑝𝑝 𝑋𝑝
Dari bentuk di atas didapat kombinasi linier komponen utama yaitu sebagai berikut:
Maka Var(Yi ) = ei'Σei dan Cov(Yi,Yk ) = ei'Σei di mana i,k = 1, 2, ... , p.
Syarat untuk membentuk komponen utama yang merupakan kombinasi linier dari
variabel acak X agar mempunyai varians maksimum adalah dengan memilih vektor ciri
(eigen vector) yaitu e = (e1, e2, …, ep) sedemikian sehingga Var(Yi) = ei'Σei maksimum
dan ei'ei = 1.
• Komponen utama pertama adalah kombinasi linear e1'X yang memaksimumkan

Var(e1'X) dengan syarat e1'e1 = 1.
• Komponen utama kedua adalah kombinasi linier e2'X yang memaksimumkan
Var(e2'X) dengan syarat e2'e2 = 1
• Komponen utama ke-i adalah kombinasi linear ei'X yang memaksimumkan Var(ei'X)
dengan syarat ei'ek = 1 dan Cov(ei'ek)=0 untuk k < 1.
Untuk vektor acak X dengan matriks kovarians Σ dan eigenvalue-eigenvector pairs

(λ1, e1),…, (λp, ep) di mana λ1 ≥ λ2 ≥ ⋯ ≥ λp , 𝜎11 + ⋯ + 𝜎𝑝𝑝 = ∑𝑝𝑖=1 𝑉𝑎𝑟(𝑋𝑖 ) = λ1+…+ λp =
∑𝑝𝑖=1 𝑉𝑎𝑟(𝑌𝑖 ) dapat dilihat seberapa baik suatu komponen utama Yi merangkum variabel acak
Xi dengan menggunakan metode berikut:
𝜆𝑘
𝑝
∑𝑖=1 𝜆𝑖
Kemudian dapat diketahui pula korelasi dari variabel acak Xk dengan komponen utama Yi
dengan menggunakan rumus berikut:
𝑒𝑖𝑘 √𝜆
𝑖
𝜌𝑦𝑖,𝑥𝑘 =
√𝜎𝑘𝑘
2.CONTOH KASUS
Tabel 2.1. Pengamatan Bulanan Konsentrasi 𝐂𝐎𝟐 di Atmosfer
Konsentrasi 𝐂𝐎𝟐 Konsentrasi 𝐂𝐎𝟐 Konsentrasi 𝐂𝐎𝟐

Konsentrasi 𝐂𝐎𝟐
bulanan dalam dengan dengan siklus
dengan noise yang
bagian per juta penyesuaian musiman yang
dihilangkan (𝐗 𝟑 )
(𝐗 𝟏 ) musiman (𝐗 𝟐 ) dihapus (𝐗 𝟒 )
316.9 316.88 317.22 317.19
317.7 317.09 317.87 317.26
318.54 317.25 318.63 317.32
319.48 317.15 319.75 317.41
320.58 317.78 320.3 317.49
319.77 317.65 319.69 317.59
318.57 317.87 318.34 317.67
316.79 318.05 316.47 317.76
314.99 317.87 314.94 317.84
315.31 318.31 314.93 317.92
316.1 317.99 316.12 317.99
317.01 317.79 317.29 318.06
319.44 319.42 319.71 319.68
320.44 319.82 320.34 319.71
320.89 319.58 321.08 319.76
322.14 319.77 322.2 319.82
322.16 319.32 322.74 319.9
321.87 319.71 322.13 319.99
321.21 320.5 320.77 320.09
318.87 320.14 318.9 320.2
317.82 320.75 317.39 320.32
317.3 320.35 317.4 320.43
318.87 320.79 318.65 320.55
319.42 320.21 319.88 320.66
320.62 320.61 320.81 320.78
321.59 320.97 321.54 320.91
322.39 321.07 322.34 321.01
322.39 321.68 322.09 321.41
320.36 321.64 320.17 321.48
318.64 321.58 318.59 321.55
318.1 321.16 318.57 321.62
319.79 321.71 319.77 321.68
321.03 321.82 320.96 321.74
322.32 322.31 321.83 321.8
Source: https://www.kaggle.com/ucsandiego/carbon-dioxide
Pada Tabel 2.1. di atas menunujukan data pengamatan bulanan konsentrasi karbon
dioksida (atau CO2) di atmosfer dari Observatorium Mauna Loa (Hawaii) pada garis lintang
19,5, garis bujur -155,6, dan ketinggian 3397 meter yang terdiri dari 4 variabel kelompok
yaitu Konsentrasi CO2 bulanan dalam bagian per juta (X1 ), Konsentrasi CO2 dengan
penyesuaian musiman (X2 ), Konsentrasi CO2 dengan noise yang dihilangkan (X3 ), dan
Konsentrasi CO2 dengan siklus musiman yang dihapus (X4 ). Terdapat sampel sebanyak 34
unit observasi untuk masing-masing variabelnya.
Dari data di atas akan digunakan metode analisis komponen utama untuk mereduksi
data yang berasal dari 4 variabel yang ada menjadi beberapa komponen utama yang paling
berpengaruh dan banyaknya komponen utama tersebut lebih sedikit dari banyaknya jumlah
variabel yang ada, sehingga kedepannya ketika akan dilakukan analisis data secara
multivariate akan menjadi lebih efisien.
Misal :
X1 = Konsentrasi CO2 bulanan dalam bagian per juta
X2 = Konsentrasi CO2 dengan penyesuaian musiman
X3 = Konsentrasi CO2 dengan noise yang dihilangkan
X4 = Konsentrasi CO2 dengan siklus musiman yang dihapus
PENGUJIAN ASUMSI
Sebelumya akan dilakukan pengujian asumsi yaitu uji normalitas multivariat dan uji
homogenitas varians yaitu sebagai berikut.
• Uji Normalitas Data Multivariat Secara Simultan

Asumsi normalitas multivariat artinya residu dari data yang akan dianalisis
menggunakan Analisis Komponen Utama harus berdistribusi normal multivariat.
Pengujian normalitas multivariate akan dilakukan menggunakan Uji Mardia Skewness
dan Mardia Kurtosis, dengan langkah – langkah pengujian adalah sebagai berikut :
Hipotesis
H0 : Data pengamatan bulanan konsentrasi CO2 berdistribusi normal multivariat
H1 : Data pengamatan bulanan konsentrasi CO2 tidak berdistribusi normal multivariat
Taraf Signifikan
𝛼 = 5%
Statistik Uji
Dengan menggunakan syntax pada software R
#input data
> setwd("D:/Documents/")
> data = read.csv("konsentrasi.csv", header = T, sep = ";")
> attach(data)
#asumsi normalitas
> library(MVN)
> summary(data)
X1 X2 X3 X4
Min. :315.0 Min. :316.9 Min. :314.9 Min. :317.2
1st Qu.:317.9 1st Qu.:317.9 1st Qu.:318.0 1st Qu.:317.9
Median :319.5 Median :319.8 Median :319.7 Median :319.9
Mean :319.4 Mean :319.6 Mean :319.4 Mean :319.6
3rd Qu.:321.0 3rd Qu.:320.9 3rd Qu.:320.9 3rd Qu.:320.9
Max. :322.4 Max. :322.3 Max. :322.7 Max. :321.8

> mvn(data=data, mvnTest="mardia")
$multivariateNormality
Test Statistic p value Result
1 Mardia Skewness 8.25280904078767 0.990058674949821 YES
2 Mardia Kurtosis -1.89536248334424 0.0580443954202434 YES
3 MVN <NA> <NA> YES
$univariateNormality
Test Variable Statistic p value Normality
1 Shapiro-Wilk X1 0.9601 0.2442 YES
2 Shapiro-Wilk X2 0.9289 0.0290 NO
3 Shapiro-Wilk X3 0.9636 0.3079 YES
4 Shapiro-Wilk X4 0.8844 0.0018 NO
$Descriptives
n Mean Std.Dev Median Min Max 25th 75th Skew
X1 34 319.3941 2.100915 319.460 314.99 322.39 317.8900 320.9950 -0.2924096
X2 34 319.6056 1.650141 319.795 316.88 322.31 317.9000 320.9250 -0.1577933
X3 34 319.3944 2.114628 319.730 314.93 322.74 317.9875 320.9225 -0.3545287
X4 34 319.6056 1.609325 319.945 317.19 321.80 317.8600 320.8775 -0.2240288
Kurtosis
X1 -0.9361822
X2 -1.4117648
X3 -0.7752302
X4 -1.5304532
Kriteria Uji
Tolak H0 jika p-value < 𝛼 Bersarkan hasil output multivariate normality, residu dapat
dikatakan berdistribusi normal apabila p – value Mardia Skewness dan p – value Mardia
Kurtosis < 𝛼. Apabila salah satu di antaranya tidak memenuhi kriteria tersebut, maka
residu dikatakan tidak berdistribusi normal. Hal yang demikian berlaku juga pada hasil
output univariate normality (Shapiro - Wilk) Data dikatakan berdistribusi normal (H0
Diterima ) jika : -1,96 < Skewnees & Kurtosis z-values < +1,96.
Kesimpulan
Dari hasil perhitungan menggunakan software R di atas pada output “Multivariate

Normality”, terlihat bahwa pada Uji Skewness dan Kurtosis menghasilkan p-value yang
lebih besar dari pada taraf signifikannya yaitu 5%, selain itu pada kolom result
menunjukan hasil “yes” sehingga H0 diterima, artinya dengan taraf signifikan 5%
pendapat mendukung bahwa data pengamatan bulanan konsentrasi CO2 di atmosfer pada
tabel 4.1 yang terdiri dari 4 variabel memiliki distribusi normal multivariat, sehingga
untuk asumsi yang pertama terpenuhi
• Uji Homogenitas Varians

Asumsi homogenitas varians akan dilakukan menggunakan Uji Bartlett test dengan
langkah – langkah pengujian adalah sebagai berikut :
Hipotesis
H0 : Ke-4 variabel pada data memiliki varians yang homogen
H1 : Ke-4 variabel pada data memiliki varians yang heterogen (berbeda secara signifikan)
Taraf Signifikan
𝛼 = 5%
Statistik Uji

> variabel=as.factor(rep(c("X1","X2","X3","X4"),each=34))
> dataCO2=c(X1,X2,X3,X4)
> data2=data.frame(variabel,dataCO2)
> bartlett.test(dataCO2~variabel,data2)
Bartlett test of homogeneity of variances
data: dataCO2 by variabel
Bartlett's K-squared = 4.2848, df = 3, p-value = 0.2323
Kriteria Uji
Tolak H0 jika p – value < 𝛼
Kesimpulan
Dari Uji Bartlett pada output software R di atas menghasilkan p-value yang lebih
besar dari pada taraf signifikannya (0.2323 > 0.05) maka H0 diterima, artinya dengan
taraf signifikan 5% pendapat mendukung bahwa ke-4 variabel tersebut memiliki varians
yang homogen (tidak berbeda secara signifikan), sehingga untuk asumsi yang kedua
terpenuhi.
ANALISIS KOMPONEN UTAMA
Karena asumsi normalitas maupun asumsi homogenitas keduanya sama-sama

terpenuhi maka analisis komponen utama dapat dilanjutkan melalui langkah-langkah sebagai
berikut:
1. Input data
2. Mengubah data ke dalam vector
3. Mengubah data vektor ke dalam matriks (m x n)
4. Mencari matriks varians kovarians
• Untuk populasi
2 2 2
𝜎11 𝜎12 … 𝜎1𝑝
𝜎2 2
𝜎22 2
… 𝜎2𝑝
Σ = 21
⋮ ⋮ ⋱ ⋮
2 2 2
[𝜎𝑝1 𝜎𝑝2 … 𝜎𝑝𝑝 ]
• Untuk sampel
2 2 2
𝑠11 𝑠12 … 𝑠1𝑝
𝑠2 2
𝑠22 2
… 𝑠2𝑝
∆ = 21
⋮ ⋮ ⋱ ⋮
2 2 2
[𝑠𝑝1 𝑠𝑝2 … 𝑠𝑝𝑝 ]
5. Mencari nilai eigen (𝜆)
Nilai eigen menggambarkan varians data
𝜆1 0 … 0
0 𝜆2 … ⋮
𝜆= [ ]
⋮ ⋮ ⋱ ⋮
0 … … 𝜆𝑝
6. Mencari vektor eigen (𝑣)
|𝛴 − 𝜆𝐼| = 0
Keterangan :
𝜆 : nilai eigen
𝐼 : matriks identitas
𝛴 : nilai matriks
7. Membuat persamaan kombinasi linear dari variabel-variabel baru
𝑌=𝑧𝑥𝑣
𝑌𝑝 = 𝑎̃𝑝′ 𝑥̃ = 𝑎𝑝1 𝑥1 + 𝑎𝑝2 𝑥2 + ⋯ + 𝑎𝑝𝑝 𝑥𝑝
• Untuk populasi, varians sama dengan nilai eigen nya

𝜎11 = 𝜎22 = 𝜎33 = 𝜆11 = 𝜆22 = 𝜆33
• Untuk sampel, standar deviasi sama dengan nilai eigen nya
𝑠11 = 𝑠22 = 𝑠33 = 𝜆11 = 𝜆22 = 𝜆33
8. Mencari proporsi tiap variable
𝜆𝑘
𝜏𝑘 = 𝑝
∑𝑖=1 𝜆𝑖
9. Mencari kumulatif proporsi

𝜏 = 𝜏1 + 𝜏2 …..
10. Mencari nilai korelasi masing-masing antara variabel baru dan komponen utama
𝑒𝑖𝑘 √𝜆
𝑖
𝜌𝑦𝑖,𝑥𝑘 =
√𝜎𝑘𝑘
11. Membuat matriks korelasi

• Untuk populasi
𝜌𝑦1,𝑥1 𝜌𝑦2,𝑥1 … 𝜌𝑦𝑖 ,𝑥𝑘

𝜌𝑦 ,𝑥 𝜌𝑦2,𝑥2 … ⋮
𝑅 = [ 1⋮ 2 ⋮ ⋱ ⋮ ]
𝜌𝑦𝑖 ,𝑥𝑘 … … 𝜌𝑦𝑖 ,𝑥𝑘
• Untuk sampel
𝑟𝑦1,𝑥1 𝑟𝑦2,𝑥1 … 𝑟𝑦𝑖 ,𝑥𝑘

𝑟𝑦 ,𝑥 𝑟𝑦2,𝑥2 … ⋮
𝑅 = [ 1⋮ 2 ⋮ ⋱ ⋮ ]
𝑟𝑦𝑖 ,𝑥𝑘 … … 𝑟𝑦𝑖 ,𝑥𝑘
Perhitungan Analisis Komponen Utama dilakukan dengan menggunakan software R
sebagai berikut :
1. Input Data ke dalam software R

> data<-read.csv(file.choose(),header=T,sep=";")
> attach(data)
> str(data)
'data.frame': 34 obs. of 4 variables:
$ X1: num 317 318 319 319 321 ...
$ X2: num 317 317 317 317 318 ...
$ X3: num 317 318 319 320 320 ...
$ X4: num 317 317 317 317 317 ...
> head(data)
X1 X2 X3 X4
1 316.90 316.88 317.22 317.19
2 317.70 317.09 317.87 317.26
3 318.54 317.25 318.63 317.32
4 319.48 317.15 319.75 317.41
5 320.58 317.78 320.30 317.49
6 319.77 317.65 319.69 317.59
Standarisasi Data
Standarisasi data bertujuan untuk menyamakan satuan, jadi nilai standar tidak lagi
tergantung pada satuan pengukuran melainkan menjadi nilai baku.
> data_standardized<-scale(x=data)
> data_standardized
X1 X2 X3 X4
[1,] -1.18715790 -1.65173067 -1.0282718 -1.50099423
[2,] -0.80637141 -1.52446880 -0.7208890 -1.45749775
[3,] -0.40654558 -1.42750738 -0.3614877 -1.42021505

[4,] 0.04087855 -1.48810827 0.1681564 -1.36429100
[5,] 0.56445998 -1.10632268 0.4282495 -1.31458073
⋮ ⋮ ⋮ ⋮ ⋮
[30,] -0.35894727 1.19651106 -0.3804035 1.20821538
[31,] -0.61597816 0.94198733 -0.3898615 1.25171186
[32,] 0.18843332 1.27529221 0.1776144 1.28899456
[33,] 0.77865239 1.34195319 0.7403612 1.32627726
[34,] 1.39267061 1.63889754 1.1517812 1.36355996
attr(,"scaled:center")
X1 X2 X3 X4
319.3941 319.6056 319.3944 319.6056
attr(,"scaled:scale")
X1 X2 X3 X4
2.100915 1.650141 2.114628 1.609325
2. Menghitung Nilai Matriks Varians dan Kovarians

> data_covariance<-cov(data_standardized)
> data_covariance
X1 X2 X3 X4
X1 1.0000000 0.5346448 0.9915288 0.5458177
X2 0.5346448 1.0000000 0.5016128 0.9866080
X3 0.9915288 0.5016128 1.0000000 0.5336965
X4 0.5458177 0.9866080 0.5336965 1.0000000
3. Menghitung Nilai Eigen

> data_eigen<-eigen(data_covariance)
> data_eigen
eigen() decomposition
$values
[1] 3.047118e+00 9.317165e-01 2.114443e-02 2.154701e-05

$vectors
[,1] [,2] [,3] [,4]
[1,] 0.5042646 -0.4869041 -0.4497319 0.5535186
[2,] 0.4958508 0.5123283 -0.5436778 -0.4427936
[3,] 0.4968681 -0.5116481 0.4249978 -0.5574184
[4,] 0.5029626 0.4885288 0.5670384 0.4322450
Output yang dihasilkan dari fungsi eigen terdiri atas :
• Value yaitu nilai eigen yang sudah diurutkan dari yang tertinggi ke yang
terendah. Nilai ini bisa digunakan untuk melihat seberapa besar varians yang
dapat dijelaskan oleh komponen utama.
• Vectors yaitu vektor eigen. Nilai ini merupakan nilai loadings yang digunakan
untuk membuat persamaan komponen utama.
4. Analisis Komponen Utama

> fit_pca=princomp(data_standardized,cor=FALSE)
> summary(fit_pca)
Importance of components:
Comp.1 Comp.2 Comp.3 Comp.4
Standard deviation 1.7197373 0.9509538 0.143256871 4.573103e-03
Proportion of Variance 0.7617794 0.2329291 0.005286106 5.386751e-06
Cumulative Proportion 0.7617794 0.9947085 0.999994613 1.000000e+00
Interpretasi
Proporsi varians kumulatif Komponen pertama dapat menjelaskan 76% total

varians dan bila ditambahkan komponen kedua menjadi 99.4% dan bila ditambahkan
komponen ketiga menjadi 99.9%,Artinya kita cukup mengambil dua komponen saja
yaitu komponen pertama dan kedua.
> loadings(fit_pca)
Loadings:
X1 0.504 0.487 0.450 0.554
X2 0.496 -0.512 0.544 -0.443

X3 0.497 0.512 -0.425 -0.557
X4 0.503 -0.489 -0.567 0.432
SS loadings 1.00 1.00 1.00 1.00
Proportion Var 0.25 0.25 0.25 0.25
Cumulative Var 0.25 0.50 0.75 1.00
Interpretasi
Nilai-nilai loading yang ditampilkan pada hasil di atas adalah nilai vektor
eigen dari matriks kovarians,Sehingga Fungsi komponen utamanya adalah sebagai
berikut :
AKU1 = 0.504 X1 + 0.496 X2 + 0.497 X 3 + 0.503 X4
AKU2 = 0.487 X1 − 0.512 X2 + 0.512 X 3 − 0.489 X4
AKU3 = 0.450 X1 + 0.544 X2 − 0.425 X 3 − 0.567 X4
AKU4 = 0.554 X1 − 0.443 X2 − 0.557 X 3 + 0.432 X4
5. Plot Analisis Komponen Utama

> plot(fit_pca,type="l")
Interpretasi
Dari scree plot tersebut terlihat bahwa kurva mulai landai pada titik comp 3
artinya bahwa dengan dua komponen saja sudah mencukupi untuk mewakili keempat
variabel tersebut.
Perhitungan Analisis Komponen Utama dilakukan dengan menggunakan function

pada software R sebagai berikut :
> PCA=function(x, standardize=FALSE){
+ data=as.matrix(x)
+ S = cov(data)
+ if(standardize == TRUE){
+ S = cor(data)
+ }
+ eigen_val = eigen(S)$values
+ eigen_vec = eigen(S)$vector
+ n = length(eigen_val)
+ prop = c()
+ for (i in (1:n)){
+ prop[i] = (eigen_val[i])/sum(eigen_val)
+ }
+ q = length(prop)
+ propcum = c()
+ for (i in 1:q){
+ propcum[i]=sum(prop[1:i])
+ }
+ p = nrow(eigen_vec)
+ corr = matrix(0,p,p)
+ for (i in (1:p)){
+ for (j in (1:p)){
+ corr[i,j] = (eigen_vec[i,j]*sqrt(eigen_val[i]))/S[j,j]
+ }
+ }
+ plot(eigen_val, main="Scree Plot", type="o")
+ hasil = list("Matriks Varkov/Korelasi"=S, "Eigen Value"=eigen_val,
+ "Eigen Vector"=eigen_vec, "Proporsi Komponen"=prop,
+ "Proporsi Kumulatif Komponen"=propcum, "Matriks

Korelasi Y dan X"=corr)
+ print(hasil)
+ }
> PCA(data_standardized)
$`Matriks Varkov/Korelasi`
X1 X2 X3 X4
X1 1.0000000 0.5346448 0.9915288 0.5458177
X2 0.5346448 1.0000000 0.5016128 0.9866080
X3 0.9915288 0.5016128 1.0000000 0.5336965
X4 0.5458177 0.9866080 0.5336965 1.0000000
$`Eigen Value`
[1] 3.047118e+00 9.317165e-01 2.114443e-02 2.154701e-05
$`Eigen Vector`
[,1] [,2] [,3] [,4]
[1,] 0.5042646 -0.4869041 -0.4497319 0.5535186
[2,] 0.4958508 0.5123283 -0.5436778 -0.4427936
[3,] 0.4968681 -0.5116481 0.4249978 -0.5574184
[4,] 0.5029626 0.4885288 0.5670384 0.4322450

$`Proporsi Komponen`
[1] 7.617794e-01 2.329291e-01 5.286106e-03 5.386751e-06
$`Proporsi Kumulatif Komponen`
[1] 0.7617794 0.9947085 0.9999946 1.0000000
$`Matriks Korelasi Y dan X`
[,1] [,2] [,3] [,4]
[1,] 0.88024402 -0.84993947 -0.785051724 0.966221849
[2,] 0.47862224 0.49452725 -0.524787555 -0.427408580
[3,] 0.07225020 -0.07439938 0.061799454 -0.081054889
[4,] 0.00233469 0.00226769 0.002632121 0.002006427
Output
1. Matrix Korelasi
Matrix korelasi yang dihasilkan dari data pada terlihat bahwa hubungan/korelasi
yang memiliki tingkat keeratan cukup erat adalah :
• Variabel Konsentrasi CO2 bulanan dalam bagian per juta (X1) dengan
Variabel Konsentrasi CO2 dengan noise yang dihilangkan (X3), dengan nilai
korelasi sebesar 0.9915288
• Variabel Konsentrasi CO2 dengan penyesuaian musiman (X2) dengan
Variabel Konsentrasi CO2 dengan siklus musiman yang dihapus (X4),
dengan nilai korelasi sebesar 0.9866080
• Variabel Konsentrasi CO2 dengan noise yang dihilangkan (X3) dengan
Variabel Konsentrasi CO2 bulanan dalam bagian per juta (X1), dengan nilai
• Variabel Konsentrasi CO2 dengan siklus musiman yang dihapus (X4) dengan
Variabel Konsentrasi CO2 dengan penyesuaian musiman (X2), dengan nilai
2. Fungsi Komponen Utama
Karena data pada data memiliki 4 variabel, maka akan menghasilkan 4 nilai
eigen dan 4 vektor eigen dengan dimensi 4×1, dari vector eigen yang dihasilkan
maka akan terbentuk 4 fungsi komponen utama yaitu sebagai berikut :
AKU1 = 0.504 X1 + 0.496 X2 + 0.497 X3 + 0.503 X4
AKU2 = 0.487 X1 − 0.512 X2 + 0.512 X3 − 0.489 X4
AKU3 = 0.450 X1 + 0.544 X2 − 0.425 X3 − 0.567 X4
AKU4 = 0.554 X1 − 0.443 X2 − 0.557 X3 + 0.432 X4

3. Kumulatif Proporsi Pengaruh Komponen Utama terhadap Data
Proporsi varians kumulatif Komponen pertama dapat menjelaskan 76% total
varians dan bila ditambahkan komponen kedua menjadi 99.4% dan bila
ditambahkan komponen ketiga menjadi 99.9%,Artinya kita cukup mengambil dua
komponen saja yaitu komponen pertama dan kedua.Dengan dua komponen utama
saja sudah mencukupi untuk mewakili keempat variabel tersebut berikut nilai
(score) komponen utama dengan menggunakan function pada software R
PCA Score
> #PCA SCORE
> baku=function(X){
+ x=as.matrix(X)
+ n=nrow(x)
+ p=ncol(x)
+ a=matrix(0,n,p)
+ for (j in (1:p)) {
+ for (i in (1:n)) {
+ a[i,j]=(x[i,j]-mean(x[,j]))/sd(x[,j])
+ }
+ }
+ print(a)
+ }
> baku(data_standardized)
[,1] [,2] [,3] [,4]
[1,] -1.18715790 -1.65173067 -1.0282718 -1.50099423
[2,] -0.80637141 -1.52446880 -0.7208890 -1.45749775
[3,] -0.40654558 -1.42750738 -0.3614877 -1.42021505
[4,] 0.04087855 -1.48810827 0.1681564 -1.36429100

[5,] 0.56445998 -1.10632268 0.4282495 -1.31458073
[6,] 0.17891366 -1.18510383 0.1397826 -1.25244289
[7,] -0.39226609 -1.05178188 -0.4986277 -1.20273263
[8,] -1.23951605 -0.94270028 -1.3829441 -1.14680857
[9,] -2.09628566 -1.05178188 -2.1064758 -1.09709831
[10,] -1.94397107 -0.78513797 -2.1112048 -1.04738804
[11,] -1.56794440 -0.97906081 -1.5484579 -1.00389155
[12,] -1.13479976 -1.10026259 -0.9951690 -0.96039507
[13,] 0.02183923 -0.11246812 0.1492406 0.04623786
[14,] 0.49782235 0.12993543 0.4471654 0.06487921
[15,] 0.71201475 -0.01550670 0.7971088 0.09594813
[16,] 1.30699365 0.09963499 1.3267529 0.13323083
[17,] 1.31651332 -0.17306901 1.5821170 0.18294110
[18,] 1.17847821 0.06327446 1.2936501 0.23886515
[19,] 0.86432935 0.54202147 0.6505109 0.30100298
[20,] -0.24947115 0.32385827 -0.2338056 0.36935460
[21,] -0.74925343 0.69352369 -0.9478793 0.44392000
[22,] -0.99676465 0.45112014 -0.9431504 0.51227162
[23,] -0.24947115 0.71776404 -0.3520297 0.58683703
[24,] 0.01231956 0.36627890 0.2296330 0.65518864
[25,] 0.58349931 0.60868245 0.6694267 0.72975405
[26,] 1.04520294 0.82684564 1.0146412 0.81053323
[27,] 1.42598943 0.88744653 1.3929584 0.87267107
[28,] 1.42598943 1.25711195 1.2747343 1.12122241
[29,] 0.45974370 1.23287159 0.3667730 1.16471889
[30,] -0.35894727 1.19651106 -0.3804035 1.20821538
[31,] -0.61597816 0.94198733 -0.3898615 1.25171186
[32,] 0.18843332 1.27529221 0.1776144 1.28899456
[33,] 0.77865239 1.34195319 0.7403612 1.32627726
[34,] 1.39267061 1.63889754 1.1517812 1.36355996

3.KESIMPULAN
Maka kesimpulan yang bisa didapatkan dari hasil reduksi data di atas baik secara
manual maupun dengan function sofwere R adalah cukup dengan 2 komponen utama yaitu X1
dan X2, dengan besar kontribusi yang dihasilkan adalah sebesar 99.4% bisa mewakili ke-4
variabel yang ada. Sehingga jika kedepannya akan dilakukan analisis secara multivariat
(deskriptif maupun inferensial) tidak perlu sebanyak 4 variabel untuk menganalisisnya, tetapi
cukup dengan 2 komponen tadi hasil analisis akan memberikan informasi yang cukup untuk
mewakili ke-4 variabel tersebut dan proses analisis akan menjadi lebih efisien.Kedua fungsi
komponen utama yang dipakai tersebut adalah sebagai berikut :
Fungsi Komponen Utama yang terbentuk
AKU1 = 0.504 X1 + 0.496 X2 + 0.497 X3 + 0.503 X4
AKU2 = 0.487 X1 − 0.512 X2 + 0.512 X3 − 0.489 X4

A TUGAS 1 Kelompok 12

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

A TUGAS 1 Kelompok 12

Diunggah oleh

Hak Cipta:

Format Tersedia

TUGAS PRAKTIKUM 1

“Analisis Komponen Utama”

Dosen : Titi Purwandari , Dra., MS.

Nabilla Clarissa Salma (140610190015)

Alisya Aqmarina Adelya Putri

PROGRAM STUDI S1 STATISTIKA

Y = W1X1+ W2X2+ … + WpXp

• Komponen utama pertama adalah kombinasi linear e1'X yang memaksimumkan

Untuk vektor acak X dengan matriks kovarians Σ dan eigenvalue-eigenvector pairs

Tabel 2.1. Pengamatan Bulanan Konsentrasi 𝐂𝐎𝟐 di Atmosfer

Konsentrasi 𝐂𝐎𝟐 Konsentrasi 𝐂𝐎𝟐 Konsentrasi 𝐂𝐎𝟐

• Uji Normalitas Data Multivariat Secara Simultan

H0 : Data pengamatan bulanan konsentrasi CO2 berdistribusi normal multivariat

H1 : Data pengamatan bulanan konsentrasi CO2 tidak berdistribusi normal multivariat

Dengan menggunakan syntax pada software R

> data = read.csv("konsentrasi.csv", header = T, sep = ";")

Min. :315.0 Min. :316.9 Min. :314.9 Min. :317.2

1st Qu.:317.9 1st Qu.:317.9 1st Qu.:318.0 1st Qu.:317.9

Median :319.5 Median :319.8 Median :319.7 Median :319.9

Mean :319.4 Mean :319.6 Mean :319.4 Mean :319.6

3rd Qu.:321.0 3rd Qu.:320.9 3rd Qu.:320.9 3rd Qu.:320.9

Max. :322.4 Max. :322.3 Max. :322.7 Max. :321.8

Test Statistic p value Result

1 Mardia Skewness 8.25280904078767 0.990058674949821 YES

2 Mardia Kurtosis -1.89536248334424 0.0580443954202434 YES

3 MVN <NA> <NA> YES

Test Variable Statistic p value Normality

1 Shapiro-Wilk X1 0.9601 0.2442 YES

2 Shapiro-Wilk X2 0.9289 0.0290 NO

3 Shapiro-Wilk X3 0.9636 0.3079 YES

4 Shapiro-Wilk X4 0.8844 0.0018 NO

n Mean Std.Dev Median Min Max 25th 75th Skew

X1 34 319.3941 2.100915 319.460 314.99 322.39 317.8900 320.9950 -0.2924096

X2 34 319.6056 1.650141 319.795 316.88 322.31 317.9000 320.9250 -0.1577933

X3 34 319.3944 2.114628 319.730 314.93 322.74 317.9875 320.9225 -0.3545287

X4 34 319.6056 1.609325 319.945 317.19 321.80 317.8600 320.8775 -0.2240288

Dari hasil perhitungan menggunakan software R di atas pada output “Multivariate

• Uji Homogenitas Varians

Dengan menggunakan syntax pada software R

data: dataCO2 by variabel

Bartlett's K-squared = 4.2848, df = 3, p-value = 0.2323

Tolak H0 jika p – value < 𝛼

Karena asumsi normalitas maupun asumsi homogenitas keduanya sama-sama

Nilai eigen menggambarkan varians data

𝑌𝑝 = 𝑎̃𝑝′ 𝑥̃ = 𝑎𝑝1 𝑥1 + 𝑎𝑝2 𝑥2 + ⋯ + 𝑎𝑝𝑝 𝑥𝑝

• Untuk populasi, varians sama dengan nilai eigen nya

8. Mencari proporsi tiap variable

9. Mencari kumulatif proporsi

11. Membuat matriks korelasi

𝜌𝑦1,𝑥1 𝜌𝑦2,𝑥1 … 𝜌𝑦𝑖 ,𝑥𝑘

𝑟𝑦1,𝑥1 𝑟𝑦2,𝑥1 … 𝑟𝑦𝑖 ,𝑥𝑘

1. Input Data ke dalam software R

'data.frame': 34 obs. of 4 variables:

$ X1: num 317 318 319 319 321 ...

$ X2: num 317 317 317 317 318 ...

$ X3: num 317 318 319 320 320 ...

$ X4: num 317 317 317 317 317 ...

1 316.90 316.88 317.22 317.19

2 317.70 317.09 317.87 317.26

3 318.54 317.25 318.63 317.32

4 319.48 317.15 319.75 317.41

5 320.58 317.78 320.30 317.49

6 319.77 317.65 319.69 317.59

[1,] -1.18715790 -1.65173067 -1.0282718 -1.50099423