A Tugas 2 Kelompok 12

TUGAS PRAKTIKUM 2
“Analisis Faktor”
Diajukan untuk Memenuhi Tugas Mata Kuliah Analisis Multivariat II
Dosen : Titi Purwandari , Dra., MS.
Disusun oleh :
Nabilla Clarissa Salma (140610190015)

Nadiyah Nisrina (140610190022)
Kelas : A
Aslab :
Alisya Aqmarina Adelya Putri
Helni Nurhidayat
PROGRAM STUDI S1 STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
JATINANGOR
2021
1.RINGKASAN MATERI
Analisis faktor merupakan metode analisis multivariat yang didasarkan pada korelasi antar
variabel. Analisis faktor termasuk salah satu teknik statistika yang dapat digunakan untuk
memberikan deskripsi yang relatif sederhana melalui reduksi jumlah variabel yang disebut
faktor. Analisis faktor dipergunakan untuk mereduksi data atau meringkas, dari variabel lama
yang banyak diubah menjadi sedikit variabel baru yang disebut faktor, dan masih memuat
sebagian besar informasi yang terkandung dalam variabel asli (Supranto, 2004).
Variabel latent atau variabel untuk data-data kualitatif harus melalui pengujian kelayakan dan
keabsahan terlebih dahulu (validitas dan realibilitas) sebelum dikelompokkan menjadi variabel
yang akan di analisis faktor.
Analisis faktor dalam analisis multivariate tergolong analisis interdependensi (interdependence

technique) dimana seluruh set hubungan yang interdependen diteliti. Variabel yang berada dalam
satu kelompok akan memiliki korelasi yang tinggi sedangkan variabel yang berbeda kelompok
akan memiliki korelasi yang rendah.
Dalam tulisan Supranto, dikatakan bahwa analisis faktor digunakan untuk mereduksi
data/variabel. Analisis faktor dipergunakan dalam kondisi sebagai berikut :
1. Mengenali atau mengidentifikasi dimensi yang mendasari (underlying dimensions) atau

faktor, yang menjelaskan korelasi antara suatu set variabel.
2. Mengenali atau mengidentifikasi suatu set variabel baru yang tidak berkorelasi
(independent) yang lebih sedikit jumlahnya untuk
3. menggantikan suatu set variabel asli yang saling berkorelasi di dalam analisis multivariat
selanjutnya.
4. Mengenali atau mengidentifikasi suatu set variabel yang penting dari suatu set variabel
yang lebih banyak jumlahnya untuk dipergunakan dalam analisis multivariat selanjutnya.
Analisis Faktor dapat dirumuskan dalam model persamaan linier Misalkan vektor
acak X dengan p komponen memiliki rata-rata μ dan matriks covariance Σ. Maka bentuk model
persamaan faktornya adalah:
Di mana:
= rata-rata variabel asal ke i
= spesifik faktor ke i
= Common faktor ke j
= disebut loading dari peubah asal ke I pada faktor j
Dalam bentuk matriks persamaan tersebut menjadi:

( ) +
(px1) (pxm) (mx1) (px1)
Asumsi mendasar yang perlu diperhatikan dalam analisis faktor adalah variable-variabel yang
dianalisis memiliki keterkaitan atau saling berhubungan (multikolinearitas) karena analisis faktor
berusaha untuk mencari common dimension (kesamaan dimensi) yang mendasari variable-
variabel tersebut. Asumsi lainnya yang perlu dipenuhi antara lain:
Data berasal dari populasi yang berdistribusi normal univariat






Proses yang perlu dilakukan dalam analisis faktor adalah sebagai berikut:
1. Mengidentifikasikan struktur.
2. Menduga parameter (faktor loading dan sistematik varians).
 Metode Komponen Utama
 Metode Kemungkinan Maksimum
 Metode Kuadrat Terkecil
3. Menentukan jumlah faktor (dapat dilakukan dengan metode scree plot, eigen values,
proporsi varians).
4. Rotasi faktor (ortogonal: varimax, quartimax, equimax; oblique: oblimax, quartimin,
oblimin).
5. Interpretasi faktor (eigen values, explained variances, factor scores, koefisien faktor).
2.CONTOH KASUS
Tabel 2.1. Kualitas Air Sungai di India
LOCATIONS TEMP DO pH CONDUCTIVITY BOD NITRATE

BAHARAMPORE WEST
26.5 7.4 7.9 304 4.2 0.8
BENGAL
NABADIP ON GANGA 27.4 7.4 7.9 353 3.3 0.7
TRIBENI ON GANGA 28.3 6.9 8 312 2.8 0.8
GANGA AT PALTA 27 6.7 7.8 315 3.4 0.9
GANGA AT SERAMPORE 27.3 6 7.9 323 3.1 0.7
GANGA AT
26.5 6.7 8 319 4.2 0.7
DAKSHMINESWAR
GANGA AT HOWRAH-
26.5 6.3 8 314 3.6 0.7
SHIVPUR
GANGA AT GARDEN
26.4 6.1 8.1 322 3.2 0.7
REACH
GANGA AT ULUBERIA 27.1 6.3 8.1 368 3.4 0.6
GANGA AT DIAMOND
26.4 6.9 8 1900 3.7 0.8
HARBOUR
BRAHAMPUTRA AT
22.3 7.2 7.1 216 1.5 1.4
KHERGHAT
BRAHAMPUTRA AT
21.8 7.7 7.2 256 1.4 1.5
DIBRUGARH
BRAHAMPUTRA AT
25.1 6.9 7 273 1.5 2.5
NIMATIGHAT
BRAHMPUTRA RIVER
24.3 7.5 7 298 1.3 1.7
AT DHENUKHAPAHAR
BRAHAMPUTRA AT
25.4 7.9 7.2 236 1.4 2.3
PANDU
BRAHAMPUTRA AT
JOGIJHOGA NEAR 27.7 6 7.3 295 1.1 1.9
BRIDGE
BRAHMPUTRA RIVER 27 8.1 7.6 210 0.9 1.2
BRAHMAPUTRA RIVER 25.8 7.3 7.1 168 1.6 0.4
BRAHMPUTRA RIVER
27.3 7.1 7.2 289 1.6 1.4
AT SUALKUCHI
BRAHMAPUTRA RIVER
28.2 5.1 7 253 1.5 1.4
AT DHUBRI
KRISHNA AT
23.1 6.8 8.1 160 3.1 2.9
MAHABALESHWAR
KRISHNA AT KRISHNA
23.8 6 8.2 262 5.1 1.8
BRIDGE
KRISHNA D/S OF
25 6.7 7.6 441 2.9 1.5
ISLAMPUR
KRISHNA AT
24 7 7.5 400 2.8 1.2
KURUNDWAD
KRISHNA RIVER AT
20.8 6.1 8.4 551 5.6 2.3
KSHETRA MAHULI.
KRISHNA RIVER AT
22 6.2 8.3 458 4.6 2.3
KRISHNA-VENNA
KRISHNA RIVER AT
22.7 6.1 8.2 413 5.5 1.8
WAI.
KRISHNA AT U/S OF
29 7.5 8 685 2.1 2.3
UGARKHURD BARRAGE
KRISHNA - ANKALI
28 7.5 8 808 1.8 2.1
BRIDGE ALONG
KRISHNA AT D/S OF
29.3 5.9 8.3 521 1.5 0.4
NARAYANPURA
KRISHNA AT D/S OF
29.4 7.2 8.3 916 1.9 0.2
DEVASAGAR BDG
KRISHNA AT TINTINI
29.5 7.1 8.2 718 1.9 0.2
BRIDGE
KRISHNA AT D/S OF
29.2 6.2 8.3 513 1.4 0.5
ALAMATTI DAM
Source:https://www.kaggle.com/utcarshagrawal/water-quality-data
Pada Tabel 2.1. di atas menunujukan data kualitas air sungai di India.Data tersebut terdiri
dari 6 variabel,yaitu Temperatur (X1), DO (X2), PH (X3), Conductivity (X4), BOD (X5), Nitrate
(X6) Setap variabel kelompok merupakan nilai rata-rata yang diukur pada periode waktu
tertentu.Terdapat sampel sebanyak 33 unit observasi untuk masing-masing variabelnya.
Dari data di atas akan digunakan metode analisis faktor untuk mereduksi data yang
berasal dari 6 variabel yang ada menjadi beberapa faktor yang paling berpengaruh dan
banyaknya faktor tersebut lebih sedikit dari banyaknya jumlah variabel yang ada, sehingga
kedepannya ketika akan dilakukan analisis data secara multivariate akan menjadi lebih efisien.
Misal :
X1 = Temperatur
X2 = DO
X3 = Ph
X4 = Conductivity
X5 = BOD
X6 = Nitrat
PENGUJIAN ASUMSI
Sebelumya akan dilakukan pengujian asumsi yaitu uji normalitas multivariat dan uji
homogenitas varians yaitu sebagai berikut.
 Uji Normalitas Data Multivariat Secara Simultan

Asumsi normalitas multivariat artinya residu dari data yang akan dianalisis menggunakan
Analisis Komponen Utama harus berdistribusi normal multivariat. Pengujian normalitas
multivariate akan dilakukan menggunakan Uji Mardia Skewness dan Mardia Kurtosis,
dengan langkah – langkah pengujian adalah sebagai berikut :
Hipotesis
Data pengamatan air sungai di India berdistribusi normal multivariat
Data pengamatan air sungai di India berdistribusi tidak berdistribusi normal multivariat
Taraf Signifikan
Statistik Uji
Dengan menggunakan syntax pada software R
> setwd("D:/Lectures/Anreg/")
> #Membaca data
> data<- read.csv("water.csv" ,header = TRUE, sep=";")
> #asumsi normalitas
> library(MVN)
> summary(data)
X1 X2 X3 X4
Min. :20.80 Min. :5.100 Min. :7.000 Min. : 160.0
1st Qu.:24.30 1st Qu.:6.200 1st Qu.:7.300 1st Qu.: 273.0
Median :26.50 Median :6.900 Median :8.000 Median : 319.0
Mean :26.06 Mean :6.782 Mean :7.782 Mean : 429.4

3rd Qu.:27.70 3rd Qu.:7.300 3rd Qu.:8.100 3rd Qu.: 458.0
Max. :29.50 Max. :8.100 Max. :8.400 Max. :1900.0
X5 X6 X7 X8
Min. :0.900 Min. :0.200 Min. : 2 Min. : 80
1st Qu.:1.500 1st Qu.:0.700 1st Qu.: 444 1st Qu.: 1377
Median :2.800 Median :1.200 Median : 1208 Median : 26322
Mean :2.694 Mean :1.291 Mean : 43379 Mean :109472
3rd Qu.:3.400 3rd Qu.:1.800 3rd Qu.: 34392 3rd Qu.:134042
Max. :5.600 Max. :2.900 Max. :310417 Max. :586250
> mvn(data=data, mvnTest="mardia")
$multivariateNormality
Test Statistic p value Result
1 Mardia Skewness 256.601979847772 6.1034959171056e-12 NO
2 Mardia Kurtosis 2.40634682347028 0.0161129595644334 NO
3 MVN <NA> <NA> NO
$univariateNormality
Test Variable Statistic p value Normality
1 Shapiro-Wilk X1 0.9450 0.0949 YES
3 Shapiro-Wilk X3 0.8792 0.0016 NO
4 Shapiro-Wilk X4 0.6391 <0.001 NO
5 Shapiro-Wilk X5 0.9112 0.0105 NO

$Descriptives
n Mean Std.Dev Median Min Max 25th 75th
X1 33 2.606364e+01 2.424203e+00 26.5 20.8 29.5 24.3 27.7
X2 33 6.781818e+00 6.857726e-01 6.9 5.1 8.1 6.2 7.3
X3 33 7.781818e+00 4.599284e-01 8.0 7.0 8.4 7.3 8.1
X4 33 4.293939e+02 3.194191e+02 319.0 160.0 1900.0 273.0 458.0
X5 33 2.693939e+00 1.338829e+00 2.8 0.9 5.6 1.5 3.4
X6 33 1.290909e+00 7.430358e-01 1.2 0.2 2.9 0.7 1.8
X7 33 4.337918e+04 8.259363e+04 1208.0 2.0 310417.0 444.0 34392.0
X8 33 1.094719e+05 1.652256e+05 26322.0 80.0 586250.0 1377.0 134042.0
Skew Kurtosis
X1 -0.4818105 -0.8460226
X2 -0.1912043 -0.6362930
X3 -0.5072525 -1.2864288
X4 3.0601998 10.9337782
X5 0.5922830 -0.7899570
X6 0.3598010 -1.0872511
X7 1.9652208 2.9550235
X8 1.6192945 1.5383493
Kriteria Uji
Tolak H0 jika p-value < Bersarkan hasil output multivariate normality, residu dapat
dikatakan berdistribusi normal apabila p – value Mardia Skewness dan p – value Mardia
Kurtosis < . Apabila salah satu di antaranya tidak memenuhi kriteria tersebut, maka residu
dikatakan tidak berdistribusi normal. Hal yang demikian berlaku juga pada hasil output
univariate normality (Shapiro - Wilk) Data dikatakan berdistribusi normal ( Diterima ) jika
Kesimpulan
Dari hasil perhitungan menggunakan software R di atas pada output “Multivariate

Normality”, terlihat bahwa pada Uji Skewness dan Kurtosis menghasilkan p-value yang lebih
kecil dari pada taraf signifikannya yaitu , selain itu pada kolom result menunjukan hasil
“no” sehingga ditolak artinya dengan taraf signifikan pendapat mendukung bahwa
data pengamatan kualitas air sungai di India yang terdiri dari 6 variabel tidak memiliki
distribusi normal multivariat, sehingga untuk asumsi yang pertama belum terpenuhi. tetapi
untuk kasus normalitas multivariat akan diasumsikan terpenuhi agar analisis faktor dapat
dilakukan.
 Uji Multikolinearitas
Multikolinieritas adalah tingkat hubungan linier diantara variabel eksplanatori dalam suatu
persamaan regresi, dengan langkah – langkah pengujian adalah sebagai berikut:
Hipotesis
H0 : Ke-6 variabel pada data tidak berkorelasi antar variabel lainnya (non-
multikolinearitas)
H1 : Setidaknya ada 1 dari ke-6 variabel (multikolinearitas)
Taraf Signifikan
α = 5%
Statistik Uji
Perhitungan tersebut akan dilakukan menggunakan Software R, yaitu sebagai berikut :
> #asumsi multikolinearitas
> diag(solve(cor(data)))
X1 X2 X3 X4 X5 X6
2.634482 1.266827 2.529239 1.254390 3.215215 1.537583
Kriteria Uji
VIF atau Variance Inflation Factor menggambarkan kenaikan varians taksiran koefisien
regresi jika variabel eksplanatori tidak saling berkorelasi. Apabila nilai VIF lebih dari 5 atau
10, maka taksiran parameter kurang baik, terjadi multikolinearitas. VIF dapat dihitung
dengan
Kesimpulan
Dari hasil di atas tidak terdapat nilai VIF yang lebih dari 5 atau 10. Maka diterima,
sehingga dengan taraf signifikan pendapat mendukung bahwa data tersebut tidak
teridentifikasi multikolinearitas. Maka asumsi analisis faktor yang kedua terpenuhi.
 Uji Homogenitas Varians
Hipotesis
Ke-5 variabel pada data memiliki varians yang homogen
Ke-5 variabel pada data memiliki varians yang heterogen (berbeda secara
signifikan)
Taraf Signifikan
Statistik Uji : Bartlett test
Dengan menggunakan syntax pada software R:
> setwd("D:/Documents/")
> data = read.csv("water.csv", header = T, sep = ";")
> attach(data)
> ##UJI VARIANS HOMOGEN
> variabel=as.factor(rep(c("X1","X2","X3","X4","X5","X6"),each=33))
> water=c(X1,X2,X3,X4,X5,X6)
> data2=data.frame(variabel,water)
> bartlett.test(water~variabel,data2)
Bartlett test of homogeneity of variances
data: water by variabel
Bartlett's K-squared = 1500.6, df = 5, p-value < 2.2e-16

Interpretasi
Dari Uji Bartlett pada output software R di atas menghasilkan p-value yang lebih besar dari
pada taraf signifikannya maka ditolak, artinya dengan taraf signifikan
5% pendapat mendukung bahwa ke-6 variabel tersebut memiliki varians yang heterogen
(berbeda secara signifikan), sehingga untuk asumsi yang ketiga tidak terpenuhi. Tetapi untuk
kasus homogenits varians diasumsikan terpenuhi agar analisis faktor dapat dilakukan.
KESIMPULAN HASIL PENGUJIAN ASUMSI
Dari ketiga uji diatas, diperoleh bahwa seluruh hasil ujinya tidak memenuhi kriteria asumsi
untuk analisis faktor. Namun karena akan tetap diasumsikan terpenuhi, maka setelah
melakukan pengujian asumsi (normalitas, multikolinieritas dan homogenitas), akan dilakukan
analisis faktor sebagai berikut.
LANGKAH PENGERJAAN MANUAL ANALISIS FAKTOR
1. Lakukanlah pengujian asumsi, antara lain:
Data memiliki distribusi normal multivariate,
Adanya fenomena multikolinearitas pada data,



 Variabel F dan ε saling bebas antara satu sama lain, dan

2. Identifikasi struktur dari data
Langkah ini dilakukan untuk mengetahui metode analisis apa yang harus digunakan, antara
lain:
 Analisis Komponen Utama,

 Analisis Faktor, atau
 Analisis Kluster.
3. Melakukan pendugaan parameter untuk factor loading dan systematic variance
Untuk melakukan estimasi parameter, terdapat beberapa metode, antara lain :
 Metode komponen utama (Principal Component Analysis),

 Metode kemungkinan maksimum (Maximum Likelihood Estimation), dan
 Metode kuadrat terkecil (Least Square Estimation).
4. Tentukanlah jumlah faktor
Untuk menentukan jumlah faktor, terdapat beberapa cara yang bisa dilakukan, antara lain:
 Metode pareto (kumulatif varians ≥ 80%),

 Nilai eigen ≥ 1,
 Screeplot dari nilai eigen,
5. Melakukan rotasi faktor
Tujuan dari langkah ini adalah untuk menyederhanakan struktur faktor hingga parsimoni,
sehingga lebih mudah diinterpretasikan peneliti. Rotasi faktor perlu dilakukan jika ekstraksi
faktor belum memberikan output berupa komponen faktor utama yang jelas. Terdapat dua
metode rotasi faktor, antara lain:
 Orthogonal, dan
 Oblique rotation.
6. Interpretasikan faktor yang telah diperoleh.
ANALISIS FAKTOR
Karena asumsi normalitas, asumsi multikolinieritas, dan asumsi homogenitas ketiganya sama-
sama terpenuhi maka analisis komponen utama dapat dilanjutkan melalui langkah-langkah
sebagai berikut :
Perhitungan Analisis Faktor dilakukan dengan menggunakan software R sebagai berikut :
1. Input Data ke dalam software R

> data<-read.csv(file.choose(),header=T,sep=";")
> #Menentukan folder kerja
> setwd("D:/Lectures/Anreg/")
> #Membaca data
> data<- read.csv("water.csv" ,header = TRUE, sep=";")#asumsi normalitas
> str(data)
'data.frame': 33 obs. of 6 variables:
$ X1: num 26.5 27.4 28.3 27 27.3 26.5 26.5 26.4 27.1 26.4 ...
$ X2: num 7.4 7.4 6.9 6.7 6 6.7 6.3 6.1 6.3 6.9 ...
$ X3: num 7.9 7.9 8 7.8 7.9 8 8 8.1 8.1 8 ...
$ X4: int 304 353 312 315 323 319 314 322 368 1900 ...
$ X5: num 4.2 3.3 2.8 3.4 3.1 4.2 3.6 3.2 3.4 3.7 ...
$ X6: num 0.8 0.7 0.8 0.9 0.7 0.7 0.7 0.7 0.6 0.8 ...
> head(data)
X1 X2 X3 X4 X5 X6
1 26.5 7.4 7.9 304 4.2 0.8
2 27.4 7.4 7.9 353 3.3 0.7
3 28.3 6.9 8.0 312 2.8 0.8
4 27.0 6.7 7.8 315 3.4 0.9
5 27.3 6.0 7.9 323 3.1 0.7
6 26.5 6.7 8.0 319 4.2 0.7

2. Analisis Faktor dengan Function
> #((ANALISIS FAKTOR))
> FactorAnalysis=function(x, standardize=FALSE){
+ data=as.matrix(x)
+ if(standardize == TRUE){
+ data = scale(data)
+ }
+ S = cov(data)
+ A = eigen(S)$values
+ V = eigen(S)$vector
+ trace_S=sum(diag(S))
+ prop=A/trace_S
+ q = length(prop)
+ propcum = c()
+ for (i in 1:q){
+ propcum[i]=sum(prop[1:i])
+ }
+ L=V%*%sqrt(diag(A,length(A),length(A)))
+ miu=colMeans(data)
+ n=nrow(data)
+ p=ncol(data)
+ Xc=matrix(0,n,p)
+ for (i in (1:n)){
+ for (j in (1:p)){
+ Xc[i,j]=data[i,j]-miu[j]
+ }
+ }
+ F=Xc%*%solve(S)%*%L
+ plot(A, main="Scree Plot", type="o")
+ hasil = list("Matriks Varkov/Korelasi"=S, "Eigen Value"=A,
+ "Eigen Vector"=V, "Proporsi Faktor"=prop,
+ "Proporsi Kumulatif Faktor"=propcum,
+ "Loading Factor"=L, "Factor Score"=F)
+ print(hasil)
+ }
> FactorAnalysis(data,standardize = T)
$`Matriks Varkov/Korelasi`
X1 X2 X3 X4 X5 X6
X1 1.00000000 -0.01319245 0.1571856 0.24080174 -0.42949852 -0.56281316
X2 -0.01319245 1.00000000 -0.3042613 0.04303212 -0.38133256 0.06712649
X3 0.15718565 -0.30426126 1.0000000 0.37772650 0.60323128 -0.21721849
X4 0.24080174 0.04303212 0.3777265 1.00000000 0.11855405 -0.18056674
X5 -0.42949852 -0.38133256 0.6032313 0.11855405 1.00000000 0.07910471
X6 -0.56281316 0.06712649 -0.2172185 -0.18056674 0.07910471 1.00000000
$`Eigen Value`
[1] 1.9970594 1.8257288 0.9879675 0.6023151 0.4305360 0.1563930

$`Eigen Vector`
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] -0.1196317 0.65747982 -0.17248701 0.1856737 -0.4500649 -0.535372411
[2,] 0.3861411 0.17231769 0.65714976 -0.5786818 -0.2016488 -0.117563085
[3,] -0.6290423 -0.01573554 0.12500766 -0.1860526 -0.5614658 0.488438274
[4,] -0.3561111 0.24423787 0.67083349 0.4623798 0.3869337 -0.001531543
[5,] -0.4987995 -0.44841703 0.04934278 -0.3157205 0.1131047 -0.659707775
[6,] 0.2554859 -0.52635475 0.26518529 0.5315661 -0.5282283 -0.160519972
$`Proporsi Faktor`
[1] 0.33284324 0.30428814 0.16466126 0.10038586 0.07175601 0.02606550
$`Proporsi Kumulatif Faktor`
[1] 0.3328432 0.6371314 0.8017926 0.9021785 0.9739345 1.0000000
$`Loading Factor`
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] -0.1690603 0.88838366 -0.17144615 0.1440994 -0.29531121 -0.2117213606
[2,] 0.5456843 0.23283486 0.65318423 -0.4491089 -0.13231234 -0.0464921537
[3,] -0.8889459 -0.02126179 0.12425331 -0.1443935 -0.36840714 0.1931605249
[4,] -0.5032468 0.33001307 0.66678538 0.3588482 0.25388750 -0.0006056725
[5,] -0.7048903 -0.60589900 0.04904503 -0.2450274 0.07421391 -0.2608917176
[6,] 0.3610459 -0.71120809 0.26358504 0.4125430 -0.34659832 -0.0634801238
$`Factor Score`
[,1] [,2] [,3] [,4] [,5] [,6]
[1,] -0.3008753 0.01264238 0.21168615 -1.83471037 -0.12609127 -1.80115436
[2,] -0.1580188 0.49653821 0.18151634 -1.47320574 -0.29781060 -1.12831939

[3,] -0.2969579 0.62998470 -0.40686720 -0.72522725 -0.76285465 -0.57676024
[4,] -0.2739042 0.13746108 -0.49682132 -0.61635438 0.04114409 -1.10343254
[5,] -0.6359576 0.24871371 -1.23183994 0.04395448 0.27674027 -0.21602122
[6,] -0.7127348 -0.05915043 -0.44003706 -1.18992847 0.13759219 -1.17472254
[7,] -0.7099870 0.01236118 -0.85848083 -0.58202330 0.23036548 -0.25366491
[8,] -0.7838229 0.05624244 -1.01472175 -0.29009303 0.12550680 0.65572192
[9,] -0.8419264 0.26282279 -0.80331077 -0.50562118 0.05683667 -0.01701651
[10,] -1.7206756 0.92415935 3.11782630 1.77573668 2.82232883 -0.65637317
[11,] 1.4675866 -0.54241242 0.03015129 -0.40540911 1.48014082 1.52017419
[12,] 1.6066266 -0.55732588 0.69204280 -0.85335179 1.16412225 1.92067750
[13,] 1.5697308 -0.57808328 0.02855083 1.36952692 -0.07817234 -0.78354994
[14,] 1.6750910 -0.14394707 0.42242406 0.00816085 0.76646175 0.08902414
[15,] 1.7710288 -0.22826281 0.87214677 -0.01539587 -0.84778557 -0.61319002
[16,] 0.7721013 0.19498935 -1.12698876 2.05781221 -0.32947066 -0.21383507
[17,] 1.2924056 0.80587469 0.59136505 -1.19399192 -1.05490754 0.70498487
[18,] 1.1534024 0.65102558 -0.58075801 -1.21043965 1.45272590 -0.05546688
[19,] 1.0724027 0.45659196 -0.23888105 0.25041710 0.07182742 -1.08563168
[20,] 0.4924088 0.27479139 -2.36592832 2.58131435 1.00621278 -1.13328942
[21,] 0.2997795 -1.69623413 0.34029501 0.37930326 -1.95000660 1.11989728
[22,] -1.0155885 -1.56837770 -0.55902434 -0.16533731 -0.33800632 -0.54801118
[23,] 0.1679026 -0.37823616 0.05478183 0.23053593 0.49730617 -0.22992261
[24,] 0.4048549 -0.36177101 0.19018905 -0.46484568 1.06832489 0.21890989
[25,] -1.3027045 -2.37954038 0.61552843 0.17363386 0.15010976 0.72140770
[26,] -0.8709772 -1.92229470 0.36511049 0.36584556 -0.34863256 0.98651378
[27,] -1.1619116 -1.78427717 -0.04999187 -0.22252118 0.25869064 -0.47730465
[28,] 0.1729132 0.48026512 1.42222625 0.98259330 -2.25647211 -1.17949946
[29,] 0.1412262 0.52836429 1.67076321 1.02012098 -1.56838518 -0.13949379
[30,] -0.9401508 1.28736508 -1.11072361 0.72050675 -0.50395985 1.93968915

[31,] -0.8913995 1.77842109 0.91304314 -0.25225524 -0.11740681 0.92636978
[32,] -0.6817495 1.67038211 0.36377432 -0.45084344 -0.28037918 0.64773436
[33,] -0.7601186 1.29091666 -0.79904647 0.49209267 -0.74609547 1.93555500
Output
a. Matrix Korelasi
Matrix korelasi yang dihasilkan dari data pada terlihat bahwa hubungan/korelasi yang memiliki
tingkat keeratan cukup erat adalah :
 Variabel Temperatur (X1) dengan Variabel Conductivity (X4), dengan nilai korelasi sebesar
0.2408
 Variabel DO (X2) dengan Variabel Nitrat (X6), dengan nilai korelasi sebesar 0.06713
 Variabel pH (X3) dengan Variabe BOD (X5), dengan nilai korelasi sebesar 0.632
 Variabel Conductivity (X4) dengan Variabel pH (X3), dengan nilai korelasi sebesar 0.377
 Variabel BOD (X5) dengan Variabel DO (X2), dengan nilai korelasi sebesar 0.632
 Variabel Nitrat (X6) dengan Variabel BOD (X5), dengan nilai korelasi sebesar 0.079
b. Fungsi Komponen Utama
Karena data pada data memiliki 6 variabel, maka akan menghasilkan 6 nilai eigen dan 6 vektor
eigen dengan dimensi 6×1, dari vector eigen yang dihasilkan maka akan terbentuk 6 fungsi
komponen utama yaitu sebagai berikut :
c. Kumulatif Proporsi Pengaruh Komponen Utama terhadap Data
Proporsi varians kumulatif Komponen pertama dapat menjelaskan 33% total varians dan bila
ditambahkan komponen kedua menjadi 64% dan bila ditambahkan komponen ketiga menjadi
80%, artinya kita cukup mengambil tiga komponen saja yaitu komponen pertama, kedua dan
ketiga. Dengan tiga komponen utama saja sudah mencukupi untuk mewakili keenam variabel
tersebut. Ketiga fungsi komponen utama yang dipakai tersebut adalah sebagai berikut :
d. Banyaknya Faktor yang Terbentuk
Untuk menentukan berapa jumlah faktor dan faktor mana saja yang akan digunakan dalam
perhitungan faktor skor, dalam kasus ini, dilihat dari nilai eigen yang dimiliki. Jika nilai eigen
lebih besar atau sama dengan satu (nilai eigen ≥ 1), maka faktor dengan nilai eigen tersebut
dimasukkan ke dalam model perhitungan faktor skor. Faktor pertama dan kedua memiliki nilai
eigen lebih besar dari 1 (nilai eigen ≥ 1), maka faktor tersebut yang dihitung untuk mendapatkan
faktor skor yang diperlukan. Karena dirasa sudah mencukupi dan menggambarkan keseluruhan
kebutuhan informasi/ke-6 variabel yang ada untuk analisis. Dengan Loading Faktor sebagai
berikut.
[X1] [X2] [X3] [X4] [X5] [X6]
[L1] -0.1690603 0.88838366 -0.17144615 0.1440994 -0.29531121 -0.2117213606
[L2] 0.5456843 0.23283486 0.65318423 -0.4491089 -0.13231234 -0.0464921537
3. Analisis Faktor dengan Syntax Manual
Dengan menggunakan software R sebagai berikut.
a. Banyaknya Faktor yang Terbentuk
> ##((MENENTUKAN BANYAK FAKTOR))
> library(nFactors)
> cor=cor(data)
> cov=cov(data)
> ev<-eigen(cor)
> ap<-parallel(subject=150,var=5,cent=.05)
> nS<-nScree(ev$values,ap$eigen$qevpea)
> plotnScree(nS)
Interpretasi
Dari gambar di atas diperoleh hasil bahwa banyak faktor yang dapat diambil untuk parallel
analysis adalah 2 berdasarkan analisis paralel. Berdasarkan metode acceleration factor (AF)
banyak faktor yang dapat diambil adalah 1. Hal ini sesuai dengan output yang dapat ditampilkan
diantaranya sebagai berikut :
b. Membentuk Faktor yang diinginkan
> #((ANALISIS FAKTOR))
> fit<-factanal(data,factors=2)
> print(fit)
Call:
factanal(x = data, factors = 2)
Uniquenesses:
X1 X2 X3 X4 X5 X6
0.038 0.812 0.376 0.863 0.047 0.636
Loadings:
Factor1 Factor2
X1 -0.150 0.969
X2 -0.427
X3 0.740 0.277
X4 0.231 0.289
X5 0.929 -0.300
X6 -0.103 -0.595
Factor1 Factor2
SS loadings 1.679 1.549
Proportion Var 0.280 0.258
Cumulative Var 0.280 0.538
Test of the hypothesis that 2 factors are sufficient.
The chi square statistic is 2.73 on 4 degrees of freedom.
The p-value is 0.604
Berdasarkan output di atas, pada bagian proporsi varians kumulatif, komponen pertama dapat
menjelaskan 33% total varians dan bila ditambahkan komponen kedua menjadi 64% dan bila
ditambahkan komponen ketiga menjadi 80%, artinya kita cukup mengambil tiga komponen
saja yaitu komponen pertama, kedua dan ketiga. Kemudian tampak bahwa berdasarkan uji
hipotesis yang dilakukan, diperoleh nilai chi-square sebesar dengan pvalue .
Sehingga diperoleh beberapa kesimpulan bahwa faktor satu terdiri dari wariabel
Sedangkan faktor dua terdiri dari variabel
c. Membentuk PCA Variabel Map
> library(FactoMineR)
> result<-PCA(data)
Interpretasi
Plot di atas juga dikenal sebagai plot korelasi variabel. Ini menunjukkan hubungan antara semua
variabel. Dapat diartikan sebagai berikut :
 Variabel yang berkorelasi positif dikelompokkan bersama.

 Variabel yang berkorelasi negatif ditempatkan pada sisi berlawanan dari asal plot
(kuadran berlawanan).
 Jarak antara variabel dan asal mengukur kualitas variabel pada peta faktor. Variabel yang
jauh dari asal terwakili dengan baik di peta faktor.
Berdasarkan plot di atas, setiap variabel tidak dalam kelompok yang sama artinya variabel X1,
X2, X3, X4, X5 dan X6 tidak saling berkorelasi.
KESIMPULAN
Berdasarkan hasil analisis faktor yang telah dilakukan pada Data Kualitas Air Sungai di India
yang terdiri dari 6 variabel dengan 33 unit observasi, tampak pada nScree plotnya bahwa
banyak faktor yang dapat diambil baik berdasarkan eigen value maupun parallel analysis-nya
adalah sebanyak 2 faktor. Sehingga dalam membentuk faktor yang diinginkan dengan
menggunakan fungsi factanal() pada software R diperoleh hasil bahwa Faktor 1 beranggotakan
variabel Sedangkan Faktor 2 beranggotakan Kemudian tampak
bahwa berdasarkan uji hipotesis yang dilakukan, diperoleh nilai chi-square sebesar
dengan pvalue . Maka dalam hal ini faktor yang terbentuk adalah :

A Tugas 2 Kelompok 12

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

A Tugas 2 Kelompok 12

Diunggah oleh

Hak Cipta:

Format Tersedia

TUGAS PRAKTIKUM 2

Dosen : Titi Purwandari , Dra., MS.

Nabilla Clarissa Salma (140610190015)

Alisya Aqmarina Adelya Putri

PROGRAM STUDI S1 STATISTIKA

Analisis faktor dalam analisis multivariate tergolong analisis interdependensi (interdependence

1. Mengenali atau mengidentifikasi dimensi yang mendasari (underlying dimensions) atau

Dalam bentuk matriks persamaan tersebut menjadi:

Data berasal dari populasi yang berdistribusi normal univariat

Tabel 2.1. Kualitas Air Sungai di India

LOCATIONS TEMP DO pH CONDUCTIVITY BOD NITRATE

 Uji Normalitas Data Multivariat Secara Simultan

Data pengamatan air sungai di India berdistribusi normal multivariat

Dengan menggunakan syntax pada software R

> #Membaca data

> data<- read.csv("water.csv" ,header = TRUE, sep=";")

> #asumsi normalitas

Min. :20.80 Min. :5.100 Min. :7.000 Min. : 160.0

1st Qu.:24.30 1st Qu.:6.200 1st Qu.:7.300 1st Qu.: 273.0

Median :26.50 Median :6.900 Median :8.000 Median : 319.0

Mean :26.06 Mean :6.782 Mean :7.782 Mean : 429.4

Max. :29.50 Max. :8.100 Max. :8.400 Max. :1900.0

Min. :0.900 Min. :0.200 Min. : 2 Min. : 80

Median :2.800 Median :1.200 Median : 1208 Median : 26322

Mean :2.694 Mean :1.291 Mean : 43379 Mean :109472

3rd Qu.:3.400 3rd Qu.:1.800 3rd Qu.: 34392 3rd Qu.:134042

Max. :5.600 Max. :2.900 Max. :310417 Max. :586250

> mvn(data=data, mvnTest="mardia")

Test Statistic p value Result

1 Mardia Skewness 256.601979847772 6.1034959171056e-12 NO

2 Mardia Kurtosis 2.40634682347028 0.0161129595644334 NO

3 MVN <NA> <NA> NO

Test Variable Statistic p value Normality

1 Shapiro-Wilk X1 0.9450 0.0949 YES

2 Shapiro-Wilk X2 0.9684 0.4382 YES

3 Shapiro-Wilk X3 0.8792 0.0016 NO

4 Shapiro-Wilk X4 0.6391 <0.001 NO

5 Shapiro-Wilk X5 0.9112 0.0105 NO

6 Shapiro-Wilk X6 0.9416 0.0754 YES

7 Shapiro-Wilk X7 0.5978 <0.001 NO

8 Shapiro-Wilk X8 0.7067 <0.001 NO

n Mean Std.Dev Median Min Max 25th 75th

X1 33 2.606364e+01 2.424203e+00 26.5 20.8 29.5 24.3 27.7

X2 33 6.781818e+00 6.857726e-01 6.9 5.1 8.1 6.2 7.3

X3 33 7.781818e+00 4.599284e-01 8.0 7.0 8.4 7.3 8.1

X4 33 4.293939e+02 3.194191e+02 319.0 160.0 1900.0 273.0 458.0

X5 33 2.693939e+00 1.338829e+00 2.8 0.9 5.6 1.5 3.4

X6 33 1.290909e+00 7.430358e-01 1.2 0.2 2.9 0.7 1.8

X7 33 4.337918e+04 8.259363e+04 1208.0 2.0 310417.0 444.0 34392.0

X8 33 1.094719e+05 1.652256e+05 26322.0 80.0 586250.0 1377.0 134042.0

Dari hasil perhitungan menggunakan software R di atas pada output “Multivariate

H1 : Setidaknya ada 1 dari ke-6 variabel (multikolinearitas)

Ke-5 variabel pada data memiliki varians yang homogen

Statistik Uji : Bartlett test

Dengan menggunakan syntax pada software R:

> data = read.csv("water.csv", header = T, sep = ";")

> ##UJI VARIANS HOMOGEN

Bartlett test of homogeneity of variances

data: water by variabel

Bartlett's K-squared = 1500.6, df = 5, p-value < 2.2e-16

KESIMPULAN HASIL PENGUJIAN ASUMSI

1. Lakukanlah pengujian asumsi, antara lain:

Data memiliki distribusi normal multivariate,

Adanya fenomena multikolinearitas pada data,