STUDY
ANALISIS DATA STATISTIK B
01 02 03 04
Principal Factor Cluster Analisis
Component Analysis (FA) Analysis Diskriminan
Analysis (PCA)
Deskripsi
Sungai Shuangji adalah sungai yang tercemar. Sumber air utamanya berasal dari pabrik
pengolahan limbah perkotaan dan pabrik pengolahan limbah pembuatan kertas. Suatu
penelitian dilakukan pada sungai Suangi China untuk mengetahui kualitas air sungai.
Titik-titik pengamatan disepanjang sungai dapat dilihat pada gambar diatas.
Pengamatan dilakukan selama 2 tahun.
Variabel Penelitian
Preprocessing Data
Pada analisis kali ini akan dilakukan dengan menggunakan Melakukan cek missing value, dimana ditemukan
variabel numerik. Sehingga perlu dilakukan perubahan data tidak adanya missing value pada data. Sehingga
dari kategorik menjadi numerik. dapat dilanjutkan ke langkah berikutnya.
Statistik Descriptive
PCA
KMO dan Barlett Test
Pada pengujian KMO telah terpenuhi,
dimana nilai all over MSA > 0,5 yaitu 0,75.
Nilai MSA pada masing-masing variabel
juga telah bernilai > 0,05 sehingga tidak
adanya penghapusan variabel.
Matriks ini menunjukkan nilai kedekatan hubungan antar variabel. Matriks korelasi berisi
koefisien semua pasangan variabel.
Korelasi tertinggi : Variabel VP dan Variabel CN (0.606)
Korelasi terendah : Variabel DO dan Variabel CN (-0.323)
Eigenvalue dan Eigenvector
eigenvalue
eigenvector
Eigen value digunakan untuk menentukan berapa faktor yang akan terbentuk. Hal
tersebut dapat dilihat dari nilai eigen value yang lebih dari 1.
Berdasarkan hasil dari eigen value, didapatkan 6 faktor yang terbentuk
Proporsi Varians dan
Kumulatifnya
Berdasarkan Scree Plot diatas, banyaknya komponen utama yang dipilih adalah 6. Hal ini
karena titik ekstrim dimana garis kurva mulai melandai ditunjukkan pada komponen ke 6.
Berdasarkan informasi ini jumlah komponen yang dipilih berdasarkan metode proporsi
kumulatif varians dengan metode Scree Plot yaitu 6 komponen utama.
Membentuk Model
Matriks ini menunjukkan nilai kedekatan hubungan antar variabel. Matriks korelasi berisi
koefisien semua pasangan variabel.
Eigen value digunakan untuk menentukan berapa faktor yang akan terbentuk. Hal
tersebut dapat dilihat dari nilai eigen value yang lebih dari 1.
Loading factor adalah besaran korelasi antara variabel (indikator) dengan kontruks latennya (faktor).
Berdasarkan nilai loading factor yang diperoleh terlihat bahwa antara variabel (indikator)
dengan konstruks latennya (faktor) menghasilkan nilai korelasi yang bervariasi
Rotasi orthogonal
Faktor-faktor yang diperoleh masih sulit diinterpretasikan secara langsung. Untuk itu
dilakukan manipulasi dengan cara merotasi loading dengan menggunakan metode
Varimax Orthogonal Rotation, karena rotasi tegak lurus varimax lebih mendekati kenyataan
dibanding yang lain.
Berdasarkan nilai rotasi varimax yang diperoleh terlihat bahwa korelasi yang dihasilkan
cukup rendah.
Nilai Communality
Berdasarkan grafik dengan metode Elbow, Berdasarkan grafik dengan metode sillhoute,
terlihat penurunan paling tajam membentuk terlihat garis yang terbentuk menunjukan
pada jumlah k cluter k=2. Sehingga untuk jumlah cluster optimal pada k=2. Sehingga
metode elbow diperoleh hasil k optimal 2 untuk metode sillhoute diperoleh hasil k
optimal 2
K-Means Clustering Spasial
Berdasarkan gambar di
samping, didapatkan nilai
silhoutte score sebesar 0,678
atau mendekati satu.
Sehingga dapat disimpulkan
bahwa hasil clustering spasial
telah berhasil dilakukan. Hal
tersebut juga
mengindikasikan bahwa
titik-titik yang terbentuk
pada satu kelompok berada
di dekat satu sama lain dan
tidak berdekatan dengan
kelompok lainnya.
Visualisasi Clustering Spasial
Berdasarkan grafik dengan metode Elbow, Berdasarkan grafik dengan metode sillhoute,
terlihat penurunan paling tajam membentuk terlihat garis yang terbentuk menunjukan
pada jumlah k cluter k=2. Sehingga untuk jumlah cluster optimal pada k=2. Sehingga
metode elbow diperoleh hasil k optimal 2 untuk metode sillhoute diperoleh hasil k
optimal 2
K-Means Clustering Temporal
Terpenuhinya asumsi multikolinearitas adalah ketika data memiliki nilai VIF < 10.
Berdasarkan output di atas, dapat dilihat bahwa banyak dari nilai VIF yang melebihi 10.
Artinya, terjadi kasus multikolinearitas. Namun, pada analisis ini, data akan diasumsikan
tidak terjadi multikolinearitas.
Kesamaan Matriks Varians
Kovarians
Untuk menguji kesamaan varian digunakan angka
Box’ M dengan ketentuan sebagai berikut:
• Jika signifikansi > 0,05 maka HO diterima
• Jika signifikansi < 0,05 maka H0 ditolak
Hipotesis:
H0 : Varians kedua kelompok data
identik/homogen
H1 : Varians kedua kelompok data tidak
sama/heterogen.
Dari nilai p-value statistik uji Box’ M diketahui nilai
p-value > 0,05 maka gagal tolak H0.
Terpenuhinya asumsi multikolinearitas adalah ketika data memiliki nilai VIF < 10.
Berdasarkan output di atas, dapat dilihat bahwa terdapat variabel pH, Cr6+, VP dan S
yang mengalami multikolinearitas. Namun pada pengerjaan kali ini, data dianggap
memenuhi asumsi multikolinearitas.
Kesamaan Matriks Varians
Kovarians
Untuk menguji kesamaan varian digunakan angka Box’
M dengan ketentuan sebagai berikut:
• Jika signifikansi > 0,05 maka HO diterima
• Jika signifikansi < 0,05 maka H0 ditolak
Hipotesis:
H0 : Varians kedua kelompok data identik/homogen
H1 : Varians kedua kelompok data tidak
sama/heterogen.
Dari nilai p-value statistik uji Box’ M diketahui nilai p-
value > 0,05 maka gagal tolak H0.