Anda di halaman 1dari 8

Principal Component Analysis (PCA)

Ircham Ali
Jaka Septiadi
Kagiraneza Alexis Fidele
Tujuan Eksperimen

• Uji dataset jantung koroner yang diambil dari UCI Machine Learning Repository
dengan menggunakan algoritma Principal Component Analysis (PCA).
• Pengujian dilakukan dengan bantuan tools SPSS sebagai alat bantu perhitungan
statistika.

• Dataset : 14 variabel faktor yang mempengaruhi penyakit jantung koroner.


• Hipotesis : mereduksi variabel-variabel yang mempengaruhi penyakit jantung
koroner.
Pembersihan Data

• Pembersihan data dilakukan dengan tools SPSS, dengan analisis deskriptif


statistik. Semua variabel dipilih untuk mengetahui variabel yg missing. Tabel
berikut ini menampilkan variabel yg missing.

• Terdapat 1 baris data dari ke-14 variabel yg missing


Menghitung nilai Barlett Test of Sphecirity
dan Keiser Meyers Oklin (KMO)

• Dengan menghitung kedua nilai ini, untuk memastikan dataset yang digunakan
memenuhi persyaratan Analisa PCA.

• Dari tabel di atas, diketahui nilai Barlett sebesar 559.782 pada signifikan 0.000
dan nilai KMO sebesar 0.667 menunjukkan kecukupan sampel termasuk kategori
menengah sehingga dataset penyakit jantung koroner yang digunakan memenuhi
syarat untuk Analisa dengan PCA.
Principal Component Analysis (PCA)
• Analisa PCA diawali dengan menghitung korelasi antar variabel.
• Ada dua cara dalam menentukan hubungan antara variabel :
1. menghitung nilai korelasi (matriks korelasi)
2. menghitung kovarian (matriks kovarian)
• Dari matriks korelasi nantinya akan dilakukan Analisa PCA dengan melihat nilai
eigen yang ada pada masing-masing variabel.
• Lalu, terbentuk variabel baru yang didasarkan pada nilai eigen lebih dari satu.
Nilai Eigen hasil Analisa PCA
Nilai Eigen hasil Analisa PCA
• Berdasarkan tabel sebelumnya, diperoleh 5 variabel baru (principal component)
yang memiliki nilai eigen lebih satu.
• 1. Komponen pertama : 2.763
• 2. Komponen kedua : 1.537
• 3. Komponen ketiga : 1.223
• 4. Komponen keempat: 1.181
• 5. Komponen kelima : 1.022
• Untuk menentukan variabel apa saja yang termasuk dalam lima variabel baru ini
dan variabel yang benar-benar mempengaruhi penyakit jantung koroner, maka
dilakukan rotasi faktor (transformasi) dengan menggunakan rotasi faktor varimax.
Rotasi Faktor
• Berdasarkan tabel di samping, terdapat korelasi antara
variabel asli denngan variabel baru, yang disebut nilai
Loading. Nilai Loading yang dipilih adalah nilai Loading
yang memiliki nilai di atas 0.5 yang dianggap
mempengaruhi jantung koroner

Anda mungkin juga menyukai