Anda di halaman 1dari 23

ANALISIS KOMPONEN UTAMA

(Principal Component Analysis)


JURUSAN BIOLOGI FMIPA UNIVERSITAS TANJUNGPURA
2014
Sub Pokok Bahasan
Pendahuluan
Principal Component Analysis (PCA)
Metode PCA
Contoh dan Interpretasi Hasil
Analisis dengan R
Pendahuluan
Salah satu kajian yang sering menarik perhatian para peneliti biologi adalah
kajian untuk melihat bagaimana struktur komunitas suatu ekosistem dalam
wilayah yang diteliti dan bagaimana hubungannya dengan faktor lingkungan
Pernyataan lain yang mungkin ingin dijawab oleh peneliti adalah
bagaimanakah interaksi antar spesies dalam memperebutkan sumberdaya
yang tersedia? atau apakah interaksi ini akan tercermin dalam struktur
komunitas yang diamati?
Analisis yang umum digunakan untuk mengkaji hal seperti ini adalah apa yang
disebut sebagai analisis klaster (ada juga menyebutnya klasifikasi) dan
ordinasi
Pendahuluan
Tujuan dari analisis klaster adalah untuk mendapatkan gambaran secara umum
bagaimana sampel mengelompok (secara alamiah) dalam sebuah wilayah
Pengelompokan ini terjadi karena sampel tersebut memiliki kemiripan yang sama
dibandingkan dengan sampel dari kelompok yang lain, sedangkan
Ordinasi adalah sebuah peta dari sampel yang digambarkan dalam dua atau tiga
dimensi, yang penempatan sampel bukanlah untuk menunjukkan lokasi geografis dari
sampel tersebut, melainkan mencerminkan kemiripan komunitas secara biologik
Jarak antar sampel dalam ordinasi dicoba untuk sesuai dengan ketidakmiripan dalam
struktur komunitas, dengan perkataan lain titik-titik yang berdekatan mencerminkan
komunitas yang sama, atau sampel yang jauh terpisah memiliki sedikit spesies yang
sama
Principal Component Analysis (PCA)
PCA merupakan salah satu kajian analisis mulivariat
Multivariate Analysis (MA): Metode analisis yang berkenaan dengan
sejumlah besar variabel yang datanya diperoleh secara simultan dari setiap
obyek pengamatan
Hubungan-hubungan antar variabel secara simultan ( = Analisis Peubah
Ganda) dimana Proses perhitungannya sangat kompleks
Dalam proses perhitungannya menggunakan pendekatan matrik seperti
Determinan Matriks, Pangkat Matriks, Matriks Kebalikan, Eigen Value, Eigen
Vector, dll
Principal Component Analysis (PCA)
Principal Component Analysis (PCA) digunakan untuk menjelaskan struktur
matriks varians-kovarians dari suatu set variabel melalui kombinasi linier dari
variabel-variabel tersebut
Secara umum komponen utama dapat berguna untuk reduksi dan interpretasi
variabel-variabel.
PCA sering digunakan sebagai kajian ekologi untuk melihat hubungan antara
variabel yang di kaji
Principal Component Analysis (PCA)
Penelitian ekologi umumnya akan melibatkan data biotis maupun abiotis. Data
biotis yang dikumpulkan biasanya disajikan dalam bentuk matriks data
(spesies stasiun)
Principal Component Analysis (PCA)
Notasi variabel biasanya dinyatakan sebagai X1, X2, ....., Xp, dimana p
menunjukkan banyaknya variabel (banyaknya spesies atau stasiun)
Data yang dikumpulkan dalam sebuah penelitian bisa berbentuk kualitatif
atau kuantitatif
Untuk data biotis, contoh data yang berbentuk kualitatif adalah jika data
matriks berisikan data presence/absence (ada atau tidak ada)
Data yang berbentuk kuantitatif, data yang dikumpulkan adalah data
kelimpahan (yang umum digunakan) atau dapat juga berbentuk persentase
Principal Component Analysis (PCA)
Pada dasarnya PCA adalah suatu metode untuk mengekspresikan kembali data
multivariat.
PCA adalah metode untuk mentransformasikan variabel lama menjadi
variabel baru yaitu melakukan orientasi kembali terhadap data yang
dikumpulkan sehingga bisa diperoleh dimensi yang lebih sedikit namun
memberikan informasi sebesar-besarnya dari data aslinya
Adanya pengurangan dimensi ini maka visualisasi data, tampak lebih
sederhana dan lebih mudah mengelolanya
Jika dalam analisis klaster atau klasifikasi yang digunakan sebagai data
dasarnya adalah indeks kemiripan antar sampel, maka untuk perhitungan
PCA konsep yang digunakan adalah jarak Euclidian.
Metode PCA
Misal kita mempunyai variabel X1, X2,..., Xp (spesies atau faktor lingkungan).
Berdasarkan variabel ini kita dapat membangun kombinasi linear untuk
menghasilkan variabel baru yang disebut sebagai komponen utama.

dengan
Wi adalah bobot atau koefisien untuk variabel ke i
Xi adalah variabel ke i
Y adalah kombinasi linier dari variabel X
Metode PCA
Dalam analisis komponen utama ditentukan suatu metode untuk
mendapatkan nilai-nilai koefisien atau bobot dari kombinasi linier
variabel-variabel pembentuknya dengan ketentuan sebagai berikut
Ada sebanyak p komponen utama, yaitu sebanyak variabel yang diamati dan
setiap komponen utama adalah kombinasi linier dari variabel-variabel
tersebut
Setiap komponen utama saling ortogonal (tegak lurus) dan saling bebas.
Komponen utama dibentuk berdasarkan urutan varians dari yang terbesar
hingga yang terkecil
Metode PCA
Maksud komponen utama dibentuk berdasarkan urutan varians dari yang terbesar
hingga yang Terkecil adalah
komponen utama pertama (PC1) merupakan kombinasi linier dari seluruh variabel
yang diamati dan memiliki varians terbesar
komponen utama kedua (PC2) merupakan kombinasi linier dari seluruh variabel yang
diamati yang bersifat ortogonal terhadap PC 1 dan memiliki varians kedua terbesar
komponen utama ketiga (PC3) merupakan kombinasi linier dari seluruh variabel yang
diamati yang bersifat ortogonal baik terhadap PC 1maupun PC2, dan memiliki varians
ketiga terbesar
komponen utama ke p (PCp) merupakan kombinasi linier dari seluruh variabel yang
diamati yang bersifat ortogonal terhadap PC1, PC2, , PC(p-1)dan memiliki varians
yang terkecil.
Metode PCA

Selanjutnya Z1 disebut sebagai komponen utama pertama, Z2 komponen


utama kedua dan seterusnya
Urutan ini merupakan cerminan dari besarnya varians yang dimiliki oleh
masing-masing variabel atau secara matematis dinotasikan sebagai var(Z1 )
var(Z2 ) ... var(Zp ), dimana var(Zi ) adalah varians dari Zi dalam kumpulan
data yang dipelajari
Metode PCA
Untuk mendapatkan koefisien komponen utama secara bersamaan dapat
menggunakan salah satu cara berikut ini
Dekomposisi eigen value dan eigen vector dari matriks korelasi atau
kovarians dari variabel-variabel yang diamati. Dalam hal ini eigen value
merupakan varians setiap komponen utamanya dan eigen vector
merupakan koefisien-koefisien komponen utamanya
Dekomposisi nilai singular dari matriks data yang berukuran n x p.
Metode PCA
Untuk keperluan reduksi variabel tentu harus ditentukan berapa banyak
komponen utama yang mesti diambil. Ada beberapa cara untuk menentukan
berapa banyak komponen utama yang harus diambil diantaranya adalah
menggunakan scree plot. Banyak komponen yang diambil adalah pada titik
kurva tidak lagi menurun tajam atau mulai melandai.
Menggunakan proporsi kumulatif varians terhadap total varians
Metode PCA
Dalam analisis komponen utama diperoleh beberapa ukuran-ukuran berikut
Nilai total varians merupakan informasi dari seluruh variabel asal yang dapat
dijelaskan oleh komponen-komponen utamanya
proporsi varians komponen utama ke k terhadap total varians menunjukkan
besarnya persentase informasi variabel-variabel asal yang terkandung dalam
komponen utama ke-k
Nilai koefisien korelasi antara komponen utama dengan variabelnya
Contoh Soal
Interpretasi Hasil
Eigenvalues yang ditunjukkan dalam tabel di atas sebenarnya adalah varians
dari masing-masing komponen utama
Persentase variasi menunjukkan berapa besar muatan informasi yang
terdapat pada masing-masing sumbu komponen dan diperoleh dari (i/p
100%)
Berdasarkan Tabel 4 di atas tampak bahwa persentase varians untuk
komponen utama pertama (Z1) adalah yang paling tinggi yaitu sebesar 83,6%
disusul oleh Z2, Z3 dan Z4
Interpretasi Hasil
eigenvector yaitu koefisien-koefisien yang membentuk kombinasi linier dari
komponen utama
Analisis PCA dengan R
> data(iris)
> str(iris); summary(iris[1:4])
> pairs(iris[1:4],main="Iris Data", pch=19, col=as.numeric(iris$Species)+1)
> mtext("Type of iris species: red-> setosa; green-> versicolor; blue-> virginica",
1, line=3.7,cex=.8)
> iris.stand <- as.data.frame(scale(iris[,1:4]))
> pca <- prcomp(iris.stand,scale=T)
Analisis PCA dengan R
> summary(pca)
> pca$sdev
> screeplot(pca, type="lines",col=3)
> pca$rotation
> biplot(pca,cex=0.8)
> bline(h = 0, v = 0, lty = 2, col = 8)
> abline(h = 0, v = 0, lty = 2, col = 8)

Anda mungkin juga menyukai