Anda di halaman 1dari 7

Principal Component Analisys (PCA) With PRIMER 6.1.

13

RIMER-E Ltd

By : FAJAR RAHMAWAN Email : fajar_rahmawan@yahoo.com Phone : +6281944880181 Refferance : Bambang S. Soedibjo (ANALISIS KOMPONEN UTAMA DALAM KAJIAN EKOLOGI)

A. Principal Component Analisys (PCA) : Merupakan salah satu metode analisa multivariate yang salah satu pengaplikasiannya dibidang ekologi dapat digunakan untuk melihat bagaimana struktur komunitas suatu ekosistem dalam wilayah yang diteliti dan bagaimana hubungannya dengan faktor lingkungan. B. Alasan mengapa menggunakan metode PCA : Ada beberapa alasan yang saya gunakan mengapa memilih metode PCA, antara lain adalah sebagai berikut: 1. dapat menghilangkan korelasi =0 2. dapat digunakan untuk semua kondisi data 3. dapat digunakan tanpa mengurangi jumlah variable asal 4. dari berbagai penelitian, yang telah dilakukan analisa menggunakan PCA, ternyata hasil lebih akurat 5. PCA mampu mentransformasi variable lama menjadi variable baru C. Diskripsi perhitungan metode PCA : Misalnya : Faktor lingkungan / species (X1, X2, X3, X4, X5, . Xn) Perhitungan PCA menggunakan konsep Euclidian Z1 = e11X1, e12X2, e13X3, e14X4, e15X5, . e1nXn) Z2 = e21X1, e22X2, e23X3, e24X4, e25X5, . e2nXn) Z3 = e31X1, e32X2, e33X3, e34X4, e35X5, . e3nXn) . . . . . . . . Zp = ep1X1, ep2X2, ep3X3, ep4X4, ep5X5, . EpnXn) Komponen utama Pertama Komponen utama Ke-2 Komponen utama Ke-3

Komponen utama dst

Dapat ditulis notasi : Var (Z1) Var (Z2) Var (Z3) Var (Z4) Var (Z5) .. Var (Zp) Kumpulan data yang dipelajari Sifat Varian Z tidak memiliki korelasi dengan yang lainnya

Principal Component Analisys | 1

D. Contoh perhitungan menggunakan PCA dan diskripsinya : Contoh data kelimpahan species : Tabel 1 : Spesies Spesies A Species B Species C Species D Dimensi Stasiun (sampel) ST 3 ST 4 ST 5 3 5 2 14 15 10 3 0 3 1 1 1

ST 1 2 20 1 2

ST 2 3 15 6 2

ST 6 5 11 1 1

ST 7 6 2 0 4

Dihasilkan 4 komponen utama


Hasil 1 :

Gambar 1. Hasil Eigenvalues Eigenvalues (i) : Merupakan varians dari komponen utama Persentase variasi = i/p * 100% % Variasi Komulatif :
% variasi komulatif Z1 = persentase variasi Z1 % variasi komulatif Z2 = persentase variasi Z1 + persentase variasi Z2 % variasi komulatif Z3 = persentase variasi Z1 + persentase variasi Z2 + persentase variasi Z3 % variasi komulatif Z3 = persentase variasi Z1 + persentase variasi Z2 + persentase variasi Z3 + persentase variasi Z4

Next Step : Eigenvector (koeefisien komponen utama)

Gambar 2. Hasil Eigenvectors Z1 - Z5 = Hasil Species A, B, C dan D (Lihat data diatas yang ) dan didapatkan kombinasi linier seperti dibawah ini :
Z1 = 0.188 Species A 0.968 Species B 0.121 Species C + 0.112 Species D Z2 = -0.354 Species A 0.186 Species B + 0.917 Species C - 0.018 Species D Z3 = 0.885 Species A + 0.151 Species B + 0.377 Species C + 0.227 Species D Z4 = -0.237 Species A + 0.073 Species B - 0.057 Species C + 0.967 Species D

Hasil tabel dicari terbesar dari +0- Artinya adalah nilai terbesar tersebut berkontribusi tinggi dari kelimpahan komponen utama (species) atau adanya dominan komponen ini.

Principal Component Analisys | 2

Next Step : Perhitungan Score : Berdasarkan kombinasi linier yang terbentuk di atas, maka dapat dihitung skor dari masing-masing komponen utama dengan memasukkan nilai-nilai kelimpahan masing masing spesies ke dalam persamaan tersebut, sehingga diperoleh SCORE berikut pada Gambar 3 :

Gambar 3. Principal Component Scores Next Step : Plot Grafik : Skor-skor di atas merupakan titik koordinat ordinasi untuk diplot dalam sumbu komponen yang diinginkan. Dicontohkan ordinasi sampel dengan menggunakan sumbu Z1 dan Z2 :

NB

Gambar 4. Hasil plot ordinasi Z1 dan Z2 : jika ada 1 titik semakin jauh dari kelompok titik titik yang berkumpul maka harus ada kajian yang mendalam

Principal Component Analisys | 3

Next Step (Conditional) : Normalisasi data : Normalisasi adalah mengurangi nilai kelimpahan dari setiap baris dengan rata rata kelimpahan dari baris tersebut dibagi dengan simpangan bakunya (STDEV). Normalisasi data menyebabkan varians sampel sepanjang sumbu spesies akan sama yaitu 1. Ini berarti seluruh spesies memiliki nilai penting yang sama dalam menentukan komponen utama. Namun demikian, tidak semua data perlu dinormalisasikan, khususnya jika transformasi pada grafik PCA sudah memberikan gambaran yang seimbang atas kelimpahan spesies diantara sampel. PCA yang didasarkan pada data yang sudah dinormalisasi, disebut PCA berbasis korelasi. Sebaliknya, PCA yang datanya tidak dinormalisasi disebut PCA berbasis kovarians. Untuk melakukan normalisasi diperlukan data yang disajikan pada Tabel 2 berikut ini. Tabel 2. Data kelimpahan species yang akan di Normalisasi Spesies Spesies A Species B Species C Species D Stasiun (sampel) ST 3 ST 4 ST 5 ST 6 ST 7 3 5 2 5 6 14 15 10 11 2 3 0 3 1 0 1 1 1 1 4 Total 26 87 14 12 Rata2 STDEV 3.71 12.43 2.00 1.71 1.6 5.6 2.2 1.1

ST 1 2 20 1 2

ST 2 3 15 6 2

Rumus Normalisasi Normalisasi (tiap spesies dari seluruh sampel) dilakukan dengan menggunakan rumus berikut : Normalisasi Species x (Yx) =

Contoh 1 : Normalisasi pada Species C ST 6 = = -0.46

Contoh 2 : Normalisasi pada Species D ST 7 = = 2.08

Principal Component Analisys | 4

Selain transformasi data dan normalisasi data, hal lain yang penting diperhatikan sebelum PCA dilakukan adalah mereduksi spesies-spesies yang jumlahnya sangat sedikit (langka). Misalnya saja, dari 20 sampel yang diambil, Spesies A hanya muncul 1 individu dalam sedikit sampel. Reduksi spesies ini sebaiknya dilakukan sebelum transformasi dan normalisasi dilakukan. Menghilangkan spesies seperti ini akan banyak berpengaruh terhadap hasil ordinasi. Apalagi jika jumlah spesies yang tercatat sangat banyak tetapi kelimpahannya sedikit. Hasil pembahasan di atas mungkin timbul pertanyaan kapankah kita melakukan transformasi dan normalisasi atau keduanya? Transformasi dalam data biotik umumnya tetap perlu ditransformasikan untuk menghindari distribusi data yang miring ke kanan (yang umum dijumpai untuk data kelimpahan). Normalisasi tidak selamanya perlu dilakukan. Normalisasi dalam PCA dilakukan apabila variabelvariabel yang diamati memiliki unit pengukuran yang berbeda antara lain data lingkungan. Contohnya suhu, salinitas, kimia hara, adalah variabel - variabel lingkungan yang memiliki satuan pengukuran yang berbeda. E. Penggunaan SOFTWARE PRIMER 6 Untuk melakukan analisa PCA : Salah satu perangkat lunak yang banyak digunakan dalam analisis komunitas laut adalah PRIMER yang dikembangkan oleh Plymouth Laboratory, Inggris Contoh file dapat dilihat seperti Tabel 1 diketik pada MS Excel dimulai pada A1 :

1. Langkah a. Buka Primer 6 File Open pilih yang Excel Files pilih contoh file nya pilih dimana letak anda ketikkan data pada Excel worksheet nya Next Finish

Principal Component Analisys | 5

b. Setelah dibuka dapat dilihat seperti gambar dibawah ini :

c. Pilih Analyse PCA Maximum no of PCs ketikkan 4 (karna menghasilkan 4 komponen utama) OK

d. Maka akan dihasilkan :

Principal Component Analisys | 6