Anda di halaman 1dari 6

Analisis Biplot

By : Ridho Ananda, S.Pd, M.Si

Analisis biplot diperkenalkan oleh Gabriel pada tahun 1971. Pada dasarnya
analisis biplot merupakan upaya untuk memberikan peragaan grafik dari matriks
data 𝐗 dalam suatu plot dengan menumpangtindihkan vektor-vektor dalam ruang
berdimensi rendah (biasanya dimensi 2 atau 3) yang mewakili vektor-vektor baris
matriks 𝐗 (gambaran objek) dengan vektor-vektor yang mewakili kolom matriks 𝐗
(gambaran peubah). Dari peragaan ini antara lain akan diperoleh gambaran tentang
kedekatan antarobjek, keragaman peubah, dan korelasi antarpeubah, serta
keterkaitan objek dengan peubah-peubahnya (Siswadi & Suharjo 1999).
Perhitungan dalam analisis biplot didasarkan pada PNS suatu matriks data.
Konsep dasar analisis biplot ialah setiap matriks 𝐗 yang berukuran 𝑛 × 𝑝 dengan
pangkat 𝑟 ≤ min{𝑛, 𝑝} dapat digambarkan secara pasti dalam ruang berdimensi 𝑟.
Bagi matriks berpangkat 𝑟 dan ingin digambarkan dengan baik dalam ruang
berdimensi 𝑠 (biasanya 𝑠 = 2 atau 𝑠 = 3), dilakukan suatu pendekatan yang
optimal dengan suatu matriks berpangkat 𝑠 berdasarkan kuadrat norma perbedaan
minimum antara keduanya seperti yang telah diuraikan oleh Eckart & Young
(1936) dalam pembahasan PNS, sehingga pendekatan tersebut dapat digambarkan
dalam bidang atau ruang.
Misalkan terdapat matriks data 𝐗 𝟎 berukuran 𝑛 × 𝑝 dengan 𝐗 merupakan
1
matriks data yang terkoreksi terhadap nilai tengahnya, yaitu 𝐗 = 𝐗 𝟎 − 𝑛 𝟏𝟏′𝐗 𝟎 , 𝟏

merupakan vektor kolom berunsur bilangan satu dan berukuran 𝑛 × 1. Matriks


koragam dari vektor peubah ganda yang diamati ialah 𝚺 = (n − 1)−1 𝐗′𝐗. Misalkan
𝐗 berpangkat 𝑟, dengan PNS diperoleh 𝐗 = 𝐔𝐋𝐖′ yang dapat ditulis sebagai,

𝐗 = 𝐔𝐋𝛼 𝐋1−𝛼 𝐖 ′ dengan 𝛼 ∈ [0,1], (1)

di mana 𝐔 merupakan matriks berukuran 𝑛 × 𝑟, 𝐋 = diag(√𝜆1 , √𝜆2 , … , √𝜆𝑟 ), dan


𝐖 merupakan matriks berukuran 𝑟 × 𝑝. Jika didefinisikan,

𝐆 ≔ 𝐔𝐋𝛼 (2)

dan
𝐇 ∶= 𝐖𝐋1−𝛼 . (3)

Dengan menyubstitusikan persamaan (1) dan (2) ke persamaan (3) maka diperoleh
persamaan

𝐗 = 𝐆𝐇 ′ . (4)

Baris ke-i pada matriks 𝐆 akan digunakan untuk merepresentasikan baris ke-i
matriks 𝐗, yang berarti merepresentasikan objek ke-i, sedangkan baris ke-j matriks
𝐇 akan digunakan untuk merepresentasikan kolom ke-j matriks 𝐗, yang berarti
merepresentasikan peubah ke-j. Penguraian matriks 𝐗 persamaan (4) tentunya tidak
bersifat khas, bergantung pada pemilihan 𝛼. Ketidakkhasan tersebut akan
memberikan makna yang berbeda dalam analisis. Berikut ini diuraikan beberapa
makna yang diperoleh dari pengambilan nilai 𝛼, antara lain:

1. Pemilihan 𝜶 = 𝟎

Misalkan α = 0, maka 𝐆 = 𝐔 dan 𝐇 = 𝐖𝐋, sehingga diperoleh :

𝐗’𝐗 = (𝐆𝐇’)’(𝐆𝐇’) = 𝐇𝐆’𝐆𝐇’ = 𝐇𝐔’𝐔𝐇’ = 𝐇𝐇’. (5)

Karena 𝐗’𝐗 = 𝐇𝐇’ = (𝑛 − 1)𝚺, maka hasil kali 𝐡𝑗 ′𝐡𝑘 akan sebanding dengan
koragam 𝜎𝑗𝑘 (Jolliffe, 2002). Dalam Gabriel (1971), panjang vektor 𝐡𝑘 adalah
sebanding dengan simpangan baku peubah 𝑘. Sedangkan korelasi antara peubah ke-
𝑗 dan ke-𝑘 ditunjukkan oleh nilai kosinus sudut antara vektor 𝐡𝑗 dan 𝐡𝑘 . Kedekatan
antarobjek pada gambar biplot dapat dilihat dengan menggunakan jarak Euclid
antara 𝐠 𝑖 dan 𝐠 𝑗 di mana nilainya sebanding dengan jarak Mahalanobis antarobjek
pengamatan 𝐱 𝑖 dan 𝐱𝑗 dalam data pengamatan sesungguhnya, hal tersebut cukup
mudah untuk dibuktikan. Misalkan jarak Mahalanobis antara dua pengamatan pada
data awal 𝐱 𝑖 dan 𝐱𝑗 didefinisikan sebagai:

2
𝑑𝑀 (𝐱 𝑖 , 𝐱𝑗 ) = (𝐱 𝑖 − 𝐱𝑗 )′𝚺 −1 (𝐱 𝑖 − 𝐱𝑗 ), (6)

dan jarak Euclid pada biplot didefinisikan sebagai

𝑑𝐸2 (𝐠 𝑖 , 𝐠 𝑗 ) = (𝐠 𝑖 − 𝐠 𝑗 )′(𝐠 𝑖 − 𝐠 𝑗 ).
Berdasarkan persamaan (4) maka vektor baris ke-𝑖 pada matriks 𝐗 dapat
direpresentasikan menjadi

𝐱′𝑖 = 𝐠 ′𝒊 𝐇 ′ ⟺ 𝐱 𝑖 = 𝐇𝐠 𝑖 , (7)

untuk 𝑖 = 1,2, … , 𝑛. Karena 𝐇 = 𝐖𝐋 dan 𝚺 −1 = (n − 1)(𝐗 ′ 𝐗)−1 maka dengan


menyubstitusikan persamaan (7) ke dalam persamaan (6) maka diperoleh:
2
𝑑𝑀 (𝐱 𝑖 , 𝐱𝑗 ) = (𝐇𝐠 𝑖 − 𝐇𝐠 𝑗 )′𝚺 −1 (𝐇𝐠 𝑖 − 𝐇𝐠 𝑗 )

= (𝐇(𝐠 𝑖 − 𝐠 𝑗 )) 𝚺 −1 (𝐇(𝐠 𝑖 − 𝐠 𝑗 ))

= (𝐠 𝑖 − 𝐠 𝑗 )′𝐇′𝚺 −1 𝐇(𝐠 𝑖 − 𝐠 𝑗 )

= (𝐠 𝑖 − 𝐠 𝑗 ) (𝐋𝐖 ′ )(𝑛 − 1)(𝐗 ′ 𝐗)−1 𝐖𝐋(𝐠 𝑖 − 𝐠 𝑗 )
′ (8)
= (𝑛 − 1)(𝐠 𝑖 − 𝐠 𝑗 ) (𝐋𝐖 ′ )(𝐗 ′ 𝐗)−1 𝐖𝐋(𝐠𝑖 − 𝐠 𝑗 ).
Berdasarkan hasil pengurai nilai singular (PNS, Singular Value Decomposition)
dari matriks 𝐗 maka diperoleh nilai dari (𝐗 ′ 𝐗)−1 ialah:

(𝐗 ′ 𝐗)−1 = ((𝐔𝐋𝐖 ′ )′ (𝐔𝐋𝐖 ′ ))−1 = (𝐖𝐋𝐔′ 𝐔𝐋𝐖 ′ )−1 = 𝐖𝐋−2 𝐖 ′ . (9)

Dengan menyubstitusikan persamaan (9) ke persamaan (8) maka diperoleh:


2 ′
𝑑𝑀 (𝐱 i , 𝐱 j ) = (𝑛 − 1)(𝐠 𝑖 − 𝐠 𝑗 ) (𝐋𝐖 ′ )(𝐗 ′ 𝐗)−1 𝐖𝐋(𝐠 𝑖 − 𝐠 𝑗 )

= (𝑛 − 1)(𝐠 𝑖 − 𝐠 𝑗 ) (𝐋(𝐖 ′ 𝐖)𝐋−2 (𝐖 ′ 𝐖)𝐋(𝐠 𝑖 − 𝐠 𝑗 )

= (𝑛 − 1)(𝐠 𝑖 − 𝐠 𝑗 ) 𝐋𝐋−2 𝐋(𝐠 𝑖 − 𝐠 𝑗 )

= (𝑛 − 1)(𝐠 𝑖 − 𝐠 𝑗 ) (𝐠 𝑖 − 𝐠 𝑗 )
= (𝑛 − 1)𝑑𝐸2 (𝐠 𝑖 , 𝐠 𝑗 ). (10)

Berdasarkan hasil pada persamaan (10) maka terbukti untuk 𝛼 = 0, jarak Euclid
dua objek pada gambar biplot sebanding dengan jarak Mahalanobis dua objek
tersebut pada data awal.

2. Pemilihan 𝜶 = 𝟏

Misalkan 𝛼 = 1 maka 𝐆 = 𝐔𝐋 dan 𝐇 = 𝐖 sehingga 𝐆 = 𝐔𝐋𝐖 ′ 𝐖 = 𝐗𝐖


merupakan matriks komponen utama di mana vektor-vektor kolom matriks 𝐖
merupakan vektor-vektor eigen yang berpadanan dengan nilai eigen dari matriks
𝐗′𝐗 di mana 𝐗′𝐗 sebanding dengan matriks koragam. Dalam kasus ini, maka
analisis komponen utama (AKU, Principal Component Analysis) merupakan
bentuk khusus dari analisis biplot. Koordinat vektor 𝐡𝑗 merupakan koefisien peubah
ke-𝑗 dalam 𝑟 komponen utama pertama. Kedekatan antarobjek pada gambar biplot
dapat dilihat dengan menggunakan jarak Euclid antara 𝐠 𝑖 dan 𝐠 𝑗 di mana nilainya
sama dengan jarak Euclid antarobjek pengamatan 𝐱 𝑖 dan 𝐱𝑗 dalam data pengamatan
sesungguhnya, hal tersebut cukup mudah untuk dibuktikan. Berdasarkan persamaan
(7) maka jarak Euclid pada data pengamatan sesungguhnya adalah:

𝑑𝐸2 (𝐱 𝑖 , 𝐱𝑗 ) = (𝐱 𝑖 − 𝐱𝑗 ) (𝐱 𝑖 − 𝐱𝑗 )

⟺ 𝑑𝐸2 (𝐱 𝑖 , 𝐱𝑗 ) = (𝐇𝐠 𝑖 − 𝐇𝐠 𝑗 ) (𝐇𝐠 𝑖 − 𝐇𝐠 𝑗 )

⟺ 𝑑𝐸2 (𝐱 𝑖 , 𝐱𝑗 ) = {𝐇(𝐠 𝑖 − 𝐠 𝑗 )} 𝐇(𝐠 𝑖 − 𝐠 𝑗 )

⟺ 𝑑𝐸2 (𝐱 𝑖 , 𝐱𝑗 ) = (𝐠 𝑖 − 𝐠 𝑗 ) 𝐇 ′ 𝐇 (𝐠 𝑖 − 𝐠 𝑗 )

⟺ 𝑑𝐸2 (𝐱 𝑖 , 𝐱𝑗 ) = (𝐠 𝑖 − 𝐠 𝑗 ) (𝐠 𝑖 − 𝐠 𝑗 )
⟺ 𝑑𝐸2 (𝐱 𝑖 , 𝐱𝑗 )
= 𝑑𝐸2 (𝐠 𝑖 , 𝐠 𝑗 ). (11)

Dari persamaan (11) maka terbukti untuk 𝛼 = 1, jarak Euclid dua objek pada
gambar biplot sama dengan jarak Euclid dua objek tersebut pada data pengamatan.

Untuk pengambilan 𝑠 komponen utama, maka:

𝑑𝐸2 (𝐠 𝑖 , 𝐠 𝑗 ) ≈ 𝑑𝐸2 (𝐱 𝑖 , 𝐱𝑗 ) (12)

sehingga hasil dari 𝑑𝐸2 (𝐠 𝑖 , 𝐠 𝑗 ) pada persamaan (12) merupakan pendekatan dari
jarak Euclid antara objek ke-i dan objek ke-k pada data pengamatan.

3. Pemilihan 𝛼 = 0.5

Jika 𝛼 = 0.5, maka 𝐆 = 𝐔𝐋0.5 dan 𝐇 = 𝐖𝐋0.5 . Biplot dengan 𝛼 = 0.5 akan
merepresentasikan nilai-nilai yang diamati dari matriks data awal lebih baik
daripada pemilihan 𝛼 = 0 dan 𝛼 = 1 (Kohler & Luniak 2005). Hanya saja,
kelemahan dari pemilihan 𝛼 = 0.5, hasil representasinya tidak mempertahankan
ukuran dari koragam data awal dan juga tidak mempertahankan ukuran
ketakmiripan antarobjek data awal.
Gabriel (2001) di dalam Jolliffe (2002) menginvestigasi untuk berapapun
nilai 𝛼, diperoleh hubungan antara objek dengan peubah yakni 𝑥𝑖𝑗 = 𝐠 𝑖 ′𝐡𝑗
memberikan beberapa kemungkinan interpretasi sebagai berikut:

a. Jika vektor 𝐠 𝑖 dan 𝐡𝑗 membentuk sudut lancip, maka nilai 𝑥𝑖𝑗 positif, artinya
objek ke-𝑖 mempunyai nilai lebih besar dari rata-rata pada peubah ke-𝑗.
b. Jika vektor 𝐠 𝑖 dan 𝐡𝑗 membentuk sudut siku-siku, maka nilai 𝑥𝑖𝑗 sekitar nol,
artinya objek ke-𝑖 mempunyai nilai di sekitar rata-rata pada peubah ke-𝑗.
c. Jika vektor 𝐠 𝑖 dan 𝐡𝑗 membentuk sudut tumpul, maka nilai 𝑥𝑖𝑗 negatif,
artinya objek ke-𝑖 mempunyai nilai kurang dari rata-ratanya pada peubah
ke-𝑗.

Jika 𝐗 didekati dengan menggunakan 𝑠 nilai singular pertama, 𝑠 ≪ 𝑟, maka


diperoleh persamaan

𝐗 ≈ 𝑛𝐔𝑠 𝐋𝑠 𝐖𝑝′ = ( 𝑛𝐔𝑠 𝐋𝛼𝑠 )(𝐋1−𝛼 ′


𝑠 𝐖𝑝 ), (13)

𝛼
dengan 0 ≤ 𝛼 ≤ 1. Vektor-vektor baris matriks 𝑛𝐔𝑠 𝐋𝑠 akan merepresentasikan
pendekatan optimal vektor-vektor baris matriks 𝐗 dan vektor-vektor baris matriks
1−𝛼
𝑝𝐖𝑠 𝐋𝑠 akan merepresentasikan pendekatan optimal vektor-vektor kolom
matriks 𝐗. Bila 𝐀 ≔ 𝑛𝐔𝑠 𝐋𝛼𝑠 dan 𝐁 ≔ 𝑝𝐖𝑠 𝐋1−𝛼
𝑠 maka
𝑠

𝐗 ≈ 𝐀𝐁 = ∑ √λ𝑖 𝐮𝑖 𝐰𝑖′ .

(14)
i=1

Menurut Gabriel (1971), analisis biplot dapat digunakan tidak hanya


pendekatan bagi matriks data 𝐗 dengan 𝐀𝐁′ tetapi juga ragam, koragam, dan
korelasi, serta ketakmiripan antarobjek. Dikarenakan 𝐗 ′ 𝐗 = 𝐖𝐋′𝐋𝐖′, maka
matriks 𝐁𝐁′ akan merupakan pendekatan bagi (𝑛 − 1) kali matriks koragam yang
diperoleh dari 𝐗′𝐗. Demikian pula, 𝐀𝐀′ dapat dilihat sebagai pendekatan bagi
matriks 𝐗𝐗′ yang terkait konfigurasi dari objek pada data pengamatan (Jolliffe
2002). Selanjutnya 𝐗, 𝐗𝐗 ′ , dan 𝐗′𝐗 berturut-turut disebut sebagai matriks data,
objek, dan peubah.
Daftar Pustaka
Eckart C, Young G. 1936. The approximation of one matrix by another of lower
rank. Psychometrika, 3(1):211-218.
Gabriel KR. 1971. The biplot graphic display of matrices with application to
principal component analysis. Biometrika, 58(3): 453-468. doi:
10.2307/2334381.
Gabriel KR. 2002. Le biplot – outil d’exploration de donnees multidimensionnelles.
Journal de la Societe Francaise de Statistique. 143(3-4): 5-55.
Jolliffe IT. 2002. Principal Component Analysis. 2nd Ed. New York (US): Springer
Verlag.
Kohler U, Luniak M. 2005. Data inspection using biplots. The Stata Journal, 5(2):
208-223.
Siswadi, Suharjo B. 1999. Analisis Data Peubah Ganda. Bogor (ID): Jurusan
Matematika FMIPA IPB.

Anda mungkin juga menyukai