Analisis biplot diperkenalkan oleh Gabriel pada tahun 1971. Pada dasarnya
analisis biplot merupakan upaya untuk memberikan peragaan grafik dari matriks
data 𝐗 dalam suatu plot dengan menumpangtindihkan vektor-vektor dalam ruang
berdimensi rendah (biasanya dimensi 2 atau 3) yang mewakili vektor-vektor baris
matriks 𝐗 (gambaran objek) dengan vektor-vektor yang mewakili kolom matriks 𝐗
(gambaran peubah). Dari peragaan ini antara lain akan diperoleh gambaran tentang
kedekatan antarobjek, keragaman peubah, dan korelasi antarpeubah, serta
keterkaitan objek dengan peubah-peubahnya (Siswadi & Suharjo 1999).
Perhitungan dalam analisis biplot didasarkan pada PNS suatu matriks data.
Konsep dasar analisis biplot ialah setiap matriks 𝐗 yang berukuran 𝑛 × 𝑝 dengan
pangkat 𝑟 ≤ min{𝑛, 𝑝} dapat digambarkan secara pasti dalam ruang berdimensi 𝑟.
Bagi matriks berpangkat 𝑟 dan ingin digambarkan dengan baik dalam ruang
berdimensi 𝑠 (biasanya 𝑠 = 2 atau 𝑠 = 3), dilakukan suatu pendekatan yang
optimal dengan suatu matriks berpangkat 𝑠 berdasarkan kuadrat norma perbedaan
minimum antara keduanya seperti yang telah diuraikan oleh Eckart & Young
(1936) dalam pembahasan PNS, sehingga pendekatan tersebut dapat digambarkan
dalam bidang atau ruang.
Misalkan terdapat matriks data 𝐗 𝟎 berukuran 𝑛 × 𝑝 dengan 𝐗 merupakan
1
matriks data yang terkoreksi terhadap nilai tengahnya, yaitu 𝐗 = 𝐗 𝟎 − 𝑛 𝟏𝟏′𝐗 𝟎 , 𝟏
𝐆 ≔ 𝐔𝐋𝛼 (2)
dan
𝐇 ∶= 𝐖𝐋1−𝛼 . (3)
Dengan menyubstitusikan persamaan (1) dan (2) ke persamaan (3) maka diperoleh
persamaan
𝐗 = 𝐆𝐇 ′ . (4)
Baris ke-i pada matriks 𝐆 akan digunakan untuk merepresentasikan baris ke-i
matriks 𝐗, yang berarti merepresentasikan objek ke-i, sedangkan baris ke-j matriks
𝐇 akan digunakan untuk merepresentasikan kolom ke-j matriks 𝐗, yang berarti
merepresentasikan peubah ke-j. Penguraian matriks 𝐗 persamaan (4) tentunya tidak
bersifat khas, bergantung pada pemilihan 𝛼. Ketidakkhasan tersebut akan
memberikan makna yang berbeda dalam analisis. Berikut ini diuraikan beberapa
makna yang diperoleh dari pengambilan nilai 𝛼, antara lain:
1. Pemilihan 𝜶 = 𝟎
Karena 𝐗’𝐗 = 𝐇𝐇’ = (𝑛 − 1)𝚺, maka hasil kali 𝐡𝑗 ′𝐡𝑘 akan sebanding dengan
koragam 𝜎𝑗𝑘 (Jolliffe, 2002). Dalam Gabriel (1971), panjang vektor 𝐡𝑘 adalah
sebanding dengan simpangan baku peubah 𝑘. Sedangkan korelasi antara peubah ke-
𝑗 dan ke-𝑘 ditunjukkan oleh nilai kosinus sudut antara vektor 𝐡𝑗 dan 𝐡𝑘 . Kedekatan
antarobjek pada gambar biplot dapat dilihat dengan menggunakan jarak Euclid
antara 𝐠 𝑖 dan 𝐠 𝑗 di mana nilainya sebanding dengan jarak Mahalanobis antarobjek
pengamatan 𝐱 𝑖 dan 𝐱𝑗 dalam data pengamatan sesungguhnya, hal tersebut cukup
mudah untuk dibuktikan. Misalkan jarak Mahalanobis antara dua pengamatan pada
data awal 𝐱 𝑖 dan 𝐱𝑗 didefinisikan sebagai:
2
𝑑𝑀 (𝐱 𝑖 , 𝐱𝑗 ) = (𝐱 𝑖 − 𝐱𝑗 )′𝚺 −1 (𝐱 𝑖 − 𝐱𝑗 ), (6)
𝑑𝐸2 (𝐠 𝑖 , 𝐠 𝑗 ) = (𝐠 𝑖 − 𝐠 𝑗 )′(𝐠 𝑖 − 𝐠 𝑗 ).
Berdasarkan persamaan (4) maka vektor baris ke-𝑖 pada matriks 𝐗 dapat
direpresentasikan menjadi
𝐱′𝑖 = 𝐠 ′𝒊 𝐇 ′ ⟺ 𝐱 𝑖 = 𝐇𝐠 𝑖 , (7)
= (𝐠 𝑖 − 𝐠 𝑗 )′𝐇′𝚺 −1 𝐇(𝐠 𝑖 − 𝐠 𝑗 )
′
= (𝐠 𝑖 − 𝐠 𝑗 ) (𝐋𝐖 ′ )(𝑛 − 1)(𝐗 ′ 𝐗)−1 𝐖𝐋(𝐠 𝑖 − 𝐠 𝑗 )
′ (8)
= (𝑛 − 1)(𝐠 𝑖 − 𝐠 𝑗 ) (𝐋𝐖 ′ )(𝐗 ′ 𝐗)−1 𝐖𝐋(𝐠𝑖 − 𝐠 𝑗 ).
Berdasarkan hasil pengurai nilai singular (PNS, Singular Value Decomposition)
dari matriks 𝐗 maka diperoleh nilai dari (𝐗 ′ 𝐗)−1 ialah:
Berdasarkan hasil pada persamaan (10) maka terbukti untuk 𝛼 = 0, jarak Euclid
dua objek pada gambar biplot sebanding dengan jarak Mahalanobis dua objek
tersebut pada data awal.
2. Pemilihan 𝜶 = 𝟏
Dari persamaan (11) maka terbukti untuk 𝛼 = 1, jarak Euclid dua objek pada
gambar biplot sama dengan jarak Euclid dua objek tersebut pada data pengamatan.
sehingga hasil dari 𝑑𝐸2 (𝐠 𝑖 , 𝐠 𝑗 ) pada persamaan (12) merupakan pendekatan dari
jarak Euclid antara objek ke-i dan objek ke-k pada data pengamatan.
3. Pemilihan 𝛼 = 0.5
Jika 𝛼 = 0.5, maka 𝐆 = 𝐔𝐋0.5 dan 𝐇 = 𝐖𝐋0.5 . Biplot dengan 𝛼 = 0.5 akan
merepresentasikan nilai-nilai yang diamati dari matriks data awal lebih baik
daripada pemilihan 𝛼 = 0 dan 𝛼 = 1 (Kohler & Luniak 2005). Hanya saja,
kelemahan dari pemilihan 𝛼 = 0.5, hasil representasinya tidak mempertahankan
ukuran dari koragam data awal dan juga tidak mempertahankan ukuran
ketakmiripan antarobjek data awal.
Gabriel (2001) di dalam Jolliffe (2002) menginvestigasi untuk berapapun
nilai 𝛼, diperoleh hubungan antara objek dengan peubah yakni 𝑥𝑖𝑗 = 𝐠 𝑖 ′𝐡𝑗
memberikan beberapa kemungkinan interpretasi sebagai berikut:
a. Jika vektor 𝐠 𝑖 dan 𝐡𝑗 membentuk sudut lancip, maka nilai 𝑥𝑖𝑗 positif, artinya
objek ke-𝑖 mempunyai nilai lebih besar dari rata-rata pada peubah ke-𝑗.
b. Jika vektor 𝐠 𝑖 dan 𝐡𝑗 membentuk sudut siku-siku, maka nilai 𝑥𝑖𝑗 sekitar nol,
artinya objek ke-𝑖 mempunyai nilai di sekitar rata-rata pada peubah ke-𝑗.
c. Jika vektor 𝐠 𝑖 dan 𝐡𝑗 membentuk sudut tumpul, maka nilai 𝑥𝑖𝑗 negatif,
artinya objek ke-𝑖 mempunyai nilai kurang dari rata-ratanya pada peubah
ke-𝑗.
𝛼
dengan 0 ≤ 𝛼 ≤ 1. Vektor-vektor baris matriks 𝑛𝐔𝑠 𝐋𝑠 akan merepresentasikan
pendekatan optimal vektor-vektor baris matriks 𝐗 dan vektor-vektor baris matriks
1−𝛼
𝑝𝐖𝑠 𝐋𝑠 akan merepresentasikan pendekatan optimal vektor-vektor kolom
matriks 𝐗. Bila 𝐀 ≔ 𝑛𝐔𝑠 𝐋𝛼𝑠 dan 𝐁 ≔ 𝑝𝐖𝑠 𝐋1−𝛼
𝑠 maka
𝑠
𝐗 ≈ 𝐀𝐁 = ∑ √λ𝑖 𝐮𝑖 𝐰𝑖′ .
′
(14)
i=1