ISSN : 2087-5290.
MULTIVARIAT
(M.1)
HYBRID KORESPONDENSI UNTUK MENGANALISIS OBJEK
BERDASARKAN KATEGORI KOLOM DAN KARAKTERISTIK OBJEK
Irlandia Ginanjar
Jurusan Statistika, Universitas Padjadjaran, Bandung
email: irlandia_g@unpad.ac.id
Abstrak
Analisis objek akan lebih mudah, efisien dan informatif bila berdasarkan pada peta yang
dapat menampilkan objek, karakteristik objek dan kategori kolom karena berdasarkan peta
tersebut bisa diidentifikasi informasi kesamaan antar objek, kesamaan kategori kolom,
hubungan kategori kolom dengan objek, dan hubungan karakteristik objek dengan objek
berdasarkan kategori kolom. Berdasarkan hal itu penulis memperkenalkan metoda pemetaan
yang dinamakan analisis Hybrid Korespondensi (Hybrid Correspondence Analysis) yang
merupakan metoda penggabungan Biplot Principal Component Analysis (PCA Biplot) dengan
Analisis Korespondensi, dimana untuk memetakan objek dan kategori kolom menggunakan
metoda analisis Korespondensi dan untuk memetakan karakteristik objek menggunakan PCA
Biplot. Dalam Hybrid Korespondensi ini pemetaan Karakteristik Objek dihitung dengan
menggunakan PCA Biplot yang selanjutnya dipetakan ke peta yang dihasilkan oleh analisis
Korespondensi, sehingga objek, karakteristik objek dan kategori kolom dapat dipetakan
bersama-sama, dengan persen keragaman komulatif pertama dan kedua dari eigenvalues
yang dihasilkan Analisis Korespondensi menjadi acuan kualitas pemetaan.
Kata Kunci :
1. PENDAHULUAN
Pemetaan adalah gambaran objek-objek yang dapat disajikan pada dua atau lebih
dimensi. Tiap objek mempunyai posisi tertentu dalam suatu peta, hal itu memberikan suatu
gambaran ruang mengenai informasi kesamaan antar objek-objek yang diamati. Informasi
kesamaan antar objek akan lebih lengkap bila ditambah dengan informasi tentang
karakteristik
objek,
karakteristik
objek
tersebut
biasanya
digunakan
untuk
mendifrensiasikan objek (Levitt, 1998) atau memposisikan pasar (Kotler, 1997), maka
analisis objek akan lebih mudah, efisien dan informatif bila berdasarkan pada peta yang
dapat menampilkan objek, karakteristik objek dan kategori kolom karena berdasarkan peta
tersebut bisa diidentifikasi informasi kesamaan antar objek, karakterisasi objek dan
kesamaan antar kategori kolom.
303
PROSIDING
Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290.
Hybrid
2. METODE
Berdasarkan tujuan makalah ini maka analisis data dilakukan mulai dari melakukan
Analisis Korespondensi sehingga menghasikan skor faktor kategori kolom dan skor faktor
objek. Skor faktor objek menjadi acuan untuk pemetaan karakteristik objek, sehingga skor
faktor objek dikorelasikan dengan variabel karakteristik untuk mendapatkan matriks
komponen utama (Yan dan Kang, 2003). Matriks komponen utama dianalisis dengan
menggunakan metoda Biplot PCA untuk mendapatkan skor faktor karakteristik. Kualitas peta
yang dihasikan oleh Hybrid korespondensi diidentifikasi berdasarkan persentase keragaman.
Cara mengidentifikasi informasi dari peta yang dihasikan oleh Hybrid korespondensi, sama
304
PROSIDING
Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290.
dengan cara mengidentifikasi informasi dari Analisis Korespondensi dan analisis Biplot PCA.
Langkah-langkah penelitian yang dilakukan digambarkan dalam bentuk diagram alur analisis
data yang disajikan di Gambar 1.
D
Membangun Tabel
Analisis Korespondensi
Skor faktor objek
Menghitung korelasi antara variabel karakteristik dengan skor
faktor objek, untuk mendapatkan matriks komponen utama
Analisis Biplot PCA
Koordinat pemetaan karakteristik objek
Memetakan objek, karakteristik objek dan kategori kolom
Peta objek, karakteristik objek, dan kategori
Mengidentifikasi persentase keragaman yang diterangkan oleh
Mengidentifikasi informasi kesamaan antar objek, hubungan
karakteristik dengan objek dan kesamaan antar kategori kolom.
GAMBAR 1. DIAGRAM ALUR ANALISIS DATA.
Pemetaan Korespondensi
Misalkan N matriks kontingensi, dan P matriks korespondensi.
N(I x J) [nij]
; nij 0
(1)
(2)
(3)
Matriks P disebut juga matriks kepadatan peluang, karena jika kita jumlahkan setiap
baris matriks P hasilnya 1 (satu). Simbol 1 pada persamaan (2.2) adalah matriks kolom yang
Jurusan Statistika-FMIPA-Unpad 2011
305
PROSIDING
Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290.
setiap unsurnya adalah 1 (satu), ditulis 1 [1 ... 1]T. Dr dan Dc berturut-turut adalah matriks
diagonal baris dan matriks diagonal kolom yang unsur diagonalnya masing-masing adalah r
dan c.
Matriks profil baris dan kolom dari P didefinisikan sebagai vektor baris dan vektor
kolom dari P dibagi oleh jumlah masing-masing, ditulis;
~r1 T
~
c1T
(4)
R Dr-1P # dan C Dc-1PT #
T
T
~
~
rI
cJ
cj (j = 1 ... J) masing-masing ditulis
Kedua profil baris ~
ri (i = 1 ... I) dan profil kolom ~
dalam baris R dan kolom C. Profil-profil ini identik dengan baris dan kolom N yang dibagi
oleh jumlah masing-masing.
Misalkan SVD dari P rcT adalah :
P rcT = ADBT Dimana ATDr-1A = BTDc-1B = I
(5)
1 ... K > 0, maka kolom dari matriks A dan B berturut-turut mendefinisikan sumbu
utama kolom dan sumbu utama baris, dimana
1
A = e1
1
1
0
D =
#
2
#
0
1
1
e2 "
ek ;
2
k
0
" 0
;
% #
" k
(6)
"
(7)
B = [e1 e 2 " e k ];
(8)
adalah akar pangkat dua dari eigenvalue ( ) dan e adalah eigenvector yang
didapatkan dari matrik [P rcT].
IJ
J J J K
(9)
JI
II
IK
(10)
306
PROSIDING
Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290.
Dua kolom pertama dari F menjadi titik koordinat untuk pemetaan objek dan dua
kolom pertama dari G menjadi titik koordinat untuk pemetaan kategori kolom. Pemetaan
karakteristik merupakan vektor, Kesamaan antar objek, kesamaan antar kategori kolom, dan
hubungan antara objek dengan kategori kolom dapat diidentifikasi berdasarkan jarak antar
titik, jika semakin dekat jarak antar titik maka semakin mirip, semakin jauh jarak antar titik
maka semakin berbeda, maka pengelompokan objek atau kategori kolom juga bias dilakukan
berdasarkan kesamaan tersebut.
3.2
cos( ij ) ij .
(11)
dimana ij adalah sudut antara vektor i dengan vektor j, dan ij adalah koefisien korelasi
antara vektor i dan vektor j. Pemetaan objek didapatkan menggunakan persamaan (9)
dengan matriks pemetaan F berukuran n r yang merupakan skor faktor matriks efek baris,
dan karakteristik yang dilambangkan dengan Z berukuran p n , maka matriks komponen
utama yang berukuran p r didapatkan dengan cara:
ij = corr (z i , f j )
ij =
N i j z i f j
( z )( f )
i
(N z ( z ) )(N
2
fj
( f ) )
2
(12)
11
21
A=
#
p1
12
22
#
p2
" 1r
" 2 r
% #
" pr
(13)
12
, dengan =
yang menjadi pengali di matriks efek baris dan matriks efek kolom sama, maka matriks efek
kolom sebagai koordinat pemetaan vektor karakteristik dihitung menggunakan:
H' = D
12 12
A' ,
(14)
Dua kolom pertama dari H menjadi titik koordinat untuk pemetaan vektor
karakteristik objek. Pemetaan karakteristik merupakan vektor, karena titik koordinat
307
PROSIDING
Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290.
didapatkan dari hasil perhitungan karelasi skor faktor matriks efek baris dengan
karakteristik objek, berdasarkan hal itu maka informasi didapatkan berdasarkan korelasi
vektor karakteristik objek dengan sumbu pada peta, jika sudut antara vektor karakteristik
dengan sumbu pada peta mendekati 00 atau 3600 (vektor karakteristik objek berhimpit
dengan sumbu pada peta dengan arah yang sama) maka vektor tersebut memiliki korelasi
positif yang sangat erat dengan sumbu pada peta, jika sudut antara vektor karakteristik
dengan sumbu peta mendekati 1800 (vektor karakteristik objek berhimpit dengan sumbu
peta dengan arah berlawanan) maka vektor tersebut memiliki korelasi negatif yang sangat
erat dengan sumbu pada peta, jika sudut antara vektor karakteristik dengan sumbu pada peta
mendekati 900 atau 2700 (vektor karakteristik objek tegak lurus dengan sumbu pada peta)
maka vektor tersebut tidak berkorelasi.
3.3
Analisis Korespondensi menjadi acuan kualitas pemetaan yang memuat objek, karakteristik
objek, dan kategori kolom dalam satu peta yang dihasilkan Hybrid Korespondensi.
Persentase keragaman (inertia) yang digunakan sebagai ukuran kualitas pemetaan dihitung
dengan cara:
= 1' 2
3.4
2 .
(15)
Contoh Kasus
Contoh kasus dalam penelitian ini adalah diambil dari data skunder, yang didapatkan
dari sumber pustaka Jawa Barat Dalam Angka, Tahun 2010 yang diunduh dari
www.jabarprov.go.id pada tanggal 6 Oktober 2011. Data tabel kontingensi merupakan jumlah
dosen pada tahun 2009 yang ada di Universitas Padjadjaran, dengan kategori baris terdiri
dari sebelas fakultas yaitu Hukum, Ekonomi, MIPA, Pertanian, ISIP, Sastra, Psikologi, Ilmu
Komunikasi, Perikanan, TIP, dan Farmasi sebagai objek, kategori kolom terdiri dari tiga
kategori tingkat pendidikan dosen yaitu Sarjana, Magister, dan Doktor. Data karakteristik
objek yang digunakan terdiri dari dua variabel yaitu Jumlah Mahasiswa Baru Tahun Ajaran
2009/2010 dan Jumlah Lulusan Tahun Ajaran 2009/2010. Data yang digunakan dalam
penelitian ini disajikan pada Tabel 2.
Dengan menggunakan Analisis Korespondensi didapatkan nilai inersia (persamaan
(15)), titik koordinat fakultas (persamaan (9)), dan titik koordinat tingkat pendidikan
308
PROSIDING
Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290.
(persamaan (10)) untuk pemetaan dua dimensi yang disajikan pada Tabel 2. Peta Fakultas
dan Tingkat Pendidikan Dosen hasil dari Analisis Korespondensi, disajikan pada Gambar 2.
TABEL 1. JUMLAH DOSEN TAHUN 2009, JUMLAH MAHASISWA BARU, DAN JUMLAH LULUSAN
TAHUN AJARAN 2009/2010 PER FAKULTAS.
Tingkat Pendidikan
Dosen
No.
Fakultas
1
2
3
4
5
6
7
8
9
10
11
Hukum
Ekonomi
MIPA
Pertanian
ISIP
Sastra
Psikologi
IlmuKomunikasi
Perikanan
TIP
Farmasi
Sarj
ana
28
7
51
31
50
44
17
29
11
5
15
Megi
ster
Dok
tor
67
95
132
68
100
79
34
71
40
40
32
16
34
48
62
26
17
15
7
14
9
5
Karakteristik Fakultas
Jumlah
mahasiswa
Baru
636
521
422
110
1010
739
202
422
235
148
162
Jumlah
lulusan
322
450
313
252
477
340
105
562
448
116
115
TABEL 2. PERSEN KERAGAMAN (INERSIA) DAN TITIK KOORDINAT FAKULTAS DAN TINGKAT
PENDIDIKAN DALAM DUA DIMENSI.
Dimensi
1
2
Persen Keragaman
67,78
32,21
Hukum
-0,17042
0,00862
Ekonomi
0,36957
0,64380
MIPA
0,05246
-0,04636
Pertanian
0,66019
-0,48447
ISIP
-0,24566
-0,17474
Sastra
-0,33591
-0,22027
Fakultas
0,03816
-0,18895
Psikologi
Ilmu
-0,39705
0,14337
Komunikasi
Perikanan
0,08622
0,12957
TIP
0,04410
0,44315
Farmasi
-0,23259
-0,00994
Sarjana
-0,50819
-0,72114
Tingkat Pendidikan
Master
-0,17406
0,62143
Doktor
0,84347
-0,30624
309
PROSIDING
Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290.
fakultas, karakteristik fakultas, dan tingkat pendidikan, hasil dari metoda Hybrid
Korespondensi. Peta dua dimensi fakultas, karakteristik fakultas, dan tingkat
pendidikan, hasil dari metoda Hybrid Korespondensi disajikan di Gambar 3.
Gambar 2. Peta Fakultas dan Tingkat Pendidikan Dosen Hasil dari Analisis
Korespondensi
310
PROSIDING
Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290.
311
PROSIDING
Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290.
Kesimpulan
1. Hybrid Korespondensi mendapatkan peta objek, karakteristik objek, dan kategori
kolom dalam satu peta, karena pemetaan objek pada Analisis Korespondensi ataupun
PCA Biplot sama-sama berdasarkan skor faktor matriks efek baris.
2. Kesamaan antar objek , kesamaan antar kategori kolom, dan hubungan antara objek
dengan kategori kolom dapat diidentifikasi berdasarkan jarak antar titik, jika semakin
dekat jarak antar titik maka semakin mirip, semakin jauh jarak antar titik maka semakin
berbeda.
3. Hubungan objek dengan karakteristiknya dapat diidentifikasi berdasarkan sudut antara
vektor karakteristik dengan sumbu pada peta, jika sudut antara vektor karakteristik
dengan sumbu pada peta mendekati 00 atau 3600 maka vektor tersebut memiliki korelasi
positif yang sangat erat dengan sumbu pada peta, jika sudut antara vektor karakteristik
dengan sumbu peta mendekati 1800 maka vektor tersebut memiliki korelasi negatif yang
sangat erat dengan sumbu pada peta, jika sudut antara vektor karakteristik dengan
sumbu pada peta mendekati 900 atau 2700 maka vektor tersebut tidak berkorelasi.
4. Kualitas pemetaan Hybrid Korespondensi didapatkan berdasarkan komulatif dari
persentase keragaman atau inersia pertama dan kedua dari eigenvalues yang
dihasilkan oleh Analisis Korespondensi.
4.2
Saran
1. Jika data berasal dari sampel dan hasil analisis yang diinginkan dapat
mempresentasikan populasi maka harus menggunakan teknik pengambilan sampel
peluang (Probability sampling).
5. DAFTAR PUSTAKA
Abdi, H., dan Valentin, D. (2007), DISTATIS, Encyclopedia of measurement and statistics, Ed:
Salkind, N., Sage Publications, Inc., California, hal. 284291.
Gabriel, K.R. (1971), The biplot graphic display of matrices with application to principal
component analysis, Biometrika, Vol. 58, No. 3, hal. 453467.
Ginanjar, I. (2011), Analisis produk dan assessor dari data penyortiran menggunakan Hybrid
DISTATIS, Prosiding Seminar Nasional Statistika, Universitas Diponegoro, ISBN: 978979-097-142-4, hal. 2537.
Jurusan Statistika-FMIPA-Unpad 2011
312
PROSIDING
Seminar Nasional Statistika | 12 November 2011
ISSN : 2087-5290.
Greenacre, M.J., (1984), Theory and Applications of Correspondence Analysis, Academic Press,
Inc., London.
Harshman, R.A., dan Lundy, M.E., (1994), PARAFAC: Parallel factor analysis, Computational
Statistics and Data Analysis, Vol. 18, hal. 3972.
Husson, F., & Pags, J. (2006), INDSCAL model: geometrical interpretation and
methodology, Computational Statistics and Data Analysis, Vol. 50, hal. 358378.
Kotler, P. (1997), Marketing Management, 6th edition, Prentice-Hall, Inc., New Jersey.
Kruskal, J., dan Wish, M. (1978), Multidimensional Scaling, Sage University Papers Series.
Quantitative Applications in the Social Sciences ; No. 07-011, Sage Publications, Inc.,
Iowa.
Lawless, H.T., Sheng T., dan Knoops, S. (1995), Multidimensional scaling of sorting data
applied to cheese perception, Food Quality and Preference, Vol. 6, hal. 9198.
Levitt, T. (1980), Marketing Succes Through Differentiation-of Anything, Harvard Business
Review, January-February 1980, Harvard Business School Publishing, Boston.Goldberg,
Jack.L., 1991. Matrix Theory With Apllications, McGraw-Hill Inc, New York.
Meyners, M., Kunert, J., dan Qanari E.M. (2000), Comparing generalized procrustes analysis and
statis, Food Quality and Preference, Vol. 11, hal. 7783.
Yan, W., dan Kang, M.S. (2003), GGE biplot analysis : a graphical tool for breeders, geneticists,
and agronomists, CRC Press LLC, Florida.
Pemprov Jabar. (2011), Jawa Barat Dalam Angka 2010,
http://www.jabarprov.go.id/root/dalamangka/JabalDalamAngka2010.pdf, diunduh
pada tanggal 6 Oktober 2011.
313