Anda di halaman 1dari 17

ANALISIS KORESPONDENSI (Correspondence Analysis) Oleh : Bambang Widjanarko Otok 1.

PENDAHULUAN Dalam penelitian bidang sosial seperti marketing research data yang telah dikumpulkan sering di tampilkan dalam bentuk tabel kontingensi dwi arah (cross tabulation) yang berisi informasi tentang frekuensi atau presentase dari kategori-kategori penyusunnya. Dari tabel tersebut, salah satu informasi yang ingin diketahui pada umumnya adalah ada tidaknya keterkaitan antar kategori. Untuk menguji kebebasan ini statistik uji yang sering digunakan adalah KhiKuadrat (Chi-Square) bila antar kategori tersebut tidak saling terkait (bebas), dapat di artikan bahwa besarnya frekuensi (nilai) profil pada suatu kategori tidak dipengaruhi oleh profil pada kategori lainnya. Akan tetapi bila kebebasan antar kategori tersebut tak dapat dibuktikan, maka hal yang selalu ingin diketahui adalah profil-profil mana yang saling terkait tersebut. Untuk mengetahui hal ini diperlukan analisis lanjutan guna membandingkan antar profil. Analisis korespondensi yang tergolong dalam analisis eksplorasi data peubah ganda (exploratory multivariate data analysis), di samping dapat digunakan untuk melihat secara visual ada tidaknya ketergantungan antar kategori tersebut, juga sekaligus dapat membantu melihat kedekatan (keterkaitan) suatu profil dari suatu kategori terhadap profil dari kontingensi, menjadi komponen baris dan kolom. Hasil dari analisis ini kemudian akan ditampilkan dalam bentuk gambar dua dimensi dengan menumpangtindihkan ( overlay) antara profil-profil baris dan kolom. Analisis ini dapat digunakan untuk positioning dan perceptual mapping. 2. ANALISIS KORESPONDENSI Analisis korespondensi (AK) merupakan analisis yang memperagakan baris dan kolom secara serempak dari tabel kontingensi dwi arah, yang kemudian dapat diperluas untuk tabel kontingensi multi arah. Di bidang psikologi perhitungan analisis ini dikenal dengan penskalaan dual sedangkan dalam ekologi dikenal sebagai peretaan timbal balik (Hill, 1974). Peragaan yang diperoleh merupakan penumpang tindihan profilprofil baris dan kolom, yang dalam analisis ini diperoleh dari tabel kontingensi dengan menggunakan jarak khi-kuadrat. Penggunaan Penguraian Nilai Singular (PNS) umum (Generalized Singular value Decomposition) dalam perhitungan analisis ini akan memberikan keterkaitannya dengan analisis lain dalam multivariat.
Otok_bw@yahoo.com

Andaikan N merupakan matriks data yang unsur-unsurnya bilangan non-negatif. Matriks ini merupakan tabel kontingensi dwiarah. Matriks korespondensi didefinisikan sebagai:
i Pj

1 N dengan n.. = 1' N1 n..

Vektor yang unsur-unsurnya merupakan jumlah unsur dari vektorvektor baris matriks P ialah r = P1; ri > 0, i=1,2,...,I. Vektor yang unsur-unsurnya merupakan jumlah unsur dari vektor-vektor kolom matriks P ialah c = P1; ci > 0,i = 1,2,..., J. Definisikan Dr sebagai matriks diagonal yang unsur-unsur diagonal utamanya ialah unsur dari vektor r, yang dilambangkan sebagai Dr = diag(r), dan Dc = diag(c). Matriks profil baris didefinisikan sebagai R = Dr-1P dan matriks profil kolom didefinisikan sebagai C = Dc-1P. Jadi vektor r merupakan rata-rata terboboti dari profil-profil kolom dan vektor c merupakan rata-rata terboboti dari profil-profil baris. Andaikan R = [r1, r2,..., rI] dan C = [c1, c2,..., cJ], maka jarak yang digunakan untuk menggambarkan kedekatan antar profil adalah jarak Kai-Kuadrat, yaitu: (ri rj)Dc-1(ri rj) untuk jarak antara profil baris ri dengan profil baris rj (ci cj)Dr-1(ci cj) untuk jarak antara profil kolom ci dengan profil kolom cj Profil-profil baris dan kolom tersebut di atas digambarkan dengan menumpangtindihkan dalam ruang berdimensi rendah. Bila dengan Penguraian Nilai Singular (PNS) umum diperoleh bahwa P rc = ADB; ADr-1A = BDc-1B = I, maka profil baris matriks R yang posisi relatifnya sama dengan matriks baris matriks R 1c, diberikan oleh F = Dr-1AD. Profil kolom matriks C yang posisi relatifnya sama dengan matriks baris matriks C 1r, diberikan oleh G = Dc-1BD. Jika profil baris R atau profil kolom C digunakan jarak KaiKuadrat maka dengan profil baris matriks F atau G representatsinya diperoleh jarak Euclid. Interpretasi kedekatan antar profil dalam kategori yang sama didasarkan pada jarak Euclidnya, sedangkan hubungan profil-profil antar kategori dapat ditelusuri melalui persamaan transisi sebagai berikut: F = RGD-1 atau G = CFD-1 Jarak yang jauh antar profil akan memberikan kontribusi yang relatif besar terhadap tidak adanya kebebasan antar kategori yang diamati. Dalam analisis korespondensi, kelayakan penggambaran dalam ruang berdimensi rendah didasarkan pada presentase inersia yang dapat dijelaskan dari inersia total yang merupakan dugaan statistik uji kebebasan antar kategori yang dibagi dengan banyaknya obyek (n..). CONTOH KASUS:

Otok_bw@yahoo.com

Pemilu Tahun 2004 telah usai, namun banyak kenangan empiris yang masih perlu diingat. Menjelang pemilu, LSM dan harian Jawa Pos telah melakukan kerjasama melakuan survey politik. Salah satu hasil penelitian tersebut dicantumkan pada Tabel 1 berikut: Tabel 1: Data Tingkat Pendidikan dengan Parpol Tingkat PARPOL Pendidika PDIP PPP PAN GOLKA PKB PBB PKS n R <= SD SLTP SLTA > SLTA 30 39 34 31 19 25 19 14 7 14 18 32 8 7 7 11 6 5 6 9 0 3 3 6 1 1 3 6

Dari tabel diatas, informasi yang ingin diketahui adalah: apakah ada keterkaitan antara tingkat pendidikan seseorang dengan Parpol yang dipilih. Lebih lanjut dapat dikembangkan suatu mendapatkan gambaran mengenai posisi parpol menurut tingkat pendidikan para pendukungnya untuk menjawab pertanyaan tersebut dapat dijabarkan secara berstruktur seperti berikut: 1. Apakah ada katerkaitan antara tingkat pendidikan dengan parpol yang dipilih, bila tidak ada, berarti antar parpol memiliki proporsi pendidikan yang sama dari para pendukungnya. 2. Bagaimana basis pendidikan pendukung atau simpatisan masing-masing parpol. Analisis korespondensi akan digunakan untuk menjawab pertanyaanpertanyaan tersebut. Namun untuk memberikan gambaran lebih jelas tentang manfaat analisis korespondensi, pada tahap awal akan dilakukan suatu analisis dengan menggunakan uji Khi-kuadrat ( chisquare) untuk mengetahui ada tidaknya keterkaitan antar tingkat pendidikan dengan parpol yang dipilih. Crosstabs Output 1:
Case Processing Summary Cases Missing N Percent 0 .0%

Parpol * Pddkn

Valid N Percent 364 100.0%

Total N Percent 364 100.0%

Output 2:

Otok_bw@yahoo.com

Pddkn * Parpol Crosstabulation PDIP 30 26.1 39 34.6 34 33.1 31 40.1 134 134.0 PPP 19 15.0 25 19.9 19 19.0 14 23.1 77 77.0 PAN 7 13.8 14 18.3 18 17.6 32 21.3 71 71.0 Parpol GOLKAR 8 6.4 7 8.5 7 8.2 11 9.9 33 33.0 PKB 6 5.1 5 6.7 6 6.4 9 7.8 26 26.0 PBB 0 2.3 3 3.1 3 3.0 6 3.6 12 12.0 PKS 1 2.1 1 2.8 3 2.7 6 3.3 11 11.0 Total 71 71.0 94 94.0 90 90.0 109 109.0 364 364.0

Pddkn

<=SD SLTP SLTA > SLTA

Total

Count Expected Count Expected Count Expected Count Expected Count Expected

Count Count Count Count Count

Interpretasi: Menunjukkan informasi mengenai nilai amatan (observasi) dan nilai harapan dari masing-masing sel. Besarnya selisih antara nilai amatan dengan nilai harapan dalam sel yang sama, dapat digunakan sebagai petunjuk profil-profil mana yang saling terkait.

Output 3:
Chi-Square Tests Value 28.785 a 31.634 11.515 364 df 18 18 1 Asymp. Sig. (2-sided) .051 .024 .001

Pearson Chi-Square Likelihood Ratio Linear-by-Linear Association N of Valid Cases

a. 8 cells (28.6%) have expected count less than 5. The minimum expected count is 2.15.

Interpretasi: Menunjukkan hasil pengujian kebebasan antar kategori. Terlihat ada 3 jenis uji yang digunakan, pertama adalah Pearson Chi-Sguare dengan nilai uji yang diperoleh 28,785 dan Asymp. Sig (2-sided) sebesar 0,051 yang mendekati dari 0,05 yang berarti antar kategori memiliki kecenderungan untuk saling terkait. Kedua adalah Lielihood Ratio dengan nilai uji yang diperoleh 31,634 dan Asymp. Sig (2-sided) sebesar 0,024 yang lebih kecil dari 0,05 yang berarti antar kategori pendidikan dan PARPOL yang dipilih memiliki keterkaitan secara signifikan. Ketiga Linear-by-Linear Association dengan nilai uji yang diperoleh 11,515 dan Asymp. Sig (2-sided) sebesar 0,001 yang lebih kecil dari 0,05 yang berarti antar kategori memiliki kecenderungan untuk saling terkait.

Otok_bw@yahoo.com

Dari hasil ini dapat disimpulkan bahwa antara tingkat pendidikan dengan PARPOL yang dipilih memiliki keterkaitan atau tidak bebas. Correspondence Analysis Output 1:
Correspondence Table Parpol GOLKAR PKB 8 6 7 5 7 6 11 9 33 26

Pddkn <=SD SLTP SLTA > SLTA Active Margin

PDIP 30 39 34 31 134

PPP 19 25 19 14 77

PAN 7 14 18 32 71

PBB 0 3 3 6 12

PKS 1 1 3 6 11

Active Margin 71 94 90 109 364

Interpretasi: Menunjukkan data asli yang berguna untuk melihat kembali apakah data yang dimasukkan tidak ada kesalahan. Output 2:
Row Profiles Parpol GOLKAR PKB .113 .085 .074 .053 .078 .067 .101 .083 .091 .071

Pddkn <=SD SLTP SLTA > SLTA Mass

PDIP .423 .415 .378 .284 .368

PPP .268 .266 .211 .128 .212

PAN .099 .149 .200 .294 .195

PBB .000 .032 .033 .055 .033

PKS .014 .011 .033 .055 .030

Active Margin 1.000 1.000 1.000 1.000

Interpretasi: Menunjukan profil baris, dimana setiap data asli diboboti (dibagi) dengan jumlah masing-masing baris. Output ini dapat digunakan untuk mengetaui proporsi simpatisan partai berdasrkan pendidikan tertentu. Output 3:
Column Profiles Parpol GOLKAR PKB .242 .231 .212 .192 .212 .231 .333 .346 1.000 1.000

Pddkn <=SD SLTP SLTA > SLTA Active Margin

PDIP .224 .291 .254 .231 1.000

PPP .247 .325 .247 .182 1.000

PAN .099 .197 .254 .451 1.000

PBB .000 .250 .250 .500 1.000

PKS .091 .091 .273 .545 1.000

Mass .195 .258 .247 .299

Interpretasi: Menunjukan profil kolom, dimana setiap data asli diboboti (dibagi) dengan jumlah masing-masing kolom. Output ini dapat digunakan untuk mengetaui proporsi pendidikan simpatisan setiap partai. Output 4:

Otok_bw@yahoo.com

Summary Proportion of Inertia Singular Value .267 .085 .024 Confidence Singular Value Standard Deviation .050 .048 Correlation 2 -.163

Dimension 1 2 3 Total

Inertia .071 .007 .001 .079

Chi Square

Sig.

28.785

.051 a

Accounted for .902 .091 .007 1.000

Cumulative .902 .993 1.000 1.000

a. 18 degrees of freedom

Interpretasi: Menunjukan akar ciri (eigen values) yaitu besarnya keragaman yang dapat dijelaskan oleh skor baris dan kolom. Terlihat bahwa persentase proporsi kumulatif dua akar cirri pertama sebesar 99,3 %. Hal ini dapat diartikan bahwa dua vector baris dan kolom mampu menjelaskan 99,3% inersia total. Atau dua dimensi tersebut dapat menjelaskan 99,3 % keragaman data. Sehingga gambar yang dihasilkan akan sangat mewakili konfigurasi yang sebenarnya. Output 5:
a Overview Row Points

Score in Dimension Of Point to Inertia of Dimension 1 2 .275 .524 .143 .401 .000 .041 .582 .035 1.000 1.000

Contribution Of Dimension to Inertia of Point 1 2 Total .838 .161 1.000 .773 .219 .992 .017 .416 .433 .993 .006 .999

Pddkn <=SD SLTP SLTA > SLTA Active Total

Mass .195 .258 .247 .299 1.000

1 -.614 -.385 .013 .720

2 .477 -.363 -.118 .100

Inertia .023 .013 .001 .042 .079

a. 0 normalization

Interpretasi: Menunjukan informasi mengenai koefisien profil baris hasil Penguraian Nilai Singular Terampat (Generalized Singular Value Decomposition, GSVD). Koefisien baris ini digunakan untuk menggambarkan masingmasing kategori baris pada ruang dimensi rendah (dua). Output 6:

Otok_bw@yahoo.com

a Overview Column Points

Score in Dimension Of Point to Inertia of Dimension 1 2 .121 .019 .224 .042 .376 .029 .001 .325 .005 .264 .124 .267 .148 .052 1.000 1.000

Contribution Of Dimension to Inertia of Point 1 2 Total .977 .016 .993 .981 .019 1.000 .992 .008 1.000 .021 .906 .927 .160 .840 1.000 .812 .177 .989 .950 .034 .983

Parpol PDIP PPP PAN GOLKAR PKB PBB PKS Active Total

Mass .368 .212 .195 .091 .071 .033 .030 1.000

1 -.297 -.532 .718 .047 .138 1.001 1.145

2 -.067 -.131 -.113 .552 .560 -.830 .383

Inertia .009 .016 .027 .003 .002 .011 .011 .079

a. 0 normalization

Interpretasi: Menunjukan informasi mengenai koefisien profil kolom hasil Penguraian Nilai Singular Terampat (Generalized Singular Value Decomposition, GSVD). Koefisien kolom ini digunakan untuk menggambarkan masing-masing kategori kolom pada ruang dimensi rendah (dua). Output 7:
Confidence Row Points Standard Deviation in Dimension 1 2 .163 .169 .163 .190 .187 .337 .102 .128 Correlation 1-2 .584 -.150 -.010 -.286

Pddkn <=SD SLTP SLTA > SLTA

Interpretasi: Menunjukan informasi mengenai kontribusi korelasi masing-masing profil baris terhadap vector-vektor hasil Penguraian Nilai Singular Terampat (Generalized Singular Value Decomposition, GSVD).

Output 8:

Otok_bw@yahoo.com

Confidence Column Points Standard Deviation in Dimension 1 2 .074 .117 .080 .070 .084 .099 .309 .411 .231 .159 .436 .484 .406 .557 Correlation 1-2 -.151 -.433 .468 -.053 .018 .477 .061

Parpol PDIP PPP PAN GOLKAR PKB PBB PKS

Interpretasi: Menunjukan informasi mengenai kontribusi korelasi masing-masing profil kolom terhadap vector-vektor hasil Penguraian Nilai Singular Terampat (Generalized Singular Value Decomposition, GSVD). Output 9:

Row and Column Points

0 Normalization
Parpol Pddkn

0.6

<=SD

GOLKAR PKB PKS > SLTA

0.3

Dimension 2

0.0

PPP

PDIP

SLTA

PAN

-0.3

SLTP

-0.6 PBB -0.9 -0.5 0.0 0.5 1.0

Dimension 1

Interpretasi:
Otok_bw@yahoo.com

Menunjukan tampilan utaman dari analisis korespondensi. Melalui gambar ini dua masalah utama dapat diketahui yaitu: Ada tidaknya keterkaitan antar kategori dapat diketahui secara visual Kedekatan antar profil dari masing-masing kategori yang dapat menunjukkan ada tidaknya ciri khas (dominasi) suatu profil dari satu kategori terhadap profil yang lain (kategori lain). Kedekatan antar profil dalam satu kategori dapat digunakan jarak Euclid, sedangkan kedekatan antar profil antar kategori digunakan persamaan transisi. Semakin jauh jarak antar profil menunjukan tidak adanya kebebasan antar kategori. Terlihat bahwa antar PARPOL bila dilihat sejajar dengan sumbu mendatar, antar PPP dan PKS terdapat jarak yang cukup jauh, hal ini mengindikasikan bahwa terdapat ketakbebasan antar PARPOL terhadap Pendidikan simpatisannya. Hal ini juga telah dibuktikan pada tahap pertama melalui analisis tabel kontingensi (cross tabulation). Bila antar kategori tersebut saling bebas, maka profil-profil tersebut akan menyebar di sekitar pusat koordinat. Untuk melihat profil baris terhadap profil kolom (sebaliknya), dapat dilakukan melalui konfigurasi antar keduanya. Terlihat bahwa PAN merupakan PARPOL yang dominan terhadap simpatisan dengan proporsi Pendidikan (> SLTA), demikian pula dengan PKS dan PBB. Sementara itu PARPOL PDIP dan PPP proporsi pendidikan simpastisannya lebih dominan pada tingkat pendidikan SD, SLTP dan SLTA. Sedangkan PARPOL GOLKAR dan PKB simpatisannya hampir semua jenjang pendidikan.

Otok_bw@yahoo.com

PRAKTIKUM ANALISIS KORESPONDENSI Menggunakan SPSS Berikut adalah tahapan yang dilalui dalam analisis tersebut dengan menggunakan SPSS.

Gambar1: Memulai SPSS for Windows Ketiklah data pada Tabel 1 dengan menggunakan Data Editor SPSS, dengan mengunakan format berindeks tersaji pada Gambar 2 berikut.

Otok_bw@yahoo.com

10

Gambar 2. Entry Data Melalui Data Editor SPSS Pada menu utama SPSS Pilih Data selanjutnya Klik Weight Case .Pada Kotak Dialog Weight Cases Tandai pilihan Weight cases by dan pindahkan Frek ke kotak dialog Frequency Variable seperti tampak pada Gambar berikut:

Otok_bw@yahoo.com

11

Selanjutnya untuk melakukan uji kebebasan, pada menu utama SPSS pilih Analyze pilih Descriptive Statistics Pilih Crosstabs seperti Gambar berikut.

Gambar 4: Uji Kebebasan Data Melalui Crosstabs... Selanjutnya pada kotak Dialog Crosstabs, pindahkan Pddkn pada kotak Dialog Row(s) dan Parpol pada kotak dialog Column(s), seperti pada Gambar berikut.

Gambar 5: Kotak Dialog Crosstab Selanjutnya Klik Statistics... untuk memilih jenis analisis, sesaat akan muncul kotak dialog Crosstabs: Statistics dan Tandai Chisquare dan Klik Continue untuk kembali ke menu utama Gambar 5.

Otok_bw@yahoo.com

12

Gambar 6: Kotak Dialog Crosstabs: Statistics Selanjutnya Klik Cells... untuk memilih jenis analisis, sesaat akan muncul kotak dialog Crosstabs: Cell Display dan Tandai Observed dan Expected dan Klik Continue untuk kembali ke menu utama Gambar 5.

Gambar 7: Kotak Dialog Crosstabs: Cell Display Selanjutnya Klik OK, dan hasil analisis bisa dilihat pada Output Editor. Langkah-lagkah untuk melakukan analisis korespondensi menggunakan SPSS adalah sebagai berikut: Pada menu utama SPSS pilih Analyze pilih Data Reduction Pilih Correspondence Analysis seperti Gambar berikut.

Otok_bw@yahoo.com

13

Gambar 8: Analisis Korepondensi melalui SPSS Selanjutnya akan muncul kotak dialog Correspondence Analysis, Pindahkan Parpol ke kotak Dialog Row dan Klik Define Range, Klik Continue untuk kembali Gambar 9. Pindahkan Pddkn ke kotak Dialog Column dan Klik Define Range, seperti Gambar 9 dan 10 berikut.

Gambar 9: Kotak Dialog Correspondence Analysis

Otok_bw@yahoo.com

14

Gambar 10: Kotak Dialog Correspondence Analysis Selanjutnya Klik Model... untuk memilih jenis analisis, sesaat akan muncul kotak dialog Correspondence Analysis: Model dan Tandai seperti Gambar 11 berikut dan Klik Continue untuk kembali ke menu utama Gambar 9.

Gambar 11: Kotak Dialog Correspondence Analysis: Model Selanjutnya Klik Statistics... untuk memilih jenis analisis, sesaat akan muncul kotak dialog Correspondence Analysis: Statistics dan Tandai seperti Gambar 12 berikut dan Klik Continue untuk kembali ke menu utama Gambar 9.

Otok_bw@yahoo.com

15

Gambar 12: Kotak Dialog Correspondence Analysis: Statistics Selanjutnya Klik Plots... untuk memilih jenis analisis, sesaat akan muncul kotak dialog Correspondence Analysis: Plots dan Tandai seperti Gambar 13 berikut dan Klik Continue untuk kembali ke menu utama Gambar 9.

Gambar 13: Kotak Dialog Correspondence Analysis: Plots Selanjutnya Klik OK, dan hasil analisis bisa dilihat pada Output Editor. LATIHAN: Pemilu Tahun 2004 telah usai, namun banyak kenangan empiris yang masih perlu diingat. Menjelang pemilu, LSM dan harian Jawa Pos telah melakukan kerjasama melakuan survey politik. Salah satu hasil penelitian tersebut dicantumkan pada Tabel 2 berikut: Tabel 2: Data Tingkat Usia dengan Parpol Usia PARPOL (tahun) PDIP PPP PAN GOLKA PKB PBB PKS

Otok_bw@yahoo.com

16

R 17 24 25 34 35 44 > 45 37 35 31 30 12 21 18 13 7 18 18 12 3 7 8 11 6 5 6 29 0 3 3 6 6 5 6 8

Dari tabel diatas, informasi yang ingin diketahui adalah: apakah ada keterkaitan antara tingkat usia seseorang dengan Parpol yang dipilih. Lebih lanjut dapat dikembangkan suatu mendapatkan gambaran mengenai posisi parpol menurut tingkat usia para pendukungnya untuk menjawab pertanyaan tersebut dapat dijabarkan secara berstruktur seperti berikut: Apakah ada katerkaitan antara tingkat usia dengan parpol yang dipilih, bila tidak ada, berarti antar parpol memiliki proporsi usia yang sama dari para pendukungnya. Bagaimana basis usia pendukung atau simpatisan masingmasing parpol.

Otok_bw@yahoo.com

17