Anda di halaman 1dari 22

MAKALAH ANALISIS MULTIVARIATE

ANALISIS KORESPONDENSI

Disusun Oleh Kelompok 19:

Manis Hanggraeni 081711633012


Maseta Rahma 081711633047

Dibimbing Oleh :
Dr. Rimuljo Hendradi, S.Si., MSi.

PROGRAM STUDI S1 SISTEM INFORMASI


FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS AIRLANGGA
SURABAYA
2019
BAB I

PENDAHULUAN

1.1 Latar Belakang


Dalam salah satu analisis statistika dengan tujuan untuk mengetahui
hubungan antara dua variabel atau lebih. Bila hubungan variabel-variabel ini
dimodelkan dalam bentuk rumus matematik, maka dapat digunakan untuk
keperluan peramalan atau pengklasifikasian . Analisis multivatiat berhubungan
dengan metode-metode statistik yang secara Bersama-sama melakukan analisis
terhadap lebih dari dua variabel . Salah satu teknik dalam multivariat adalah
analisis korespondensi. Dengan makalah ini maka akan dijabarkan mengenai
analisis korespondensi dan contoh soal yang berkaitan.

1.2 Rumusan Masalah


Rumusan masalah dalam makalah ini adalah :
1. Apa yang dimaksud dengan analisis korespondensi?
2. Bagaimana cara menghitung singular value, principal inersia?

1.3 Tujuan
Tujuan yang ingin dicapai adalah:
1. Untuk mengetahui apa yang dimaksud dengan analisis koresponsensi.
2. Untuk mengetaui bagaimana cara menghitung singular value dan
prinsipal inersia.
BAB II

PEMBAHASAN

2.1 Analisis Korespondensi

Analisis korespondensi adalah prosedur grafis untuk mewakili asosiasi


dalam tabel frekuensi atau jumlah. Kami akan berkonsentrasi pada tabel
frekuensi dua arah atau tabel kontingensi. Jika tabel kontingensi memiliki
baris I dan kolom J ,plot yang dihasilkan oleh analisis korespondensi
berisi dua poin: Yaitu poin I terkait dengan baris dan poin J yang sesuai
dengan kolom. Posisi poin mencerminkan asosiasi.

Poin baris yang berdekatan menunjukkan baris yang memiliki profil


serupa (distribusi bersyarat) di seluruh kolom. Titik kolom yang
berdekatan menunjukkan kolom dengan profil yang serupa (distribusi
bersyarat) di baris. Akhirnya, titik baris yang dekat dengan titik kolom
mewakili kombinasi yang terjadi lebih sering daripada yang diharapkan
dari model independensi - yaitu, model di mana kategori baris tidak
terkait dengan kategori kolom.

Keluaran biasa dari analisis korespondensi termasuk representasi dua


dimensi "terbaik" dari data, bersama dengan koordinat titik yang diplot,
dan ukuran (disebut inersia) dari jumlah informasi yang disimpan dalam
setiap dimensi.

Sebelum membahas secara singkat perkembangan aljabar analisis


kontingensi, ada baiknya untuk menggambarkan ide-ide yang telah kami
perkenalkan dengan sebuah contoh:

Analisis Korespondensi data Arkeolog


Tabel 12.8 dengan jumlah kolom J = 4 jenis tembikar yang berbeda
(disebut potsherds) dan jumlah baris I = 7. Jika kita membagi jumlah di
setiap baris dengan total baris yang sesuai, kami memperoleh profil jenis
tembikar.Profil untuk berbagai baris ditampilkan dalam grafik batang di
Gambar 12.20 (a). Lebar bilah sebanding dengan jumlah baris total.
Secara umum, profilnya berbeda; namun, profil untuk baris P1 dan P2
serupa, seperti profil untuk baris P4 dan P5.

Profil situs arkeologi untuk berbagai jenis tembikar (kolom) adalah


ditunjukkan dalam grafik batang pada Gambar 12.20 (b). Profil situs
dibuat menggunakan total kolom. Bilah pada gambar tampak sangat
berbeda satu sama lain. Ini menunjukkan bahwa berbagai jenis tembikar
tidak didistribusikan di situs arkeologi dengan cara yang sama.

Plot dua dimensi dari analisis korespondensi2 dari data situs tipe
tembikar ditunjukkan pada Gambar 12.21.

Plot pada Gambar 12.21 menunjukkan, misalnya, bahwa situs P1 dan P2


memiliki profil tipe tembikar yang sama (dua titik berdekatan), dan situs
PO dan P6 memiliki profil yang sangat berbeda (titik-titiknya berjauhan).
Poin individu yang mewakili jenis tembikar tersebar, menunjukkan bahwa
profil situs arkeologis mereka sangat berbeda. Temuan ini konsisten
dengan profil yang digambarkan pada Gambar 12.20.

Perhatikan bahwa poin PO dan D cukup berdekatan dan terpisah dari


poin yang tersisa. Ini menunjukkan bahwa tembikar tipe D cenderung
dikaitkan, hampir secara eksklusif, dengan situs PO. Demikian pula,
tembikar tipe A cenderung dikaitkan dengan situs P1 dan, pada derajat
yang lebih rendah, dengan situs P2 dan P3. Tembikar tipe B dikaitkan
dengan situs P4 dan P5, dan tembikar tipe C cenderung dikaitkan, sekali
lagi, hampir secara eksklusif, dengan situs P6. Karena situs arkeologi
mewakili periode yang berbeda, asosiasi ini sangat menarik bagi
arkeolog.

Angka 𝜆12 = 0,28 pada akhir sumbu koordinat pertama dalam plot dua
dimensi adalah inersia yang terkait dengan dimensi pertama.
Kelembaman ini adalah 55% dari total kelembaman. Kelambanan yang
terkait dengan dimensi kedua adalah 𝜆22 = .17, dan dimensi kedua
menyumbang 33% dari total inersia. Bersama-sama, akun dua dimensi
untuk 55% + 33% = 88% dari total inersia.
Karena, dalam hal ini, data dapat direpresentasikan secara tepat dalam
tiga dimensi, relatif sedikit informasi (variasi) yang hilang dengan
merepresentasikan data dalam plot dua dimensi pada Gambar 12.21.
Secara ekivalen, kita dapat menganggap plot ini sebagai representasi
dua dimensi terbaik dari hamburan multidimensi dari titik-titik baris dan
hamburan multidimensi dari titik-titik kolom. Inersia gabungan sebesar
88% menunjukkan bahwa representasi "cocok" dengan data. Dalam
contoh ini, output grafis dari analisis korespondensi menunjukkan sifat
asosiasi dalam tabel kontingensi cukup jelas.

2.2 Pengembangan Aljabar Analisis Korespondensi

Untuk memulai, misalkan X, dengan elemen xij, menjadi tabel dua arah I
X J dari frekuensi yang tidak tertandingi atau dihitung. Dalam diskusi,
mengambil I > J dan menganggap bahwa X adalah peringkat kolom
penuh J.

Baris dan kolom dari tabel kontingensi X sesuai dengan kategori berbeda
dari dua karakteristik yang berbeda. Sebagai contoh, susunan frekuensi
jenis tembikar yang berbeda di situs arkeologi yang berbeda ditunjukkan
pada Tabel 12.8 adalah tabel kontingensi dengan I = 7 situs arkeologi
dan J = 4 jenis tembikar. Jika n adalah total frekuensi dalam data matriks
X, pertama-tama membangun matriks proporsi P = {Pij} dengan membagi
setiap elemen X dengan n. Karenanya matriks P disebut dengan matriks
korespondensi.

Selanjutnya, tentukan jumlah baris dan kolom vektor r dan c masing-


masing, dan matriks diagonal Dr dan De dengan elemen r dan c pada
diagonal. Jadi

di mana 1j adalah J X 1 dan 1I adalah vektor I X 1 dari 1's dan

Dr = diag (r1, r2, ..., rI) dan Dc = diag (c1, c2, ..., cJ)

Kemudian mendefinisikan matriks akar kuadrat

Analisis Korespondensi dapat dirumuskan sebagai masalah kuadrat


terkecil tertimbang untuk memilih P̂ = {p̂ij}, sebuah matriks dengan
peringkat yang direduksi, untuk meminimalkan

(P-P̂) 𝑫𝒄
−𝟏/𝟐 −𝟏/𝟐
Karena (pij-p̂ij)/√𝑟𝑖 𝑐𝑖𝑗 adalah elemen (i,j) dari 𝑫𝒓

Seperti yang diperlihatkan oleh Hasil 12.1, istilah rc' adalah umum
terhadap perkiraan P̂ apa pun matriks korespondensi P dengan I X J .
Matriks P̂= rc’ dapat ditampilkan sebagai perkiraan peringkat 1 terbaik
untuk P.

Perkiraan peringkat yang diturunkan ke P, yang meminimalkan jumlah


kuadrat (12-28), diberikan oleh

Dimana λ̃k adalah nilai singular dan vector I×1 ũk dan vector J×1 vk̃
adalah korespondensi vektor singular yang sesuai dari matriks I X J
−𝟏/𝟐 −𝟏/𝟐
𝑫𝒓 𝑷𝑫𝒄 . Nilai minimum (12-28) adalah ∑𝑱𝒌=𝒔+𝟏 𝝀̃𝟐𝒌 .

Peringkat pengurangan K> 1 mendekati P-rc’ adalah

di mana λk adalah nilai-nilai singular dan vektor I X 1 uk dan vektor J X


1 vk adalah korespondensi vektor singular dari matriks I X J
−𝟏/𝟐 −𝟏/𝟐
𝑫𝒓 (𝑷 − 𝒓𝒄′)𝑫𝒄 .

Di sini λk = λ̃k+1, ,uk = ũk+1, dan vk = vk̃ +1 untuk k = 1,. . . , J - 1.

−𝟏/𝟐 −𝟏/𝟐
Bukti. Pertama-tama mempertimbangkan versi skala B = 𝑫𝒓 𝑷𝑫𝒄
dari matriks korespondensi P. Menurut Hasil 2A. 16, perkiraan peringkat
−𝟏/𝟐 −𝟏/𝟐
rendah terbaik = s mendekati B̂ ke 𝑫𝒓 𝑷𝑫𝒄 diberikan oleh s pertama
dalam dekomposisi nilai singular.

Dimana

Dan

Dan , Hasil oleh 2A.16, perkiraan kesalahan adalah ∑𝑱𝒌=𝒔+𝟏 𝝀̃𝟐𝒌

Apa pun matriks korespondensi P, istilah rc' selalu memberikan


perkiraan (yang terbaik) peringkat satu. Ini sesuai dengan asumsi
𝟏/𝟐
independensi baris dan kolom. Untuk melihat ini, misalkan ũ1 = 𝑫𝒓 1I
𝟏/𝟐
dan ṽ1 = 𝑫𝒄 1J, di mana 1I adalah sebuah I×1 dan 1J sebuah J×1 vektor
1's. Verifikasi bahwa (12-31) berlaku untuk pilihan ini

Dan

Yakni,

adalah vektor singular yang terkait dengan nilai singular λ 1= 1. Untuk


setiap matriks korespondensi, P, istilah umum dalam setiap ekspansi
adalah

Oleh karena itu, ditetapkan perkiraan pertama dan (12-30) selalu dapat
dinyatakan sebagai

Karena istilah umum, masalahnya dapat diulang dalam hal P - rc' dan
−𝟏/𝟐 −𝟏/𝟐
versi yang diperbesar 𝑫𝒓 (𝑷 − 𝒓𝒄′)𝑫𝒄 . Dengan ortogonalitas dari
−𝟏/𝟐 −𝟏/𝟐 𝟏/𝟐
vektor singular 𝑫𝒓 𝑷𝑫𝒄 kemudian memiliki 𝒖̃′𝒌 (𝑫𝒓 1I)=0 dan 𝒗̃′𝒌 (
𝟏/𝟐
𝑫𝒄 1J)=0 untuk k> 1 jadi
−𝟏/𝟐 −𝟏/𝟐
adalah dekomposisi nilai singular dari 𝑫𝒓 (𝑷 − 𝒓𝒄′)𝑫𝒄 dalam hal
−𝟏/𝟐 −𝟏/𝟐
nilai dan vektor singular yang diperoleh dari 𝑫𝒓 𝑷𝑫𝒄 .
Pengonversian ke nilai dan vektor singular λk , uk dan vk dari
−𝟏/𝟐 −𝟏/𝟐
𝑫𝒓 (𝑷 − 𝒓𝒄′)𝑫𝒄 hanya berarti mengubah k ke k - 1 jadi λk = λ̃k+1
,uk = ũk+1, dan vk = vk̃ +1 untuk k = 1,. . . , J - 1.

−𝟏/𝟐 −𝟏/𝟐
Dalam hal dekomposisi nilai singular untuk 𝑫𝒓 (𝑷 − 𝒓𝒄′)𝑫𝒄 ,
ekspansi untuk 𝑷 − 𝒓𝒄′ mengambil bentuk

−𝟏/𝟐 −𝟏/𝟐
Perkiraan peringkat K terbaik ke 𝑫𝒓 (𝑷 − 𝒓𝒄′)𝑫𝒄 diberikan oleh
∑𝑲
𝒌=𝟏 𝝀𝒌 𝒖̃𝒌 𝒗̃′𝒌 . Kemudian, perkiraan terbaik untuk P - rc ' adalah

𝟏/𝟐 𝟏/𝟐
Perhatikan bahwa vector 𝑫𝒓 𝒖̃𝒌 dan 𝑫𝒄 𝒗̃𝒌 dalam ekspansi (12-34) dari
P-rc' tidak perlu memiliki panjang 1 tetapi memenuhi penskalaan.

Karena penskalaan ini, ekspansi dalam Hasil 12.1 telah disebut


dekomposisi nilai singular umum.

Misalkan ᴧ, U = [u1,. . . , uI] dan V = [v1,. . . , vj] menjadi matrik dari nilai
−𝟏/𝟐 −𝟏/𝟐
dan vektor singular yang diperoleh dari 𝑫𝒓 (𝑷 − 𝒓𝒄′)𝑫𝒄 . Biasanya
dalam analisis korespondensi untuk memplot dua atau tiga kolom
𝟏/𝟐 𝟏/𝟐 −𝟏/𝟐
pertama dari F= 𝑫−𝟏 −𝟏
𝒓 (𝑫𝒓 𝑼)ᴧ dan 𝑫𝒄 (𝑫𝒄 𝑽)ᴧ atau 𝝀𝒌 𝑫𝒓 𝒖̃𝒌 dan
−𝟏/𝟐
𝝀𝒌 𝑫𝒄 𝒗̃𝒌 untuk k = 1, 2, dan mungkin 3.

Plot join dari koordinat dalam F dan G disebut peta simetris (lihat
Greenacre [13]) karena titik-titik yang mewakili baris dan kolom memiliki
normalisasi yang sama, atau penskalaan, di sepanjang dimensi solusi.
Yaitu, geometri untuk titik-titik baris identik dengan geometri untuk titik-
titik kolom.

Example 12.18 (Perhitungan Analisis Korespondensi)


Berdasarkan tabel kontingensi 3 x 2
B1 B2 Total
A1 24 12 36
A2 16 48 64
A3 60 40 100
100 100 200

Matriks korespondensinya yaitu dengan total marginal


c' = [0.5, 0.5]
dan r' = [0.18, 0.32, 0.50]. Matriks negative square root nya yaitu

kemudian

scaled version dari matriks ini yaitu

karena I > J, maka kuadrat dari singular value dan vi ditentukan dari

diperoleh nilai 𝜆12 = 0.12 , 𝜆22 = 0 , karena J-1=1, maka


kemudian,

Perhitungan komputer mengonfirmasi bahwa single nonzero eigenvalue


adalah 𝜆12 = 0.12 , sehingga singular value memiliki nilai absolut 𝜆1 =
0.2√3 dan diperoleh

Ekspansi dari P-rc’ , yaitu

Hanya ada satu vektor untuk plot, yaitu

dan
Ada cara kedua untuk mendefinisikan analisis kontingensi. Yakni
Mengikuti aturan Greenacre [13], atau disebut pendekatan matrix
approximation method dan pendekatan profile approximation method.
Digambarkan bahwa profile approximation method menggunakan profil
baris; Namun, solusi analog dihasilkan jika kita memulai dengan profil
kolom.
Secara aljabar, profil baris merupakan baris dari matriks 𝑫−𝟏 𝒓 𝑷 ,
dan analisis kontingensi dapat didefinisikan sebagai perkiraan profil baris
dengan titik-titik dalam ruang dimensi rendah. Pertimbangkan perkiraan
profil baris dengan matriks 𝑷∗ . Dengan menggunakan square-root
𝟏/𝟐 𝟏/𝟐
matrices 𝑫𝒓 dan 𝑫𝒄 yang didefinisikan dalam (12-27), dapat dituliskan

Masalah minimisasi pertama di Result 12.1. Pada (12-30),


−𝟏/𝟐 −𝟏/𝟐
𝑫𝒓 𝑷𝑫𝒄 memiliki dekomposisi singular-value

Perkiraan peringkat K yang terbaik diperoleh dengan menggunakan


persyaratan K pertama dari ekspansi ini. Untuk mendapatkan
dekomposisi generalized singular-value dapat dihitung dengan
menggunakan persamaan

−𝟏/𝟐 −𝟏/𝟐
Jadi, singular values dan vektor dari 𝑫𝒓 𝑷𝑫𝒄 , pengurangan
−𝟏
peringkat K < J aproksimasi ke profil baris 𝑫𝒓 𝑷 adalah

kemudian singular values dan vektor 𝜆𝑘 , 𝒖̃𝑘 dan 𝒗̃𝒌 yang diperoleh dari
𝟏
− −𝟏/𝟐
𝑫𝒓 𝟐 (𝑷 − 𝒓𝒄′ )𝑫𝒄 dapat ditulis dengan

2.3 Inersia
Inersia total merupakan pengukuran variasi dalam perhitungan
data dan didefinisikan sebagai weighted sum of squares

di mana 𝜆𝑘 adalah singular values yang diperoleh dari singular-value


𝟏
− −𝟏/𝟐
decomposition 𝑫𝒓 𝟐 (𝑷 − 𝒓𝒄′ )𝑫𝒄 .
Inersia yang terkait dengan perkiraan penurunan rank K < J yang
terbaik ke matriks pusat 𝑷 − 𝒓𝒄′ (K-dimensional solution) memiliki inersia
∑𝐾 2
𝑘=1 𝜆𝑘 .

Inersia residual (variasi) yang tidak diperhitungkan oleh solusi rank K


sama dengan jumlah kuadrat dari singular values yang tersisa: 𝜆2𝐾+1 +
𝜆2𝐾+2 + ⋯ + 𝜆𝐽−1
2
. Untuk plot, inersia yang terkait dengan dimensi k, 𝜆2𝑘
, biasanya ditampilkan di sepanjang sumbu koordinat k.

2.4 Interpretasi dalam Dua Dimensi


Secara geometris, dapat dikatakan bahwa asosiasi dalam pusat
data diwakili dengan baik oleh titik-titik dalam sebuah bidang, dan bidang
perkiraan terbaik ini mencakup hampir semua variasi dalam data di luar
yang diperhitungkan oleh solusi rank 1 (model independensi) . Secara
aljabar, rumus perkiraan yakni .

2.5 Latihan Soal

Jawaban:

Dengan Menggunakan SPSS:


Pertama-tama masukkan data dari table soal kedalam data view pada
SPSS seperti pada gambar berikut.
Lalu mengatur data weight untuk meletakkan isi (Score) pada setiap
baris kolom
Kemudian untuk melakukan analisis korespondensi hanya perlu
dengan mengeklik Analyze kemudian memilih dimension Reduction
serta memilih Correspondence Analysis

Sehingga akan muncul form Corresponsence Analysis seperti pada


gambar dibawah ini, dan mengisikan Row serta Column sesuai
dengan table soal, Pada Define Range isikan sesuai banyak Row atau
Column yang ada.

Kemudian isi Dimensions in solution sesuai keinginan data untuk


dipresentasikan dalam berapa dimensi yang umumnya ialah 2. Dan
Kemudian untuk Plots dapat disesuaikan dengan scatterplots yang
ingin ditampilkan. Jika semuanya telah diatur dapat mengeklik button
ok
Kemudian akan keluar output hasil perhitungan analisis
korespondensi sebagaimana pada gambar dibawah ini.
Tabel dibawah ini menggambarkan tabel korespondensi

Correspondence Table
Mental Health Parental Socioeconomic Status
Status A (High) B C D E (Low) Active Margin
Well 121 57 72 36 21 307
Mild symptom 188 105 141 97 71 602
formation
Moderate symptom 112 65 77 54 54 362
formation
Impaired 86 60 94 78 71 389
Active Margin 507 287 384 265 217 1660

Dari data diatas didapatkan singular value 0.161, 0.037 dan 0.008 .
Sedangkan untuk inersia 0.026 , 0.001 dan 0.000
Overview Row Pointsa
Score in
Dimension Contribution
Of Point to Inertia of Of Dimension to
Mental Health Dimension Inertia of Point
Status Mass 1 2 Inertia 1 2 1 2 Total
Well .185 -.646 .069 .013 .479 .024 .996 .003 .998
Mild symptom .363 -.073 .117 .001 .012 .134 .591 .347 .938
formation
Moderate .218 .035 -.363 .001 .002 .776 .040 .960 1.000
symptom
formation
Impaired .234 .591 .102 .013 .507 .066 .992 .007 .999
Active Total 1.000 .027 1.000 1.000
a. Symmetrical normalization

Overview Column Pointsa


Score in
Dimension Contribution
Of Point to
Parental Inertia of Of Dimension to Inertia of
Socioeconomic Dimension Point
Status Mass 1 2 Inertia 1 2 1 2 Total
A (High) .305 -.455 -.081 .010 .393 .053 .993 .007 1.000
B .173 -.147 -.117 .001 .023 .063 .852 .123 .975
C .231 .022 .220 .000 .001 .301 .040 .909 .949
D .160 .412 .225 .005 .168 .218 .932 .064 .996
E (Low) .131 .716 -.321 .011 .416 .364 .955 .044 1.000
Active Total 1.000 .027 1.000 1.000
a. Symmetrical normalization
Dari gambar data yang direpresentasikan dalam plot dua
dimensional diatas dapat disimpulkan bahwa status mental well
berdekatan dengan kondisi status sosialekonomi tinggi sedangkan
untuk Status Mild Symptom lebih mendekati status sosialekonomi
kelas C kemudian B . Untuk status Status sosialekonomi E rendah
berada diantara status kesehatan mental Moderate symptom dan
Impaired.

Apabila data direpresentasikan dalam plot satu dimensi maka data


susah untuk dibaca dan hasilnya akan seperti pada gambar dibawah
ini.
Jawaban:
BAB III

PENUTUP

3.1 Kesimpulan
Dalam melakukan analisis korespondensi dapat dilakukan dengan
menyusun table kontigensi terlebih dahulu jikalau telah tersedia maka
dapat langsung menghitung total kolom dah baris. Dengan menghitung
total inersia serta membuat peta persepsi yang biasa digambarkan
dengan titik titik berdasarkan pada ukuran kedekatan yang didapat dari
perhitungan chi square . Sehingga terbentuk hubungan antara variabel
baris dan kolom.
DAFTAR PUSTAKA

http://eprints.uny.ac.id/42103/6/BAB%20II.pdf [Diakses tanggal 16 Agustus


2019]

Johnson, Richard A. 2007. Applied Multivariate Statistical Analysis Sixth


Edition. United State of America: Pearson Education, Inc

Anda mungkin juga menyukai