Gambar diatas merupakan garis linier dari hubungan antara variabel Y dan X
Apabila model yang terbentuk sesuai dengan data:
a. Nilai R2 tinggi
b. Nilai p value rendah
C. Analisis Regresi Berganda: Multikolinieritas
Hasil dari regresi berganda sering kali sulit untuk diintepretasikan:
a. Keseluruhan p value pada model sangat rendah
b. Tapi tiap p values pada variabel prediktor tinggi
Dapat diartikan bahwa model yang didapatkan akan sesuai dengan data ,
meskipun tidak terdapat variabel X yang berpengaruh signifikan terhadap
variabel respon Y.
Hal tersebut dikarenakan ketika dua (atau lebih) variabel prediktor X memiliki
korelasi yang tinggi, yang disebut multikolinieritas.
Multikolinieritas
Multikolinieritas dapat terjadi ketika menguji apakah setiap variabel prediktor
berpengaruh terhadap variabel respon, dengan karakteristik sbb:
Tiap nilai p values pada variabel X dapat menghasilkan nilai yang
tinggi.
Rentang kepercayaan (confidence intervals) pada koefisien regresi
menjadi besar.
Diperoleh nilai R-square yang besar, sedangkan koefisien regresi tidak
signifikan pada uji parsial.
Ukuran pendugaan multikolinieritas:
Secara umum: Apabila nilai r diantara variabel prediktor X lebih dari 0.8 (r >
0.8) maka dapat diduga adanya multikolinieritas.
Variance Inflation Factor (VIF) : Multikolinieritas dapat diperiksa
menggunakan VIF, apabila nilai VIF >10 maka diindikasi terdapat
multikolinieritas.
Contoh :
Bagaimana kejelasan suara yang diterima oleh stimulus (rangsangan)
pendengaran dipengaruhi oleh kerasnya suara (loudness) dan frekuensi suara
(pitch)? Dengan persepsi bahwa eksperimen tersebut dilakukan oleh subjek
(orang) yang telah menilai kejelasan suara dari stimulus pendengaran
Model:
Y = β1X1 + β2X2 + ε
Y = Judged clarity of stimulus
X1 = Kerasnya suara
X2 = Frekuensi
Apa yang terjadi ketika variabel X1 (loudness) dan X2 (pitch) saling
berkorelasi?
56
55
54
53
LOUDNESS 52
51
50
110 120 130 140 150 160 170
PITCH
Y = 0.859X1 + 24.41
p < 0.000
Y = 0.824X1 + 26.94
p < 0.000
Y = 0.756X1 + 26.94X2
p < 0.000
Variabel prediktor :
Model Linier Umum & Regresor terkait (General Linear Model & Correlated
Regressors)
Model Linear Umum dapat dilihat sebagai perpanjangan dari regresi berganda (atau
regresi berganda hanyalah bentuk sederhana dari Model Linier Umum). Regresi berganda
hanya melihat satu variabel Y sedangkan GLM memungkinkan untuk menganalisis beberapa
variabel Y dalam kombinasi linier. ANOVA, uji-t, uji-F juga merupakan bentuk dari GLM
𝑌 = 𝑋. 𝛽 + 𝜀
Keterangan:
Y = data yang diamati
X = Matriks desain yang berisi beberapa komponen yang menjelaskan data yang teramati
𝛽 = Parameter
𝜀 = Kesalahan / sisa yaitu perbedaan antara data yang diamati, Y, dan yang diprediksi oleh
model
Dalam menganalisis data fMRI atau mesin Fungsional Magnetic Resonance Imaging yaitu
perangkat yang mengambil gambar real-time dari aktivitas tubuh ketika seseorang melakukan
suatu tindakan. Masalah multikolinearitas terjadi saat menentukan regresi dalam matriks
desain. Jika regresor tidak bergantung linier (berkorelasi) maka hasil GLM tidak mudah
ditafsirkan karena varians yang diakibatkan oleh regresor individu dapat dikacaukan dengan
regresor lain (s). Hal ini dapat menyebabkan salah tafsir terhadap aktivasi di area otak
tertentu.
Sebagai contoh:
Anggaplah bahwa respons terhadap stimulus Sr sangat berkorelasi dengan respons motorik
yang terkait Mr dan anggaplah hipotesis bahwa aktivitas daerah tertentu untuk Sr tidak
dipengaruhi oleh Mr maka wilayah ini harus diuji hanya setelah menghapus semua varians
dari regresor untuk semua varians yang dapat dijelaskan oleh Sr. Oleh karena respons
motorik tidak mempengaruhi sinyal di wilayah tersebut maka Sinyal uji akan terlalu
signifikan sehingga menyebabkan varians salah ditugaskan ke Sr.
Terdapat dua tujuan:
1. Mendeteksi daerah dimana sinyal berkorelasi dengan kovariat yang dihasilkan
2. Mencari perbedaan periode aktivasi versus kontrol
Menerapkan dua model :
Satu dengan aktivasi-vs-istirahat ditambah regresi kovariat (r = 0,845):
M = C1 (ac-rest) + C2 (kovariat)
Kedua dengan varian dari covariate C2 dihapus:
M * = C1 + C2 * (C2 * = 0,845 • √ (SSC2 / SSC1)
Untuk model M dan M *
- Pengolahan SPM
Parameter untuk C1 dan C2 / C2 * diuji dengan menggunakan uji-t dan diubah menjadi
z-score
- Hasil yang didapatkan:
Perbedaan antara M dan M * hanya terjadi untuk aktivasi yang berhubungan dengan C1
(regressor sisa / aktivasi). Misalnya, aktivasi parahippocampal signifikan di M tetapi
tidak di M *, kiri precuneal, temporal superior, aktivitas frontal medial signifikan pada
M * tapi tidak di M
Contoh voxel:
(54, -56, 34) diaktifkan dalam M (p = 0,004) tidak dalam M * (p = 0,901)
(6, 28, -28) diaktifkan dalam M * (p = 0,014) tidak dalam M (p = 0,337)