Anda di halaman 1dari 6

Fungsi Dasar Sementara dan Korelasi

A. Korelasi (atau: masalah dengan multikolinieritas…)


Pada analisis regresi berganda:
a. Permasalahan untuk behavioural data (data perilaku)
b. Contoh behavioural data (fiksi)
c. Solusi
Pada General Linear Model (GLM):
d. Permasalahan untuk neuroimaging data
e. Contoh PET
f. Solusi
B. Analisi Regresi Berganda dan Korelasi
 Karakteristik regresi berganda adalah adanya hubungan antara beberapa
variabel independen (or regressors), X1, X2, X3....Xn, dan variabel dependen,
Y: Y = β1X1 + β2X2 +…..+ βLXL + ε
 Variabel X merupakan kombinasi linear dan tiap variabel X memiliki
koefisien regresi β (weight)
 βs merupakan kontribusi independen untuk tiap variabel , X, merupakan hasil
dari variabel dependen, Y
 i.e. Proporsi varians pada variabel Y merupakan jumlahan dari tiap variabel
prediktor setelah semua variabel prediktor lain telah dijumlahkan

Gambar diatas merupakan garis linier dari hubungan antara variabel Y dan X
 Apabila model yang terbentuk sesuai dengan data:
a. Nilai R2 tinggi
b. Nilai p value rendah
C. Analisis Regresi Berganda: Multikolinieritas
 Hasil dari regresi berganda sering kali sulit untuk diintepretasikan:
a. Keseluruhan p value pada model sangat rendah
b. Tapi tiap p values pada variabel prediktor tinggi
 Dapat diartikan bahwa model yang didapatkan akan sesuai dengan data ,
meskipun tidak terdapat variabel X yang berpengaruh signifikan terhadap
variabel respon Y.
 Hal tersebut dikarenakan ketika dua (atau lebih) variabel prediktor X memiliki
korelasi yang tinggi, yang disebut multikolinieritas.

Multikolinieritas
 Multikolinieritas dapat terjadi ketika menguji apakah setiap variabel prediktor
berpengaruh terhadap variabel respon, dengan karakteristik sbb:
 Tiap nilai p values pada variabel X dapat menghasilkan nilai yang
tinggi.
 Rentang kepercayaan (confidence intervals) pada koefisien regresi
menjadi besar.
 Diperoleh nilai R-square yang besar, sedangkan koefisien regresi tidak
signifikan pada uji parsial.
 Ukuran pendugaan multikolinieritas:
Secara umum: Apabila nilai r diantara variabel prediktor X lebih dari 0.8 (r >
0.8) maka dapat diduga adanya multikolinieritas.
Variance Inflation Factor (VIF) : Multikolinieritas dapat diperiksa
menggunakan VIF, apabila nilai VIF >10 maka diindikasi terdapat
multikolinieritas.
 Contoh :
Bagaimana kejelasan suara yang diterima oleh stimulus (rangsangan)
pendengaran dipengaruhi oleh kerasnya suara (loudness) dan frekuensi suara
(pitch)? Dengan persepsi bahwa eksperimen tersebut dilakukan oleh subjek
(orang) yang telah menilai kejelasan suara dari stimulus pendengaran
Model:
Y = β1X1 + β2X2 + ε
Y = Judged clarity of stimulus
X1 = Kerasnya suara
X2 = Frekuensi
Apa yang terjadi ketika variabel X1 (loudness) dan X2 (pitch) saling
berkorelasi?
56

55

54

53

LOUDNESS 52

51

50
110 120 130 140 150 160 170

PITCH

Korelasi variabel X1 (loudness) dan X2 (pitch) : 0.945 (p<0.000), hasil


prediktor X1 yang tinggi sesuai dengan hasil prediktor X2 yang tinggi pula.

Contribution of individual predictors:

 X1 (loudness) sebagai variabel prediktor:

Y = 0.859X1 + 24.41

R2 = 0.74 (74% menjelaskan varians Y)

p < 0.000

 X2 (pitch) sebagai variabel prediktor:

Y = 0.824X1 + 26.94

R2 = 0.68 (68% menjelaskan varians Y)

p < 0.000

 Variabel prediktor X1 dan X2 diregresikan bersama:

Model yang dihasilkan:

Y = 0.756X1 + 26.94X2

R2 = 0.74 (74% menjelaskan varians Y)

p < 0.000

Variabel prediktor :

X1 (loudness) : R2 = , p < 0.000

X2 (pitch) : R2 = 0.555, p < 0.594


Cara menangani collinearity atau Multicolinierity:
1. Meningkatkan ukuran sampel
2. Membuat variabel independen yang memiliki hubungan (korelasi) menjadi Orthogonal,
dengan cara sebagai berikut:
a) Menggunakan analisis faktor
b) Hal ini akan menghasilkan regresi bebas linear dan nilai faktor yang sesuai.
c) Nilai faktor ini kemudian dapat digunakan sebagai pengganti nilai regresi berkorelasi
asli.

Model Linier Umum & Regresor terkait (General Linear Model & Correlated
Regressors)
Model Linear Umum dapat dilihat sebagai perpanjangan dari regresi berganda (atau
regresi berganda hanyalah bentuk sederhana dari Model Linier Umum). Regresi berganda
hanya melihat satu variabel Y sedangkan GLM memungkinkan untuk menganalisis beberapa
variabel Y dalam kombinasi linier. ANOVA, uji-t, uji-F juga merupakan bentuk dari GLM
𝑌 = 𝑋. 𝛽 + 𝜀
Keterangan:
 Y = data yang diamati
 X = Matriks desain yang berisi beberapa komponen yang menjelaskan data yang teramati
 𝛽 = Parameter
 𝜀 = Kesalahan / sisa yaitu perbedaan antara data yang diamati, Y, dan yang diprediksi oleh
model
Dalam menganalisis data fMRI atau mesin Fungsional Magnetic Resonance Imaging yaitu
perangkat yang mengambil gambar real-time dari aktivitas tubuh ketika seseorang melakukan
suatu tindakan. Masalah multikolinearitas terjadi saat menentukan regresi dalam matriks
desain. Jika regresor tidak bergantung linier (berkorelasi) maka hasil GLM tidak mudah
ditafsirkan karena varians yang diakibatkan oleh regresor individu dapat dikacaukan dengan
regresor lain (s). Hal ini dapat menyebabkan salah tafsir terhadap aktivasi di area otak
tertentu.
Sebagai contoh:
Anggaplah bahwa respons terhadap stimulus Sr sangat berkorelasi dengan respons motorik
yang terkait Mr dan anggaplah hipotesis bahwa aktivitas daerah tertentu untuk Sr tidak
dipengaruhi oleh Mr maka wilayah ini harus diuji hanya setelah menghapus semua varians
dari regresor untuk semua varians yang dapat dijelaskan oleh Sr. Oleh karena respons
motorik tidak mempengaruhi sinyal di wilayah tersebut maka Sinyal uji akan terlalu
signifikan sehingga menyebabkan varians salah ditugaskan ke Sr.
 Terdapat dua tujuan:
1. Mendeteksi daerah dimana sinyal berkorelasi dengan kovariat yang dihasilkan
2. Mencari perbedaan periode aktivasi versus kontrol
 Menerapkan dua model :
Satu dengan aktivasi-vs-istirahat ditambah regresi kovariat (r = 0,845):
M = C1 (ac-rest) + C2 (kovariat)
Kedua dengan varian dari covariate C2 dihapus:
M * = C1 + C2 * (C2 * = 0,845 • √ (SSC2 / SSC1)
 Untuk model M dan M *
- Pengolahan SPM
Parameter untuk C1 dan C2 / C2 * diuji dengan menggunakan uji-t dan diubah menjadi
z-score
- Hasil yang didapatkan:
Perbedaan antara M dan M * hanya terjadi untuk aktivasi yang berhubungan dengan C1
(regressor sisa / aktivasi). Misalnya, aktivasi parahippocampal signifikan di M tetapi
tidak di M *, kiri precuneal, temporal superior, aktivitas frontal medial signifikan pada
M * tapi tidak di M
Contoh voxel:
(54, -56, 34) diaktifkan dalam M (p = 0,004) tidak dalam M * (p = 0,901)
(6, 28, -28) diaktifkan dalam M * (p = 0,014) tidak dalam M (p = 0,337)

Menggunakan toolbox "Design Magic" - Penilaian multikolinieritas untuk fMRI untuk


SPM99. Memungkinkan Anda untuk menilai multikolinearitas dalam desain fMRI Anda
dengan menghitung jumlah varians faktor yang juga dicatat oleh faktor lain dalam desain
(dinyatakan dalam R2). Hal ini memungkinkan Anda mengurangi korelasi antara regresor
melalui penggunaan filter high-pass.
Bila sesuai model dalam analisis regresi berganda atau membangun matriks desain,
korelasi antara regresor dapat menyebabkan salah tafsir terhadap pengaruh variabel
independen terhadap variabel dependen. Multikolinearitas adalah sebuah kerumitan, namun
dapat ditangani, biasanya meskipun prosedur ortogonalisasi yang melibatkan (kelompok)
regresor.

Anda mungkin juga menyukai