Anda di halaman 1dari 27

REGRESI MULTILEVEL

Kelompok 1

Leny Yuliyani (G152140421)

Wimi Sartika (G152140441)

PROGRAM STUDI STATISTIKA TERAPAN

SEKOLAH PASCASARJANA

INSTITUT PERTANIAN BOGOR

2015
PENDAHULUAN

Latar belakang
Karakteristik pengambilan data dalam suatu penelitian biasanya terdiri
dari beragamnya latar belakang responden karena pengambilan responden secara
acak, misalkan melihat pengaruh prestasi siswa dengan memperhatikan tingkat
pendidikan keluarga dengan memperhatikan popularitas sekolah. Perbedaan latar
belakang ini membuat data menjadi berjenjang atau bertingkat (memiliki level) ,
sehingga untuk mengatasi masalah keragaman yang muncul disiasati dengan
pemilihan sampel bertingkat dan terkadang diperlukan analisis disetiap
tingkat/level, selain secara keseluruhan.
Perbedaan latar belakang ini pada akhirnya seringkali mempengaruhi hasil
uji statistik yang digunakan karena memiliki variabilitas yang besar.Variasi yang
besar ini menyebabkan uji jadi bias. Jadi dalam penerapannya, walaupun nilai uji
goodness of fit-nya yang diukur dengan R-square menunjukkan model dapat
menjelaskan peubah respon dengan baik , namun terdapat pelanggaran asumsi
yang berupa masalah heteroskedasitas dan ketakbebasan galat. Masalah ini
seringkali diatasi dengan menggunakan dummy, tapi dalam penerapannya
masalah ketakbebasan galat masih tidak bisa diatasi.Oleh karena itu, digunakan
regresi multilevel untuk mengatasinya.Goldstein (1995) memperkenalkan model
multilevel yang disebutkan mampu mengatasi semua permasalahan yang ada pada
data yang berhierarki tersebut, sehingga dapat memperkecil kesalahan pada model
tersebut.
Dalam regresi multilevel tingkatan dalam stuktur hirarki akan menjadi
tingkat levelnya, dimana level yang lebih rendah akan bersarang dalam level yang
lebih tinggi. Tingkat yang paling rendah disebut level 1, dan tingkat yang lebih
tinggi disebut level 2. Keunggulan model multilevel dapat menunjukkan korelasi
antar yang berada dalam level satu dalam satu kesatuan level 2 yang pada model
lain diasumsikan tidak ada. Selain itu model multilevel juga dapat mengukur
interaksi yang mungkin terjadi antara peubah pada level yang berbeda. Disamping
itu, model regresi multilevel tidak mensyaratkan kebebasan antar galat pada
masing masing level/tingkat, serta adanya korelasi peubah dari level yang lebih

2
tinggi dengan peubah dari level yang lebih rendah yang menyebabkan interaksi
antar dua level. Akan tetapi kebebasan antar peubah dalam satu level tetap
menjadi asumsi dasar yang harus dipenuhi jika tidak akan menyebabkan
multikolinearitas.
Salah satu penerapan regresi multilevel dalam makalah ini akan ditelurusi
bagaimana dan apa saja faktor yang mempengaruhipendidikan anak di Indonesia.
Faktor-faktor yang berada pada level pertama yaitu latar pendidikan ibu serta
pendidikan ayah yang mempengaruhi pendidikan anak dimana cenderung harapan
seorang ayah maupun ibu ingin pendidikan anaknya minimal sama bahkanlebih
dibanding pendidikan mereka..Selanjutnya, faktor yang berada pada level kedua /
level kelompk (kecamatan) dengan memperhatikan banyak SMA di kecamatan
serta presentasi petani di kecamatan.Jadi, penarikan contoh terdiri dari dua tahap
dimana pertama mengambil contoh sekolah dan kedua adalah mengambil siswa
dimasing masing sekolah yang terpilih sehingga “level siswa akan
tersarang/nested di dalam level sekolah”. Maka dari itu juga dapat disimpulkan
tiga faktor pertama akan diukur pada level individu yaitu anak itu sendiri, dan
faktor lain yakni lebih tinggi yang akan diukur pada lingkungan sekolah sehingg
data yang diperoleh berstuktur/berhierarki.

Tujuan
1. Menjelaskan model regresi multilevel.
2. Menjelaskan pendugaan dan pengujian parameter pada model regresi
multilevel.
3. Membandingkan Analisis Regresi Multilevel dengan Analisis Linear
Regresi Berganda

3
TINJAUAN PUSTAKA

Data Hirarki
Data yang mempunyai struktur hirarki dapat dianalisis dengan beberapa
pendekatan. Jika analisis regresi linear biasa dilakukan untuk menganalisis data
hirarki, maka analisis dapat dilakukan pada unit-unit level-1 saja atau dilevel-2
saja. Jika analisis dilakukan pada level-1, struktur hirarki/pengelompokkan data
diabaikan (disaggregated), artinya model regresi dibentuk dari seluruh data
pengamatan level-1. Variasi antar unit-unit level-2 tidak dapat diketahui secara
langsung, tapi masih bisa diukur dengan membuat model regresi untuk tiap unit
level-2. Untuk jumlah unit level-2 yang sedikit mungkin prosedur penaksiran
variasi antar unit-unit level-2 tersebut cukup efisien, namun jika jumlah unit level-
2 cukup banyak akan mengakibatkan banyaknya parameter-parameter yang harus
diestimasi dalam model-model regresi yang terbentuk sehingga prosedur tersebut
menjadi tidak efisien.
Jika analisis dilakukan pada unit-unit di level-2 saja(aggregated), maka
data yang digunakan untuk membuat model regresi adalah rata-rata data respon
dan rata-rata data variabel penjelas pada tiap-tiap unit level-2. Analisis dengan
cara seperti itu akan mengakibatkan kesalahan interpretasi mengenai hubungan
yang terbentuk. Dilain hal, struktur data yang mempunyai struktur hirarki, unit-
unit observasi pada level-1 dalam unit level-2 yang sama akan cenderung
mempunyai sifat yang hampir sama, sehingga unit-unit observasi tersebut tidak
sepenuhnya independent. Hal tersebut menjadi alasan mengapa analisis regresi
linear biasa kurang tepat digunakan pada data yang mempunyai struktur hirarki
yang dapat mengakibatkan pelanggaran asumsi kebebasan jika menggunakan
model regresi satu level. Jika hal ini diabaikan maka dugaan galat baku koefisien
regresi cenderung berbias kebawah, sehingga akan menghasilkan kecenderungan
hubungan yang signifikan secara statistik dalam pengujian hipotesis
(www.tramss.data-archive.ac.uk)
Sebagai contoh adalah mahasiswa (level pertama) yang berada pada kelas
parallel (level kedua). Secara umum model regresi multilevel mempunyai struktur
data hirarki yaitu :

4
1. Sebuah peubah tak bebas yang diukur pada level paling bawah(level 1)
2. Beberapa peubah penjelas yang diukur pada setiap level
Pada regresi biasa intersep dan kemiringan untuk setiap kelompok nilainya
sama(fixed), sedangkan pada model model multilevel intersep maupun
kemiringan untuk setiap kelompok nilainya bisa berbeda (random),
sehingga dapat dilihat keragaman antar kelompok (Goldstein, 1995)

Model regresi multilevel


Model multilevel merupakan suatu pemodelan untuk menduga hubungan
antar peubah yang diamati pada level-level yang berbeda dalam stuktur data
berjenjang. Model yang paling sederhana adalah model dua level dimana level
kesatu adalah data individu dan level kedua adalah data kelompok (West et
al,2007). Model regresi dua-level dapat digolongkan dalam dua bentuk dasar,
yaitu random intercept model dan random slope model.

Random Intercept Model


Random intercept model merupakan salah satu bentuk model regresi 2-level
dimana perpotongan (intercept) pada model terhadap sumbu-y dinyatakan dalam
bentuk random, tidak fixed seperti pada regresi linear biasa, intercept yang
berbeda-beda untuk tiap unit level-2 dapat digunakan untuk mengukur perbedaan
antar unit level-2 . Random intercept model dapat diinterpretasikan dalam bentuk
representasi multilevel sebagai berikut :
- Untuk model level-1, model random-intercept ditulis:
p
y ij =β oj + ∑ β p X pj + ε ij …………………………………………(1)
p=1

dengan
y ij= peubah respon untuk unit ke-i pada level-1 dalam unit ke- j pada level-2
β oj =¿random intercept untuk unit ke- j pada level-2
β p=efek tetap (fixed effects) untuk variable penjelas ke- p
x pij=¿peubah penjelas ke- p di level-1 untuk unit ke-i pada level-1 dalam unit
ke- j pada level-2
ε ij=¿residual untuk unit ke-i pada level-1 dalam unit ke- j pada level-2 (residual l

5
level-1), diasumsikan berdistribusi N(0 , σ 2ε )

Untuk model level-2 :


β oj =β o +uoj …………………………………………………………(2)
dengan
β o=¿ fixed intercept, merupakan rata-rata keseluruhan
uoj = efek random (error) untuk unit ke- j pada level-2, diasumsikan berdistribusi

N(0 , σ 2ε )
ε ijdanuoj diasumsikan saling bebas, cov ( ε ij , uoj )=0
Pada model random intercept, notasi j=1,2 ,… , m menyatakan unit-unit level-2
dan i=1,2 , … , n j menyatakan unit-unit level-1 yang bersarang dalam unit ke-j
pada level-2. Sehingga total observasi level-1 dalam seluruh unit level-2 adalah :

n=∑ n j
j=1

Model (2) dapat disubstitusikan ke dalam model (1) sehingga model regresi 2-
level dengan random intercept menjadi
p
y ij =β 0 + ∑ β p x pij +u oj + ε ij …………………………………………...(3)
p=1

Model 3 disebut juga combine model.


Parameter-parameter dalam model yang akan ditaksir adalah β 0 dan β p sebagai
fixed parameter serta σ 2uo dan σ 2ε sebagai random parameter.σ 2ε danσ 2uo masing-
masing menyatakan variansi antar unit level dan variansi antar unit level-2.
Model 3 dapat juga dituliskan dalam bentuk vector seperti berikut :
'
y ij =X ij β+u 0 j +ε ij
dengan
y ij= respon untuk unit ke-i pada level-1 dalam unit ke- j pada level-2
'
X ij = vectorberisi kovariat untuk ke-i pada level-1dalam unit ke- j pada level-2,
berukuran 1X(P+1), x ij =[ 1 x 1 ij x 2 ij … x pij ]
'

6
[]
β0
β
β= 1 , β merupakan vector berisi parameter-parameter fixed yang tidak

βp

diketahui, berukuran (P+1)X1,


ε ij = residual unit ke-i pada level-1 dalam unit ke- j pada level-2 (residual level-1),

diasumsikan berdistribusi N(0 , σ 2ε )

Random Slope Model


Berbeda dengan random intercept model, pada random slope model
memungkinkan garis-garis regresi untuk tiap unit level-2 mempunyai kemiringan
(slope)yang berbeda. Representasi multilevel dari random slope model dinyatakan
dalam bentuk :
- Untuk model level-1:
P Q
y ij =β oj + ∑ β p x pij + ∑ βqj Z qj +ε ij ……………………………(4)
p=1 q =1

y ij = peubah respon untuk unit ke-i pada level-1 dalam unit ke- j pada level-2

β oj = efek tetap (fixed effects) untuk peubah penjelas ke- p, p=1,2 , … , P


β qj = random slope untuk peubah penjelas ke-q pada unit ke - j level-2,
q=1,2 , … ,Q
Z qj = peubah penjelas ke-q dengan q=1,2 , … ,Q untuk unit ke- j pada level-2

x pij = peubah penjelas ke- p dengan p=1,2 , … , P untuk unit level-1 ke-i

dalam unit level-2 ke- j

ε ij = residual untuk unit ke-i pada level-1 dalam unit ke- j pada level ke-2

(residual level-1), diasumsikan berdistribusi N(0 , σ 2ε )

- Untuk model level-2

β 0 j =γ 00 + γ 01 Z j +u oj ………………….…………….(5)

β 1 j=γ 00 +γ 01 Z j +u1 j ………………………………(6)

7
β oj = fixed intercept, atau rata-rata keseluruhan

uoj = efek random (error) untuk unit ke- j pada level-2, diasumsikan

berdistribusi N( 0 , σ 2ε )

uqj = efek random dari z qj pada level-2, untuk q=1,2 , … ,Q

Pada random slope model, notasi j=1,2 ,… , m menyatakan unit-unit level-2 dan
i=1,2 , … , n j menyatakan unit-unit level-1 yang bersarang dalam unit ke-j pada
level-2. Sehingga total observasi level-1 dalam seluruh unit level-2 adalah :

n=∑ n j
j=1

Model (2) dapat disubstitusikan ke dalam model (1) sehingga model regresi 2-
level dengan random intercept menjadi
P Q p
y ij =γ 00 + ∑ γ p 0 X pij + ∑ γ 0 q Z qj + ∑ β p x pij + uoj +ε ij
p=1 q=1 p=1

Secara umum model random slope dinyatakan dalam bentuk vector adalah sebagai
berikut:
y ij =X 'ij β+ Z 'j u j+ ε ij ………………………………………………………(7)
dengan
y ij= respon untuk unit ke-i pada level-1 dalam unit ke- j pada level-2
'
X ij = vector berisi peubah penjelas level-1, berukuran 1X(P+1)
β=¿ merupakan vector berisi parameter-parameter fixed yang tidak diketahui
yang bersesuaian dengan vector X 'ij berukuran (P+1)X1,
'
Z j = vector berisi peubah penjelas level-2 untuk Q+1 efek random,

Zij =[ 1 z 1 j z2 j ⋯ z Qj ]
'

u j = vector berisi efek random yang bersesuaian dengan vector Z'j, berukuran

[]
u0 j
u
(Q+1)X1, u j= 1 j

uQj

8
ε ij = residual unit ke-i pada level-1 dalam unit ke- j pada level-2 (residual level-1),

diasumsikan berdistribusi N(0 , σ 2ε )

Penduga parameter
Metode pendugaan parameter (koefisien regresi dan komponen ragam)
yang dapat digunakan pada pemodelan regresi dua level adalah metode Maximum
Likelihood (ML) atau Restricted Maximum Likelihood (REML) (Goldstein, 1999)
. Secara umum fungsi Maximum Likelihood (ML) untuk persamaan (7) adalah
sebagai berikut (dalam notasi matriks):
J −n j −1
L ( β , θ ) =∏ ( 2 π ) |V j| 2 exp−0.5 ∑ ( y j− X j β ) ' V j ( y j−X j β ) ………..(8)
2 −1

j =1

denganθ adalah vector parameter acak dari elemen matriks V j. Fungsi Log-
Likelihood dari persamaan diatas adalah sebagai berikut
J
l ( β , θ )=ln ( β , θ )=−0.5 ln 2 π−0.5 ln|V j|−0.5 ∑ ( y j −X j β j ) ' V −1
j ( y j −X j β )
j=1

Dalam hal ini V j merupakan fungsi dari θ . Sehingga penduga koefisien fungsi
Maximum Likelihood (ML) adalah sebagai berikut:

( )
J −1 J

∑ ( X 'j V −1j X j ) ∑ X 'j V j


−1
^β= y j ………………………………………(9)
j=1 j=1

Dengan galat baku adalah akar diagonal utama matriks


var ( β )=¿¿ ……………………………………………….(10)
West et al. (2007)
Pada persamaan (9) dan (10) elemen matriks V j adalah parameter-
parameter acak yang nilainya belum diketahui. Sehingga untu mendapatkan nilai
V j perlu dibentuk fungsi profile log-likelihood(l ML ( β , θ ) ), yaitu dengan mengganti
nilai β dengan penduganya yang didapatkan dari persamaan (9) untuk nilai V j yan
telah ditentukan terlebih dahulu. Persamaan fungsi baru dari Maximum Likelihood
(ML) dapat ditulis sebagai berikut:
J
ln ML ( β ,θ )=−0.5 ln 2 π −0.5 ln |V j|−0.5 ∑ ( y j− X j β j ) ' V −1
j ( y j − X j β )……………
j=1

……………………………………………………………….(11)
Sehingga penduga V j didapat dari persamaan berikut

9
^ j=Z j D
V ^ Z'j + ^
R j ……………………………………………………………….(12)
Kemudian nilai penduga V j ini digunakan untuk menduga nilai koefisien regresi
dengan mengganti V j pada persamaan (9) dan (10)
Proses penduga ini harus melalui proses iterasi sehingga mendapatkan nilai
penduga yang konvergen. Penduga yang didapatkan pada persamaan (10)
merupakan penduga yang bias sehingga untuk mendapatkan penduga yang tak
bias perlu dilakukan suatu modifikasi dari prosedur pendugaannya. Prosedur
pendugaan Maximum Likelihood (ML) akan menghasilkan penduga tak bias
apabila dilakukan modifikasi dalam fungsi profile log-likelihood yang disebut
fungsi Restricted log-likelihood berikut ini
J J −1 J
l REML ( β ,θ )=−0.5 ( n−p ) ln2 π−0.5 ∑ ln|V j|−0.5 ∑ ( y j−X j β^ j ) ( y j−X j β^ j )−0.5 ∑ ln| X j ' V −1j X j|
'Vj

j=1 j=1 j=1

……………………………… (13)
Dengan p adalah banyaknya parameter tetap dalam model. Prosedur ini disebut
sebagai Restricted Maximum Likelihood atau Residual Maximum Likelihood
(REML) West et al.(2007).

Penduga koefisien korelasi intraclass


Jika data yang dimiliki adalah data dengan struktur berjenjang yang
sederhana , maka regresi multilevel dapat digunakan untuk memberikan nilai
dugaan bagi korelasi intraklas (Hox, 2002). Model yang digunakan untuk tujuan
ini adalah model yang tidak memiliki peubah penjelas dalam setiap levelnya, yang
dikenal sebagai intercept-only model. Dengan menggunakan model ini korelasi
intraklas ρ dapat diformulasikan sebagai berikut:
2
σu 0
ρ= 2 2 ………………………………………………………………….. (14)
σ u 0+ σ e 0

Dengan σ 2u 0 adalah ragam dari galat pada level tertinggi u0 j dan σ 2ue adalah
ragam dari galat pada level terendah. Korelasi intraklas (ρ) menunjukkan proporsi
keragaman yang dijelaskan oleh struktur kelompok dalam populasi , yang dapat
juga diinterpretasikan sebagai korelasi harapan antara dua unit yang dipilih secara
acak yang berada dalam kelompok yang sama (Hox, 2002).

10
Pengujian hipotesis
Penduga parameter yang didapatkan dari metode Maximum Likelihood
selanjutnya digunakan untuk menguji keberartian parameter pada model regresi
multilevel secara individual.Hipotesis dari dua model yang memiliki hubungan
tersarang dapat dibuat menjadi suatu formula. Model reference (model penuh)
merupakan model yang lebih umum yang mencakup kedua hipotesis (H0 dan H1) .
Sedangkan model yag hanya mencakup H0 disebut sebagai model model nested
(model tersarang) .Model penuh terdiri dari semua parameter yang diuji
sedangkan model tersarang.
Hipotesis yang digunakan adalah sebagai berikut :

Parameter level 1
H 0 : β kj=0
H 1 : βkj ≠ 0
Dengan indeks k =1,2 , … q dan q menyatakan banyak parameter tetap level 1
Parameter level 2
H 0 :γ kj=0
H 1 : γ kj ≠ 0
Dengan indeks l=1,2 , … r dan r menyatakan banyak parameter tetap level 2
Statistik uji yang digunakan adalah statistik Wald sebagai berikut:
^β kj γ^ kj
t= dant=
√V ( β^ ¿ ¿ kj)¿ √V (^γ ¿¿ kj) ¿
……………………………………………………(15)
Dalam hal ini t mengikuti sebaran t student dengan derajat bebas untuk penduga
parameter Level 1 adalah n−q−1 sedangkan derajat bebas untuk penduga
parameter level 2 adalah J−r−1 (Jones & Steenbergen 2002).

Pemilihan model terbaik


Didalam pemilihan model terbaik , untuk menentukan cocok tidaknya
suatu model juga dapat dilihat dari Deviance . secara umum Deviance dirumuskan
sebagai berikut :

11
D=−2 log
( )
λ0
λ1
………………………………………………………………(16)

Dengan λ 0 adalah fungsi Likelihood dibawah hipotesis nol pada saat


mencapai konvergen dan λ 1 fungsi Likelihood dibawah hipotesis alternative pada
saat mencapai konvergen.Kriteria keputusan dari deviance ini semakin kecil nilai
deviance model dikatakan semakin cocok. Untuk membandingkan kedua model
juga dapat dilakukan dengan prosedur berikut (Jones & Steenbergen, 1997) ,
misalkan terdapat dua model yaitu M1 dan M2. Maka kemungkinan hubungan
antara dua model antara lain :
1. M1 merupakan model yang diturunkan dari M2 dengan cara
menghilangkan suatu parameter atau M1 dikatakan tersarang dalam M2
2. M1 merupakan model yang sama sekali berbeda dengan M2 (dimana M1
tidak tersarang dalam M2)
Untuk membandingkan kedua model pada kemungkinan pertama digunakan
suatu ukuran perbedaan Devianceyaitu :
diff= D1-D2
diff merupakan sebaran Khi-Kuadrat dengan derajat bebas k = p2− p1 dengan p1
adalah banyak parameter pada M1 dan p2 adalah banyak parameter pada M2.
Artinya jika pengujian nyata maka M2 lebih cocok dibandingkan dengan M1.

Koefisien determinasi
Koefisien determinasi digunakan untuk mengukur seberapa besar
keragaman koefisien yang dapat dijelaskan oleh model yang ditetapkan. Pada
model multilevel akan didapatkan koefisien determinasi lebih dari satu. Menurut
Hox (2002) koefisien determinasi akan didapat pada masing-masing level.
Level 1 :
2
2 σ^ ep
R =1− 2
1
σ^ e 0
Dengan
2
σ^ ep=¿ penduga ragam dari galat pada level 1 dengan p peubah penjelas
σ^ e0 =¿penduga ragam dari galat pada level 1 tanpa peubah penjelas
2

Level 2 :

12
2
2 σ^ u 0 p
R =1− 2
2
σ^ u 0

σ^ 2u 0 p =¿penduga ragam dari galat pada level 2 dengan p peubah penjelas


σ^ u 0=¿penduga ragam dari galat pada level 2 tanpa peubah penjelas
2

STUDI KASUS

Misalkan kita ingin mengetahui tingkat pendidikan anak berdasarkan


pengaruh tingkat pendidikan ibu dan ayah dengan memperhatikan
kecamatan.Data diambil dari penelitian Bertho Tantular (2009) yang merupakan
data pendidikan hasil survey lembaga internasional mengenai pendidikan di
Indonesia.Data yang digunakan hanya menggunakan 13 kecamatan di Jawa-Barat
dengan banyak observasi sebanyak 274.
Berdasarkan data yang tersedia diperoleh peubah peubah yang dilibatkan
adalah sebagai berikut :
Peubah respon
Y = Pendidikan Anak (Tahun)
Peubah penjelas pada level 1
X1= Pendidikan Ibu (Tahun)
X2=Pendidikan Ayah (Tahun)
Peubah penjelas pada level 2
Z1= Banyak SMA di Kecamatan
Z2= Persentase Petani di Kecamatan

13
a. Regresi Linear
Regresi linear berganda dilakukan sebagai dasar dalam membandingkan
model multilevel yang akan diperoleh nantinya. Peubah yang digunakan dalam
analisis regresi linear adalah peubah bebas pada level 1 (anak) tanpa
memperhatikan peubah bebas pada level kecamatan (Z).Peubah pada level 1
adalah pendidikan ibu (X1) dan pendidikan ayah (X2). Pendugaan parameternya
menggunakan metode kuadrat terkecil dan hasilnya adalah sebagai berikut :

> model0<-lm(Y~X2+X3, data=dataku)


>summary (model0)

Tabel 1. Hasil Analisis Model Regresi Linear


Penduga Galat Baku T Nilai-p
Intersep 5.918 0.291 20.31 0.000*
X1 0.213 0.073 2.90 0.004*
X2 0.358 0.063 5.70 0.000*

Nilai koefisien keragaman (R2) adalah sebesar 0.30, artinya sebesar 30%
peubah-peubah X mempengaruhi Y (Pendidikan anak), dan sisanya 70% ada
faktor lain yang tidak terdapat dalam model yang mempengaruh Y. Berdasarkan
Tabel 1 diatas diperoleh bahwa pendidikan ibu (X1) dan pendidikan ayah (X2)
berpengaruh nyata terhadap pendidikan anak pada taraf 5%. Hal ini terlihat dari
nilai-p < 0.05. Sehingga persamaan regresinya adalah sebagai berikut :
Y^ ij =5.918+0.213 X 1 ij+0.358 X 2ij
Terlihat semua nilai koefisien regresi bernilai positif, artinya semakin
tinggi pendidikan ayah dan ibu maka semakin tinggi pula pendidikan anak.
Selanjutnya pengujian asumsi regresi :

 Asumsi Non-multikolonearitas

The regression equation is

14
Y = 5.92 + 0.213 X2 + 0.358 X3

Predictor Coef SE Coef T P VIF


Constant 5.9176 0.2914 20.31 0.000
X2 0.21251 0.07334 2.90 0.004 1.837
X3 0.35758 0.06278 5.70 0.000 1.837

S = 2.95957 R-Sq = 30.0% R-Sq(adj) = 29.5%

Dari Hasil output minitab tersebut terlihat nilai VIF < 10 sehingga dapat
disimpulkan tidak ada multikolinearitas antar peubah bebas.

 Asumsi Kenormalan
Hipotesis:
H0 : Data berdistribusi normal
H1 : Data tidak berdistribusi normal

Gambar 1 Plot Uji Kolmogorov Smirnov

Dari Gambar 1 terlihat sisaan tidak mengikuti pola garis normal dan nilai
p-valuenya kurang dari 0.05, sehingga dapat disimpulkan bahwa sisaan tidak
berdistribusi normal.

 Asumsi Homogen Ragam

15
Gambar 2 Scater Plot Residual vs Y-duga

Dari Gambar 2 terlihat scater plotmembentuk pola, sehingga data bersifat


heterogen.Hal ini dikarenakan ada pengaruh level (kelompok) antar pengamatan.

 Asumsi Kebebasan Ragam

Hipotesis:
H0 : Sisaan saling bebas
H1 : Sisaan tidak saling bebas

Output :

Runs Test: RESI1

Runs test for RESI1

Runs above and below K = 1.368897E-14

The observed number of runs = 111


The expected number of runs = 137.642
130 observations above K, 144 below
P-value = 0.001

Berdasarkan uji-Run yang menghasilkan nilai p = 0.001, artinya sisaan


tidak saling bebas. Hal ini mengindikasikan bahwa adanya korelasi antar
observasi pada masing-masing kelompok.Dalam kasus ini yang menjadi
kelompok adalah kecamatan. Selain itu ragam dalam kecamatan cenderung sama,

16
sedangkan ragam antar kecamatan cenderung berbeda. Akibatnya tidak pas
menggunakan regresi linear, perlu dilakukan regresi dengan memasukan pengaruh
kecamatan dalam model, yaitu dengan regresi multilevel.

Korelasi intraclass
Nilai korelasi intraclassdihitung dari ragam yang yang diperoleh di masing-
masing level tanpa melibatkan peubah bebas. Hasil pendugaan ragam pada
masing-masing level disajikan pada tabel 2 berikut :

> model_01=lme(Y~1,data=dataku,~1|Kecamatan)
>VarCorr(model_01)
Kecamatan = pdLogChol(1)
Variance StdDev
(Intercept) 5.129616 2.264866
Residual 8.093212 2.844857

Tabel 2.Nilai pendugaan parameter ragam tanpa peubah bebas


Parameter Dugaan
2
σ u 0 (level 2) 5.1296
2
σ e0 (level 1) 8.0932

2
σu0 5.1296
ρ= 2 2
= =0.388
σ +σ
e0 u0
8.0932+5.1296

Nilai korelasi intraclasssebesar 38,8%. Hal ini menunjukkan proporsi


ragam pada level kecamatan terhadap ragam total sebesar 38.8%. Sehingga
terlihat bahwa adanya pengaruh kecamatan yang mempengaruhi model.Ini juga
berarti bahwa korelasi antara dua anak dalam satu kecamatanadalah sebesar 0.388.
Selanjutnya akan dihitung nilai deviancesebagai berikut.

17
> -2*logLik(model_00)
[1] 1468.026
attr(,"nall")
[1] 274
attr(,"nobs")
[1] 273
attr(,"df")
[1] 2
attr(,"class")
[1] "logLik"
> -2*logLik(model_01)
[1] 1382.374
attr(,"nall")
[1] 274
attr(,"nobs")
[1] 273
attr(,"df")
[1] 3
attr(,"class")
[1] "logLik"
>anova(model_00,model_01)

Model df AIC BIC logLik Test L.Ratio p-value


model_0 1 21472.026 1479.245 -734.0128
model_01 2 31388.373 1399.202 -691.1868 1 vs 2 85.65216 <.0001

Tabel 3 Nilai Deviance untuk model regresi linier dan multilevel tanpa peubah
bebas
Deviance df Diff Nilai p
Regresi 1468.026 2
Multilevel 1382.374 3 85.6521 <.0001
6

Berdasarkan Tabel 3 diatas diketahui nilai deviance untuk model regresi


sebesar 1468.026 dan deviance untuk model multilevel sebesar 1382.374.Semakin
kecil nilai Deviance model tersebut dikatakan semakin cocok, sehingga model
yang cocok untuk data ini adalah model multilevel

18
Hal ini juga dapat dilihat dari nilai-p yang lebih kecil dari 5%, artinya terdapat
perbedaan yang nyata antara model regresi dengan model multilevel.Sehingga
dapat disimpulakan bahwa model multilevel lebih cocok digunakan dalam data
ini.

b. Model Regresi Multilevel dengan Intersep Acak


Model regresi multilevel dengan intersep acak dilakukan untuk melihat
adanya pengaruh kecamatan terhadap model.Model ini merupakan model regresi
multilevel dimana faktor kecamatan diperhatikan.Peubah bebas yang digunakan
adalah peubah bebas pada level 1 (anak) dengan mengikutsertakan peubah bebas
pada level 2 (kecamatan). Intersep pada model ini merupakan komponen acak
sedangkan slope merupakan komponen tetap.Hasil pendugaan menggunakan
metode REML ditunjukkan pada tabel 10 berikut ini.

> model1<-lme(Y~1+X1+X2+Z1+Z2, data=dataku, random=~1|Kecamatan)


>summary(model1)

Tabel 4. Hasil Analisis Model Intersep Acak


Penduga Galat Baku Db T Nilai-p
Intersep 7.515 1.546 259 4.860 0.0000*
X1 0.247 0.074 259 3.348 0.0009*
X2 0.191 0.064 259 2.990 0.0031*
Z1 0.052 0.034 10 1.562 0.1492
Z2 -0.027 0.024 10 -1.129 0.2854

Berdasarkan Tabel 4 menunjukkan bahwa peubah pada level 2


(kecamatan) tidak berpengaruh nyata sehingga kedua peubah tersebut tidak
diikutsertakan, maka diperoleh hasil regresinya adalah berikut ini.

> model1<-lme(Y~1+X1+X2, data=dataku, random=~1|Kecamatan)

19
>summary(model1)

Tabel 5. Hasil Analisis Model Intersep Acak Modifikasi


Penduga Galat Baku Db T Nilai-p
Intersep 6.554 0.515 259 12.715 0.0000*
X1 0.243 0.075 259 3.258 0.0013*
X2 0.215 0.063 259 3.405 0.0008*

Terlihat dari Tabel 5 semua peubah penjelas berpengaruh nyata, sehingga model
yang didapat adalah sebagai berikut :

Y ij =β 0 j + β 1 X 2ij+ β 2 X 3ij + β 3 X 4 ij+e ij (level 1)


β 0 j =γ 0+ u0 j (level 2)

Maka dugaan persamaan regresinya :


Y^ ij =β 0 j +0.243 X 1 ij+0.215 X 2ij
^β =6.554
0j

c. Model Regresi Multilevel dengan Koefisien Acak


Model Regresi multilevel dengan koefisien acak merupakan model regresi
multilevel dengan mengikutsertakan peubah penjelas pada level 2 (kecamatan)
selain itu juga tetap mengikutsertakan peubah penjelas pada level 1 (keluarga)
serta memperhatikan adanya interaksi anatar peubah bebas pada level 1 (keluarga)
dan kecamatan. Pada model ini pengaruh kecamatan ditambahkan pada peubah
pendidikan ayah (X2).Pendidikan ayah dipilih sebagai variabel acak karena
berdasarkan pengetahuan sebelumnya bahwa 37% pendidikan ayah dipengaruhi
oleh kecamatan dimana mereka tinggal.Peubah penjelas pada level 2 yang
digunakan adalah banyaknya SMA di kecamatan (Z1) dan persentasi petani di
kecamatan (Z2).

20
> model2<-lmer(Y~X1+X2+Z1+Z2+Z1*X2+Z2*X2+(1+X2|Kecamatan),
data=dataku)
>summary(model2)

Hasil pendugaan koefisien acak adalah sebagai berikut :


Tabel 6. Hasil Pendugaan Koefisien Acak
Penduga Galat Baku Db T t-tabel
Intersep 9.498 2.418 258 3.928* 1.96
X1 0.249 0.0669 258 3.727* 1.96
X2 -0.144 0.297 258 -0.483 1.96
Z1 0.067 0.0518 10 1.297 2.23
Z2 -0.073 0.0388 10 -1.876 2.23
X2*Z1 -0.0024 0.0063 258 -0.374 1.96
X2*Z2 0.0086 0.0048 258 1.810 1.96

Dari Tabel 6 diatas terlihat bahwa semua peubah pada level 2 tidak nyata
pada taraf 5%, begitu pula interaksi antara peubah level 1 dengan peubah level 2
tidak nyata. Artinya tidak terdapat interaksi antara peubah pada level yang
berbeda. Selain itu koefisien pendidikan ayah tidak nyata pada taraf 5%. Oleh
karena itu dilakukan modifikasi dengan cara melakukan eliminasi peubah yang
tidak nyata dan juga interaksi yang tidak nyata. Sehingga didapat hasil pendugaan
koefisien sebagai berikut :
> model2<-lmer(Y~X1+X2+Z1+(1+X2|Kecamatan), data=dataku)
>summary(model2)

Tabel 7. Hasil Pendugaan Koefisien Acak tanpa Interaksi


Penduga Galat Baku Db T T_tabel
Intersep 5.8626 0.6693 258 8.759* 1.96
X1 0.2493 0.0664 258 3.756* 1.96
X2 0.2597 0.0959 258 2.708* 1.96
Z1 0.0565 0.0155 11 3.644* 2.2

21
Terlihat pada Tabel 7 diatas semua peubah sudah nyata pada taraf 5%, sehingga
model regresinya adalah sebagai berikut :
Y ij =β 0 j +0.2493 X 1ij + β2 X 2ij (level 1)
dengan β 0 j =5.8626+0.0565 Z 1 (level 2)
β 2 j=0.2597
Sehingga menjadi
Y ij =γ 00 +γ 01 Z 1+ β 1 X 1ij +γ 02 X 2ij +u0 j +u 1 j X 2ij +e ij
Maka persamaan regresinya
Y ij =5.8626+0.0565 Z 1+0.2493 X 1ij + 0.2597 X 2ij

d. Pemilihan Model Terbaik


Untuk melihat model terbaik digunakan nilai Deviance yang paling kecil
dari model. Adapun nilai Deviance dari tiap model adalah sebagai berikut.
-2*logLik(model_0)
'log Lik.' 1369.167 (df=4)
> -2*logLik(model_1)
'log Lik.' 1345.264 (df=5)
> -2*logLik(model_2)
'log Lik.' 1329.461 (df=8)
Tabel 8.Nilai Deviance masing-masing model
Deviance Parameter
Model Regresi 1369.167 4
Model Intersep Acak 1345.264 6
Model Koefisien Acak 1329.461 8

Berdasarkan Tabel 8 diatas terlihat bahwa nilai Deviance terkecil


diperoleh oleh model multilevel dengan koefisien acak yaitu sebesar
1329.461.sehingga dapat disimpulkan bahwa model multilevel dengan koefisien
acak adalah model terbaik dibandingkan dengan model regresi dan model intersep
acak.

22
e. Koefisien Determinasi pada Setiap Level
Koefisien determinasi menunjukkan besarnya keragaman respon yang
dapat dijelaskan oleh peubah bebas. Koefisien pada masing-masinng level
diperoleh dengan cara ragam disetiap level pada model multilevel dengan peubah
bebas dan tanpa peubah bebas. Untuk memperoleh nilai keragaman yang dapat
dijelaskan pada setiap level digunakan model tanpa peubah penjelas level 1
sebagai dasar dan model intersep acak. Dalam data ini tidak digunakan model
koefisien acak yang merupakan model terbaik karena pada model koefisien acak
berfungsi sebagai model dasar bagi keragaman yang ada koefisien kemiringannya
pada setiap level dan tidak dapat digunakan untuk menjelaskan keragaman yang
ada pada intersep.
Hasil dugaan ragam pada masing-masing level disajikan pada Tabel 9 berikut ini:

\>VarCorr(model_1)
Kecamatan = pdLogChol(1)
Variance StdDev
(Intercept) 2.070705 1.438994
Residual 7.138527 2.671802

Tabel 9. Hasil Pendugaan Ragam Model Intersep Acak


Ragam Model Intersep Acak
Dgn. Peubah Tanpa Peubah Koef. Determinasi

Penjelas Penjelas
Residual level 1 (e 0) 7.1385 8.0932 0.1179
Intersep level 2 (u0 ) 2.0707 5.1296 0.5963

Dari Tabel 9 diatas dapat dilihat bahwa koefisien determinasi pada level 1
sebesar 11.79% yang berarti keragaman pendidikan anak dapat dijelaskan oleh
peubah bebas pada level 1 yaitu pendidikan ayah dan pendidikan ibu adalah
sebesar 11.79% lebih tinggi bila dibandingkan dengan model regresi biasa,
sedangkan sisanya dijelaskan peubah lain yang belum dimasukkan ke dalam
model. Sedangkan pada level 2 (Kecamatan), keragaman pendidikan anak dapat

23
dijelaskan oleh faktor kecamatan yaitu peubah banyaknya SMA di kecamatan
sebesar 59.63%. Angka ini cukup besar oleh sehingga pada level 2 keragamaan
pendidikan anak sudah cukup baik dijelaskan oleh peubah banyaknya SMA,
sedangkan sisanya 40.37% dijelaskan oleh faktor lain yang tidak dimasukkan ke
dalam model.

KESIMPULAN

1. Model multilevel umumya digunakan untuk data berjenjang atau


bersarang.
2. Model multilevel dapat mengatasi masalah-masalah yang muncul dari data
berstruktur hirarki, yaitu masalah keheterogenan, masalah hubungan antara
peubah pada level yang berbeda dan masalah terdapatnya komponen acak
dalam model.
3. Model Multilevel juga dapat mengukur korelasi antar dua pengamatan
dalam satu kelompok dan menentukan keragaman dari setiap level.
4. Untuk studi kasus mengenai tingkat pendidikan anak faktor yang
mempengaruhi adalah tingkat pendidikan orang tua (ayah dan ibu) yang
diukur pada level keluarga dan faktor lain yang mempengaruhi pada level

24
kecamatan adalah jumlah SMA di kecamatan sedangkan persentasi petani
tidak berpengaruh.

DAFTAR PUSTAKA
[Anonim].1999.http://tramss.data-archive.ac.uk/documentation/MLwiN/what-is-
asp [26 April 2015, 09:15]
Goldstein H. 1995. Multilevel Statistical Models 2 nd Ed. E- Book Of Arnold,
London
Hox JJ, 2002. Multilevel Statistical Models, edisi ke-2, E-Book Of Arnold, London
Jones BS, Steenbergen MR, 1997, Modelling Multilevel Data Structures. Paper
prepared ini 14thmannual meeting of the political methodology society,
Colombus, OH
McCulloch CE, Searle SR. 2001. General, Linear, and Mixed Models.New
York:John Willey&Sons,Inc.
West BT, Welch KB, Galecki AT.2007. Linear Mixed Models: A Practical Guide
Using Statistical Software. New York: Chapman & Hall

25
Lampiran 1 Contoh Struktur data umtuk analisis regresi multilevel

Kecamata Y X1 X2 Z1 Z2
n
A 6 6 6 1 82
A 2 6 2 1 82
A 6 0 2 1 82
B 6 5 2 2 65
B 0 0 0 2 65
B 6 5 2 2 65
C 17 6 6 4 39
C 6 4 0 4 39
C 9 4 0 4 39
D 2 2 4 0 62
D 3 0 0 0 62
D 3 0 0 0 62
E 7 0 6 5 38
E 9 0 4 5 38
E 12 0 2 5 38
F 9 6 6 21 52
F 7 6 6 21 52
F 9 6 6 21 52
G 11 6 7 2 61
G 1 8 8 2 61
G 12 3 6 2 61
H 5 5 0 0 67
H 6 6 1 0 67
H 6 6 1 0 67
I 4 1 6 4 50
I 11 1 6 4 50
I 6 1 2 4 50
J 11 6 9 8 62
J 15 9 12 8 62
J 12 6 9 8 62
K 11 9 17 23 10
K 12 6 6 23 10
K 9 6 6 23 10
L 12 1 6 49 28
L 12 1 6 49 28
L 12 4 6 49 28
M 9 6 9 16 54
M 12 6 9 16 54
M 12 6 9 16 54

26
27

Anda mungkin juga menyukai