LITERATUR REVIEW
OLEH
REZKI QORILANI
B2B123038
UNIVERSITAS HALUOLEO
KENDARI
2023.1
DAFTAR ISI
Cover.........................................................................................................................................
Daftar Isi....................................................................................................................................
Regresi Sederhana..................................................................................................................3
Rendah.....................................................................................................................................6
Perbandingan Model................................................................................................................8
Ukuran Sampel........................................................................................................................11
Metode Diagnosis...................................................................................................................15
Diagnostik Grafis....................................................................................................................15
Linearitas Fenomena..............................................................................................................16
Pemilihan Variabel..................................................................................................................21
Pendekatan Kombinatorial......................................................................................................24
Mengidentifikasi Multikorinealitas............................................................................................30
Dekomposisi Multikorinealitas..................................................................................................31
Korelasi Biraviat......................................................................................................................32
Koefisien Struktur...................................................................................................................34
Analisis Dominasi....................................................................................................................34
Model Multilevel......................................................................................................................37
Model Panel............................................................................................................................39
Jenis Variabel..........................................................................................................................41
Jenis Model.............................................................................................................................42
ii
Interprestasi Koefisien Regresi Tugas Pertama......................................................................46
Korelasi Biraviat......................................................................................................................49
Koefisien Struktur....................................................................................................................50
Analisis Keumumaran..............................................................................................................51
Analisis Dominasi.....................................................................................................................51
Daftar Pustaka.........................................................................................................................v
iii
iv
1. Ringkasan Bahan Kajian
Analisis regresi berganda merupakan suatu teknik statistik yang dapat digunakan
untuk menganalisis hubungan antara satu variabel terikat (kriteria) dan beberapa variabel
independen yang nilainya diketahui untuk memprediksi nilai dependen tunggal yang dipilih
peneliti. Setiap variabel independen diberi bobot dengan prosedur analisis regresi untuk
kontribusi relatif dari variabel independen terhadap keseluruhan prediksi dan memfasilitasi
demikian, sama-sama dapat mencapai tujuan prediksi atau penjelasan. Himpunan variabel
independen tertimbang membentuk variat regresi, yaitu kombinasi linier dari variabel
ketergantungan. Oleh karena itu, untuk menggunakannya, seseorang harus bisa membagi
variabel menjadi variabel terikat dan variabel bebas. Analisis regresi juga merupakan alat
statistik yang sebaiknya digunakan hanya jika variabel terikat dan bebasnya berbentuk
metrik. Namun, dalam keadaan tertentu dimungkinkan untuk memasukkan data nonmetrik
baik sebagai variabel independen (dengan mentransformasikan data ordinal atau nominal
Regresi berganda tidak diragukan lagi telah menjadi teknik analisis yang dominan
bagi para peneliti di era penjelasan ilmiah dan ketergantungan pada metode kuantitatif.
Namun ada satu pertanyaan yang dihadapi semua peneliti. Namun regresi berganda adalah
contoh utama dari jenis model yang berlawanan, yaitu model statistik/data, yang
1
berorientasi pada konfirmasi model yang diusulkan dengan penekanan pada penjelasan.
Dan penekanan pada penjelasan ini membuat regresi berganda sangat cocok untuk
beberapa bidang analisis utama. Yang pertama adalah peramalan, dimana pemahaman
tentang “penyebab” dasar suatu proses diperlukan sebelum membuat proyeksi ke masa
depan.
Regresi berganda dan varian pemodelan deret waktu dan pemodelan persamaan
struktural memberikan kerangka kerja untuk pemahaman mendalam tentang proses yang
sedang diselidiki. Hal ini penting untuk melakukan peramalan dimana model diharapkan
dapat melakukan ekstrapolasi ke kondisi masa depan yang mungkin belum pernah terjadi di
masa lalu. Bidang analitik kedua yang sangat cocok untuk regresi berganda adalah bidang
tujuan mendasar dan dengan demikian model statistik/data akan selalu diutamakan. Dan
Sangat sulit untuk memberi insentif kepada manajer dalam meningkatkan kepuasan
pelanggan atau meningkatkan kinerja perusahaan jika tidak ada model obyektif yang
memberikan wawasan tentang bagaimana hal ini dilakukan. Hal ini juga merupakan peran
regresi berganda, untuk memberikan cara obyektif dalam mengukur dampak faktor-faktor
potensial terhadap hasil terte Era Big Data menghadirkan regresi berganda dengan banyak
tantangan, mulai dari banyaknya jenis variabel, banyaknya variabel (bahkan ketika jumlah
variabel melebihi ukuran sampel) hingga jumlah observasi yang dipertimbangkan [120].
Namun bahkan dengan tantangan-tantangan ini, regresi berganda masih memberikan dasar
model statistik/data yang cocok untuk berbagai masalah penelitian yang berfokus pada
prediksi dan penjelasan. Hal ini bukan berarti mengabaikan peran kumpulan teknik
memiliki peran utama dalam analisis saat ini dan di masa depan.
2
Contoh Regresi Sederhana dan Berganda
Kesalahan prediksi, selisih antara nilai aktual dan nilai prediksi variabel terikat
variabel bebas.
berbeda secara signifikan dari nol), nilai koefisien regresi menunjukkan sejauh mana
3
intercept Interpretasi dari intersep agak berbeda. Intersep hanya memiliki nilai
Secara sederhana, intersep memiliki nilai interpretasi hanya jika nol adalah
nilai yang valid secara konseptual untuk independen variabel penyok (yaitu,
adalah dana periklanan. Jika realistis bahwa, dalam beberapa situasi, tidak
ada iklan yang dilakukan, maka intersep akan mewakili nilai variabel terikat
Jika nilai independen mewakili ukuran yang tidak pernah mempunyai nilai
melewati titik asal, suku intersep dapat dihilangkan (disebut regresi melalui titik asal).
Dalam kasus ini, interpretasi residu dan koefisien regresi sedikit berubah.
Ukuran akurasi prediksi lainnya adalah variasi yang diharapkan dalam nilai prediksi,
yang disebut kesalahan standar estimasi (SEE ). Didefinisikan secara sederhana sebagai
deviasi standar dari nilai prediksi, hal ini memungkinkan peneliti untuk memahami interval
kepercayaan yang dapat diharapkan untuk setiap prediksi dari model regresi. Jelas, interval
kepercayaan yang lebih kecil menunjukkan akurasi prediksi yang lebih besar. Hal ini
mensurvei peneliti dengan hasil dari berbagai tingkat kesesuaian model dan seringkali
hasilnya dianggap lebih dapat diprediksi daripada yang dapat dibenarkan oleh model [110].
4
Pemeriksaan SEE memberikan ukuran tambahan yang meningkatkan penilaian model. Oleh
karena itu, ukuran relevansi praktis ini penting dalam evaluasi model secara keseluruhan.
Kedua ukuran keakuratan prediksi ini sekarang dapat digunakan untuk menilai tidak
hanya model regresi sederhana ini, namun juga perbaikan yang dilakukan ketika lebih
BERGANDA
meningkatkan prediksi variabel dependen tidak hanya terkait dengan korelasinya terhadap
variabel dependen, tetapi juga dengan korelasi variabel independen tambahan terhadap
variabel independen. ) sudah ada dalam persamaan regresi. Kolinearitas adalah hubungan,
diukur sebagai korelasi, antara dua variabel independen. Multikolinearitas mengacu pada
korelasi antara tiga atau lebih variabel independen (terbukti ketika salah satu variabel
Meskipun ada perbedaan yang jelas antara kedua konsep ini dalam istilah statistik,
Seperti yang diharapkan, korelasi antar variabel independen dapat mempunyai dampak
independen sebesar sejauh mana variabel tersebut dikaitkan dengan variabel independen
lainnya. Ketika kolinearitas meningkat, varian unik yang dijelaskan oleh masing-masing
variabel independen menurun dan persentase usia prediksi bersama meningkat. Karena
prediksi bersama ini hanya dapat dihitung satu kali, maka hal ini mempunyai dua efek yang
5
nyata: (a) efek prediksi yang disebabkan oleh salah satu variabel independen hanya
penurunan koefisien regresi variabel yang terkena dampak, dan (b) keakuratan prediksi
sangat berlebihan hanya akan menambah varians bersama secara bertahap melebihi apa
yang akan ditambahkan oleh satu variabel secara individual. Dengan demikian, prediksi
harus mencari variabel independen yang memiliki multikolinearitas rendah dengan variabel
independen lainnya tetapi juga memiliki korelasi yang tinggi dengan variabel dependen.
Seperti disebutkan sebelumnya, regresi berganda adalah penggunaan dua atau lebih
memiliki daya prediksi tambahan terbesar. Meskipun kita dapat menentukan hubungan
variabel independen dengan variabel dependen melalui koefisien korelasi, besarnya daya
prediksi tambahan untuk variabel tambahan berkali- kali lipat ditentukan oleh
multikolinearitasnya dengan variabel lain yang sudah ada dalam persamaan regresi. Kita
Kita telah melihat peningkatan akurasi prediksi yang diperoleh dari peralihan dari
persamaan regresi sederhana ke persamaan regresi berganda, namun kita juga harus
mencatat bahwa pada titik tertentu penambahan variabel independen akan menjadi kurang
6
menguntungkan dan bahkan dalam beberapa kasus kontraproduktif. Penambahan lebih
banyak variabel independen didasarkan pada trade-off antara peningkatan daya prediksi
versus model regresi yang terlalu kompleks dan bahkan berpotensi menyesatkan. Survei
penggunaan kartu kredit memberikan satu lagi kemungkinan tambahan pada persamaan
regresi berganda, yaitu jumlah mobil yang dimiliki 1V3 2. Jika sekarang kita menentukan
persamaan regresi untuk memasukkan ketiga variabel independen Dengan demikian, kita
dapat melihat beberapa perbaikan dalam persamaan regresi, namun tidak sebesar yang
Analisis regresi berganda, suatu bentuk model linier umum, adalah teknik statistik
multivariat yang digunakan untuk menguji hubungan antara satu variabel terikat dan
sekumpulan variabel bebas. Titik awal yang diperlukan dalam regresi berganda, seperti
halnya semua teknik statistik multivariat, adalah masalah penelitian. Fleksibilitas dan
Dalam memilih penerapan regresi berganda yang sesuai, peneliti harus mempertimbangkan
Regresi berganda sejauh ini merupakan teknik multivariat yang paling banyak
digunakan dari teknik yang dibahas dalam teks ini. Dengan penerapannya yang luas,
7
regresi berganda telah digunakan untuk berbagai tujuan. Penerapan regresi berganda yang
semakin meluas terbagi dalam dua kelompok besar masalah penelitian: prediksi dan
penjelasan. Prediksi menyangkut sejauh mana variate regresi (satu atau lebih variabel
(besarnya, tanda, dan signifikansi statistiknya) untuk setiap variabel independen dan
analisis regresi berganda dapat mengatasi salah satu atau kedua jenis masalah penelitian
tersebut.
Salah satu tujuan mendasar dari regresi berganda adalah untuk memprediksi variabel
terikat dengan sekumpulan variabel bebas. Dengan demikian, regresi berganda memenuhi
contoh sebelumnya dalam memprediksi penggunaan kartu kredit, variat dibentuk dengan
prediktor optimal dari ukuran dependen. Keakuratan prediksi selalu penting untuk
memastikan validit Ukuran akurasi prediksi dikembangkan dan uji statistik digunakan untuk
Dalam aplikasi tertentu yang hanya berfokus pada prediksi, peneliti terutama tertarik untuk
mencapai prediksi maksimal, dan menafsirkan koefisien regresi relatif tidak penting.
Sebaliknya, peneliti menggunakan banyak pilihan baik dalam bentuk maupun spesifikasi
8
PERBANDINGAN MODEL
Regresi berganda juga dapat mencapai tujuan kedua yaitu membandingkan dua atau
lebih kumpulan variabel independen untuk memastikan kekuatan prediksi setiap varian.
berganda ini berkaitan dengan perbandingan hasil dari dua atau lebih model alternatif atau
model yang bersaing. Fokus utama dari jenis analisis ini adalah kekuatan prediksi relatif
antar model, meskipun dalam situasi apa pun prediksi model yang dipilih harus
Interpretasi paling langsung dari variat regresi adalah penentuan kepentingan relatif
setiap variabel independen dalam prediksi ukuran dependen. Dalam semua penerapan,
variabel dependen. Analisis regresi kemudian memberikan cara untuk menilai secara
objektif besaran dan arah (positif atau negatif) hubungan masing-masing variabel
adalah penilaian hubungan secara simultan antara masing-masing variabel independen dan
ukuran dependen. Dalam melakukan penilaian simultan ini, kepentingan relatif dari masing-
variabel, regresi berganda juga memberi peneliti sarana untuk menilai sifat hubungan antara
hubungan linier berdasarkan korelasi antara variabel independen dan ukuran dependen.
9
MENENTUKAN HUBUNGAN STATISTIK
Regresi berganda cocok jika peneliti tertarik pada hubungan statistik, bukan
Jika biaya variabel adalah $2 per unit, biaya tetap adalah $500, dan kita
memproduksi 100 unit, kita asumsikan bahwa biaya total akan tepat $700 dan setiap
penyimpangan dari $700 disebabkan oleh ketidakmampuan kita mengukur biaya karena
hubungan antar biaya. telah diperbaiki. Disebut hubungan fungsional karena kita
mengharapkan tidak ada kesalahan dalam prediksi kita. Oleh karena itu, kita selalu
Namun dalam contoh sebelumnya yang berhubungan dengan data sampel yang
mewakili perilaku manusia, kami berasumsi bahwa deskripsi kami tentang penggunaan
kartu kredit hanyalah perkiraan dan bukan prediksi sempurna. Ini didefinisikan sebagai
hubungan statistik karena beberapa komponen acak selalu ada dalam hubungan yang
1. Ketika beberapa observasi dikumpulkan, lebih dari satu nilai dari nilai dependen
terikat juga diasumsikan acak, dan untuk variabel independen tertentu kita hanya
dapat berharap untuk memperkirakan nilai rata-rata dari variabel dependen yang
terkait dengannya.
Misalnya, dalam contoh regresi sederhana, kami menemukan dua keluarga dengan
dua anggota, dua keluarga dengan empat anggota, dan seterusnya, yang memiliki nomor
kartu kredit berbeda. Dua keluarga dengan empat anggota rata-rata memiliki 6,5 kartu
kredit, dan prediksi kami adalah 6,75. Prediksi kami memang tidak seakurat yang kami
10
inginkan, namun lebih baik dibandingkan hanya menggunakan rata-rata 7 kartu kredit.
Kesalahan tersebut diasumsikan sebagai akibat dari perilaku acak di antara pemegang
Keberhasilan akhir dari setiap teknik multivariat, termasuk regresi berganda, dimulai
dengan pemilihan variabel yang akan digunakan dalam analisis. Karena regresi berganda
merupakan teknik ketergantungan, maka peneliti harus menentukan variabel mana yang
merupakan variabel terikat dan variabel mana yang merupakan variabel bebas. Meskipun
sering kali pilihan-pilihan tersebut tampak jelas, peneliti harus selalu mempertimbangkan
tiga masalah yang dapat mempengaruhi keputusan apa pun: teori yang kuat, kesalahan
penggunaan regresi berganda di berbagai macam aplikasi. Seperti yang akan dilihat di
bagian berikut, regresi berganda dapat mewakili berbagai hubungan ketergantungan. Dalam
diasumsikan bersifat metrik dan memiliki hubungan linier dengan variabel dependen,
11
Masing-masing fitur ini memainkan peran kunci dalam penerapan regresi berganda
Ukuran sampel
Ukuran sampel yang digunakan dalam regresi berganda mungkin merupakan satu-
satunya elemen paling berpengaruh yang berada di bawah kendali peneliti dalam
merancang analisis. Pengaruh ukuran sampel terlihat paling langsung pada kekuatan
statistik pengujian signifikansi dan kemampuan generalisasi hasil. Kedua masalah tersebut
Sampel memiliki dampak langsung pada kesesuaian dan kekuatan statistik regresi
berganda. Sampel kecil, biasanya dicirikan memiliki kurang dari 30 observasi, hanya cocok
untuk dianalisis dengan menggunakan metode regresi berganda. regresi sederhana dengan
satu variabel independen. Bahkan dalam situasi seperti ini, hanya hubungan kuat yang
dapat dideteksi dengan tingkat kepastian apa pun. Demikian pula, sampel besar yang terdiri
dari
1.000 observasi atau lebih membuat uji signifikansi statistik menjadi terlalu sensitif, sering
kali menunjukkan bahwa hampir semua hubungan signifikan secara statistik. Dengan
sampel yang begitu besar, peneliti harus memastikan bahwa kriteria signifikansi praktis dan
Aturan umumnya adalah rasio tidak boleh turun di bawah 5:1, artinya lima observasi
dilakukan untuk setiap variabel independen dalam variate. Meskipun rasio minimumnya
12
adalah 5:1, tingkat yang diinginkan adalah antara 15 hingga 20 observasi untuk setiap
variabel independen. Ketika tingkat ini tercapai, hasilnya harus dapat digeneralisasikan jika
direkomendasikan meningkat menjadi 50:1 karena teknik ini hanya memilih hubungan
terkuat dalam kumpulan data dan memiliki kecenderungan lebih besar untuk menjadi
sampel spesifik [125]. Jika sampel yang tersedia tidak memenuhi kriteria ini, peneliti harus
Karena rasio ini turun di bawah 5:1, peneliti menghadapi risiko penyesuaian variasi
yang berlebihan terhadap sampel, sehingga hasilnya terlalu spesifik untuk sampel sehingga
kurang dapat digeneralisasikan. Dalam memahami konsep overfitting, kita perlu membahas
konsep statistik derajat kebebasan. Dalam prosedur estimasi statistik apa pun, peneliti
membuat estimasi parameter dari data sampel. Dalam kasus regresi, parameternya adalah
koefisien regresi untuk setiap variabel independen dan suku konstanta. Seperti yang telah
terhadap nilai prediksi. Lalu, apa hubungan antara jumlah observasi dan variabelnya? Mari
linier antara variabel terikat metrik dan variabel bebas berdasarkan korelasi product-
moment. Salah satu masalah yang sering dihadapi peneliti adalah keinginan untuk
memasukkan data nonmetrik, seperti gender atau pekerjaan, ke dalam persamaan regresi.
Namun, seperti yang telah kita bahas, regresi terbatas pada data metrik. Selain itu,
13
menghambat peneliti ketika dihadapkan pada situasi di mana hubungan nonlinier (misalnya,
Transformasi Data Dalam situasi ini, variabel baru harus dibuat melalui transformasi, karena
regresi berganda sepenuhnya bergantung pada pembuatan variabel baru dalam model
untuk memasukkan variabel nonmetrik atau mewakili efek apa pun selain hubungan linier.
Salah satu situasi umum yang dihadapi peneliti adalah keinginan untuk
memanfaatkan variabel independen nonmetrik. Namun, sampai saat ini, semua ilustrasi
kami mengasumsikan pengukuran metrik untuk variabel independen dan dependen. Ketika
variabel dependen diukur sebagai variabel dikotomi (0, 1), maka analisis diskriminan atau
bentuk regresi khusus (regresi logistik), pengganti variabel independen. Setiap variabel
dummy mewakili satu kategori dari variabel independen nonmetrik, dan setiap variabel
Pengkodean indikator: format yang paling umum Dari dua bentuk pengkodean
variabel dummy, yang paling umum adalah pengkodean indikator di mana setiap kategori
variabel nonmetrik diwakili oleh 1 atau 0. Koefisien regresi untuk variabel dummy mewakili
perbedaan pada variabel dummy. variabel terikat untuk setiap kelompok responden dari
kategori referensi (yaitu, kelompok yang dihilangkan yang menerima semua angka nol).
Perbedaan kelompok ini dapat dinilai secara langsung, karena koefisiennya berada pada
Bentuk pengkodean variabel dummy ini dapat digambarkan sebagai intersep yang
suku konstan model regresi. Dalam contoh ini, variabel nonmetrik tiga kategori diwakili oleh
14
dua variabel dummy (D1 dan D2 ) yang mewakili kelompok 1 dan 2, dengan kelompok 3
sebagai kategori referensi. Koefisien regresinya adalah 2,0 untuk D1 dan 23,0 untuk D2 .
Koefisien ini diterjemahkan ke dalam tiga garis sejajar. Kelompok referensi (dalam hal ini
kelompok 3) ditentukan oleh persamaan regresi dengan kedua variabel dummy sama
dengan nol. Garis kelompok 1 berada dua satuan di atas garis kelompok acuan. Garis Grup
2 berada tiga satuan di bawah garis referensi grup 3. Garis sejajar menunjukkan bahwa
variabel dummy tidak mengubah sifat hubungan, namun hanya menyediakan intersep yang
30
20
10
0
5 6 7 8 9 10 11 12 13 14
X
Diperkirakan
Keseluruhan
Spesifik Grup
Y = 2 + 1,2X + 2(1)
Bentuk pengkodean ini paling tepat bila terdapat kelompok referensi logis,
misalnya dalam eksperimen. Setiap kali pengkodean variabel dummy digunakan, kita harus
rata-rata kelompok dari kelompok ini. Pengkodean efek Sebuah metode alternatif
15
pengkodean variabel dummy disebut pengkodean efek. Hal ini sama dengan pengkodean
indikator, hanya saja kelompok pembanding atau yang dihilangkan (kelompok yang semua
angkanya nol) diberi nilai 21, bukan 0 untuk variabel dummy. Sekarang koefisien-koefisien
tersebut mewakili perbedaan- perbedaan untuk setiap kelompok dari rata-rata semua
kelompok dan bukan dari kelompok yang dihilangkan. Kedua bentuk pengkodean variabel
dummy tersebut akan memberikan hasil prediksi, koefisien determinasi, dan koefisien
regresi yang sama untuk variabel kontinu. Perbedaannya hanya terletak pada penafsiran
asumsi yang mendasari analisis regresi berganda berlaku baik terhadap variabel individual
(dependen dan independen) dan hubungan secara keseluruhan. Bab 2 membahas metode
yang tersedia untuk menilai asumsi untuk masing-masing variabel. Dalam regresi berganda,
setelah suatu variat diturunkan, ia bertindak secara kolektif dalam memprediksi variabel
terikat, sehingga memerlukan penilaian asumsi tidak hanya untuk variabel individual tetapi
juga untuk variat itu sendiri. Bagian ini berfokus pada pengujian variate dan hubungannya
dengan variabel dependen untuk memenuhi asumsi regresi berganda. Analisis ini
sebenarnya harus dilakukan setelah model regresi diestimasi pada Tahap 4. Oleh karena
itu, pengujian asumsi harus dilakukan tidak hanya pada tahap awal regresi, tetapi juga
METODE DIAGNOSIS
Ukuran utama kesalahan prediksi untuk suatu variate adalah residu—selisih antara
nilai observasi dan nilai prediksi untuk variabel dependen. Saat memeriksa residu, beberapa
langsung. (Dalam bentuk aslinya, nilai prediksi yang lebih besar secara alami memiliki
16
residu yang lebih besar.) Pendekatan standardisasi yang paling banyak digunakan adalah
residu yang dipelajari, yang berbeda dari metode lain dalam cara menghitung deviasi
deviasi dari sisa observasi dihitung dari estimasi regresi tanpa menyertakan observasi ke-i
dalam penghitungan estimasi regresi. Nilai residu yang dipelajari sesuai dengan nilai t,
sehingga cukup mudah untuk menilai signifikansi statistik dari residu yang sangat besar.
Diagnostik Grafis
Memplot residu versus variabel independen atau prediksi adalah metode dasar untuk
penggunaan plot sisa bergantung pada beberapa pertimbangan utama. Plot Residual Dasar
Plot residu yang paling umum melibatkan residu 1ri 2 versus nilai dependen yang diprediksi
1Yi 2. Untuk model regresi sederhana, residu dapat diplot terhadap variabel dependen atau
hanya nilai dependen yang diprediksi yang mewakili pengaruh total variasi regresi. Jadi,
kecuali jika analisis residu bermaksud untuk berkonsentrasi hanya pada satu variabel, maka
MENILAI PELANGGARAN
Pelanggaran terhadap setiap asumsi dapat diidentifikasi melalui pola residu tertentu.
Gambar berisi sejumlah plot sisa yang menjawab asumsi dasar yang dibahas pada bagian
berikut. Salah satu plot yang menarik perhatian adalah plot nol, yaitu plot residu ketika
semua asumsi terpenuhi. Plot nol menunjukkan residu yang jatuh secara acak, dengan
penyebaran yang relatif sama di sekitar nol dan tidak ada kecenderungan kuat untuk lebih
besar atau lebih kecil dari nol. Demikian pula, tidak ditemukan pola untuk nilai besar versus
kecil dari variabel bebas. Plot sisa yang tersisa akan digunakan untuk mengilustrasikan
metode pemeriksaan pelanggaran asumsi yang mendasari analisis regresi. Pada bagian
17
berikut, kami menguji serangkaian uji statistik yang dapat melengkapi pemeriksaan visual
Linearitas FENOMENA
Linieritas hubungan antara variabel terikat dan bebas menunjukkan sejauh mana
perubahan variabel terikat dikaitkan dengan variabel bebas. Koefisien regresi diasumsikan
konstan pada rentang nilai variabel independen. Konsep korelasi, ukuran hubungan yang
mendasari analisis regresi, didasarkan pada hubungan linier, sehingga menjadikannya isu
Selain itu, pelanggaran asumsi linearitas tidak dapat diatasi dengan meningkatkan ukuran
Linearitas hubungan bivariat dapat dengan mudah diperiksa melalui plot sisa. Setiap
pola lengkung yang konsisten dalam residu menunjukkan bahwa tindakan perbaikan akan
meningkatkan akurasi prediksi model dan validitas estimasi koefisien. Tindakan korektif
Transformasi nilai data (misalnya logaritma, akar kuadrat, dll.) dari satu atau lebih
pelanggaran asumsi yang paling sering terjadi. Dalam kasus ini, suku kesalahan (residual)
18
tidak konstan di seluruh rentang variabel independen. Kurangnya variansi yang konstan
dalam residu tidak membuat koefisien estimasi menjadi bias, namun hal ini menyebabkan
estimasi kesalahan standar estimasi yang tidak akurat (paling sering diremehkan). Hal ini
dapat menyebabkan tingkat kesalahan Tipe I yang meningkat atau penurunan kekuatan
statistik [98].
Diagnosis dibuat dengan plot sisa atau uji statistik sederhana. Merencanakan
residu (yang dipelajari) terhadap nilai dependen yang diprediksi dan membandingkannya
dengan plot nol menunjukkan pola yang konsisten jika variansnya tidak konstan. Mungkin
pola yang paling umum adalah berbentuk segitiga di kedua arah. Pola berbentuk wajik
dapat diharapkan dalam kasus persentase dimana lebih banyak variasi diperkirakan terjadi
pada rentang tengah dibandingkan pada bagian ekor. Seringkali sejumlah pelanggaran
terhadap salah satu pelanggaran seringkali juga memperbaiki permasalahan di bidang lain.
Misalnya, IBM SPSS menyediakan uji Levene untuk homogenitas varians, yang mengukur
karena tidak terlalu terpengaruh oleh penyimpangan dari keadaan normal, yang merupakan
Diagnostik paling sederhana untuk himpunan variabel independen dalam persamaan adalah
histogram residu, dengan pemeriksaan visual untuk distribusi yang mendekati distribusi
normal. Meskipun menarik karena kesederhanaannya, metode ini sangat sulit dilakukan
pada sampel yang lebih kecil, dimana distribusinya seringkali tidak normal. Metode yang
19
lebih baik adalah penggunaan plot probabilitas normal. Plot ini berbeda dengan plot residu
karena residu terstandar dibandingkan dengan distribusi normal. Distribusi normal membuat
garis diagonal lurus, dan residu yang diplot dibandingkan dengan diagonal. Jika suatu
distribusi normal, garis sisa mengikuti diagonal. Prosedur yang sama dapat
normal [33].
ukuran sampel melebihi 200 pengamatan, namun peneliti selalu didorong untuk melakukan
Dalam sampel yang lebih kecil, variabel dapat ditransformasikan untuk mencapai normalitas
guna mengoreksi pelanggaran asumsi. Ketika variabel terikat diketahui mengikuti distribusi
yang tidak normal (misalnya, jumlah, proporsi atau probabilitas, variabel biner), peneliti
didorong untuk mengeksplorasi penggunaan model linier umum (lihat Bab 1 untuk
pembahasan lebih lanjut) yang secara eksplisit menggabungkan distribusi istilah kesalahan
ini. selain distribusi normal. Hal ini memberi peneliti metode untuk menghindari transformasi
Kami berasumsi dalam regresi bahwa setiap nilai prediksi bersifat independen,
artinya nilai prediksi tidak terkait dengan prediksi lainnya; artinya, mereka tidak
dikelompokkan atau diurutkan berdasarkan variabel apa pun. Kita dapat mengidentifikasi
kejadian seperti itu dengan memplot residu terhadap kemungkinan pengelompokan atau
variabel sekuensing. Jika residunya independen, polanya akan tampak acak dan mirip
dengan plot nol dari residu. Pelanggaran akan diidentifikasi melalui pola yang konsisten
dalam residu. Jenis variabel pengelompokan atau pengurutan terbagi dalam dua kelas
dasar: data deret waktu dan observasi berkerumun. Data deret waktu mewakili pengamatan
20
pada unit yang sama (misalnya orang atau objek) dalam beberapa kesempatan. Hal ini
terdistribusi secara hierarkis (yaitu, terdapat kelompok observasi yang membentuk struktur
bersarang di dalam data). Contoh klasiknya adalah dalam lingkungan pendidikan, di mana
setiap siswa dapat dikelompokkan berdasarkan kelas, kemudian kelas dalam sekolah, dan
seterusnya. Kelompok-kelompok ini semuanya dapat saling terkait dalam kelompok tersebut
(misalnya, dampak umum antara satu guru dengan guru lainnya) dan dengan demikian
multilevel atau hierarki telah dikembangkan untuk secara khusus mengatasi masalah ini dan
memberikan solusi atas ketergantungan antar observasi. Kelompok model ini juga akan
dibahas nanti dalam bab ini bersama dengan model panel sebagai perluasan analisis
Tahap 4: Memperkirakan Model Regresi dan Menilai secara keseluruhan Model Cocok
3. Tentukan apakah observasi mana pun memberikan pengaruh yang tidak semestinya
terhadap hasil.
MENGELOLA VARIASI
Mungkin tugas paling penting dalam analisis regresi apa pun adalah spesifikasi
variat yang benar dalam model akhir. Seperti yang telah kita bahas sebelumnya,
dalam hasil analisis regresi dan sebagian besar permasalahan ini diselesaikan melalui
penilaian peneliti dan hilangnya solusi empiris. Pada Bab 1, kami memperkenalkan
21
kerangka kerja Mengelola Variasi (lihat Gambar 5.13) yang akan kami bahas kembali di sini
variabel (menentukan variasi selama proses estimasi). Bagian berikut akan memberikan
rincian lebih lanjut tentang berbagai pilihan yang tersedia bagi peneliti di masing-masing
SPESIFIKASI VARIABEL
Keputusan dasar yang dihadapi peneliti pada tahap ini adalah apakah akan
menggunakan variabel independen dalam bentuk aslinya atau melakukan suatu bentuk
memberikan peneliti pengukuran langsung terhadap variabel yang diteliti, yang mungkin
sangat penting karena penjelasan menjadi tujuan yang penting. Namun seiring
pada Tahap 1, terutama ketika peneliti berupaya menghindari kesalahan spesifikasi dengan
Jika reduksi dimensi dilakukan, peneliti kembali dapat memilih salah satu dari dua
pilihan: melakukan reduksi dimensi sebelum analisis dilakukan melalui beberapa bentuk
lunak. seperti regresi komponen utama di mana perangkat lunak melakukan reduksi dimensi
tanpa campur tangan peneliti. Keuntungan reduksi dimensi dalam bentuk apapun telah
dibahas sebelumnya ketika mengatasi masalah yang terkait dengan multikolinearitas dan
menjadi suatu bentuk variabel gabungan yang kemudian menggantikan variabel individual
dalam analisis. Efeknya adalah memusatkan seluruh efek prediktif ke dalam satu ukuran
dibandingkan dengan memiliki beberapa ukuran yang semuanya “berbagi” dalam efek
yang lebih besar mengenai konsep utama yang mendasari variabel, dengan mengandalkan
“konvergensi” variabel untuk mewakili perspektif bersama mengenai konsep yang jauh lebih
22
kuat daripada Masalah pengurangan kesalahan pengukuran melalui komposit merupakan
elemen mendasar dari pemodelan persamaan struktural. Pilihan yang tepat terlihat jelas
dalam situasi ekstrem—variabel yang jumlahnya sangat sedikit atau sangat besar. Namun
sebagian besar situasi penelitian berada pada kondisi ekstrem dan penilaian peneliti
mempunyai dampak yang besar. Jadi kami merekomendasikan para peneliti untuk
Pemilihan VARIABEL
persamaan regresi. Terkadang kumpulan variabel independen ditentukan secara tepat dan
model regresi pada dasarnya digunakan dalam pendekatan konfirmatori. Namun dalam
kebanyakan kasus, peneliti dapat memilih untuk menentukan variabel yang akan
variabel independen dengan pencarian sekuensial atau dibatasi. proses. Tujuannya harus
selalu untuk menemukan model regresi terbaik, baik melalui satu atau lebih pendekatan
berikut. Masing-masing dari empat pendekatan dasar ini akan dibahas selanjutnya.
model regresi adalah dengan menggunakan pendekatan konfirmatori (juga dikenal sebagai
akan dimasukkan. Dibandingkan dengan pendekatan lain yang akan dibahas selanjutnya,
peneliti memiliki kendali penuh atas pemilihan variabel. Meskipun spesifikasi konfirmatori
memiliki konsep yang sederhana, peneliti sepenuhnya bertanggung jawab atas trade-off
antara variabel yang lebih independen dan akurasi prediksi yang lebih besar dibandingkan
kekikiran model, multikolinearitas, dan penjelasan ringkas. Yang paling bermasalah adalah
23
kesalahan spesifikasi baik penghilangan atau penyertaan yang dibahas sebelumnya pada
Tahap 1.
Pendekatan Kombinatorial
Bentuk lain dari pemilihan variabel yang dikendalikan pengguna adalah pendekatan
kombinatorial, yang pada dasarnya merupakan proses pencarian umum pada semua
kemungkinan kombinasi variabel independen. Prosedur yang paling terkenal adalah regresi
semua subset yang mungkin, persis seperti namanya. Semua kemungkinan kombinasi
variabel independen diperiksa, dan kumpulan variabel yang paling sesuai diidentifikasi.
persamaan dengan semua kombinasi dua variabel, dan seterusnya). Dengan prosedur
estimasi yang terkomputerisasi, proses ini kini dapat dikelola bahkan untuk permasalahan
yang cukup besar, sehingga dapat mengidentifikasi persamaan regresi keseluruhan yang
terbaik untuk sejumlah ukuran kecocoka Penggunaan pendekatan ini mengalami penurunan
karena kritik terhadap (1) sifat atheoretis dan (2) kurangnya pertimbangan faktor-faktor
permasalahan serius yang mempengaruhi kesesuaiannya, dan model lain pada akhirnya
dapat dipilih. Namun pendekatan ini dapat memberikan wawasan mengenai jumlah model
regresi yang memiliki kekuatan prediksi yang setara, namun memiliki kombinasi variabel
pengguna, metode pencarian sekuensial memiliki kesamaan yaitu pendekatan umum dalam
ditentukan oleh peneliti, dan kemudian algoritma perangkat lunak secara selektif
24
beberapa ukuran kriteria secara keseluruhan tercapai. Pendekatan ini memberikan metode
obyektif untuk memilih variabel yang memaksimalkan prediksi sambil menggunakan jumlah
variabel terkecil. Dua jenis pendekatan pencarian sekuensial adalah (1) estimasi bertahap
dan (2) penambahan maju dan eliminasi mundur. Dalam setiap pendekatan, variabel dinilai
secara individual kontribusinya terhadap prediksi variabel dependen dan ditambahkan atau
dihapus dari model regresi berdasarkan kontribusi relatifnya. Prosedur bertahap dibahas
dan kemudian dikontraskan dengan prosedur penjumlahan maju dan eliminasi mundur.
ESTIMASI LANGKAH
Mungkin pendekatan sekuensial yang paling populer dalam pemilihan variabel adalah
estimasi bertahap. Pendekatan ini memungkinkan peneliti untuk menguji kontribusi masing-
masing variabel independen terhadap model regresi. Setiap variabel dipertimbangkan untuk
proses trial-and-error untuk menemukan estimasi regresi terbaik. Model penjumlahan maju
mirip dengan prosedur bertahap yaitu membangun persamaan regresi yang dimulai dengan
persamaan regresi yang mencakup semua variabel independen dan kemudian menghapus
pendekatan bertahap dengan prosedur penjumlahan maju dan eliminasi mundur adalah
kemampuannya untuk menambah atau menghapus variabel pada setiap tahap. Setelah
variabel ditambahkan atau dihapus dalam skema penambahan maju atau eliminasi mundur,
tindakan tersebut tidak dapat dibatalkan pada tahap berikutnya. Dengan demikian,
25
PERINGATAN TERHADAP METODE PENCARIAN SEKUENSIAL
sempurna terhadap dilema yang dihadapi dalam pendekatan konfirmatori dengan mencapai
daya prediksi maksimum hanya dengan variabel-variabel yang berkontribusi dalam jumlah
yang signifikan secara statistik. Namun dalam pemilihan variabel untuk dimasukkan ke
dalam varian regresi, ada tiga hal penting yang sangat mempengaruhi persamaan regresi
yang dihasilkan.
terhadap spesifikasi akhir model. Kriteria untuk dimasukkan atau dihapusnya pendekatan ini
adalah memaksimalkan daya prediksi tambahan dari variabel tambahan. Jika salah satu
variabel tersebut masuk ke dalam model regresi, kecil kemungkinan variabel lainnya juga
ikut masuk karena variabel-variabel tersebut sangat berkorelasi dan secara terpisah
multikolinearitas). Oleh karena itu, peneliti harus menilai pengaruh multikolinearitas dalam
interpretasi model dengan tidak hanya menguji persamaan regresi akhir, tetapi juga menguji
korelasi langsung seluruh variabel independen potensial. Pengetahuan ini akan membantu
tersebut mungkin sangat terkait dengan variabel dependen, tetapi juga berkorelasi dengan
variabel-variabel yang sudah ada dalam model. Meskipun pendekatan pencarian sekuensial
akan memaksimalkan kemampuan prediksi model regresi, namun peneliti harus berhati-hati
26
variansnya. Teknik ini sangat berguna ketika (a) terdapat derajat multikolinearitas yang
tinggi atau (b) jumlah variabel melebihi jumlah observasi dalam sampel.
menggunakan metode yang dikendalikan perangkat lunak, kriteria yang paling penting
adalah pengetahuan substantif peneliti tentang konteks penelitian dan landasan teoretis apa
yang akan dimasukkan serta tanda-tanda yang diharapkan dan besaran koefisiennya.
Tanpa pengetahuan ini, hasil regresi dapat memiliki akurasi prediksi yang tinggi
mempunyai kelebihan dan kekurangan, sehingga tidak ada satu metode yang selalu
diunggulkan dibandingkan pendekatan lainnya. Oleh karena itu, peneliti tidak boleh
sepenuhnya mengandalkan salah satu dari pendekatan ini tanpa memahami bagaimana
implikasi metode estimasi berhubungan dengan tujuan peneliti dalam prediksi dan
penjelasan serta landasan teoritis penelitian. Seringkali penggunaan dua atau lebih metode
secara bersamaan dapat memberikan perspektif yang lebih seimbang bagi peneliti
dibandingkan hanya menggunakan satu metode dan mencoba mengatasi semua masalah
sekarang harus menilai model estimasi untuk memenuhi asumsi yang mendasari regresi
berganda. Uji Signifikansi Koefisien Regresi Pengujian signifikansi statistik untuk estimasi
koefisien dalam analisis regresi adalah tepat dan diperlukan bila analisis didasarkan pada
sampel populasi dan bukan pada sensus. Saat menggunakan sampel, peneliti tidak hanya
tertarik pada estimasi koefisien regresi untuk sampel tersebut, namun juga tertarik pada
bagaimana koefisien diharapkan bervariasi antar sampel yang diulang. Pembaca yang
27
tertarik dapat menemukan pembahasan lebih rinci tentang penghitungan yang mendasari uji
signifikansi koefisien regresi dalam lampiran Statistik Dasar di situs web teks.
mengenai apakah estimasi koefisien pada sejumlah besar sampel dengan ukuran tertentu
memang akan berbeda dari nol. Untuk membuat penilaian ini, interval kepercayaan harus
ditetapkan di sekitar koefisien estimasi. Jika selang kepercayaan tidak memuat nilai nol,
maka dapat dikatakan selisih koefisien dengan nol signifikan secara statistik.
Hingga saat ini, kami fokus pada mengidentifikasi pola umum dalam seluruh rangkaian
Pengamatan ini belum tentu “buruk” dalam arti harus dihapus. Dalam banyak kasus,
mereka mewakili elemen khas dari kumpulan data. Namun, kita harus mengidentifikasinya
terlebih dahulu dan menilai dampaknya sebelum melanjutkan [13]. Bagian ini
hasil regresi.
luas mencakup semua pengamatan yang mempunyai pengaruh tidak proporsional terhadap
hasil regresi. Tiga tipe dasar didasarkan pada sifat dampaknya terhadap hasil regresi
UTLIER Pengamatan yang memiliki nilai residu besar dan hanya dapat diidentifikasi
sehubungan dengan model regresi tertentu adalah outlier [2]. Outlier secara tradisional
28
model regresi, dan metode regresi khusus (misalnya, regresi kuat) bahkan dikembangkan
untuk menangani secara khusus dampak outlier pada hasil regresi [8, 100].
Pengamatan yang berpengaruh sering kali sulit diidentifikasi melalui analisis residu
tradisional ketika mencari outlier. Pola residunya tidak akan terdeteksi karena residu untuk
titik-titik berpengaruh (jarak tegak lurus dari titik perkiraan garis regresi) tidak akan terlalu
besar untuk diklasifikasikan sebagai outlier. Oleh karena itu, berfokus hanya pada residu
Dalam diskusi berikut, kita membahas proses empat langkah untuk mengidentifikasi
outlier, poin leverage, dan pengamatan yang berpengaruh. Seperti disebutkan sebelumnya,
lebih kelas-kelas ini, dan tindakan yang diambil bergantung pada penilaian peneliti,
Parsial Residual berperan penting dalam mendeteksi pelanggaran asumsi model, dan
juga berperan dalam mengidentifikasi observasi yang merupakan outlier pada variabel
dependen setelah model diestimasi. Kami menggunakan dua metode deteksi: analisis
Kasus yang digunakan dalam menghitung residu. Kita telah melihat bagaimana kita
menghitung sisa menggunakan semua observasi, tetapi bentuk kedua, residu yang
dihapus, berbeda dari residu normal karena observasi ke-i dihilangkan ketika
observasi tersebut. Dengan demikian, setiap observasi tidak berdampak pada nilai
29
prediksinya sendiri dalam sisa yang dihapus. Residu yang dihapus lebih jarang
perhitungannya.
apakah akan membakukan residu tersebut. Residu yang tidak terstandarisasi berada
dalam skala variabel terikat, yang berguna dalam interpretasi tetapi tidak
memberikan gambaran mengenai apa yang terlalu besar atau terlalu kecil untuk
skala umum dengan membagi setiap residu dengan simpangan baku residu. Setelah
standarisasi, residu memiliki rata-rata nol dan simpangan baku satu. Dengan ukuran
sampel yang cukup besar (50 atau lebih), residu terstandarisasi kira-kira mengikuti
distribusi t, sehingga residu yang melebihi ambang batas seperti 1,96 (nilai t kritis
pada tingkat kepercayaan 0,05) dapat dianggap signifikan secara statistik. Uji
signifikansi yang lebih ketat juga telah diusulkan, yang memperhitungkan beberapa
substansial berbeda dari observasi-observasi lainnya pada satu atau lebih variabel
independen. Kasus-kasus ini disebut titik pengaruh (leverage point) karena kasus-kasus
observasi lainnya. Ada dua ukuran yang umumnya digunakan untuk mengidentifikasi titik
Jarak Mahalanobis Ukuran yang sebanding dengan nilai topi adalah jarak
Mahalanobis (D2 ), yang hanya mempertimbangkan jarak observasi dari nilai rata-rata
variabel independen dan bukan dampaknya terhadap nilai prediksi. Jarak Mahalanobis
adalah cara lain untuk mengidentifikasi outlier. Tujuan ini terbatas karena nilai ambang
batas bergantung pada sejumlah faktor, dan nilai ambang batas aturan praktis tidak
mungkin dilakukan. Namun, signifikansi statistik jarak Mahalanobis dapat ditentukan dari
30
tabel yang dipublikasikan [8]. Namun bahkan tanpa tabel yang dipublikasikan, peneliti dapat
melihat nilai-nilai tersebut dan mengidentifikasi observasi apa pun yang nilainya jauh lebih
tinggi dibandingkan observasi lainnya. Misalnya, sekumpulan kecil pengamatan dengan nilai
Mahalanobis tertinggi yang dua hingga tiga kali nilai tertinggi berikutnya akan menyebabkan
perpecahan besar dalam distribusi dan indikasi lain mengenai kemungkinan pengaruh.
Sampai saat ini kami telah menemukan titik-titik terpencil pada variabel prediktor dan
kriteria namun belum secara formal memperkirakan pengaruh satu pengamatan terhadap
hasil. Pada langkah ketiga ini, semua metode mengandalkan proposisi umum: ukuran
pengaruh yang paling langsung melibatkan penghapusan satu atau lebih pengamatan dan
mengamati perubahan dalam hasil regresi dalam hal residu, koefisien individual, atau
Peneliti kemudian hanya perlu memeriksa nilai-nilai dan memilih pengamatan yang melebihi
nilai yang ditentukan. Kita telah membahas salah satu pengukuran tersebut, yaitu residu
yang dihapuskan secara pelajar, namun sekarang kita akan mengeksplorasi beberapa
terhadap kesesuaian model secara keseluruhan. Jarak Cook (Di ) dianggap sebagai ukuran
yang paling representatif. Ini menangkap dampak observasi dari dua sumber perubahan
nilai prediksi ketika kasus dihilangkan (outlying studentized residual) serta jarak observasi
dengan jarak Cook 1,0 atau lebih besar, meskipun ambang batas 4/1n 2 k 2 12 , di mana n
adalah ukuran sampel dan k adalah jumlah variabel independen, disarankan sebagai lebih
banyak ukuran konservatif dalam sampel kecil atau untuk digunakan dengan kumpulan data
yang lebih besar. Sekalipun tidak ada pengamatan yang melebihi ambang batas ini,
perhatian tambahan akan diberikan jika sekelompok kecil pengamatan memiliki nilai yang
terhadap efisiensi proses estimasi. Secara khusus, COVRATIO mewakili sejauh mana suatu
31
observasi berdampak pada kesalahan standar koefisien regresi. Hal ini berbeda dengan
DFBETA dan SDFBETA karena mempertimbangkan semua koefisien secara kolektif dan
bukan setiap koefisien secara individual. Ambang batas dapat ditetapkan pada 1 6 3p/n.
Nilai di atas ambang batas 1 1 3p/n membuat proses estimasi menjadi lebih efisien,
sedangkan nilai yang kurang dari 1 2 3p/n mengurangi efisiensi estimasi. Hal ini
memungkinkan COVRATIO untuk bertindak sebagai indikator observasi lain yang memiliki
pengaruh besar baik secara positif maupun negatif pada kumpulan koefisien.
Ukuran ketiga adalah SDFFIT, yaitu sejauh mana nilai yang dipasang berubah
ketika kasus dihapus. Nilai batas 2"1k 1 12/1n 2 k 2 12of telah disarankan untuk mendeteksi
pengaruh yang besar. Meskipun jarak Cook dan SDFFIT adalah ukuran kesesuaian secara
memungkinkan kami menentukan apakah pengaruh timbul dari residu, leverage, atau
dengan berbagai metode dibandingkan mengandalkan satu ukuran saja. Karena tidak ada
satu ukuran pun yang benar-benar mewakili semua dimensi pengaruh, maka hal ini
Koefisien regresi yang diperkirakan, disebut koefisien b, mewakili jenis hubungan (positif
atau negatif) dan kekuatan hubungan antara variabel independen dan dependen dalam
variabel regresi. Tanda koefisien menunjukkan hubungan positif atau negatif, dan nilai
koefisien menunjukkan perubahan nilai terikat setiap kali variabel bebas berubah sebesar
satu satuan.
32
Prediksi
Prediksi merupakan elemen integral dalam analisis regresi, baik dalam proses estimasi
maupun dalam situasi peramalan. Seperti yang dijelaskan di bagian pertama bab ini, regresi
melibatkan penggunaan variate (model regresi) untuk memperkirakan nilai tunggal untuk
variabel dependen. Proses ini digunakan tidak hanya untuk menghitung nilai prediksi dalam
prosedur estimasi, namun juga dengan sampel tambahan yang digunakan untuk validasi
tujuan.
MENILAI MULTIKOLLINEARITAS
Masalah utama dalam menafsirkan variasi regresi adalah korelasi antar variabel
independen. Masalah ini adalah masalah data, bukan spesifikasi model. Situasi ideal bagi
seorang peneliti adalah memiliki sejumlah variabel independen yang berkorelasi tinggi
tersebut. Namun dalam sebagian besar situasi, khususnya situasi yang melibatkan data
respons konsumen, multikolinieritas pada tingkat tertentu tidak dapat dihindari. Pada
beberapa kesempatan lain, seperti menggunakan variabel dummy untuk mewakili variabel
nonmetrik atau istilah poli nomial untuk efek nonlinier, peneliti menciptakan situasi
bagaimana hal ini dapat diukur. Korelasi Pearson yang biasa kita gunakan adalah
korelasi bivariat atau korelasi orde nol. Ini hanya mewakili hubungan antara dua
33
variabel, tidak memperhitungkan variasi yang dimiliki oleh variabel lain dan
Ada dua bentuk korelasi lain yang mencerminkan derajat variansi bersama dari
multikolinearitas. Pertama, korelasi bivariat atau nol antara X2 dan Y mencakup b (varian
unik) dan c (varian bersama) seperti yang telah kita bahas. Hal ini berbeda dengan korelasi
semi-parsial atau sebagian yang hanya memuat varian unik (b). Korelasi parsial juga hanya
mempunyai varian unik (b), namun berbeda karena penyebutnya bukan varian total Y,
Perbedaan ini penting, seperti yang akan dilihat nanti, bahwa korelasi semi-parsial
2
sedangkan korelasi parsial R digunakan dalam regresi bertahap untuk memilih variabel
Mengidentifikasi Multikolinearitas
Cara paling sederhana dan paling jelas untuk mengidentifikasi kolinearitas adalah
dengan menguji matriks korelasi untuk variabel independen. Kita dapat mencari variabel lain
yang berkorelasi tinggi dengan variabel independen tertentu, namun hal tersebut hanya
mencerminkan kolinearitas. Adanya korelasi yang tinggi (umumnya 0,70 dan lebih tinggi)
merupakan indikasi pertama adanya kolinearitas yang substansial. Namun, kurangnya nilai
disebabkan oleh pengaruh gabungan dari dua atau lebih variabel independen lainnya
(disebut multikolinearitas).
sejauh mana setiap variabel independen dapat dijelaskan oleh sekumpulan variabel
dependen dan diregresi terhadap variabel independen lainnya. Ada dua pendekatan yang
34
tersedia untuk menilai multikolinearitas. Pertama, ukuran keseluruhan (toleransi dan
variabel dapat mengidentifikasi kumpulan variabel tertentu yang mungkin menjadi asal
muasal multikolinieritas.
DEKOMPOSISI MULTIKOLLINEARITAS
variabel yang memiliki multikolinearitas tinggi [13]. Ada dua komponen yang
Indeks kondisi. Ini mewakili kolinearitas kombinasi variabel dalam kumpulan data.
untuk setiap regresi koefisien (dan variabel independen terkaitnya) yang dapat
multikolinearitas tinggi. Namun hal ini memberikan cara untuk mengidentifikasi kumpulan
variabel yang harus diperiksa lebih dekat jika terdapat kebutuhan untuk mengatasi
multikolinearitas.
bebas dalam variat regresi. Ketika multikolinearitas terjadi (bahkan pada tingkat yang relatif
rendah yaitu 0,30 atau lebih) proses untuk mengidentifikasi efek unik dari variabel
independen menjadi semakin sulit. Hal ini berdampak pada beberapa aspek penjelasan.
Interpretasi Koefisien Ingatlah bahwa koefisien regresi mewakili jumlah varian unik yang
35
porsi variansi bersama yang lebih besar dan tingkat varian unik yang lebih rendah, pengaruh
tinggi sehingga tidak ada satu pun koefisien regresi independen yang signifikan secara
statistik, namun model regresi secara keseluruhan memiliki tingkat akurasi prediksi yang
signifikan. Kita akan membahas ukuran-ukuran yang relatif penting di bagian selanjutnya
yang menggambarkan varian unik dan varian bersama dari suatu variabel independen.
Ada situasi di mana tingkat multikolinearitas yang tinggi mungkin diharapkan dan
karenanya diabaikan. Yang paling umum adalah ketika istilah interaksi dimasukkan dalam
analisis (misalnya, efek moderasi). Karena suku interaksi merupakan hasil perkalian dua
variabel lain dalam persamaan, maka diharapkan terjadi multikolinearitas. Demikian pula,
ketika polinomial dimasukkan untuk mewakili efek non-linear dari variabel, maka akan terjadi
multikolinearitas yang tinggi. Inilah sebabnya mengapa berkali-kali uji signifikansi untuk
interaksi atau suku polinomial dilakukan melalui uji signifikansi tambahan yang sesuai.
Selain itu, mungkin terdapat multikolinearitas di antara variabel dummy yang digunakan
untuk mewakili variabel nonmetrik. Terakhir, jika ada variabel yang dimasukkan sebagai
variabel kontrol, maka tidak perlu dilakukan interpretasi dan dapat menunjukkan
Setiap peneliti harus menentukan derajat kolinearitas yang dapat diterima, karena
sebagian besar standar atau ambang batas yang direkomendasikan masih memungkinkan
KORELASI BIVARIAT
Saat menilai korelasi bivariat, ada dua hal yang harus dipertimbangkan. Pertama,
korelasi sebesar 0,70 (yang mewakili varian “bersama” sebesar 50%) dapat berdampak
pada penjelasan dan estimasi hasil regresi. Selain itu, bahkan korelasi yang lebih rendah
pun dapat berdampak jika korelasi antara dua variabel independen lebih besar daripada
36
korelasi variabel independen dengan ukuran dependen (misalnya, situasi pada contoh
pembalikan tanda sebelumnya). Pola-pola ini harus diperiksa untuk setiap variabel dengan
dua atau tiga korelasi tertinggi, terutama jika variabel tersebut melibatkan korelasi dengan
Batas yang disarankan untuk nilai toleransi adalah 0,10 (atau VIF terkait sebesar
10,0), yang berkorelasi dengan korelasi berganda sebesar 0,95 dengan variabel independen
lainnya. Ketika nilai-nilai pada tingkat ini ditemui, masalah multikolinearitas sangat mungkin
terjadi. Namun, permasalahannya kemungkinan besar juga terjadi pada tingkat yang lebih
rendah [88]. Misalnya, VIF sebesar 5,3 berarti korelasi berganda sebesar 0,9 antara satu
variabel independen dan semua variabel independen lainnya. Bahkan VIP sebesar 3,0
mewakili korelasi berganda sebesar 0,82, yang akan dianggap tinggi jika antara variabel
Seperti yang telah kita lihat pada pembahasan sebelumnya, adanya multikolinearitas
independen terhadap ukuran dependen. Sesuatu yang sederhana seperti korelasi bivariat
estimasi koefisien regresi juga dapat menimbulkan komplikasi. Untuk mencapai tujuan ini
serangkaian tindakan baru yang relat telah dikembangkan untuk memberikan penilaian
penjelasan varians yang dimiliki bersama dan unik serta dalam ukuran yang sebanding di
variabel independen mana yang berkontribusi paling besar terhadap model regresi dengan
Pembahasan berikut ini pertama-tama akan mengulas ukuran langsung yang tersedia
mengenai kepentingan variabel yang tersedia dari hasil regresi dan korelasi yang digunakan
dalam proses estimasi. Kemudian serangkaian ukuran relatif penting akan dibahas yang
37
memperluas hasil dasar regresi dengan melakukan serangkaian model regresi atau
Para peneliti telah lama mengandalkan hasil regresi dan ukuran korelasi untuk
KORELASI BIVARIAT
Ukuran dampak suatu variabel yang pertama dan paling mendasar adalah korelasi
bivariat dengan variabel dependen. Ini mewakili hubungan mendasar dari analisis regresi
dan karenanya harus selalu dipertimbangkan. Dalam beberapa hal, ini mewakili informasi
paling mendasar tentang hubungan yang digunakan dalam analisis regresi dan dengan
demikian memberikan titik awal untuk memahami dampak suatu variabel. Namun hal ini
terbatas, seperti yang telah kita lihat dalam diskusi sebelumnya dengan adanya
multikolinearitas.
Ukuran kepentingan relatif yang dibahas di bawah ini memberikan perspektif yang
berbeda mengenai
(a) dampak unik dan bersama dari suatu variabel independen terhadap ukuran-ukuran
dependen, sementara (b) menyatakan dampak-dampak ini sedemikian rupa sehingga dapat
KOEFISIEN STRUKTUR
nilai prediksinya, bukan variabel dependen seperti yang terlihat pada matriks korelasi input
[32]. Dengan demikian, nilai tersebut merupakan ukuran kontribusi relatif terhadap nilai
prediksi. Mereka tidak membuat perbedaan apa pun antara varian unik dan varian bersama,
seperti halnya korelasi bivariat dengan variabel terikat. Namun hubungannya dengan nilai
prediksi membuatnya cukup berguna jika dibandingkan dengan bobot regresi. Variabel
dengan bobot regresi kecil namun koefisien struktur kuadratnya besar mempunyai efek
38
prediksi bersama yang tinggi, namun efek uniknya kecil. Dalam situasi yang berlawanan,
bobot regresi yang besar tetapi koefisien struktur yang kecil menunjukkan variabel yang
ANALISIS DOMINASI
Metode analisis dominasi juga didasarkan pada semua subset regresi yang
mungkin, namun memberikan perbandingan yang berbeda antar variabel independen [23,
24]. Ukuran dasar dampak adalah rata-rata kuadrat korelasi semi-parsial di seluruh model
regresi yang memasukkan variabel tersebut. Juga disediakan dua ukuran dominasi antara
masing-masing pasangan variabel: (a) dominasi lengkap adalah ketika satu variabel selalu
memiliki korelasi semi-parsial kuadrat yang lebih besar, tidak peduli variabel apa pun yang
ada dalam model, (b) dominasi bersyarat adalah ketika salah satu variabel berada dalam
model. variabel melebihi yang lain dalam beberapa spesifikasi model, tetapi sebaliknya
dalam spesifikasi model lainnya. Ukuran ketiga dari dominasi umum hanya berfokus pada
bahwa model tersebut mewakili populasi umum (gener alizability) dan sesuai dengan situasi
di mana model tersebut akan digunakan (transferability). Pedoman terbaik adalah sejauh
mana model regresi cocok dengan model teoritis yang ada atau serangkaian hasil yang
telah divalidasi sebelumnya pada topik yang sama. Namun dalam banyak kasus, hasil atau
teori sebelumnya tidak tersedia. Oleh karena itu, kami juga membahas pendekatan empiris
Pendekatan validasi empiris yang paling tepat adalah dengan menguji model regresi
pada sampel baru yang diambil dari populasi umum. Sampel baru akan memastikan
keterwakilan dan dapat digunakan dalam beberapa cara. Pertama, model asli dapat
memprediksi nilai dalam sampel baru dan kecocokan prediktif dapat dihitung. Kedua, model
terpisah dapat diestimasi dengan sampel baru dan kemudian dibandingkan dengan
39
persamaan asli mengenai karakteristik seperti variabel signifikan yang dimasukkan; tanda,
ukuran, dan kepentingan relatif suatu variabel; dan akurasi prediksi. Dalam kedua kasus
Seringkali kemampuan untuk mengumpulkan data baru dibatasi atau dihalangi oleh
faktor-faktor seperti biaya, tekanan waktu, atau ketersediaan responden. Kemudian, peneliti
dapat membagi sampel menjadi dua bagian: subsampel estimasi untuk membuat model
regresi dan subsampel ketidaksepakatan atau validasi yang digunakan untuk menguji
persamaan. Banyak prosedur, baik acak maupun sistematis, tersedia untuk memisahkan
data, masing-masing mengambil dua sampel independen dari satu dataset. Semua paket
statistik populer menyertakan opsi khusus untuk memungkinkan estimasi dan validasi pada
subsampel terpisah.
adalah dengan menggunakan sampel asli secara khusus dengan menghitung statistik
PRESS (Prediction Sum of Squares), suatu ukuran yang mirip dengan R digunakan untuk
menilai keakuratan prediksi model regresi yang diperkirakan. Hal ini berbeda dari
pendekatan sebelumnya karena tidak hanya satu, tetapi n 2 1 model regresi diestimasi
dengan prosedur yang mirip dengan pendekatan validasi jackknife. Prosedur tersebut
menghilangkan satu observasi dalam estimasi model regresi dan kemudian memprediksi
observasi yang dihilangkan dengan model estimasi. Dengan demikian, observasi tidak dapat
baru, dan membuat prediksi. Residual untuk pengamatan “tahan” kemudian dapat
dibandingkan dengan model asli untuk menilai peningkatan jumlah kuadrat residu karena
prosedur validasi.
40
Perkiraan selalu dapat dibuat dengan menerapkan model estimasi pada sekumpulan
nilai variabel independen baru dan menghitung nilai variabel dependen. Namun, dalam
Saat menerapkan model pada sampel baru, kita harus ingat bahwa prediksi kini tidak
hanya mencakup variasi pengambilan sampel dari sampel asli, namun juga variasi
sampel yang baru diambil. Oleh karena itu, kita harus selalu menghitung interval
kepercayaan dari prediksi kita selain estimasi titik untuk melihat kisaran nilai variabel
Kita harus memastikan bahwa kondisi dan hubungan yang diukur pada saat
Misalnya, dalam contoh kartu kredit kita, jika sebagian besar perusahaan mulai
membebankan biaya yang lebih tinggi untuk kartu mereka, kepemilikan kartu kredit
sebenarnya mungkin akan berubah secara substansial, namun informasi ini tidak
independen yang ditemukan dalam sampel. Misalnya, dalam contoh kartu kredit kita,
memprediksi kepemilikan kartu kredit untuk keluarga dengan 10 anggota. Kita tidak
independen yang jauh lebih besar atau lebih kecil dibandingkan dengan nilai dalam
analitik, baik akademis maupun organisasi, telah melahirkan beragam varian untuk
mengatasi berbagai masalah, banyak di antaranya telah dibahas. Di antara yang paling
banyak digunakan adalah sebagai berikut: regresi kuat untuk menangani outlier tanpa
41
penghapusannya, regresi kuantil di mana variabel terikat dibagi menjadi beberapa
mana batasan ditempatkan pada rentang atau bahkan arah param estimasi eter, regresi
dengan data hasil yang disensor atau terpotong (mirip dengan analisis kelangsungan hidup),
regresi dengan koreksi kesalahan pengukuran dan beberapa model regresi persamaan
berganda lainnya regresi yang tampaknya tidak berhubungan dan regresi multivariat. Bab ini
tidak membahas semua metode ini, namun peneliti harus menyadari bahwa ada beragam
model berbasis regresi untuk menangani berbagai pertanyaan penelitian yang berbeda.
MODEL MULTILEVEL
Munculnya model multilevel di berbagai disiplin ilmu telah mengakui bahwa efek
multilevel atau hierarki (1) mengembangkan kerangka teoritis yang lebih sesuai untuk
banyak situasi aktual di mana model tersebut dipelajari, serta (2) memberikan kerangka
terpadu untuk mengatasi permasalahan yang ada. banyak masalah statistik yang terjadi
secara alami ketika ada struktur data hierarki. Selain itu, perangkat lunak dan sumber daya
untuk pemodelan bertingkat telah berkembang hingga setiap peneliti harus memasukkan
data hierarki yang dihasilkan, tingkat efek dalam model hierarki dan penggunaannya secara
luas di seluruh disiplin ilmu dan sumber daya dasar yang tersedia. Bagian selanjutnya
pengukuran dengan level, korelasi intrakelas, efek acak versus tetap, pertimbangan ukuran
sampel, sedangkan bagian terakhir menjelaskan strategi pemodelan lima tahap untuk
42
persamaan regresi tunggal yang dikumpulkan di seluruh wilayah, meskipun variabel-variabel
tersebut diukur pada tingkat yang berbeda dan dengan demikian nilai tunggal suatu wilayah
digunakan untuk semua individu dalam wilayah tersebut. Kedua tindakan ini melanggar
prinsip dasar regresi berganda, namun merupakan satu-satunya tindakan pada saat itu.
Pendekatan Model Multilevel Model multilevel mendekati masalah dengan cara yang agak
lebih kompleks, namun pada dasarnya sederhana—persamaan terpisah untuk setiap level
yang kemudian digabungkan. Persamaan Level-1 sama seperti model regresi dasar kami
MANFAAT MLM
Manfaat MLM bersifat metodologis dan konseptual [58]. Dari sudut pandang
observasi yang diperkenalkan oleh struktur data bertingkat. Ketergantungan ini menciptakan
[107]. Hal ini terutama menjadi masalah untuk variabel tingkat tinggi yang berkali- kali lipat
menjadi variabel kunci yang menjadi perhatian [77]. Kedua, ukuran sampel efektif yang
sebaiknya digunakan lebih kecil dibandingkan sampel keseluruhan karena struktur data
yang disarangkan [112]. Hal ini berdampak pada estimasi kekuatan statistik dan melebih-
permasalahan ini, MLM dapat secara langsung menggabungkan data pengukuran berulang
serta diterapkan langsung pada rencana pengambilan sampel bertingkat yang lebih rumit
berbagai tingkat model konseptual sambil tetap mempertahankan sifat hierarki dari efeknya.
Banyak model konseptual yang diteorikan dalam struktur hierarki (misalnya, hasil
43
pendidikan, perilaku organisasi, kelompok sosial dan politik, dll.). MLM menyediakan metode
yang “mempertahankan” pengaruh tingkat terhadap hubungan dalam tingkat tersebut (yaitu,
variabel independen dalam persamaan tingkat hanyalah variabel yang diukur pada tingkat
tersebut). Hal ini juga memungkinkan adanya pembagian dampak ke berbagai tingkat yang
sebelumnya tidak tersedia. Terakhir, seperti yang akan dibahas pada bagian efek tetap
versus efek acak, penggunaan efek acak memungkinkan terjadinya generalisasi dampak
Salah satu manfaat paling positif dari pengembangan multi-disiplin MLM adalah
keragaman perangkat lunak yang tersedia. Software pertama yang banyak digunakan untuk
MLM adalah HLM yang masih banyak digunakan hingga saat ini [93]. Perkembangan yang
lebih baru adalah MLwiN [26] dan modul bertingkat tersedia di banyak program statistik
(Stata, MPLUS) atau melalui metode statistik dasar (misalnya, model MIXED di IBM SPSS
dan SAS).
Selain kemampuan ketersediaan perangkat lunak, ada beberapa teks bagus dengan
penjelasan lebih rinci tentang MLM dari berbagai sudut pandang [62, 45, 47, 108, 6] serta
teks yang berorientasi pada perangkat lunak tertentu – IBM SPSS [58], SAS [ 12 Stata [91]
dan R [42].
MODEL PANEL
Dalam kerangka analisis yang agak mirip dengan model bertingkat, model panel atau
analisis panel adalah teknik analisis berbasis regresi yang dirancang untuk menangani
analisis cross-sectional dari data longitudinal atau data deret waktu. Dalam perspektif cross-
independen yang terkait dengan variabel hasil. Analisisnya bisa menganalisis individu,
perusahaan, merek, sekolah, negara atau unit analisis lainnya, dan faktor apa saja yang
44
mempengaruhi hasilnya. Namun elemen unik dari model panel adalah bahwa model
tersebut juga mengakomodasi data longitudinal baik untuk variabel dependen maupun
independen. Jadi, daripada harus melakukan analisis terpisah setiap tahunnya atau
menggabungkan data-data tersebut dari tahun ke tahun dengan cara tertentu, model panel
dirancang untuk memenuhi karakteristik yang diperlukan dari jenis data ini.
individu, perusahaan, sekolah, dll.) membentuk suatu kelompok (yaitu, Tingkat-2), dengan
data longitudinal untuk unit analisis tersebut berupa observasi dalam kelompok tersebut
(yaitu, Tingkat -1). Dalam model bertingkat kami memperhatikan ketergantungan dalam
grup. Dengan data longitudinal kita mengetahui bahwa kita mempunyai beberapa pola
korelasi serial yang harus diperhitungkan. Model panel akan menggunakan banyak konsep
yang sama, khususnya efek tetap versus efek acak, untuk menganalisis bentuk data
dalam satu kerangka kerja memiliki beberapa keunggulan dibandingkan metode lainnya.
Pertama, dengan menggunakan estimasi efek tetap untuk suatu efek, permasalahan
variabel yang dihilangkan (endogenitas) diperhitungkan. Dengan melakukan hal ini, model
efek tetap dan acak memungkinkan kontrol yang tepat atas variasi karena heterogenitas
Model Panel Latar Belakang memberikan alternatif terhadap sejumlah teknik analisis
lain yang ditujukan untuk data jangka panjang. Pendekatan pertama adalah model cross-
45
sectional yang diulang-ulang, yang mengalami ketidakmampuan untuk “menghubungkan”
analisis selama bertahun-tahun yang kita bahas di bagian model multilevel. Pendekatan
kedua adalah model sejarah peristiwa, yang mencakup teknik-teknik seperti analisis
kelangsungan hidup, analisis waktu kegagalan, dan model bahaya atau risiko.
Jenis model ini cukup dapat diterapkan pada proses tertentu (misalnya
kelangsungan hidup) dan metode yang muncul memfasilitasi masuknya lebih banyak
kovariat (yaitu variabel independen). Namun model-model ini masih memiliki kelemahan
karena terbatasnya variasi yang dapat diakomodasi dan mengakibatkan fokus pada prediksi
Metode alternatif ketiga adalah analisis deret waktu, yang paling baik dicirikan sebagai
beberapa variabel, banyak periode waktu. Ia memiliki keunggulan unik dalam prosedur
analitis ekstensif untuk estimasi dan prediksi serta wawasan terperinci mengenai pola
sepanjang waktu.
Permasalahan Dasar
Beberapa permasalahan mendasar yang terlibat dalam model panel dan memaparkan
kepada pembaca jenis permasalahan yang harus ditangani dalam metode ini. Pada bagian
di bawah ini kita akan membahas jenis-jenis variabel yang dapat dimasukkan ke dalam
model panel, jenis-jenis model yang dapat diestimasi dengan menggabungkan efek-efek
tetap dan acak, beberapa pertanyaan dasar ketika memilih efek-efek tetap versus acak dan
JENIS VARIABEL
Ada empat tipe dasar variabel yang dapat digunakan dalam model panel. Yang
pertama adalah variabel yang berbeda antar unit analisis, namun tidak berubah seiring
berjalannya waktu (misalnya ras dan gender, jenis perusahaan atau tingkat sekolah). Jenis
variabel kedua dapat berubah seiring berjalannya waktu, namun sama untuk semua unit
46
REFERENCES
Aguinis H., JC Beaty, RJ Boik, dan CA Pierce. 2005. Ukuran Efek dan Kekuatan dalam
Aguinis, H., RK Gottfredson, dan H. Joo. 2013. Rekomendasi Praktik Terbaik untuk
Akaike, H. 1974. Pandangan Baru pada Model Statistik Identifikasi. Transaksi IEEE pada
Alkharusi, H. 2012. Variabel Kategorikal dalam Analisis Regresi: Perbandingan Dummy dan
Banerjee, S., BP Carlin, dan AE Gelfan. 2014. Pemodelan dan Analisis Hirarki untuk Data
Barcikowski, RS 1981. Kekuatan Statistik dengan Mean Grup sebagai Unit Analisis. Jurnal
Barnett, V., dan T. Lewis. 1994. Pencilan dalam Data Statistik, edisi ke-3. New York: Wiley.
Beck, Natanael. 2001. Data Rangkaian Waktu–Penampang: Apa yang Telah Kita Pelajari
iii
Beckstead, JW 2012. Mengisolasi dan Mengkaji Sumber Supresi dan Multikolinearitas pada
Bell, A., dan K. Jones. 2015. Penjelasan Fixed Effect: Pemodelan Random Effects dari Data
Time-Series Cross- Sectional dan Panel. Penelitian dan Metode Ilmu Politik 3:133–53.
Belsley, DA, E. Kuh, dan E. Welsch. 1980. Diagnostik Regresi: Mengidentifikasi Data yang
Blalock, HM 1984. Model Efek Kontekstual: Masalah Teoritis dan Metodologis. Review
Bliese, PD, dan PJ Hanges. 2004. Menjadi Terlalu Liberal dan Terlalu Konservatif: Bahaya
Organisasi 7: 400–17.
BMDP Statistical Software, Inc. 1991. SOLO Power Anal ysis.Los Angeles: BMDP.
Merek Bollen, KA, dan JE. 2010. Model Panel Umum dengan Efek Acak dan Tetap:
Kotak, GEP, dan DR Cox. 1964. Analisis Transformasi. Jurnal Royal Statistical Society B 26:
211–43.
Boyd, LH, dan GR Iversen. 1979. Analisis Kontekstual: Konsep dan Teknik Statistik.
iv
Bryk, AS, dan SW Raudenbush. 1988. Menuju Konseptualisasi Penelitian Pengaruh Sekolah
yang Lebih Tepat: Model Linier Hirarki Tiga Tingkat. Jurnal Pendidikan Amerika 97: 65–
108.
Bryk, AS, dan SW Raudenbush. 1989. Metodologi Penelitian Organisasi Lintas Tingkat.
Dalam SB Bacha rach (ed.), Penelitian Sosiologi Organisasi, Vol. 1, Greenwich, CT:
Bryk, AS, dan SW Raudenbush. 1992. Model Linier Hirarki. Taman Newbury, CA: Sage.
Budescu DV, dan R.Azen. 2004. Melampaui Ukuran Global yang Pentingnya Relatif:
Charlton, C., J. Rasbash, WJ Browne, M. Healy, dan B. Cameron. 2017.MLwiN Versi 3.00.
Clark, TS, dan DA Linzer. 2015. Haruskah Saya Menggunakan Efek Tetap atau Acak?