Y = 30 + 4INC1 + .004INC2
Dimana:
INC1 = penghasilan tahunan suami (in $1,000s)
INC2 = penghasilan tahunan istri (in dollars)
Jika kita mengetahui bahwa INC1 dan INC2 adalah pendapatan tahunan kedua pasangan,
maka kita mungkin akan menyimpulkan bahwa pendapatan suami jauh lebih penting
daripada pendapatan istri. Jika kita memprediksikan dolar restoran yang hanya untuk
pendapatan istri, itu akan menjadi $160 , yang akan sama persis dengan pendapatan
suami sebesar $40.000 . Dengan demikian, pendapatan masing-masing pasangan sama
pentingnya, tetapi interpretasi ini mungkin tidak akan terjadi hanya melalui pemeriksaan
koefisien regresi. Untuk menggunakan koefisien regresi untuk tujuan penjelasan, pertama-
tama kita harus memastikan bahwa semua variabel independen berada pada skala yang
sebanding.
Menilai Multikolinearitas
Isu kunci dalam menafsirkan variat regresi adalah korelasi antara variabel independen. Namun dalam kebanyakan
situasi, khususnya situasi yang melibatkan data respon konsumen, beberapa derajat multikolinearitas tidak dapat
dihindari. Pada beberapa kesempatan lain, seperti menggunakan variabel dummy untuk mewakili variabel nonmetrik
atau istilah polinomial untuk efek nonlinier, peneliti menciptakan situasi multikolinearitas tinggi. Tugas peneliti meliputi
hal-hal berikut:
a. Kaji derajat multikolinearitas.
b. Tentukan dampaknya terhadap hasil
c. Terapkan pengobatan yang diperlukan jika diperlukan
MENGIDENTIFIKASI MULTIKOLINIERITAS Cara paling sederhana dan paling jelas untuk mengidentifikasi
kolinearitas adalah pemeriksaan matriks korelasi untuk variabel independen. Collinearity mungkin karena efek
gabungan dari dua atau lebih variabel independen lainnya.
Untuk menilai multikolinearitas, kita memerlukan ukuran yang menyatakan sejauh mana setiap variabel bebas dijelaskan
oleh himpunan variabel bebas lainnya. Dua ukuran paling umum untuk menilai kolinearitas variabel berpasangan dan
ganda adalah toleransi dan kebalikannya, faktor inflasi varians. Jadi, untuk setiap model regresi dengan dua atau lebih
variabel independen, toleransi dapa secara sederhana diidentifikasikan dalam dua langkah:
Ambil setiap variabel independen, satu per satu, dan hitung R2 – jumlah variabell independen yang dijelaskan oleh
semua variabel independen lainnya dalam model regresi. Dalam proses ini, variabel bebas yang terpilih dijadikan
variabel terikat yang diprediksi oleh semua variabel bebas lainnya yang tersisa.
Toleransi kemudian dihitung sebagai 1-R2. Misalnya, jika variabel bebas lainnya menjelaskan 25% variabel bebas X1
(R2 = 0,25), maka nilai toleransi X1 adalah 75 (1,0 – 0,25 = 0,75)
Ukuran kedua dari multikolinearitas adalah faktor inflasi varians , yang dihitung secara sederhana sebagai kebalikan
dari nilai toleransi. Dalam contoh sebelumnya dengan toleransi . Mari kita periksa beberapa contoh untuk
menggambarkan keterkaitan toleransi, VIF, dan dampaknya terhadap kesalahan standar.
Misalnya, jika VIF sama dengan 1,0 (artinya toleransi sama dengan 1,0 dan dengan demikian tidak ada
multikolinieritas), maka kesalahan standard an tidak terpengaruh. Namun, asumsikan bahwa 1VIF = 1,0 toleransi
sebesar 0,5 (artinya terdapat multikoliearitas yang cukup tinggi, karena 75% variansi variabel dijelaskan oleh variabel
bebas lainnya). Dalam hal ii VIF adalah 4.0 (1,0 : 0,25 = 4) dan standard error menjadi dua kali lipat karena
multikolinearitas.
A. Pertama, kasus ekstrim multikolinearitas di mana dua atau lebih variabel berkorelasi sempurna,
disebut singularitas, mencegah estimasi koefisien apa pun. Kesalahan umum adalah memasukkan
semua variabel dummy yang digunakan untuk mewakili variabel nonmetrik, daripada menghilangkan
satu sebagai kategori referensi. Untuk alasan apapun, bagaimanapun, singularitas harus dihilangkan
sebelum estimasi koefisien dapat dilanjutkan.
B. Ketika multikolinearitas meningkat, kemampuan untuk menunjukkan bahwa estimasi koefisien
regresi berbeda secara signifikan dari nol dapat menjadi sangat terpengaruh karena peningkatan
kesalahan standar seperti yang ditunjukkan pada nilai VIF. Masalah ini menjadi sangat bermasalah
pada ukuran sampel yang lebih kecil, di mana kesalahan standar umumnya lebih besar karena
kesalahan pengambilan sampel.
C. Selain mempengaruhi uji statistik dari koefisien atau model keseluruhan, derajat multikolinearitas
yang tinggi juga dapat mengakibatkan koefisien regresi diestimasi secara tidak benar dan bahkan
memiliki tanda yang salah. Dua contoh menggambarkan hal ini
Contoh pertama kami (lihat tabel 6) mengilustrasikan situasi tanda pembalikan karena korelasi negatif
yang tinggi antara dua variabel. Persamaan regresi berganda, bagaimanapun, tidak mempertahankan
hubungan dari regresi sederhana. Tanda koefisien regresi V1 salah dalam pengertian intuitif, tetapi
korelasi negatif yang kuat antara V1 dan V2 menghasilkan pembalikan tanda untuk V1.
PERBAIKAN UNTUK MULTIKOLINIERITASSetelah derajat kolinearitas
telah ditentukan, peneliti memiliki sejumlah pilihan:
a. Hilangkan satu atau lebih variabel independen yang berkorelasi tinggi dan
identifikasi variabel independen lainnya untuk membantu prediksi. Namun,
peneliti harus berhati-hati saat mengikuti opsi ini, untuk menghindari kesalahan
spesifikasi saat menghapus satu atau lebih variabel independen.
b. Gunakan model dengan variabel independen yang berkorelasi tinggi hanya
untuk prediksi (yaitu, jangan mencoba menafsirkan koefisien regresi), sambil
mengakui tingkat kemampuan prediksi keseluruhan yang lebih rendah.
c. Gunakan korelasi sederhana antara masing-masing variabel independen dan
variabel dependen untuk memahami hubungan variabel independen-dependen.
d. Gunakan metode analisis yang lebih canggih seperti regresi Bayesian (atau
kasus khusus—regresi ridge) atau regresi pada komponen utama untuk
mendapatkan model yang lebih jelas mencerminkan efek sederhana dari
variabel independen. Prosedur ini dibahas secara lebih rinci dalam beberapa
teks
STAGE 6 VALIDASI HASIL
Sampel Tambahan atau Terpisah Pendekatan validasi empiris yang paling tepat adalah dengan
menguji model regresi pada sampel baru yang diambil dari populasi umum. Dalam kedua kasus,
peneliti menentukan validitas model asli dengan membandingkannya dengan model regresi yang
diestimasi dengan sampel baru. Sering kali kemampuan untuk mengumpulkan data baru dibatasi atau
dihalangi oleh faktor-faktor seperti biaya, tekanan waktu, atau ketersediaan responden. Semua paket
statistik populer menyertakan opsi khusus untuk memungkinkan estimasi dan validasi pada subsampel
terpisah.
Menghitung Statistik PRESS Sebuah pendekatan alternatif Prosedur menghilangkan satu observasi
dalam estimasi model regresi dan kemudian memprediksi observasi yang dihilangkan dengan model
estimasi. Dengan demikian, pengamatan tidak dapat mempengaruhi koefisien model yang digunakan
untuk menghitung nilai prediksinya. Prosedur diterapkan lagi, menghilangkan pengamatan lain,
memperkirakan model baru, dan membuat prediksi.
Membandingkan Model Regresi Saat membandingkan model regresi, standar yang paling umum
digunakan adalah kecocokan prediktif keseluruhan. Jadi, dengan memasukkan semua variabel bebas,
kita tidak akan pernah menemukan model lain dengan R2 yang lebih tinggi, tetapi kita mungkin
menemukan bahwa jumlah variabel bebas yang lebih sedikit menghasilkan nilai yang hampir sama. R2
yang disesuaikan juga berguna dalam membandingkan model antara kumpulan data yang berbeda,
karena akan mengimbangi ukuran sampel yang berbeda.
Peramalan Dengan Model Saat menerapkan model ke sampel baru, kita harus ingat bahwa prediksi
sekarang tidak hanya memiliki variasi pengambilan sampel dari sampel asli, tetapi juga sampel yang
baru diambil. Dengan demikian, kita harus selalu menghitung interval kepercayaan dari prediksi kita
di samping estimasi titik untuk melihat rentang nilai variabel dependen yang diharapkan. Akhirnya,
kita tidak boleh menggunakan model untuk memperkirakan di luar jangkauan variabel independen
yang ditemukan dalam sampel. Seseorang tidak dapat berasumsi bahwa hubungannya adalah sama
untuk nilai-nilai variabel independen yang secara substansial lebih besar atau lebih kecil daripada
Ilustrasi Analisis Regresi Pertimbangkan pengaturan penelitian di mana HBAT
telah memperoleh sejumlah ukuran dalam survei pelanggan. Manajemen HBAT
telah lama tertarik untuk memprediksi tingkat kepuasan pelanggannya secara
lebih akurat. Untuk tujuan ini, para peneliti di HBAT mengusulkan bahwa
analisis regresi berganda harus dicoba untuk memprediksi kepuasan pelanggan
berdasarkan persepsi mereka tentang kinerja HBAT. Untuk menerapkan
prosedur regresi, peneliti memilih kepuasan pelanggan sebagai variabel
dependen yang diprediksi oleh variabel independen yang mewakili persepsi
kinerja HBAT.
Sekarang kita dapat bertanya «Apakah prediktor lain tersedia?» Untuk menjawab pertanyaan ini, kita
dapat melihat pada Tabel 9 di bawah bagian «Variabel yang Tidak Dimasukkan ke dalam Model
Regresi». Melihat korelasi parsial untuk variabel yang tidak ada dalam persamaan pada Tabel 9, kita
melihat bahwa X12 memiliki korelasi parsial tertinggi.
Dari hasil tersebut, kita akan melihat bahwa ketiga variabel yang sekarang dalam persamaan tersebut masing-masing
merupakan anggota dari faktor yang berbeda dalam analisis tersebut. Karena variabel dalam faktor yang sama
menunjukkan derajat multikolinearitas yang tinggi, maka diharapkan ketika satu variabel dari suatu faktor memasuki
persamaan regresi, peluang variabel lain dari faktor yang sama memasuki persamaan agak rendah.
Dengan persamaan ini, tingkat kepuasan pelanggan yang diharapkan untuk setiap pelanggan dapat
dihitung jika evaluasi pelanggan terhadap HBAT diketahui. Sebagai ilustrasi, mari kita asumsikan
bahwa pelanggan menilai HBAT dengan nilai 6,0 untuk masing-masing dari lima ukuran ini. Tingkat
kepuasan pelanggan yang diprediksi untuk pelanggan itu adalah
Semua variabel kecuali satu memiliki koefisien positif. Semua variabel lain memiliki koefisien positif,
yang berarti bahwa persepsi yang lebih positif terhadap HBAT meningkatkan kepuasan
pelanggan. Dalam hal ini, korelasi bivariat antara X7 dan kepuasan pelanggan adalah positif,
menunjukkan bahwa jika dipertimbangkan secara terpisah, X7 memiliki hubungan positif dengan
kepuasan pelanggan, sama seperti variabel lainnya. Kami akan membahas di bagian berikut dampak
multikolinearitas pada pembalikan tanda untuk koefisien yang diestimasi.
Dalam pendekatan konfirmasi, tiga variabel memiliki nilai Tabel 15 memuat hasil penambahan X3 pada model stepwise,
toleransi di bawah . Dalam situasi seperti itu, hampir tidak dimana ditambah dengan lima variabel yang membentuk model
mungkin variabel-variabel ini menjadi prediktor stepwise tadi pada bagian ini. Ketika kita memeriksa koefisien
signifikan. Enam variabel lainnya memiliki nilai toleransi di regresi, perhatikan bahwa koefisien untuk X3 adalah . Nilai
bawah. 50, menunjukkan bahwa variabel model regresi koefisien yang positif menunjukkan bahwa perusahaan besar,
menyumbang lebih dari setengah varians dalam variabel- mengingat karakteristik mereka pada lima variabel independen
variabel ini. lainnya dalam persamaan, masih memiliki tingkat kepuasan
Dengan demikian, masuknya semua variabel menciptakan pelanggan sekitar seperempat poin lebih tinggi pada pertanyaan
masalah dalam estimasi dan interpretasi. kepuasan pelanggan 10 poin. Contoh ini mengilustrasikan cara
peneliti dapat menambahkan variabel nonmetrik ke variabel metrik
dalam varian regresi dan meningkatkan prediksi dan penjelasan.
Tinjauan Manajerial Hasil
Perusahaan yang lebih besar memiliki tingkat kepuasan sekitar seperempat poin lebih tinggi daripada
perusahaan yang lebih kecil. Hasil ini memberikan manajemen dengan kerangka kerja untuk
mengembangkan strategi untuk meningkatkan kepuasan pelanggan. Tindakan yang diarahkan untuk
meningkatkan persepsi HBAT dapat dibenarkan mengingat peningkatan yang sesuai dalam kepuasan
pelanggan. Dampak dari dua variabel lain terhadap kepuasan pelanggan kurang pasti.
Meskipun kedua variabel ini termasuk dalam solusi bertahap, varians yang dijelaskan gabungannya
hanya . Kedua variabel tidak signifikan dalam model konfirmasi. Untuk menyatakan bahwa hanya tiga
variabel spesifik ini yang mempengaruhi kepuasan pelanggan akan menjadi salah saji yang serius dari
pola kolinearitas antar variabel yang lebih kompleks. Dengan demikian, variabel-variabel ini lebih
baik dipandang sebagai perwakilan dari dimensi persepsi, dengan variabel lain di setiap dimensi juga
dipertimbangkan dalam setiap kesimpulan yang diambil dari hasil ini.
Manajemen sekarang memiliki analisis objektif yang menegaskan tidak hanya pengaruh spesifik dari
variabel kunci, tetapi juga dimensi persepsi yang harus dipertimbangkan dalam segala bentuk
perencanaan bisnis mengenai strategi yang ditujukan untuk mempengaruhi kepuasan pelanggan.
Sekian dan Terima Kasih