Anda di halaman 1dari 20

TUGAS UJIAN TENGAH SEMESTER

STATISTIK DAN MULTIVARIATE


“ANALISIS REGRESI BERGANDA”

KELOMPOK 7

SRI NOVIANTI LATIANG 186020300111037


WARDATUL JANNAH 196020300111007
MARCHELYN PONGSAPAN 196020300111019

PROGRAM PASCASARJANA MAGISTER ILMU AKUNTANSI


FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS BRAWIJAYA
2020
Analisis Regresi Berganda

Analisis regresi berganda digunakan untuk menyelesaikan masalah penelitian penting,


khususnya dalam bisnis. Analisis ini adalah teknik statistik umum yang digunakan untuk
menganalisis hubungan antara variabel dependen tunggal dan beberapa variabel independen.
Formulasi dasarnya adalah
Y1 = X1 + X2 + ... + Xn
(metrik) (metrik)
Tujuan dari analisis ini adalah untuk menggunakan variabel independen yang nilainya
diketahui dalam memprediksi nilai dependen tunggal yang dipilih oleh peneliti. Setiap
variabel independen ditimbang dengan prosedur analisis regresi untuk memastikan prediksi
maksimal dari set variabel independen. Analisis regresi berganda juga merupakan teknik
ketergantungan. Sehingga, dapat dibagi menjadi variabel dependen dan independen. Analisis
ini merupakan alat statistik yang harus digunakan ketika kedua variabel dependen dan
independen adalah metrik. Singkatnya, untuk menerapkan analisis regresi berganda:
1. Data harus metrik atau ditransformasikan dengan tepat, dan
2. Sebelum menurunkan persamaan regresi, peneliti harus memutuskan variabel mana
yang menjadi dependen dan variabel mana yang akan independen.
Titik awal dalam setiap analisis regresi adalah mengidentifikasi variabel independen
tunggal yang mencapai prediksi terbaik dari ukuran dependen. Dengan koefisien intersep dan
regresi yang diestimasi oleh prosedur kuadrat terkecil, perhatian kini beralih ke interpretasi
dari dua nilai ini antara lain:
1. Koefisien regresi. Perkiraan perubahan variabel dependen untuk perubahan unit
variabel independen.
2. Mencegat. Interpretasi intersep yang berbeda. Intersepsi hanya memiliki nilai penjelas
dalam kisaran nilai untuk variabel independen.
Intersep hanya memiliki nilai interpretatif jika nol nilai konseptual yang valid untuk
variabel independen (mis., Variabel independen dapat memiliki nilai nol dan tetap
mempertahankan relevansi praktisnya).
Jika nilai independen merupakan ukuran yang tidak dapat memiliki nilai sebenarnya dari
nol (mis., Sikap atau persepsi), alat bantu intersep dalam meningkatkan proses prediksi, tetapi
tidak memiliki nilai penjelas.
MENGUKUR AKURASI PREDIKSI
Ukuran akurasi prediksi yang paling umum digunakan untuk model regresi adalah
koefisien determinasi (R2) yang mewakili efek gabungan dari seluruh variate (satu atau
lebih variabel independen ditambah intersep) dalam memprediksi variabel dependen, berkisar
dari 1,0 (prediksi sempurna) hingga 0,0 (tidak ada prediksi) karena itu kuadrat korelasi dari
nilai aktual dan prediksi dan juga mewakili jumlah varians dalam variabel dependen yang
dijelaskan oleh variabel independen.
Ukuran akurasi prediktif lainnya adalah variasi yang diharapkan dalam nilai-nilai
yang diprediksi, disebut standar kesalahan estimasi (SEE).
Kedua ukuran akurasi prediksi ini sekarang dapat digunakan untuk menilai model
regresi sederhana dan peningkatan yang dilakukan ketika variabel lebih independen
ditambahkan dalam model regresi berganda.

DAMPAK MULTIKOLLINARITAS
Kemampuan variabel independen tambahan untuk meningkatkan prediksi variabel
dependen terkait dengan korelasinya dengan variabel dependen, dan juga korelasi antara
variabel independen tambahan dengan variabel independen. Collinearity adalah asosiasi,
diukur sebagai korelasi, antara dua variabel independen. Multikolinearitas mengacu pada
korelasi di antara tiga atau lebih variabel independen (dibuktikan ketika seseorang mengalami
kemunduran terhadap yang lain). Meskipun perbedaan yang tepat memisahkan kedua konsep
ini dalam istilah statistik. Seperti yang mungkin diharapkan, korelasi antara variabel
independen dapat memiliki dampak yang nyata pada model regresi:
 Dampak multikolinearitas adalah untuk mengurangi daya prediksi variabel independen
tunggal sejauh yang dikaitkan dengan variabel independen lainnya.
 Untuk memaksimalkan prediksi dari sejumlah variabel independen, peneliti harus
mencari variabel independen yang memiliki multikolinieritas rendah dengan variabel
independen lainnya tetapi juga memiliki korelasi tinggi dengan variabel dependen.

PERSAMAAN REGRESI GANDA


Tugas bagi peneliti adalah untuk memperluas model regresi sederhana dengan
menambahkan variabel independen yang memiliki kekuatan prediksi tambahan terbesar.
Titik penambahan variabel independen akan menjadi kurang menguntungkan dan
kontraproduktif. Penambahan variabel yang lebih independen didasarkan pada trade-off
antara peningkatan daya prediksi versus model regresi yang terlalu kompleks dan bahkan
berpotensi menyesatkan.

TAHAP 1: TUJUAN REGRESI GANDA


Titik awal yang diperlukan dalam regresi berganda adalah masalah penelitian.
Fleksibilitas dan kemampuan beradaptasi dari regresi berganda memungkinkan
penggunaannya dengan hampir semua hubungan ketergantungan. Dalam memilih aplikasi
yang sesuai dari regresi berganda, peneliti harus mempertimbangkan tiga masalah utama:
1. Kesesuaian masalah penelitian
2. Spesifikasi hubungan statistik
3. Pemilihan variabel dependen dan independen
Aplikasi regresi berganda yang terus berkembang termasuk dalam dua kelas besar
masalah penelitian: prediksi dan penjelasan. Prediksi melibatkan sejauh mana variate regresi
(satu atau lebih variabel independen) dapat memprediksi variabel dependen. Penjelasan
menguji koefisien regresi (besarnya, tanda, dan signifikansi statistik) untuk setiap variabel
independen dan upaya untuk mengembangkan alasan substantif atau teoritis untuk efek dari
variabel independen.
Salah satu tujuan mendasar dari regresi berganda adalah untuk memprediksi variabel
dependen dengan seperangkat variabel independen. Dengan demikian, regresi berganda
memenuhi salah satu dari dua tujuan:
• Tujuan pertama adalah untuk memaksimalkan kekuatan prediktif keseluruhan dari
variabel independen sebagaimana diwakili dalam variate.
• Regresi berganda juga dapat mencapai tujuan kedua yaitu membandingkan dua atau lebih
set variabel independen untuk memastikan daya prediksi masing-masing varian.
Regresi berganda juga menyediakan sarana untuk menilai secara obyektif derajat dan
karakter hubungan antara variabel dependen dan independen dengan membentuk varian
variabel independen dan kemudian memeriksa besarnya, tanda, dan signifikansi statistik
dari koefisien regresi untuk setiap independen variabel. Dengan cara ini, variabel
independen dapat dipertimbangkan untuk kontribusi individu mereka terhadap variate dan
prediksinya. Interpretasi variate dapat mengandalkan salah satu dari tiga perspektif:
pentingnya variabel independen, jenis hubungan yang ditemukan, atau keterkaitan antar
variabel independen.
• Interpretasi paling langsung dari varian regresi adalah penentuan kepentingan relatif
masing-masing variabel independen dalam prediksi ukuran dependen.
• Selain menilai pentingnya setiap variabel, regresi berganda juga memberi peneliti cara
untuk menilai sifat hubungan antara variabel independen dan variabel dependen.
• Akhirnya, regresi berganda memberikan wawasan tentang hubungan antara variabel-
variabel independen dalam prediksi mereka terhadap ukuran dependen. Peneliti harus
bergantung pada landasan teoritis untuk analisis regresi untuk menilai hubungan "benar"
untuk variabel independen. Dalam situasi seperti itu, peneliti harus waspada terhadap
menentukan pentingnya variabel independen berdasarkan semata-mata pada varian yang
diturunkan, karena hubungan antara variabel independen dapat menutupi atau
mengacaukan hubungan yang tidak diperlukan untuk tujuan prediksi tetapi tetap
merupakan temuan substantif.
Dalam hubungan statistik terdapat beberapa komponen acak yang selalu hadir
dalam hubungan yang diperiksa. Hubungan statistik ditandai oleh dua elemen:
1. Ketika beberapa pengamatan dikumpulkan, lebih dari satu nilai dari nilai dependen
biasanya akan diamati untuk setiap nilai dari variabel independen.
2. Berdasarkan penggunaan sampel acak, kesalahan dalam memprediksi variabel dependen
juga dianggap acak, dan untuk variabel independen yang diberikan, kita hanya bisa
berharap untuk memperkirakan nilai rata-rata dari variabel dependen yang terkait
dengannya.

Pada saat peneliti tidak melakukan penilaian selama pemilihan variabel, maka yang perlu
diperhatikan adalah:
1. Memilih variabel tanpa pandang bulu atau
2. Memungkinkan untuk pemilihan variabel independen didasarkan hanya pada basis
empiris, beberapa prinsip dasar pengembangan model akan dilanggar. .
Kesalahan pengukuran yang bermasalah dapat diatasi melalui salah satu dari dua
pendekatan:
• Skala yang diringkas, gunakan beberapa variabel untuk mengurangi ketergantungan pada
variabel tunggal apa pun sebagai satu-satunya perwakilan dari suatu konsep.
• Pemodelan persamaan struktural secara langsung mengakomodasi kesalahan pengukuran
dalam memperkirakan efek dari variabel independen dalam setiap hubungan
ketergantungan yang ditentukan.

TAHAP 2: DESAIN PENELITIAN ANALISIS REGRESI GANDA


Dalam melakukannya, peneliti menggabungkan tiga fitur:
1. Ukuran sampel. Regresi berganda mempertahankan tingkat kekuatan statistik yang
diperlukan dan signifikansi praktis / statistik di berbagai ukuran sampel.
2. Elemen unik dari hubungan ketergantungan. Meskipun variabel independen
diasumsikan metrik dan memiliki hubungan linier dengan variabel dependen, kedua
asumsi dapat dilonggarkan dengan membuat variabel tambahan untuk mewakili aspek
khusus dari hubungan ini.
3. Sifat variabel independen. Regresi berganda mengakomodasi variabel independen
metrik yang dianggap tetap di alam serta variabel yang acak. Masing-masing fitur ini
memainkan peran kunci dalam penerapan regresi berganda untuk berbagai jenis
pertanyaan penelitian sambil mempertahankan tingkat signifikansi statistik dan praktis
yang diperlukan.
Ukuran sampel memiliki dampak langsung pada kesesuaian dan kekuatan statistik
regresi berganda. Sampel kecil, biasanya ditandai memiliki kurang dari 30 pengamatan,
sesuai untuk analisis hanya dengan regresi sederhana dengan satu variabel independen dan
sampel besar dari 1.000 pengamatan atau lebih membuat tes signifikansi statistik terlalu
sensitif, sering menunjukkan bahwa hampir semua hubungan secara statistik signifikan.
Tujuan ini untuk menyediakan peneliti dengan cara memodifikasi baik variabel dependen
atau independen untuk salah satu dari dua alasan:
1. Meningkatkan atau memodifikasi hubungan antara variabel independen dan dependen
2. Mengaktifkan penggunaan variabel nonmetrik dalam varian regresi

TAHAP 3: ASUMSI DALAM ANALISIS REGRESI GANDA


Tahap ini membuat beberapa asumsi tentang hubungan antara variabel dependen dan
independen yang mempengaruhi prosedur statistik (kuadrat terkecil) dalam regresi berganda.
Asumsi yang akan diperiksa ada di empat bidang:
1. Linearitas dari fenomena yang diukur
2. Varian konstan dari istilah kesalahan
3. Independensi istilah kesalahan
4. Normalitas istilah distribusi kesalahan
Dalam regresi berganda, setelah variate diturunkan, ia bertindak secara kolektif dalam
memprediksi variabel dependen, yang mengharuskan penilaian asumsi tidak hanya untuk
variabel individual tetapi juga untuk variate itu sendiri. Bagian ini berfokus pada pemeriksaan
varian dan hubungannya dengan variabel dependen untuk memenuhi asumsi regresi
berganda.
Ukuran utama kesalahan prediksi untuk varian adalah residual perbedaan antara nilai
yang diamati dan yang diprediksi untuk variabel dependen. Namun, penggunaan plot sisa
tergantung pada beberapa pertimbangan utama:
a. Plot residual yang paling umum melibatkan residual (ri) versus nilai dependen yang
diprediksi (Yi).
b. Pelanggaran setiap asumsi dapat diidentifikasi dengan pola spesifik residual.
Linearitas hubungan antara variabel dependen dan independen mewakili sejauh mana
perubahan dalam variabel dependen dikaitkan dengan variabel independen. Tindakan korektif
dapat mengambil salah satu dari tiga bentuk:
a. Mengubah nilai data (mis., Logaritma, akar kuadrat, dll.) Dari satu atau lebih variabel
independen untuk mencapai linearitas
b. Langsung memasukkan hubungan nonlinear dalam model regresi, seperti melalui
pembuatan istilah polynomial
c. Menggunakan metode khusus seperti regresi nonlinear yang dirancang khusus untuk
mengakomodasi efek lengkung variabel independen atau hubungan nonlinear yang
lebih kompleks
Pemeriksaan residual hanya menunjukkan efek gabungan dari semua variabel
independen, dalam hal ini menggunakan plot regresi parsial yang menunjukkan hubungan
variabel independen tunggal dengan variabel dependen, mengendalikan efek dari semua
variabel independen lainnya.
Kehadiran varians yang tidak sama (heteroskedastisitas) adalah salah satu
pelanggaran asumsi yang paling umum.
1. Plot nol 5a menunjukkan pola yang konsisten jika variansnya tidak konstan.
Mungkin pola yang paling umum adalah berbentuk segitiga di kedua arah.
2. Gambar 5c Pola berbentuk berlian
3. Gambar 5d dapat diharapkan dalam kasus persentase di mana lebih banyak variasi
yang diharapkan pada kisaran menengah daripada di bagian ekor.
4. Gambar 5h sejumlah pelanggaran terjadi secara bersamaan.
Jika heteroskedastisitas hadir, ada dua solusi yang tersedia. Jika pelanggaran dapat
dikaitkan dengan satu variabel independen tunggal melalui analisis plot residu yang dibahas
sebelumnya, maka prosedur kuadrat terkecil tertimbang dapat digunakan. Akan tetapi, yang
lebih langsung dan lebih mudah adalah sejumlah transformasi penstabilan-varians yang
memungkinkan variabel-variabel yang ditransformasi menunjukkan homoseksualitas
(kesetaraan varian) dan digunakan langsung dalam model regresi kami.
Jika residu independen, polanya akan tampak acak dan mirip dengan plot nol residual.
Pelanggaran akan diidentifikasi dengan pola yang konsisten dalam residu.
5. Gambar 5e menampilkan plot residual yang menunjukkan hubungan antara residu
dan waktu, variabel urutan umum.
6. Gambar 5f menampilkan kondisi model dasar berubah tetapi tidak termasuk dalam
model.
7. Gambar 5g, histogram residual, dengan pemeriksaan visual untuk distribusi yang
mendekati distribusi normal.
Metode yang lebih baik adalah penggunaan plot probabilitas normal. Distribusi
normal membuat garis diagonal lurus, dan residu yang diplot dibandingkan dengan diagonal.
Jika distribusi normal, garis residual erat mengikuti diagonal. Prosedur yang sama dapat
membandingkan variabel dependen atau independen secara terpisah dengan distribusi normal

TAHAP 4: ESTIMASI MODEL REGRESI DAN MENILAI MODEL


KESELURUHAN KESELURUHAN
Pada tahap ini, peneliti harus menyelesaikan tiga tugas dasar:
1. Pilih metode untuk menentukan model regresi yang akan diperkirakan.
2. Menilai signifikansi statistik dari keseluruhan model dalam memprediksi variabel
dependen.
3. Tentukan apakah ada pengamatan yang memberikan pengaruh yang tidak semestinya pada
hasil.

Memilih Teknik Estimasi


Ketiga pendekatan untuk menentukan model regresi dibahas selanjutnya:
1. SPESIFIKASI KONFIRMASI di mana peneliti menentukan set variabel independen
yang tepat untuk dimasukkan.
2. METODE PENCARIAN SEKUENSIAL dengan mempertimbangkan seperangkat
variabel yang ditentukan oleh peneliti, dan kemudian secara selektif menambahkan
atau menghapus antara variabel-variabel ini sampai beberapa kriteria keseluruhan
ukuran tercapai. Dua jenis pendekatan pencarian berurutan adalah
a). Estimasi bertahap Pendekatan ini memungkinkan peneliti untuk memeriksa
kontribusi masing-masing variabel independen terhadap model regresi.
b) Penambahan maju dan eliminasi mundur.
Metode estimasi sekuensial telah banyak digunakan karena efisiensinya dalam memilih
subset variabel independen yang memaksimalkan akurasi prediksi.
3. PENDEKATAN KOMBINATORIUM proses pencarian umum di semua
kemungkinan kombinasi variabel independen. Prosedur yang paling terkenal adalah
regresi semua-kemungkinan-himpunan bagian, yang persis seperti namanya. Semua
kemungkinan kombinasi dari variabel independen diperiksa, dan set variabel yang
paling pas diidentifikasi.
Setiap metode estimasi memiliki kelebihan dan kekurangan, sehingga tidak ada metode
tunggal yang lebih disukai daripada pendekatan lainnya. Dengan demikian, peneliti tidak
boleh sepenuhnya mengandalkan salah satu dari pendekatan ini tanpa memahami bagaimana
implikasi metode estimasi berhubungan dengan tujuan peneliti untuk prediksi dan penjelasan
dan landasan teoritis untuk penelitian..
Dengan variabel independen yang dipilih dan koefisien regresi diperkirakan, peneliti
sekarang harus menilai model estimasi untuk memenuhi asumsi yang mendasari regresi
berganda.
Dengan hanya satu sampel ini, kita perlu menguji hipotesis bahwa model regresi kita
dapat mewakili populasi daripada hanya satu sampel kita. Tes statistik ini mengambil dua
bentuk dasar: tes variasi yang dijelaskan (koefisien determinasi) dan tes setiap koefisien
regresi.

PENTINGNYA MODEL OVERALL: MENGUJI KOEFISIEN PENENTU


Untuk menguji hipotesis bahwa jumlah variasi yang dijelaskan oleh model regresi
lebih dari prediksi baseline (yaitu, bahwa R2 secara signifikan lebih besar dari nol), rasio F
dihitung sebagai:

Keterangan:
- dfregress = Jumlah estimasi koefisien (termasuk intersepsi) - 1
- dfresidual = Ukuran sampel - Jumlah estimasi koefisien (termasuk intersepsi)
Tiga fitur penting dari rasio ini harus diperhatikan:
1. Membagi setiap jumlah kuadrat dengan derajat kebebasan (df) yang sesuai menghasilkan
estimasi varians.
2. Secara intuitif, jika rasio varians yang dijelaskan dengan yang tidak dijelaskan adalah
tinggi, variate regresi harus bernilai signifikan dalam menjelaskan variabel dependen.
3. Meskipun nilai R2 yang lebih besar menghasilkan nilai F yang lebih tinggi, peneliti harus
mendasarkan setiap penilaian signifikansi praktis yang terpisah dari signifikansi statistik.

MENYESUAIKAN KOEFISIENSI PENENTUAN


Ukuran ini melibatkan penyesuaian berdasarkan jumlah variabel independen relatif
terhadap ukuran sampel. Dengan cara ini, menambahkan variabel tidak signifikan hanya
untuk meningkatkan R2 dapat diabaikan secara sistematis. Sebagai bagian dari semua
program regresi, koefisien determinasi yang disesuaikan (adjusted R2) diberikan bersama
dengan koefisien determinasi. Analisis regresi adalah tepat dan perlu ketika analisis
didasarkan pada sampel populasi daripada sensus.
Membangun Interval Keyakinan. Pengujian signifikansi koefisien regresi adalah
estimasi probabilitas berdasarkan statistik dari apakah koefisien estimasi di sejumlah besar
sampel dengan ukuran tertentu memang akan berbeda dari nol. Untuk membuat penilaian ini,
interval kepercayaan harus ditetapkan di sekitar koefisien yang diperkirakan dan peneliti
bergantung pada tiga konsep:
a. Menetapkan tingkat signifikansi (alfa) menunjukkan peluang yang peneliti ambil
untuk menjadi salah tentang apakah koefisien estimasi berbeda dari nol.
b. Kesalahan pengambilan sampel adalah penyebab variasi dalam estimasi koefisien
regresi untuk setiap sampel yang diambil dari suatu populasi.
c. Kesalahan standar adalah variasi yang diharapkan dari koefisien yang diperkirakan
(baik koefisien konstan maupun koefisien regresi) karena kesalahan pengambilan
sampel.
Dengan tingkat signifikansi dipilih dan kesalahan standar dihitung, kita dapat menetapkan
interval kepercayaan untuk koefisien regresi berdasarkan kesalahan standar sama seperti kita
dapat untuk rata-rata berdasarkan standar deviasi.
Mengidentifikasi Pengamatan Berpengaruh dengan tujuan menemukan pengamatan itu
berada di luar pola umum kumpulan data atau sangat mempengaruhi hasil regresi.
Pengamatan ini tidak selalu "buruk" dalam arti bahwa mereka harus dihapus. Dalam
banyak kasus mereka mewakili elemen khas dari kumpulan data.

JENIS PENGAMATAN INFLUENTIAL


Tiga tipe dasar didasarkan pada sifat dampaknya terhadap hasil regresi:
1. Pencilan adalah pengamatan yang memiliki nilai residu yang besar dan hanya dapat
diidentifikasi sehubungan dengan model regresi tertentu.
2. Leverage poin adalah pengamatan yang berbeda dari pengamatan yang tersisa
berdasarkan nilai variabel independennya.
3. Pengamatan berpengaruh adalah kategori terluas, termasuk semua pengamatan yang
memiliki efek tidak proporsional pada hasil regresi.

MENGIDENTIFIKASI PENGAMATAN INFLUENTIAL


Gambar 8 mengilustrasikan beberapa bentuk umum pengamatan berpengaruh dan pola residu
yang sesuai:
1. Gambar 8a Memperkuat: titik yang berpengaruh adalah titik “baik”, memperkuat pola
umum data dan menurunkan kesalahan standar prediksi dan koefisien. Titik leverage
yang memiliki nilai residu kecil atau nol, karena diprediksi dengan baik oleh model
regresi.
2. Gambar 8b dan 8c Konflik: memiliki efek yang bertentangan dengan pola umum dari
data yang tersisa tetapi masih memiliki residu kecil. Pada Gambar 8b, dua
pengamatan berpengaruh hampir sepenuhnya menjelaskan hubungan yang diamati,
karena tanpa mereka tidak ada pola nyata yang muncul dari titik data lainnya.
Gambar 8c, efek yang lebih mendalam terlihat di mana pengamatan yang
berpengaruh menangkal pola umum semua data yang tersisa.
3. Gambar 8d Pergeseran: Pengamatan berpengaruh dapat memengaruhi semua hasil
dengan cara yang serupa, di mana kemiringan tetap konstan tetapi intersep digeser.
Dengan demikian, hubungan di antara semua pengamatan tetap tidak berubah kecuali
untuk pergeseran dalam model regresi.
4. Gambar 8e, dua titik berpengaruh memiliki posisi relatif yang sama, membuat deteksi
agak sulit.
5. Gambar 8f, pengaruh memiliki posisi yang sangat berbeda tetapi efek yang sama pada
hasilnya.

Poin pengaruh, keluaran, dan leverage didasarkan pada satu dari empat kondisi, yang
masing-masing memiliki rangkaian tindakan korektif yang spesifik:
1. Kesalahan dalam pengamatan atau entri data: Memperbaiki dengan memperbaiki data atau
menghapus kasing.
2. Pengamatan yang valid tetapi luar biasa yang dapat dijelaskan oleh situasi luar biasa:
Pemulihan dengan menghapus kasus kecuali variabel yang mencerminkan situasi luar biasa
dimasukkan dalam persamaan regresi.
3. Pengamatan luar biasa tanpa penjelasan yang mungkin: Menghadirkan masalah khusus
karena tidak memiliki alasan untuk menghapus kasus, tetapi inklusi tidak dapat dibenarkan
juga, menyarankan analisis dengan dan tanpa pengamatan untuk membuat penilaian lengkap.
4. Pengamatan biasa dalam karakteristik individualnya tetapi luar biasa dalam kombinasi
karakteristiknya: Mengindikasikan modifikasi pada dasar konseptual model regresi dan harus
dipertahankan.

TAHAP 5: MENARIK interpretasi VARIASI REGRESI


Menginterpretasikan varian regresi dengan mengevaluasi estimasi koefisien regresi
untuk penjelasan mereka tentang variabel dependen. Peneliti harus mengevaluasi tidak hanya
model regresi yang diperkirakan tetapi juga variabel independen potensial yang dihilangkan
jika pencarian sekuensial atau pendekatan kombinatorial digunakan.
Koefisien regresi yang diestimasi, disebut koefisien b, mewakili tipe hubungan
(positif atau negatif) dan kekuatan hubungan antara variabel independen dan dependen dalam
varian regresi. Tanda koefisien menunjukkan apakah hubungan itu positif atau negatif, dan
nilai koefisien menunjukkan perubahan dalam nilai dependen setiap kali variabel independen
berubah oleh satu unit. Koefisien regresi memainkan dua fungsi utama dalam memenuhi
tujuan prediksi dan penjelasan untuk setiap analisis regresi. Prediksi adalah elemen integral
dalam analisis regresi, baik dalam proses estimasi maupun dalam situasi perkiraan. Prediksi
dibagia atas dua bentuk, antara lain:
1. Perkiraan yang digunakan untuk menurunkan variate regresi, prediksi variabel
dependen dibuat untuk setiap pengamatan dalam kumpulan data.
2. Peramalan bermanfaat sebenarnya dari prediksi datang dalam aplikasi perkiraan.
Model regresi digunakan dalam hal ini untuk prediksi dengan seperangkat
pengamatan yang tidak digunakan dalam estimasi.
Penjelasan. Sering kali peneliti tertarik pada lebih dari sekadar prediksi. Penting bagi model
regresi untuk memiliki prediksi yang akurat untuk mendukung validitasnya.
Interpretasi dengan Koefisien Regresi. Dengan demikian, untuk tujuan penjelasan,
koefisien regresi menjadi indikator dampak relatif dan pentingnya variabel independen dalam
hubungannya dengan variabel dependen. Sayangnya, dalam banyak kasus koefisien regresi
tidak memberikan informasi ini secara langsung
Untuk menggunakan koefisien regresi untuk tujuan penjelasan, maka semua
variabel independen berada pada skala yang sebanding. Namun demikian, perbedaan
variabilitas dari variabel ke variabel dapat mempengaruhi ukuran koefisien regresi.
Membakukan Koefisien Regresi: Koefisien Beta merupakan koefisien yang
dihasilkan dari analisis data terstandarisasi. Standarisasi mengubah variabel ke skala umum
dan variabilitas, yang paling umum adalah rata-rata nol (0,0) dan standar deviasi satu (1,0).
Keuntungannya adalah mereka menghilangkan masalah berurusan dengan unit pengukuran
yang berbeda (seperti yang digambarkan sebelumnya) dan dengan demikian mencerminkan
dampak relatif pada variabel dependen dari perubahan dalam satu standar deviasi di kedua
variabel. Meskipun koefisien beta mewakili ukuran objektif yang penting yang dapat
langsung dibandingkan, dua peringatan harus diperhatikan dalam penggunaannya:
1. Pertama, mereka harus digunakan sebagai panduan untuk kepentingan relatif variabel
independen individu hanya ketika kolinearitas minimal.
2. Kedua, nilai beta hanya dapat ditafsirkan dalam konteks variabel lain dalam
persamaan.

Singkatnya, koefisien beta harus digunakan hanya sebagai panduan untuk kepentingan relatif
variabel independen yang termasuk dalam persamaan dan hanya untuk variabel-variabel
dengan multikolinearitas minimal.
Masalah utama dalam menginterpretasikan varian regresi adalah korelasi antara
variabel independen. Namun dalam sebagian besar situasi, khususnya situasi yang melibatkan
data respons konsumen, beberapa tingkat multikolinearitas tidak dapat dihindari.
Pada beberapa kesempatan lain, seperti menggunakan variabel dummy untuk
mewakili variabel nonmetrik atau istilah polinomial untuk efek nonlinear, peneliti
menciptakan situasi multikolinieritas tinggi. Tugas peneliti meliputi yang berikut:
 Menilai tingkat multikolinearitas.
 Tentukan dampaknya pada hasil.
 Terapkan solusi yang diperlukan jika perlu.

Untuk menilai multikolinieritas, kita perlu ukuran yang menyatakan sejauh mana masing-
masing variabel independen dijelaskan oleh set variabel independen lainnya. Secara
sederhana, setiap variabel independen menjadi variabel dependen dan mengalami
kemunduran terhadap variabel independen yang tersisa variabel. Adapun ukuran terhadap
multikolinearitas adalah
1. Toleransi, yang didefinisikan sebagai jumlah variabilitas dari variabel independen
yang dipilih tidak dijelaskan oleh variabel independen lainnya. Dengan demikian,
untuk setiap model regresi dengan dua atau lebih variabel independen toleransi dapat
dengan mudah didefinisikan dalam dua langkah:
a. Ambil masing-masing variabel independen, satu per satu, dan hitung R2 * —
jumlah variabel independen yang dijelaskan oleh semua dari variabel independen
lainnya dalam model regresi
b. Toleransi kemudian dihitung sebagai 1 - R2 *.
Nilai toleransi harus tinggi, yang berarti tingkat multikolinieritas yang kecil (yaitu,
variabel independen lainnya tidak secara kolektif memiliki sejumlah besar varian bersama).

2. Faktor Inflasi Varians. Ukuran yang dihitung hanya sebagai kebalikan dari nilai
toleransi. VIF mendapatkan namanya dari fakta bahwa akar kuadrat dari VIF () adalah
sejauh mana kesalahan standar telah meningkat karena multikolinieritas. VIF
menerjemahkan nilai toleransi, yang secara langsung mengungkapkan tingkat
multikolinieritas, menjadi dampak pada proses estimasi. Ketika kesalahan standar
meningkat, itu membuat interval kepercayaan di sekitar koefisien yang diperkirakan
lebih besar, sehingga membuatnya lebih sulit untuk menunjukkan bahwa koefisien
secara signifikan berbeda dari nol.
Dampak multikollinaritas yaitu Dampak pada Estimasi. Multikolinearitas dapat
memiliki efek substantif tidak hanya pada kemampuan prediksi model regresi (seperti yang
baru saja dijelaskan), tetapi juga pada estimasi koefisien regresi dan uji signifikansi
statistiknya.
1. Pertama, kasus ekstrim multikolinieritas di mana dua atau lebih variabel berkorelasi
sempurna, disebut singularitas, mencegah estimasi koefisien apa pun.
2. Ketika multikolinieritas meningkat, kemampuan untuk menunjukkan bahwa koefisien
regresi yang diperkirakan secara signifikan berbeda dari nol dapat menjadi sangat
dipengaruhi karena peningkatan kesalahan standar seperti yang ditunjukkan dalam
nilai VIF.
3. Selain memengaruhi uji statistik koefisien atau model keseluruhan, derajat
multikolinearitas yang tinggi juga dapat mengakibatkan koefisien regresi diperkirakan
salah dan bahkan memiliki tanda-tanda yang salah. Dalam beberapa kasus,
pembalikan tanda ini diharapkan dan diinginkan.
Dampak pada Penjelasan. Efek pada penjelasan terutama menyangkut kemampuan
prosedur regresi dan peneliti untuk mewakili dan memahami efek dari masing-masing
variabel independen dalam varian regresi. Ketika multikolinieritas terjadi (bahkan pada
tingkat yang relatif rendah, 30 atau lebih), proses untuk mengidentifikasi efek unik dari
variabel independen menjadi semakin sulit.
Setiap peneliti harus menentukan tingkat collinearity yang dapat diterima, karena
sebagian besar standar atau ambang batas yang direkomendasikan masih memungkinkan
untuk collinearity substansial. Beberapa pedoman yang disarankan mengikuti:
1. Ketika menilai korelasi bivariat, dua masalah harus dipertimbangkan. Pertama,
korelasi genap 0,70 (yang mewakili varians "dibagi" 50%) dapat memengaruhi
penjelasan dan estimasi hasil regresi.
2. Batas yang disarankan untuk nilai toleransi adalah. 10 (atau VIF yang sesuai 10,0),
yang sesuai dengan korelasi berganda 0,95 dengan variabel independen lainnya.
Ketika nilai-nilai pada tingkat ini ditemui, masalah multikolinieritas hampir pasti.
Namun, masalah juga cenderung pada tingkat yang jauh lebih rendah.
Solusi untuk multikolinieritas berkisar dari modifikasi varian regresi hingga penggunaan
prosedur estimasi khusus. Setelah derajat kolinearitas ditentukan, peneliti memiliki sejumlah
opsi:

1. Menghilangkan satu atau lebih variabel independen yang berkorelasi tinggi dan
mengidentifikasi variabel independen lainnya untuk membantu prediksi.
2. Gunakan model dengan variabel independen yang sangat berkorelasi hanya untuk
prediksi (mis., Jangan mencoba menafsirkan koefisien regresi), sambil mengakui
tingkat kemampuan prediksi keseluruhan yang lebih rendah.
3. Gunakan korelasi sederhana antara setiap variabel independen dan variabel dependen
untuk memahami hubungan variabel dependen-independen.
4. Gunakan metode analisis yang lebih canggih seperti regresi Bayesian (atau kasus
khusus - regresi ridge) atau regresi pada komponen utama untuk mendapatkan model
yang lebih jelas mencerminkan efek sederhana dari variabel independen.

TAHAP 6: VALIDASI HASIL

Untuk memastikan bahwa itu mewakili populasi umum (dapat digeneralisasikan) dan
sesuai untuk situasi di mana ia akan digunakan (transferability). Pedoman terbaik adalah
sejauh mana model regresi cocok dengan model teoritis yang ada atau set hasil yang
sebelumnya divalidasi pada topik yang sama. Namun, dalam banyak kasus, hasil atau teori
sebelumnya tidak tersedia. Dengan demikian, kami juga membahas pendekatan empiris untuk
memvalidasi model.

CONTOH REGRESI SEDERHANA DAN GANDA

Data yang digunakan di sini adalah data yang akan diuji regresi berganda, di sini kita
akan melihat apakah Motivasi (X1) dan Minat (X2) berpengaruh terhadap Prestasi Belajar
(Y). disini terdiri dari dua variabel bebas atau X, jadi masuk dalam kategori regresi berganda.
Adapun datanya sebagai berikut:

Rumusan Hipotesis :

H1 = Terdapat pengaruh Motivasi (X1) terhadap Prestasi (Y)

H2 = Terdapat pengaruh Minat (X2) terhadap Prestasi (Y)

H3 = Terdapat pengaruh Motivasi (X1) dan Minat (X2) secara simultan terhadap (Y)

Tingkat kepercayaan 95%, α = 0,05


HASIL INTERPRETASI.

PENGUJIAN HIPOTESIS H1 DAN H2 DENGAN UJI t

1. Pengujian Hipotesis Pertama (H1)


Diketahui nilai Sig. untuk pengaruh X1 terhadap Y adalah sebesar 0,347 ˃ 0,05 dan
nilai t hitung 0,992 ˂ t table 2,262, sehingga dapat disimpulkan bahwa H1 ditolak
yang berarti tidak terdapat pengaruh X1 terhadap Y.

2. Pengujian Hipotesis Kedua (H2)


Diketahui nilai Sig. untuk pengaruh X2 terhadap Y adalah sebesar 0,000 ˂ 0,05 dan
nilai t hitung 3,441 ˃ t tabel 2, 262 sehingga dapat disimpulkan bahwa H2 diterima
yang berarti terdapat pengaruh X2 terhadap Y.
t tabel = t (a/2 : n-k-1) = t (0,025: 9) = 2,262
Uji t untuk melihat apakah ada pengaruh bersama-sama antara Motivasi (X1)
dan Minat (X2) terdapat Prestasi (Y)Kurva tersebut menunjukkan bahwa jika area
hipotesis ditolak maka area tersebut adalah area yang tidak berpengaruh, sedangkan
area hipotesis diterima itu berpengaruh.
X1 t hitung 0.0992 yang masuk dalam area hipotesis ditolak atau tidak berpengaruh
Sedangkan, X2 t hitungannya 3,441 letaknya berada pada area hipotesis diterima,
karena lebih besar dari t tabel maka ada pengaruh X2 terhadap Y, arah pengaruhnya
positif, arah positif maksudnya semakin positif Minat (X2) seseorang akan
meningkatkan Prestasi (Y) seseorang, sedangkan untuk minus berarti ada pengaruh
negatif, ada pengaruh tetapi negatif.
PENGUJIAN HIPOTESIS H3 DENGAN UJI F

Berdasarkan output di atas diketahui nilai signifikansi untuk pengaruh X1 dan X2


secara simultan terhadap Y adalah sebesar 0,000 ˂ 0,05 dan nilai F hitung 23,978 ˃ F tabel
4,10 sehingga disimpulkan bahwa H3 diterima yang berarti terdapat pengaruh X1 dan X2
secara simultan terhadap Y.

F tabel = F (k : n –k ) = F (2 :10) 4,10

Hasilnya H1 tidak berpengaruh terhadap Prestasi


Hasilnya H2 terdapat pengaruh terhadap Prestasi
Hasil X1 dan X2 secara bersamaan memiliki pengaruh terhadap Prestasi

KOEFISIEN DETERMINASI

Berdasarkan output di atas maka diketahui nilai R Square sebesar 0,842, hal ini
mengandung arti bahwa pengaruh variabel X1 dan X2 secara simultan terhadap variabel Y
adalah sebesar 84,2%

Anda mungkin juga menyukai