Analysis
DEFINISI
Regression Analysis
Teknik statistika yang digunakan untuk menganalisis pengaruh
variabel independen terhadap variabel dependen.
1. Simple regression (regresi sederhana)
• Apabila memiliki sebuah variabel independen
2. Multiple regression (regresi majemuk)
• Memiliki dua atau lebih variabel independen
MODEL DASAR
2 • Rancangan Penelitian
3 • Pembentukan Model
4 • Interpretasi Hasil
5 • Validasi Model
STAGE 1
IDENTIFIKASI
MASALAH
TUJUAN
1. Menentukan tujuan penggunaan analisis regresi
– Prediksi
– Eksplanasi
Rp 300.000,- ???
EKSPLANASI
• Konsep analisis regresi majemuk juga dapat dimanfaatkan
untuk menilai tingkat dan karakteristik hubungan antara
variabel dependen dengan setiap variabel independennya.
RANCANGAN
PENELITIAN
ISU STATISTIKA
1. Menentukan ukuran sampel
– Statistical power (1-β)
– Statistical significance level (α)
– Generalizability
– Hair (1998) menyatakan bahwa jumlah sampel minimum
adalah lima kali jumlah variabel independen
Power (1-β) : Probabilitas ditolaknya H0, pada saat sebenarnya tidak ada
hubungan antara X dan Y
Significance Level (α) : Probabilitas diterimanya H0, pada saat sebenarnya
ada hubungan antara X dan Y
POWER & SIGNIFICANCE LEVEL (2)
JUMLAH SAMPEL
• Jumlah sampel : jumlah variabel independen = 5:1
(artinya untuk setiap satu variabel independen
minimum terdapat lima buah subjek sampel)
• Untuk metode stepwise direkomendasikan
perbandingannya 50:1
• Idealnya terdapat 15-20 subjek sampel untuk
setiap satu variabel independen
VARIABEL DUMMY
• Menentukan jenis pengkodean (Indicator coding/Effect coding)
• Menentukan kategori acuan (Reference Category)
PENGUJIAN ASUMSI
INDIVIDUAL
ASUMSI 1 - LINEARITAS
• Analisis regresi Berbasis korelasi Hubungan linear
• Pengujian
– Scatter plot antar setiap variabel
• Apabila ternyata disimpulkan bahwa terjadi hubungan yang
tidak linear, maka perlu dilakukan transformasi data
• Untuk membangun model: Y = α + β1X1 + β2X2 + β3X3 ,
maka:
– Hubungan (X1 dan Y); (X2 dan Y); (X3 dan Y) harus linear
ASUMSI 2 - HOMOSCEDASCITY
• Pengujian:
– Scatterplot antara error dan ekspektasi variabel
dependen
– Levene Test, Box’s M
ASUMSI 3 - NORMALITAS (1)
• Pengujian
– Normal Probability Plot
– Kolmogorov-Smirnov
– Shapiro-Wilks
Tujuan
• Memperbaiki data pada asumsi yang dilanggar
• Meningkatkan korelasi antar variabel
Metode Transformasi
• Square-root
• Logaritma/Logaritma natural (ln)
• 1/X
STAGE 4
PEMBENTUKAN
MODEL
TAHAP PEMBENTUKAN MODEL
• Combinatorial approach
– Mencoba semua kombinasi variabel yang memiliki
kemampuan prediksi terbaik
PENGUJIAN ASUMSI VARIATE
Outliers
Observasi yang memiliki nilai residual (error) yang besar.
Leverage Points
Observasi yang berbeda dari observasi lainnya yang
berbasis pada nilai variabel independen.
Other Influentials Observations
Observasi yang menghasilkan efek yang tidak sesuai
dengan hasil regresi.
INFLUENTIALS OBSERVATIONS (2)
REMEDY FOR INFLUENTIALS
INTERPRETASI
HASIL
INTERPRETASI HASIL REGRESI
Melakukan evaluasi persamaan regresi dengan
merepresentasikan nilai dari koefisien regresi.
VALIDASI MODEL
VALIDASI
Tujuan
- Mengukur generalizability
- Mengantisipasi adanya over-fitting
Metode
Membandingkan dengan model regresi yang dibentuk dari set
data lain.
Sumber Data
- Split sample
- Observasi baru
That’s All
Any questions?