Analisis Regresi
Secara umum terdapat 2 macam hubungan antara dua variabel atau lebih, yaitu :
1. Berkaitan dengan tingkat keeratan hubungan Analisis korelasi.
2. Berkaitan dengan bentuk hubungan Analisis regresi.
Regresi
Metoda analisis statistika untuk menganalisis dan memodelkan secara matematis hubungan antara dua variabel
atau lebih.
Pada analisis regresi ini dikenal adanya:
Variabel terikat. Notasi y
(istilah lainnya: var. dependen, var. tidak bebas,, var. tergantung, unknown var., response var.)
Variabel bebas. Notasi x
(istilah lainnya: var. Independen, var. bebas, explanatory var., regressor var., predictor var.).
Regresi dipakai untuk mengukur besarnya pengaruh perubahan pada variabel terikat yang diakibatkan perubahan
pada variabel bebas.
2
Regresi Linier
Studi ketergantungan satu atau lebih variabel bebas terhadap variabel terikat, untuk meramalkan nilai variabel
terikatnya.
Jika var. Bebas > 1 regresi linear berganda
Berganda: karena pengaruh beberapa variabel bebas akan dikenakan kepada variabel terikat. Sederhana: variabel
bebasnya hanya 1.
ASUMSI regresi linier sederhana:
• Error (ε) independen secara statistik
• Distribusi probabilitas dari Error berdistribusi Normal
• Distribusi probabilitas dari Error mempunyai variansi yang konstan
• Ada hubungan linier antara kedua variabel
Beberapa istilah:
• Residual: selisih nilai duga dengan pengamatan untuk data sampel.
• Error adalah selisih nilai duga dengan pengamatan untuk data populasi.
Persamaan : merupakan selisih antara nilai duga dengan pengamatan.
Perbedaan keduanya: residual dari data sampel, error dari data populasi.
3
Random Error
Population
Y-Intercept
4
Populasi Sampel
yi a bX i ei
yi X i i
4
5
Y yi X i i Nilai
observasi
i = Random error
E Yi X i
X
Nilai observasi
5
Model Regresi Linier Sederhana Sampel
Y y a bX e
i i i
e = residual
i
Observasi
tidak
yi a bX i
tersampel
X
Nilai observasi
6
REGRESI LINIER 7
2. Menentukan Standar Error Estimasi (MSE) dan Standar Error Koefisien Regresi (Sb)
2
a. Standar Error Estimasi S dari 𝛔𝟐
Jumlah kuadrat error (SSE) merupakan variansi yang menggambarkan penyimpangan nilai–nilai
observasi di sekitar garis regresi sampel. Rataan kuadrat error (Mean Squared Error–MSE) atau
2
S adalah estimasi dari 𝜎 2 dengan persamaan berikut:
𝑆𝑆𝐸 𝑆𝑦𝑦 − 𝑏𝑆𝑥𝑦 σሺ ො
𝑦−𝑦 ሻ2
𝑆2 = 𝑀𝑆𝐸 = = =
𝑛−2 𝑛−2 𝑛−2
Contoh Kasus
Sebuah penelitian dilakukan untuk mengetahui efek dari temperatur (X) dalam derajat celcius pada persentase konversi
hasil dari suatu proses kimia (Y). Data berikut merupakan sampel acak sebanyak 12 proses kimia :
No 1 2 3 4 5 6 7 8 9 10 11 12
Temperatur (X) 200 250 200 250 189 260 225 225 225 225 225 225
Konversi (Y) 43 78 69 73 48 78 65 74 76 79 83 81
o Hitunglah nilai slope (b) dan intercept (a) berdasarkan data sampel di atas !
o Buatlah persamaan untuk model regresi linier sederhana taksirannya dan prediksilah persentase konversi hasil proses
kimia pada temperatur 230 !
o Lakukan pengujian hipotesis pada taraf nyata 5% untuk mengetahui efek dari temperatur (X) terhadap konversi hasil
proses kimia (Y) !
o Lakukan pengujian signifikansi parameter regresi menggunakan ANOVA !
o Hitunglah nilai koefisien determinansi dan jelaskan artinya !
16
Solusi
17
o Taksiran slope (b) dan intercept (a) :
𝑎= ´𝑦 −𝑏 ´𝑥 =70.58 − ( 0.4078 )( 224.92 ) =−21.1401
o Model regresi taksiranya / model regresi sampel
𝑦 𝑖=−21.1401+0.4078 𝑋 𝑖+𝑒 𝑖
Prediksi nilai konversi hasil proses kimia jika diketahui temperaturnya 230
Untuk melakukan pengujian hipotesis, terlebih dahulu kita harus mencari taksiran untuk komponen varians error dengan
membuat tabel nilai prediksi setiap observasi, kemudian dihitung nilai residualnya sebagai berikut :
yi yi y yˆ
i ei ei2
ei e 2
i
43 60.42 -17.42 303.53
78 80.81 -2.81 7.91
69 60.42 8.58 73.58
73 80.81 -7.81 61.04
48 55.94 -7.94 62.98
78 84.89 -6.89 47.48
65 70.62 -5.62 31.55 Standard error untuk koefisien slope (b)
74 70.62 3.38 11.44
76 70.62 5.38 28.97
79 70.62 8.38 70.27
83 70.62 12.38 153.33
81 70.62 10.38 107.80
Total 959.89
19
Berdasarkan data sampel, pada taraf nyata 5% cukup bukti untuk menyatakan bahwa temperatur memberikan efek
signifikan/nyata pada hasil konversi proses kimia.
20
No. yi ˆi
y ˆi y
y ˆi y )
(y 2
Pada taraf nyata 5%, cukup bukti untuk menyatakan bahwa model regresi mampu menjelaskan variasi pada variabel
Y (hasil konversi).
23
Arti : Variasi pada variabel Y (hasil konversi) mampu dijelaskan rata-rata sebesar 46.52% oleh variasi pada variabel X
(temperatur) pada model regresi, sedangkan sisanya sebesar 53.48% dijelaskan oleh variasi variabel lain yang tidak
dimasukkan dalam model (komponen error).
24
Latihan
Manajer kantor di sebuah perusahaan real estate membuat kopi dalam sebuah teko setiap pagi.
Waktu sebelum kopi habis dalam teko (Y) dalam jam tergantung jumlah orang yang bekerja pada
hari itu (X). Data berikut merupakan pengamatan berpasangan nilai (X, Y) dari enam hari kerja
yang dipilih secara acak adalah:
o Hitunglah nilai slope (b) dan intercept (a) berdasarkan data sampel di atas !
o Buatlah persamaan untuk model regresi linier sederhana taksirannya dan prediksilah berapa lama
kopi dalam teko akan habis jika pada suatu hari tertentu ada 6 orang yang bekerja
o Lakukan pengujian hipotesis pada taraf nyata 5% untuk menguji parameter slope model
o Lakukan pengujian signifikansi parameter regresi menggunakan ANOVA !
o Hitunglah nilai koefisien determinansi dan jelaskan artinya !