Anda di halaman 1dari 52

MASHADI

Regresi digunakan untuk mengukur besarnya


pengaruh variabel bebas terhadap variabel
tergantung dan memprediksi variabel tergantung
dengan menggunakan variabel bebas.
Regresi Linier dibagi 2 :
1. Regresi Linier Sederhana Jika variabel bebas
hanya satu variabel
2. Regresi Linier Berganda Jika Variabel bebas
lebih dari satu variabel
Dua variabel numerik ingin diketahui
hubungannya
Dua variabel numerik salah satu variabel
dianggap sebagai variabel yang mempengaruhi
variabel lainnya
Variabel yang mempengaruhi X, variabel bebas,
variabel penjelas
Variabel yang dipengaruhi Y, variabel tak bebas,
variabel respon
Hati-hati menentukan variabel bebas dan variabel
tak bebas
Hubungan berat badan dan tinggi badan

Apakah ada hubungan

Kalau ada, mana yang bebas dan mana yang tak
bebas
Korelasi
Model Matematika yang digunakan :
Garis Lurus
Parabola / Kurva Kuadratik
Kurva kubik
Kurva Quartic
Kurva pangkat n

Biasanya disebut sebagai polinomial berderajat
satu, dua, .dst
Y = a + bX

X variabel bebas
Y variabel tak bebas
Hasil panen dan banyak pupuk yang di gunakan

Y = a + bX

X Volume pupuk yang digunakan
Y Hasil Panen
Regresi
Makna |
0
& |
1
?
Perhatikan bentuk regresi linear
sederhana Y = a + bX
??? Bagaimana menentukan koefisien a dan
koefisien b ????

Persamaan Regresi kita buat dari data sampel
(penaksir)
bX a Y

+ =
Menentukan persamaan
regresi
Metoda tangan bebas

Gambarkan titik-titik
sampel
Buat regresi
penduganya

Maka metoda ini tidak
valid
35
40
45
50
55
60
65
8 10 12 14 16
ads expenditures (millions of dollars)
s
a
l
e
s

r
e
v
e
n
u
e

(
m
i
l
l
i
o
n
s

o
f

d
o
l
l
a
r
s
)
35
40
45
50
55
60
65
8 10 12 14 16
ads expenditures (millions of dollars)
s
a
l
e
s

r
e
v
e
n
u
e

(
m
i
l
l
i
o
n
s

o
f

d
o
l
l
a
r
s
)
Ini tidak valid karena ada kehendak yang subjektif
Misalnya ingin melihat hubungan antara
pengeluaran untuk iklan (ads expenditures, X)
dengan penerimaan melalui penjualan (sales
revenue, Y)
Tahun 1 2 3 4 5 6 7 8 9 10
X 10 9 11 12 11 12 13 13 14 15
Y 44 40 42 46 48 52 54 58 56 60
Bagaimana menentukan a
dan b
35
40
45
50
55
60
65
8 10 12 14 16
ads expenditures (millions of dollars)
s
a
l
e
s

r
e
v
e
n
u
e

(
m
i
l
l
i
o
n
s

o
f

d
o
l
l
a
r
s
)
Rumus I
= =
= = = =
|
|
.
|

\
|

|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
|
|
.
|

\
|
=
n
i
n
i
i i
n
i
i i
n
i
i
n
i
2
i
n
i
i
X X n
Y X X X Y
a

1
2
1
2
1 1 1 1
= =
= = =
|
|
.
|

\
|

|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
n
i
n
i
i i
n
i
i
n
i
i
n
i
i i
X X n
Y X Y X n
b

1
2
1
2
1 1 1
Mari kerja dengan exel untuk contoh berikut
X = banyak pengunjung toko
Y = banyak pembeli



X 56 54 33 42 54 34 48 62 50 38 60 55
Y 34 46 28 33 44 26 29 44 39 23 36 37
Ini cara semi manual, nanti kita lihat dengan excel
Xi Yi XiYi Xi^2
56 34 1904 3136
54 46 2484 2916
33 28 924 1089
42 33 1386 1764
54 44 2376 2916
34 26 884 1156
48 29 1392 2304
62 44 2728 3844
50 39 1950 2500
38 23 874 1444
60 36 2160 3600
55 37 2035 3025
586 419 21097 29694
9X 0.59000927 1 6.10454686 Y
diperoleh sehingga
+ =
0.6X 6.1 Y
Rumus ke dua



= =
= = =
|
|
.
|

\
|

|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
n
i
n
i
i i
n
i
i
n
i
i
n
i
i i
X X n
Y X Y X n
b

1
2
1
2
1 1 1
atas di seperti tetap b

=
X b

Y a

diperoleh
X b

Y dari
=
+ =
3 48.8333333 9 0.59000927 7 34.9166666 a

=
1 6.10454686
1 28.8121198 7 34.9166666 a

=
=
9X 0.59000927 1 6.10454686 Y
diperoleh juga sehingga
+ =
I cara dengan sama Hasilnya
Ini cara semi manual, nanti kita lihat dengan excel
Memberi makna dari persamaan regresi
Misalkan hubunan antara biaya iklan yang dikeluarkan (X)
dengan penjualan adalah
Y = 7.6 + 3.5333X
Ingat bilang koefisian dari X (b > 0) berarti grarik
Naik dari kiri ke kanan
Jika b < 0 grafik
Turun dari kiri ke kanan
35
40
45
50
55
60
65
8 10 12 14 16
ads expenditures (millions of dollars)
s
a
l
e
s

r
e
v
e
n
u
e

(
m
i
l
l
i
o
n
s

o
f

d
o
l
l
a
r
s
)
a = besarnya nilai Y ketika X sebesar 0
b = besarnya perubahan nilai Y ketika X berubah
satu satuan. Tanda koefisien b menunjukkan arah
hubungan X dan Y
Pada kasus ilustrasi
a = 7.6 = besanya pendapatan jika tidak ada
belanja iklan adalah 7.6
b = 3.533 = jika belanja iklan dinaikkan 1 juta dolar
maka penjualan naik 3.533 juta dolar
Kita bisa membuat prediksi berapakah pendapatan
yang akan diperoleh jika biaya pengeluaran iklan
dinaikkan sampai 20 juta dollar

Ingat prediksi TERBATAS
MAKA DIPERLUKAN UJI LINEARITAS
UJI HIPOTESI UNTUK REGRESI
Model Regresi Sederhana
Y
i
= |
0
+ |
1
X
i
+
i
|
0
dan |
1
: parameter dari fungsi yg nilainya akan diestimasi.
Adanya variabel
i
disebabkan karena:
C Ketidak-lengkapan teori
C Perilaku manusia yang bersifat random
C Ketidak-sempurnaan spesifikasi model
C Kesalahan dalam agregasi
C Kesalahan dalam pengukuran

http://rosihan.com
.
.
.
.

. .
.
.

i
= b
0
+ b
1
X
i
Y
i

i
X
Y
Y
i
= |
0
+ |
1
X
i
+
i
Variation
in Y
Systematic
Variation
Random
Variation
0
http://rosihan.com
METODE PENAKSIRAN PARAMETER DALAM EKONOMETRIK
Metode estimasi yang sering digunakan adalah Ordinary Least
Square (OLS). Dalam regresi populasi dikenal pula adanya
istilah PRF (Population Regression Function) dan dalam regresi
sampel sebagai penduga regresi populasi dikenal istilah SRF
(Sample Regression Function).
Y
i

e
i

u
i

0
X X
i

Y
X Y
^ ^ ^
| + o =
X ) Y ( E | + o =
SRF
PRF
P
Yi
^
http://rosihan.com




Persamaan Regresi dengan metode kuadrat terkecil
dapat diperoleh sebagai berikut :



Bagaimana Pengujian terhadap model regresi ??
parsial (per koefisien) uji-t
bersama uji-F (Anova)

Bagaimana menilai kesesuaian model ??
R
2
Koef. Determinasi
(% keragaman Y yang mampu dijelaskan oleh X)
PENGUJIAN MODEL REGRESI
Penelitian mengenai pengaruh Jumlah Tenaga Kerja terhadap
Biaya Produksi Tidak Langsung.

BULAN Biaya Produksi Tidak
Langsung (Jutaan rupiah)
Jumlah Tenaga Kerja
Januari 200 30
Februari 140 25
Maret 130 15
April 175 24
Mei 240 31
Juni 120 27
Juli 160 10
Agustus 90 9
September 300 29
Oktober 89 12
November 70 16
Desember 60 14
TAMPILAN VARIABEL VIEW
TAMPILAN DATA VIEW
Pilih Menu Analyze Regression Linear
Masukkan
Variabel
Terikat (Y)
Masukkan
Variabel
Bebas (X)
Klik tombol Statistics,
kemudian check list pada
pilihan Estimate, Model Fit
dan Descriptive Statistic.
Klik tombol Plots,
kemudian pilih pilihan
sebagai berikut di bawah
ini
Output 1 : Statistik Deskriptif
Bagian ini berisi penjelasan dan gambaran mengenai setiap
variabel
Rata-rata Biaya produksi tidak langsung per bulan selama satu
tahun adalah 147,83 juta sedangkan rata-rata jumlah tenaga
kerja per bulannya selama satu tahun adalah 20 orang
Standar deviasi untuk variabel Biaya Produksi tidak langsung
adalah 71,978 sedangkan untuk varibael Jumlah Tenaga Kerja
adalah 8,277
Descriptive Statistics
Mean Std. Deviation N
Biaya Produksi Tidak Langsung 147.83 71.978 12
Jumlah Tenaga Kerja 20.17 8.277 12
Output 2 : Korelasi
Correlations
Biaya Produksi
Tidak Langsung
Jumlah Tenaga
Kerja
Pearson Correlation Biaya Produksi Tidak Langsung 1.000 .716
Jumlah Tenaga Kerja .716 1.000
Sig. (1-tailed) Biaya Produksi Tidak Langsung . .004
Jumlah Tenaga Kerja .004 .
N Biaya Produksi Tidak Langsung 12 12
Jumlah Tenaga Kerja 12 12
Bagian ini untuk mengetahui ada dan tidaknya hubungan antara variabel X dan Y
Besar hubungan antara variabel By. Prod Tidak Langsung dan Jumlah Tenaga
Kerja adalah 0,716. Artinya terdapat hubungan yang kuat antara kedua variabel
tersebut.
Hubungan antara Biaya Prod Tidak Langsung dan Jumlah Tenaga Kerja adalah
Positif, artinya jika Jumlah tenaga kerja besar maka Biaya Prod. Tidak Langsung
juga meningkat
Hubungan antara variabel Biaya Produksi Tidak Langsung dengan Jumlah Tenaga
Kerja adalah signifikan karena angka signifikan (0,004) < 0,05.
Output 3 : Variabel yang dimasukkan/dikeluarkan
Variables Entered/Removed
b

Model Variables Entered
Variables
Removed
Method
1 Jumlah Tenaga Kerja
a
. Enter
a. All requested variables entered.
b. Dependent Variable: Biaya Produksi Tidak Langsung
Bagian ini menunjukkan informasi variabel yang dimasukkan
pada analisa regresi serta metode yang digunakan yaitu metode
ENTER
Output 4 : Ringkasan Model (Koefisien Determinasi)
Model Summary
b

Model R R Square Adjusted R Square
Std. Error of the
Estimate
1 .716
a
.513 .464 52.702
a. Predictors: (Constant), Jumlah Tenaga Kerja
b. Dependent Variable: Biaya Produksi Tidak Langsung
Bagian ini menunjukkan Koefisien Determinasi dari model. Koefisien
Determinasi (R
2
) digunakan untuk menghitung besarnya peranan atau
pengaruh variabel bebas terhadap variabel tergantung.
Dari tabel di atas dapat diketahui Koefisien Determinasi / KD / R Square
menunjukkan angka 0,513 artinya sebesar 51,3% biaya produksi tidak
langsung yang terjadi dapat dijelaskan oleh variabel jumlah tenaga kerja.
Sedangkan sisanya sebesar 48,7% (100% - 51,3%) dijelaskan oleh variabel-
variabel lain.
Untuk diketahui bahwa besarnya R Square berkisar antara 0 1. Semakin
mendekati 1 maka hubungan kedua variabel semakin kuat.
Koefisien Determinasi (R
2
) dapat dicari dengan
menggunakan rumus sebagai berikut :
Lanjutan Output 4 : Ringkasan Model (Koefisien Determinasi)
Model Summary
b

Model R R Square Adjusted R Square
Std. Error of the
Estimate
1 .716
a
.513 .464 52.702
a. Predictors: (Constant), Jumlah Tenaga Kerja
b. Dependent Variable: Biaya Produksi Tidak Langsung
Selanjutnya dari output bagian 4 ini, diperoleh angka Standar Error Of
the Estimate (SSE) adalah 52,702 (untuk variabel By. Prod. Tidak
Langsung).
Jika angka tersebut dibandingkan dengan angka Standar Deviasi (STD)
pada Output 1 yaitu sebesar 71,98, maka angka SSE lebih kecil. Hal ini
berarti angka SSE baik untuk dijadikan angka predictor dalam
menentukan besarnya biaya produksi tidak langsung.
Angka yang baik untuk dijadikan sebagai predictor variabel tergantung
harus lebih kecil dari angka Standar Deviasi (SSE < STD).
Output 5 : ANOVA
ANOVA
b

Model Sum of Squares df Mean Square F Sig.
1 Regression 29214.496 1 29214.496 10.518 .009
a

Residual
27775.170 10 2777.517
Total
56989.667 11
a. Predictors: (Constant), Jumlah Tenaga Kerja
b. Dependent Variable: Biaya Produksi Tidak Langsung
Bagian ini menampilkan hasil dari Analysis of Variance (ANOVA).
Teknik ANOVA digunakan untuk menguji distribusi atau variansi
means dalam variabel penjelas secara simultan atau bersama-sama
apakah telah signifikan menjelaskan variasi dari variabel yang
dijelaskan.
Pengujian persamaan secara simultan ini dilakukan dengan
melakukan pembandingan antara F Hitung dengan F tabel sehingga
sering disebut sebagai Uji F.
Uji Simultan Koefisien Regresi : Uji F
Hasil Uji Anova tersebut berasal dari :
MODEL
Sum of
Square
DF
Mean
Square
F
Regresi SSR k - 1 MSR MSR / MSE
Residual SSE n k MSE
Total SSTO
H
0
: |
1
=

|
2
= 0 Variabel bebas secara serentak tidak
signifikan mempengaruhi variabel terikat.
H
1
: |
1
= |
2
= 0 Variabel bebas secara serentak signifikan
mempengaruhi variabel terikat
Aturan dalam Uji F :
Jika F Hitung > F Tabel Tolak H0 sehingga H1 diterima (Signifikan)
Jika F Hitung < F Tabel Terima H0 sehingga H1 ditolak (Tidak Signifikan)

Atau dapat juga menggunakan Nilai Signifikansi :
Jika Sig < 0.05 Tolak H0 sehingga H1 diterima (Signifikan)
Jika Sig > 0.05 Terima H0 sehingga H1 ditolak (Tidak Signifikan)
Uji Simultan Koefisien Regresi : Uji F
Output 5 : ANOVA
ANOVA
b

Model Sum of Squares df Mean Square F Sig.
1 Regression 29214.496 1 29214.496 10.518 .009
a

Residual
27775.170 10 2777.517
Total
56989.667 11
a. Predictors: (Constant), Jumlah Tenaga Kerja
b. Dependent Variable: Biaya Produksi Tidak Langsung
Dari Output tersebut di atas, dapat disimpulkan :
F hitung (10,518) > F tabel (5%, 1, 10) (4.96)
Dan Nilai Sig. (0,009) < 0,05

Maka H0 ditolak dan terima H1 yang berarti bahwa Variabel
Bebas secara simultan signifikan mempengaruhi Variabel
terikat yaitu Biaya Produksi Tidak Langsung
Uji Simultan Koefisien Regresi : Uji F
Coefficients
a

Model
Unstandardized
Coefficients
Standardized
Coefficients
t Sig. B Std. Error Beta
1 (Constant)
22.276 41.596 .536 .604
Jumlah Tenaga Kerja
6.226 1.920 .716 3.243 .009
a. Dependent Variable: Biaya Produksi Tidak Langsung
Output 6 : KOEFISIEN REGRESI
Dari Output tersebut dihasilkan persamaan regresi sebagai berikut :

Y = 22,276 + 6,226 X
(0,536) (3,243)

Dimana Y adalah Biaya Produksi Tidak Langsung dan X adalah
Jumlah Tenaga Kerja
Uji Parsial Koefisien Regresi : Uji T
Uji Parsial Koefisien Regresi dilakukan untuk
mengetahui apakah Variabel bebas secara parsial
(sendiri-sendiri) signifikan mempengaruhi Variabel
terikat.
Uji Parsial dilakukan dengan membandingkan T hitung
dengan T tabel sehingga sering disebut Uji T.
Degree of Freedom pada uji T adalah n-1
T hitung dapat dicari dengan rumus berikut :



H
0
: |

= 0 Variabel bebas secara parsial tidak signifikan
mempengaruhi variabel terikat.
H
1
: |

0 Variabel bebas secara parsial signifikan mempengaruhi
variabel terikat
Aturan dalam Uji T :
Jika T Hitung > T Tabel Tolak H0 sehingga H1 diterima (Signifikan)
Jika T Hitung < T Tabel Terima H0 sehingga H1 ditolak (Tidak Signifikan)

Atau dapat juga menggunakan Nilai Signifikansi :
Jika Sig < 0.05 Tolak H0 sehingga H1 diterima (Signifikan)
Jika Sig > 0.05 Terima H0 sehingga H1 ditolak (Tidak Signifikan)
Uji Parsial Koefisien Regresi : Uji T
Coefficients
a

Model
Unstandardized
Coefficients
Standardized
Coefficients
t Sig. B Std. Error Beta
1 (Constant)
22.276 41.596 .536 .604
Jumlah Tenaga Kerja
6.226 1.920 .716 3.243 .009
a. Dependent Variable: Biaya Produksi Tidak Langsung
Output 6 : KOEFISIEN REGRESI
Dari tabel tersebut diperoleh informasi sebagai berikut :
O Nilai t hitung untuk konstanta (a atau |
0
) adalah sebesar 0,536
dengan nilai sig. Senilai 0,604
T hitung (0,536) < T tabel (0.05, 11) (1,796) Maka H0 diterima
Nilai Sig (0.604) > 0.05 Maka H0 diterima
Hal tersebut berarti, konstanta tersebut tidak signifikan
mempengaruhi variabel Biaya Prod Tidak Langsung.
O Nilai t hitung untuk koefisien X (b atau |
1
) adalah sebsar
3,243 dengan nilai sig. 0,009
T hitung (3,243) > T tabel (0.05, 11) (1,796) Maka H0
ditolak
Nilai Sig (0,009) < 0,005 Maka H0 ditolak
Artinya, koefisien Variabel Jumlah Tenaga Kerja (X) secara
signifikan mempengaruhi variabel Biaya Produksi Tidak
Langsung.
Uji Parsial Koefisien Regresi : Uji T
Output 6 : HISTOGRAM
Output 6 : Normal P-P Plot
Grafik di samping
menunjukkan
normalitas sebaran data.
Jika residual berasal dari
distribusi normal, maka
nilai-nilai sebaran data
akan berada pada area di
sekitar garis lurus.
Output 6 : Persyaratan Kelayakan Model Regresi (Model Fit)
Model regresi layak
digunakan untuk
memprediksi jika data
yang tersebar berpencar
di sekitar angka 0 pada
sumbu Y serta tidak
membentuk pola atau
kecenderungan
tertentu.