ANALISIS REGRESI
Tujuan Umum
Pada bab ini, akan dibahas hubungan antara variabel -variabel, yaitu analisis
regresi menghasilkan suatu persamaan yang dapat digunakan untuk
mengestimasi atau memprediksi nilai suatu variabel ( sering disebut
variabel dependen ) berdasarkan variabel yang lain ( sering disebut varabel
independen atau variabel bebas ). Persamaan estimasi ditentukan dari
perhitungan-perhitungan berdasarkan data yang diobservasi. Ada beberapa
bentuk persamaan regresi, di antaranya: r egresi linier sederhana, regresi
linier berganda, dan regresi non -linier.
Tujuan Khusus
Jumlah Penduduk dan Jumlah Motor yang Terjual pada Sepuluh Daer ah di
Suatu Propinsi
X
Y
Gambar 13.1 Diagram Pencar Regresi Linier
Dengan menggunakan diagram ini , kita dapat melihat apakah ada suatu
hubungan yang berarti di antara kedua variabel itu? Apakah ada gejala
bahwa letak titik -titik itu pada atau sekitar garis lurus? Jika demikian
halnya, cukup alasan bagi kita untuk menduga bahwa antara variabel -
variabel itu ada hubungan linier.
Setelah diketahui bentuk hubungan antara variabel -variabel itu, tugas
selanjutnya ialah menentukan hubungan tersebut dirumuskan dalam suatu
persamaan matematis. Tegasnya, antara variabel yang dinyatakan oleh X
dan Y itu, akan d itentukan hubungan Y = f (X). Apabila X merupakan
variabel yang nilai -nilainya dapat ditentukan terlebih dahulu, hubungan X
= g (Y) dengan syarat harga variabel Y sudah diketahui terlebih dahulu.
Apabila hubungan Y = f (X) atau X = g (Y) digambarkan bersa ma-sama
dengan diagram pencarnya, akan didapatkan sebuah garis. Garis ini dikenal
dengan nama garis regresi. Jika hubungan Y = f (X) atau X = g (Y) itu
linier, didapat garis regresi linier. Dalam hal lainnya didapat regresi
nonlinier.
regres i nonlinier
* * *
*
*
* *
* * *
* *
*
*
*
Yi = an + b X i
2
X i Yi = a X i + b X i ...............................(13 − 2)
Setelah persamaan (13 - 2) diselesaikan, akan didapat harga -harga a dan b
yang kita cari yaitu :
n X iYi − ( X i )( Yi )
b= ............................(13 − 3)
n X i − ( X i ) 2
2
Untuk menjelaskan penggunaan rumus (13 - 3), kita lihat contoh soal
mengenai jumlah penduduk dan jumlah motor yang terjual yang datanya
terdapat dalam tabel 13.1. Dari diagram pencar Gam bar 13.1, mudah dilihat
bahwa titik-titik itu terletak di sekitar garis lurus. Untuk menentukan
regresi linier Y atas X, dibuat sebuah tabel seperti tabel 13.2 untuk
memudahkan perhitungan
Tabel 13.2
Nilai-nilai yang Perlu untuk Menghitung Persamaan Reg resi
X Y X² XY
36 54 1296 1944
26 30 676 780
12 28 144 336
40 48 1600 1920
24 36 576 864
18 30 324 540
30 38 900 1140
30 46 900 1380
14 16 196 224
34 42 1156 1428
X = 264 Y = 368 X 2
= 7768 XY = 10556
(368)(7768) − ( 264)(10556)
a = = 8,998002
(10)(7768) − ( 264) 2
(10)(10556) − ( 264)(368)
b = = 1,053106
(10)(7768) − ( 264) 2
x = + X ...................(13 − 4)
Untuk menyatakan regresi Y atas X dengan x, berarti rata -rata nilai Y
untuk X yang diketahui.
Koefisien-koefisien a dan b seperti dalam rumus (1 3 - 3) akan menjadi
titik taksiran untuk koefisien -koefisien dan .
Seperti dalam hal menaksir parameter lainnya yang terdapat interval
taksiran selain titik taksiran, untuk regresi pun terdapat pula interval
taksiran.Untuk menentukan taksiran ini, diperlukan sifat -sifat distribusi
sampling koefisien arah garis regresi. Asumsi-asumsi mengenai X dan Y
juga harus diambil, yaitu
1) untuk harga X yang diketahui, variabel tak bebas Y bersifat bebas dan
berdistribusi normal dengan rata -rata + X dan simpa ngan bakunya
y.x;
2) simpangan baku y.x. dimisalkan sama untuk setiap X yang diberikan
Akan diperoleh nilai -nilai rata-rata b dan simpangan baku b sebagai
b =
yx
b = .....................(13 − 5)
X i − n( X ) 2
2
(Yi − Yi ) 2
S YX = .................(13 − 6)
n−2
Yi − a Yi − b X i Yi
2
SY . X = ..............(13 − 7)
n−2
Dari tabel 13.2 diperoleh nilai -nilai sebagai berikut :
b − Z 1 / 2 . b b + Z 1 / 2 . b ........(13 − 9)
^ Syx ^ Syx
Y − Z1 / 2 x Y + Z 1 / 2 ................(13 − 12)
n n
Dengan:
1) Y didapat dari persamaan regresi dengan mensubstitusikan X
yang diketahui;
2) Syx = kekeliruan standar taksiran ;
Untuk sampel -sampel yang berukuran kecil, rumus (13 -12) kurang tepat
hasilnya. Sebagai gantinya, jika koefisie n kepercayaan = ( 1-p ), rumus
interval taksiran untuk rata -rata x adalah :
2
^ (X − X ) ^ (X − X )2
Y − t p Syx 1 / n + x Y + t p Syx 1 / n + .......(13 − 13)
X i − n( X ) 2 X i − n( X ) 2
2 2
^ n +1 ( X − X )2 ^ n +1 ( X − X )2
Y − Z / 2 .Syx + Y Y + Z / 2 .Syx + ..........(13 − 14)
n X i 2 − n( X ) 2 n X 2 i − n( X ) 2
Jika sampel yang digunakan sebagai bahan ramalan itu berukuran kecil,
rumus (13-14) tidak dapat digunakan. Untuk meramalkan individu Y dengan
ukuran sampel kecil dengan koefisien kepercayaan = ( 1- p ), digunakan
bentuk
^ n +1 ( X − X )2 ^ n +1 ( X − X )2
Y − tp.Syx + Y Y + tp.Syx + ..........(13 − 15)
n X i 2 − n( X ) 2 n X 2 i − n( X ) 2
Contoh 13.1 :
Dalam tempo delapan tahun, hubungan antara Produk Nasional Kotor
(dinyatakan oleh Y) dan hasil jualan tahunan minyak mentah (dinyatakan
oleh X) di suatu nega ra, ditentukan oleh :
Y = -3,21 + 0,02453 X
Dengan X, Y dalam milyar unit uang di negara itu.
a) Apakah arti 0,02453 ?
b) Jika hasil penjualan tahunan minyak mentah mencapai harga 285
milyar unit uang, berapakah Produk Nasional Kotor di negara itu
diperkirakan untuk tahun tersebut ?
c) Jika selanjutanya diketahui Syx =0,241 dan X² = 1.089.413,
Pemecahannya :
a) Angka koefisien regresi 0,02453 berarti Produk Na sional Kotor rata -rata
setiap tahun bertambah dengan 0,02453 milyar unit uang untuk
pertambahan hasil penjualan tahunan minyak mentah setiap milyarnya.
b) Substitusikan X = 285 maka didapat taksiran nilai Y yaitu Y = -3,21 +
0,02453 x 285 = 3,78105. Untuk hasil penjualan tahunan minyak mentah
0,241
Sb = = 0,00177
2.927 2
1.089.413 − 8 x ( )
8
1 ( 285 − 365,875) 2
3,78105 − ( 2,4469)(0,241) + x
8 1.089,413 − 8(365,875) 2
1 ( 285 − 365,875) 2
3,78105 + ( 2,4469)(0,241) +
8 1.089,413 − 8(365,875) 2
8 +1 ( 285 − 365,975) 2
3,78105 − ( 2,4469)(0,241) + Y
8 1.089,413 − 8(365,875) 2
8 +1 ( 285 − 365,975) 2
3,7810 + ( 2,4469)(0,241) +
8 1.089,413 − 8(365,875) 2
(b − o) Sx
t = n − 1.................(13 − 16)
Syx
dengan:
Pemecahannya :
Rumusan Hipotesisnya adalah :
H : = 0
A: ≠ 0
8(1.089.413) − ( 2.927) 2
Sx = = 51,4
8(8 − 1)
(0,02453 − 0)51,4044
t = 8 − 1 = 13,8432
0,241
Contoh 13.3:
Tabel di bawah ini menyatakan biaya iklan dan besarnya penjualan dari
suatu barang selama 13 bulan. Selanjutnya, akan dilihat hubungan antara
biaya iklan dan besarnya hasil penjualan.
a) Misalnya dari diagram penca r, ternyata sebuah parabola merupakan
lengkungan yang cocok dengan letak titik -titik diagram itu. Tentukanlah
persamaannya untuk memperkirakan besarnya penjualan apabila
besarnya biaya iklan diketahui.
b) Berapakah rata -rata besarnya hasil penjualan jika rata -rata biaya iklan
sebesar Rp 50 juta.
Pemecahannya :
a) Untuk mem perkirakan besarnya hasil penjualan (Y) jika diketahui
besarnya biaya iklan (X), regresi kuadratik mempunyai persamaan Y
= a + bX + cX² dengan a, b, dan c ditentukan berdasarkan data yang
diketahui.
Untuk mempermudah perhitungan, dibuat tabel sebagai b erikut
Bulan X Y XY X²Y X² X³ X4
1 32 53 1696 54272 1024 32768 1048576
2 28 51 1428 39984 784 21968 614656
3 33 58 1914 63162 1089 35937 1185921
4 35 62 2170 75950 1225 42875 1500625
5 48 66 2508 95304 1444 54872 2085136
6 42 70 2940 123480 1764 74088 3111696
7 47 73 3725 175075 2209 103823 4879681
8 43 69 2967 127581 1849 79507 3418801
9 43 72 3096 133128 1849 79507 3418801
10 56 72 4032 225792 3136 175616 9834496
11 54 70 3780 204120 2916 157464 8503056
12 51 72 3672 187272 2601 132651 6765201
13 51 68 3876 220932 3249 185193 10556001
Juml. 559 856 37804 1726052 25139 1176253 56922647
( log Yi )( X i ) − ( X i )( X i log Yi )
2
log a =
( )
n X i − ( X i ) 2
2
Yi Yi
a=
n X i − ( X i )
2 2
Xi 1
n ( ) − ( X i ). ( )
Yi Yi
b= .................................(13 − 27 )
n X i − ( X i )
2 2
Soal-soal Latihan :
1) Apakah yang dimaksudkan dengan
a) persamaan regresi,
b) regresi linier,
c) regresi nonlinier,
d) regresi linier Y atas X,
e) regresi linier Y atas X,
f) regresi linier X atas Y,
g) regresi linier berganda,
h) metode kuadrat terkecil?
2) Jelaskan perbedaan mengenai
a) regresi linier dan regresi nonlinier,
b) taksiran rata -rata dan taksiran individu dalam regresi linier satu
variabel,
c) simpangan baku dan simpangan baku bersyarat!
3) Penjualan sabun cuci kelihatannya sangat bergantung kepada iklan.
Pengeluaran dan penjualan tahunan untuk iklan beberapa merek sabun cuci
adalah sebagai berikut:
2 2
nY i = 855.766, nX i = 19.207.423 dan nX I Y I = 4.047.975
5) Pada soal No. 4 di atas, ada dugaan bahwa besarnya penjualan dalam
minggu berikutnya tidak bergantung pada besarnya barang yang dipesan
minggu sebelumnya. Apakah ya ng harus diuji dalam hal ini ? Coba
lakukanlah dengan mengambil = 0,05 !