SEDERHANA
9.1 Pengantar
Dalam bab ini akan dibahas analisis hubungan antara dua variabel, yaitu
regresi linear sederhana dan korelasi. Regresi yang melibatkan variabel teri-
kat dengan hanya satu variabel bebas yang disebut regresi linear sederhana,
akan menunjukkan bagaimana sifat (pola) hubungan antara dua variabel ter-
sebut atau bagaimana pengaruh variabel bebas terhadap variabel terikatnya.
Sementara analisis korelasi akan menunjukkan keeratan (kuat-lemahnya) hu-
bungan antara kedua variabel tersebut. Kedua analisis ini, umumnya dibahas
secara bersamaan.
Tujuan bab ini. Setelah mempelajari bab ini peserta didik (mahasiswa) di-
harapkan dapat memahami dengan baik mengenai regresi dan korelasi yang
sederhana. Dapat menyusun persamaan regresi yang linear, dapat menaksir
nilai variabel terikat berdasarkan variabel bebas yang nilainya telah diketahui,
dapat memberikan interpretasi terhadap nilai koefisien regresi. Selain itu juga
mahasiswa diharapkan dapat menghitung koefisien korelasi dan sekaligus
mampu memberikan interpretasi atas nilainya
ki-laki dengan tinggi badan ayahnya. Kajian Galton ini menunjukkan hasil
bahwa: “Tinggi badan anak laki-laki dari ayah yang tinggi setelah beberapa
generasi cendrung mundur (regresed) mendekati nilai tengah populasi”.
Sekarang istilah regresi, tidak demikian lagi, regresi oleh para statisi di-
terapkan hampir di semua bidang ilmu, untuk menaksir atau meramalkan ni-
lai satu variabel berdasarkan variabel lain yang nilainya telah diketahui, dan
kedua variabel tersebut memiliki hubungan fungsional atau sebab-akibat satu
dengan yang lainnya.
Dalam bidang ekonomi dan bisnis misalnya, jumlah modal mempengaru-
hi jumlah produksi, suku bunga mempengaruhi jumlah investasi, biaya iklan
mempengaruhi nilai penjualan, dan tingkat pendapatan mempengaruhi be-
sarnya konsumsi. Keempat contoh tersebut, menunjukkan hubungan sebab-
akibat antara dua variabel . Dalam bahasa matematisnya modal, tingkat suku
bunga, biaya iklan dan tingkat pendapatan disebut variabel bebas (variabel
yang mempengaruhi) dan umumnya disimbolkan dengan X. Sedangkan jum-
lah produksi, besarnya investasi, nilai penjualan dan konsumsi disebut varia-
bel terikat (variabel yang dipengaruhi), atau variabel yang nilainya ditentukan
oleh nilai variabel X, dan umumnya disimbolkan dengan Y.
Hubungan fungsional (sebab-akibat) antara variabel bebas (X) dan variabel
terikat (Y), dalam bentuk fungsi dinyatakan sebagai Y = f(X). (dibaca : Y fungsi
dari X), yang artinya nilai variabel Y tergantung dari atau dipengaruhi oleh
nilai variabel X. Sifat hubungan antara variabel bebas (X) dengan variabel
terikat (Y), dapat positip, negatif atau tidak ada hubungan. Hubungan positip
yang juga disebut hubungan searah, artinya bila nilai X naik maka nilai Y juga
naik atau sebaliknya bila nilai X turun, nilai Y juga turun. Hubungan negatif
disebut juga hubungan berlawanan arah, artinya bila nilai X naik maka nilai Y
akan turun atau sebaliknya bila nilai X turun maka nilai Y akan naik. Tidak ada
hubungan, artinya bila nilai X berubah (naik / turun), maka nilai Y tidak berubah
atau tetap. Hubungan antara biaya iklan dan hasil penjualan, tingkat suku
bunga bank dan deposito, harga suatu barang dan penawaran, merupakan
tiga contoh dari dua variabel yang memiliki hubungan yang bersifat positif.
Hubungan tingkat suku bunga dengan investasi, jumlah peserta KB dan tingkat
kelahiran, harga suatu barang dan jumlah barang yang diminta, merupakan
tiga contoh dari dua variabel yang memiliki hubungan yang bersifat negatif.
Usia kendaraan dan tinggi gedung, kecepatan kendaraan dan jumlah bayi
yang lahir, jumlah jembatan yang dibangun dan usia seseorang. Merupakan
tiga contoh dua variabel yang tidak memiliki hubungan.
Bila ketiga jenis sifat hubungan antara dua variabel tersebut dinyatakan
dalam grafik, bentuk grafiknya seperti Grafik 9.1.
Grafik 9.1
Tiga grafik yang menyatakan hubungan variabel X dan Y
Diagram 9.2
Empat Bentuk Scatter Diagram
ei = a + bX
Y
0 X
Agar jumlah kuadrat simpangan vertikal ke garis regresi yaitu ∑(Yi - )2 sekecil
mungkin, maka ∑(Yi - )2 = ∑(ei)2 diminimumkan terhadap a dan b. Dengan
bantuan kalkulus diferensial (derevasi parsial) didapatlah dua persamaan
normal yaitu persamaan (9.1) dan persamaan (9.2). Dengan menyelesaikan
kedua persamaan ini secara simultan, maka nilai a dan b dari persamaan linear
= a + bx, dapat dihitung.
Dalam bentuk lain, kedua persamaan normal di atas dapat dinyatakan seba-
gai:
b= (9.3)
a= (9.4)
Koefisien regresi b pada (9.3) dapat juga dihitung melalui bentuk deviasi/
penyimpangan masing-masing data terhadap mean-nya masing-masing yaitu
( = dan ( = ,, sebagai berikut :
∑xiyi
b = ––––– (9.5)
∑xi2
Contoh 9-1
Sebuah sampel acak yang terdiri dari 6 (enam) pasangan data mengenai
besarnya pendapatan dan konsumsi bulanan dari 6 (enam) karyawan peru-
sahaan swasta yang bergerak dalam bidang pariwisata (dalam juta rupiah)
adalah sebagai berikut (data hipotesis):
Pendapatan (X) 8 12 16 20 24 26
Konsumsi (Y) 7 9 12 14 13 15
Penyelesaian
(a) Menyusun persamaan regresi
Tabel 9.1 Perhitungan Untuk Persamaan Regresi
xi = yi =
Xi Yi Xi Yi Xi2 Yi2 xi yi xi2
xi- Yi-Ῡ
8 7 56 64 49 -9,67 -4,67 45,16 93,51
12 9 108 144 81 -5,67 -2,67 15,14 32,15
16 12 192 256 144 -1,67 0,33 -0,55 2,79
20 14 280 400 196 2,33 2,33 5,43 5,43
24 13 312 576 169 6,33 1,33 8,42 40,07
26 15 390 676 225 8,33 3,33 27,74 69,39
106 70 1.338 2.116 864 101,34 243,34
Dari Tabel 9.1, dapat diketahui ∑Xi = 106, ∑Yi = 70, ∑Xi Yi = 1338,
∑Xi2 = 2116, ∑Yi2 = 864 dan ∑XiYi = 101,34 ; ∑Xi2 = 243,34 dan n = 6
= = = 17, 67 = = = 11,67
Per rumus (9.3) atau rumus (9.5) dapat dihitung koefisien regresi b, seba-
gai berikut:
b=
6(1.338) − (106)(70)
=
6(2.116) − (106) 2
= 0,42
Contoh 9-2
Lima pasangan data sampel di bawah ini adalah data mengenai nilai investasi
dan suku bunga lima tahun terakhir pada suatu daerah (data hipotetis)
Suku Bunga
12 14 15 16 17
(% per tahun)
Nilai Investasi
100 80 60 50 40
(miliar rupiah)
Penyelesaian
(a) Menyusun persamaan regresi.
= = = 14,8 = = = 66
b =
= -12,43
∑ ( Yi − Ŷ )2
S Yx = n− 2 (9.6)
atau
S Yx
=
∑ Yi2 − a∑ Yi − b∑ XiYi (9.7)
n−2
Diagram 9.3
Tiga buah garis regresi dengan penyimpangannya
Kesalahan baku dari dugaan ini secara langsung menunjukkan tingkat pen-
caran data. Semakin besar nilai S Y berarti semakin tersebar titik-titik yang bera-
x
da sekitar garis regresi (semakin jauh letak titik-titik dari garis regresi). Semakin
kecil nilai S Y semakin dekat titik-titik yang berada disekitar garis regresi. Apabi-
x
la nilai S Y = 0, ini berarti semua titik-titik berada tepat pada garis regresi, yang
x
berarti pula bahwa garis regresi dapat dipergunakan secara sempurna untuk
menaksir variabel terikat, Y.
Pada Diagram 9.3a letak titik-titik lebih mendekati garis regresi dibanding
kan dengan pada Diagram 9.3b, pada Diagram 9.3c, semua titik-titik terletak
tepat sepanjang garis regresi. Ini berarti untuk data Diagram 9.3a lebih
kecil dari untuk data Diagram 9.3b, dan untuk data pada Diagram 9.3c
adalah nol.
Contoh 9-3
Berdasarkan data pada Contoh 9.2, hitunglah kesalahan baku dari dugaan
dan berikan interpretasi.
Penyelesaian
Dari hasil perhitungan Tabel 9.2, telah diperoleh bahwa ∑Yi = 330, ∑Yi2 =
24.100, ∑XiYi = 4.700, a = 249,96; b =-12, 43 dan diketahui n = 5.
= 3,38
Jadi, kesalahan baku dari dugaan adalah Rp3,38 miliar.
Interpretasi nilai . Nilai = Rp3,38 miliar, memiliki arti bahwa sekitar
68% dari seluruh residual (beda nilai investasi dan nilai taksirannya) terletak
antara minus (1 x ) = Rp3,38 miliar dan (1 x ) = Rp3,38 miliar. Sekitar
95% residual letaknya antara minus (2 x ) = Rp6,76 miliar dan (2 x ) =
Rp 6,76 miliar, dan hampir seluruh residualnya (sekitar 99,7%) terletak antara
minus (3 x ) = Rp 10,14 miliar dan (3 x ) = Rp10,14 miliar.
Contoh 9-4
Berdasarkan data Contoh 9.1, hitunglah kesalahan baku dari dugaan.
Penyelesaian
Dari hasil perhitungan Tabel 9.1, diperoleh ∑Yi = 70, ∑Yi2 = 864, ∑Xi Yi =
1338, a = 4,25; b = 0,42 dan diketahui n = 6
= 1,07
Nilai = 1,07 ribu rupiah, memiliki arti bahwa sekitar 68% dari seluruh
residual (beda nilai konsumsi dan nilai taksirannya) terletak antara minus
Rp1,07 ribu dan Rp1,07 ribu . Sekitar 95% nilai residualnya terletak antara
minus Rp2,14 ribu dan Rp2,14 ribu , dan hampir seluruh residualnya (sekitar
99,7%) terletak antara minus Rp3,21 ribu dan Rp3,21 ribu.