1. Korelasi
Pada semua kejadian, baik kejadian ekonomi maupun lainnya, pasti ada faktor yang
menyebabkan terjadinya kejadian-kejadian tersebut. Misal, angka penjualan suatu barang yang
turun disebabkan oleh naiknya harga barang tersebut. Contoh lain, seorang anak yang tidak
Uraian di atas menunjukkan adanya hubungan atau korelasi antara kejadian yang satu
dengan kejadian yang lainnya. Kejadian itu dapat dinyatakan dengan perubahan nilai variabel.
Misal, jika x merupakan variabel harga, maka naik turunnya harga dapat dinyatakan dengan
perubahan nilai x. Dan apabila y merupakan variabel hasil penjualan, maka naik turunnya hasil
penjualan dapat dinyatakan dengan perubahan nilai y. Jadi, hubungan antara dua kejadian dapat
dinyatakan dengan hubungan dua variabel x dan y. Disini saya hanya akan menjelaskan tentang
hubungn antara dua variabel, hubungan linier lebih dari dua variabel akan dijelaskan pada
subbab berikutnya.
Pada contoh diuraian sebelumnya, kita tentu setuju jika dikatakan bahwa naik turunnya
harga mempengaruhi hasil penjualan. Namun dalam hal ini kita tidak tahu pasti seberapa besar
pengaruhnya. Analisis korelasi yang akan dibahas kali ini berfungsi untuk mengetahui seberapa
2. Ukuran korelasi
Hubungan dua variabel ada yang positif dan negatif. Suatu hubungan dikatakan positif
x = pupuk, y = produksi
Apabila diagram pencar tidak teratur, artinya kenaikan/penurunan x tidak berpengaruh pada
3. Koefisien korelasi
Kuat dan tidaknya hubungan antara x dan y apabila dinyatakan denagn fungsi linier,
diukur dengan suatu nilai yang disebut koefisien korelasi (r). Nilai koefisien korelasi ini paling
sedikit bernilai -1 dan paling besar bernilai 1. Jadi dapat dinyatakan sebagai berikut:
-1<= r >= 1
Artinya:
Jika r = 1, hubungan x dan y sempurna dan positif (mendekati 1, yaitu hubungan sangat kuat dan
positif).
Jika r = -1, hubungan x dan y sempurna dan negatif (mendekati -1, yaitu hubungan sangat kuat
dan negatif).
Jika r = 0, tidak ada hubungan atau lemah sekali hubungan antara x dan y.
4. Koefisien Penentu
nilai y. Namun dalam diagram pencar, nilai y memiliki nilai yang bervariasi meskipun nilai y
naik dalam deret ukur. Hal ini terjadi karena nilai y tidak hanya dipengaruhi oleh variabel x
namun juga beberapa faktor lain. Misal, hasil penjualan tidak hanya dipengaruhi oleh harga pasar
tapi melainkan juga dipengaruhi oleh pendapatan masyarakat, selera, dll. Dari sini timbul
pertanyaan, beraa besarnya kontribusi dari x terhadap naik turunnya nilai y? Untuk menjawab
pertanyaan ini harus dihitung dulu suatu koefisien yang disebut keofisien determinasi atau
KP = r2
Jika r = 0.9 maka nilai KP = (0.9)2 = 0.81 atau 81%. Hal ini berarti besar kontribusi dari x
terhadap nilai y sebesar 81%, dan 19% lainnya adalah kontribusi dari faktor-faktor lainnya.
1. Jika x adalah presentase kenaikan biaya iklan dan y adalah presentase kenaikan
hasil penjualan, kemudian berdasarkan tabel dibawah ini, hitunglah koefisien korelasi (r)!
x 1 2 4 5 7 9 10 12
Y 2 4 5 7 8 10 12 14
Penyelesaian :
untuk menghitung r diperlukan lembaran kerja yang disusun berdasarkan rumus sebagai berikut :
Y x2 y2
2 1 4 2
4 4 16 8
5 16 25 20
7 25 49 35
8 49 64 56
10 81 100 90
12 100 144 120
14 144 196 168
yi = 62 xi2 = 420 yi2 = 598 xiyi
2. 2. Jika X adalah presentase kenaikan harga dan Y adalah presentase kenaikan hasil penjualan,
kemudian berdasarkan tabel dibawah ini, hitunglah koefisien korelasi (r) dan kofisien
determinasi (KP) !
X 2 4 5 6 8 10 11 13 14 15
Y 15 14 12 10 9 8 6 4 3 2
Penyelesaian :
untuk menghitung r diperlukan lembaran kerja yang disusun berdasarkan rumus sebagai berikut :
X Y X2 Y2 XY
2 15 4 225 30
4 14 16 196 56
5 12 25 144 60
6 10 36 100 60
8 9 64 81 72
10 8 100 64 80
11 6 121 36 66
13 4 169 16 52
14 3 196 9 42
15 2 225 4 30
Kesimpulan: hubungan X dan Y kuat dan negatif. Dengan demikian, nilai KP = r2 = (-0.99)2 =
Apa perlunya mengetahui hubungan antar variable? Di dalam perencanaan, selain data
masa lampau dan masa sekarang, juga diperlukan data hasil ramalan yang menggambarkan
memerlukan ramalan hasil penjualan (kemampuan menjual di masa yang akan datang, sehingga
Apabila dua variable X dan Y mempunyai hubungan, maka nilai variable X yang sudah
Variable Y yang nilainya akan diramalkan disebut variable tidak bebas (dependent
variable), sedangkan variable X yang nilainya digunakan untuk meramalkan nilai Y disebut
Jadi analisis korelasi membantu kita untuk mengetahui seberapa kuat hubungan antara dua
2. Membantu menentukan jenis persamaan yang akan digunakan untuk menentukan hubungan
tersebut..
6. Diagram pencar
Jika terdapat sebuah data antara dua variable dan kita belum dapat memastikan apakah data
tersebut memiliki hubungan satu sama lain atau tidak, cara untuk mengetahuinya adalah dengan
Pada kesempatan ini hanya akan dijelaskan mengenai regresi linear sederhana yakni regresi
yang berbentuk garis lurus atau linear (gambar (a), dan (b)).
a : konstanta b : kemiringan/gradien
Penetapan Persamaan Regresi Linier Sederhana
1. Berikut adalah data Biaya Promosi dan Volume Penjualan PT BIMOIL perusahaan Minyak
x Y
1992 2 5 10 4 25
1993 4 6 24 16 36
1994 5 8 40 25 64
1995 7 10 70 49 100
persama
2. Diketahui hubungan Biaya Promosi (x dalam Juta Rupiah) dan y (Volume penjualan dalam
Ratusan Juta liter) dapat dinyatakan dalam persamaan regresi linier berikut
y = 2.530 + 1.053 x. Perkirakan Volume penjualan jika dikeluarkan biaya promosi Rp. 10 juta ?
x = 10
Dalam menggunakan persamaan regresi untuk melakukan suatu perkiraan, terdapat satu
pertanyaan penting mengenai seberapa kuat hubungan antar variable bebas dan terikatnya; atau
dengan kata lain, seberapa besar derajat ketergantungannya (dependability) hasil perkiraan
tersebut. Hal ini dapat lebih dimengerti dengan memperhatikan gambar 4 (a), terlihat bahwa
titik-titik data terpencar lebih rapat di sekitar garis regresi dibandingkan dengan titik-titik data
pada gambar 4 (b). Dengan nalar secara awam saja, kita dapat mengatakan bahwa suatu estimasi
yang dilakukan dengan persamaan garis regresi untuk keadaan pada gambar 4 (a) akan lebih baik
Ukuran yang mengindifikasi derajat variasi sebaran data di sekitar garis regresi dapat
menunjukkan seberapa besar derajat keterikatan perkiraan yang diperoleh dengan menggunakan
persamaan regresi tersebut. Ukuran ini dinamakan sebagai standar error estimasi. Dalam definisi
yang lebih tepat standar error estimasi estimasi (sy,x) adalah deviasi standar yang memberikan
ukuran penyebaran nilai-nilai yang teramati di sekitar garis regresi, dirumuskan sebagai berikut:
Contoh soal:
Dari suatu praktikum fisika dasar diperoleh data yang menghubungkan variabel bebas x dan
Ujian ke- x y
1 6 30
2 9 49
3 3 18
4 8 42
5 7 39
6 5 25
7 8 41
8 10 52
S 56 296
Jika diasumsikan memiliki bentuk hubungan yang linear, maka hitunglah persamaan garis
Penyelesaian:
ian ke- x y xy x2 y2
1 6 30 180 36 900
2 9 49 441 81 2401
3 3 18 54 9 324
4 8 42 336 64 1764
5 7 39 273 49 1521
6 5 25 125 25 625
7 8 41 328 64 1681
8 10 52 520 100 2704
S 56 296 2257 428 12920
y = 1.0277 + 5.138 x
Pada teori pendugaan (estimation theory) terdapat dua hal yang penting yaitu pendugaan
interval (confidence interval, atau interval estimation) dan pendugaan tunggal (prediction
interval atau point estimation). Pendugaan interval dimaksudkan untuk menggambarkan nilai
tengah untuk setiap nilai X tertentu, sedang pendugaan tunggal untuk menggambarkan kisaran
Pendugaan interval nilai tengah Y dimaksudkan untuk mengetahui nilai dugaan bagi Y
untuk seluruh nilai X yang diketahui. Telah disinggung pada sub-bab sebelumnya bahwa dalam
model regresi linier ini, dengan adanya nilai pengamatan dari nilai dugaannya, suatu nilai peubah
bebas X tertentu dapat memberikan beragam nilai peubah Y yang bervariasi yang pusatnya
diperkirakan terletak pada titik yx = 0 + 1x. Dengan kata lain, nilai harapan Y pada X
tertentu adalah 0 + 1X. Nilai tengah Y tersebut diduga oleh y = b0 + b1x dengan galat baku:
Contoh 1
Berikut ini adalah delapan pengukuran pada tinggi anak dengan tinggi bapak dan tinggi anak
sulungnya (cm).
Tentukan selang kepercayaan 95% bagi nilai-tengah tinggi badan anak yang bapaknya memiliki
Jawab:
Untuk pengamatan tersebut dapat dibuat tabel berikut ini (X untuk tinggi bapak, Y untuk tinggi
anak)
Model Regresinya adalah:
Penduga titik nilai tengah tinggi anak yang bapaknya memiliki tinggi 165 cm adalah:
Selang kepercayaan 95% tinggi anak yang bapaknya memiliki tinggi 165 cm adalah :
1.2. Pendugaan Satu Nilai y pada x tertentu (Pendugaan Tunggal)
Nilai y pada x tertentu juga diduga dengan y = b0 + b1x. Berbeda dengan nilai tengahnya, galat
Contoh 2
Untuk data pada contoh 1 tentukan selang kepercayaan 95% bagi tinggi badan seorang anak yang
Penduga titik nilai y pada tinggi anak yang bapaknya memiliki tinggi 165 cm adalah
Selang kepercayaan 95% tinggi anak yang bapaknya memiliki tinggi 165 cm adalah :
berbagai sumber keragaman. Pengujian model dapat juga dilakukan dengan menggunakan
analisis ragam. Perhatikan bahwa jumlah kuadrat total dapat diuraikan menjadi jumlah kuadrat
DB(Total) = n 1
DB(Regresi) = 1
DB(Galat)= n-2
H1 : 2regresi = 2sisa
Nilai Fhitung yang lebih dari F, DB(Regresi),DB(Galat) yang berarti tertolaknya H0 pada taraf nyata ,
diinterpretasikan bahwa persamaan regresi linear yang terpasang pada data adalah berperan
dalam menjelaskan keragaman total. Dengan kata lain, tertolaknya H0 dalam uji-F tadi
menunjukkan adanya peran peubah bebas dalam menjelaskan keragaman peubah tak bebas, atau
keragaman data bukanlah sekedar keragaman acak tetapi berkaitan dengan keragaman peubah
Contoh 3
Untuk data pada contoh 1 buatlah tabel analisis ragam untuk regresi tinggi badan anak pada
Jawab :
Untuk data pada contoh 1 dapat disusun tabel perhitungan sebagai berikut :
JK (Galat) = 375.80
JK (Total) = 463.50
= 463.50 375.80
= 87.7
Tabel Analisis Ragam untuk regresi tinggi badan anak pada tinggi badan bapaknya :
Adapun F0.05,1.6 = 5.99
Dengan Fhitung tidak lebih dari F0.05,1.6 maka keputusan ujinya adalah tidak tolak H0. Berdasarkan
data tabel tersebut , persamaan regresi linier yang terpasang pada data belum bisa dikatakan
antara nilai dugaan atau garis regresi dengan data sample. Ukuran kesesuaian model ini disebut
Koefisien Determinasi (R2). Koefisien Determinasi adalah bagian dari keragaman total variable
tak bebas Y (variable yang dipengaruhi atau dependent) yang dapat diterangkan atau
Nisbah kuadrat tengah total pada kuadrat tengah galat menunjukkan besarnya keragaman data
yang tidak terjelaskan oleh model. Koefisien determinasi dengan demikian menyatakan besarnya
keragaman yang terjelaskan oleh model. Nilai minimum koefisien determinasi adalah 0, dan nilai
maksimumnya adalah 1. Semakin besar nilai koefisien determinasi, mendekati angka 1, semakin
sesuai model yang dipasang dengan data yang dibicarakan. Koefisien determinasi kadang
kadang juga dinyatakan dalam persen, sehingga nilainya berkisar antara 0 100%.
Contoh 4
Hitunglah besarnya koefisien determinasi untuk regresi tinggi badan anak pada tinggi badan
bapaknya!
Jawab:
Koefisien determinasi untuk model regresi ini sangat kecil, menunjukkan model ini kurang baik
dalam menjelaskan keragaman peubah respon dalam kaitannya dengan peubah penjelas. Kurang
baiknya model ini mungkin karena antara kedua peubah tersebut pada kenyataannya tidak
berkaitan satu sama lain, atau keterkaitan antara peubah tersebut ada tetapi tidak linier.
REGRESI GANDA
Regresi ganda adalah regresi suatu variable terikat yang memiliki lebih dari satu variable bebas.
hubungan fungsional dua variable penjelas (variable bebas) atau lebih terhadap variable
respon(variable terikat). Penyelesaian regresi ganda dapat menggunakan notasi matriks dan
a. Metode Matriks
Dalam notasi matriks, p merupakan variable bebas berdasarkan jumlah pengamatan (n):
Dengan
yaitu
Sehingga
Selanjutnya ragan bagi beta , s2{b}, dalam notasi matriks dituliskan sebagai :
dengan
Pendugaan Nilai Peubah Respon galat baku bagi dugaan nilai-tengah Y dan dugaan nilai Y pada
Selang kepercayaan (1-) 100% bagi nilai tengah Y dan dugaan nilai Y pada X tertentu ,
Jumlah kuadrat total, jumlah kuadrat regresi dan jumlah kuadrat galat dalam matriks ditulis
Koefisien determinasi yang merupakan ukuran kesesuaian model dapat dihitung yaitu:
Persamaan regresi ganda dapat digunakan dalam perhitungan nilai Y untuk setiap perhitungan
nilai X1dan X2. Perubahan nilai Y disebabkan oleh perubahan X1, ketika X2 konstan ataupun
sebaliknya. Data pada table regresi, yang terdiri dari variable X1, X2, dan Y dapat di hitung
Setelah Rhintung diperoleh maka kuadratkanlah Rhintung. Kemudian menghitung F sign hitungdengan
rumus:
Contoh soal:
Y X1 X2
23.3 5 13
24.5 6 14
27.2 8 17
27.1 9 17
24.1 7 14
23.4 5 13
24.3 6 14
24.1 7 14
27.2 9 17
27.3 8 17
27.4 8 17
27.3 9 17
24.3 6 14
23.4 5 13
24.1 7 14
27 9 17
23.5 5 13
24.3 6 14
27.3 8 17
23.7 7 14
i) Persamaan linear
Penyelesaian:
i) Persamaan linear
Dengan mensubstitusikan nilai masing-masing yang tertera pada table ke dalam persamaan di
atas, sehingga:
Eliminasi a dari persamaan (1) dan (2). Persamaan 1 dikalikan dengan -7 dan persamaan 2
dikalikan dengan 1
sehingga diperoleh:
40 b1 + 44 b2 = 41.8 ..(4)
Sehingga diperoleh :
44 b1 + 56 b2 = 55 (5)
40 b1 + 44 b2 = 41.8 (x-44)
44 b1 + 56 b2 = 55 (x40)
Maka a= 9.26
Sehingga
ii) Matriks
Sehingga diperoleh
Menghasilkan
Dari matriks tersebut, maka diperoleh:
Sehingga
Ho
3. Untuk data pada soal sebelumnya, buatlah tabel analisa ragam untuk regresi Y dengan dua
variabel bebas
= 54.668
Table analisis ragam untuk regresi Y pada dua peubah bebas X1 dan X2
Kuadrat Tengah
Total 54.668 19
Adapun F 0.025;17 = 3.59. dengan Fhitung jauh lebih besar dari F table, maka keputusan ujinya
4. Tentukan koefisien determinasi untuk model regresi linear Y pada peubah bebas X1 dan X2!
Jawab:
Persamaan Linear
Sehingga diperoleh
x1y = 41.8
x2y = 55
y2 = 54.668
Dari data tersebut juga dapat ditentukan nilai koefisien korelasi berganda yaitu dengan rumus:
sehingga R= 0.995207434
Matriks
= 0.994235 = 99.42%
5. Tentukan nilai dari F hitung!
= 1765.08
dari data di atas, Ho dan Ha di tolak karena nilai F pada tabel adalah 3.59