Korelasi Dan Regresi
Korelasi Dan Regresi
1. Korelasi
Pada semua kejadian, baik kejadian ekonomi maupun lainnya, pasti ada faktor yang
menyebabkan terjadinya kejadian-kejadian tersebut. Misal, angka penjualan suatu barang
yang turun disebabkan oleh naiknya harga barang tersebut. Contoh lain, seorang anak yang
tidak belajar mendapatkan nilai jelek pada saat ulangan, dll.
Uraian di atas menunjukkan adanya hubungan atau korelasi antara kejadian yang satu
dengan kejadian yang lainnya. Kejadian itu dapat dinyatakan dengan perubahan nilai
variabel. Misal, jika x merupakan variabel harga, maka naik turunnya harga dapat dinyatakan
dengan perubahan nilai x. Dan apabila y merupakan variabel hasil penjualan, maka naik
turunnya hasil penjualan dapat dinyatakan dengan perubahan nilai y. Jadi, hubungan antara
dua kejadian dapat dinyatakan dengan hubungan dua variabel x dan y. Disini saya hanya akan
menjelaskan tentang hubungn antara dua variabel, hubungan linier lebih dari dua variabel
akan dijelaskan pada subbab berikutnya.
Pada contoh diuraian sebelumnya, kita tentu setuju jika dikatakan bahwa naik
turunnya harga mempengaruhi hasil penjualan. Namun dalam hal ini kita tidak tahu pasti
seberapa besar pengaruhnya. Analisis korelasi yang akan dibahas kali ini berfungsi untuk
mengetahui seberapa besar atau seberapa kuat suatu relasi antar dua variabel.
2. Ukuran korelasi
Hubungan dua variabel ada yang positif dan negatif. Suatu hubungan dikatakan positif
apabila kenaikan/penurunan x pada umumnya diikuti oleh kenaikan/penurunan y. Sebaliknya
dikatakan negatif bila kenaikan/penurunan x pada umumnya diikuti oleh penurunan/kenaikan
y. Perhatikan Gambar 1 dan 2.
x = pupuk, y = produksi
Apabila diagram pencar tidak teratur, artinya kenaikan/penurunan x tidak berpengaruh pada
kenaikan/penurunan x. Maka dapat dikatakan x dan y tidak berkorelasi.
3. Koefisien korelasi
Kuat dan tidaknya hubungan antara x dan y apabila dinyatakan denagn fungsi linier,
diukur dengan suatu nilai yang disebut koefisien korelasi (r). Nilai koefisien korelasi ini
paling sedikit bernilai -1 dan paling besar bernilai 1. Jadi dapat dinyatakan sebagai berikut:
-1<= r >= 1
Artinya:
Jika r = 1, hubungan x dan y sempurna dan positif (mendekati 1, yaitu hubungan sangat kuat
dan positif).
Jika r = -1, hubungan x dan y sempurna dan negatif (mendekati -1, yaitu hubungan sangat
Jika r = 0, tidak ada hubungan atau lemah sekali hubungan antara x dan y.
4. Koefisien Penentu
Nilai x dikatakan mempengaruhi y karena kenaikan atau penurunan x mempengaruhi
nilai y. Namun dalam diagram pencar, nilai y memiliki nilai yang bervariasi meskipun nilai y
naik dalam deret ukur. Hal ini terjadi karena nilai y tidak hanya dipengaruhi oleh variabel x
namun juga beberapa faktor lain. Misal, hasil penjualan tidak hanya dipengaruhi oleh harga
pasar tapi melainkan juga dipengaruhi oleh pendapatan masyarakat, selera, dll. Dari sini
timbul pertanyaan, beraa besarnya kontribusi dari x terhadap naik turunnya nilai y? Untuk
menjawab pertanyaan ini harus dihitung dulu suatu koefisien yang disebut keofisien
determinasi atau koefisien penentu (KP). Nilai KP dicari dengan rumus,
KP = r2
Jika r = 0.9 maka nilai KP = (0.9)2 = 0.81 atau 81%. Hal ini berarti besar kontribusi dari x
terhadap nilai y sebesar 81%, dan 19% lainnya adalah kontribusi dari faktor-faktor lainnya.
x 1 2 4 5 7 9 10 12
Y 2 4 5 7 8 10 12 14
Penyelesaian :
untuk menghitung r diperlukan lembaran kerja yang disusun berdasarkan rumus sebagai
berikut :
x Y x2 y2 xy
2 1 4 2
4 4 16 8
5 16 25 20
7 25 49 35
8 49 64 56
10 81 100 90
12 100 144 120
14 144 196 168
Σyi = 62 Σxi2 = 420 Σyi2 = 598 Σxiyi = 499
2. 2. Jika X adalah presentase kenaikan harga dan Y adalah presentase kenaikan hasil penjualan,
kemudian berdasarkan tabel dibawah ini, hitunglah koefisien korelasi (r) dan kofisien
determinasi (KP) !
X 2 4 5 6 8 10 11 13 14 15
Y 15 14 12 10 9 8 6 4 3 2
Penyelesaian :
untuk menghitung r diperlukan lembaran kerja yang disusun berdasarkan rumus sebagai
berikut :
X Y X2 Y2 XY
2 15 4 225 30
4 14 16 196 56
5 12 25 144 60
6 10 36 100 60
8 9 64 81 72
10 8 100 64 80
11 6 121 36 66
13 4 169 16 52
14 3 196 9 42
15 2 225 4 30
5. Regresi
Apa perlunya mengetahui hubungan antar variable? Di dalam perencanaan, selain data
masa lampau dan masa sekarang, juga diperlukan data hasil ramalan yang menggambarkan
kemampuan di masa yang akan datang. Misalnya, perusahaan dalam merencanakanproduksi
memerlukan ramalan hasil penjualan (kemampuan menjual di masa yang akan datang,
sehingga dapat dicegah terjadinya overproduction atau underproduction).
Apabila dua variable X dan Y mempunyai hubungan, maka nilai variable X yang sudah
diketahui dapat digunakan untuk menaksir/memperkirakan nilai variable Y.
Variable Y yang nilainya akan diramalkan disebut variable tidak bebas (dependent
variable), sedangkan variable X yang nilainya digunakan untuk meramalkan nilai Y disebut
variable bebas (independent variable).
Jadi analisis korelasi membantu kita untuk mengetahui seberapa kuat hubungan antara
dua variable, sedangkan analisis regresi membantu kita untuk:
2. Membantu menentukan jenis persamaan yang akan digunakan untuk menentukan hubungan
tersebut..
6. Diagram pencar
Jika terdapat sebuah data antara dua variable dan kita belum dapat memastikan apakah
data tersebut memiliki hubungan satu sama lain atau tidak, cara untuk mengetahuinya adalah
dengan cara menggunakan diagram pencar (scatter diagram).
Pada kesempatan ini hanya akan dijelaskan mengenai regresi linear sederhana yakni
regresi yang berbentuk garis lurus atau linear (gambar (a), dan (b)).
a : konstanta b : kemiringan/gradien
Penetapan Persamaan Regresi Linier Sederhana
1. Berikut adalah data Biaya Promosi dan Volume Penjualan PT BIMOIL perusahaan Minyak
x Y
1992 2 5 10 4 25
1993 4 6 24 16 36
1994 5 8 40 25 64
2. Diketahui hubungan Biaya Promosi (x dalam Juta Rupiah) dan y (Volume penjualan dalam
Ratusan Juta liter) dapat dinyatakan dalam persamaan regresi linier berikut
y = 2.530 + 1.053 x. Perkirakan Volume penjualan jika dikeluarkan biaya promosi Rp. 10
juta ?
Penyelesaian: y = 2.530 + 1.053 x
x = 10
Gambar 4
Ukuran yang mengindifikasi derajat variasi sebaran data di sekitar garis regresi dapat
menunjukkan seberapa besar derajat keterikatan perkiraan yang diperoleh dengan
menggunakan persamaan regresi tersebut. Ukuran ini dinamakan sebagai standar error
estimasi. Dalam definisi yang lebih tepat standar error estimasi estimasi (sy,x) adalah deviasi
standar yang memberikan ukuran penyebaran nilai-nilai yang teramati di sekitar garis regresi,
dirumuskan sebagai berikut:
Contoh soal:
Dari suatu praktikum fisika dasar diperoleh data yang menghubungkan variabel bebas x dan
variabel terikat y seperti ditunjukkan dalam tabel berikut:
Ujian ke- x y
1 6 30
2 9 49
3 3 18
4 8 42
5 7 39
6 5 25
7 8 41
8 10 52
S 56 296
Jika diasumsikan memiliki bentuk hubungan yang linear, maka hitunglah persamaan garis
regresinya dan standar error estimasinya!
Penyelesaian:
Ujian ke- x y xy x2 y2
1 6 30 180 36 900
2 9 49 441 81 2401
3 3 18 54 9 324
4 8 42 336 64 1764
5 7 39 273 49 1521
6 5 25 125 25 625
7 8 41 328 64 1681
8 10 52 520 100 2704
S 56 296 2257 428 12920
Nilai konstanta b dapat ditentukan:
Jadi persamaan regresi linear yang menggambarkan hubungan antara variabel x dan y dari
pendugaan interval (confidence interval, atau interval estimation) dan pendugaan tunggal
menggambarkan nilai tengah untuk setiap nilai X tertentu, sedang pendugaan tunggal untuk
Pendugaan interval nilai tengah Y dimaksudkan untuk mengetahui nilai dugaan bagi
Y untuk seluruh nilai X yang diketahui. Telah disinggung pada sub-bab sebelumnya bahwa
dalam model regresi linier ini, dengan adanya nilai pengamatan dari nilai dugaannya, suatu
nilai peubah bebas X tertentu dapat memberikan beragam nilai peubah Y yang bervariasi
yang pusatnya diperkirakan terletak pada titik yx = β0 +β1x. Dengan kata lain, nilai harapan
Y pada X tertentu adalah β0 + β1X. Nilai tengahY tersebut diduga oleh y = b0 + b1x dengan
galat baku:
Contoh 1
Berikut ini adalah delapan pengukuran pada tinggi anak dengan tinggi bapak dan tinggi anak
sulungnya (cm).
Tentukan selang kepercayaan 95% bagi nilai-tengah tinggi badan anak yang bapaknya
Jawab:
Untuk pengamatan tersebut dapat dibuat tabel berikut ini (X untuk tinggi bapak, Y untuk
tinggi anak)
Penduga titik nilai – tengah tinggi anak yang bapaknya memiliki tinggi 165 cm
adalah:
Selang kepercayaan 95% tinggi anak yang bapaknya memiliki tinggi 165 cm adalah :
Nilai y pada x tertentu juga diduga dengan y = b0 + b1x. Berbeda dengan nilai tengahnya,
Contoh 2
Untuk data pada contoh 1 tentukan selang kepercayaan 95% bagi tinggi badan seorang anak
Jawab:
Penduga titik nilai y pada tinggi anak yang bapaknya memiliki tinggi 165 cm adalah
Selang kepercayaan 95% tinggi anak yang bapaknya memiliki tinggi 165 cm adalah :
Tabel Analisis Ragam
berbagai sumber keragaman. Pengujian model dapat juga dilakukan dengan menggunakan
analisis ragam. Perhatikan bahwa jumlah kuadrat total dapat diuraikan menjadi jumlah
Sementara itu, derajat bebas masing – masing jumlah kuadrat tersebut berturut – turut adalah:
DB(Total) = n – 1
DB(Regresi) = 1
DB(Galat)= n-2
Nilai Fhitung dari table analisis raga mini adalah nilai F uji atas hipotesis H0 : σ2regresi= σ2sisa v.s.
H1 : σ2regresi = σ2sisa
Nilai Fhitung yang lebih dari Fα, DB(Regresi),DB(Galat) yang berarti tertolaknya H0pada taraf nyata α,
diinterpretasikan bahwa persamaan regresi linear yang terpasang pada data adalah berperan
dalam menjelaskan keragaman total. Dengan kata lain, tertolaknya H0 dalam uji-F tadi
menunjukkan adanya peran peubah bebas dalam menjelaskan keragaman peubah tak bebas,
atau keragaman data bukanlah sekedar keragaman acak tetapi berkaitan dengan keragaman
Contoh 3
Untuk data pada contoh 1 buatlah tabel analisis ragam untuk regresi tinggi badan anak pada
Untuk data pada contoh 1 dapat disusun tabel perhitungan sebagai berikut :
JK (Galat) = 375.80
JK (Total) = 463.50
= 463.50 – 375.80
= 87.7
Tabel Analisis Ragam untuk regresi tinggi badan anak pada tinggi badan bapaknya :
Berdasarkan data tabel tersebut , persamaan regresi linier yang terpasang pada data belum
antara nilai dugaan atau garis regresi dengan data sample. Ukuran kesesuaian model ini
disebut Koefisien Determinasi (R2). Koefisien Determinasi adalah bagian dari keragaman
total variable tak bebas Y (variable yang dipengaruhi atau dependent) yang dapat diterangkan
atau diperhitungkan oleh keragaman variable bebas X (variabel yang mempengaruhi atau
Nisbah kuadrat tengah total pada kuadrat tengah galat menunjukkan besarnya keragaman data
yang tidak terjelaskan oleh model. Koefisien determinasi dengan demikian menyatakan
besarnya keragaman yang terjelaskan oleh model. Nilai minimum koefisien determinasi
adalah 0, dan nilai maksimumnya adalah 1. Semakin besar nilai koefisien determinasi,
mendekati angka 1, semakin sesuai model yang dipasang dengan data yang dibicarakan.
Koefisien determinasi kadang – kadang juga dinyatakan dalam persen, sehingga nilainya
Contoh 4
Hitunglah besarnya koefisien determinasi untuk regresi tinggi badan anak pada tinggi badan
bapaknya!
Jawab:
Koefisien determinasi untuk model regresi ini sangat kecil, menunjukkan model ini kurang
baik dalam menjelaskan keragaman peubah respon dalam kaitannya dengan peubah penjelas.
Kurang baiknya model ini mungkin karena antara kedua peubah tersebut pada kenyataannya
tidak berkaitan satu sama lain, atau keterkaitan antara peubah tersebut ada tetapi tidak linier.
REGRESI GANDA
hubungan fungsional dua variable penjelas (variable bebas) atau lebih terhadap variable
respon(variable terikat). Penyelesaian regresi ganda dapat menggunakan notasi matriks dan
a. Metode Matriks
Dalam notasi matriks, p merupakan variable bebas berdasarkan jumlah pengamatan (n):
Dengan
yaitu
Sehingga
Selanjutnya ragan bagi beta , s2{b}, dalam notasi matriks dituliskan sebagai :
dengan
Dapat di buat dengan criteria uji T. Tolak H0 jika t lebih kecil atau sama dengan -t/2,n-
(p+1) atau sama dengan -t/2,n-p dengan t = be / s{bk} , P(T -t/2,n-(p+1)) = /2, dan
Pendugaan Nilai Peubah Respon galat baku bagi dugaan nilai-tengah Y dan dugaan nilai Y
Jumlah kuadrat total, jumlah kuadrat regresi dan jumlah kuadrat galat dalam matriks ditulis
Derajat bebas yang berpadanan dengan masing-masing jumlah kuadrat tersebut adalah :
Koefisien determinasi yang merupakan ukuran kesesuaian model dapat dihitung yaitu:
perhitungan nilai X1dan X2. Perubahan nilai Y disebabkan oleh perubahan X1, ketika
X2 konstan ataupun sebaliknya. Data pada table regresi, yang terdiri dari variable X1, X2, dan
hitungdengan rumus:
Contoh soal:
1. Diberikan data sebagai berikut:
Y X1 X2
23.3 5 13
24.5 6 14
27.2 8 17
27.1 9 17
24.1 7 14
23.4 5 13
24.3 6 14
24.1 7 14
27.2 9 17
27.3 8 17
27.4 8 17
27.3 9 17
24.3 6 14
23.4 5 13
24.1 7 14
27 9 17
23.5 5 13
24.3 6 14
27.3 8 17
23.7 7 14
i) Persamaan linear
ii) Matriks
Penyelesaian:
Koefisien regresi X1, X2, dan Y
i) Persamaan linear
atas, sehingga:
Eliminasi a dari persamaan (1) dan (2). Persamaan 1 dikalikan dengan -7 dan persamaan 2
dikalikan dengan 1
sehingga diperoleh:
40 b1 + 44 b2 = 41.8 …………..(4)
Sehingga diperoleh :
44 b1 + 56 b2 = 55 ……………(5)
40 b1 + 44 b2 = 41.8 (x-44)
44 b1 + 56 b2 = 55 (x40)
Maka a= 9.26
Sehingga
ii) Matriks
Sehingga diperoleh
Sehingga
Ho
3. Untuk data pada soal sebelumnya, buatlah tabel analisa ragam untuk regresi Y dengan dua
variabel bebas
= 54.668
Table analisis ragam untuk regresi Y pada dua peubah bebas X1 dan X2
sumber Jumlah Derajat Bebas Kuadrat F hitung
Kuadrat Tengah
Total 54.668 19
Adapun F 0.025;17 = 3.59. dengan Fhitung jauh lebih besar dari F table, maka keputusan ujinya
4. Tentukan koefisien determinasi untuk model regresi linear Y pada peubah bebas X1 dan X2!
Jawab:
Persamaan Linear
Sehingga diperoleh
∑x1y = 41.8
∑x2y = 55
∑y2 = 54.668
Dari data tersebut juga dapat ditentukan nilai koefisien korelasi berganda yaitu dengan
rumus:
sehingga R= 0.995207434
Matriks
= 0.994235 = 99.42%
= 1765.08
dari data di atas, Ho dan Ha di tolak karena nilai F pada tabel adalah 3.59