Bahan Ajar Statistika - Analisis Regresi Dan Korelasi

ANALISIS REGRESI
DAN KORELASI
TAHUN PERTAMA BERSAMA

UNIVERSITAS MATARAM 2018
BAB VI
ANALISIS REGRESI DAN KORELASI
KOMPETENSI DASAR
Setelah mengikuti materi pokok Analisis Regresi dan Korelasi
mahasiswa diharapkan dapat menjelaskan dan melakukan analisis
regresi dan korelasi.
INDIKATOR
Indikator ketercapaian dari materi pokok Uji Hipotesis adalah
6.1 Mahasiswa dapat menjelaskan pengertian dasar yang
berkaitan analisis regresi dan korelasi.
6.2 Mahasiswa dapat melakukan analisis regresi linier sederhana.
6.3 Mahasiswa dapat melakukan analisis regresi linier berganda.
6.4 Mahasiswa dapat menentukan koefisien korelasi.
PENDAHULUAN
Dalam penelitian, seringkali kita mengamati dua atau lebih
variabel yang berpasangan. Berdasarkan hasil pengamatan
terhadap variabel-variabel tersebut kita ingin mengetahui apakah
variabel-variabel tersebut saling berhubungan/berkaitan,
bagaimanakah pola hubungan antara variabel-variabel tersebut,
dan seberapa kuatkah hubungan antara variabel-variabel tersebut.
Untuk mengetahui hal tersebut kita dapat menggunakan metode
statistika, antara lain adalah analisis regresi dan korelasi.
1
Pada bagian ini akan dibahas pengertian dari analisis regresi
dan korelasi, cara menentukan pola regresi dan koefisien korelasi
dan bagaimana menginterpretasikan hasil yang diperoleh.
A. ANALISIS REGRESI
Analisis Regresi adalah suatu metode statistika yang mengkaji
tentang pola hubungan (bentuk fungsional) antara dua variabel
atau lebih, sehingga nilai salah satu variabel dapat diprediksi atau
diramalkan berdasarkan variabel yang lain. Misalnya, hubungan
antara berat badan orang dewasa dengan tinggi badan, nilai
dengan waktu belajar siswa, tekanan gas dengan suhu dan volume,
nilai penjualan dengan biaya promosi, berat badan dengan umur
dan asupan makanan.
Variabel-variabel dalam analisis regresi dibedakan menjadi
dua, yaitu variabel penyebab atau yang mempengaruhi, yang
dikenal dengan sebutan variabel prediktor, variabel bebas, variabel
penjelas, atau variabel independen. Biasanya disimbulkan dengan
huruf “X”. Selain itu terdapat pula variabel yang terkena akibat atau
yang dipengaruhi, yang dikenal dengan istilah variabel respon,
variabel terikat, atau variabel dependen. Biasanya disimbulkan
dengan huruf “Y “.
Analisis regresi merupakan metode statistika yang mengkaji
pola hubungan antar variabel, sehingga tujuan dari analisis regresi
adalah menyelidiki bentuk fungsional atau pola hubungan antara
variabel respon (Y) dan variabel prediktor (X) berdasarkan data
sampel yang diperoleh. Sebagai contoh, misalkan kita memiliki data
sampel tentang nilai penjualan dan biaya promosi maka dengan
analisis regresi kita bertujuan untuk menyelidiki bagaimana bentuk
2
fungsional antara nilai penjualan dan biaya promosi, apakah biaya
promosi mempengaruhi nilai penjualan secara garis lurus, kuadratik,
eksponensial atau bentuk fungsional yang lain.
Selain itu analisis regresi juga bertujuan untuk mengestimasi
nilai rata-rata (mean) dari Y populasi berdasarkan nilai X yang
diberikan. Dimana estimasi nilai rata-rata Y populasi tersebut
ditentukan oleh bentuk fungsional hubungan antara Y dan X. Atau
dapat dikatakan bahwa bentuk fungsional antara Y dan X
merupakan estimator nilai rata-rata Y populasi. Sebagai contoh,
misalkan akan diestimasi berapa rata-rata emisi yang ditimbulkan
bila sebuah mobil telah menempuh jarak sejauh 50 ribu kilometer.
Dengan analisis regresi kita estimasi bentuk fungsionalnya
berdasarkan data sampel yang ada. Selanjutnya bentuk fungsi yang
dihasilkan tersebut digunakan untuk mengestimasi nilai rata-rata
emisinya. Misalkan hasil estimasi bentuk fungsionalnya adalah 𝑌̂ =
382 + 5.39 𝑋 , bila diberikan nilai X = 50 maka dapat diestimasi bahwa
nilai rata-rata Y populasi adalah 382 + 5.39(50) = 651.5 . Sehingga
dapat dikatakan bahwa untuk mobil yang telah menempuh jarak
sejauh 50 ribu kilometer maka rata-rata emisi yang ditimbulkan
sebesar 651.5 ppm.
Adapun manfaat dari analisis regresi adalah dapat digunakan
untuk memprediksi atau meramalkan nilai salah satu variabel
berdasarkan variabel yang lain. Contohnya, dengan mengetahui
bentuk fungsional antara nilai penjualan dan biaya produksi, kita
dapat memprediksi atau meramalkan berapa nilai penjualan yang
akan kita peroleh bila kita mengeluarkan biaya promosi dengan
jumlah tertentu.
Selain itu dengan analisis regresi, kita dapat mengetahui faktor
mana yang memberikan kontribusi terbesar terhadap hal tertentu.
3
Misalkan ada beberapa faktor yang mempengaruhi nilai indeks
harga saham, yaitu inflasi, nilai tukar rupiah terhadap dolar, dan
tingkat suku bunga. Dengan mengetahui bentuk fungsional atau
pola hubungan antara indeks harga saham dengan inflasi, nilai tukar
rupiah terhadap dolar, dan tingkat suku bunga, maka dapat
diketahui mana di antara inflasi, nilai tukar rupiah, dan tingkat suku
bunga yang mempunyai kontribusi terbesar (paling berpengaruh)
terhadap perubahan nilai indeks harga saham.
Hasil yang diperoleh dari analisis regresi akan sangat
membantu dalam pengambilan keputusan dan penentuan
kebijakan dalam berbagai bidang.
Analisis regresi dapat dibedakan menjadi dua bagian, yaitu
analisis regresi linier dan analisis regresi non linier. Pada analisis regresi
linier bentuk fungsionalnya mempunyai parameter linier (pangkat
satu). Yang termasuk analisis regresi linier antara lain adalah analisis
regresi linier sederhana (garis lurus), analisis regresi linier berganda.
Sedangkan pada analisis regresi non linier bentuk fungsionalnya
mempunyai parameter non linier. Yang termasuk analisis regresi non
linier antara lain adalah model regresi eksponensial dan logaritma.
Pada bagian ini akan dibahas tentang analisis regresi linier,
khususnya regresi linier sederhana dan regresi linier berganda.
1. Analisis Regresi Linier Sederhana

Analisis regresi linier sederhana merupakan salah satu metode
statistika yang digunakan untuk mengestimasi pola
hubungan/bentuk fungsional antara satu variabel respon Y dan satu
variabel prediktor X. Pada analisis regresi linier sederhana hubungan
kedua variabel tersebut diasumsikan mengikuti pola/bentuk
fungsional garis lurus.
4
Karena diasumsikan bentuk fungsionalnya adalah garis lurus,
maka pada analisis regresi linier sederhana model regresinya adalah
sebagai berikut:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 , 𝑖 = 1,2, … , 𝑛 (6.1)
dengan 𝛽0 , 𝛽1 adalah parameter-parameter regresi, dan 𝜀𝑖 adalah
sisaan atau galat yang didefinisikan sebagai selisih/beda antara 𝑌𝑖
dengan garis regresi pada lokasi 𝑋𝑖 . Untuk mengestimasi persamaan
garis regresi, dilakukan dengan menentukan estimator parameter
𝛽0 (= 𝛽̂0 = 𝑏0 ) dan estimator parameter 𝛽1 (= 𝛽̂1 = 𝑏1 ). Sehingga
diperoleh persamaan garis
𝑌̂𝑖 = 𝑏0 + 𝑏1 𝑋𝑖 , 𝑖 = 1,2, … , 𝑛 (6.2)
dimana 𝑌̂𝑖 merupakan nilai prediksi 𝑌𝑖 pada lokasi 𝑋𝑖 .
Gambaran dari model regresi linier sederhana dapat dilihat pada
Gambar 6.1 berikut.
Garis regresi
𝑌𝑖
𝜀𝑖
𝛽0 + 𝛽1 𝑋𝑖 yang
diestimasi dengan
𝑌̂𝑖 = 𝑏0 + 𝑏1 𝑋𝑖
𝑋𝑖
Gambar 6.1 Ilustrasi Model Regresi Linier Sederhana
Misalkan kita mempunyai sekelompok data berpasangan

yang merupakan hasil pengamatan dari dua variabel yang
diasumsikan mempunyai pola hubungan garis lurus. Berdasarkan
5
data tersebut kita mungkin memperoleh beberapa persamaan garis
lurus, seperti nampak pada gambar 6.2 berikut.
90
80
70
60
50
Y
40
30
20
10
0
0 20 40 60 80 100
Gambar 6.2 Beberapa Garis Lurus yang Mungkin untuk

Sekelompok Data Berpasangan
Yang menjadi pertanyaan adalah garis mana yang paling

sesuai/tepat untuk data sampel yang kita miliki tersebut? Untuk
mendapatkan garis lurus yang paling sesuai dapat dilakukan
dengan memilih intercept 𝛽0 dan slope 𝛽1 yang meminimumkan
selisih/beda antara nilai pengamatan 𝑌𝑖 dengan nilai prediksi 𝑌̂𝑖 pada
lokasi 𝑋𝑖 yang sama. Atau mengestimasi koefisien regresi 𝛽0 , 𝛽1 yang
meminimumkan sisaan/galat.
Salah satu metode yang dapat digunakan untuk
mengestimasi koefisien-koefisien regresi adalah Metode Kuadrat
Terkecil (Ordinary Least Square). Dengan metode ini kita
mengestimasi koefisien regresi dengan cara meminimumkan fungsi
jumlah kuadrat sisaan/galat. Berdasarkan persamaan 6.1 dapat
dibuat fungsi sisaan/galat sebagai berikut:
𝜀𝑖 = 𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 , 𝑖 = 1,2, … , 𝑛 (6.3)
6
yang mana bila dikuadratkan akan diperoleh
𝜀𝑖2 = (𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 )2 , 𝑖 = 1,2, … , 𝑛 (6.4)
Jumlah kuadrat sisaan/galat tersebut kita misalkan dengan Q dan
didefinisikan sebagai berikut:
𝑄 = ∑𝑛𝑖=1 𝜀𝑖2 = ∑𝑛𝑖=1(𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 )2 (6.5)
Untuk mengestimasi 𝛽0 , 𝛽1 dengan Metode Kuadrat Terkecil,

kita minimumkan fungsi Q tersebut di atas dengan membuat turunan
fungsi tersebut terhadap parameter-parameternya sama dengan
nol.
𝜕𝑄 𝜕𝑄
= 0 dan =0
𝜕𝛽0 𝜕𝛽1
Sehingga diperoleh persamaan normal

𝑛 𝑛
∑ 𝑌𝑖 − 𝑛𝛽0 − 𝛽1 ∑ 𝑋𝑖 = 0
𝑖=1 𝑖=1
𝑛𝛽0 + 𝛽1 ∑𝑛𝑖=1 𝑋𝑖 = ∑𝑛𝑖=1 𝑌𝑖 (6.6)

dan
𝑛 𝑛 𝑛
∑ 𝑋𝑖 𝑌𝑖 − 𝛽0 ∑ 𝑋𝑖 − 𝛽1 ∑ 𝑋𝑖2 = 0
𝑖=1 𝑖=1 𝑖=1
𝛽0 ∑𝑛𝑖=1 𝑋𝑖 + 𝛽1 ∑𝑛𝑖=1 𝑋𝑖2 = ∑𝑛𝑖=1 𝑋𝑖 𝑌𝑖 (6.7)
Persamaan 6.6 dan 6.7 membentuk suatu sistem persamaan

linier, yang mana penyelesaiannya dan penggantian 𝛽0 , 𝛽1 dengan
𝑏0 , 𝑏1 sebagai estimator akan memberikan hasil sebagai berikut
𝑛 𝑛
∑𝑖=1 𝑋𝑖 ∑𝑖=1 𝑌𝑖
∑𝑛
𝑖=1 𝑋𝑖 𝑌𝑖 −
𝑏1 = 𝑛
2 (6.8)
(∑𝑛
𝑖=1 𝑋𝑖 )
∑𝑛 𝑋
𝑖=1 𝑖
2
−
𝑛
dan 𝑏0 = 𝑌̅ − 𝑏1 𝑋̅ (6.9)
7
Nilai yang diperoleh dari persamaan 6.8 dan 6.9 disubstitusikan
ke persamaan 6.2 untuk mendapatkan prediksi model regresinya.
Berikut ini diberikan contoh pembentukan model regresi

berdasarkan Metode Kuadrat Terkecil.
Contoh 6.1.
Berdasarkan hasil penelitian Dr. A.S. Heagle di Universitas Carolina
Utara tentang pengaruh polusi ozon pada hasil produksi tanaman
kedelai, diperoleh data sebagai berikut
Tabel 6.1 Hasil Produksi Tanaman Kedelai (Y) dan Konsentrasi

Ozon (X)
X (ppm) Y (gr/tanaman)
0.02 242
0.07 237
0.11 231
0.15 201
𝑛 𝑛
∑ 𝑋𝑖 = 0.35 ∑ 𝑌𝑖 = 911
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
∑ 𝑋𝑖2 = 0.0399 ∑ 𝑌𝑖2 = 208495 ∑ 𝑋𝑖 𝑌𝑖 = 76.99

𝑖=1 𝑖=1 𝑖=1
Sumber: Applied regression analysis: a research tool. — 2nd ed. , Rawlings, J.O.,
Pentula, S.G., Dickey, D.A., Springer-Verlag, Inc., New York, 1998.
Dengan mengasumsikan bahwa terdapat pola hubungan

regresi linier sederhana, estimasi model tersebut dilakukan dengan
mengestimasi parameter-parameter regresi dengan menggunakan
persamaan 6.8 dan 6.9 sebagai berikut.
(0.35)(911)
76.99 −
𝑏1 = 4 = −293.531
(0.35)2
0.0399 −
4
8
911 0.35
𝑏0 = — (−293.531) ( ) = 253.434
4 4
Sehingga model regresi yang terbentuk adalah

𝑌̂𝑖 = 253.434 − 293.531𝑋𝑖
Persamaan tersebut dapat diinterpretasikan sebagai berikut,

rata-rata hasil produksi tanaman kedelai akan menurun sebesar
293.531 gram per tanaman seiring dengan peningkatan konsentrasi
ozon sebesar 1 ppm. Nilai b0 menunjukkan rata-rata hasil produksi
tanaman kedelai sebesar 253.433 gram per tanaman ketika tidak
ada ozon.
Adapun nilai prediksi berdasarkan nilai X yang diberikan
beserta sisaan/galat berdasarkan model yang diperoleh dapat
dilihat pada tabel 6.2 di bawah ini.
Tabel 6.2 Nilai Pengamatan, Nilai Prediksi, dan Sisaan untuk

Regresi Linier Hasil Produksi Tanaman Kedelai pada
Konsentrasi Ozon
𝑋𝑖 𝑌𝑖 𝑌̂𝑖 𝑒𝑖 = 𝑌𝑖 − 𝑌̂𝑖
0.02 242 247.563 -5.563
0.07 237 232.887 4.113
0.11 231 221.146 9.854
0.15 201 209.404 -8.404
9
2. Analisis Regresi Linier Berganda
Pada analisis regresi linier sederhana, variabel respon Y hanya
dipengaruhi oleh satu variabel prediktor X. Namun pada
kenyataannya sering kita jumpai suatu keadaan dipengaruhi lebih
dari satu faktor. Sebagai contoh, hasil penjualan (Y) tidak hanya
dipengaruhi oleh faktor promosi (X1), tetapi dipengaruhi juga oleh
faktor lokasi penjualan (X2). Contoh lain, berat badan (Y) dapat
dipengaruhi oleh jumlah asupan makanan (X1) dan umur (X2). Atau
indeks harga saham (Y) dipengaruhi oleh tingkat inflasi (X1), suku
bunga (X2), dan nilai tukar rupiah (X3). Untuk mengestimasi pola
hubungan satu variabel respon dengan dua atau lebih variabel
prediktor, digunakan analisis regresi linier berganda.
Bentuk umum dari model regresi linier berganda yang
berkaitan dengan p variabel bebas/prediktor adalah
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + ⋯ + 𝛽𝑗 𝑋𝑖𝑗 + ⋯ + 𝛽𝑝 𝑋𝑖𝑝 + 𝜀𝑖 (6.10)
dimana i menunjukkan unit pengamatan untuk variabel respon Y
dan p variabel prediktor yang diberikan. Untuk sampel berukuran n,
maka i = 1,2,…,n. Pada model tersebut nampak terdapat p’=(p+1)
parameter regresi 𝛽𝑗 , j = 0,1,2,…,p yang akan diestimasi. Di sini kita
asumsikan bahwa n>p’.
Estimasi parameter model regresi linier berganda dapat
diestimasi dengan Metode Kuadrat Terkecil. Berdasarkan
persamaan 6.10 dapat dibuat fungsi sisaan/galat sebagai berikut:
𝜀𝑖 = 𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖1 − 𝛽2 𝑋𝑖2 − ⋯ − 𝛽𝑝 𝑋𝑖𝑝 , 𝑖 = 1,2, … , 𝑛 (6.11)
yang mana bila dikuadratkan akan diperoleh

2
𝜀𝑖2 = (𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖1 − 𝛽2 𝑋𝑖2 − ⋯ − 𝛽𝑝 𝑋𝑖𝑝 ) , 𝑖 = 1,2, … , 𝑛 (6.12)
10
Jumlah kuadrat sisaan/galat tersebut kita misalkan dengan Q dan
didefinisikan sebagai berikut:
2
𝑄 = ∑𝑛𝑖=1 𝜀𝑖2 = ∑𝑛𝑖=1(𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖1 − 𝛽2 𝑋𝑖2 − ⋯ − 𝛽𝑝 𝑋𝑖𝑝 ) (6.13)
Untuk mengestimasi 𝛽𝑗 , j = 0,1,2,…,p dengan Metode Kuadrat

Terkecil, kita minimumkan fungsi Q tersebut di atas dengan membuat
turunan fungsi tersebut terhadap parameter-parameternya sama
dengan nol.
𝜕𝑄 𝜕𝑄 𝜕𝑄 𝜕𝑄
= 0, = 0, = 0, … , =0
𝜕𝛽0 𝜕𝛽1 𝜕𝛽2 𝜕𝛽𝑝
Hasil penurunan dan penggantian parameter regresi 𝛽𝑗 , j = 0,1,2,…,p

dengan estimator 𝑏𝑗 , j = 0,1,2,…,p memberikan persamaan normal
sebagai berikut
n n n n
 Yi
i 1
 b0 n  b1  X i1
i 1
 b2  X i 2
i 1
 ...  b p  X ip
i 1
n n n n n
 X i1Yi  b0  X i1  b1  X i21
i 1 i 1 i 1
 b2  X i1 X i 2  ...  b p  X i1 X ip
i 1 i 1
n n n n n
 X i 2Yi  b0  X i 2  b1  X i1 X i 2  b2  X i22  ...  b p  X i 2 X ip

i 1 i 1 i 1 i 1 i 1 (6.14)
.
.
.
n n n n n
 X ipYi  b0  X ip  b1  X i1 X ip  b1  X i 2 X ip  ...  b p  X ip2

i 1 i 1 i 1 i 1 i 1
Persamaan 6.14 merupakan suatu sistem persamaan linier,

dimana penyelesaiannya akan memberikan hasil estimasi dari
11
parameter-parameter regresi. Untuk penyelesaiannya dapat
dilakukan dengan pendekatan matriks.
Contoh 6.2 berikut ini memberikan gambaran tentang cara

mengestimasi parameter regresi linier berganda.
Contoh 6.2
Misalkan ingin diketahui pola hubungan antara hasil penjualan
(Y) dengan biaya iklan (X1) dan biaya untuk kontrol kualitas (X2). Oleh
karena itu dikumpulkan data hasil penjualan, biaya iklan, dan biaya
untuk kontrol kualitas selama 10 tahun terakhir sebagai berikut
Tabel 6.3 Data Hasil Penjualan, Biaya Iklan, Biaya Kontrol Kualitas
Hasil Penjualan Kontrol Kualitas
Biaya Iklan (X1)
Tahun (Y) (X2)
(dalam
(dalam (dalam
1000dolar)
1000dolar) 1000dolar)
1 44 10 3
2 40 9 4
3 42 11 3
4 46 12 3
5 48 11 4
6 52 12 5
7 54 13 6
8 58 13 7
9 56 14 7
10 60 15 8
12
Estimasi diawali dengan menghitung unsur-unsur yang
diperlukan dalam proses estimasi parameter regresi linier berganda.
Hasilnya terangkum dalam tabel 6.4.
Tabel 6.4 Hasil Perhitungan Contoh 6.2

No. Y 𝑋1 𝑋2 𝑌2 𝑋1 𝑌 𝑋2 𝑌 𝑋12 𝑋22 𝑋1 𝑋2
1 44 10 3 1936 440 132 100 9 30
2 40 9 4 1600 360 160 81 16 36
3 42 11 3 1764 462 126 121 9 33
4 46 12 3 2116 552 138 144 9 36
5 48 11 4 2304 528 192 121 16 44
6 52 12 5 2704 624 260 144 25 60
7 54 13 6 2916 702 324 169 36 78
8 58 13 7 3364 754 406 169 49 91
9 56 14 7 3136 784 392 196 49 98
10 60 15 8 3600 900 480 225 64 120
Total 500 120 50 25440 6106 2610 1470 282 626
Hasil tersebut dimasukkan ke dalam persamaan normal pada

persamaan 6.14. sehingga diperoleh sistem persamaan linier berikut
500  10 b0  120 b1  50 b2
6106  120 b0  1470 b1  626 b2
2610  50 b0  626 b1  282 b2
Dengan menyelesaikan sistem persamaan linier di atas
diperoleh nilai-nilai b0 = 17.944; b1 = 1.873 dan b2 = 1.916. Sehingga
model regresi yang terbentuk adalah
𝑌̂𝑖 = 17.944 + 1.873𝑋1𝑖 + 1.916𝑋2𝑖
13
Adapun nilai prediksi berdasarkan nilai X1 dan X2 yang
diberikan beserta sisaan/galat berdasarkan model yang diperoleh
dapat dilihat pada tabel 6.5 di bawah ini.
Tabel 6.5 Nilai Pengamatan, Nilai Prediksi, dan Sisaan untuk

Regresi Linier Hasil Penjualan berdasarkan
Biaya Iklan dan Biaya Kontrol Kualitas
𝑋1𝑖 𝑋2𝑖 𝑌𝑖 𝑌̂𝑖 𝑒𝑖 = 𝑌𝑖 − 𝑌̂𝑖
10 3 44 42.422 1.578
9 4 40 42.465 -2.465
11 3 42 44.295 -2.295
12 3 46 46.168 -0.168
11 4 48 46.211 1.789
12 5 52 50.000 2.000
13 6 54 53.789 0.211
13 7 58 55.705 2.295
14 7 56 57.578 -1.578
15 8 60 61.367 -1.367
B. ANALISIS KORELASI
Analisis Korelasi merupakan metode statistika yang mengkaji
tentang tingkat/derajat (seberapa kuat) hubungan antara dua
variabel atau lebih. Analisis korelasi dilakukan dengan menentukan
nilai suatu ukuran yang menunjukkan arah dan tingkat kuat
hubungan antara dua variabel atau lebih. Ukuran tersebut
dinamakan koefisien korelasi dan disimbulkan degan notasi “r”.
Besarnya koefisien korelasi akan berkisar antara -1 (negatif
satu) sampai dengan +1 (positif satu), −1 ≤ 𝑟 ≤ +1.
Koefisien korelasi bernilai positif menunjukkan arah hubungan
positif, yaitu apabila nilai variabel ditingkatkan maka akan
14
meningkatkan nilai variabel yang lain. Dan apabila nilai variabel
diturunkan maka akan menurunkan nilai variabel yang lain.
Koefisien korelasi bernilai negatif menunjukkan arah hubungan
negatif, yaitu apabila nilai variabel ditingkatkan maka akan
menurunkan nilai variabel yang lain. Dan apabila nilai variabel
diturunkan maka akan meningkatkan nilai variabel yang lain.
Koefisien korelasi bernilai 0 menunjukan bahwa tidak terdapat
hubungan antara variabel-variabel tersebut. Koefisien korelasi
bernilai +1 dan -1 menunjukkan korelasi yang sempurna.
Apabila koefisien korelasi mendekati + 1 atau – 1, berarti
hubungan antar variabel tersebut semakin kuat. Sebaliknya, apabila
koefisien korelasi mendekati angka 0, berarti hubungan antar
variabel tersebut semakin lemah. Dengan kata lain, besarnya nilai
korelasi bersifat absolut, sedangkan tanda “ + “ atau “–“ hanya
menunjukkan arah hubungan saja.
1. Koefisien Korelasi Sederhana

Koefisien korelasi sederhana digunakan untuk menentukan
koefisien korelasi antara dua variabel (X dan Y). Koefisien korelasi
sederhana dapat ditentukan dengan menggunakan rumus koefisien
korelasi Pearson (Pearson’s Product Moment) sebagai berikut
𝑛 ∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 𝑦𝑖 −∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
𝑟= (6.15)
2 2
√𝑛 ∑𝑛 2 𝑛
𝑖=1 𝑥𝑖 −(∑𝑖=1 𝑥𝑖 )
√𝑛 ∑ 𝑛 2 𝑛
𝑖=1 𝑦𝑖 −(∑𝑖=1 𝑦𝑖 )
Berdasarkan nilai koefisien korelasi yang diperoleh dapat

diinterpretasikan hubungan antar variabel tersebut, sangat lemah,
lemah, sedang, kuat atau sangat kuat. Pedoman interpretasi
koefisien korelasi dapat dijabarkan seperti pada tabel 6.6.
15
Tabel 6.6 Pedoman Interpretasi Koefisien Korelasi
Nilai Koefisien Korelasi Interpretasi
0.00 – 0.199 Sangat lemah
0.20 – 0.399 Lemah
0.40 – 0.599 Sedang
0.60 – 0.799 Kuat
0.80 – 1.000 Sangat kuat
Contoh 6.3.
Misalkan diketahui data besarnya pendapatan (X) dengan
pengeluaran/konsumsi per bulan (Y) sebagai berikut
Pendapatan (X) 800 900 700 500 700 900 800 600
(dalam ribuan)
Konsumsi (Y) 300 300 200 100 200 400 200 200
(dalam ribuan
Berdasarkan data tersebut, tentukan koefisien korelasi antara

pendapatan dan konsumsi per bulan.
Jawab :
Pertama, dilakukan penghitungan unsur-unsur yang
diperlukan dalam penentuan koefisien korelasi yang hasilnya
tampak pada tabel 6.7.
16
Tabel 6.7 Hasil Perhitungan Contoh 6.3
No. X Y X2 Y2 XY
1 800 300 640000 90000 240000
2 900 300 810000 90000 270000
3 700 200 490000 40000 140000
4 500 100 250000 10000 50000
5 700 200 490000 40000 140000
6 900 400 810000 160000 360000
7 800 200 640000 40000 160000
8 600 200 360000 40000 120000
Total 5900 1900 4490000 510000 1480000
Hasil perhitungan tersebut dimasukkan ke dalam rumus

koefisien korelasi Pearson pada persamaan 6.15
(8)(1480000) − (5900)(1900)
𝑟= = 0.872228
√(8)(4490000) − (5900)2 √(8)(510000) − (1900)2
Diperoleh nilai koefisien korelasi 0.872228 yang berarti terdapat

korelasi yang sangat kuat antara pendapatan dan pengeluaran
(konsumsi) per bulan.
2. Koefisien Korelasi Ganda

Koefisien korelasi ganda digunakan untuk mengukur
keeratan/kekuatan hubungan antara variabel respon (Y) dengan
dua atau lebih variabel prediktor (X1, X2, …).
17
Jika terdapat 2 variabel prediktor (X1, X2), maka koefisien
korelasi ganda antara Y dengan 2 variabel prediktor tersebut dapat
ditentukan dengan rumus berikut
2 +𝑟 2 −2𝑟
𝑟𝑦𝑥1 𝑦𝑥2 𝑦𝑥1 𝑟𝑦𝑥2 𝑟𝑥1 𝑥2
𝑅𝑦𝑥1 𝑥2 = √ (6.16)
1−𝑟𝑥21 𝑥2
dengan 𝑟𝑦𝑥1 = koefisien korelasi sederhana antara Y dan X1
𝑟𝑦𝑥2 = koefisien korelasi sederhana antara Y dan X2

𝑟𝑥1𝑥2 = koefisien korelasi sederhana antara X1 dan X2
Contoh 6.4
Berdasarkan data pada contoh 6.2, tentukan koefisien korelasi
ganda antara hasil penjualan (Y) dengan biaya iklan (X1) dan biaya
untuk kontrol kualitas (X2).
Jawab:
Pertama, ditentukan terlebih dahulu koefisien-koefisien korelasi
sederhana antara Y dan X1, Y dan X2, serta X1 dan X2 berdasarkan
persamaan 6.15 danhasil perhitungan contoh 6.2 pada tabel 6.4,
yaitu
(𝑛) ∑𝑛𝑖=1 𝑥1𝑖 𝑦𝑖 − ∑𝑛𝑖=1 𝑥1𝑖 ∑𝑛𝑖=1 𝑦𝑖
𝑟𝑦𝑥1 =
2 2
√𝑛 ∑𝑛𝑖=1 𝑥1𝑖
2
− (∑𝑛𝑖=1 𝑥1𝑖 ) √𝑛 ∑𝑛𝑖=1 𝑦𝑖2 − (∑𝑛𝑖=1 𝑦𝑖 )
(10)(6106) − (120)(500)
= = 0.9226
√(10)(1470) − (120)2 √(10)(25440) − (500)2
18
(𝑛) ∑𝑛𝑖=1 𝑥2𝑖 𝑦𝑖 − ∑𝑛𝑖=1 𝑥2𝑖 ∑𝑛𝑖=1 𝑦𝑖
𝑟𝑦𝑥2 =
2 2
2
− (∑𝑛𝑖=1 𝑥2𝑖 ) √𝑛 ∑𝑛𝑖=1 𝑦𝑖2 − (∑𝑛𝑖=1 𝑦𝑖 )
(10)(2610) − (50)(500)
= = 0.9270
√(10)(282) − (50)2 √(10)(25440) − (500)2
(𝑛) ∑𝑛𝑖=1 𝑥1𝑖 𝑥2𝑖 − ∑𝑛𝑖=1 𝑥1𝑖 ∑𝑛𝑖=1 𝑥2𝑖

𝑟𝑥1𝑥2 =
2 2
2
− (∑𝑛𝑖=1 𝑥1𝑖 ) √𝑛 ∑𝑛𝑖=1 𝑥2𝑖
2
− (∑𝑛𝑖=1 𝑥2𝑖 )
(10)(626) − (120)(50)
= = 0.8391
√(10)(1470) − (120)2 √(10)(282) − (50)2
Hasil yang diperoleh tersebut, dimasukkan ke dalam

persamaan 6.16 sebagai berikut
0.92262 + 0.92702 − 2(0.9226)(0.9270)(0.8391)

𝑅𝑦𝑥1𝑥2 = √ = 0.9644
1 − 0.83912
Diperoleh koefisien korelasi ganda sebesar 0.9644 yang berarti

terdapat hubungan yang sangat kuat antara hasil penjualan (Y)
dengan biaya iklan (X1) dan biaya untuk kontrol kualitas (X2).
Jika terdapat p variabel prediktor (X1, X2, …, Xp), maka

koefisien korelasi ganda antara Y dengan p variabel prediktor
tersebut dapat ditentukan dengan rumus berikut
𝑏1 ∑ 𝑥1 𝑦+𝑏2 ∑ 𝑥2 𝑦+⋯+𝑏𝑖 ∑ 𝑥𝑖 𝑦+⋯+𝑏𝑝 ∑ 𝑥𝑝 𝑦

𝑅𝑦𝑥1 𝑥2.…𝑥𝑖 …𝑥𝑝 = √ (6.17)
∑ 𝑦2
(∑𝑛 𝑛
𝑗=1 𝑥𝑖𝑗 )(∑𝑗=1 𝑦𝑗 )
dengan ∑ 𝑥𝑖 𝑦 = ∑𝑛𝑗=1 𝑥𝑖𝑗 𝑦𝑗 − , 𝑖 = 1,2, … , 𝑝
𝑛
19
2
(∑𝑛
𝑗=1 𝑦𝑗 )
∑𝑦 = 2 ∑𝑛𝑗=1 𝑦𝑗2 −
𝑛
𝑏𝑖 = koefisien regresi masing-masing variabel prediktor,

untuk 𝑖 = 1,2, … , 𝑝
3. Koefisien Korelasi Parsial

Koefisien korelasi parsial adalah ukuran yang digunakan untuk
menentukan tingkat keeratan/kekuatan hubungan antara salah
satu variabel prediktor dengan variabel respon apabila variabel
prediktor yang lain dianggap konstan/tetap.
Untuk variabel-variabel Y, X1, dan X2, kita dapat menentukan
koefisien korelasi parsial antara Y dan X1 dengan menganggap X2
konstan, dinotasikan dengan 𝑟𝑦𝑥1 . 𝑥2 , dan koefisien korelasi parsial
antara Y dan X2 dengan menganggap X1 konstan, dinotasikan

dengan 𝑟𝑦𝑥2 . 𝑥1 . Rumus yang digunakan adalah
𝑟𝑦𝑥1 −𝑟𝑦𝑥2 𝑟𝑥1 𝑥2

𝑟𝑦𝑥1 . 𝑥2 = (6.18)
2 )(1−𝑟 2
√(1−𝑟𝑦𝑥2 𝑥1 𝑥2 )
𝑟𝑦𝑥2 −𝑟𝑦𝑥1 𝑟𝑥1 𝑥2

𝑟𝑦𝑥2 . 𝑥1 = (6.19)
2 )(1−𝑟 2
√(1−𝑟𝑦𝑥1 𝑥1 𝑥2 )
dengan 𝑟𝑦𝑥1 = koefisien korelasi sederhana antara Y dan X1
𝑟𝑦𝑥2 = koefisien korelasi sederhana antara Y dan X2

𝑟𝑥1𝑥2 = koefisien korelasi sederhana antara X1 dan X2
20
Contoh 6.5
Berdasarkan contoh 6.2 dan 6.4, tentukan korelasi parsial antara Y
dan X1 dengan mengagnggap X2 konstan (𝑟𝑦𝑥1 . 𝑥2 ).
Jawab:
Untuk menentukan 𝑟𝑦𝑥1 . 𝑥2 , digunakan persamaan 6.18, dimana
perlu diketahui nilai koefisien-koefisien korelasi 𝑟𝑦𝑥1 , 𝑟𝑦𝑥2 , dan 𝑟𝑥1 𝑥2 .
Nilai-nilai tersebut telah dihitung pada contoh 6.4 dan hasilnya

adalah
𝑟𝑦𝑥1 = 0.9226, 𝑟𝑦𝑥2 = 0.9270, dan 𝑟𝑥1𝑥2 = 0.8391
Nilai tersebut dimasukkan ke persamaan 6.18, sehingga diperoleh
0.9226 − (0.9270)(0.8391)
𝑟𝑦𝑥1 . 𝑥2 = = 0.7095
√(1 − 0.92702 )(1 − 0.83912 )
Untuk variabel-variabel Y, X1, X2, dan X3 kita dapat

menentukan koefisien-koefisien korelasi parsial 𝑟𝑦𝑥1 . 𝑥2 𝑥3 , 𝑟𝑦𝑥2 . 𝑥1 𝑥3 ,
dan 𝑟𝑦𝑥3 . 𝑥1 𝑥2 . 𝑟𝑦𝑥1 . 𝑥2 𝑥3 menyatakan koefisien korelasi antara Y
dan X1 dengan menganggap X2 dan X3 konstan. Rumus yang

digunakan adalah
𝑟𝑦𝑥1 . 𝑥2 − 𝑟𝑦𝑥3 . 𝑥2 𝑟𝑥1 𝑥3 . 𝑥2

𝑟𝑦𝑥1 . 𝑥 2 𝑥3 = (6.20)
2
√(1−𝑟𝑦𝑥 )(1−𝑟𝑥21 𝑥3 . 𝑥2 )
3 . 𝑥2
𝑟𝑦𝑥2 . 𝑥1 − 𝑟𝑦𝑥3 . 𝑥1 𝑟𝑥2 𝑥3 . 𝑥1

𝑟𝑦𝑥2 . 𝑥 1 𝑥3 = (6.21)
2
√(1−𝑟𝑦𝑥 )(1−𝑟𝑥22 𝑥3 . 𝑥1 )
3 . 𝑥1
21
𝑟𝑦𝑥3 . 𝑥1 − 𝑟𝑦𝑥2 . 𝑥1 𝑟𝑥2 𝑥3 . 𝑥1
𝑟𝑦𝑥3 . 𝑥 1 𝑥2 = (6.22)
2
√(1−𝑟𝑦𝑥 )(1−𝑟𝑥22 𝑥3 . 𝑥1 )
2 . 𝑥1
Dengan koefisien-koefisien korelasi parsial yang ada di ruas kanan

dapat dihitung seperti rumus pada persamaan 6.18 dan 6.19.
22
LATIHAN SOAL
1. Indeks prestasi (IP) mahasiswa matematika kemungkinan

dipengaruhi oleh skor kemampuan dasar matematika dari
mahasiswa tersebut. Untuk mengetahui hal tersebut dikumpulkan
data indeks prestasi dan skor kemampuan dasar matematika
dari beberapa mahasiswa matematika. Hasilnya tampak pada
tabel berikut
IP Skor Kemampuan Dasar

Matematika
1.98 321
2.18 358
2.98 640
1.89 270
2.66 442
3.14 670
2.20 580
2.02 452
3.08 792
3.10 595
a. Pola hubungan antara indeks prestasi dengan skor

kemampuan dasar matematika diasumsikan mengikuti pola
garis lurus. Lakukan estimasi parameter-parameter regresi!
b. Tentukan nilai prediksi indeks prestasi mahasiswa untuk tiap
skor kemampuan dasar matematika hasil pengamatan!
c. Tentukan koefisien korelasi antara indeks prestasi dengan skor
kemampuan dasar matematika.
23
2. Berikut adalah data total konsumsi energi di daerah A dan total
populasi daerah A
Tahun Konsumsi Energi Total Populasi

(quadrillion Btu.) (million)
1900 7.6 76.0
1910 14.8 86.0
1920 19.8 105.7
1930 22.3 120.0
1940 23.9 131.7
1950 34.2 151.3
1960 44.6 179.3
1970 67.1 203.2
a. Pengaruh total populasi terhadap konsumsi energi di daerah

A dapat dinyatakan dengan menggunakan model garis
lurus, lakukan estimasi model regresinya.
b. Dengan model garis lurus yang diperoleh, prediksi besarnya
konsumsi energi di daerah A pada tahun 1975 ketika total
populasinya 213 million. Dan bila ternyata total konsumsi
energinya sebesar 71.1 quadrillion Btu., berapa besar
kesalahan prediksi yang dibuat berdasarkan data tahun
1900-1970 tersebut?
c. Bagaimana arah dan tingkat/derajat hubungan antara
konsumsi energi dan total populasi?
3. Suhu plat pembungkus dan jarak plat pembungkus dalam mesin

pembungkus sabun mempengaruhi persentase sabun
terbungkus yang lolos inspeksi. Beberapa data tentang variabel
itu telah dikumpulkan, yaitu
24
% Terbungkus Rapi Jarak Plat Suhu Plat
Y pembungkus Pembungkus
X1 X2
78.5 7 2.6
74.3 1 2.9
104.3 11 5.6
87.6 11 3.1
95.9 7 5.2
109.2 11 5.5
102.7 3 7.1
102.5 5 6.2
Sumber: Draper dan Smith, 1998
a. Gunakan model regresi linier berganda dan estimasi

parameter-parameter regresinya.
b. Tentukan nilai prediksi dan sisaan/galat berdasarkan model
regresi yang diperoleh.
c. Tentukan koefisien korelasi ganda antara Y dengan X1 dan X2.
4. Kualitas benang telah diteliti sebanyak 20 potong. Karakteristik

yang diuji dalam penelitian ini adalah
X1 = panjang fiber per 0.01 inc.

X2 = daya regang fiber (1000 pound per inc2)
X3 = kehalusan fiber (0.1 microgram per inc fiber)
yang diperlukan untuk memperkirakan kekuatan untaian benang

(Y) dalam pund. Hasil penelitian diberikan dalam tabel berikut.
25
Nomor X1 X2 X3 Y
Benang
1 85 76 44 99
2 82 78 42 93
3 75 73 42 99
4 74 72 44 97
5 76 73 43 90
6 74 69 46 96
7 73 69 46 93
8 96 80 36 130
9 93 78 36 118
10 70 73 37 88
11 82 71 46 89
12 80 72 45 93
13 77 76 42 94
14 67 76 50 75
15 82 70 48 84
16 76 76 41 91
17 74 78 31 100
18 71 80 29 98
19 70 83 39 101
20 64 79 38 80
Sumber: Duncan, A.J., Quality Control and Industrial Statistics, Richard D. Irwin,
Inc., 1959
a. Tentukan model regresinya.

b. Tentukan nilai prediksi dan sisaan/galatnya.
***
26

Bahan Ajar Statistika - Analisis Regresi Dan Korelasi

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bahan Ajar Statistika - Analisis Regresi Dan Korelasi

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS REGRESI

TAHUN PERTAMA BERSAMA

1. Analisis Regresi Linier Sederhana

Gambar 6.1 Ilustrasi Model Regresi Linier Sederhana

Misalkan kita mempunyai sekelompok data berpasangan

Gambar 6.2 Beberapa Garis Lurus yang Mungkin untuk

Yang menjadi pertanyaan adalah garis mana yang paling

𝑄 = ∑𝑛𝑖=1 𝜀𝑖2 = ∑𝑛𝑖=1(𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 )2 (6.5)

Untuk mengestimasi 𝛽0 , 𝛽1 dengan Metode Kuadrat Terkecil,

Sehingga diperoleh persamaan normal

𝑛𝛽0 + 𝛽1 ∑𝑛𝑖=1 𝑋𝑖 = ∑𝑛𝑖=1 𝑌𝑖 (6.6)

𝛽0 ∑𝑛𝑖=1 𝑋𝑖 + 𝛽1 ∑𝑛𝑖=1 𝑋𝑖2 = ∑𝑛𝑖=1 𝑋𝑖 𝑌𝑖 (6.7)

Persamaan 6.6 dan 6.7 membentuk suatu sistem persamaan

Berikut ini diberikan contoh pembentukan model regresi

Tabel 6.1 Hasil Produksi Tanaman Kedelai (Y) dan Konsentrasi

∑ 𝑋𝑖2 = 0.0399 ∑ 𝑌𝑖2 = 208495 ∑ 𝑋𝑖 𝑌𝑖 = 76.99

Dengan mengasumsikan bahwa terdapat pola hubungan

Sehingga model regresi yang terbentuk adalah

Persamaan tersebut dapat diinterpretasikan sebagai berikut,

Tabel 6.2 Nilai Pengamatan, Nilai Prediksi, dan Sisaan untuk

𝜀𝑖 = 𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖1 − 𝛽2 𝑋𝑖2 − ⋯ − 𝛽𝑝 𝑋𝑖𝑝 , 𝑖 = 1,2, … , 𝑛 (6.11)

yang mana bila dikuadratkan akan diperoleh

Untuk mengestimasi 𝛽𝑗 , j = 0,1,2,…,p dengan Metode Kuadrat

Hasil penurunan dan penggantian parameter regresi 𝛽𝑗 , j = 0,1,2,…,p

 X i 2Yi  b0  X i 2  b1  X i1 X i 2  b2  X i22  ...  b p  X i 2 X ip

 X ipYi  b0  X ip  b1  X i1 X ip  b1  X i 2 X ip  ...  b p  X ip2

Persamaan 6.14 merupakan suatu sistem persamaan linier,

Contoh 6.2 berikut ini memberikan gambaran tentang cara

Tabel 6.4 Hasil Perhitungan Contoh 6.2

Hasil tersebut dimasukkan ke dalam persamaan normal pada

𝑌̂𝑖 = 17.944 + 1.873𝑋1𝑖 + 1.916𝑋2𝑖

Tabel 6.5 Nilai Pengamatan, Nilai Prediksi, dan Sisaan untuk

1. Koefisien Korelasi Sederhana

Berdasarkan nilai koefisien korelasi yang diperoleh dapat

Berdasarkan data tersebut, tentukan koefisien korelasi antara

Hasil perhitungan tersebut dimasukkan ke dalam rumus

Diperoleh nilai koefisien korelasi 0.872228 yang berarti terdapat

2. Koefisien Korelasi Ganda

dengan 𝑟𝑦𝑥1 = koefisien korelasi sederhana antara Y dan X1

𝑟𝑦𝑥2 = koefisien korelasi sederhana antara Y dan X2

(𝑛) ∑𝑛𝑖=1 𝑥1𝑖 𝑥2𝑖 − ∑𝑛𝑖=1 𝑥1𝑖 ∑𝑛𝑖=1 𝑥2𝑖

Hasil yang diperoleh tersebut, dimasukkan ke dalam

0.92262 + 0.92702 − 2(0.9226)(0.9270)(0.8391)

Diperoleh koefisien korelasi ganda sebesar 0.9644 yang berarti

Jika terdapat p variabel prediktor (X1, X2, …, Xp), maka

𝑏1 ∑ 𝑥1 𝑦+𝑏2 ∑ 𝑥2 𝑦+⋯+𝑏𝑖 ∑ 𝑥𝑖 𝑦+⋯+𝑏𝑝 ∑ 𝑥𝑝 𝑦

𝑏𝑖 = koefisien regresi masing-masing variabel prediktor,

3. Koefisien Korelasi Parsial

antara Y dan X2 dengan menganggap X1 konstan, dinotasikan

𝑟𝑦𝑥1 −𝑟𝑦𝑥2 𝑟𝑥1 𝑥2

𝑟𝑦𝑥2 −𝑟𝑦𝑥1 𝑟𝑥1 𝑥2

dengan 𝑟𝑦𝑥1 = koefisien korelasi sederhana antara Y dan X1

𝑟𝑦𝑥2 = koefisien korelasi sederhana antara Y dan X2

perlu diketahui nilai koefisien-koefisien korelasi 𝑟𝑦𝑥1 , 𝑟𝑦𝑥2 , dan 𝑟𝑥1 𝑥2 .

Nilai-nilai tersebut telah dihitung pada contoh 6.4 dan hasilnya

Untuk variabel-variabel Y, X1, X2, dan X3 kita dapat

dan 𝑟𝑦𝑥3 . 𝑥1 𝑥2 . 𝑟𝑦𝑥1 . 𝑥2 𝑥3 menyatakan koefisien korelasi antara Y

dan X1 dengan menganggap X2 dan X3 konstan. Rumus yang

𝑟𝑦𝑥1 . 𝑥2 − 𝑟𝑦𝑥3 . 𝑥2 𝑟𝑥1 𝑥3 . 𝑥2

𝑟𝑦𝑥2 . 𝑥1 − 𝑟𝑦𝑥3 . 𝑥1 𝑟𝑥2 𝑥3 . 𝑥1

Dengan koefisien-koefisien korelasi parsial yang ada di ruas kanan

1. Indeks prestasi (IP) mahasiswa matematika kemungkinan

IP Skor Kemampuan Dasar