DAN KORELASI
KOMPETENSI DASAR
Setelah mengikuti materi pokok Analisis Regresi dan Korelasi
mahasiswa diharapkan dapat menjelaskan dan melakukan analisis
regresi dan korelasi.
INDIKATOR
Indikator ketercapaian dari materi pokok Uji Hipotesis adalah
6.1 Mahasiswa dapat menjelaskan pengertian dasar yang
berkaitan analisis regresi dan korelasi.
6.2 Mahasiswa dapat melakukan analisis regresi linier sederhana.
6.3 Mahasiswa dapat melakukan analisis regresi linier berganda.
6.4 Mahasiswa dapat menentukan koefisien korelasi.
PENDAHULUAN
Dalam penelitian, seringkali kita mengamati dua atau lebih
variabel yang berpasangan. Berdasarkan hasil pengamatan
terhadap variabel-variabel tersebut kita ingin mengetahui apakah
variabel-variabel tersebut saling berhubungan/berkaitan,
bagaimanakah pola hubungan antara variabel-variabel tersebut,
dan seberapa kuatkah hubungan antara variabel-variabel tersebut.
Untuk mengetahui hal tersebut kita dapat menggunakan metode
statistika, antara lain adalah analisis regresi dan korelasi.
1
Pada bagian ini akan dibahas pengertian dari analisis regresi
dan korelasi, cara menentukan pola regresi dan koefisien korelasi
dan bagaimana menginterpretasikan hasil yang diperoleh.
A. ANALISIS REGRESI
Analisis Regresi adalah suatu metode statistika yang mengkaji
tentang pola hubungan (bentuk fungsional) antara dua variabel
atau lebih, sehingga nilai salah satu variabel dapat diprediksi atau
diramalkan berdasarkan variabel yang lain. Misalnya, hubungan
antara berat badan orang dewasa dengan tinggi badan, nilai
dengan waktu belajar siswa, tekanan gas dengan suhu dan volume,
nilai penjualan dengan biaya promosi, berat badan dengan umur
dan asupan makanan.
Variabel-variabel dalam analisis regresi dibedakan menjadi
dua, yaitu variabel penyebab atau yang mempengaruhi, yang
dikenal dengan sebutan variabel prediktor, variabel bebas, variabel
penjelas, atau variabel independen. Biasanya disimbulkan dengan
huruf “X”. Selain itu terdapat pula variabel yang terkena akibat atau
yang dipengaruhi, yang dikenal dengan istilah variabel respon,
variabel terikat, atau variabel dependen. Biasanya disimbulkan
dengan huruf “Y “.
Analisis regresi merupakan metode statistika yang mengkaji
pola hubungan antar variabel, sehingga tujuan dari analisis regresi
adalah menyelidiki bentuk fungsional atau pola hubungan antara
variabel respon (Y) dan variabel prediktor (X) berdasarkan data
sampel yang diperoleh. Sebagai contoh, misalkan kita memiliki data
sampel tentang nilai penjualan dan biaya promosi maka dengan
analisis regresi kita bertujuan untuk menyelidiki bagaimana bentuk
2
fungsional antara nilai penjualan dan biaya promosi, apakah biaya
promosi mempengaruhi nilai penjualan secara garis lurus, kuadratik,
eksponensial atau bentuk fungsional yang lain.
Selain itu analisis regresi juga bertujuan untuk mengestimasi
nilai rata-rata (mean) dari Y populasi berdasarkan nilai X yang
diberikan. Dimana estimasi nilai rata-rata Y populasi tersebut
ditentukan oleh bentuk fungsional hubungan antara Y dan X. Atau
dapat dikatakan bahwa bentuk fungsional antara Y dan X
merupakan estimator nilai rata-rata Y populasi. Sebagai contoh,
misalkan akan diestimasi berapa rata-rata emisi yang ditimbulkan
bila sebuah mobil telah menempuh jarak sejauh 50 ribu kilometer.
Dengan analisis regresi kita estimasi bentuk fungsionalnya
berdasarkan data sampel yang ada. Selanjutnya bentuk fungsi yang
dihasilkan tersebut digunakan untuk mengestimasi nilai rata-rata
emisinya. Misalkan hasil estimasi bentuk fungsionalnya adalah 𝑌̂ =
382 + 5.39 𝑋 , bila diberikan nilai X = 50 maka dapat diestimasi bahwa
nilai rata-rata Y populasi adalah 382 + 5.39(50) = 651.5 . Sehingga
dapat dikatakan bahwa untuk mobil yang telah menempuh jarak
sejauh 50 ribu kilometer maka rata-rata emisi yang ditimbulkan
sebesar 651.5 ppm.
Adapun manfaat dari analisis regresi adalah dapat digunakan
untuk memprediksi atau meramalkan nilai salah satu variabel
berdasarkan variabel yang lain. Contohnya, dengan mengetahui
bentuk fungsional antara nilai penjualan dan biaya produksi, kita
dapat memprediksi atau meramalkan berapa nilai penjualan yang
akan kita peroleh bila kita mengeluarkan biaya promosi dengan
jumlah tertentu.
Selain itu dengan analisis regresi, kita dapat mengetahui faktor
mana yang memberikan kontribusi terbesar terhadap hal tertentu.
3
Misalkan ada beberapa faktor yang mempengaruhi nilai indeks
harga saham, yaitu inflasi, nilai tukar rupiah terhadap dolar, dan
tingkat suku bunga. Dengan mengetahui bentuk fungsional atau
pola hubungan antara indeks harga saham dengan inflasi, nilai tukar
rupiah terhadap dolar, dan tingkat suku bunga, maka dapat
diketahui mana di antara inflasi, nilai tukar rupiah, dan tingkat suku
bunga yang mempunyai kontribusi terbesar (paling berpengaruh)
terhadap perubahan nilai indeks harga saham.
Hasil yang diperoleh dari analisis regresi akan sangat
membantu dalam pengambilan keputusan dan penentuan
kebijakan dalam berbagai bidang.
Analisis regresi dapat dibedakan menjadi dua bagian, yaitu
analisis regresi linier dan analisis regresi non linier. Pada analisis regresi
linier bentuk fungsionalnya mempunyai parameter linier (pangkat
satu). Yang termasuk analisis regresi linier antara lain adalah analisis
regresi linier sederhana (garis lurus), analisis regresi linier berganda.
Sedangkan pada analisis regresi non linier bentuk fungsionalnya
mempunyai parameter non linier. Yang termasuk analisis regresi non
linier antara lain adalah model regresi eksponensial dan logaritma.
Pada bagian ini akan dibahas tentang analisis regresi linier,
khususnya regresi linier sederhana dan regresi linier berganda.
4
Karena diasumsikan bentuk fungsionalnya adalah garis lurus,
maka pada analisis regresi linier sederhana model regresinya adalah
sebagai berikut:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 , 𝑖 = 1,2, … , 𝑛 (6.1)
dengan 𝛽0 , 𝛽1 adalah parameter-parameter regresi, dan 𝜀𝑖 adalah
sisaan atau galat yang didefinisikan sebagai selisih/beda antara 𝑌𝑖
dengan garis regresi pada lokasi 𝑋𝑖 . Untuk mengestimasi persamaan
garis regresi, dilakukan dengan menentukan estimator parameter
𝛽0 (= 𝛽̂0 = 𝑏0 ) dan estimator parameter 𝛽1 (= 𝛽̂1 = 𝑏1 ). Sehingga
diperoleh persamaan garis
𝑌̂𝑖 = 𝑏0 + 𝑏1 𝑋𝑖 , 𝑖 = 1,2, … , 𝑛 (6.2)
dimana 𝑌̂𝑖 merupakan nilai prediksi 𝑌𝑖 pada lokasi 𝑋𝑖 .
Gambaran dari model regresi linier sederhana dapat dilihat pada
Gambar 6.1 berikut.
Garis regresi
𝑌𝑖
𝜀𝑖
𝛽0 + 𝛽1 𝑋𝑖 yang
diestimasi dengan
𝑌̂𝑖 = 𝑏0 + 𝑏1 𝑋𝑖
𝑋𝑖
5
data tersebut kita mungkin memperoleh beberapa persamaan garis
lurus, seperti nampak pada gambar 6.2 berikut.
90
80
70
60
50
Y
40
30
20
10
0
0 20 40 60 80 100
6
yang mana bila dikuadratkan akan diperoleh
𝜀𝑖2 = (𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖 )2 , 𝑖 = 1,2, … , 𝑛 (6.4)
Jumlah kuadrat sisaan/galat tersebut kita misalkan dengan Q dan
didefinisikan sebagai berikut:
∑ 𝑌𝑖 − 𝑛𝛽0 − 𝛽1 ∑ 𝑋𝑖 = 0
𝑖=1 𝑖=1
∑ 𝑋𝑖 𝑌𝑖 − 𝛽0 ∑ 𝑋𝑖 − 𝛽1 ∑ 𝑋𝑖2 = 0
𝑖=1 𝑖=1 𝑖=1
dan 𝑏0 = 𝑌̅ − 𝑏1 𝑋̅ (6.9)
7
Nilai yang diperoleh dari persamaan 6.8 dan 6.9 disubstitusikan
ke persamaan 6.2 untuk mendapatkan prediksi model regresinya.
Contoh 6.1.
Berdasarkan hasil penelitian Dr. A.S. Heagle di Universitas Carolina
Utara tentang pengaruh polusi ozon pada hasil produksi tanaman
kedelai, diperoleh data sebagai berikut
∑ 𝑋𝑖 = 0.35 ∑ 𝑌𝑖 = 911
𝑖=1 𝑖=1
𝑛 𝑛 𝑛
Sumber: Applied regression analysis: a research tool. — 2nd ed. , Rawlings, J.O.,
Pentula, S.G., Dickey, D.A., Springer-Verlag, Inc., New York, 1998.
(0.35)(911)
76.99 −
𝑏1 = 4 = −293.531
(0.35)2
0.0399 −
4
8
911 0.35
𝑏0 = — (−293.531) ( ) = 253.434
4 4
9
2. Analisis Regresi Linier Berganda
Pada analisis regresi linier sederhana, variabel respon Y hanya
dipengaruhi oleh satu variabel prediktor X. Namun pada
kenyataannya sering kita jumpai suatu keadaan dipengaruhi lebih
dari satu faktor. Sebagai contoh, hasil penjualan (Y) tidak hanya
dipengaruhi oleh faktor promosi (X1), tetapi dipengaruhi juga oleh
faktor lokasi penjualan (X2). Contoh lain, berat badan (Y) dapat
dipengaruhi oleh jumlah asupan makanan (X1) dan umur (X2). Atau
indeks harga saham (Y) dipengaruhi oleh tingkat inflasi (X1), suku
bunga (X2), dan nilai tukar rupiah (X3). Untuk mengestimasi pola
hubungan satu variabel respon dengan dua atau lebih variabel
prediktor, digunakan analisis regresi linier berganda.
Bentuk umum dari model regresi linier berganda yang
berkaitan dengan p variabel bebas/prediktor adalah
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + ⋯ + 𝛽𝑗 𝑋𝑖𝑗 + ⋯ + 𝛽𝑝 𝑋𝑖𝑝 + 𝜀𝑖 (6.10)
dimana i menunjukkan unit pengamatan untuk variabel respon Y
dan p variabel prediktor yang diberikan. Untuk sampel berukuran n,
maka i = 1,2,…,n. Pada model tersebut nampak terdapat p’=(p+1)
parameter regresi 𝛽𝑗 , j = 0,1,2,…,p yang akan diestimasi. Di sini kita
asumsikan bahwa n>p’.
Estimasi parameter model regresi linier berganda dapat
diestimasi dengan Metode Kuadrat Terkecil. Berdasarkan
persamaan 6.10 dapat dibuat fungsi sisaan/galat sebagai berikut:
10
Jumlah kuadrat sisaan/galat tersebut kita misalkan dengan Q dan
didefinisikan sebagai berikut:
2
𝑄 = ∑𝑛𝑖=1 𝜀𝑖2 = ∑𝑛𝑖=1(𝑌𝑖 − 𝛽0 − 𝛽1 𝑋𝑖1 − 𝛽2 𝑋𝑖2 − ⋯ − 𝛽𝑝 𝑋𝑖𝑝 ) (6.13)
𝜕𝑄 𝜕𝑄 𝜕𝑄 𝜕𝑄
= 0, = 0, = 0, … , =0
𝜕𝛽0 𝜕𝛽1 𝜕𝛽2 𝜕𝛽𝑝
Yi
i 1
b0 n b1 X i1
i 1
b2 X i 2
i 1
... b p X ip
i 1
n n n n n
X i1Yi b0 X i1 b1 X i21
i 1 i 1 i 1
b2 X i1 X i 2 ... b p X i1 X ip
i 1 i 1
n n n n n
11
parameter-parameter regresi. Untuk penyelesaiannya dapat
dilakukan dengan pendekatan matriks.
Contoh 6.2
Misalkan ingin diketahui pola hubungan antara hasil penjualan
(Y) dengan biaya iklan (X1) dan biaya untuk kontrol kualitas (X2). Oleh
karena itu dikumpulkan data hasil penjualan, biaya iklan, dan biaya
untuk kontrol kualitas selama 10 tahun terakhir sebagai berikut
Tabel 6.3 Data Hasil Penjualan, Biaya Iklan, Biaya Kontrol Kualitas
Hasil Penjualan Kontrol Kualitas
Biaya Iklan (X1)
Tahun (Y) (X2)
(dalam
(dalam (dalam
1000dolar)
1000dolar) 1000dolar)
1 44 10 3
2 40 9 4
3 42 11 3
4 46 12 3
5 48 11 4
6 52 12 5
7 54 13 6
8 58 13 7
9 56 14 7
10 60 15 8
12
Estimasi diawali dengan menghitung unsur-unsur yang
diperlukan dalam proses estimasi parameter regresi linier berganda.
Hasilnya terangkum dalam tabel 6.4.
13
Adapun nilai prediksi berdasarkan nilai X1 dan X2 yang
diberikan beserta sisaan/galat berdasarkan model yang diperoleh
dapat dilihat pada tabel 6.5 di bawah ini.
B. ANALISIS KORELASI
Analisis Korelasi merupakan metode statistika yang mengkaji
tentang tingkat/derajat (seberapa kuat) hubungan antara dua
variabel atau lebih. Analisis korelasi dilakukan dengan menentukan
nilai suatu ukuran yang menunjukkan arah dan tingkat kuat
hubungan antara dua variabel atau lebih. Ukuran tersebut
dinamakan koefisien korelasi dan disimbulkan degan notasi “r”.
Besarnya koefisien korelasi akan berkisar antara -1 (negatif
satu) sampai dengan +1 (positif satu), −1 ≤ 𝑟 ≤ +1.
Koefisien korelasi bernilai positif menunjukkan arah hubungan
positif, yaitu apabila nilai variabel ditingkatkan maka akan
14
meningkatkan nilai variabel yang lain. Dan apabila nilai variabel
diturunkan maka akan menurunkan nilai variabel yang lain.
Koefisien korelasi bernilai negatif menunjukkan arah hubungan
negatif, yaitu apabila nilai variabel ditingkatkan maka akan
menurunkan nilai variabel yang lain. Dan apabila nilai variabel
diturunkan maka akan meningkatkan nilai variabel yang lain.
Koefisien korelasi bernilai 0 menunjukan bahwa tidak terdapat
hubungan antara variabel-variabel tersebut. Koefisien korelasi
bernilai +1 dan -1 menunjukkan korelasi yang sempurna.
Apabila koefisien korelasi mendekati + 1 atau – 1, berarti
hubungan antar variabel tersebut semakin kuat. Sebaliknya, apabila
koefisien korelasi mendekati angka 0, berarti hubungan antar
variabel tersebut semakin lemah. Dengan kata lain, besarnya nilai
korelasi bersifat absolut, sedangkan tanda “ + “ atau “–“ hanya
menunjukkan arah hubungan saja.
𝑛 ∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 𝑦𝑖 −∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
𝑟= (6.15)
2 2
√𝑛 ∑𝑛 2 𝑛
𝑖=1 𝑥𝑖 −(∑𝑖=1 𝑥𝑖 )
√𝑛 ∑ 𝑛 2 𝑛
𝑖=1 𝑦𝑖 −(∑𝑖=1 𝑦𝑖 )
15
Tabel 6.6 Pedoman Interpretasi Koefisien Korelasi
Nilai Koefisien Korelasi Interpretasi
0.00 – 0.199 Sangat lemah
0.20 – 0.399 Lemah
0.40 – 0.599 Sedang
0.60 – 0.799 Kuat
0.80 – 1.000 Sangat kuat
Contoh 6.3.
Misalkan diketahui data besarnya pendapatan (X) dengan
pengeluaran/konsumsi per bulan (Y) sebagai berikut
Pendapatan (X) 800 900 700 500 700 900 800 600
(dalam ribuan)
Konsumsi (Y) 300 300 200 100 200 400 200 200
(dalam ribuan
Jawab :
Pertama, dilakukan penghitungan unsur-unsur yang
diperlukan dalam penentuan koefisien korelasi yang hasilnya
tampak pada tabel 6.7.
16
Tabel 6.7 Hasil Perhitungan Contoh 6.3
No. X Y X2 Y2 XY
1 800 300 640000 90000 240000
2 900 300 810000 90000 270000
3 700 200 490000 40000 140000
4 500 100 250000 10000 50000
5 700 200 490000 40000 140000
6 900 400 810000 160000 360000
7 800 200 640000 40000 160000
8 600 200 360000 40000 120000
Total 5900 1900 4490000 510000 1480000
(8)(1480000) − (5900)(1900)
𝑟= = 0.872228
√(8)(4490000) − (5900)2 √(8)(510000) − (1900)2
17
Jika terdapat 2 variabel prediktor (X1, X2), maka koefisien
korelasi ganda antara Y dengan 2 variabel prediktor tersebut dapat
ditentukan dengan rumus berikut
2 +𝑟 2 −2𝑟
𝑟𝑦𝑥1 𝑦𝑥2 𝑦𝑥1 𝑟𝑦𝑥2 𝑟𝑥1 𝑥2
𝑅𝑦𝑥1 𝑥2 = √ (6.16)
1−𝑟𝑥21 𝑥2
Contoh 6.4
Berdasarkan data pada contoh 6.2, tentukan koefisien korelasi
ganda antara hasil penjualan (Y) dengan biaya iklan (X1) dan biaya
untuk kontrol kualitas (X2).
Jawab:
Pertama, ditentukan terlebih dahulu koefisien-koefisien korelasi
sederhana antara Y dan X1, Y dan X2, serta X1 dan X2 berdasarkan
persamaan 6.15 danhasil perhitungan contoh 6.2 pada tabel 6.4,
yaitu
(𝑛) ∑𝑛𝑖=1 𝑥1𝑖 𝑦𝑖 − ∑𝑛𝑖=1 𝑥1𝑖 ∑𝑛𝑖=1 𝑦𝑖
𝑟𝑦𝑥1 =
2 2
√𝑛 ∑𝑛𝑖=1 𝑥1𝑖
2
− (∑𝑛𝑖=1 𝑥1𝑖 ) √𝑛 ∑𝑛𝑖=1 𝑦𝑖2 − (∑𝑛𝑖=1 𝑦𝑖 )
(10)(6106) − (120)(500)
= = 0.9226
√(10)(1470) − (120)2 √(10)(25440) − (500)2
18
(𝑛) ∑𝑛𝑖=1 𝑥2𝑖 𝑦𝑖 − ∑𝑛𝑖=1 𝑥2𝑖 ∑𝑛𝑖=1 𝑦𝑖
𝑟𝑦𝑥2 =
2 2
√𝑛 ∑𝑛𝑖=1 𝑥2𝑖
2
− (∑𝑛𝑖=1 𝑥2𝑖 ) √𝑛 ∑𝑛𝑖=1 𝑦𝑖2 − (∑𝑛𝑖=1 𝑦𝑖 )
(10)(2610) − (50)(500)
= = 0.9270
√(10)(282) − (50)2 √(10)(25440) − (500)2
(10)(626) − (120)(50)
= = 0.8391
√(10)(1470) − (120)2 √(10)(282) − (50)2
(∑𝑛 𝑛
𝑗=1 𝑥𝑖𝑗 )(∑𝑗=1 𝑦𝑗 )
dengan ∑ 𝑥𝑖 𝑦 = ∑𝑛𝑗=1 𝑥𝑖𝑗 𝑦𝑗 − , 𝑖 = 1,2, … , 𝑝
𝑛
19
2
(∑𝑛
𝑗=1 𝑦𝑗 )
∑𝑦 = 2 ∑𝑛𝑗=1 𝑦𝑗2 −
𝑛
20
Contoh 6.5
Berdasarkan contoh 6.2 dan 6.4, tentukan korelasi parsial antara Y
dan X1 dengan mengagnggap X2 konstan (𝑟𝑦𝑥1 . 𝑥2 ).
Jawab:
Untuk menentukan 𝑟𝑦𝑥1 . 𝑥2 , digunakan persamaan 6.18, dimana
0.9226 − (0.9270)(0.8391)
𝑟𝑦𝑥1 . 𝑥2 = = 0.7095
√(1 − 0.92702 )(1 − 0.83912 )
21
𝑟𝑦𝑥3 . 𝑥1 − 𝑟𝑦𝑥2 . 𝑥1 𝑟𝑥2 𝑥3 . 𝑥1
𝑟𝑦𝑥3 . 𝑥 1 𝑥2 = (6.22)
2
√(1−𝑟𝑦𝑥 )(1−𝑟𝑥22 𝑥3 . 𝑥1 )
2 . 𝑥1
22
LATIHAN SOAL
23
2. Berikut adalah data total konsumsi energi di daerah A dan total
populasi daerah A
24
% Terbungkus Rapi Jarak Plat Suhu Plat
Y pembungkus Pembungkus
X1 X2
78.5 7 2.6
74.3 1 2.9
104.3 11 5.6
87.6 11 3.1
95.9 7 5.2
109.2 11 5.5
102.7 3 7.1
102.5 5 6.2
Sumber: Draper dan Smith, 1998
25
Nomor X1 X2 X3 Y
Benang
1 85 76 44 99
2 82 78 42 93
3 75 73 42 99
4 74 72 44 97
5 76 73 43 90
6 74 69 46 96
7 73 69 46 93
8 96 80 36 130
9 93 78 36 118
10 70 73 37 88
11 82 71 46 89
12 80 72 45 93
13 77 76 42 94
14 67 76 50 75
15 82 70 48 84
16 76 76 41 91
17 74 78 31 100
18 71 80 29 98
19 70 83 39 101
20 64 79 38 80
Sumber: Duncan, A.J., Quality Control and Industrial Statistics, Richard D. Irwin,
Inc., 1959
***
26