Anda di halaman 1dari 12

BAB VII.

ANALISIS REGRESI DAN KORELASI

A. Tujuan Instruksional Khusus :

Pada akhir pertemuan 14, 15 dan 16, mahasiswa diharapkan mampu menganalisis
regresi dan korelasi

B. Pokok Bahasan :

1. Pendahuluan
2. Persamaan regresi linear sederhana
3. Pengujian hipotesis terhadap koefisien regresi linear sederhana
4. Persamaan regresi linear berganda
5. Pengujian hipotesis terhadap koefisien regresi linear berganda
6. Koefisien determinasi
7. Koefisien korelasi

C. Referensi :

1. Mattjik, A.A., dan M. Sumertajaya. 2000. Perancangan Percobaan dengan


Aplikasi SAS dan Minitab. IPB Press, Bogor.
2. Kvanli, A.H. 1988. Statistic. A Computer Integrated Approach. West Publishing
Company, New York.

D. Referensi Tambahan :

1. Milton, S.J. 1995. Introduction to Probability and Statistic: Principles and


Application for engineering and the Computing Science.

E. Pertanyaan Kunci :

Apakah tingkat pendidikan penduduk mempengaruhi pendapatan?


71. Pendahuluan

Dalam kehidupan sehari-hari kita seringkali ingin melihat hubungan antar


peubah, seperti hubungan antara panjang dan berat bayi, tingkat pendidikan ibu
dengan gizi balita. Umumnya suatu peubah bersifat mempengaruhi peubah lainnya.
Peubah pertama disebut peubah bebas (independent variable) sedangkan peubah yang
kedua disebut peubah tak bebas (dependent variable). Secara kuantitatif hubungan
antara peubah bebas dan peubah tidak bebasdapat kita modelkan dalam suatu
persamaan matematika, sehingga kita dapat menduga nilai suatu peubah tak bebas bila
diketahui nilai peubah bebas. Persamaan matematik yang menggambarkan hubungan
antara peubah bebas da peubah tidak bebas sering disebut persamaan regresi.
Persamaan regresi dapat terdiri dari satu peubah bebas dan satu peubah tidak
bebas atau beberapa peubah bebas dengan satu peubah tidak bebas. Persamaan yang
pertama disebut persamaan regresi sederhana, sedangkan persamaan kedua disebut
persamaan regresi berganda.

7.2. Persamaan Regresi Linear Sederhana

Regresi linear sederhana adalah persamaan regresi yang menggambarkan


hubungan antara satu peubah bebas (X) dan satu peubah tak bebas (Y), dimana
hubungan keduanya dapat digambarkan sebagai suatu garis lurus. Sehingga hubungan
kedua peubah tersebut dapat dituliskan dalam bentuk persamaan :
Yi =  + Xi + i ………………………………………………………(1)
dimana : Y = peubah tak bebas, X = peubah bebas
 = intersep atau perpotongan dengan sumbu tegak
 = kemiringan atau gradient
 = pengaruh error/galat
Pada kenyataanya seringkali kita tidak dapat mengamati seluruh anggota populasi,
sehingga hanya mengambil n buah contoh acak dan diperoleh pengamatan contoh
acak berukuran n yang dapat dilambangkan {(xi,yi), i = 1,2,…,n}.
Persamaan yang kita peroleh adalah dugaan dari persamaan (1) dan dapat
dituliskan :
Yˆi  ˆ  ˆX i atau Yˆi  a  bX i

dimana a adalah penduga bagi  dan b adalah penduga bagi 


Untuk peubah bebas Xi, nilai pengamatan Yi tidak akan selalu tepat berada
pada garis persamaan Yi =  + Xi (garis regresi populasi) atau Yˆi  a  bX i (garis

regresi contoh). Jarak dari titik pengamatan ke garis regresi contoh dinamakan erroe
(i).
Untuk menduga parameter  dan  terdapat bermacam-macam metode seperti
metode kuadrat terkecil (least square method), metode kemungkinan maksimum
(maximum likelihood method), metode kuadrat terkecil terboboti (weighted least
square method) dan metode-metode lainnya tergantung pada keadaan datanya. Namun
sebagai bahan pengantar dalam buku ini metode yang digunakan untuk menduga
parameter regresi adalah metode kuadrat terkecil (MKT). Metode kuadrat terkecil
adalah metode yang umum dipakai dan mudah dikerjakan baik secara manual maupun
dengan bantuan komputer.
Untuk mendapatkan penduga kuadrat terkecil dari parameter regresi adalah
dengan meminimumkan galat atau error. Dengan menggunakan bantuan kalkulus
maka nilai dugaan parameter regresi diperoleh sebagai berikut :
n n n n
 xi  x  yi  y  n X i Yi   X i  Yi
i 1 i 1 i 1 i 1
b n
 2
 n 
 xi  x 2
n
n X i   X i 
i 1 i 1  i 1 
a  y  bx
Besarnya nilai a dapat diinterpretasikan sebagai berikut : pada saat X bernilai
nol maka besarnya dugaan nilai Y adalah sebasar a. Sedangkan besarnya nilai b dapat
diinterpretasikan sebagai besarnya perubahan nilai Y jika terjadi perubahan pada nilai
X satu satuan adalah sebesar b.
7.3. Pengujian Hipotesis Bagi Koefisien Regresi Linear Sederhana

Untuk menguji hopotesis apakah intersep bernilai tertentu (misalnya k) dapat


diuji dengan menggunakan statistik uji t, dimana hipotesisnya dapat dituliskan sebagai
berikut :
H0 :  = k
H1 :   k
Statistik uji t dapat dirumuskan sebagai berikut :
n

ak
 ei2
i 1
t hitung  , dimana KTG 
  n  2
 
KTG 1n 
2
X

 X i  X  
n
2

 i 1 
Nilai tabelnya adalah tabel t dengan derajat bebas (n-2). Jika nilai thitung lebih besar
dari nilai t n  2 , maka hipotesis nol ditolak yang berarti bahwa nilai   k.
2

Sedangkan untuk melihat apakah peubah X berpengaruh terhadap peubah Y


juga dapat diuji dengan menggunakan uji-t. Misalnya ingin diuji apakah perubahan
setiap satuan X akan mengakibatkan Y berubah sebesar k satuan?. Hipotesis dari
pernyataan ini dapat dituliskan sebagai berikut :
H0 :  = k
H1 :   k
Statistik uji-t dapat dirumuskan sebagai berikut :
n

bk
 ei2
i 1
t hitung  , dimana KTG 
 n
2
n  2
KTG1 /  X i  X  
 i 1 
Nilai tabelnya adalah tabel t dengan derajat bebas (n-2). Jika nilai thitung lebih besar
dari nilai t n  2 , maka hipotesis nol ditolak. Jika hipotesis nol ditolak itu berarti
2

bahwa besarnya pengaruh peubah X terhadap Y sebesar k.


7.4. Persamaan Regresi Linear Berganda

Persamaan regresi linear berganda adalah persamaan regresi dengan satu


peubah tak bebas (Y) dengan lebih dari satu peubah bebas (X1, X2, …, Xp). Hubungan
antara peubah-peubah tersebut dapat dirumuskan dalam bentuk persamaan :
Yi   0  1 X 1i   2 X 2i  ...   p X pi   i

Bila dituliskan dalam bentuk matriks :


Y  X 

Beberapa asumsi yang mendasari model tersebut adalah : (i). i menyebar


saling bebas mengikuti sebaran normal (0,2); (ii). i memiliki ragam homogen atau
disebut juga tidak adanya masalah heteroskedastis; (iii). tidak adanya hubungan antara
peubah X atau sering juga disebut tidak ada masalah kolinier; dan (iv). i bebas
terhadap peubah X.
Dengan menggunakan metode kuadrat terkecil, yaitu dengan meminimumkan
galat/error, maka diperoleh nilai dugaan bagi  , yaitu :

ˆ   X ' X 1  X ' Y 


 n
 x1  x2   x p   Y 
 
  x1  x12  x1 x2   x1 x p    X 1Y 
X ' X    x2  x1 x2  x22   x2 x p  X ' Y    X 2Y 
  
         
 x p  x1 x p  x2 x p   x 2p   X p Y 

 2 S 20  2 S 20  p 
 S 0 S 20 1 

 S 21 S 21 2  S 21 p 

V ˆ   2  X ' X 1

 S 22 

S 22  p 
   
 
 S 2 p 
 

 2  KTG 
Y 'Y   ' X 'Y 
n  p  1
7.4.1. Analisis Ragam
Untuk menguji pengaruh peubah bebas terhadap peubah tak bebas secara
simultan dapat diuji dengan menggunakan uji-F. Penggunaan uji F dalam menguji
pengaruh peubah bebas secara simultan sering disebut analisis ragam. Pengujian
secara simultan dimaksudkan untuk melihat pengaruh peubah bebas secara bersama-
sama terhadap peubah tak bebas. Penguraian komponen ragam dari regresi linear
berganda dapat dilihat pad tabel berikut :
Sumber Derajat Jumlah Kuadrat Kuadrat F-hitung
Keragaman (SK) Bebas (db) (JK) Tengah (KT)
Regresi p JKR KTR KTR/KTG
Galat n-p-1 JKG KTG
Total n-1 JKT

JKT = Jumlah kuadrat total JKR = Jumlah kuadrat regresi


JKG = Jumlah kuadrat galat KTR = Kuadrat tengah regresi
KTG = Kuadrat tengah galat

 Yi 
2
JKT   Yi  Y    Yi    Yi2  nY 2
2 2
n


JKR   Yˆ  Y 2  bi   X iYi   X ni Yi   bi  X i  X Yi  Y 
 
atau :

JKR  bi2  X i  X 
2

Untuk memperoleh JKG digunakan persamaan :


JKG = JKT – JKR
KTR = JKR/p
KTG = JKG/(n-p-1)

Bentuk hipotesis yang diuji dari analisis ragam di atas adalah :


H0 : 0 = 1 = 2 = … = p
H1 : minimal ada 1 dimana i  0
Hipotesis nol ditolak jika F-hitung  F-tabel (F, dengan derajat bebas p dan (n-p-1)).
Jika hipotesis nol ditolak berarti dari p peubah bebas yang dilibatkan dalam model
regresi linear berganda diharapkan terdapat paling sedikit satu peubah bebas yang
berpengaruh langsung terhadap peubah tak bebas.

7.5. Pengujian Hipotesis Koefisien regresi Berganda

Untuk melihat pengaruh peubah bebas terhadap peubah tak bebas dapat diuji
dengan menggunakan uji-t. pengujian ini akan berguna jika pada pengujian analisis
ragam diperoleh kesimpulan bahwa terdapat paling sedikit satu peubah bebas yang
berpengaruh terhadap peubah tak bebas. Bentuk hipotesis parsialnya dapat dituliskan
sebagai berikut :
H0 : i = k
H1 : i  k
Statistik ujinya dapat dirumuskan sebagai berikut :
ˆi  k
t hitung  S ̂2  KTG  Cii
S 2ˆ
i
2

Cii = unsur pada beris dan kolom ke-I dari matriks (X’X)-1
Hipotesis nol akan ditolak bila nilai thitung lebih besar dari nilai t/2 dengan derajat
bebas (n-p-1).

7.5. Pengujian Hipotesis Koefisien regresi Berganda

Keterandalan dari model yang diperoleh dapat kita lihat dari kemampuan
model menerangkan keragaman nilai peubah Y. Ukuran ini sering disebut dengan
koefisien determinasi yang dilambangkan dengan R2. Semakin besar nilai R2 berarti
model semakin mampu menerangkan perilaku peubah Y. Kisaran dari nilai R2 mulai
dari 0% sampai 100%. Besarnya nilai koefisien determinasi dapat dihitung sebagai
berikut :
JKR JKT  JKG
R2  
JKT JKT
7.7. Koefisien Korelasi

Koefisien korelasi adalah koefisien yang menggambarkan tingkat keeratan


hubungan linear antara dua peubah bebas atu lebih. Besaran koefisien korelasi tidak
menggambarkan hubungan sebab akibat antara dua peubah atau lebih tetapi semata-
mata menggambarkan keterkaitan linear antar peubah.
Koefisien korelasi sering dinotasikan dengan r dan nilainya berkisar antara -1
dan 1 (-1  r  1). Nilai r yang mendekati -1 atau 1 menunjukan semakin erat
hubungan linierantara kedua peubah tersebut. Sedangkan nilai r yang mendekati nol
menggambarkan hubungan kedua peubah tersebut tidak linier.
Koefisien korelasi antara peubah X dan Y dapat dirumuskan sebagai berikut:
S xy
r
S x2 S y2

n n n
 xi  x  yi  y   xi  x 2   yi  y 2
i 1 i 1 i 1
S xy  , S x2  , S y2 
n  1 n  1 n  1

Contoh 7.1. Data berikut ini adalah banyaknya anggota dalam suatu rumah (X), dan
konsumsi/pemakaian listrik tiap bulan (Y dalam kwh).
X 2 9 6 5 7
Y 7,9 15,3 26,8 15,6 36,4
Jika diasumsikan hubungan antara banyaknya anggota keluarga dan konsumsi listrik
dapat dinyatakan dapat dinyatakan dalam persamaan regresi linear sederhana :
a. carilah persamaan garisnya
b. jika sebuah keluarga terdiri dari ayah, ibu, dan 2 anak, dugalah pemakaian
listriknya perbulan
c. ujilah apakah banyaknya anggota keluarga memberikan pengaruh yang nyata pada
pemakaian listrik.
d. hitunglah koefisien korelasinya?
Jawab :
Xi 2 9 6 5 7  X i  29
Yi 7,9 15,3 26,8 15,6 36,4  Yi  102
Xi2 4 81 36 25 49 X i
2
 195

Yi2
XiYi 15,8 137,7 160,8 78,0 254,8  X Y  647,1
i i

n n n
n X iYi   X i Yi
5 647,1  29 102 
b i 1 i 1 i 1
  2,07
5 195   29 
2 2
n
 
n
n X i2    X i 
i 1  i 1 
a  20,2  2,075,8  8,39

a. Jadi persamaan regresinya adalah : Yˆi  8,39  2.07 X i


b. bila X = 4, maka Y = 8,39 + 2,07(4) = 16,67 Kwh
c. H0 : i = 0 (banyaknya anggota keluarga tidak mempengaruhi pemakaian listrik
per bulan)
H1 : i  0 (banyaknya anggota keluarga mempengaruhi pemakaian listrik per
bulan)
* Statistik uji-t dapat dirumuskan sebagai berikut :
bk 2,07  0
t hit    0,94
S b2 2,195 2

* Nilai tebelnya : ttabel = t/2(n-2) = t0,025(3) = 3,182


* Kesimpulan : jika t hit  ttabel, maka tolak H0

0,94  3,182 jadi kesimpulannya terima H0 yang berarti bahwa banyaknya

anggota keluarga tidak mempengaruhi pemakaian listrik per


bulan.

Latihan 7.

1. Tabel di bawah ini, Y menyatakan banyaknya suatu senyawa kimia yang larut
dalam 100 gram air pada berbagai suhu X.
X (oC) 0 15 30 45 60 75
Y 8 12 25 31 44 48

Diasumsikan bahwa hubungan antara banyaknya suatu senyawa kimia yang larut
dalam air dengan suhu dapat dinyatakan dalam persamaan regresi linear
sederhana:
a. tentukan persamaan garis regresinya
b. dugalah banyaknya senyawa kimia tersebut yang akan larut dalam 100 gram
air pada suhu 500 C
c. ujilah hipotesis, apakah suhu mempengaruhi banyaknya senyawa kimia yang
larut dalam 100 gram air. Gunakan taraf nyata 5%.
d. carilah koefisien determinasinya!. Apa yang dapat anda simpulkan dari nilai
tersebut?.
e. carilah koefisien korelasinya.
2. Suatu telaah dilakukan untuk mengevaluasi sejauh mana pengaruh biaya yang
dikeluarkan untuk iklan (BI) terhadap hasil penjualan HP (HP). Untuk itu,
dikumpulkan data biaya iklan dan hasil penjualan HP sebagai berikut :
HP 285 400 395 365 475 440 490 420 560 525 480 510
BI 40 20 25 20 30 50 40 20 50 40 25 50

Jika diasumsikan hubungan antara biaya iklan dengan hasil penjualan dapat
dinyatakan dalam persamaan regresi linear sederhana :
a. carilah persamaan garisnya
b. jika sebuah perusahaan mempunyai alokasi dana untujl iklan sebesar 35 juta,
dugalah hasil penjualan yang akan diperoleh perusahaan tersebut
c. ujilah apakah biaya iklan memberikan pengaruh yang nyata terhadap hasil
penjualan
d. carilah koefisien korelasinya
3. Data berikut dikumpulkan untuk menentukan hubungan antara panjang bayi (Y)
dengan umur (X1) dan berat waktu lahir (X2)
……………………………….
Berdasarkan data di atas :
a. Carilah persamaan regresi, bila model linearnya : Yi = 0 + 1X1i + i
b. Carilah koefisien korelasi antara panjang dengan berat
c. Carilah koefisien determinasi dari pertanyaan pada bagian a
Bila kita menggunakan model Yi = 0 + 1X2i + 2X2i + I , maka outputnya
sebagai berikut :
……………………………………………………….
d. Carilah matriks (XX)
e. Carilah persamaan regresinya
f. Apakah umur bayi mempengaruhi panjang bayi?
g. Apakah bobot lahir bayi mempengaruhi panjang bayi?.
(gunakan taraf nyata 5% untuk pertanyaan f dan g).
4. Dalam bidang kehutanan, analisis regresi digunakan untuk membantu pendugaan
karakteristik pohon. Data berikut adalah data umur pohon (X1), diameter pohon
(X2) dan tinggi pohon (Y).
……………………………………….
Diasumsikan bahwa hubungan antara tinggi pohon dengan umur pohon dan
diameter pohon dinyatakan dalam persamaan regresi linear berganda.

Dengan menggunakan Software Minitab untuk data diatas, maka diperoleh output
sebagai berikut :
……………………………………………….
Berdasarkan output diatas :
a. Lengkapi bagian yang kosong pada tabel anova
b. Tuliskan persamaan regresinya.
c. Apakah umur pohon memberikan pengaruh pada tinggi pohon?.
d. Apakah diameter pohon memberikan pengaruh pada tinggi pohon?
e. Gunakan taraf nyata 5%.

Referensi :
1. Kvanli, A.H. 1988. Statistic. A Computer Integrated Approach. West Publishing Company, New
York.
2. Walpole, R.E. 1995. Pengantar Statistika, edisi ketiga. PT. Pustaka Gramedia, Jakarta.
3. Milton, S.J. 1995. Introduction to Probability and Statistic: Principles and Application for
engineering and the Computing Science.
4. Mattjik, A.A., dan M. Sumertajaya. 2000. Perancangan Percobaan dengan Aplikasi SAS dan
Minitab. IPB Press, Bogor.

Anda mungkin juga menyukai