Anda di halaman 1dari 5

BAB VIII

ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

8.1. ANALISIS KORELASI


Nilai korelasi adalah nilai yang menggambarkan tingkat keeratan hubungan linier
antara dua variabel atau lebih. Nilai korelasi tidak menggambarkan hubungan sebab akibat
antara dua variabel atau lebih tetapi semata-mata menggambarkan keterkaitan linier antar
variabel. Nilai korelasi sering dinotasikan dengan r dan nilainya dari –1 sampai 1
(-1£ r £1), nilai r yang mendekati 1 atau –1 menunjukkan semakin erat hubungan linier
antara kedua variabel tersebut. Sedangkan nilai r yang mendekati nol menggambarkan
hubungan kedua variabel tersebut tidak linier. Tanda dari nilai r dapat dilihat dari diagram
pencar pengamatan dari dua variabel tersebut. Bila titik-titik pengamatan menggerombol
mengikuti garis lurus dengan kemiringan positif, maka korelasi antar kedua variabel
tersebut positif. Sebaliknya bila titik-titik pengamatan tersebut menggerombol mengikuti
garis lurus dengan kemiringan negatif, maka korelasi antar variabel tersebut bertanda
negatif.
Beberapa pola hubungan antar variabel dapat dilihat pada gambar berikut:

Gambar (a). r >0 Gambar (b) r <0

Gambar ( c ) r = 0 Gambar (d) r = 0

Pada Gambar a dan Gambar b terlihat kedua variabel memiliki hubungan yang sangat erat
tetapi arah hubungannya berlawanan. Sedangkan pada Gambar c dan Gambar d,
menunjukkan kedua variabel secara linier tidak berhubungan tetapi kedua variabel
memiliki hubungan tidak linier.
Salah satu ukuran keeratan hubungan linier antara dua variabel adalah Koefisien
Korelasi Pearson, rumus untuk menghitung korelasi tersebut dari data sampel adalah
sebagai berikut:

1
n n
∑ ( x i− x̄ )( y i− ȳ ) ∑ x i y i−n x̄ ȳ
i=1 i =1
r= =

√ √[∑ ][∑ ]
n n n n
∑ ( x i − x̄ )2 ∑ ( y i − ȳ )2 x 2i −n x̄ 2 y 2i −n ȳ 2
i =1 i=1 i=1 i=1

S xy
r=
√ S xx S yy
dengan –1 £ r £1

Inferensi terhadap ρ
Nilai r merupakan suatu nilai penduga bagi nilai korelasi populasi yang
dilambangkan dengan ρ maka apabila ingin mendapatkan suatu uji yang menyatakan
kapan r berada cukup jauh dari suatu nilai tertentu 0 .
ρ
Hipotesis untuk menguji apakah dua varibel mempunyai hubungan linier atau tidak adalah
sebagai berikut :
Ho : ρ = 0
Statistik uji :
r √n−2
t=
√ 1−r 2 , dengan v = n - 2
Wilayah kritis :
t < -ta untuk Ho : ρ < 0
t > ta untuk Ho : ρ > 0
t < -ta/2 dan t > ta/2 untuk Ho : ρ ¹ 0

8.2. ANALISIS REGRESI LINIER SEDERHANA


Dalam kehidupan sehari-hari seringkali kita ingin melihat hubungan antara dua
variabel, seperti hubungan antara panjang bayi dan bobot bayi, protein dan kadar
hemoglobin, tinggi badan dan berat badan, IQ anak dan nilai matematikanya. Umumnya
suatu variabel bersifat mempengaruhi variabel yang lainnya, variabel pertama disebut
variabel bebas (independent variable) sedangkan variabel yang kedua disebut variabel tak
bebas (dependent variable). Secara kuantitatif hubungan antara variabel bebas dan variabel
tak bebas dapat dimodelkan dalam suatu model matematik. Metode yang digunakan untuk
mencari pola hubungan fungsional antara satu variabel bebas (independen / prediktor / X)
dengan satu variabel tak bebas (dependen / respons / y) adalah analisis regresi sederhana.
Model analisis regresi sederhana Y terhadap X adalah :
y i =α + β x i +ε i
dengan yi = variabel respon ke-i
xi = variabel prediktor ke-i
a = parameter intersep
b = parameter slope (kemiringan)
ei = error ke-i

2
Dengan menggunakan metode kuadrat terkecil (least square) persamaan regresi diatas
dapat diduga dengan :
^y i =a+bx i
dengan
n n
∑ ( x i − x̄ )( y i− ȳ ) ∑ xi y i −n x̄ ȳ S xy
b=i=1
n
= i=1
n
=
S xx
∑ ( x i − x̄ )2 ∑ x2i −n x̄ 2
i=1 i=1
a= ȳ−b x̄

CONTOH 1 :
Hasil proses kimia diperkirakan merupakan fungsi jumlah katalisator yang ditambahkan
pada reaksi tersebut. Data yang didapat disajikan pada tabel berikut :

Hasil (%) 60,5 63,9 63,8 60,2 66,7 71,7 70,8 65,7
Katalisator (lb) 0,9 1,4 1,6 1,7 1,8 2,0 2,1 2,3

Tentukan estimasi model regresi linier sederhana berdasarkan data sampel diatas?

Jawab :
Dalam kasus ini variabel respon Y adalah hasil (%), sedangkan variabel bebas X
adalah katalisator (lb). Berdasarkan data pada tabel 1, didapat
8 8 8 8
∑ x i =13 , 8 ∑ yi =523 , 3 ∑ x i y i =911, 58 ∑ x 2i =25 , 16
i=1 , i=1 , i=1 , i=1

(8 )(911, 58)−(13 , 8)(523 , 3 )


b= =6 ,559
x̄=1 , 725 dan ȳ=65 , 412 sehingga didapat (8 )(25 ,16 )−(13 ,8 )2
a = 65,412 - (6,56)(1,725) = 54,096
Didapat estimasi model regresi linier sederhana y=54 , 096+6 , 559 x

Koefisien determinasi
Untuk mengetahui kesesuaian model dan besarnya variasi nilai Y yang dapat dijelaskan
oleh model regresi digunakan nilai koefisien determinasi dengan rumus sbb:
n
∑ ( ^y i − ȳ )2
R2 = i=1
n
∑ ( y i − ȳ )2
i=1
dengan 0 £ R2 £1
Untuk analisis regresi linier sederhana :
R2 = r2

SOAL 2 :
Diberikan data tinggi (X) dalam cm dan berat (Y) dalam Kg sebagai berikut :

X 12 10 14 11 12 9
Y 18 17 23 19 20 15
3
Hitung koefisien korelasi dan koefisien determinasi bagi kedua variabel tersebut serta
berikan penjelasan.

Jawab :
6 6 6 6 6
∑ x i =68 ∑ yi =112 ∑ x i y i =1292 ∑ x 2i =7865 , 16 ∑ yi2=2128
i=1 , i=1 , i=1 , i=1 , i=1 , didapat
(6)(1292 )−(68 )(112)
r= =0 ,947
√(6 )(786 )−(68)2 √(6 )(2128 )−(112)2
r2 = 0,897 artinya keragaman nilai variabel respon Y yang dapat dijelaskan oleh
variabel bebas X sebesar 89,7%.

SOAL-SOAL LATIHAN :
1. Sebuah penelitian dilakukan untuk menentukan apakah ada hubungan antara jangka
waktu pengeringan dengan berkurangnya berat suatu bahan yang dikeringkan.
Diperoleh data sebagai berikut :
jangka waktu Berat yang berkurang
pengeringan (jam) (mg)
1,2 101
0,8 92
1,0 110
1,3 120
0,7 90
0,8 82
1,0 93
0,6 75
0,9 91
1,1 105
a. Buatlah diagram pencarnya.
b. Hitung dan tafsirkan koefisien korelasi antara jangka waktu pengeringan dengan
berat yang berkurang.
c. Apakah korelasi tersebut secara signifikan berbeda dari nol ?
d. Tentukan persamaan garis regresinya untuk meramalkan berat yang berkurang
berdasarkan jangka waktu pengeringan.
e. Hitung koef. determinasinya, dan jelaskan artinya.
f. Taksirlah berat yang berkurang jika jangka waktu pengeringannya 1 jam.

2. Sebuah penelitian mengukur banyaknya gula yang terbentuk pada berbagai suhu.
Diperoleh dtat sebagi berikut :

Suhu, x Gula yang terbentuk, y


1,0 8,1
1,1 7,8
1,2 8,5
1,3 9,8
1,4 9,5
1,5 8,9
1,6 8,6

4
1,7 10,2
1,8 9,3
1,9 9,2
2,0 10,5

a. Buatlah diagram pencarnya.


b. Hitung dan tafsirkan koefisien korelasi antara suhu dengan banyaknya gula yang
terbentuk.
c. Apakah korelasi tersebut secara signifikan berbeda dari nol ?
d. Tentukan persamaan garis regresinya dengan menggunakan metode kuadrat
terkecil.
e. Hitung koefisien determinasinya, dan jelaskan artinya.
f. Dugalah banyaknya gula yang terbentuk bila suhunya 1,75.

3. Tabel berikut menyajikan data sampel yang terdiri dari 12 orang bapak dengan putra
tertua mereka usia 3 tahun dengan variabel-variabel yang diukur adalah tinggi badan
anak (Y) dan tinggi badan bapak (X) dalam satuan cm.

X 156 181 175 169 162 170 180 168 175 161 159 172
Y 76 100 96 95 85 79 105 82 98 80 90 98

Berdasarkan data sampel diatas dan model regresi Y i =A + Bxi + ε i , maka :


a. Tentukan model regresinya dengan menggunakan metode kuadrat terkecil.
b. Dugalah tinggi anak jika tinggi bapak 165 cm
c. Hitung koefisien determinasi, dan jelaskan artinya.

Anda mungkin juga menyukai