Anda di halaman 1dari 8

PREDIKSI DAN INTERPRETASI KORELASI

Apa itu Prediksi dengan regresi linier ?

Prediksi dengan regresi adalah cara statistika meramalkan nilai satu variabel dari nilai variabel lain yang
diketahui, dan kedua variabel saling berhubungan secara linier

Regresi linier itu apa?

Regresi linier adalah persamaan garis lurus yang menggambarkan hubungan dua variabel.
Persamaan garis lurus tersebut dapat ditulis sebagai berikut:
Y=bX+a
Y dan X melambangkan dua variabel yang saling berhubungan. Variabel X dikatakan sebagai variabel
bebas dan variabel Y dikatakan sebagai variabel terikat. Sementara b dan a adalah konstanta. Konstanta
b adalah gradien/kemiringan garis regresi, semantara a adalah titik potong garis dengan sumbu y (ketika
x = 0)

Bagaimana gambar persamaan garis lurus itu dalam koordinat cartesius?

Misalkan ada persamaan garis lurus Y = 2 X + 1. Pada persamaan ini b = 2 dan a = 1. Jika diketahui X
seperti data berikut

X 1 3 5 8 10 11

Maka Y dapat dihitung dengan memasukkan harga X ke


Y = 2X + 1 dalam persamaan. Maka untuk setiap satu harga X akan
25 ada satu harga Y.

X 0 1 3 5 8 10 11
20
Y 1 3 7 11 17 21 23
Titik (0,1) (1,3) (3,7) (5,11) (8,17) 10,21) (11,23)

15
Misal X = 3, maka Y = 2.3 + 1 = 4.
Jadi akan ada pasangan-pasangan X dan Y, dan pasangan -
Y

10 (Y,X)- ini jadi sebuah titik pada koordinat kartesius. Data


hasil pengolahan seperti berikut ini.

0
0 2 4 X6 8 10 12

Bagaimana persamaan garis digunakan untuk meramalkan nilai Y atau nilai X?

Ambil contoh persamaan garis di atas, Y = 2X + 1. Jika diketahui X = 6, maka maka Y = 2.6 + 1 = 13.
Y −1 15−1
Sebaliknya jika diketahui Y = 15, maka X = = =7.
2 2
Jadi dengan mengetahui persamaan garis kita dapat meramalkan nilai satu variabel dari nilai variabel
lain yang diketahui.

Mengapa data pasangan data berkorelasi dapat digunakan untuk memprediksi (meramal)?

Data berkorelasi (misalkan data X dan Y) adalah data berpasangan, dimana setiap pasangan X dan Y akan
menjadi satu titik di koordinat cartesius. Sebaran titik dikoordinat akan memperlihatkan pola garis lurus.
Dengan statistika regresi, maka persamaan garis lurus itu dapat ditentukan dengan menggunakan data
berpasangan tersebut. Garis lurus itu adalah suatu garis yang “menyinggung” semua titik. Metode
mencari persamaan garis lurus yang “menyinggung” semua titik ini dalam statistika disebut metode
least square.

Bagaimana metode least square bekerja untuk mencari persamaan garis lurus?

Metode least square menyatakan: buatlah satu garis sedemikian rupa sehingga kuadarat jarak setiap
titik terhadap garis sejajar sumbu Y adalah minimum. Dengan mengingat kembali sifat rata-rata yang
mendasari prinsip bahwa rata-rata berhak menjadi wakil data, yaitu kuadrat jarak setiap skor pada rata-
rata adalah minimum, maka garis ini dapat kita sebut sebagai garis rata-rata yang mewakili semua titik.
Jadi garis itu dapat kita sebut sebagai garis yang menyinggung semua titik.
Y

Bagaimana mencari persamaan garis dari data berpasangan dengan metode ini?

Untuk menentukan persamaan garis lurus dengan metode ini kita dapat menentukan nilai b dan nilai a
dari data. Nilai b dan a ditentukan dengan cara berikut (pembahasan di sini tidak memberikan
pembuktian)
N ∑ XY −∑ X ∑ Y ∑ Y −b yx ∑ X
b yx = 2
a yx =
2
N ∑ X −( ∑ X ) N

Persamaan ini dapat disederhanakan dengan


Persamaan ini dapat disederhanakan dengan membagi
membagi suku di kanan dengan N
semua suku di kanan dengan N
N ∑ XY ∑ X ∑ Y ∑ X∑ Y ∑ Y − b yx ∑ X
− ∑ XY − N N
N N N a yx =
b yx = 2
= 2 N
N ∑ X2 ( ∑ X ) 2 (∑ X ) N
− ∑ X −¿ ¿
N N N
Karena,
∑ = X́ dan ∑ ∑ = ∑ ∑ Y N , dan Dan diperoleh Karena,
X X Y X ∑ X = X́ dan Karena,
N N N N N
2
( X) ∑ X∑ X N
maka ∑
∑ Y =Ý , maka
= N
N N N

∑ XY −N X́ Ý a yx =Ý −b yx X́
b yx = Nilai ayx dapat dicari dengan kedua rumus di
∑ X 2−¿ X́ 2 ¿ atas
Nilai byx dapat dicari dengan kedua rumus di atas
Pesamaan regresi selanjutnya dapat ditulis Indeks yx pada byx dan ayx menunjukkan bahwa
Y’ = b yx X – ayx kedua konstanta ini digunakan dalam
Simbol (‘) pada pada Y’ bermakna Y yang dicari dengan persamaan regresi linier untuk meramal nilai Y
persamaan regresi adalah Y hasil prediksi dari nilai X

Jika nilai Y dapat diramal dari nilai X, maka nilai X juga dapat diramal dari nilai Y. Cara mencari
persamaan regresi untuk meramal X dari Y adalah sebagai berikut

N ∑ XY −∑ X ∑ Y ∑ X −b xy ∑ Y
b xy= 2
a xy =
N ∑ Y 2− ( ∑ Y ) N
Persamaan ini dapat disederhanakan dengan
Persamaan ini dapat disederhanakan dengan membagi
membagi suku di kanan dengan N
semua suku di kanan dengan N
N ∑ XY ∑ X ∑ Y ∑ X∑ Y ∑ X − b xy ∑ Y
− ∑ XY − N N
N N N a xy =
a yx = 2
= 2 N
N ∑ Y2 (∑ Y ) 2 (∑ Y ) N
N

N
∑ X −¿ N ¿
Karena,
∑ Y =Ý dan ∑ X ∑ Y = ∑ X ∑ Y N , dan Dan diperoleh Karena, ∑ X = X́ dan Karena,
N N N N N
2
( Y) ∑Y∑ X N
maka ∑
∑ Y =Ý , maka
= N
N N N

∑ XY −N X́ Ý a xy= X́−b xy Ý
b yx = Nilai ayx dapat dicari dengan kedua rumus di
∑ Y 2−¿ Ý 2 ¿ atas
Nilai byx dapat dicari dengan kedua rumus di atas
Pesamaan regresi selanjutnya dapat ditulis Indeks xy pada bxy dan axy mnunjukkan bahwa
X’ = bxy X – axy kedua konstanta ini digunakan dalam
Simbol (‘) pada pada X’ bermakna X yang dicari dengan persamaan regresi linier untuk meramal nilai X
persamaan regresi adalah X hasil prediksi dari nilai Y

Dapatkah persamaan regresi dicari dengan menggunakan data simpangan?

Jika semua skor dibuat dalam bentuk data simpangan, X menjadi x = X− X́ dan Y menjadi y = Y− Ý , maka
nilai byx dan ayx dapat ditulis menjadi:

byx
b yx =
∑ XY −N X́ Ý
xy−N x́ ý
∑ X 2−¿ X́ 2= ∑ x 2 ¿

Karena ∑ x =0) dan ∑ y=0 (jumlah simpangan skor dari rata-rata adalah nol, maka
x́=0 dan ý=0. Dengan demikian byx dapat ditulis sebagai

b yx =
∑ xy
∑ x2
Dan ayx dapat diformulasikan sebagai

ayx a yx =Ý −b yx X́
Karena ∑ x =0) dan ∑ y=0 (jumlah simpangan skor dari rata-rata adalah nol, maka
x́=0 dan ý=0, maka

a yx =0
Persamaa
n regresi y ' =b yx x
Dengan cara yang sama, kita prediksi X dari y dapat ditulis sebagai

b xy ∑ xy
b xy=
∑Y2
a xy a xy=0
Persamaa x ' =b xy y
n regresi

HUBUNGAN REGRESI DENGAN KORELASI

Ada hubungan antara korelasi dengan regresi?

Hubungan antara korelasi dengan regresi dapat dilihat dari hubungan antara koefisien korelasi dengan
konstanta b pada persamaan regresi.
2
∑ zx zy ∑2( X− X́ ) ∑ x 2
∑ xy r= s= x =
b yx = N N N
∑ x2 ∑ s
( X − X́ ) ( Y −Ý ) Maka,
Konstanta ini dapat x sy
dirubah menjadi r= ∑ x 2=N s2x
N
rN s x s y xy
b yx = r=
∑  ∑ xy =r N s s
N s 2x N sxsy x y ∑ x 2 disubtitusikan ke r
sy
b yx =r ∑ xy disubtitusikan ke byx
sx
s
b yx =r y menunjukkan hubungan konstata b dengan koefisien korelasi. garis regresi adalah koefisien
sx
korelasi mempengaruhi besarnya kemiringan garis regresi.
Hubungan antara korelasi dengan regresi linier akan lebih terlihat jika skor dibuat dalalm bentuk skor
baku (z), yaitu x menjadi zx dan y menjadi zy, maka byx berubah menjadi b z z dan sy berubah menjadi s z
y x y

dan sx menjadi s z . Persamaan regresi dalam nilai z ditentukan dengan cara berikut
x

sz 2 ∑ ( z ¿ ¿ x− ź x )2
b z z =r y
szx = ¿
y x
sz x
N
karena Karena zx adalah skor simpangan, maka ∑ z x =0, sehingga ź x =0
s z =s z =1, maka
x y 2 ∑ ( z ¿ ¿ x− ź x )2 = ∑ z 2x ¿
sz = x
N N
b yx=r x 2 ∑ x2
Karena z x = , maka ∑ z x = 2 , sehigga
sx sx
Jadi terlihat jelas hubungan
2
korelasi dengan regresi yaitu 2 ∑ x
sz =
koefisien korelasi adalah N s 2x
x

kemiringan garis regresi.


x2
Persamaan regresi dalam nilai z Karena s2x = ∑ , maka
ditulis sebagai: N
2
z 'y =r z x 2
sz =
∑ x N =1 dan s = √1=1
z
z 'x =r z y
x
N s 2x ∑ x 2 x

Dengan cara yang yang sama, dapat dibuktikan bahwa


s z =√ 1=1
y

Bagaimana menginterpretasi koefisien korelasi dengan regresi?

Koefisien korelasi bukan proporsi (perbandingan). Koefisien korelasi 0.60 tidak berarti dua kali lebih
besar dari koefisien korelasi 0.30.

Perbedaan r = 0.30 dengan r = 0,40 tidak sama dengan perbedaan koefisien korelasi 0.50 dan 0.60.
Pertanyaannya adalah bagaimana menginterpretasi koefisien korelasi?. Cara paling mudah
mengkomunikasikan interpretasi koefisien korelasi adalah dengan menggunakan variansi
Bagaimana variansi dapat digunakan untuk menginterpretasi koefisien korelasi?

Ketika, misalkan, prediksi Y dari X dilakukan dengan menggunakan persamaan regresi, Y’ = b yx X + ayx,
maka dapat diasumsikan bahwa skor Y (Y yang sesungguhnya teramati atau sebut saja Y obeservasi)
akan berbeda dengan Y’ (Y hasil prediksi). Sehingga skor mengadung dua komponen

a. Y’ Jarak dari sumbu X ke garis regresi sejajar sumbu


Y (semua Y’ terletak di garis regresi
Y−Y’ b. Perbedaan antara Y observasi dan Y prediksi, yaitu
(Y – Y’)
Kedua Y ini saling tidak tergantung satu sama lain,
Y’ Y sehingga keduanya dapat dijumlahkan:
Y = Y’ + (Y – Y’)
s2y =s 2y ' + s2y. x

Dimana,
s2y = variansi Y observasi
s2y ' = variansi Y prediksi
2
s2y . x = variansi (Y – Y’) atau s(Y −Y ). '

Nilai s2y . x akan menyatakan variansi kesalahan prediksi (variance of error of prediction, variansi
kesalahan prediksi

2 2 2
Dari persamaan s y =s y ' + s y. x diketahui bahwa
2
a. s y ' adalah variansi Y yang dapat sumbangan dari, diprediksi dari, dijelaskan dengan variansi X.
2
b. s y ' adalah ukuran jumlah informasi yang kita punyai tentang Y dari pengetahuan kita tentang X
c. s2y . x variansi kesalahan prediksi
2
d. s y . x adalah bahagian dari variansi Y yang tidak dapat dikaitkan dengan variansi X, tatapi mesti
berasal dari pengaruh lain
2 2 2 2 2
Oleh karena s y ; s y ' ; dan s y . x bersifat additif (dapat dijumlahkan) maka jika s y =400, s y ' =300 dan

2 s 2y ' 300
sy.x = 100, maka dapat dikatakan bahwa 2 = =0.75 . Dari angka ini dapat dinyatakan bahwa
s y 400
s 2y . x 100
75 % variansi Y dapat diprediksi dari X, dan perbandingan = =0.25 akan meyatakan bahwa
s 2y 400
kesalahan prediksi 25%.

s 2y . x
Perbandingan 2 akan menunjukkan nilai r2. Relasi ini didapatkan dari hubungan:
sy
2 ( Y −Y ' )2 2 s2y =s 2y ' + s2y. x
s =
y.x =s y ( 1−r 2)
N s2y =s 2y + s2y ( 1−r 2)
'

s2y =s 2y + s2y +r 2 s 2y
'

s2
'

r 2 s 2y =s2y r 2= 2y
'

sy
Jadi r2 adalah ratio dari dua variansi. Jika diketahui korelasi Y dan X menghasilkan r = 0.8, maka r 2 =
0.64. Artinya 64 % variansi Y dapat diprediksi dari variansi X. Dengan kata lain dapat dikatakan bahwa
kita hanya mengetahui 64 % dari apa yang seharusnya kita ketahui dari prediksi sempurna. Jadi
derajat korelasi lebih bermakna bila diinterpretasi dengan kuadrat koefisien korelasi, r 2.

Apa hubungan koefisien korelasi dengan akurasi prediksi?

Akurasi prediksi dinyatakan melalui kesalahan estimasi standar. Kesalahan estimasi standar
diformulasi dengan cara berikut.

2 ( Y −Y ' )2 2 Nilai s yx ini disebut kesalahan estimasi standar (standard error


s = =s y ( 1−r 2)
y.x
N of estimate). Harga standar error ini dari 0 sampai s y . Bila r =
1, semua titik berada tepat berada di garis regresi dan s y . x = 0.
s y . x =s y √ 1−r 2 Bila r = 0, maka s y . x =s y .

s y . x akan menyatakan:

a. Derajat akurasi prediksi satu variabel dari variabel lain.


b. Seberapa dekat titik hasil observasi data berpasangan mendekati garis regresi

Tugas:
Berikut adalah data berpasangan
X Y X Y X Y
22 18 19 25 11 17
15 16 7 36 5 6
9 31 6 27 26 45
7 8 46 45 19 30
4 2 11 18 8 18
45 36 27 18 1 3
19 12 19 37 9 7
26 16 36 42 18 28
35 47 25 20 46 21
49 22 16 12 9 25
a. Tentukan harga persamaan regresi Y’ = byx X + ayx dengan terlebih dahulu menenentukan nilai
byx data yx dari data
b. Cari harga koefisien korelasi dan tuliskan hasil interpretasi koefisien korelasi dengan r 2

Anda mungkin juga menyukai