Soal Latihan Regresi Linier
Soal Latihan Regresi Linier
BAB V
ANALISIS REGRESI DAN KORELASI
5.1
PENGERTIAN UMUM
Banyak permasalahan yang datanya dinyatakan oleh lebih dari sebuah
variabel.
pada dasarnya merupakan perluasan dari analisis yang datanya terdiri atas dua
variabel, maka di sini terutama akan dibicarakan penelaahan kumpulan data yang
dilukiskan oleh dua variabel saja.
variabel itu digunakan simbul yang lazim dipakai, ialah X dan Y yang dapat
diberi indeks menurut keperluannya yaitu :
Yang Berbelanja ( yi )
156
151
2
345
419
378
353
435
361
394
436
175
203
196
189
241
197
212
232
Hal-hal yang akan dipelajari mengenai kumpulan data yang terdiri atas
dua variabel yaitu :
a.
Bagian ini
Jika pada
suatu hari ada 390 pengunjung, dari hubungan yang diperoleh dapat
diperkirakan ada berapa yang akan belanja di toko itu. Selain daripada
itu, juga dapat ditentukan berapa kuat jumlah pembeli ditentukan oleh
adanya pengunjung
b.
produk. Lainnya, antara lain jasa, Jika data selama waktu-waktu tertentu
diketahui, hubungan antara produk-produk nasional kotor dan jasa dapat
dihitung. Dari hubungan ini, produk nasional kotor dapat diperkirakan
jika jasa dapat diketahui.
5.2
ANALISIS REGRESI
Untuk menjelaskan bagaimana hubungan antara dua variabel, perhatikan
hari.
HARI
KE
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
PENGUNJUNG
(Xi)
35
39
34
40
31
43
40
30
34
39
33
32
36
40
43
BELANJA
(Yi)
32
36
31
38
29
42
33
29
29
36
31
31
33
37
36
HARI
KE
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
PENGUNJUNG
(Xi)
40
41
32
34
30
35
36
37
39
41
33
34
36
38
37
BELANJA
(Yi)
38
37
30
30
28
35
29
34
35
36
32
32
34
37
34
. .
.
.
.
Jika hubungan Y = f(X) itu linear, maka garis yang didapat adalah
Yang
Pada
kumpulan titik-titik itu ditarik sebuah garis lurus yang akan paling dekat titiktitik itu berkerumun sekitar garis yang ditarik tadi.
bagaimana persamaannya.
Meskipun cara tersebut sangat mudah dilakukan namun untuk penelitian
jarang dilakukan oleh karena kecuali terlalu kasar hasilnya, juga terlalu subyektif
dan ini sedapat mungkin harus dihindarkan. Karenanya akan ditinjau cara yang
dianggap cukup baik dan sering digunakan.
METODA KUADRAT TERKECIL.
Y a bX
(5.1)
6
Untuk menentukan koefisien-koefisien a dan b ini akan digunakan
METODA KUADRAT TERKECIL. Ternyata bahwa untuk regresi linear dalam
rumus 6.1, harga-harga a dan b dapat dihitung berdasarkan sekumpulan data
sebanyak n buah dengan menggunakan sistem persamaan :
Yi an b X i
i 1
i 1
X Y a X
i 1
i i
i 1
b X i
.............. (5.2)
i 1
Pasangan persamaan dengan dua anu a dan b ini, bentuk rumus 6.3, disebut
persamaan-persamaan normal untuk bentuk regresi dalam rumus 6.1.
Setelah
i 1
i 1
i 1
i 1
X i
i 1
n X i2
i 1
Yi X i2 X i X iYi
n
n X iYi X i Yi
i 1
i 1
.............. (5.3)
i 1
X i
i 1
n X i2
i 1
Yi
32
Xi2
1156
Yi2
1024
XiYi
1088
Xi
40
Yi
38
Xi2
1600
Yi2
1444
XiYi
1520
38
36
1444
1296
1368
41
37
1681
1369
1517
34
31
1156
961
1054
32
30
1024
900
960
40
38
1600
1444
1520
34
30
1156
900
1020
31
29
961
841
899
30
28
900
784
840
43
42
1849
1764
1806
35
35
1225
1225
1225
40
33
1600
1089
1320
36
29
841
841
1044
30
29
900
841
870
37
34
1156
1156
1258
33
29
1089
841
4957
39
35
1225
1225
1365
39
36
1521
1296
1296
40
36
1296
1296
1440
33
31
1089
961
1023
33
32
1024
1024
1056
32
31
1024
961
992
34
32
1024
1024
1088
36
33
1296
1289
1089
36
34
1156
1156
1224
40
37
1600
1369
1480
37
37
1369
1369
1369
42
36
1764
1296
1512
37
34
1156
1156
1258
545
503
20049
17073
18481
541
501
19651
16869
18184
X
i 1
1086
Y 1044
i 1
n
X
i 1
2
i
39700
X Y 36.665
i 1
i i
8
1044.39700 - 1086.36665
30.38700 - 1086 2
a 1, 6
a
30.36665 - 1086.1044
30.39700 - 1086 2
b 0,88
b
Y 1, 6 0,88 X
Dengan menggunakan persamaan yang diperoleh ini dapat diperkirakan berapa
orang diantara pengunjung itu yang akan berbelanja, apabila jumlah pengunjung
dapat diketahui.
b.
Y a bX cX 2 dX 3
c.
d.
5.4
1
a bX
variabel. Sehingga yang harus digunakan adalah regresi dengan variabel bebas
lebih dari satu.
Contoh :
1. Harga beras tidak saja hanya ditentukan oleh adanya persediaan, tetapi juga
oleh harga bensin, upah buruh dan sebagainya.
2. Produksi telur ayam tidak saja bergantung pada banyaknya ayam petelur
yang ada saja, tetapi juga dari banyak makanan yang diberikan, umur
ayam dan barangkali masih ada faktor lainnya.
Apabila ada satu variabel terikat Y dan k variabel bebas X 1 , X 2 ,..., X k
sehingga terdapat hubungan semacam garis regresi Y atas X 1 , X 2 ,..., X k .
Dalam bagian ini akan dijelaskan secara singkat bagaimana garis regresi yang
dimaksud dapat ditentukan dan yang akan ditinjau di sini hanyalah garis regresi
Y atas X 1 , X 2 ,..., X k yang paling sederhana ialah yang dikenal dengan nama
regresi linear berganda.
adalah :
Y a0 a1 X 1 ... ak X k
Dimana a0 , a1 ,..., ak harus ditentukan dari data hasil pengamatan.
Mudah
dilihat bahwa regresi di atas ini merupakan perluasan dari regresi linear
sederhana.
10
Pertanyaan yang timbul adalah
bagaimana koefisien-koefisien
Dapat
dibayangkan bahwa hal itu memerlukan metode penyelesaian yang lebih baik dan
karenanya memerlukan matematika yang lebih tinggi lebih-lebih untuk variabel
yang cukup banyak.
Untuk regresi linear berganda yang sederhana :
Y a0 a1 X 1 a2 X 2
Misalnya kita harus menyelesaikan 3 persamaan dengan 3 anu yang berbentuk :
n
Yi na0 a1 X 1i a2 X 2i
i 1
i 1
i 1
i 1
i 1
i 1
i 1
i 1
i 1
i 1
2i
a0 X 2i a1 X 1i X 2i a2 X 22i
ANALISIS KORELASI
Dalam bagian yang lalu, telah dipelajari bagaimana hubungan antara dua
11
hubungan antara variabel-variabel itu.
koefisien korelasi.
Untuk keperluan analisis tentang korelasi ini, seperti biasa akan
dibedakan antara statistik (ialah koefisien korelasi untuk data dalam sampel) dan
parameter (untuk menyatakan koefisien korelasi populasi.
Koefisien korelasi
Koefisien Korelasi
Karena ternyata korelasi dan regresi berhubungan erat, maka
X
n
i 1
X Yi Y
n 1 S x S y
12
i 1
i 1
n X iYi X i Yi
i 1
i 1
Dengan
X i
i 1
2
n X i
menggunakan
n Yi
i 1
perhitungan
Y i
i 1
n
matematika,
ternyata
dapat
Makin
dekat letak titik-titik itu pada garis lurus, makin kuatlah korelasi positif
itu dan harganya makin dekat kepada satu.
Jika titik-titik itu terletak pada garis lurus yang arahnya positif,
akan diperoleh harga r = +1.
r = +1
r = -1
13
Dilihat dari diagram pencarnya, letak titik-titik akan berada
sekitar sebuah garis lurus yang koefisien arahnya negatif. Makin dekat
letak titik-titik itu pada garis yang dimaksud, makin dekat pula nilai r
kepada -1. Dan akhirnya jika titik-titik itu terletak pada garis lurus yang
koefisien arahnya negatif didapat harga r = -1.
Dalam prakteknya jarang sekali didapatkan diagram pencar yang
letak titik-titiknya pada sebuah garis lurus seperti dalam gambar di atas
sangat jarang.
Makin terpencar
letak titik-titik itu dari sebuah garis lurus, makin dekatlah r kepada nol.
Setelah dikenal apa arti koefisien korelasi, masih ada ukuran lain
yang sebenarnya lebih mudah untuk ditafsirkan dalam penggunaannya.
Ukuran tersebut ialah yang dinamakan koefisien determinasi yang tiada
lain daripada kuadrat koefisien korelasi. Jadi :
Koefisien Determinasi = r2
Karena sudah diketahui bahwa koefisien korelasi berada -1 r +1,
maka tentulah koefisien determinasi mulai dari nol sampai dengan 1,
atau :
r2 1
Sedangkan
14
apabila datanya tidak terlalu banyak.
Oleh
Gaji
30-39
40-49
50-59
60-69
70-79
80-89
90-99
jumlah
15
wisata
0,00-0,99
1,00-1,99
2,00-2,99
3,00-3,99
4,00-4,99
5,00-5,99
6,00-6,99
7,00-7,99
Jumlah
1
2
1
3
2
5
1
10
6
2
10
19
2
5
4
1
2
1
3
10
5
14
19
1
2
6
2
1
12
1
1
2
2
1
7
1
6
15
19
12
19
11
2
85
Dari daftar dapat dilihat bahwa ada 4 tentara dengan gaji Rp. 300.000
sampai dengan Rp. 400.000 sebulannya, dengan pengeluaran untuk
wisata masing-masing 1 orang Rp. 0 sampai dengan Rp. 99.000.
Sekarang persoalannya adalah bagaimana menentukan koefisen korelasi
antara keduanya ?
Untuk itu dipergunakan rumus berikut :
fuv
2
n f xu
f x u
f u f
x
n fu v 2 -
fu
v
dimana :
u = koding untuk variabel X
v = koding untuk variabel Y
fx = frekuensi kelas interval dari variabel X
fy = frekuensi kelas interval dari variabel Y
f = frekuensi dalam tiap sel
n = banyak data.
Sekarang dipergunakan peerumusan di atas.
x
u
34,5
-3
44,5
-2
Gaji tentara
54,5
64,5
-1
0
74,5
1
84,5
2
94,5
3
fy
fyv
fyv2
Fuv
16
0,495
1,495
2,495
3,495
4,495
5,495
6,495
7,495
fx
fxu
fxu2
fuv
-3
-2
-1
0
1
2
3
4
1
2
1
3
2
5
1
10
6
2
2
5
4
1
2
1
3
10
5
10
19
14
19
1
2
6
2
1
12
-12
36
24
-20
40
16
-19
19
10
0
0
0
19
19
38
24
48
48
1
1
2
2
1
7
1
6
15
19
12
19
11
2
85
24
63
45
21
63
45
-3
-12
-15
0
12
38
33
8
61
9
24
15
0
12
76
99
32
267
sama
untuk tanda kelas yang makin kecil berturut-turut -1, -2, -3, ..
sedangkan untuk tanda kelas yang makin besar +1, +2, +3,
Harga-
Korelasi Rank
Ada kalanya ingin diketahui korelasi antara dua variabel tidak
9
26
17
8
8
56
45
20
181
17
Umpamanya saja, kita telah melakukan penelitian mengenai tingkatan
menyenangi merk sepatu olahraga bagi prajurit A dan prajurit B anggota
TNI AL. Hasilnya dinyatakan dalam tabel di bawah ini. Untuk sepatu
yang paling disukai, diberi nilai 1 dan yang paling tidak disukai diberi
nilai 10. Urut-urutan nilai tersebut dinamakan RANK.
Berdasarkan
rank atau biasa juga dikenal dengan koefisien korelasi spearman dan
disimbulkan dengan r' (baca : er - aksen) untuk membedakan dengan
koefisien korelasi yang sudah dikenal.
Merk sepatu
1
Adidas
Lotto
Speck
Spotex
New Era
Jet
Niel
Pioneer
Crown
Best
Prajurit A
2
1
2
3
5
4
6
8
9
7
10
Prajurit B
3
2
3
1
4
5
6
9
7
8
10
r 1
6 di2
i 1
n n 2 1
18
Rank A
Rank B
di
di2
r 1
1
2
-1
1
2
3
-1
1
3
1
2
4
5
4
1
1
4
5
-1
1
6
6
0
0
8
9
-1
1
9
7
2
4
7
8
-1
1
10
10
0
0
Jml
14
6.14
10(100 1)
r' = 0,015
d.
Korelasi Berganda
Korelasi berganda merupakan korelasi dari beberapa variabel
Y a0 a1 X 1 ... ak X k
a1 x1 y a2 x2 y ... ak xk y
dengan
x y X Y n
X
Y
x y X Y
X1
y Y
2
e.
Korelasi Parsial
Korelasi parsial adalah korelasi antara sebuah variabel tak bebas
19
Korelasi parsial Y dengan X1 dengan X2 dianggap konstan adalah :
rYX1 . X 2
1 r 1 r
2
YX 2
2
X1 X 2
rYX 2 . X1
1 r 1 r
2
YX 1
5.6
2
X1 X 2
SOAL-SOAL
a.
b.
regresi linear
2)
regresi nonlinear
3)
4)
5)
6)
7)
8)
c.
d.
Sejalan
20
1)
artinya kalau = 0 ?
g.
h.
i.
Nilai statistika
65
66
66
67
69
72
72
73
75
76
77
78
76
80
80
21
Y = 185 + 1,46 X
1)
Kotor (Y) dengan hasil jualan tahunan minyak mentah dinyatakan oleh X
di suatu negara, ditentukan oleh : Y = -3,21 + 0,02453 X
Dengan X, Y dalam milyard unit uang di negara itu.
1)
2)
3)
k.
Korelasi
2)
Koefisien korelasi
3)
Korelasi parsial
4)
Korelasi positif
5)
Korelasi negatif
6)
Korelasi Rank
22
l.
m.
1)
Positif
2)
Negatif
Apakah ini
perusahaan kecap. Untuk kecap yang paling enak, oleh setiap ahli diberi
nomor satu, yang kurang enak diberi nomor dua dan seterusnya.
Hasilnya diberikan dalam daftar berikut :
Ahli A
Ahli B
10
8
3
6
5
1
4
12
1
3
8
11
7
2
6
5
2
7
9
4
11
10
12
9
1)
2)