Anda di halaman 1dari 22

1

BAB V
ANALISIS REGRESI DAN KORELASI

5.1

PENGERTIAN UMUM
Banyak permasalahan yang datanya dinyatakan oleh lebih dari sebuah

variabel.

Mengingat analisis kumpulan data yang terdiri atas banyak variabel

pada dasarnya merupakan perluasan dari analisis yang datanya terdiri atas dua
variabel, maka di sini terutama akan dibicarakan penelaahan kumpulan data yang
dilukiskan oleh dua variabel saja.

Untuk keperluan penelaahan, kepada kedua

variabel itu digunakan simbul yang lazim dipakai, ialah X dan Y yang dapat
diberi indeks menurut keperluannya yaitu :

x1 , x2 ,..., xn dan y1 , y2 ,..., yn


Atau pasangan xi , yi ; i = 1,2, , n
Sehingga sampel yang berukuran n itu terdiri atas n buah pasang data.
Contoh 5.1 :
Jika xi menyatakan banyak pengunjung ke suatu toko swalayan dan yi diartikan
orang-orang diantara pengunjung itu yang berbelanja di toko tersebut misalnya,
maka akan diteliti kumpulan data seperti dalam daftar berikut :
Tabel 5.1 : Jumlah pengunjung dan belanja di suatu toko swalayan
Pengunjung ( xi )
300
290

Yang Berbelanja ( yi )
156
151

2
345
419
378
353
435
361
394
436

175
203
196
189
241
197
212
232

Hal-hal yang akan dipelajari mengenai kumpulan data yang terdiri atas
dua variabel yaitu :
a.

Mempelajari derajat asosiasi antara kedua variabel.

Bagian ini

dalam statistika dikenal dengan nama ANALISIS KORELASI.


Hubungan korelasional ini tidak menjelaskan apakah suatu variabel
menjadi penyebab dari variabel yang lainnya.
b.

Mempelajari hubungan yang ada di antara variabel-variabel

sehingga dari hubungan yang diperoleh dapat menaksir variabel yang


satu apabila harga variabel lainnya diketahui. Bagian ini dikenal dengan
nama ANALISIS REGRESI.
Contoh 5.2 :
a.

Dari data yang tertera dalam daftar di atas, dapat dicari

hubungan yang ada antara pengunjung dan yang belanja.

Jika pada

suatu hari ada 390 pengunjung, dari hubungan yang diperoleh dapat
diperkirakan ada berapa yang akan belanja di toko itu. Selain daripada
itu, juga dapat ditentukan berapa kuat jumlah pembeli ditentukan oleh
adanya pengunjung
b.

Diketahui bahwa produk nasional kotor ditentukan oleh produk-

produk. Lainnya, antara lain jasa, Jika data selama waktu-waktu tertentu
diketahui, hubungan antara produk-produk nasional kotor dan jasa dapat
dihitung. Dari hubungan ini, produk nasional kotor dapat diperkirakan
jika jasa dapat diketahui.

5.2

ANALISIS REGRESI
Untuk menjelaskan bagaimana hubungan antara dua variabel, perhatikan

data yang tercantum dalam tabel berikut :


Tabel 5.2 :

Banyak pengunjung dan belanja di suatu toko swalayan selama 30

hari.
HARI
KE
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

PENGUNJUNG
(Xi)
35
39
34
40
31
43
40
30
34
39
33
32
36
40
43

BELANJA
(Yi)
32
36
31
38
29
42
33
29
29
36
31
31
33
37
36

HARI
KE
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

PENGUNJUNG
(Xi)
40
41
32
34
30
35
36
37
39
41
33
34
36
38
37

BELANJA

(Yi)
38
37
30
30
28
35
29
34
35
36
32
32
34
37
34

Dalam daftar di atas merupakan banyak pengunjung (dinyatakan dengan


Xi) dan yang berbelanja (dinyatakan dengan Yi) yang telah dicatat oleh seseorang
pengusaha di tokonya.
Kebiasaan yang digunakan dalam penentuan simbul-simbul yang lazim,
ialah Xi untuk hal yang diperkirakan lebih tepat dapat digolongkan ke dalam
variabel yang sifatnya bebas, sedangkan Yi untuk variabel yang diperkirakan
akan bergantung pada Xi.

Variabel Xi disebut variabel bebas sedangkan Yi

disebut variabel tak bebas.


Representasi untuk data dalam Tabel 6.2 di atas, diagram pencarnya
dapat dilihat seperti dalam gambar berikut !

. .
.
.
.

Gambar 5.1 : Diagram pencar dari data pada Tabel 6.2


Dengan menggunakan diagram ini dapat dilihat apakah ada sesuatu
hubungan yang berarti diantara titik-titik itu pada atau sekitar garis lurus ? Jika
demikian halnya, cukup alasan bagi kita untuk menduga bahwa antara variabelvariabel itu ada hubungan linear. Dalam hal lainnya, antara variabel-variabel itu
diduga terdapat hubungan non linear.
Setelah diketahui bentuk hubungan antara variabel itu, tugas selanjutnya
ialah menentukan hubungan tersebut dirumuskan dalam suatu persamaan
matematis.

Kemudian disusun dalam suatu persamaan garis yang

merepresentasikan persamaan matematisnya. Garis ini dikenal dengan nama garis


regresi.

Jika hubungan Y = f(X) itu linear, maka garis yang didapat adalah

garis regresi linear. Dalam hal lainnya didapat regresi nonlinear.


REGRESI NON LINEAR

Gambar 5.2 : Representasi garis regresi linear dan non linear

Gambar di atas memperlihatkan diagram pencar untuk data dalam daftar


dengan garis lurus atau regresi linear yang diduga cocok dengan letak titik-titik
diagram. Gambar 5.2 melukiskan regresi non linear untuk sesuatu persoalan.
Oleh karena regresi linear merupakan bentuk regresi yang paling mudah
ditelaah, kecuali itu juga karena banyak regresi nonlinear yang dapat diselesaikan
dengan bantuan regresi linear, maka di sini terutama hanyalah regresi tersebut
yang akan dibicarakan.
Bagaimanakah menentukan persamaan regresi yang linear ini?

Yang

paling mudah ialah dengan jalan kira-kira menurut penglihatan kita.

Pada

kumpulan titik-titik itu ditarik sebuah garis lurus yang akan paling dekat titiktitik itu berkerumun sekitar garis yang ditarik tadi.

Sesudah itu ditentukan

bagaimana persamaannya.
Meskipun cara tersebut sangat mudah dilakukan namun untuk penelitian
jarang dilakukan oleh karena kecuali terlalu kasar hasilnya, juga terlalu subyektif
dan ini sedapat mungkin harus dihindarkan. Karenanya akan ditinjau cara yang
dianggap cukup baik dan sering digunakan.
METODA KUADRAT TERKECIL.

Cara yang dimaksud adalah

Sebelum cara ini dibicarakan, terlebih

dahulu akan ditinjau seperlunya macam-macam regresi linear yang mungkin,


sehubungan dengan variabel bebas.
Di atas dikatakan, bahwa jika variabel X yang diketahui terlebih dahulu
dan kemudian Y ditentukan berdasarkan X ini, maka ditentukan hubungan
Y=f(X). Rumusan hubungan ini lebih dikenal dengan nama Regresi Y atas X.
Jika regresi Y atas X ini linear, maka persamaannnya dapat dituliskan
dalam bentuk linear :

Y a bX

(5.1)

Dengan Y berarti taksiran nilai X untuk harga Y yang diketahui.

6
Untuk menentukan koefisien-koefisien a dan b ini akan digunakan
METODA KUADRAT TERKECIL. Ternyata bahwa untuk regresi linear dalam
rumus 6.1, harga-harga a dan b dapat dihitung berdasarkan sekumpulan data
sebanyak n buah dengan menggunakan sistem persamaan :

Yi an b X i
i 1

i 1

X Y a X
i 1

i i

i 1

b X i

.............. (5.2)

i 1

Pasangan persamaan dengan dua anu a dan b ini, bentuk rumus 6.3, disebut
persamaan-persamaan normal untuk bentuk regresi dalam rumus 6.1.

Setelah

diselesaikan, akan didapat harga-harga a ddan b yang dicari, yakni:

i 1

i 1

i 1

i 1

X i

i 1

n X i2
i 1

Yi X i2 X i X iYi
n

n X iYi X i Yi
i 1

i 1

.............. (5.3)

i 1

X i

i 1

n X i2

i 1

Untuk menjelaskan penggunaan rumus 5.3 di atas, sekarang ditinjau contoh


mengenai banyak pengunjung dan yang berbelanja ke sebuah toko yang datanya
tertera dalam Tabel 5.2. Dari diagram pencar gambar 5.1 mudah dilihat bahwa
titik-titik itu terletak sekitar garis lurus. Untuk menentukan regresi linear Y atas
X, maka sebaliknya dibuat sebuah daftar seperti Tabel 5.3 berikut ini.

Tabel 5.4 : Tabel penyelesaian persamaan regresi linear


Xi
34

Yi
32

Xi2
1156

Yi2
1024

XiYi
1088

Xi
40

Yi
38

Xi2
1600

Yi2
1444

XiYi
1520

38

36

1444

1296

1368

41

37

1681

1369

1517

34

31

1156

961

1054

32

30

1024

900

960

40

38

1600

1444

1520

34

30

1156

900

1020

31

29

961

841

899

30

28

900

784

840

43

42

1849

1764

1806

35

35

1225

1225

1225

40

33

1600

1089

1320

36

29

841

841

1044

30

29

900

841

870

37

34

1156

1156

1258

33

29

1089

841

4957

39

35

1225

1225

1365

39

36

1521

1296

1296

40

36

1296

1296

1440

33

31

1089

961

1023

33

32

1024

1024

1056

32

31

1024

961

992

34

32

1024

1024

1088

36

33

1296

1289

1089

36

34

1156

1156

1224

40

37

1600

1369

1480

37

37

1369

1369

1369

42

36

1764

1296

1512

37

34

1156

1156

1258

545

503

20049

17073

18481

541

501

19651

16869

18184

Dari daftar di atas diperoleh :


n

X
i 1

1086

Y 1044
i 1
n

X
i 1

2
i

39700

X Y 36.665
i 1

i i

Disubstitusikan harga-harga tersebut dengan rumus regresi linear dengan


mengambil n = 30, didapat :

8
1044.39700 - 1086.36665
30.38700 - 1086 2
a 1, 6
a

30.36665 - 1086.1044
30.39700 - 1086 2
b 0,88
b

Sehingga garis regresi linear yang dimaksud mempunyai persamaan :

Y 1, 6 0,88 X
Dengan menggunakan persamaan yang diperoleh ini dapat diperkirakan berapa
orang diantara pengunjung itu yang akan berbelanja, apabila jumlah pengunjung
dapat diketahui.

Apabila rata-rata perjam ada 40 orang yang berkunjung ke

toko itu, maka dapat diperkirakan dari Y 1, 6 0,88 X diperoleh :


Y = 1,6 + (0,88)(40)
= 36,81 orang yang berbelanja.
5.3

REGRESI NON LINEAR


Setelah dipelajari seperlunya mengenai bentuk hubungan linear antara

dua variabel X dan Y sekarang akan diperhatikan bentuk hubungan nonlinear


antar dua variabel. Tidak akan dibicarakan secara luas dan mendalam mengenai
regresi nonlinear ini, tetapi hanya merupakan suatu tinjauan singkat saja, tinjauan
yang pada umumnya dapat ditelaah berdasarkan teori regresi linear.
Meskipun terdapat banyak sekali bentuk regresi non linear yang biasa
digunakan tetapi di sini hanyalah akan ditinjau beberapa saja yang penting dan
termudah.

Untuk regresi nonlinear Y atas X yang akan ditinjau di sini, antara

lain berbentuk lengkungan :


a.

Parabola kuadratis dengan persamaan Y a bX cX 2

b.

Parabola kubis dengan persamaan

Y a bX cX 2 dX 3
c.

Logaritmis dengan persamaan : Y aX b

d.

5.4

Hiperbola dengan persamaan : Y

1
a bX

REGRESI LINEAR BERGANDA


Ada banyak kenyataan bahwa pengamatan akan terdiri atas lebih dari dua

variabel. Sehingga yang harus digunakan adalah regresi dengan variabel bebas
lebih dari satu.
Contoh :
1. Harga beras tidak saja hanya ditentukan oleh adanya persediaan, tetapi juga
oleh harga bensin, upah buruh dan sebagainya.
2. Produksi telur ayam tidak saja bergantung pada banyaknya ayam petelur
yang ada saja, tetapi juga dari banyak makanan yang diberikan, umur
ayam dan barangkali masih ada faktor lainnya.
Apabila ada satu variabel terikat Y dan k variabel bebas X 1 , X 2 ,..., X k
sehingga terdapat hubungan semacam garis regresi Y atas X 1 , X 2 ,..., X k .
Dalam bagian ini akan dijelaskan secara singkat bagaimana garis regresi yang
dimaksud dapat ditentukan dan yang akan ditinjau di sini hanyalah garis regresi
Y atas X 1 , X 2 ,..., X k yang paling sederhana ialah yang dikenal dengan nama
regresi linear berganda.

Persamaan umum untuk regresi linear berganda ini

adalah :

Y a0 a1 X 1 ... ak X k
Dimana a0 , a1 ,..., ak harus ditentukan dari data hasil pengamatan.

Mudah

dilihat bahwa regresi di atas ini merupakan perluasan dari regresi linear
sederhana.

10
Pertanyaan yang timbul adalah

bagaimana koefisien-koefisien

a0 , a1 ,..., ak ditentukan ? Secara sama dengan regresi linear sederhana, maka


dipergunakan metode KUADRAT TERKECIL. Oleh karena ada k+1 parameter
yang harus dicari maka diperlukan k+1 persamaan dengan k+1 anu.

Dapat

dibayangkan bahwa hal itu memerlukan metode penyelesaian yang lebih baik dan
karenanya memerlukan matematika yang lebih tinggi lebih-lebih untuk variabel
yang cukup banyak.
Untuk regresi linear berganda yang sederhana :

Y a0 a1 X 1 a2 X 2
Misalnya kita harus menyelesaikan 3 persamaan dengan 3 anu yang berbentuk :
n

Yi na0 a1 X 1i a2 X 2i
i 1

i 1

i 1

i 1

i 1

i 1

i 1

i 1

i 1

i 1

Yi X1i a0 X1i a1 X 12i a2 X1i X 2i


Y X
i 1

2i

a0 X 2i a1 X 1i X 2i a2 X 22i

Untuk persamaan regresi dengan 4 variabel bebas, maka diperlukan 4 persamaan.


Demikian seterusnya.
5.5

ANALISIS KORELASI
Dalam bagian yang lalu, telah dipelajari bagaimana hubungan antara dua

variabel X dan Y dapat ditentukan. Hubungan yang diperoleh dinyatakan dalam


bentuk persamaan matematis yang dalam statistika dikenal dengan nama garis
regresi.

Jika X merupakan variabel bebas dan Y variabel tak bebas, regresi Y

atas X dapat digunakan untuk meramalkan nilai Y apabila nilai X diketahui.


Dalam banyak soal, jika nilai-nilai pengamatan terdiri atas lebih dari
sebuah variabel, bukan saja regresinya yang perlu dihitung, tetapi juga kekuatan

11
hubungan antara variabel-variabel itu.

Ukuran yang digunakan untuk itu adalah

koefisien korelasi.
Untuk keperluan analisis tentang korelasi ini, seperti biasa akan
dibedakan antara statistik (ialah koefisien korelasi untuk data dalam sampel) dan
parameter (untuk menyatakan koefisien korelasi populasi.

Koefisien korelasi

untuk sampel, jadi merupakan statistik, akan dinyatakan dengan r sedangkan


parameternya dengan (baca : rho).
Dalam bagian berikut ini akan diuraikan bagaimana r dihitung dan
selanjutnya akan diberikan penjelasan mengenai pengujian derajat asosiasi.
a.

Koefisien Korelasi
Karena ternyata korelasi dan regresi berhubungan erat, maka

untuk menentukan ukuran asosiasi atau koefisien korelasi, perlu


terpenuhi syarat-syarat :
1)

Koefisien korelasi harus besar apabila derajat asosiasi

tinggi dan harus kecil apabila derajat asosiasi rendah.


2)

Koefisien korelasi harus bebas daripada satuan yang

digunakan untuk mengukur variabel.


Untuk mencapai kedua syarat di atas, maka untuk menentukan
koefisien korelasi r biasa digunakan statistik :

X
n

i 1

X Yi Y

n 1 S x S y

Inilah rumus koefisien korelasi yang pertama yang disebut KOEFISIEN


KORELASI PERSON atau PRODUCT MOMENT.
Koefisien korelasi r menunjukkan apakah cukup beralasan bagi kita
untuk menyatakan ada atau tidak adanya hubungan linear antara
variabel-variabel X dan Y. Rumus lain yang juga sering dipergunakan
adalah :

12

i 1

i 1

n X iYi X i Yi

i 1

i 1

Dengan

X i

i 1

2
n X i

menggunakan

n Yi
i 1

perhitungan

Y i
i 1
n

matematika,

ternyata

dapat

dibuktikan bahwa batas-batas koefisien korelasi itu berada dalam


daerah / interval :
-1 r 1
Tanda positif menyatakan bahwa antara variabel-variabel itu terdapat
korelasi positif atau korelasi langsung yang berarti nilai variabel X yang
kecil berpasangan dengan nilai variabel Y yang kecil serta nilai variabel
X yang besar berpasangan dengan nilai variabel Y yang besar pula.
Korelasi positif menunjukkan letak titik-titik dalam diagram
pencar berada sekitar garis lurus yang koefisien arahnya positif.

Makin

dekat letak titik-titik itu pada garis lurus, makin kuatlah korelasi positif
itu dan harganya makin dekat kepada satu.
Jika titik-titik itu terletak pada garis lurus yang arahnya positif,
akan diperoleh harga r = +1.

r = +1

r = -1

Jika variabel X yang besar berpasangan dengan Y yang kecil dan


jika X kecil berpasangan dengan Y yang besar, akan diperoleh Korelasi
negatif atau korelasi invers.

13
Dilihat dari diagram pencarnya, letak titik-titik akan berada
sekitar sebuah garis lurus yang koefisien arahnya negatif. Makin dekat
letak titik-titik itu pada garis yang dimaksud, makin dekat pula nilai r
kepada -1. Dan akhirnya jika titik-titik itu terletak pada garis lurus yang
koefisien arahnya negatif didapat harga r = -1.
Dalam prakteknya jarang sekali didapatkan diagram pencar yang
letak titik-titiknya pada sebuah garis lurus seperti dalam gambar di atas
sangat jarang.

Yang sering didapati adalah bentuk yang menyebabkan

nilai koefisien korelasi tidak sama dengan 1 atau -1.

Makin terpencar

letak titik-titik itu dari sebuah garis lurus, makin dekatlah r kepada nol.
Setelah dikenal apa arti koefisien korelasi, masih ada ukuran lain
yang sebenarnya lebih mudah untuk ditafsirkan dalam penggunaannya.
Ukuran tersebut ialah yang dinamakan koefisien determinasi yang tiada
lain daripada kuadrat koefisien korelasi. Jadi :
Koefisien Determinasi = r2
Karena sudah diketahui bahwa koefisien korelasi berada -1 r +1,
maka tentulah koefisien determinasi mulai dari nol sampai dengan 1,
atau :

r2 1

Koefisien determinasi biasanya dinyatakan dengan persen.

Sedangkan

penafsirannya adalah jika r = 0,94 sehingga r = 0,8836 atau 88,36%


maka ditafsirkan sebagai 88,36% variasi suatu variabel yang disebabkan
oleh variabel lainnya.
Koefisien determinasi banyak digunakan dalam penjelasan tambahan
untuk hasil perhitungan koefisien regresi.
b.

Menghitung r Untuk Data Berkelompok


Rumus-rumus di atas adalah rumus-rumus untuk menentukan r

apabila datanya massih belum disusun dalam daftar distribusi frekuensi.


Rumus-rumus tersebut pula cukup menyenangkan untuk digunakan

14
apabila datanya tidak terlalu banyak.

Jika data yang sedang dicari

korelasinya itu banyak sekali, dengan menggunakan rumus-rumus


tersebut akan memakan waktu yang lama dari perhitungannya.
karena itu perlu ada usaha untuk mempersingkatnya.

Oleh

Jalan yang lazim

ditempuh ialah terlebih dahulu menyusun data ke dalam daftar distribusi


frekuensi. Oleh karena kita sedang berhadapan dengan penelitian yang
terdiri atas dua variabel, maka kitapun akan memperoleh dua distribusi
frekuensi.

Kedua distribusi frekuensi ini harus disajikan dalam daftar

yang berklasifikasi dua, sedemikian sehingga dampaknya banyak seperti


daftar kontingensi.

Banya baris sesuai dengan banyak kelas interval

distribusi frekuensi variabel yang satu, sedangkan banyak kolom sesuai


dengan banyak kelas interval dari distribusi frekuensi variabel kedua.
Untuk variabel yang satu, yang terdapat dalam baris, kelas-kelas
intervalnya mulai dari atas ke bawah disusun seperti biasa, yakni dari
data yang kecil hingga yang paling besar. Variabel yang terdapat dalam
kolom, kelas-kelas intervalnya dari kiri ke kanan yang dimulai dari data
yang kecil hingga yang besar.
Frekuensi data dalam daftar ini akan didapati dalam tiap-tiap sel.
Jadi frekuensi dalam setiap sel merupakan banyak data yang ada dalam
kelas interval variabel yang satu dan juga yang ada dalam kelas interval
variabel yang lain.
Contoh :
Berikut data gaji tentara (data fiktif, tahun 95) beserta pengeluarannya
untuk keperluan rekreasi bersama keluarga.
Daftar gaji tentara dan pengeluaran untuk wisata
(dalam puluhan ribu rupiah)

Gaji

30-39

40-49

50-59

60-69

70-79

80-89

90-99

jumlah

15
wisata
0,00-0,99
1,00-1,99
2,00-2,99
3,00-3,99
4,00-4,99
5,00-5,99
6,00-6,99
7,00-7,99
Jumlah

1
2
1

3
2
5

1
10
6
2

10

19

2
5
4
1
2

1
3
10
5

14

19

1
2
6
2
1
12

1
1
2
2
1
7

1
6
15
19
12
19
11
2
85

Dari daftar dapat dilihat bahwa ada 4 tentara dengan gaji Rp. 300.000
sampai dengan Rp. 400.000 sebulannya, dengan pengeluaran untuk
wisata masing-masing 1 orang Rp. 0 sampai dengan Rp. 99.000.
Sekarang persoalannya adalah bagaimana menentukan koefisen korelasi
antara keduanya ?
Untuk itu dipergunakan rumus berikut :

fuv

2
n f xu

f x u

f u f
x

n fu v 2 -


fu
v

dimana :
u = koding untuk variabel X
v = koding untuk variabel Y
fx = frekuensi kelas interval dari variabel X
fy = frekuensi kelas interval dari variabel Y
f = frekuensi dalam tiap sel
n = banyak data.
Sekarang dipergunakan peerumusan di atas.

x
u

34,5
-3

44,5
-2

Gaji tentara
54,5
64,5
-1
0

74,5
1

84,5
2

94,5
3

fy

fyv

fyv2

Fuv

16
0,495
1,495
2,495
3,495
4,495
5,495
6,495
7,495
fx
fxu
fxu2
fuv

-3
-2
-1
0
1
2
3
4

1
2
1

3
2
5

1
10
6
2

2
5
4
1
2

1
3
10
5

10

19

14

19

1
2
6
2
1
12

-12
36
24

-20
40
16

-19
19
10

0
0
0

19
19
38

24
48
48

1
1
2
2
1
7

1
6
15
19
12
19
11
2
85

24
63
45

21
63
45

-3
-12
-15
0
12
38
33
8
61

9
24
15
0
12
76
99
32
267

sama

Untuk variabel x, telah diambil koding u = 0 yang sesuai dengn tanda


kelas 64,5 dan untuk variabel Y diambil koding v = 0 sesuai dengan
tanda kelas 3,495.

Koding-koding lainnya diambil seperti biasa, yakni

untuk tanda kelas yang makin kecil berturut-turut -1, -2, -3, ..
sedangkan untuk tanda kelas yang makin besar +1, +2, +3,

Harga-

harga fxu didapat dengan mengalikan fx = 4 kali u = -3, f xu = -20 dari fx =


10 kali u = -2 dan seterusnya. Demikian pula fyv = 3 didapat dari fy = 1
kali v = -3, fyv = -12 didapat dari fy = 6 kali v = -2 dan seterusnya.
Nilai fxu2 diperoleh dengan mengalikan fxu dengan u,

nilai fyv2 adalah

hasil kali fyv dengan v dan seterusnya.


Dengan demikian, nilai r adalah :
85. 181 - 13. 61
r =
{85.225 - 132} {85.267 - 612}
r = 0,77
Angka ini menyatakan kuatnya hubungan antara gaji bulanan tentara dan
pengeluaran untuk pariwisata.
c.

Korelasi Rank
Ada kalanya ingin diketahui korelasi antara dua variabel tidak

berdasarkan pada pasangan data dimana nilai sebenarnya diketahui.

9
26
17
8
8
56
45
20
181

17
Umpamanya saja, kita telah melakukan penelitian mengenai tingkatan
menyenangi merk sepatu olahraga bagi prajurit A dan prajurit B anggota
TNI AL. Hasilnya dinyatakan dalam tabel di bawah ini. Untuk sepatu
yang paling disukai, diberi nilai 1 dan yang paling tidak disukai diberi
nilai 10. Urut-urutan nilai tersebut dinamakan RANK.

Berdasarkan

rank tersebut, dapatlah ditentukan hubungan / korelasi antara keddua


variabel.

Ukuran yang diperoleh biasa dinamakan koefisien korelasi

rank atau biasa juga dikenal dengan koefisien korelasi spearman dan
disimbulkan dengan r' (baca : er - aksen) untuk membedakan dengan
koefisien korelasi yang sudah dikenal.
Merk sepatu
1
Adidas
Lotto
Speck
Spotex
New Era
Jet
Niel
Pioneer
Crown
Best

Prajurit A
2
1
2
3
5
4
6
8
9
7
10

Prajurit B
3
2
3
1
4
5
6
9
7
8
10

Rumus untuk menghitung koefisien korelasi spearman adalah:


n

r 1

6 di2
i 1

n n 2 1

dengan di = selisih tiap pasang rank


n = banyaknya pasangan data
Sehingga dengan menggunakan rumus di atas, persoalan kesukaan
terhadap sepatu merk tertentu dapat dicari koefisien korelasinya, sebagai
berikut :

18

Rank A
Rank B
di
di2

r 1

1
2
-1
1

2
3
-1
1

3
1
2
4

5
4
1
1

4
5
-1
1

6
6
0
0

8
9
-1
1

9
7
2
4

7
8
-1
1

10
10
0
0

Jml
14

6.14
10(100 1)

r' = 0,015
d.

Korelasi Berganda
Korelasi berganda merupakan korelasi dari beberapa variabel

bebas secara serentak dengan variabel terikat


Misalkan ada k variabel bebas, X 1 , X 2 ,..., X k dan satu variabel terikat
Y dalam suatu persamaan regresi linear

Y a0 a1 X 1 ... ak X k

maka besarnya korelasi bergandanya adalah :


ry , x1 ,..., xk

a1 x1 y a2 x2 y ... ak xk y

dengan

x y X Y n
X
Y
x y X Y
X1

y Y
2

e.

Korelasi Parsial
Korelasi parsial adalah korelasi antara sebuah variabel tak bebas

dengan sebuah variabel bebas tertentu dengan variabel-variabel bebas


lain dianggap tetap / konstan.
Koefisien korelasi parsial dinyatakan dengan perumusan :
Untuk dua variabel bebas :

19
Korelasi parsial Y dengan X1 dengan X2 dianggap konstan adalah :

rYX1 . X 2

rYX1 rYX 2 rX1 X 2

1 r 1 r
2

YX 2

2
X1 X 2

Korelasi parsial Y dengan X2 dengan X1 dianggap konstan adalah :

rYX 2 . X1

rYX 2 rYX1 rX1 X 2

1 r 1 r
2

YX 1

5.6

2
X1 X 2

SOAL-SOAL
a.

Berikan contoh dimana ramalan akan diperlukan !

b.

Apakah yang dimaksud dengan :


1)

regresi linear

2)

regresi nonlinear

3)

regresi linear X atas Y

4)

regresi linear Y atas X

5)

metode kuadrat terkecil

6)

persamaan normal suatu regresi

7)

simpangan baku bersyarat

8)

regresi linear berganda

c.

Jelaskan mengenai perbedaan antara regresi linear dan non linear

d.

Dalam uraian yang mengenai hampir seluruhnya hanya ditinjau

tentang regresi Y atas X. Untuk mendapatkan uraian tentang regresi X


atas Y, tinggallah menukarkan variabel-variabel X dan Y.

Sejalan

dengan ini, regresi X atas Y, cobalah tuliskan rumuss yang sesuai.


e.

Dalam hal yang berikut, sebutkan apakah taksiran rata-rata atau

taksiran nilai individu yang diperlukan :

20
1)

bagaimanakah jualan tahun yang akan datang, apabila

untuk tahun itu diketahui produk nasional kotor yang


diharapkan ?
2)

Orang - orang dengan pendapatan Rp 1000.000,00 tiap

bulan berapa dapat menyediakan uangnya untuk keperluan


sosial ?
f.

Perhatikanlah regresi linier dalam rumus x = + X. Apakah

artinya kalau = 0 ?
g.

Jelaskanlah arti dalam hal yang berikut, apabila regresi linier :


X = ongkos untuk keperluan iklan dalam ribuan rupiah
Y = hasil jualan karena iklan tersebut dalam ribuan rupiah

h.

Dengan menggunakan data dalam daftar berikut, tentukanlah

regresi linier untuk memperkirakan nilai ujian statistika jika diketahui


NEM matematika SMU nya diketahui.
NO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

i.

NEM Matematika SMU


40
40
41
42
43
44
45
46
47
47
48
48
49
49
50

Nilai statistika
65
66
66
67
69
72
72
73
75
76
77
78
76
80
80

Garis regresi untuk memperkirakan pengeluaran keluarga tiap

bulan guna keperluan makanan berdasarkan pendapatan keluarga tiap


bulan, dinyatakan dalam ribuan rupiah , ditentukan oleh :
^

21
Y = 185 + 1,46 X
1)

Berapakah pukul rata pengeluaran keluarga setiap bulan

guan keperluan makanan apabila pendapatan keluarga setiap


bulannya mencapai 100.000 rupiah ?
2)

Berapa ribu rupiahkah pengeluaran setiap bulan akan

bertambah, jika pendapatan naik dengan Rp. 1.000,- ?


3)
j.

Apakah keanehannya jika X = 0 rupiah ?

Dalam tempo delapan tahun, hubungan antara Produk Nasional

Kotor (Y) dengan hasil jualan tahunan minyak mentah dinyatakan oleh X
di suatu negara, ditentukan oleh : Y = -3,21 + 0,02453 X
Dengan X, Y dalam milyard unit uang di negara itu.
1)

Apakah arti 0,02453

2)

Jika hasil jualan tahunan minyak mentah mencapai harga

285 milyard unit barang, berapakah Produk Nasional Kotor di


negara itu diperkirakan untuk tahun tersebut ?

3)

Jika selanjutnya diketahui sy.x. = 0,241 dan X2i =

1.089,413 sedangkan Xi = 2.927, maka dengan koefisien


kepercayaan 0,95 tentukan batas-batas pertambahan Produk
Nasional Kotor untuk setiap milyard bertambahnya hasil jualan
minyak mentah.

k.

Apakah yang dimaksud dengan :


1)

Korelasi

2)

Koefisien korelasi

3)

Korelasi parsial

4)

Korelasi positif

5)

Korelasi negatif

6)

Korelasi Rank

22
l.

Berikan contoh masing-masing sebuah, dimana diperkirakan

akan didapat korelasi :

m.

1)

Positif

2)

Negatif

Hasil penelitian sesuatu hal menghasilkan r = 0.

Apakah ini

berarti bahwa antara variabel-variabel yang diteliti itu tidak terdapat


hubungan ?
n.

Tafsiran apakah yang dapat diperoleh jika dikatakan bahwa

koefisien korelasi antara banyak kecelakaan di pabrik tiap tahun dan


umur pegawai di pabrik itu sebesar r = -0,65
o.

Untuk soal h di atas, carilah korelasi antara NEM matematika

SMU dengan nilai ujian statistika.


p.

Dua orang ahli disuruh mencoba kecap yang dihasilkan oleh 12

perusahaan kecap. Untuk kecap yang paling enak, oleh setiap ahli diberi
nomor satu, yang kurang enak diberi nomor dua dan seterusnya.
Hasilnya diberikan dalam daftar berikut :
Ahli A
Ahli B

10
8

3
6

5
1

4
12

1
3

8
11

7
2

6
5

2
7

9
4

11
10

12
9

1)

Carilah koefisien korelasi ranknya.

2)

Selidikilah, apakah ada kesesuaian rasa kedua ahli itu ?

Anda mungkin juga menyukai