Anda di halaman 1dari 22

1

BAB V
ANALISIS REGRESI DAN KORELASI

5.1 PENGERTIAN UMUM


Banyak permasalahan yang datanya dinyatakan oleh lebih dari sebuah
variabel. Mengingat analisis kumpulan data yang terdiri atas banyak variabel
pada dasarnya merupakan perluasan dari analisis yang datanya terdiri atas dua
variabel, maka di sini terutama akan dibicarakan penelaahan kumpulan data yang
dilukiskan oleh dua variabel saja. Untuk keperluan penelaahan, kepada kedua
variabel itu digunakan simbul yang lazim dipakai, ialah X dan Y yang dapat
diberi indeks menurut keperluannya yaitu :

x1 , x2 ,..., xn dan y1 , y2 ,..., yn

Atau pasangan  xi , yi  ; i = 1,2, … , n

Sehingga sampel yang berukuran n itu terdiri atas n buah pasang data.

Contoh 5.1 :
Jika xi menyatakan banyak pengunjung ke suatu toko swalayan dan yi diartikan
orang-orang diantara pengunjung itu yang berbelanja di toko tersebut misalnya,
maka akan diteliti kumpulan data seperti dalam daftar berikut :

Tabel 5.1 : Jumlah pengunjung dan belanja di suatu toko swalayan


Pengunjung ( xi ) Yang Berbelanja ( yi )
300 156
290 151
2

345 175
419 203
378 196
353 189
435 241
361 197
394 212
436 232

Hal-hal yang akan dipelajari mengenai kumpulan data yang terdiri atas
dua variabel yaitu :
a. Mempelajari derajat asosiasi antara kedua variabel. Bagian ini
dalam statistika dikenal dengan nama ANALISIS KORELASI.
Hubungan korelasional ini tidak menjelaskan apakah suatu variabel
menjadi penyebab dari variabel yang lainnya.
b. Mempelajari hubungan yang ada di antara variabel-variabel
sehingga dari hubungan yang diperoleh dapat menaksir variabel yang
satu apabila harga variabel lainnya diketahui. Bagian ini dikenal dengan
nama ANALISIS REGRESI.

Contoh 5.2 :
a. Dari data yang tertera dalam daftar di atas, dapat dicari
hubungan yang ada antara pengunjung dan yang belanja. Jika pada
suatu hari ada 390 pengunjung, dari hubungan yang diperoleh dapat
diperkirakan ada berapa yang akan belanja di toko itu. Selain daripada
itu, juga dapat ditentukan berapa kuat jumlah pembeli ditentukan oleh
adanya pengunjung
b. Diketahui bahwa produk nasional kotor ditentukan oleh produk-
produk. Lainnya, antara lain jasa, Jika data selama waktu-waktu tertentu
diketahui, hubungan antara produk-produk nasional kotor dan jasa dapat
dihitung. Dari hubungan ini, produk nasional kotor dapat diperkirakan
jika jasa dapat diketahui.
3

5.2 ANALISIS REGRESI


Untuk menjelaskan bagaimana hubungan antara dua variabel, perhatikan
data yang tercantum dalam tabel berikut :

Tabel 5.2 : Banyak pengunjung dan belanja di suatu toko swalayan


selama 30 hari.
HARI PENGUNJUNG BELANJA HARI PENGUNJUNG BELANJA
KE (Xi) (Yi) KE (Xi) (Yi)
1 35 32 16 40 38
2 39 36 17 41 37
3 34 31 18 32 30
4 40 38 19 34 30
5 31 29 20 30 28
6 43 42 21 35 35
7 40 33 22 36 29
8 30 29 23 37 34
9 34 29 24 39 35
10 39 36 25 41 36
11 33 31 26 33 32
12 32 31 27 34 32
13 36 33 28 36 34
14 40 37 29 38 37
15 43 36 30 37 34

Dalam daftar di atas merupakan banyak pengunjung (dinyatakan dengan


Xi) dan yang berbelanja (dinyatakan dengan Yi) yang telah dicatat oleh
seseorang pengusaha di tokonya.
Kebiasaan yang digunakan dalam penentuan simbul-simbul yang lazim,
ialah Xi untuk hal yang diperkirakan lebih tepat dapat digolongkan ke dalam
variabel yang sifatnya bebas, sedangkan Yi untuk variabel yang diperkirakan
akan bergantung pada Xi. Variabel Xi disebut variabel bebas sedangkan Yi
disebut variabel tak bebas.
Representasi untuk data dalam Tabel 6.2 di atas, diagram pencarnya
dapat dilihat seperti dalam gambar berikut !
4

. .
. .
. .
. .
Gambar 5.1 : Diagram pencar dari data pada Tabel 6.2

Dengan menggunakan diagram ini dapat dilihat apakah ada sesuatu


hubungan yang berarti diantara titik-titik itu pada atau sekitar garis lurus ? Jika
demikian halnya, cukup alasan bagi kita untuk menduga bahwa antara variabel-
variabel itu ada hubungan linear. Dalam hal lainnya, antara variabel-variabel itu
diduga terdapat hubungan non linear.
Setelah diketahui bentuk hubungan antara variabel itu, tugas selanjutnya
ialah menentukan hubungan tersebut dirumuskan dalam suatu persamaan
matematis. Kemudian disusun dalam suatu persamaan garis yang
merepresentasikan persamaan matematisnya. Garis ini dikenal dengan nama garis
regresi. Jika hubungan Y = f(X) itu linear, maka garis yang didapat adalah
garis regresi linear. Dalam hal lainnya didapat regresi nonlinear.

REGRESI NON LINEAR

Gambar 5.2 : Representasi garis regresi linear dan non linear


5

Gambar di atas memperlihatkan diagram pencar untuk data dalam daftar


dengan garis lurus atau regresi linear yang diduga cocok dengan letak titik-titik
diagram. Gambar 5.2 melukiskan regresi non linear untuk sesuatu persoalan.
Oleh karena regresi linear merupakan bentuk regresi yang paling mudah
ditelaah, kecuali itu juga karena banyak regresi nonlinear yang dapat diselesaikan
dengan bantuan regresi linear, maka di sini terutama hanyalah regresi tersebut
yang akan dibicarakan.
Bagaimanakah menentukan persamaan regresi yang linear ini? Yang
paling mudah ialah dengan jalan kira-kira menurut penglihatan kita. Pada
kumpulan titik-titik itu ditarik sebuah garis lurus yang akan paling dekat titik-
titik itu berkerumun sekitar garis yang ditarik tadi. Sesudah itu ditentukan
bagaimana persamaannya.
Meskipun cara tersebut sangat mudah dilakukan namun untuk penelitian
jarang dilakukan oleh karena kecuali terlalu kasar hasilnya, juga terlalu subyektif
dan ini sedapat mungkin harus dihindarkan. Karenanya akan ditinjau cara yang
dianggap cukup baik dan sering digunakan. Cara yang dimaksud adalah
METODA KUADRAT TERKECIL. Sebelum cara ini dibicarakan, terlebih
dahulu akan ditinjau seperlunya macam-macam regresi linear yang mungkin,
sehubungan dengan variabel bebas.
Di atas dikatakan, bahwa jika variabel X yang diketahui terlebih dahulu
dan kemudian Y ditentukan berdasarkan X ini, maka ditentukan hubungan
Y=f(X). Rumusan hubungan ini lebih dikenal dengan nama Regresi Y atas X.
Jika regresi Y atas X ini linear, maka persamaannnya dapat dituliskan
dalam bentuk linear :

Y  a  bX ………(5.1)

Dengan Y berarti taksiran nilai X untuk harga Y yang diketahui.


6

Untuk menentukan koefisien-koefisien a dan b ini akan digunakan


METODA KUADRAT TERKECIL. Ternyata bahwa untuk regresi linear dalam
rumus 6.1, harga-harga a dan b dapat dihitung berdasarkan sekumpulan data
sebanyak n buah dengan menggunakan sistem persamaan :

n n

 Yi  an  b X i
i 1 i 1
n n n
.............. (5.2)
 X Y  a X
i 1
i i
i 1
i  b X i
i 1
2

Pasangan persamaan dengan dua anu a dan b ini, bentuk rumus 6.3, disebut
persamaan-persamaan normal untuk bentuk regresi dalam rumus 6.1. Setelah
diselesaikan, akan didapat harga-harga a ddan b yang dicari, yakni:

n n n n

 Yi  X i2   X i  X iYi
a i 1 i 1 i 1 i 1
2
n
  n
n X i2    X i 
i 1  i 1 
n n n
.............. (5.3)
n X iYi   X i  Yi
b i 1 i 1 i 1
2
n
  n
n X i2    X i 
i 1  i 1 

Untuk menjelaskan penggunaan rumus 5.3 di atas, sekarang ditinjau contoh


mengenai banyak pengunjung dan yang berbelanja ke sebuah toko yang datanya
tertera dalam Tabel 5.2. Dari diagram pencar gambar 5.1 mudah dilihat bahwa
titik-titik itu terletak sekitar garis lurus. Untuk menentukan regresi linear Y atas
X, maka sebaliknya dibuat sebuah daftar seperti Tabel 5.3 berikut ini.
7

Tabel 5.4 : Tabel penyelesaian persamaan regresi linear


Xi Yi Xi2 Yi2 XiYi Xi Yi Xi2 Yi2 XiYi
34 32 1156 1024 1088 40 38 1600 1444 1520
38 36 1444 1296 1368 41 37 1681 1369 1517
34 31 1156 961 1054 32 30 1024 900 960
40 38 1600 1444 1520 34 30 1156 900 1020
31 29 961 841 899 30 28 900 784 840
43 42 1849 1764 1806 35 35 1225 1225 1225
40 33 1600 1089 1320 36 29 841 841 1044
30 29 900 841 870 37 34 1156 1156 1258
33 29 1089 841 4957 39 35 1225 1225 1365
39 36 1521 1296 1296 40 36 1296 1296 1440
33 31 1089 961 1023 33 32 1024 1024 1056
32 31 1024 961 992 34 32 1024 1024 1088
36 33 1296 1289 1089 36 34 1156 1156 1224
40 37 1600 1369 1480 37 37 1369 1369 1369
42 36 1764 1296 1512 37 34 1156 1156 1258
545 503 20049 17073 18481 541 501 19651 16869 18184

Dari daftar di atas diperoleh :


n

X
i 1
i  1086
n

 Y  1044
i 1
i

X
i 1
i
2
 39700
n

 X Y  36.665
i 1
i i

Disubstitusikan harga-harga tersebut dengan rumus regresi linear dengan


mengambil n = 30, didapat :
8

1044.39700 - 1086.36665
a
30.38700 - 1086 2
a  1, 6
30.36665 - 1086.1044
b
30.39700 - 1086 2
b  0,88
Sehingga garis regresi linear yang dimaksud mempunyai persamaan :

Y  1, 6  0,88 X
Dengan menggunakan persamaan yang diperoleh ini dapat diperkirakan berapa
orang diantara pengunjung itu yang akan berbelanja, apabila jumlah pengunjung
dapat diketahui. Apabila rata-rata perjam ada 40 orang yang berkunjung ke

toko itu, maka dapat diperkirakan dari Y  1, 6  0,88 X diperoleh :

Y = 1,6 + (0,88)(40)
= 36,81 orang yang berbelanja.

5.3 REGRESI NON LINEAR


Setelah dipelajari seperlunya mengenai bentuk hubungan linear antara
dua variabel X dan Y sekarang akan diperhatikan bentuk hubungan nonlinear
antar dua variabel. Tidak akan dibicarakan secara luas dan mendalam mengenai
regresi nonlinear ini, tetapi hanya merupakan suatu tinjauan singkat saja, tinjauan
yang pada umumnya dapat ditelaah berdasarkan teori regresi linear.
Meskipun terdapat banyak sekali bentuk regresi non linear yang biasa
digunakan tetapi di sini hanyalah akan ditinjau beberapa saja yang penting dan
termudah. Untuk regresi nonlinear Y atas X yang akan ditinjau di sini, antara
lain berbentuk lengkungan :
a. Parabola kuadratis dengan persamaan Y  a  bX  cX 2
b. Parabola kubis dengan persamaan
Y  a  bX  cX 2  dX 3
c. Logaritmis dengan persamaan : Y  aX b
9

1
d. Hiperbola dengan persamaan : Y 
a  bX

5.4 REGRESI LINEAR BERGANDA


Ada banyak kenyataan bahwa pengamatan akan terdiri atas lebih dari dua
variabel. Sehingga yang harus digunakan adalah regresi dengan variabel bebas
lebih dari satu.

Contoh :
1. Harga beras tidak saja hanya ditentukan oleh adanya persediaan, tetapi juga
oleh harga bensin, upah buruh dan sebagainya.
2. Produksi telur ayam tidak saja bergantung pada banyaknya ayam petelur
yang ada saja, tetapi juga dari banyak makanan yang diberikan, umur
ayam dan barangkali masih ada faktor lainnya.

Apabila ada satu variabel terikat Y dan k variabel bebas X 1 , X 2 ,..., X k

sehingga terdapat hubungan semacam garis regresi Y atas X 1 , X 2 ,..., X k .


Dalam bagian ini akan dijelaskan secara singkat bagaimana garis regresi yang
dimaksud dapat ditentukan dan yang akan ditinjau di sini hanyalah garis regresi

Y atas X 1 , X 2 ,..., X k yang paling sederhana ialah yang dikenal dengan nama
regresi linear berganda. Persamaan umum untuk regresi linear berganda ini
adalah :

Y  a0  a1 X 1  ...  ak X k

Dimana a0 , a1 ,..., ak harus ditentukan dari data hasil pengamatan. Mudah


dilihat bahwa regresi di atas ini merupakan perluasan dari regresi linear
sederhana.
10

Pertanyaan yang timbul adalah : bagaimana koefisien-koefisien

a0 , a1 ,..., ak ditentukan ? Secara sama dengan regresi linear sederhana, maka


dipergunakan metode KUADRAT TERKECIL. Oleh karena ada k+1 parameter
yang harus dicari maka diperlukan k+1 persamaan dengan k+1 anu. Dapat
dibayangkan bahwa hal itu memerlukan metode penyelesaian yang lebih baik dan
karenanya memerlukan matematika yang lebih tinggi lebih-lebih untuk variabel
yang cukup banyak.
Untuk regresi linear berganda yang sederhana :

Y  a0  a1 X 1  a2 X 2

Misalnya kita harus menyelesaikan 3 persamaan dengan 3 anu yang berbentuk :


n n n

 Yi  na0  a1  X1i  a2  X 2i
i 1 i 1 i 1
n n n n

 Yi X1i a0  X 1i  a1  X 12i  a2  X 1i X 2i


i 1 i 1 i 1 i 1
n n n n

Y X
i 1
i 2i a0  X 2i  a1  X 1i X 2i  a2  X 22i
i 1 i 1 i 1

Untuk persamaan regresi dengan 4 variabel bebas, maka diperlukan 4 persamaan.


Demikian seterusnya.

5.5 ANALISIS KORELASI


Dalam bagian yang lalu, telah dipelajari bagaimana hubungan antara dua
variabel X dan Y dapat ditentukan. Hubungan yang diperoleh dinyatakan dalam
bentuk persamaan matematis yang dalam statistika dikenal dengan nama garis
regresi. Jika X merupakan variabel bebas dan Y variabel tak bebas, regresi Y
atas X dapat digunakan untuk meramalkan nilai Y apabila nilai X diketahui.
Dalam banyak soal, jika nilai-nilai pengamatan terdiri atas lebih dari
sebuah variabel, bukan saja regresinya yang perlu dihitung, tetapi juga kekuatan
11

hubungan antara variabel-variabel itu. Ukuran yang digunakan untuk itu adalah
koefisien korelasi.
Untuk keperluan analisis tentang korelasi ini, seperti biasa akan
dibedakan antara statistik (ialah koefisien korelasi untuk data dalam sampel) dan
parameter (untuk menyatakan koefisien korelasi populasi. Koefisien korelasi
untuk sampel, jadi merupakan statistik, akan dinyatakan dengan r sedangkan
parameternya dengan  (baca : rho).
Dalam bagian berikut ini akan diuraikan bagaimana r dihitung dan
selanjutnya akan diberikan penjelasan mengenai pengujian derajat asosiasi.

a. Koefisien Korelasi
Karena ternyata korelasi dan regresi berhubungan erat, maka
untuk menentukan ukuran asosiasi atau koefisien korelasi, perlu
terpenuhi syarat-syarat :
1) Koefisien korelasi harus besar apabila derajat asosiasi
tinggi dan harus kecil apabila derajat asosiasi rendah.
2) Koefisien korelasi harus bebas daripada satuan yang
digunakan untuk mengukur variabel.
Untuk mencapai kedua syarat di atas, maka untuk menentukan
koefisien korelasi r biasa digunakan statistik :

  X  
n

i  X Yi  Y
r i 1

 n  1 S x S y

Inilah rumus koefisien korelasi yang pertama yang disebut KOEFISIEN


KORELASI PERSON atau PRODUCT MOMENT.
Koefisien korelasi r menunjukkan apakah cukup beralasan bagi kita
untuk menyatakan ada atau tidak adanya hubungan linear antara
variabel-variabel X dan Y. Rumus lain yang juga sering dipergunakan
adalah :
12

n n n
n X iYi   X i  Yi
r i 1 i 1 i 1

 n 2  n 
2
  n  n  
2

n X i    X i    i  i  
n Y  Y
 i 1  i 1    i 1  i 1  

Dengan menggunakan perhitungan matematika, ternyata dapat


dibuktikan bahwa batas-batas koefisien korelasi itu berada dalam
daerah / interval :
-1  r  1
Tanda positif menyatakan bahwa antara variabel-variabel itu terdapat
korelasi positif atau korelasi langsung yang berarti nilai variabel X yang
kecil berpasangan dengan nilai variabel Y yang kecil serta nilai variabel
X yang besar berpasangan dengan nilai variabel Y yang besar pula.
Korelasi positif menunjukkan letak titik-titik dalam diagram
pencar berada sekitar garis lurus yang koefisien arahnya positif. Makin
dekat letak titik-titik itu pada garis lurus, makin kuatlah korelasi positif
itu dan harganya makin dekat kepada satu.
Jika titik-titik itu terletak pada garis lurus yang arahnya positif,
akan diperoleh harga r = +1.

r = +1 r = -1

Jika variabel X yang besar berpasangan dengan Y yang kecil dan


jika X kecil berpasangan dengan Y yang besar, akan diperoleh Korelasi
negatif atau korelasi invers.
13

Dilihat dari diagram pencarnya, letak titik-titik akan berada


sekitar sebuah garis lurus yang koefisien arahnya negatif. Makin dekat
letak titik-titik itu pada garis yang dimaksud, makin dekat pula nilai r
kepada -1. Dan akhirnya jika titik-titik itu terletak pada garis lurus yang
koefisien arahnya negatif didapat harga r = -1.
Dalam prakteknya jarang sekali didapatkan diagram pencar yang
letak titik-titiknya pada sebuah garis lurus seperti dalam gambar di atas
sangat jarang. Yang sering didapati adalah bentuk yang menyebabkan
nilai koefisien korelasi tidak sama dengan 1 atau -1. Makin terpencar
letak titik-titik itu dari sebuah garis lurus, makin dekatlah r kepada nol.
Setelah dikenal apa arti koefisien korelasi, masih ada ukuran lain
yang sebenarnya lebih mudah untuk ditafsirkan dalam penggunaannya.
Ukuran tersebut ialah yang dinamakan koefisien determinasi yang tiada
lain daripada kuadrat koefisien korelasi. Jadi :
Koefisien Determinasi = r2
Karena sudah diketahui bahwa koefisien korelasi berada -1  r  +1,
maka tentulah koefisien determinasi mulai dari nol sampai dengan 1,
atau :
0  r2  1
Koefisien determinasi biasanya dinyatakan dengan persen. Sedangkan
penafsirannya adalah jika r = 0,94 sehingga r 2 = 0,8836 atau 88,36%
maka ditafsirkan sebagai 88,36% variasi suatu variabel yang disebabkan
oleh variabel lainnya.
Koefisien determinasi banyak digunakan dalam penjelasan tambahan
untuk hasil perhitungan koefisien regresi.

b. Menghitung r Untuk Data Berkelompok


Rumus-rumus di atas adalah rumus-rumus untuk menentukan r
apabila datanya massih belum disusun dalam daftar distribusi frekuensi.
Rumus-rumus tersebut pula cukup menyenangkan untuk digunakan
apabila datanya tidak terlalu banyak. Jika data yang sedang dicari
14

korelasinya itu banyak sekali, dengan menggunakan rumus-rumus


tersebut akan memakan waktu yang lama dari perhitungannya. Oleh
karena itu perlu ada usaha untuk mempersingkatnya. Jalan yang lazim
ditempuh ialah terlebih dahulu menyusun data ke dalam daftar distribusi
frekuensi. Oleh karena kita sedang berhadapan dengan penelitian yang
terdiri atas dua variabel, maka kitapun akan memperoleh dua distribusi
frekuensi. Kedua distribusi frekuensi ini harus disajikan dalam daftar
yang berklasifikasi dua, sedemikian sehingga dampaknya banyak seperti
daftar kontingensi. Banya baris sesuai dengan banyak kelas interval
distribusi frekuensi variabel yang satu, sedangkan banyak kolom sesuai
dengan banyak kelas interval dari distribusi frekuensi variabel kedua.
Untuk variabel yang satu, yang terdapat dalam baris, kelas-kelas
intervalnya mulai dari atas ke bawah disusun seperti biasa, yakni dari
data yang kecil hingga yang paling besar. Variabel yang terdapat dalam
kolom, kelas-kelas intervalnya dari kiri ke kanan yang dimulai dari data
yang kecil hingga yang besar.
Frekuensi data dalam daftar ini akan didapati dalam tiap-tiap sel.
Jadi frekuensi dalam setiap sel merupakan banyak data yang ada dalam
kelas interval variabel yang satu dan juga yang ada dalam kelas interval
variabel yang lain.

Contoh :
Berikut data gaji tentara (data fiktif, tahun 95) beserta pengeluarannya
untuk keperluan rekreasi bersama keluarga.

Daftar gaji tentara dan pengeluaran untuk wisata


(dalam puluhan ribu rupiah)

Gaji 30-39 40-49 50-59 60-69 70-79 80-89 90-99 jumlah


wisata
15

0,00-0,99 1 1
1,00-1,99 2 3 1 6
2,00-2,99 1 2 10 2 15
3,00-3,99 5 6 5 1 1 1 19
4,00-4,99 2 4 3 2 1 12
5,00-5,99 1 10 6 2 19
6,00-6,99 2 5 2 2 11
7,00-7,99 1 1 2
Jumlah 4 10 19 14 19 12 7 85

Dari daftar dapat dilihat bahwa ada 4 tentara dengan gaji Rp. 300.000
sampai dengan Rp. 400.000 sebulannya, dengan pengeluaran untuk
wisata masing-masing 1 orang Rp. 0 sampai dengan Rp. 99.000.
Sekarang persoalannya adalah bagaimana menentukan koefisen korelasi
antara keduanya ?
Untuk itu dipergunakan rumus berikut :

    
n   f uv     f x u    f y v 
r     

 
2

     
2

n f x u 2    f xu   n  f uv 2 -   f uv  

    
   

dimana :
u = koding untuk variabel X
v = koding untuk variabel Y
fx = frekuensi kelas interval dari variabel X
fy = frekuensi kelas interval dari variabel Y
f = frekuensi dalam tiap sel
n = banyak data.
Sekarang dipergunakan peerumusan di atas.

Gaji tentara
x 34,5 44,5 54,5 64,5 74,5 84,5 94,5
Y u -3 -2 -1 0 1 2 3 fy fyv fyv2 Fuv
0,495 -3 1 1 -3 9 9
16

1,495 -2 2 3 1 6 -12 24 26
2,495 -1 1 2 10 2 15 -15 15 17
3,495 0 5 6 5 1 1 1 19 0 0 8
4,495 1 2 4 3 2 1 12 12 12 8
5,495 2 1 10 6 2 19 38 76 56
6,495 3 2 5 2 2 11 33 99 45
7,495 4 1 1 2 8 32 20
fx 4 10 19 14 19 12 7 85 61 267 181
fxu -12 -20 -19 0 19 24 24 21
fxu2 36 40 19 0 19 48 63 63
sama
fuv 24 16 10 0 38 48 45 45

Untuk variabel x, telah diambil koding u = 0 yang sesuai dengn tanda


kelas 64,5 dan untuk variabel Y diambil koding v = 0 sesuai dengan
tanda kelas 3,495. Koding-koding lainnya diambil seperti biasa, yakni
untuk tanda kelas yang makin kecil berturut-turut -1, -2, -3, …..
sedangkan untuk tanda kelas yang makin besar +1, +2, +3, … Harga-
harga fxu didapat dengan mengalikan fx = 4 kali u = -3, fxu = -20 dari fx =
10 kali u = -2 dan seterusnya. Demikian pula fyv = 3 didapat dari fy = 1
kali v = -3, fyv = -12 didapat dari fy = 6 kali v = -2 dan seterusnya.
Nilai fxu2 diperoleh dengan mengalikan fxu dengan u, nilai fyv2 adalah
hasil kali fyv dengan v dan seterusnya.
Dengan demikian, nilai r adalah :
85. 181 - 13. 61
r =
{85.225 - 132} {85.267 - 612}

r = 0,77

Angka ini menyatakan kuatnya hubungan antara gaji bulanan tentara dan
pengeluaran untuk pariwisata.

c. Korelasi Rank
Ada kalanya ingin diketahui korelasi antara dua variabel tidak
berdasarkan pada pasangan data dimana nilai sebenarnya diketahui.
Umpamanya saja, kita telah melakukan penelitian mengenai tingkatan
17

menyenangi merk sepatu olahraga bagi prajurit A dan prajurit B anggota


TNI AL. Hasilnya dinyatakan dalam tabel di bawah ini. Untuk sepatu
yang paling disukai, diberi nilai 1 dan yang paling tidak disukai diberi
nilai 10. Urut-urutan nilai tersebut dinamakan RANK. Berdasarkan
rank tersebut, dapatlah ditentukan hubungan / korelasi antara keddua
variabel. Ukuran yang diperoleh biasa dinamakan koefisien korelasi
rank atau biasa juga dikenal dengan koefisien korelasi spearman dan
disimbulkan dengan r' (baca : er - aksen) untuk membedakan dengan
koefisien korelasi yang sudah dikenal.

Merk sepatu Prajurit A Prajurit B


1 2 3
Adidas 1 2
Lotto 2 3
Speck 3 1
Spotex 5 4
New Era 4 5
Jet 6 6
Niel 8 9
Pioneer 9 7
Crown 7 8
Best 10 10

Rumus untuk menghitung koefisien korelasi spearman adalah:

n
6 di2
r  1 i 1

n  n  1
2

dengan di = selisih tiap pasang rank


n = banyaknya pasangan data
Sehingga dengan menggunakan rumus di atas, persoalan kesukaan
terhadap sepatu merk tertentu dapat dicari koefisien korelasinya, sebagai
berikut :
18

Rank A 1 2 3 5 4 6 8 9 7 10
Rank B 2 3 1 4 5 6 9 7 8 10
di -1 -1 2 1 -1 0 -1 2 -1 0 Jml
di2 1 1 4 1 1 0 1 4 1 0 14

6.14
r  1
10(100  1)
r' = 0,015

d. Korelasi Berganda
Korelasi berganda merupakan korelasi dari beberapa variabel
bebas secara serentak dengan variabel terikat
Misalkan ada k variabel bebas, X 1 , X 2 ,..., X k dan satu variabel terikat

Y dalam suatu persamaan regresi linear Y  a0  a1 X 1  ...  ak X k


maka besarnya korelasi bergandanya adalah :
a1  x1 y  a2  x2 y  ...  ak  xk y
ry , x1 ,..., xk 
y 2

dengan

 x y   X Y   n
X1 Y
1 1

x y X Y   
X Y k
k k
n
 Y 
2

 y2   Y 2  n

e. Korelasi Parsial
Korelasi parsial adalah korelasi antara sebuah variabel tak bebas
dengan sebuah variabel bebas tertentu dengan variabel-variabel bebas
lain dianggap tetap / konstan.
Koefisien korelasi parsial dinyatakan dengan perumusan :
Untuk dua variabel bebas :
19

Korelasi parsial Y dengan X 1 dengan X2 dianggap konstan adalah :

rYX1  rYX 2 rX1 X 2


rYX1 . X 2 
 1 r  1 r 
2
YX 2
2
X1 X 2

Korelasi parsial Y dengan X 2 dengan X1 dianggap konstan adalah :

rYX 2  rYX1 rX1 X 2


rYX 2 . X1 
 1 r   1 r 
2
YX 1
2
X1 X 2

5.6 SOAL-SOAL

a. Berikan contoh dimana ramalan akan diperlukan !


b. Apakah yang dimaksud dengan :
1) regresi linear
2) regresi nonlinear
3) regresi linear X atas Y
4) regresi linear Y atas X
5) metode kuadrat terkecil
6) persamaan normal suatu regresi
7) simpangan baku bersyarat
8) regresi linear berganda
c. Jelaskan mengenai perbedaan antara regresi linear dan non linear
d. Dalam uraian yang mengenai hampir seluruhnya hanya ditinjau
tentang regresi Y atas X. Untuk mendapatkan uraian tentang regresi X
atas Y, tinggallah menukarkan variabel-variabel X dan Y. Sejalan
dengan ini, regresi X atas Y, cobalah tuliskan rumuss yang sesuai.
e. Dalam hal yang berikut, sebutkan apakah taksiran rata-rata atau
taksiran nilai individu yang diperlukan :
20

1) bagaimanakah jualan tahun yang akan datang, apabila


untuk tahun itu diketahui produk nasional kotor yang
diharapkan ?
2) Orang - orang dengan pendapatan Rp 1000.000,00 tiap
bulan berapa dapat menyediakan uangnya untuk keperluan
sosial ?
f. Perhatikanlah regresi linier dalam rumus x =  + X. Apakah
artinya kalau  = 0 ?
g. Jelaskanlah arti  dalam hal yang berikut, apabila regresi linier :
X = ongkos untuk keperluan iklan dalam ribuan rupiah
Y = hasil jualan karena iklan tersebut dalam ribuan rupiah
h. Dengan menggunakan data dalam daftar berikut, tentukanlah
regresi linier untuk memperkirakan nilai ujian statistika jika diketahui
NEM matematika SMU nya diketahui.

NO NEM Matematika SMU Nilai statistika


1 40 65
2 40 66
3 41 66
4 42 67
5 43 69
6 44 72
7 45 72
8 46 73
9 47 75
10 47 76
11 48 77
12 48 78
13 49 76
14 49 80
15 50 80

i. Garis regresi untuk memperkirakan pengeluaran keluarga tiap


bulan guna keperluan makanan berdasarkan pendapatan keluarga tiap
bulan, dinyatakan dalam ribuan rupiah , ditentukan oleh :
^

Y = 185 + 1,46 X
21

1) Berapakah pukul rata pengeluaran keluarga setiap bulan


guan keperluan makanan apabila pendapatan keluarga setiap
bulannya mencapai 100.000 rupiah ?
2) Berapa ribu rupiahkah pengeluaran setiap bulan akan
bertambah, jika pendapatan naik dengan Rp. 1.000,- ?
3) Apakah keanehannya jika X = 0 rupiah ?
j. Dalam tempo delapan tahun, hubungan antara Produk Nasional
Kotor (Y) dengan hasil jualan tahunan minyak mentah dinyatakan oleh X
di suatu negara, ditentukan oleh : Y = -3,21 + 0,02453 X
Dengan X, Y dalam milyard unit uang di negara itu.
1) Apakah arti 0,02453
2) Jika hasil jualan tahunan minyak mentah mencapai harga
285 milyard unit barang, berapakah Produk Nasional Kotor di
negara itu diperkirakan untuk tahun tersebut ?
3) Jika selanjutnya diketahui sy.x. = 0,241 dan  X2i =
1.089,413 sedangkan  Xi = 2.927, maka dengan koefisien
kepercayaan 0,95 tentukan batas-batas pertambahan Produk
Nasional Kotor untuk setiap milyard bertambahnya hasil jualan
minyak mentah.

k. Apakah yang dimaksud dengan :


1) Korelasi
2) Koefisien korelasi
3) Korelasi parsial
4) Korelasi positif
5) Korelasi negatif
6) Korelasi Rank
l. Berikan contoh masing-masing sebuah, dimana diperkirakan
akan didapat korelasi :
1) Positif
22

2) Negatif
m. Hasil penelitian sesuatu hal menghasilkan r = 0. Apakah ini
berarti bahwa antara variabel-variabel yang diteliti itu tidak terdapat
hubungan ?
n. Tafsiran apakah yang dapat diperoleh jika dikatakan bahwa
koefisien korelasi antara banyak kecelakaan di pabrik tiap tahun dan
umur pegawai di pabrik itu sebesar r = -0,65
o. Untuk soal h di atas, carilah korelasi antara NEM matematika
SMU dengan nilai ujian statistika.
p. Dua orang ahli disuruh mencoba kecap yang dihasilkan oleh 12
perusahaan kecap. Untuk kecap yang paling enak, oleh setiap ahli diberi
nomor satu, yang kurang enak diberi nomor dua dan seterusnya.
Hasilnya diberikan dalam daftar berikut :
Ahli A 10 3 5 4 1 8 7 6 2 9 11 12
Ahli B 8 6 1 12 3 11 2 5 7 4 10 9

1) Carilah koefisien korelasi ranknya.


2) Selidikilah, apakah ada kesesuaian rasa kedua ahli itu ?

Anda mungkin juga menyukai