Anda di halaman 1dari 19

REGRESI DAN KORELASI SEDERHANA

By Dr. Suminah, M.Si.


Prodi PKP, FP, UNS

8.1 Pengantar Regresi

Dalam kondisi sehari-hari kita sering menjumpai adanya hubungan antara satu
variabel dengan variabel yang lainnya. Sebagai contoh tingkat pendidikan seseorang
berhubungan dengan gaji yang diperolehnya, dalam bidang pemasaran kita ketahui adanya
hubungan antara volume penjualan dengan biaya advertensi, di bidang pertanian kita
ketahui adanya hubungan antara dosis pupuk yang diberikan dengan hasil yang diperoleh
(produksi). Hubungan antara dua atau lebih variabel tersebut dapat dilihat dari bentuk
hubungan dan keeratan hubungan. Bila ingin diketahui bentuk hubungan antara dua
variabel atau lebih, digunakan analisis korelasi. Sedangkan regresi menunjukkan bentuk
hubungan antara variabel yang satu dengan variabel yang lainnya. Korelasi menjelaskan
besarnya derajat keeratan atau tingkat hubungan antara variabel yang satu dengan variabel
yang lainnya. Pada bagian VIII ini, pembahasan dibatasi hanya pada hubungan linear dari
dua variabel yang biasa disebut sebagai regresi sederhana dan analisis korelasi sederhana.
Suatu cara untuk menentukan atau mencari bentuk atau fungsi yang paling cocok
yang menunjukkan hubungan antara variabel yang satu dengan variable yang lainnya.
Regresi juga sering dikatakan sebagai teknik statistika yang berguna untuk memeriksa dan
memodelkan hubungan diantara variabel (terapannya biasanya dikaitkan dengan studi
ketergantungan suatu variabel bebas (independent) pada variabel terikat (dependent).
Regresi diperlukan jika kita ingin mempelajari secara kuantitatif, hubungan antara
berbagai kejadian, yang dapat berupa kumpulan titik-titik yang dapat dihubungkan oleh
garis atau kurva tertentu yang disebut garis regresi, bentuknya bisa linier positif, linier
negatif. kuadratik, kubik, logaritmik, eksponensial dan bahkan bisa tidak ada hubungan.

Regresi linier mempelajari hubungan dalam bentuk garis lurus antara 2 variabel,
dan bertujuan untuk mempelajari hubungan linier antara 2 variabel X dan Y yang biasa
disebut regresi sederhana. Tujuan utamanya adalah bagaimana menghitung suatu
perkiraan atau prediksi dengan persamaan regresi yang akan menjelaskan hubungan di
antara 2 variabel tersebut.

1
8.2 Diagram Pencar (Scatter Diagram)

Pengaruh logis yang telah ditetapkan diantara variabel bebas dan variabel
terikat yang dibangun berdasarkan teori maupun hasil kajian sebelumnya, jika sudah
diperoleh data, selanjutnya untuk mendukung analisis dapat kita gunakan grafik
diagram pencar yang menunjukkan titik-titik tertentu. Setiap titik memperlihatkan
suatu hasil yang kita nilai sebagai variabel bebas dan variabel terikat. Penggunaan
diagram pencar ini dapat membantu menunjukkan arah hubungan dan dapat membantu
menetapkan jenis persamaan yang menunjukkan pengaruh maupun hubungan antara
kedua variabel tersebut.

Gambar 1. Contoh Diagram Scatter Linier Positif


Apabila variabel X dan Y berhubungan sebab akibat, dengan variabel X sebagai
variabel independent (variabel bebas, variabel yang nilainya mempengaruhi variabel tidak
bebas), dan variabel Y sebagai variabel dependent (variabel tak bebas, variabel yang
nilainya dipengaruhi oleh variabel bebas). Untuk itu jika nilai variabel X diketahui, nilai
tersebut dapat dipergunakan untuk memperkirakan nilai variabel Y jika bentuk hubungan
kedua variabel tersebut diketahui. Untuk mengetahui pola hubungan yang mungkin
terbentuk dari dua variabel X dan Y dapat dipergunakan Scatter diagram tersebut.
Dari diagram scatter dapat diperoleh informasi tentang bentuk hubungan antara
dua variabel X dan Y dengan melihat macam pola yang terbentuk. Selain memberikan

2
informasi tentang bentuk hubungan dari kedua variabel, pola yang terbentuk juga dapat
menggambarkan keeratan hubungan dari kedua variabel tersebut.
Dari contoh diagram scatter pada gambar di atas dapat diberikan penjelasan
sebagai berikut:
1) Hubungan kedua variabel tersebut adalah positif karena peningkatan nilai X juga
diikuti peningkatan nilai Y (searah).
2) Derajat atau tingkat hubungan kedua variabel X dan Y sangat erat (titik-titik yang
menunjukkan pertemuan nilai X dan Y mendekati garis lurus).
3) Hubungan kedua variabel adalah linier, karena titik-titik yang menunjukkan pertemuan
nilai X dan Y tersebut dapat menggambarkan garis lurus.
Mendasarkan pada pola hubungan antara X dan Y yang diperoleh dari scatter
diagram maka secara garis besar sifat hubungan antara variabel independent (X) dan
variabel dependent (Y) dapat diklasifikasikan sebagai hubungan linier dan hubungan
non linier. Sifat hubungan yang non linier justru banyak terjadi dalam masalah-masalah
ekonomi, meskipun demikian pembahasan pada bagian ini dibatasi hanya pada
hubungan yang linier.
Bentuk diagram scatter pola hubungannya bisa menunjukkan arah yang
berlawanan (negatif), karena dengan peningkatan nilai X, terjadi penurunan nilai Y,
seperti contoh pada Gambar 2.
Diagram scatter pola hubungannya juga bisa tidak berbentuk (tidak ada
hubungan antara variabel X dan Y), artinya setiap kenaikan nilai X tidak selalu diikuti
oleh naiknya atau turunnya nilai Y, kadang bisa naik kemudian turun, naik lagi dan
seterusnya. Pola yang tidak ada hubungan dapat dilihat pada Gambar 3.

Gambar 2. Contoh Diagram Scatter Linier Negatif

3
y

Gambar 3. Contoh Diagram Scatter Tidak Ada


Hubungan X dan Y

8.3 Regresi Linier Sederhana

Regresi menunjukkan bentuk hubungan antara variabel yang satu dengan variabel
yang lainnya. Sedangkan analisis regresi adalah:
1) Teknik statistika yang berguna untuk memeriksa dan memodelkan hubungan diantara
variabel (terapannya biasanya dikaitkan dengan studi ketergantungan suatu variabel
bebas pada variabel terikat.
2) Suatu cara untuk menentukan atau mencari bentuk fungsi yang paling cocok yang
menunjukkan hubungan antar variabel.
3) Diperlukan jika kita ingin mempelajari secara kuantitatif, hubungan antara berbagai
kejadian.
4) Berupa kumpulan titik-titik yang dapat dihubungkan oleh garis/kurva tertentu yang
disebut garis regresi (linier, kuadratik, logaritmik, eksponensial kubik, dll).
5) Merupakan suatu alat analisis yang digunakan untuk mengestimasi/memprediksi nilai
suatu variabel berdasarkan nilai variabel yang lain.
Sebagai ilustrasi dapat kita gambarkan hubungan antara penggunaan dosis pupuk
dengan produksi sebagai berikut:

4
Ilustration

produksi ( xi , y i )

15
y = a + bx

10 b (  )  slope (delta/y)

(  )a

1 kw 2 kw 3 kw

Intercep dosis pupuk

Gambar 4. Pengaruh Dosis Pupuk Terhadap Produksi

Dari gambar di atas dapat kita lihat bahwa regresi merupakan suatu alat analisis
yang digunakan untuk mengestimasi/memprediksi nilai suatu variabel berdasarkan nilai
variabel yang lain. Regresi linier sederhana mempelajari hubungan dalam bentuk garis
lurus antara 2 variabel, variabel bebas dan variabel terikat, dengan model populasi regresi
linier sederhana Yi   o   i xi   i , yang kemudian diformulakan menjadi persamaan

regresi populasi regresi linier sederhana Yi     xi   j , dimana

i = 1,2, …., n
xi, x2, …., x3 adalah variabel kontrol,
єj adalah komponen sisaan yang tidak diketahui nilainya
alpha (α) dan betha (β) adalah parameter yang nilainya tidak diketahui sehingga diduga
menggunakan statistik sampel.
Dalam persamaan regresi di atas, komponen sisaan (galat) merupakan komponen
yang dapat menunjukkan:
1) Pengaruh dari berbagai variabel yang tidak dimasukan dalam persamaan regresi karena
berbagai pertimbangan.
2) Penetapan persamaaan matematika yang tidak sempurna.

5
3) Kesalahan pengukuran dalam pengumpulan dan pemprosesan data hasil observasi.
Model populasi linier tersebut dapat di duga dengan metode kuadrat terkecil (Least
Square Method) yaitu meminimumkan selisih kuadrat antara Y observasi dan Y dugaan.

Model sampelnya adalah yˆ i  a  bxi dimana


a adalah penduga bagi intersep (α), bilangan konstanta
b adalah penduga bagi koefisien regresi/slope (β) yaitu kemiringan dari garis regresi
(kenaikan atau penurunan Y untuk setiap perubahan satu satuan X) atau koefisien regresi,
mengukur besarnya pengaruh X terhadap Y untuk X naik satu unit.
xi adalah nilai tertentu dari variabel bebas
ŷ adalah nilai yang diukur/dihitung pada variabel terikat.

8.4. Metode Kuadrat Terkecil (The Method of Least Squares)


Untuk Menentukan Ketepatan Garis Estimasi

Metode kuadrat terkecil adalah metode yang digunakan untuk menentukan garis
estimasi yang terbaik berdasarkan kriteria menghasilkan nilai Σe i2 yang sekecil mungkin.
Garis estimasi yang tepat (best fitting) adalah garis yang menghasilkan penyimpangan
nilai dalam garis estimasi dengan nilai data observasi sekecil mungkin. Untuk dapat
memperoleh garis estimasi yang tepat, harus dapat diperoleh penduga nilai β0 dan β1
sedemikian rupa sehingga tujuan di atas dapat dicapai. Permasalahan tersebut dapat di
atasi dengan menggunakan metode kuadrat terkecil.
Apabila a dan b merupakan penduga β0 dan β1, maka formula yang digunakan
untuk menemukan nilai a dan b yang dapat menghasilkan garis regresi terbaik
berdasarkan metode kuadrat terkecil adalah sbb:
S XY
b 
S XX

a  Y  bx

X 
X i

Y 
Y i

6
( X i ) 2
SXX   ( X i  X )   X i 
2 2

n
( Yi ) 2
SYY   (Yi  Y )   Yi 
2 2

n
( X i )( Yi )
SXY   ( X i  X )(Yi  Y )   X iYi 
n

Dimana, a = intercep
b = slope garis regresi

x = mean nilai variabel independent


Y = mean nilai variabel dependent
n = jumlah pengamatan

Persamaan estimasi yang terbentuk adalah yˆ  a  bxi , sedangkan slope garis regresi
dengan notasi b disebut koefisien regresi dan a disebut konstanta (intersep). Selisih antara
nilai data observasi (Yi) atau nilai yi^ dugaan disebut error yang dinotasikan dengan e
atau residual, sehingga

ei = Yi - yˆ  a  bxi
Jumlah kuadrat error = SSE = Σei2 = SYY – (S2 XY/SXX), sebagai penduga variance 2

adalah S2= SSE/(n-2).

Contoh Aplikasi

Seorang pengusaha jamu herbal ingin mengetahui hubungan antara umur mesin
pemotong simplisia dengan biaya perawatannya. Setelah diadakan pengamatan, diketahui
hubungan antara umur mesin dengan biaya perawatan sbb:
Tabel 8.1 Biaya Perawatan Mesin
No. Seri Mesin Umur Mesi (Th) Biaya Reparasi (Rp)
B 001 XY 5 3,1
B 002 VB 11 4
C 043 BN 4 3
B 901 JK 5 3,4
D 100 BC 3 2,5
V 202 VB 2 2

7
Berdasarkan informasi tersebut dapat dilakukan estimasi garis regresi berdasarkan
metode kuadrat terkecil sbb:
Tabel 8.2 Input Perhitungan Persamaan Regresi
Umur (X) Biaya perawatan XY X2 Y2
(Y)
5 3,1 15,5 25 9,61
11 4 44,0 121 16
4 3 12,0 16 9
5 3,4 17,0 25 11,53
3 2,5 7,5 9 6,25
2 2 4 4 4
ΣX=30 ΣY= 18 ΣXY=100 ΣX2= 200 ΣY2=56,42

X
x i

30
 5 dan Y 
 Yi  18  3
n 6 n 6
SXX = 200 – (30)2/6 =50
SYY = 56,42 –(18)2/6 =2,42
SYX = 100 – (30) (18)/6 = 10
SXY 10
b = -------- = -------- = 0,2
SXX 50

a = Y  b x  3  (0,2)(5)  2

Dari hasil tersebut diperoleh persamaan regresi:

yˆ  2  0,2 x dengan menggunakan persamaan regresi yang diperoleh tersebut,


pengusaha dapat melakukan estimasi biaya perawatan mesin yang harus dikeluarkannya
berdasarkan umur masing-masing mesin. Seandainya mesin berumur 8 tahun, maka X = 8
 yˆ  2  0,2(8)  3,6 , dari hasil ini dapat diketahui perkiraan biaya perawatan bagi
mesin yang berumur 8 tahun adalah sebesar Rp 3.600.000,- . Untuk mencari nilai b dan a
juga dapat digunakan rumus di bawah ini:
n(xy)  (x)(y )
b
n(x 2 )  (x) 2

8
y  b(x)
a
n

8.5 Standard Error Estimasi

Langkah berikutnya adalah mengukur ketepatan persamaan estimasi, dengan


standard error estimasi yang dinotasikan dengan Se. Standard error estimasi adalah
standard deviasi yang digunakan untuk mengukur penyebaran nilai observasi di sekitar
garis regresi. Fungsinya hampir sama dengan standart deviasi digunakan untuk mengukur
penyebaran dari kumpulan nilai observasi dengan bertitik tolak pada mean, sedangkan
standard error estimasi bertitik tolak pada garis regresi. Standard error estimasi dapat
dicari menggunakan rumus sbb:

Se  Se2
SSE
Se 2 
(n  2)
S 2 XY
SSE  SYY 
( SXX )
Dalam rumus tersebut sebagai pembagi adalah n-2 bukannya n, hal ini karena
dalam estimasi regresi menggunakan 2 derajat bebas (degrees of freedom n-2).

Contoh Aplikasi

Melihat kembali pada contoh soal mesin pemotong simplisia yang berusaha
memprediksi terhadap biaya perawatan tiap mesin dengan melihat masa pakainya, telah
ditemukan persamaan estimasi sbb:
yˆ  2  0,2 x
SSE = 2,42 –(102)/50 = 0,42
Se2 = 0,42 / (6-2) = 0,105
Se =√ 0,105 = 0,324
Standard error juga bisa dihitung dengan menggunakan rumus:

( y  y ) 2
Se 
n2

9
Semakin tinggi nilai Se, berarti kesalahan pendugaan smakin tinggi standard
error koefisien regresinya, semakin tersebar nilai observasi yang berada di sekitar garis
regresi, atau sebaliknya semakin kecil nilai Se, maka penyebaran nilai observasi akan
mendekati garis regresi. Apabila Se = 0 berarti tidak ada penyebaran atau semua nilai
observasi terletak pada garis regresi sehingga garis regresi yang terbentuk dapat
digunakan secara sempurna untuk mengadakan prediksi nilai variabel dependent.

8.6 Inferensia Terhadap Koefisien Regresi

Persamaan estimasi yang telah kita bahas sebelumnya didasarkan pada data
sampel. Kemudian hasil yang kita peroleh dapat digunakan untuk mengestimasi
persamaan populasi Yi     xi   j . Slope sampel b akan terletak di sekitar nilai β1

sehingga kita membutuhkan suatu pengukuran variasi slope. Ukuran variasi tersebut
disebut standard error koefisien regresi. Karena koefisien regresi mempunyai notasi b,
maka standard error koefisien regresi ini juga diberi notasi Sb dan rumusnya:
Se
Sb 
SXX
Untuk menguji hipotesis nilai β1 jika n < 30 digunakan di distribusi t, dan jika n >
30 menggunakan distribusi Z.

b  1 b  1
t Z
Sb Sb
Berkaitan dengan garis regresi, pengujian hipotesis bukan mengenai garis
regresinya tetapi mengenai nilai β yaitu slope dari garis regresi populasinya. Seperti sudah
dijelakan di depan bahwa untuk mengestimasi β kita gunakan b yang dihitung dari data
sampel dengan methode least squares. Hipotesis nol yang akan diuji adalah β = 0, artinya
tidak ada hubungan antara 2 variabel.

Contoh Aplikasi

Misalnya koefisien regresi b dalam persamaan estimasi yˆ  a  bx sama dengan

0, maka nilai yˆ  a untuk semua nilai X, hal ini berarti semua nilai X akan
menghasilkan nilai Y^ yang sama sehingga variabel X dan Y tidak mempunyai hubungan.

10
Untuk menyatakan permasalahan tersebut dapat dibuat hipotesis β1 = 0. Kriteria
penerimaannya adalahsbb:
1) Ho : β1 = 0
Ho : β1 = 0
Ho diterima jika -t /2 (db) < t < t /2 (db)
2) Ho : β1 = 0
Ho : β1 < 0
Ho diterima jika t > t (db)
3) Ho : β1 = 0
Ho : β1 > 0
Dengan biaya perawatan mesin, Ho diterima jika t < t (db)
Dengan menggunakan uji t, pengujian statistik terhadap hipotesis jika nilai β1 = 0
adalah:

b  1 b
t menjadi t
Sb Sb

Dengan melihat kembali persoalan hubungan antar umur mesin dengan biaya
perawatan mesin, dimana n = 6, s = 0,324 , = 0,2 maka untuk menentukan apakah
variabel X dan Y mempunyai hubungan pada tingkat signifikasi 5 % dapat dipergunakan
penyelesaian sebagai berikut:
1) Dengan asumsi menggunakan uji dua sisi maka dapat dirumuskan hipotesis,
Ho : β1 = 0
Ho : β1 = 0
2) n < 30, maka menggunakan distribusi t, dengan = 0,05 dan /2 = 0,025 serta db =
6-2 =4, diperoleh t0,025 db 4 = 2,78 sehingga kriteria penerimaan Ho adalah
-2,78 < t < 2,78.
3) untuk menemukan nilai t-test perlu diketahui nilai dari standard error koefisien regresi
(Sb) sbb:
Se
Sb  0,324
SXX Sb   0,046
50

b
t
Sb 11
0,2
t  4,35
0,046

4) Pada tingkat signifikansi 5%, keputusannya adalah Ho ditolak karena t-test (4,35) >
2,78 sehingga dapat ditarik kesimpulan bahwa umur mesin mempunyai hubungan
dengan biaya perawatan.
5) Pendekatan estimasi interval untuk slope populasi β1 dapat diselesaikan dengan rumus:
b- t /2 (db) Sb < β1 < b + t /2 (db) Sb, sehingga melanjutkan contoh soal di atas
diperoleh estimasi interval terhadap nilai β1 ,
0,2 – (2,78) (0,046) < β1 < 0,2 + (2,78) (0,046)
0,072 < β1 < 0,329
Pada contoh umur mesin dengan biaya perawatan, dengan menggunakan tingkat
kepercayaan 95% nilai β1 terletk antara nilai 0,072 sd 0,329, artinya jika umur mesin
tambah 1 tahun maka biaya perawatannya akan naik antara Rp 72.000 sd Rp 329.000,-.

SOAL LATIHAN
1) Angka-angka di bawah ini menunjukkan nilai-nilai ujian statistik ilmu sosial (Sisos)
dan manajemen bisnis (Manbis) dari 12 orang mahasiswa :
Sisos 74 93 55 41 23 92 64 40 71 33 30 71
Manbis 81 86 67 35 30 100 55 52 76 24 48 87
a. Gambarkan scatter diagramnya.
b. Hitung garis regresinya, dengan nilai statistik sebagai variabel independen.
c. Hitung garis regresinya, dengan nilai manbis sebagai variabel independen.
d. Hitung garis regresinya, dengan nilai statistik 60 berapakah nilai manajemen bisnis
yang diharapkan.
e. Apakah seorang mahasiswa mendapatkan nilai manbis 70 berapakah nilai sisos yang
diharapkan.
f. Hitung standard error of estimate.
2) Besarnya biaya promosi dan besarnya volume penjualan barang yang dipromosikan
dari suatu perusahaan selama 5 semester, ditunjukkan sebagai berikut :
Tabel 8.3 Volume Penjualan
Semester Biaya Promosi Volume Penjualan
1 2 40

12
2 3 40
3 4 50
4 5 70
5 6 50
a. Cari persamaan regresi dari hubungan antara biaya promosi dan jumlah penjualan
(dengan metode least square)
b. Hitung standard error of estimate
3) Data di bawah ini menunjukkan umur dan harga mobil sport bekas merek tertentu :
Tabel 8.4 Umur dan Harga Mobil
Umur (tahun) Harga (ribuan rupiah)
1 1.795
4 985
10 295
2 1.295
5 785
6 995
8 845
1 1.625
a. Hitung persamaan regresi yang memungkinkan kita untuk meramalkan harga
berdasarkan umur mobil
b. Ramalkan harga mobil sport bekas yang sudah berumur 3 tahun
c. Untuk mobil yang sudah berumur 20 tahun, bagaimana pendapat anda?
d. Sehubungan dengan pertanyaan b, hitunglah batas-batas ramalan dengan
probabilitas 0,95.
4) Tabel di bawah ini menunjukkan angka-angka tentang berbagai tingkat penggunaan
pupuk (X) dan hasil pemanenan Tebu (Y):
Tabel 5 Penggunaan Pupuk dan Hasil Panen Tebu
Penggunaan Pupuk X Panenan Tebu Y
2 8
4 9
5 11
7 11
10 12
a. Hitunglah garis
11 14
regresi dari hasil panenan
12 15
berdasarkan tingkat
15 16

13
penggunaan pupuk.
b. Hitung standard error of estimate
c. Pada penggunaan pupuk sebanyak 13 unit, perkiraan batas-batas panenan tebu bila
dipergunakan interval kepercayaan 95%
d. Dengan α = 0,05 ujilah hipotesis:
H0 : β = 0 (tidak ada hubungan antara tingkat penggunaan pupuk dengan hasil
panenan)
H1 : β ≠ 0
5) Manajer suatu perusahaan perbankan ingin meneliti hubungan antara income ruma
tangga (X) dengan besarnya tabungan (Y). Dari daftar yang ada dipilih secara random
100 rumah tangga yang mempunyai income berkisar antara 5.000 dan 20.000 rupiah.
Dari penelitian dan perhitungan yang dilakukan diperoleh informasi sebagai berikut :
ΣX = 1.239ΣY = 79 ΣXY = 1.613
ΣX = 17.322
2
ΣY = 293
2

a. Tentukan persamaan dugaan garis regresinya


b. Dari slope b dan intercept a yang diperoleh jelaskan artinya
c. Hitunglah SY.X dan SY. Apakah perbandingan keduanya menunjukkan bahwa garis
regresi merupakan alat yang bermanfaat untuk peramalan tabungan rumah tangga.

8.7 Analisis Korelasi Sederhana

Analisis korelasi sering digunakan bersamaan dengan analisis regresi. Analisis


regresi digunakan untuk memperoleh persamaan estimasi dan untuk mengetahui apakah 2
variabel mempunyai hubungan atau tidak. Analisis korelasi digunakan untuk pengukuran
keeratan hubungan. Ada 2 penggukuran yang dapat digunakan untuk menjelaskan kaitan
antara variabel x dan variabel y, yaitu: koefisien determinasi dan koefisien korelasi.
Koefisien Determinasi (R²) merupakan suatu ukuran yang digunakan untuk
melihat seberapa besar sumbangan variabel independent terhadap naik turunnya variabel
dependent. Kegunaannya adalah untuk ukuran ketepatan garis regresi dari hasil estimasi
terhadap sekelompok data hasil observasi, dan untuk mengukur proporsi dari jumlah
variasi yang diterangkan oleh model regresi atu untuk mengukur besarnya kontribusi
variabel x terhadap variasi variabel y, nilai R²
2
S XY
R2  berkisar antara 0 – 1 ( 0 < R² < 1), dengan rumus:
S XX SYY

Dari contoh soal yang ada dalam regresi umur mesin dengan biaya perawatan maka akan
diperoleh nilai R2,

14
(10) 2
R2   0,83
(50)(2,42)

Dari hasil penghitungan tersebut dapat disimpulkan bahwa variasi umur mesin mampu
menerangkan 83% variasi perubahan biaya perawatan.

8.7.1 Koefisien Korelasi (r)

Koefisien Korelasi (r) adalah ukuran yang digunakan untuk menentukan tingkat
keeratan hubungan linier antara 2 variabel. Besaran rho merupakan nilai koefisien korelasi
populasi sedangkan r merupakan koefisien korelasi sampel, dengan rumus sbb:

S XY 10
r   0,91
( S XX SYY ) (50)( 2,42)

Atau dapat diperoleh dari nilai koefisien determinasi dan koefisien regresi dengan
hubungan berikut r = √ R2 , R2 = 0,83, akar 0,83 = 0,91. Hasil koefisien korelasi 0,91 ini
menunjukkan bahwa umur mesin mempunyai hubungan posiif yang kuat dengan biaya
perawatan mesin atau dapat dikatakan bahwa jika semakin tua umur mesin akan semakin
besar biaya perawatannya. Koefisien korelasi mempunyai sifat sbb:
1) Merupakan besaran yang tidak mempunyai satuan
2) Nilai r akan terletak anatar -1 dan 1
3) Tanda koefisien korelasi menunjukkan arah hubungan.
4) Positif 0 dan 1 dan negatif terletak antara 0 dan -1
5) Koefisien korelasi hanya mencerminkan keeratan hubungan linier dari 2 variabel yg
terlibat.
6) Bersifat simetris, rxy = ryx = r
7) Variabel yang terlibat tidak harus variabel dependent dan independent.

Koefisien korelasi dapat juga dihitung dengan:

1) Least Squares (r)

15
n Σxy – (Σx)(Σy)
r = -------------------------------------
( n Σx² - (Σx)²) (n Σy² - (Σy)²

2) Pearson /Product Moment (rxy)


Asumsi yang mendasarinya adalah distribusi variabelnya normal, 2 variabel yang
dihubungkan bersifat kontinum (min interval), dan hubungannya bersifat rektalinier
(membentuk garis lurus), rumus yang dapat digunakan:

Σxy
rxy = -----------------
(Σx²) (Σy²)

8.7.2 Inferensia Terhadap Koefisien Korelasi Populasi


Koefisien korelasi yang dihitung biasanya dari data sampel, sedangkan nilai dari
populasinya tidak diketahui, seandainya variabel x dan y tidak berkorelasi maka rho = 0,
untuk menguji hipotesis nol rho = 0, digunakan uji t dengan db = n-2, sbb:

N 2
tr
1 r2

Contoh Aplikasi
Dari contoh soal umur mesin dan biaya perawatan di atas, apabila tingkat
signifikansi yang digunakan untuk menguji hipotesis adalah 5% maka,
1) Hipotesis yang dirumuskan adalah Ho : rho = 0 dan Ha : 0
2) Uji dua sisi /2 =0,05/2=0,025, dengan db n=6-2 = 4, sehingga diperoleh t0,025 (db=4)
= 2,78
3) Kriterian uji, Ho diterima jika -2,78 < t < 2,78

62
t  0,91  4,41
1  0,83
4) Pada tingkat signifikansi 5% dapat diputuskan untuk meolak Ho karena t hitung = 4,41
> dari pada t tabel. Karena nilai r = 0,91 yang menunjukkan adanya hubungan positif
maka umur mesin dengan biaya perawatan mempunyai hubungan yang positif.

16
Kriteria Koefisien Korelasi

0 Tidak ada hubungan


0,10 – 0,50 Korelasi lemah
0,51 – 0,80 Korelasi sedang
0,81 – 0,99 Korelasi kuat
1,00 Korelasi sempurna
0,70 – 1,00 Derajat hubungannya tinggi
0,40 - 0,70 Derajat hubungannya
substansial
0,20 - 0,40 Derajat hubungannya rendah
< 0,20 Diabaikan

SOAL LATIHAN

1) Seorang pedagang keliling ingin mengetahui apakah ada hubungan antara jarak yang
ia tempuh dengan hasil bersih yang ia peroleh :
Tabel 8.7 Tabel Jarak Tempuh dan Hasil Bersih Pedagang
Jarak Hasil Bersih
4 7
6 8
8 6
10 5
12 4
a. Hitung koefisien korelasinya dan jelaskan arti dari nilai koefisien yang dihasilkan.
b. Dengan α = 0,05 ujilah apakah ada korelasi yang significant.
2) Dua orang ibu rumah tangga dimintai pendapat tentang tingkat kesukaannya pada
berbagai macam merek sabun cuci. Hasilnya adalah sebagai berikut :
Tabel 8.8 Tabel Merk Sabun
Merek Sabun Ny. Rilo Ny. Ryo
A 3 5
B 5 6
C 8 4
D 12 9
E 10 8
F 7 12
G 9 11
H 1 3
I 4 1
J 6 2
K 2 10
L 11 7

17
Hitunglah nilai r (rank correlation coefficient)!
3) Carilah :
a. Koefisien korelasi dari data di bawah ini, dimana X adalah upah per bulan, dan Y
adalah pengeluaran per bulan, dalam ribuan rupiah. (dengan menggunakan metode
product moment):
Tabel 8.9 Tabel Upah Per Bulan
0- 5- 20-
10-14,9 15-19,9 (X)
4,9 9,9 24,9
0-2,9
1
3-5,9 2 1 - -
-
6-8,9 4 3 2 -
-
9-11,9 1 5 7 2
-
12- - 2 3 3
-
14,9 - 1 2 4
(Y)

b. apakah ada korelasi yang significant antara X dan Y pada α = 0,05.


c. Apakah yang dimaksud dengan korelasi positif, korelasi negatif, dan korelasi nihil.
4) Suatu studi dilakukan untuk mengetahui apakah ada pengaruh mengenai jumlah
konsumsi makanan yang bergizi dengan tingkat pendidikan yang dapat dicapai. Dari
sejumlah sampel yang diselidiki memberikan hasil sbb :
Tabel 8.10 Tabel Tingkat Pendidikan
Kurang Cukup Lebih dari cukup
Tamat
SMP 82 65 12
Tamat 59 112 24
SMA 37 94 42
Sarjana
a. Hitunglah nilai C (Contingency coefficient)
b. Dengan α = 0,01 ujilah apakah ada korelasi yang significant.
5) Sebuah Lembaga Research ingin mengetahui apakah ada hubungan antara rasa humor
(diukur dengan suatu objective test tertentu) dengan kecakapan menjual (diukur melalui
volume sales). Hasilnya ditunjukkan sbb:
Tabel 8.11 Tabel Lembaga Research
Di bawah Cukup Diatas
cukup cukup
Volume 65 51 42

18
Rendah 113 178 93
Volume 38 57 67
sedang
Volume tinggi

a. Hitunglah Contingency Coefficientnya


b. Dengan α = 0,05 ujilah apakah ada hubungan yang significant?

DAFTAR PUSTAKA
Akdon dan Riduwan. 2010. Rumus dan Data Dalam Analisis Statistika.
Bandung:ALFABETA.
Anto Dayan. 1974. Pengantar Metode Statistika, Jilid II. Jakarta:LP3ES.
Djarwanto.1996. Mengenal Beberapa Uji Statistik Dalam Penelitian. Yogyakarta: Liberty.
Harinaldi. 2002. Prinsip-Prinsip Statistik Untuk Teknik dan Sains. Jakarta: Erlangga.
Kasjono, HS. 2010. Cara Praktis Memahami (BIO) Statistik. Yogyakarta: Gosyen
Publishing.
Kerlinger, Fred N dan Pedhazur Elazar. 1987. Korelasi dan Analisis Regresi Ganda.
Yogyakarta: Nur Cahaya.
Subagyo, Pangestu Djarwanto. 1993. Statistik Induktif. B Yogyakarta: PFE.
Sugiarto, Supramono. 1993. Statistika. Yogyakarta: Andi Offset.plikasi, Edisi V, Jakarta:
Erlangga.
Sunarto dan Riduwan. 2011.pengantar Statistika. Bandung: ALFABETA.
Walpole, Ronald E. 1992. Pengantar Statistika. Edisi III. Jakarta: PT. Gramedia Pustaka

19

Anda mungkin juga menyukai