KOEFISIEN KORELASI
Koefisien korelasi merupakan alat statistik yang dapat digunakan untuk mengetahui
derajat keeratan antara satu variabel independen dengan variabel dependen lain. Dan koefisien
korelasi digunakan dalam hubungannya dengan regresi linier, untuk mengukur ketepatan garis
regresi dalam menjelaskan (eksplaining) variasi nilai variabel.
Koefisien korelasiadalah angka yang menggambarkan derajat keeratan hubungan
(korelasi) antara satu variabel terikat dengan satu variabel bebas. Derajat keeratan tersebut bisa
positif, disebut dengan Korelasi Positif. Dikatakan dua variabel berkorelasi positif jika kedua
variabel tersebut cenderung berubah bersama satu (path) arah yang sama. Jika variabel bebasnya
berrtambah maka variabel terikatnya juga bertambah atau sebaliknya jika variabel bebasnya
berkurang maka variabel terikatnya juga berkurang yang disebut dengan berbanding lurus
(dengan tanda koefisien korelasinya positif (+)). Sedangkan jika derajat keeratan tersebut bernilai
negatif, disebut dengan Korelasi Negatif, artinya variabel berkorelasi negative jika kedua
variabel tersebut cenderung berubah pada arah yang berlawanan, jika variabel bebasnya
bertambah maka variabel terikatnya berkurang, begitu juga sebaliknya jika variabel bebasnya
berkurang, maka variabel terikatnya bertambah, yang disebut dengan berbanding terbalik
(dengan tanda koefisien korelasinya negatif (-)). Jika derajat keeratan tersebut bernilai nol, maka
disebut tidak berkorelasi, jadi dua variabel tidak berkorelasi jika kedua variabel berubah dan
tidak berkorelasi satu sama lain. Dan jika nilai derajat keeratan sama dengan satu dan negatif
satu maka disebut dengan berkorelasi.
Untuk mengukur keeratan antara dua variabel, digunakan parameter koefisien korelasi.
Koefisien korelasi populasi diukur dengan R dan diestimasi dan koefisien korelasi sampel yang
dinotasikan dengan r.
Koefisien korelasi diperoleh dengan rumus berikut:
∑ Xi Y i
r xy = dimana : x i=X i −X dan y i=Y i −Y
√∑ X √∑Y
2
i
2
i
Atau
n∑ xy −∑ x ∑ y
r= . . . . . . . . . . . . (rumus 1)
√ n∑ X −( ∑ X )2 √ n ∑ Y 2−(∑ Y )2
2
Besar nilai koefisien korelasi sebesar -1 atau 1, menunjukkan bahwa terdapat hubungan yang
sempurna antara kedua variabel, sedangkan nilai koefisien korelasi 0 menunjukkan hubungan
antara kedua variabel tersebut sama sekali tidak sempurna. Jika nilainya berkisar -1 s/d 1, maka
hal ini perlu diuji keeratannya, yang disebut dengan Uji Koefisien Korelasi.
Menurut Guilford, untuk membaca rendah tingginya keeratan variable tersebut dapat
diklassifikasikan sebagai berikut.
Tabel 7. Nilai Korelasi Menurut Guilfrod
Koefisien Korelasi Keterangan
dan akan dibandingkan dengan nilai t tabel = t (α ,n−2) yaitu dengan tingkat significant α dan
derajat kebebasan (d.k = n -2 ) untuk 1 pihak, dant tabel = t ( α ,n−1) adalah untuk 2 pihak.
2
3. Kriteria uji, tergantung 2 pihak (two tile test) atau uji satu pihak (one tik test),
misal uji 2 pihak:
Terima Ho, jika -t ( α ,n−1)< t < +t ( α ,n−1), hal lain tolak Ho.
2 2
Kurva 8.1.
Tolak H0 Tolak H0
Terima H0
-tabel tabel
4. Kesimpulan
Maka dilakukan uji statistik F. uji kelinieran pengaruh ‘variabel pada dasarnya menunjukkan
apakah variabel bebas yang dimasuksud dalam model berpengaruh linier terhadap vriabel
terikatnya. Uji Statistik F dapat dihitung dengan rumus sebagai berikut:
b1 . JK XY
SSR /k R2 /k
Fhit =
[
JK YY −b1
(n−2)
. JK
]
XY atau F= =
SSE /(n−k−1) (1−R 2)/(n−k−1)
Dimana:
n =jumlah sempel atau observasi.
k = jumlah variabel bebas.
SSR = jumlah kuadrat regresi.
SSE = jumlah kuadrat dari kesalahan(error)peramalan.
SST = SSE+SSR=jumlah kuadrat total.
R2 = besarnya koefisien determinasi sampel
selanjutnya dengan membandingkan nilai F hasil perhitungan dengan nilai F menurut tabel,
F tabel=F ( ∝2 , n−k−1)
Kriteria Uji:
Terima H0, jika –Ftabel< Fhitung < Ftabel, . hal lain tolak H0. Kriteria pengujian ini juga dapat dilihat
dari tabel distribusi F;
Uji statistic yang digunakan adalah ujisignifikan statistik t. dengan hitungan sebagai berikut:
b
th=
s / √ JK xx
Dimana;
S = Standart deviasis =
√ JK xx – b1 . JK xy
( n−2 )
JKxx= n∑ x 2i −¿ ¿ 2
JKYY= n ∑ X i −¿ ¿2
2
JKXY=n∑ XY −∑ X . ∑ Y
bi
Sehingga untuk bi koefisien xi maka uji statistic t h=
sb i
Selanjutnya membandingkan nilai statistik t hitung dengan nilai distribusi normal t table, yaitu
t(a/2,n-1).
Kriteria uji . Terima H 0, jika: -ta/2,.n-1 ≤ t ≤ ta/2,.n-1, hal lain, maka tolak H 0. Atau dapat dilihat
dalam grafik distribusi normal t.
Gambar 20.
Tolak H0 Tolak H0
Terima H0
Z,t
-ttabel ttabel
Contoh
Uji korelasi x 1 ( pengalaman kerja ) dengan y ( pendapatan usaha tani ) adalah sbb :
Hipotesis Ho : r x 1 y=0 ( tidak ada hubungan pengalaman kerja dengan pendapatan usaha tani )
Ha : r x 1 y ≠ 0 ( ada hubungan pengalaman kerja dengan pendapatan usaha tani )
Perhitungan statistik nya adalah : n = 15
n ∑ x 1 y −∑ x 1 ∑ y
r x 1 y=
√ n ∑ x −¿ ¿ ¿
2
1
Uji statistik yang digunakan adalah distribusi student t, sesuai dengan rumus signifikan untuk
variabel bebasxi
bi
thitung¿
Sbi
dimana bi = masing-masing koefisien variabel bebas xi
Sbi = satandard deviasi bi
Tolak H0 Tolak H0
Terima H0
-tabel tabel
Contoh 8.4.
Berikut adalah data jumlah penawaran (kg) komoditi lada dengan harga komoditi lada Rp (000),
selama 8 hari berturut – turut.
Tabel 8. jumlah penawaran komoditi laba (kg) dan harga komoditi laba (000)
Periode Waktu (hari) Jumlah Penawaran (kg) Harga (Rp)
T x Y
1 20 64
2 16 61
3 34 84
4 23 70
5 27 88
6 32 92
7 18 72
8 22 77
Permasalahannya adalah ;
1. Ada dugaan bahwa jumlah penawaran komoditi lada (Rp) berkorelasi (berhubungan)
dengan harga komoditi lada Rp (000),
2. Ada dugaan bahwa jumlah penawaran komoditi lada (Rp) berkorelasi yang positif
(berhubungan positif) dengan harga komoditi lada Rp (000), artinya jika jumlah
penawaran komoditi lada meningkat, maka harga komoditi lada meningkat, dan jika
jumlah penawaran turun maka harga juga turun.
Untuk menduga korelasi tersebut, langkah pertama adalah menentukan nilai koefisien korelasi r,
maka diperlukan perhitungan pada tabel berikut ini.
Tabel 9. Data jumlah penawaran dan harga lada yang diolah pada tabel 2
Periode Waktu Jumlah Penawaran Harga (Rp) x2 y2 xy
(hari) (kg)
Y
T x
Kriteria uji: Terima Ho, jika -t ( α ,n−1)< t < +t ( α ,n−1), dalam hal ini tidak benar
2 2
bahwa -1,943 < 4,127 < 1,943.Maka tolak Ho, atau terima Ha
Atau dapat dilihat pada kurva normal distribusi t.
Kurva 1.
Tolak H0 4,127 berada dalamTolak H0
Terima H0
-1,943 1,943
Kesimpulan : Terima Ha, yaitu : Ada hubungan antara jumlah penawaran lada dengan
harga lada
2). Ada dugaan bahwa jumlah penawaran komoditi lada (Rp) berkorelasi yang positif
(berhubungan positif) dengan harga komoditi lada Rp (000),
Dalam pengujian koefisien korelasi digunakan uji satu pihak (one tile test) karena dugaan
sementara apakah benar r > 0 artinya apakah benar ada keeratan hubungan antara jumlah
penawaran lada dengan harga lada yang positif?,
Hipotesis yang dibentuk:
Ho : r = 0 (tidak ada hubungan antara jumlah penawaran lada dengan harga lada)
Hi : r > 0 (ada hubungan yang positif antara jumlah penawaran lada dengan harga lada).
Uji statistik ;
r √ n−2
t=
√ 1−r 2
0,86 √ 8−2
t=
√1−(0,86)2
2,106
t= = 4,127
0,520
nilai tabel distribusi t = t (α ,n−2) = t (0,05 ;8−2) = t (0,05 ,6 ) = 1,943
Kriteria uji: terima Ho, jika t <t tabel, karena 4,137 > 1,943, maka tolak Ho, berarti terima Hi atau
dalam distribusi kurva normal dapat dilihat kurva 2.
Kurva 2.
Tolak H0
Terima H0
1,943
4,137
Kesimpulan: Nilai t hitung = 4,127 berada dalam daerah tolak Ho, berarti terima Ha, artinya
terdapat hubungan yang positif antara jumlah lada yang ditawarkan dengan harga
lada dan jika jumlah lada yang ditawarkan meningkat.
Contoh 8.5
Dari contoh 8.3, penelitian mengenai pendapatan usaha tani apakah dipengaruhi oleh
pengalaman bekerja dan umur petani, persamaan regresi liniernya telah diperoleh;
^y =1,040992+0.114268 x 1+ 0.034185 x 2
Dimana
^y :estimasi pendapatan usaha tani
x 1:pengalama kerja tani
x 2:umur tani
Untuk menguji apakah
1) Pengalaman kerja tani x 1 berpengaruh dengan pendapatan tani y
2) Umur tani x 2berpengaruh dengan pendapatan taniy
Langkah pengujian sebagai berikut
1). Hipotesis Ho : r x 1 y=0( tidak ada hubungan pengalaman kerja dengan pendapatan usaha
tani )
Ha : r x 1 y ≠ 0 (ada hubungan pengalaman kerja dengan pendapatan usaha tani )
Perhitungan statistik nya adalah : n = 15 Perolehan hitungan pada contoh 9.3 adalah:
∑ x 1=131, ∑ x 2=606 , ∑ y=51.3, ∑ x 12=1477 , ∑ x 22=25040 , ∑ x 1 x2=5703,
∑ x 1 y=500.1, ∑ x 2 y=2138.5, selanjutnya hitung ∑ y = 186.49 2
n ∑ x 1 y −∑ x 1 ∑ y
r x 1 y=
√ n ∑ x −¿ ¿ ¿
2
1
Kriteria uji, Terima Ho jika −t t <t <+t t , Ternyata, -0,691˂ 0,0002 ˂ 0,691,
Maka terima Ho
Kesimpulan, Tidak ada hubungan pengalaman kerja terhadap pendapatan usaha tani.
2). Hipotesis Ho : r x 2 y=0(tidak ada hubungan umur tani dengan pendapatan usaha tani)
Ha : r x 2 y ≠ 0 (ada hubungan umur tani dengan pendapatan usaha tani)
Perhitungan statistik nya adalah :
n ∑ x 2 y −∑ x 2 ∑ y
r x 2 y=
√ n ∑ x −¿ ¿ ¿
2
2
7 ŷ
6 SSE
SST
5
SSR
y 4
3
0 X
2 3 4 5 6 7 8 9 10
Nilai rata – rata y adalah y (y bar) dan nilai estimasi y adalah ^y (y topi).
Misalnya, titik A adalah satu titik pasangan data A ( x i , y i ). Deviasi total (total deviation) y,
terhadap rata – ratanya adalah (y - y ). Besarnya deviasi total ini terdiri dari deviasi yang dapat
dijelaskan (explained deviation) dan deviasi yang tidak dapat dijelaskan (unexplained deviation).
Total deviasi dari semu titik (pasangan data) adalah jumlah kuadrat deviasi total titik tersebut
dari rata – ratanya yaitu:
∑( y− y)2 = ∑( y− ^y )2 + ∑( ^y − y)2
Variasi yang dapat dijelaskan (explained variation ) adalah jumlah kuadrat deviasi yang
dapat dijelaskan nilai garis regresi terhadap rata – ratanya. Besaran ini disebut juga sebagai
jumlah kuadrat regresi (Sum of Square Regretion/SSR) atau secara matematik ditulis sebagau
berikut:
∑( ^y − y)2
Variasi yang tidak dapat dijelaskan (unexplained regretion) adalah jumlah kuadrat deviasi
yang tidak dapat di jelaskan nilai y terhadap garis regresinya. Besaran ini disebut juga sebagai
jumlah kuadrat kesalahan (Sum of Square Errow/SSE) atau secara matematik dapat di tulis:
∑( y− ^y )2
Koefisien determinasi (R2 ) adalah persentase nilai y yang dapat dijelaskan oleh garis
regresi. Deviasi total adalah persentase deviasi yang dapat dijelaskan ditambah persentase
deviasi yang tidak dapat dijelaskan.
Dengan demikian persentase deviasi yang tidak dapat di jelaskan adalah 100% atau 1.
Besarnya persentase deviasi yang tidak dapat dijelaskan (unexplained deviation) oleh garis
regresi adalah deviasi yang tidak dapat dijelaskan yaitu ∑ ( y− ^y )2 dibagi deviasi total yaitu ∑
( y− y)2.
Secara maetematik dapat ditulis sebagai berikut:
∑( y − ^y )2
2
∑( y − y)
Persentase deviasi yang dapat dijelaskan (explained deviation) adalah besarnya koefisien
determinasi ( R2) yaitu:
2
2 ∑( y − ^y ) SSE
R =1- 2 = 1 -
∑( y − y) SST
Besarnya koefisien determinasi ( R2) dapat juga dicari dengan menggunakan formulasi (formulasi
alternative) sebagai berikut:
SSR
2
R = = a ∑ y +b ∑ xy −n ¿ ¿
SST
Dengan keterangan:
2
R = besarnya koefisien determinasi sampel
SSR = Sum of Square Regretion (explained variation)
SST = Sum of Square total (Total Variation)
a = titik potong kurva terhadap sumbu y (intercept)
b = koefisien variabel x (best sitting)
x = nilai variabel x
y = nilai variabel y
n = banyaknya data
y = nilai rata – rata variabel y.
SSE = Sum of Square Error
Selain diturunkan dari koefisien determinasi ( R2), koefisien korelasi (r) juga digunakan
untuk menentukan nilai koefisien determinasi ( R2), dengan menggunakan formulasi sebagai
berikut:
n ∑ xy−∑ x ∑ y
r=
√ n∑ x −(∑ x)2 √ n∑ y 2−(∑ y )2
2
T X Y
1 20 64
2 16 61
3 34 84
4 23 70
5 27 88
6 32 92
7 18 72
8 22 77
Dari persamaan regresi linier dengan metode kuadrat terkecil (Ordinary Least Square Method)
telah di peroleh pada contoh pembahasan sebelumnya:
y = 40 + 1,5 x
dan diperoleh data : n = 8 , a = 40 , b = 1,5 , ∑x = 192, ∑y = 608, ∑xy= 15032,
∑ x 2 = 4902, ∑ y 2 = 47094, y = 76
Maka
R = a ∑ y +b ∑ xy −n ¿ ¿
2
r =0,86 = 0,74
2 2