9 ANALISIS
KORELASI
9.1. PENDAHULUAN
Melalui analisis regresi yang telah diulas sebelumnya, dapat diketahui hubungan dua
variabel atau lebih dalam bentuk persamaan. Meskipun demikian, terkadang disamping
bentuk hubungan variabel-variabel terkait, dibutuhkan pula informasi tentang keeratan
hubungan dari variabel-variabel yang menjadi perhatian. Dalam hal keeratan hubungan ini,
analisis korelasi paling sering digunakan dalam statistika. Nyatanya, tersedia lebih dari satu
jenis analisis korelasi yang dapat digunakan tergantung pada skala pengukuran datanya.
Untuk data berskala ukur minimal interval, pada umumnya digunakan Analisis Korelasi
Pearson. Untuk data berskala ukur ordinal digunakan Analisis Korelasi Spearman.
Sedangkan untuk data berskala ukur minimal nominal digunakan Uji Kebebasan dalam tabel
kontingensi.
Studi yang membahas tentang derajat hubungan antar variabel dinamakan analisis
korelasi. Ukuran yang dipakai untuk mengetahui derajat hubungan, terutama untuk data
kuantitatif dinamakan koefisien korelasi.
Manfaat dari mempelajari materi Modul 9 ini adalah agar anda dapat memahami
analisis korelasi karena analisis tersebut mampu memberi informasi kepada anda mengenai
keeratan hubungan variabel-variabel.
Relevansi dari Modul 8 ini adalah bahwa pengetahuan anda tentang analisis korelasi
dapat membantu anda bila anda bermaksud mengetahui tingkat keeratan hubungan antar
variabel. Penerapannya dapat dijumpai secara luas dibanyak bidang seperti teknik, ekonomi,
manajemen, biologi, ilmu-ilmu sosial, ilmu-ilmu pertanian, dan lain lain.
Untuk memudahkan anda mempelajari isi Modul 9 serta mengetahui kaitan antara
materi-materinya, maka berikut ini dikemukakan urutan bahasan dan kaitan materi Modul
9 yakni: indeks determinasi, korelasi dalam regresi linier, dan menguji hipotesis koefisien
korelasi ρ.
9.2. PENYAJIAN
Pada Modul 9 ini kita akan mempelajari tiga aspek berikut: 1) Indeks determinasi;
2) Korelasi dalam regresi linier; dan 3) Menguji hipotesis koefisien korelasi ρ.
Analisis korelasi sukar dipisahkan dari analisis regresi. Secara umum, untuk
pengamatan yang terdiri dari dua variabel X dan Y maka kita akan tinjau hal berikut:
Misalkan persamaan regresi Y atas X, tidak perlu harus linier, yang dihitung dari data
sampel, berbentuk Ŷ = f(X). Jika regresinya linier, jelas f(X) = a + bX dan jika parabola
variabel Y, maka dapat dibentuk jumlah kuadrat total, JK tot = Σ(Yi – )2 dan jumlah kuadrat
residu, JK res = Σ(Yi – Ŷ)2 dengan menggunakan harga Ŷi yang didapat dari regresi Ŷ = f(X).
Indeks Determinasi ialah suatu besaran yang mengukur derajat hubungan antara
variabel X dan Y, apabila antara X dan Y terdapat hubungan regresi berbentuk Ŷ = f(X).
Indeks determinasi ini bersifat bahwa jika titik-titik diagram pencar letaknya makin
dekat kepada garis regresi maka harga I makin dekat kepada 1, dan sebaliknya maka harga I
makin dekat kepada nol. Secara umum berlaku 0 ≤ I ≤ 1.
Apabila garis regresi yang terbaik untuk sekumpulan data berbentuk linier, maka
derajat hubungannya dinyatakan dengan r dan biasa dinamakan koefisien korelasi. Karena
formula 9.1. di atas bersifat umum, maka itupun berlaku apabila pola hubungan X dan Y
berbentuk regresi linier. Dalam hal ini I akan diganti oleh r2 dan diperoleh :
formula 9.3 ….
Mudah dilihat bahwa formula 9.1 dan formula 9.3 akan berlaku 0 ≤ r2 ≤ 1 sehingga
untuk koefisien korelasi didapat hubungan -1 ≤ r ≤ +1. Harga r = -1 menyatakan adanya
hubungan linier sempurna tak langsung antara X dan Y. Ini berarti bahwa titik-titik yang
ditentukan oleh (Xi,Yi) seluruhnya terletak pada garis regresi linier. Harga r = +1 menyatakan
adanya hubungaan linier sempurna langsung antara X dan Y.
formula 9.5 ……
Jika persamaan regresi linier Y atas X telah ditentukan dan sudah didpt koefisien arah
b, maka koefisien determinasi r2 dpt ditentukan oleh:
Dengan sedikit pengerjaan aljabar, dari formula di atas dapat diturunkan formula
koefisien korelasi:
formula 9.7.....
dengan sx simpangan baku untuk variabel X dan sy simpangan baku untuk variabel Y.
Masih ada formula lain yaitu yang ditentukan oleh koefisien arah garis regresi Y atas
X dan regresi X atas Y.
Jika b1 koefisien arah regresi Y atas X dan b2 koef arah regresi X atas Y untuk data yang
sama maka:
Formula ini menyatakan bahwa koefisien korelasi r adalah rata-rata ukur daripada koefisien
arah b1 dan b2.
Contoh:
r = 0,8758.
Dari hasil ini ternyata didapat korelasi positif antara banyak pengunjung X dan yang
berbelanja Y. Berarti meningkatnya pengunjung yang datang meningkat pula banyak yang
berbelanja.
Contoh:
Ambillah regresi model Ŷ = 2 + X 2. Jelas ini bukan regresi linier. Kita ambil harga-
harga sebagai berikut:
Xi -3 -2 -1 0 1 2 3
Yi 11 6 3 2 3 6 11
Dari sini mudah didapat bahwa: ΣXi = 0; ΣYi = 42; ΣXi2 = 28; ΣYi2 = 336; ΣXi Yi = 0; dan
n = 7, dengan formula 9.4 didapat:
Kita gunakan formula 9.3 kita lihat bahwa = 6; Ŷi = Yi; dan harga-harga seperti
tertera di atas. Dengan demikian Σ(Yi – Ŷi)2 = 0 sehingga formula 9.3, mudah dilihat bahwa r2
= 1. Ini berarti bahwa terdapat hubungan sempurna antara X dan Y yang dinyatakan oleh
parabola dengan persamaan Ŷ = 2 + X2.
Kembali kepada populasi normal bervariabel dua dengan koefisien korelasi ρ. Dari
modelnya, jika ρ = 0, maka ternyata bahwa X dan Y independen artinya keduanya tidak
memiliki hubungan sama sekali. Sehingga dalam hal populasi berdistribusi normal, ρ = 0
mengakibatkan bahwa X dan Y independen dan sebaliknya. Sifat ini tidak berlaku bagi
populasi yang tidak berdistribusi normal.
Karena dalam suatu penelitian kita sering ingin mengetahui apakah antara dua
variabel itu independen atau tidak, kita perlu melakukan uji independen. Hipotesis yang harus
diuji adalah:
Jika sampel acak yang diambil dari populasi berdistribusi normal bervariabel dua
berukuran n dan meiliki koefisien korelasi r, maka formula yang dipakai sebagai berikut:
Bentuk alternatif untuk menguji Ho bisa H1 : ρ > 0 (uji pihak kanan) atau H1 : ρ < 0
(uji pihak kiri). Daerah kritis pengujian (daerah penolakan Ho) seperti biasa harus
disesuaikan dengan alternatif yang diambil.
Contoh:
Jika taraf nyata α = 0.05 maka dengan dk = 25 maka untuk uji dua pihak t 0.975 = 2.060,
ternyata t = 1.458 terletak antara -2.060 dan +2.060. Berdasarkan kaidah pengambilan
keputusan Ho diterima. Kesimpulannya antara dua variabel tersebut tidak memiliki
hubungan linier.
Koefisien korelasi berganda mengukur keeratan hubungan antara variabel respon (Y)
dengan semua variabel penjelas atau prediktor (X 1,X2,X3,...,Xn) secara bersamaan. Pada
analisis regresi berganda, nilai koefisiennya dapat diperoleh dengan mengakarkan nilai
koefisien determinasi (R2) keseluruhan. Nilai yang diperoleh dilambangkan dengan R dan
disebut sebagai koefisien korelasi berganda atau koefisien korelasi majemuk. Perlu dicatat,
berbeda dengan nilai koefisien korelasi sederhana yang bisa positif atau negatif, nilai
koefisien korelasi berganda (R) selalu positif.
dengan : rY1 = koefisien korelasi antara Y dan X1; rY2 = koefisien korelasi antara Y dan X2; r12
= koefisien korelasi antara X1 dan X2.
Dengan menggunakan koefisien korelasi ganda R ini, kita juga dapat menguji keberartian
korelasi ini, jadi juga menguji keberartian regresi. Untuk ini digunakan statistik F dengan
rumus:
Rumus 9.11.........
Ftabel = 4,74 - fhit > ftabel...-nyta -- α=0,01----9,55 --- sangat nyata—besaran pengaruh
dari x terhadap Y –sangat nyata.
Seperti halnya koefisien korelasi berganda, koefisien korelasi parsial juga melibatkan
banyak variabel. Tapi, pada koefisien korelasi parsial ini diukur korelasi antara dua variabel
(misalnya Y dan X1) dengan asumsi variabel lainnya tetap konstan.
Rumus 9.11.....
Contoh: Lihat data Tabel 8.1. Kita dapat menghitung koefisien korelasi rY1, rY2 dan r12.
Hasilnya sebagai berikut: rY1 = 0.9985; rY2 = 0.9957 dan r12 =0.9973. Jadi koefisien
korelasi parsial antara Y dan X2 dengan asumsi X1 tetap adalah :
(catatan: baca ry2.1, korelasi parsial y dengan x2, dengan asumsi x1 dianggap tetap)
9.3. PENUTUP
9.3.1. Ringkasan
Studi yang membahas tentang derajat hubungan antar variabel dinamakan analisis
korelasi. Ukuran yang dipakai untuk mengetahui derajad hubungan, terutama untuk data
kuantitatif dinamakan koefisien korelasi.
Indeks Determinasi ialah suatu besaran yang mengukur derajat hubungan antara
variabel X dan Y, apabila antara X dan Y terdapat hubungan regresi berbentuk Ŷ = f(X).
atau
Indeks determinasi ini bersifat bahwa jika titik-titik diagram pencar letaknya makin
dekat kepada garis regresi maka harga I makin dekat kepada 1, dan sebaliknya maka harga I
makin dekat kepada nol. Secara umum berlaku 0 ≤ I ≤ 1.
Apabila garis regresi yang terbaik untuk sekumpulan data berbentuk linier, maka derajad
hubungannya dinyatakan dengan r dan biasa dinamakan koefisien korelasi. Karena formula
Modul 9. Analisis Korelasi 170
9.1. di atas bersifat umum, maka itupun berlaku apabila pola hubungan X dan Y berbentuk
regresi linier. Dalam hal ini I akan diganti oleh r2 dan diperoleh :
Jika persamaan regresi linier Y atas X telah ditentukan dan sudah didpt koefisien arah
b, maka koefisien determinasi r2 dpt ditentukan oleh:
variabel Y.
Masih ada formula lain yaitu yang ditentukan oleh koefisien arah garis regresi Y atas
X dan regresi X atas Y.
Jika b1 koefisien arah regresi Y atas X dan b2 koef arah regresi X atas Y untuk data yang
sama maka r2 = b1 b2.
Kembali kepada populasi normal bervariabel dua dengan koefisien korelasi ρ. Dari
modelnya, jika ρ=0 maka ternyata bahwa X dan Y independen artinya keduanya tidak
memiliki hubungan sama sekali. Sehingga daklam hal populasi berdistribusi normal, ρ=0
mengakibatkan bahwa X dan Y independen dan sebaliknya. Sifat ini tidak berlaku bagi
populasi yang tidak berdistribusi normal.
Jika sampel acak yang diambil dari populasi berdistribusi normal bervariabel dua
berukuran n dan memiliki koefisien korelasi r, maka formula yang dipakai sebagai berikut:
Kaidah keputusan yang dipakai adalah untuk taraf nyata α, terima Ho bila
dimana distribusi t yang digunakan mempunyai dk (n-2). Dalam hal
lainnya tolak Ho, terima H1.
Bentuk alternatif untuk menguji Ho bisa H1 : ρ>0 (uji pihak kanan) atau H1 : ρ<0 (uji
pihak kiri). Daerah kritis pengujian (daerah penolakan Ho) seperti biasa harus disesuaikan
dengan alternatif yang diambil.
Koefisien korelasi berganda mengukur keeratan hubungan antara variabel respon (Y)
dengan semua variabel penjelas atau prediktor (X1,X2,X3,...,Xn) secara bersamaan. Pada
analisis regresi berganda, nilai koefisiennya dapat diperoleh dengan mengakarkan nilai
koefisien determinasi (R2) keseluruhan
Koefisien korelasi parsial juga melibatkan banyak variabel. Tapi, pada koefisien
korelasi parsial ini diukur korelasi antara dua variabel (misalnya Y dan X1) dengan asumsi
variabel lainnya tetap konstan. Koefisien korelasi parsial mengukur bagaimana Y
berhubungan dengan masing-masing variabel bebas
2. Jelaskan hubungan yang ada antara korelasi dan regresi untuk dua variabel. Berikan pula
perbedaan yang ada antara keduanya.
d. b dan c benar
Dibawah ini diberikan data yang secara acak diambil dari populasi normal bervariabel dua (X
dan Y). Gunakan data ini untuk menjawab soal no. 4 - 6
X Y X Y X Y
15 108 8 56 17 153
13 106 11 75 6 73
10 99 17 137 8 95
11 110 20 163 5 26
16 135 12 84 3 24
12 97 18 149 6 50
9 74 16 140 14 96
12 98 13 137 5 35
4 20 18 170 15 132
8 69 11 109 16 141
4. Persamaan regresi linier Y atas X yang diperoleh: Y = -1.24 +0.89X. Rata-rata
Y diharapkan bila X=30 adalah:
a. 256.48
b. 265.08
c. 273.67
d. 247.89
a. 4.48
b. 4.58
c. 4.68
d. 4.37
7. Koefisien determinasi R2 memiliki nilai lebih besar sama dengan nol sampai lebih kecil
sama dengan 1. Kalau R2 = 1 dapat diinterpretasi sebagai berikut:
c. a dan b benar
d. a dan b salah
8. Dalam melakukan interpretasi terhadap koefisien korelasi bila dalam analisis diperoleh
nilai r = 0.52, kita dapat menyatakan bahwa :
a. 0.8701
b. 0.8107
c. 0.8017
d. 0.7810
10. Nilai koefisien korelasi berganda R dari regresi Y atas X1 dan X2 menunjukkan bahwa:
Cocokkanlah hasil jawaban anda dengan kunci jawaban test formatif 9. Hitunglah
jumlah jawaban yang benar, kemudian gunakan formula dibawah ini untuk mengetahui
tingkat penguasaan anda atas modul 9 ini.
formula :
Jika mencapai tingkat penguasaan 80% ke atas, anda dapat meneruskan ke Modul berikutnya.
BAGUS. Tetapi bila hasilnya <80%, maka anda harus mengulang kembali terutama pada
kegiatan belajar yang belum anda kuasai.
1. A 6. C
2. D 7. C
3. A 8. C
4. A 9. C
5. A 10. A
Sugiarto, D.S.,2002. Metode Statistika Untuk Bisnis dan Ekonomi. Penerbit PT. Gramedia
Pustaka Utama, Jakarta.
Boedijoewono,N., 2001. Pengantar Statistika Ekonomi dan Perusahaan. Jilid 2. Edisi revisi.
Penerbit AMP YKPN , Yogyakarta
Mead R; R.N. Curnow and A.M. Hasted., 1994. Statistical Methods in Agriculture an
Experimental Biology. 2nd Edition. Chapman and Hall, London.