Anda di halaman 1dari 19

REGRESI DAN KORELASI

1. REGRESI
A. Pengertian Regresi

Menurut Irianto (2004:156-157), regresi merupakan alat analisis statistik yang


dapat membantu peneliti untuk melakukan prediksi atas variabel terikat dengan
mengetahui kondisi variabel bebas. Beberapa pola regresi sederhana diantaranya:
1. Linear dengan persamaan : = a + bX

2. Parabola dengan persamaan : = a + bX + cX2

3. Hiperbola dengan persamaan : = 1/ (a + bX)

4. Fungsi pangkat tiga dengan persamaan : = a + bX + cX2 + dX3


5. Dan lain-lain

B. Regresi Linear Sederhana


Model linear sederhana ditujukan untuk mempermudah konsep regresi, karena
model inilah yang paling sederhana dibanding dengan model-model lainnya. Tanpa
mempelajari model linear sederhana kemungkinan terlalu sukar mendalami dan
memahami model-model lainnya. Untuk mempermudah pemahaman regresi perlu
kita kembali pola penyebaran skor (titik-titik penyebaran skor) yaitu titik-titik
perpotongan antara nilai X dan Y. (Irianto, 2004:157-158)
Jika antara titik satu dengan titik yang lainnya dihubungkan dengan satu garis,
maka akan diperoleh garis yang tidak lurus. Tetapi, jika diambil satu garis yang
mewakili rata-rata dari seluruh titik-titik tersebut maka akan diperoleh garis lurus.
Garis lurus itulah yang merupakan garis regresi linear. Melalui garis persamaan lurus
itulah kita dapat melakukan prediksi rata-rata nilai variabel terikat. Jadi, dengan
mengetahui nilai variabel bebas kita dapat mengetahui rata-rata nilai variabel
terikatnya. Apabila kita ingin menerapkan hasil prediksi tersebut pada populasi yang
lain, maka populasi tersebut harus mempunyai kriteria yang sama dengan populasi
yang diambil sampelnya. Nilai prediksi belum tentu sama dengan nilai aslinya. Hal
ini disebabkan oleh karena yang diprediksi adalah nilai rata-ratanya. Dengan
demikian, nilai prediksi dapat dikatakan baik apabila nilai prediksi tidak jauh
menyimpang (kalau mungkin sama) dari nilai aslinya. Ini berarti bahwa rata-rata
simpangan nilai asli dengan nilai rata-ratanya tidak terlalu besar (kalau mungkin nol).
(Irianto, 2004:157-158)
Rumus persamaan regresi linear = a + bX bukan merupakan persamaan

yang tepat, artinya persamaan tersebut merupakan pendekatan dari persamaan =a+
bX. Persamaan yang sebenarnya terlalu sukar untuk dihitung, sehingga hasil
perhitungan a dan b yang merupakan pendekatan dan perlu diuji kecocokannya.

Jika ternyata a berfungsi sebagai pengganti dan berfungsi sebagai pengganti


maka persamaan diatas dapat digunakan sebagai pengganti persamaan sebenarnya,
yang fungsinya untuk melakukan prediksi. (Irianto, 2004:158)
Menurut Irianto (2004:158-159), nilai a maupun nilai b dapat dihitung melalui

rumus yang sederhana. Untuk memperoleh nilai a dapat digunakan rumus :

Sedangkan untuk memperoleh nilai b dapat digunakan rumus :

Setelah nilai a dan b dapat dihitung, langkah selanjutnya adalah menguji apakah nilai a
dan b memang dapat mewakili nilai dan . Untuk pengujian disini kita perlu melihat
beberapa variasi yang mungkin muncul, dan melihat apakah variasi-variasi tersebut
terlalu besar atau tidak. Beberapa variasi yang perlu dilihat adalah :
1. Variasi kekeliruan taksiran ( standard error estimate) yang dapat dihitung dengan rumus :

= /(n – 2)

Atau dapat dihitung dengan rumus yang lebih sederhana yaitu :

=( )( – )

Untuk menghitung variansi X dan Y

=
Keterangan
SS : merupakan sum of squarres (jumlah kuadrat) yaitu jumlah kuadrat simpangan
masing-masing nilai dengan rata-ratanya.
2. Variasi koefisien regresi terdiri dari dua macam yaitu:

a. Koefisien regresi a dihitung dengan rumus

= +

b. Koefisien regresi b dihitung dengan rumus

=
3. Variasi ramalan Y untuk setiap X:

a. Rata-rata ramalan dihitung dengan rumus :

b. Ramalan individu dihitung dengan rumus

Contoh:
X 90 100 100 95 105 110 105 105 115 120
Y 70 75 80 80 85 85 85 90 95 100
Sumber : data fiktif
Langkah pertama : membuat tabel penyebaran nilai sebagai berikut:
No X Y X2 Y2 XY
1 120 100 14400 10000 12000
2 115 95 13225 9025 10925
3 110 85 12100 7225 9350
4 105 90 11025 8100 9450
5 105 85 11025 7225 8925
6 105 85 11025 7225 8925
7 100 80 10000 6400 8000
8 100 75 10000 5625 7500
9 95 80 9025 6400 7600
10 90 70 8100 4900 6300
1045 845 109925 72125 88975

Sedangkan selisih setiap nilai X dengan rata-ratanya :


No X X- (X - )2

1 120 104,5 15,5 240,25s


2 115 104,5 10,5 110,25
3 110 104,5 5,5 30,25
4 105 104,5 0,5 0,25
5 105 104,5 0,5 0,25
6 105 104,5 0,5 0,25
7 100 104,5 -4,5 20,25
8 100 104,5 -4,5 20,25
9 95 104,5 -9,5 90,25
10 90 104,5 -14,5 210,25
0 722,5

Selisih nilai Y dengan rata-ratanya

No Y Y- (Y - )2

1 100 84,5 15,5 240,25


2 95 84,5 10,5 110,25
3 85 84,5 5,5 30,25
4 90 84,5 0,5 0,25
5 85 84,5 0,5 0,25
6 85 84,5 0,5 0,25
7 80 84,5 -4,5 20,25
8 75 84,5 -4,5 20,25
9 80 84,5 -9,5 90,25
10 70 84,5 -14,5 210,25
0 722,5

Berdasarkan kedua tabel diatas dapat dihitung a, b, serta variasi sebagai berikut :

= -12,76816609
= - 12,77

= 0,9307958478
= 0,93

= 80,2777778
= 80,28

= 80,2777778
= 80,28

=( )( – )

=( )( – )

= = 0,016887967 = 0,0017

= +

= 12,20 (1/10 + 10920,25/722,5)


= 19,6597301
= 19,66

Variasi ramalan individu Y untuk X yang diketahui (untuk X=100) adalah :

= 12,20 {1/10 + (100-104,5)2 : 722,5}


= 1,561937716 = 1,56

Variasi ramalan individu Y untuk X yang diketahui (untuk X=100) adalah :

= 12,20 {1 + 1/10 + (100-104,5)2 : 722,5}


= 13,76193772 = 13,76

C. Pengujian Signifikasi Koefisien Regresi

Menurut Irianto (2004:164), Langkah pertama adalah penyusunan hipotesis matematis


yang bentuknya sebagai berikut:
H0: =0
H1: 0
Dalam pengujian ini membutuhkan standard error dari koefisien regresi yang dapat dihitung
melalui perhitungan variance/variasi yang dapat dihitung dengan rumus :

=
Langkah kedua adalah mencari simpangan baku standard error koefisien regresi. Untuk soal
diatas, standard error koefisien regresinya adalah :

= = 0,01670238623

= 0,1292377121 = 0,13
Langkah ketiga adalah menghitung nilai t koefisien regresi b nilai t koefisien regresi b untuk
soal diatas adalah :

t = (b – )/

= (0,93 – 0) / 0,13
= 7,153846154 = 7,15
Jika menggunakan alpha 0,05 maka tabel dengan dk = 8 adalah 2,306. Dengan demikian
maka ditolak hipotesis nol, artinya koefisien regresi adalah signifikan sehingga ada
hubungan linear yang signifikan antara X dan Y, dan b= 0,93 bukan semata-mata
disebabkan oleh factor random (kebetulan) saja.
Langkah keempat adalah melakukan perhitungan tentang interval kepercayaan atas ramalan
yang dilakukan, artinya apabila meramal nilai Y dengan dasar nilai X, maka nilai Y itu akan
terletak diantara dua garis yang terletak diatas dan dibawah garis persamaan regresi linear.

B
Y
A
C

Garis A merupakan garis persamaan regresi


Garis B dan C merupakan batas confidence interval
Jarak antara garis B dan c dapat dihitung dengan rumus:

Untuk contoh diatas:


1. Persamaan regresi linear (garis B) adalah Y’ = -12,77 + 0,93X

2. Confidence interval (jarak BC) untuk nilai X = 100 dan alpha 0,05 adalah :

Y=

= 80,23 6,845985685
Jadi confidence interval untuk contoh diatas adalah diantara 87,07598569 dan 73,38401432.

Menurut Irianto (2004:167-168), langkah-langkah dalam perhitungan regresi linear


sederhana adalah :
1. Menghitung nilai a dan b untuk menentukan persamaan regresi linear sederhana.
2. Menguji signifikan koefisien regresi.

3. Menghitung variasi untuk selanjutnya digunakan untuk menentukan standar error

penafsiran.

4. Menentukan confidence interval dari penafsiran.

5. Menghitung koefisien korelasi, untuk menghitung koefisien determinasi.

6. Menguji signifikansi daripada koefisien korelasi.

7. Melakukan interpretasi.

D. Uji Linear Regresi Sederhana

Menurut Irianto (2004:172), Pengujian linearitas berkaitan dengan sum of squares sisa,
dimana sum of squares sisa dipisah menjadi dua bagian yaitu sum of squares ketidaksamaan,
dan sum of squares error. Dalam membahas ketidaksamaan perlu melihat
(mengelompokkan) Y berdasarkan nilai X, artinya kita cari simpangan nilai Y dalam setiap
kelompok X. Sehingga banyaknya derajat kebebasannya adalah k (banyaknya kelompok X)
dikurang dengan 2. Sedangkan sum of squares error merupakan selisih sum of squares sisa
dengan sum of squares ketidaksamaan, dengan derajat kebebasan n-k.
Langkah awal adalah menyusun penyebaran nilai-nilai data Y berdasarkan nilai X.
X Y

120 100

115 95

110 85

105 90

105 85

105 85

100 80

100 75

95 80
90 70

Berdasarkan tabel diatas dapat dihitung sum of squares error (SSerror) dengan rumus :

Keterangan :

x = merupakan jumlah simpangan setiap Y yang didasarkan pada pengelompokan


(kesamaan nilai ) X
nk = merupakan jumlah n setiap kelompok

Untuk contoh soal diatas squares ketidaksamaannya sebagai berikut:

= (1002 – 1002/1) + (952 – 952/1) + (852 – 852/1) + (902 + 852 + 852 – (90 + 85 +
85)2/3) + (802 + 752 (80 + 75)2/2) + (802 – 802/1) + (702 – 702/1)

= -

Untuk linearilitas akan menggunakan f tes, sedangkan hipotesisnya sebagai berikut:


H0 : persamaan regresi linear
H1 : persamaan regresi tidak linear
Sedangkan f hitung dicari dengan rumus :

F=

Untuk soal diatas f hitung adalah:


F = 13,5816 : 9,7223
= 1,396809725 = 1,40
Jika mengambil alpha 0,05 maka f 0,05 (5,3) = 9,01 (lihat tabel f)
Oleh karena f hitung lebih kecil daripada f tabel maka diterima hipotesis nol yang
menyatakan bahwa persamaan regresi yang diperoleh yaitu Y’ = -12,77 + 0,93X merupakan
persamaan regresi linear. Dengan demikian tidak perlu mencari model persamaan lain,
sebaliknya apabila ternyata persamaan regresi yang diperoleh tidak linear maka harus
mencari persamaan model lain.
Jika digabungkan hasil analisis variance tentang signifikansi koefisien regresi dan
linearitas persamaan regresi, maka tabel anovanya sebagai berikut :

Sumber variansi dk SS MS F

Total 10 72125

Regresi a 1 71402,5 71402,5

Regresi b/a 1 625,425 625,425 51,54

sisa 8 97,075 12,134375

Ketidaksamaan 5 67,908 13,5816 1,40

error 3 29,167 9,7223

Catatan : Uji linearitas mempunyai criteria penerimaan hipotesis nol terbalik dengan kriteria
yang lainnya.
2. KORELASI
Korelasi merupakan suatu hubungan antara satu variable dengan variable lainnya.
Hubungan tersebut dapat menunjukkan hubungan sebab akibat (korelasional), maupun
tidak (kausal). (Irianto,2004: 134).
Koefisien korelasi merupakan indeks atau bilangan yang digunakan untuk
mengukur keeratan (kuat, lemah, atau tidak) hubungan antarvariabel. (Hasan,2002:233).
Koefisien korelasi memiliki nilai antara -1 dan +1.
a. Jika nilai KK bernilai positif, maka variable-variabel berkorelasi positif.
b. Jika nilai KK bernilai negatif, maka variable-variabel berkorelasi negatif.
c. Jika KK bernilai 0 (nol) variable-variabel tidak menunjukkan korelasi.
d. Jika KK bernilai +1 atau -1, maka variabel menunjukkan korelasi positif
sempurna atau negative sempurna.

Untuk menentukan keeratan hubungan / korelasi antarvariabel tersebut, berikut ini


diberikan nilai-nilai dari KK sebagai patokan:

a. KK=0, tidak ada korelasi

b. 0<KK 0,20 , korelasi sangat rendah/ lemah sekali

c. 0,20<KK 0,40 , korelasi rendah/ lemah tapi pasti

d. 0,40<KK 0,70 , korelasi yang cukup berarti

e. 0,70<KK 0,90 , korelasi yang tinggi /kuat

f. 0,90<KK<1 , korelasi yang sangt tinggi /kuat sekali


g. KK=1 korelasi sempurna.

A. Korelasi Pearson (Product Moment Correlation)

Atau
Korelasi Pearson dapat pulo didasarkan pada Z skor

Dimana

Sd= Standar Deviasi

Contoh:

Sebuah penelitian yang mencari hubungan antara banyaknya jam belajar


mandiri perminggu mahasiswa dengan hasil belajar mahasiswa (indeks
prestasi mahasiswa)

Data 1.

Jumlah jam Belajar IP


20 3,1
18 4,0
15 2,8
20 4,0
10 3,0
12 3,6
16 4,0
14 3,2
18 3,5
12 4,0
Sumber : Data Fiktif
Maka untuk penyelesaiannya:

X Y X2 Y2 XY

20 3,1 400 9,61 62


18 4,0 324 16 72
15 2,8 225 7,84 42
20 4,0 400 16 80
10 3,0 100 9 30
12 3,6 144 12,96 43,2
16 4,0 256 16 64
14 3,2 196 10,24 44,8
18 3,5 324 12,25 63
12 4,0 144 16 48
155 35,2 2513 125,90 549

= 0,2289
=0,23
Maka terdapat korelasi positif lemah antara jam belajar mandiri perminggu
dengan indeks prestasi mahasiswa.

Data 2

Jam Belajar IP

40 3,80
35 3,60
30 3,25
25 3,00
25 2,95
25 3,05
20 2,50
15 2,00
10 1,50
5 1,00
Sumber : data fiktif
X rata-rata= 23 Y rata-rata =2,665
Sdx= 10,85 Sdy = 0,91

Maka penyelesaiannya :

X Y Zx Zy ZxZy

40 3.8 1.57 1.25 1.95


35 3.6 1.11 1.03 1.14
30 3.25 0.65 0.64 0.41
25 3 0.18 0.37 0.07
25 2.95 0.18 0.31 0.06
25 3.05 0.18 0.42 0.08
20 2.5 -0.28 -0.18 0.05
15 2 -0.74 -0.73 0.54
10 1.5 -1.20 -1.28 1.53
5 1 -1.66 -1.83 3.04
230 26,65 9,1315

r= 9,1315/10 =0,91315
Maka terdapat korelasi yang kuat sekali pada banyaknya jam belajar mandiri
perminggu dengan indeks prestasi mahasiswa

B. Korelasi Spearman
Apabila data yang kita hadapai mempunyai skala ordinal, maka korelasi
product moment tidak dapat digunakan. Untuk itu telah ditentukan rumus
sederhana tapi akurat. Yaitu, Spearman Correlation. Dengan rumus:

D= selisih antara X dan Y

Contoh:

Suatu penelitian terhadap hubungan antara rangking masuk mahasiswa dengan


rangking di kelas setelah ikut perkuliahan. Dari 10 mahasiswa diperoleh hasil :

Rangking tes masuk 1 2 3 4 5 6 7 8 9 10


Rangking kelas 10 7 8 6 5 3 4 2 9 1

Maka Penyelesaiannya :

D
X Y D 2
1 10 9.00 81.00
2 7 5.00 25.00
3 8 5.00 25.00
4 6 2.00 4.00
5 5 0.00 0.00
6 3 3.00 9.00
7 4 3.00 9.00
8 2 6.00 36.00
9 9 0.00 0.00
10 1 9.00 81.00
42 270

Maka korelasi negative yang cukup berarti terdapat pada hubungan antara
rangking tes masuk dengan rangking pada saat di kelas setalah mengikuti
perkuliahan.

Untuk dua buah data yang memiliki jenis data yang berbeda, missal data
pertama berskala ordinal sedangkan data kedua berskala interval, maka kita
menggunakan korelasi spearman, dengan mengubah skala interval menjadi
skala ordinal (rank)

C. Pendugaan Koefisien Korelasi Populasi


Untuk memahami pendugaan koefisien korelasi populasi
perhatikan contoh berikut :
Suatu sampel terdiri dari 12 pasang data, menghasilkan nilai r= 0,7.
Dengan tingkat keyakinan 0,95% . buatlah pendugaan interval bagi p.
1. Hitung Zr
2. Hitung

= 0,33

3. Hitung nilai Zα/2


α= 0,05
maka α/2 =0,025
Z0,025 = 1,96

4. Membuat pendugaan interval untuk

Zr- Zα/2 ≤ ≤ Zr+ Zα/2

Maka :

0,867- 1,96x0,33 ≤ ≤ 0,867+ 1,96x0,33

0,214 ≤ ≤ 1,52

5. Menghitung nilai p, dengan cara mentransformasi rumus ;

Diperoleh p =0,210 dan p=0,909


6. Membuat pendugaan interval bagi p dengan tingkat keyakinan 95%

0,210 ≤ ≤ 0,909

D. Pengujian Hipotesis Koefisien Korelasi Populasi (p)


Untuk asumsi p=0
1. Menentukkan formulasi hipotesis
H0 : p=0 ( tidak ada hubungan antara X dan Y)
H1: p>0 (ada hubungan positif)
P<0 (ada hubungan positif)
p≠0 (ada hubungan positif)
2. Menentukan t table, dengan db = n-2
3. Menentukan kriteria pengujian
H1 : p>0 (H0 diterima jika t≤ttabel)
H1 : p<0 (H0 diterima jika t≥ttabel)
H1 : p≠0 (H0 diterima jika -ttabel≤t≤ttabel )
4. Menentukkan niali uji statistik

5. Membuat kesimpulan
Menyimpulkan H0 diterima atau ditolak sesuai kriteria pengujian

3. HUBUNGAN KORELASI DAN REGRESI


Hubungan koefisien korelasi ( r ) dan regresi (b) :

Daftar Pustaka
Hasan, M.Iqbal.2002.Pokok-pokok Materi Statistik 2.Jakarta : Bumi Aksara
Irianto,Agus.2004.Statistik: Konsep Dasar, Aplikasi, dan Pengembangannya.Jakarta:Kencana

Anda mungkin juga menyukai