Anda di halaman 1dari 11

KOEFISIEN KORELASI R-PEARSON DAN ANALISIS REGRESI LINIER

Dalam praktikum kali ini akan dilakukan beberapa cara pengolahan data interval-rasio, yaitu teknik
pengukuran dengan koefisien korelasi r-pearson dan analisis regresi linier. Teknik pengukuran ini
dilakukan untuk menjelaskan keberadaan, kekuatan, dan arah hubungan dari variabel-variabel yang
kita analisis yang ditunjukkan melalui adanya rentang nilai pengukuran hubungan (-1) hingga (+1),
angka 0 menunjukkan tidak ada hubungan, sedangkan angka (+/-)1 menunjukkan ada hubungan
sempurna. Tanda positif atau negatif (+/-) menunjukan arah hubungan, dimana positif (+)
menunjukkan arah hubungan yang sama sedangkan negatif (-) menunjukkan arah hubungan yang
berlawanan. Teknik pengukuran koefisien korelasi r-pearson digunakan untuk mengukur hubungan
dua variabel yang diukur dalam skala interval rasio, sedangkan analisis regresi linier digunakan untuk
melihat pola hubungan (linier).

A. KOEFISIEN KORELASI R-PEARSON


Koefien korelasi r-pearson mengukur keeratan hubungan di antara hasil-hasil pengamatan dari
populasi yang mempunyai dua varian (bivariate). Pengukuran ini hanya cocok untuk mengukur
derajat hubungan antara variabel yang terkait secara linier. Perhitungan ini mensyaratkan bahwa
populasi asal sampel mempunyai dua varian dan berdistribusi normal. Korelasi ini digunakan untuk
mengukur data interval-rasio. Sebagai contoh kasus, di bawah ini terdapat tabel data luas lahan
pertanian dan jumlah produksi padi pada beberapa kecamatan di Kabupaten X.

Modul Praktikum V: Analisis Asosiasi

Langkah pengolahan data dengan SPSS untuk mengetahui hubungan antarvariabel adalah sebagai
berikut:

Dari menu Analyze, pilih sub menu Correlate lalu pilih Bivariate, kemudian akan keluar
tampilan sebagai berikut:

Masukkan variabel luas lahan dan produksi ke dalam kotak Variables dan untuk mengukur
korelasi data pada contoh kasus yang kuantitatif dan berskala rasio, pilih Pearson pada bagian
Correlation Coefficients. Kemudian pada bagian Test of Significance pilih Two-tailed
karena kita akan menguji dua sisi. Terakhir, berikan checklist pada bagian Flag Significant
Correlations untuk melihat tingkat signifikansi.

Sedangkan pada bagian Options dibiarkan default (standar) SPSS yaitu pada pilihan Exclude
Cases Pairwise. Sehingga akan tampak pada layar:

Modul Praktikum V: Analisis Asosiasi

Output dan interpretasi

Dari tabel di atas, kita mengetahui bahwa terdapat korelasi yang kuat antara variabel luas lahan
pertanian dengan prosuksi padi yang ditunjukkan oleh angka 0.995. Selain itu, nilai (+) positif
pada hubungan tersebut menunjukan arah hubungan yang sama antara variabel-variabel tersebut,
jadi produksi padi akan meningkat seiring meningkatnya luas lahan pertanian. Berdasarkan tabel
data tersebut, kita juga dapat mengetahui bahwa kedua variabel tersebut berkorelasi secara
signifikan.

Modul Praktikum V: Analisis Asosiasi

B. ANALISIS REGRESI LINIER


Analisis regresi digunakan terutama untuk tujuan peramalan atau melihat pola hubungan (linier) antar
dua variabel, di mana dalam model tersebut ada sebuah variabel dependen (tergantung) dan variabel
independen (bebas) yang mempengaruhi besar variabel dependen. Dalam analisis regresi, akan
dikembangkan sebuah estimating equation (persamaan regresi), yaitu suatu formula yang mencari
nilai variabel dependen dari nilai variabel independen yang diketahui yang ditunjukkan oleh rumus
berikut:

y = a + bx
Dimana, y = variabel dependen
x = variabel independen
a = titik potong sumbu regresi dengan sumbu y
b = kelerengan garis regresi
Langkah pengolahan data dengan SPSS untuk mengetahui pola hubungan antarvariabel adalah
sebagai berikut:

Dari menu Analyze, pilih sub menu Regression lalu pilih Linear untuk uji regresi secara
linier, kemudian akan keluar tampilan sebagai berikut:

Untuk pengisian kotak dialog, maka dilakukan langkah-langkah sebagai berikut:

Dalam kasus ini, variabel dependen yang akan diprediksi yaitu produksi, maka masukkan
variabel produksi pada kotak Dependent.

sedangkan variabel lainnya yaitu merupakan variabel independen (bebas) yaitu luas lahan
dimasukkan pada kotak Independent.

Oleh karena kasus didasarkan pada daerah-daerah, maka masukkan variabel daerah ke kotak
Case Labels.

Untuk metode memasukkan/seleksi variabel, untuk keseragaman, pilih default yang ada, yaitu
Enter pada bagian Method.

Modul Praktikum V: Analisis Asosiasi

Pilih kolom Statistics dengan klik mouse pada pilihan tersebut. Maka akan tampak pada layar:

Lalu lakukan langkah-langkah sebagai berikut:


-

Untuk Regression Coefficient atau perlakuakn koefisien regresi, tetap aktifkan pilihan
Estimates (default dari SPSS).

Klik mouse pada pilihan Descriptive pada kolom sebelah kanan, serta tetap aktifkan Model
Fit.

Pada bagian Residuals klik mouse pada Casewise Diagnostics dan dari situ pilih all cases
untuk melihat pengaruh regresi terhadap setiap daerah.

Klik Continue untuk meneruskan.

Pilih kolom Plots atau berhubungan dengn gambar/grafik untuk regresi. Maka akan trampak pada
layar:

Lalu lakukan langkah-langkah sbagai berikut:

Modul Praktikum V: Analisis Asosiasi

Klik mouse pada pilihan SDRESID dan masukkan ke pilihan Y. Lalu klik mouse sekali lagi
pada pilihan ZPRED dan masukkan ke pilihan X. kemudian klik tombol Nexr untuk
pengisian plot kedua.

Tampak variabel X dan Y kembali kosong kembali. Sekarang klik mouse pada pilihan
ZPRED dan masukkan ke pilihan Y. Lalu klik mouse sekali lagi pada pilihan DEPENDNT
dan masukkan ke pilihan X. Kemudian klik tombol Nextuntuk melanjutkan pengisian plot
ketiga.

Untuk plot ketiga, pada pilihan Standardized Residual Plots, klik mouse pada
NormalProbability Plot.

Klik Continue untuk kembali ke kotak dialog utama.

Pilih kolom Options dengan klik mouse pada pilihan tersebut, maka kan tampak pada layar:

Lalu lakukan hal-hal sebagai berikut:


-

Untuk Stepping Method Criteria, digunakan uji F yang mengambil standar probabilitas
sebesar 5%. Oleh karena itu, angka Entry .05 atau 5% dipilih.

Pilihan default Include constant in equation atau menyertakan persamaan regresi, tetap
dipilih.

Penanganan Missing Value atau data yang hilang, digunakan default dari SPSS, yaitu
Exclude cases listwise karena data kasus tidak ada yang hilang.

Klik Continue untuk kembali ke kotak dialog utama.

Tekan OK untuk proses data.

Modul Praktikum V: Analisis Asosiasi

Output SPSS dan Interpretasi


Oleh karena output regresi sangat banyak, maka analisis regresi akan dibahas bagian per bagian agar
lebih dalam, yaitu sebagai berikut:
Des criptive Statistics
Mean
produksi
10947.94
luas lahan 2160.5429

Std. Deviation
11249.17998
2180.27147

N
35
35

Tabel di atas menunjukkan hasil analisis statistik deskriptif (Mean, Standar Deviasi, dan jumlah data)
dari kedua variabel. Dari data di atas ditunjukkan nilai rata-rata untuk produksi sebesar 1097,94 kg
sedangkan luas lahan sebesar 2160,5429 km2. Sedangkan standar deviasinya 11249,18 kg untuk
produksi dan 2180,27 km2 untuk luas lahan dari jumlah data 35 buah.
Cor relations
Pearson Correlation
Sig. (1-tailed)
N

produksi
luas lahan
produksi
luas lahan
produksi
luas lahan

produksi
1.000
.998
.
.000
35
35

luas lahan
.998
1.000
.000
.
35
35

Dari tabel di atas, kita mengetahui bahwa terdapat korelasi yang kuat antara variabel luas lahan
pertanian dengan prosuksi padi yang ditunjukkan oleh angka 0.995. Selain itu, nilai (+) positif pada
hubungan tersebut menunjukan arah hubungan yang sama antara variabel-variabel tersebut, jadi
produksi padi akan meningkat seiring meningkatnya luas lahan pertanian.
Variables Enter ed/Re m ovebd
Model
1

Variables
Entered
luas lahana

Variables
Remov ed
.

Method
Enter

a. All requested variables entered.


b. Dependent Variable: produks i

Tabel ini menunjukkan variabel yang dimasukkan adalah variabel luas lahan dan tidak ada variabel
yang dikeluarkan (removed). Hal ini disebabkan metode yang digunakan adalah single step (enter)
dan bukannya stepwise.
b
Model Sum m ary

Model
1

R
.998 a

R Square
.997

Adjusted
R Square
.997

Std. Error of
the Estimate
637.64054

a. Predictors: (Constant), luas lahan


b. Dependent Variable: produksi

Tabel di atas menggambarkan hubungan antara kedua variabel, semakin besar nilai R square maka
semakin erat hubungannya sehingga dapat disimpulkan bahwa kedua vaiabel di atas dengan nilai R2
sebesar 0.997 memiliki hubungan yang sangat erat bahkan hampir sempurna.
Modul Praktikum V: Analisis Asosiasi

ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares
4.3E+009
13417320
4.3E+009

df
1
33
34

Mean Square
F
4289080386 10549.025
406585.464

Sig.
.000 a

a. Predictors: (Constant), luas lahan


b. Dependent Variable: produksi

Dari uji ANOVA atau F test di atas, didapat F hitung 10549,025 dengan tingkat signifikansi 0,000.
Oleh karena probabilitas (0,000) lebih kecil dari 0,05, maka model regresi bisa dipakai untuk
memprediksi produksi.
Coe fficientsa

Model
1

(Cons tant)
luas lahan

Unstandardiz ed
Coef f icients
B
Std. Error
-182.052
152.839
5.151
.050

Standardized
Coef f icients
Beta
.998

t
-1.191
102.708

Sig.
.242
.000

a. Dependent Variable: produksi

Tabel selanjutnya menggambarkan persamaan regresi:


Y = ( 182,052) + 5,151X
Dimana, Y = Produksi
X = Luas lahan
Persamaan regresi yang didapat di atas selanjutnya akan diuji apakh memang valid untuk
memprediksi variabel dependen. Dengan kata lain akan dilakukan pengujian apakah luas lahan
pertanian benar-benar bisa memprediksi produksi pada di masa mendatang.

Modul Praktikum V: Analisis Asosiasi

a
Cas ew is e Diagnos tics

Case Number
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

Std. Residual
-.423
1.075
1.787
1.056
.765
.238
.401
.158
-.122
.357
.285
.285
.195
.270
.254
.354
.465
.581
.067
-.013
.087
.213
.279
.145
.079
.148
.205
.203
-.773
-3.381
-.455
.548
-.540
-3.023
-1.770

produksi
7770.00
16648.00
29641.00
16945.00
30911.00
5492.00
4483.00
7095.00
8379.00
17602.00
7804.00
1653.00
2595.00
1788.00
1948.00
11918.00
43928.00
38933.00
3405.00
3421.00
641.00
2478.00
841.00
2491.00
3701.00
2869.00
2612.00
2961.00
2596.00
22183.00
25069.00
14133.00
11111.00
14030.00
13103.00

Predicted
V alue
8039.7113
15962.688
28501.392
16271.777
30422.894
5340.3355
4227.6157
6993.9608
8456.9812
17374.194
7622.4414
1471.5736
2470.9609
1615.8151
1785.8139
11692.111
43631.290
38562.233
3362.1670
3429.1362
585.5190
2342.1738
662.7912
2398.8401
3650.6499
2774.8982
2481.2638
2831.5645
3089.1385
24338.996
25358.989
13783.612
11455.143
15957.537
14231.791

Residual
-269.711
685.31162
1139.608
673.22279
488.10575
151.66448
255.38428
101.03923
-77.98124
227.80595
181.55861
181.42637
124.03914
172.18491
162.18605
225.88898
296.70966
370.76651
42.83301
-8.13624
55.48102
135.82616
178.20881
92.15987
50.35010
94.10179
130.73618
129.43551
-493.139
-2156.00
-289.989
349.38789
-344.143
-1927.54
-1128.79

a. Dependent V ariable: produksi

Tabel di atas memperlihatkan hasil prediksi dari persamaan regresi. Semakin kecil Residual atau
Standardized Residual akan semakin baik bagi persamaan regresi dalam memprediksi data
Res iduals Statisticsa
Predicted V alue
Std. Predicted V alue
Standard Error of
Predicted V alue
A djusted Predic ted V alue
Residual
Std. Residual
Stud. Res idual
Deleted Residual
Stud. Deleted Res idual
Mahal. Distance
Cook's Dis tance
Centered Leverage V alue

Minimum
585.5190
-.923

Max imum
43631.29
2.910

Mean
10947.94
.000

Std. Deviation
11231.62602
1.000

107.894

335.972

144.561

49.033

35

582.3763
-2156.00
-3.381
-3.507
-2319.22
-4.360
.002
.000
.000

43517.26
1139.608
1.787
1.884
1266.809
1.964
8.468
.466
.249

10940.96
.00000
.000
.005
6.98124
-.035
.971
.033
.029

11214.41350
628.19350
.985
1.016
668.57043
1.159
1.723
.087
.051

35
35
35
35
35
35
35
35
35

35
35

a. Dependent V ariable: produksi

Bagian ini membuat ringkasan yang meliputi nilai minimum dan maksimum, mean dan standar
deviasi dari predicted value (nilai yang diprediksi) dan statistik residu.

Modul Praktikum V: Analisis Asosiasi

Charts
Bagian ini digunakan untuk menganalisis apakh syarat persamaan regresi terpenuhi. Berikut uji model
regresi menggunakan output chart yang relevan.
a. Persyaratan NORMALITAS
Berikut gambar dari Normal Probability Plot:

Normal P-P Plot of Regression Standardized Residual

Dependent Variable: produksi

Pamijahan

1.0

Expected Cum Prob

Cibungbula
0.8

0.6

0.4

0.2

0.0

Leuwiliang
Sukajaya
SukamakmurCiampea
Jonggol
Babakan Ma
Ciomas
Megamendun
Cisarua Ciawi
Cariu
Citeureup
Bojonggede Tamansari
CibinongCaringin
Gunung Put
DramagaCiseeng
Parung
Cileungsi
KemangRancabungu Sukaraja
Klapanungg
Cijeruk
Cigudeg
Jasinga
Nanggung
Gunung Sin
Rumpin
Tenjo
Parung Pan
0.0

0.2

0.4

0.6

0.8

1.0

Observed Cum Prob

Jika residual berasal dari distribusi normal, maka nilai-nilai sebaran data (lihat noktah dengan
nama daerah) akan terletak di sekitar garis lurus. Terlihat bahwa sebaran data pada chart di atas
bisa dikatakan tersebar di sekitar garis lurus tersebut (tidak terpencar jauh dari garis lurus). Maka
dapat dikatakan persyratan Normalitas dapat dipenuhi.
b. Persyaratan Kelayakan Model Regresi (Model Fit)
Scatterplot

Regression Studentized Deleted (Press)


Residual

Dependent Variable: produksi


Pamijahan

2
CibinongCiomas
MegamendunCiawi
Sukaraja
Cisarua Babakan MaDramaga
0

Leuwiliang
Cibungbula
Sukajaya
Caringin

Ciampea

TamansariSukamakmur
Cileungsi Cijeruk
Gunung Put
RancabunguBojonggede
Citeureup Kemang Nanggung Jasinga
Klapanungg Gunung Sin

Jonggol

Cariu

Cigudeg

Parung Pan
-2

Tenjo
-4

Rumpin

-1

Regression Standardized Predicted Value

Jika model regresi layak dipakai untuk prediksi (fit), maka data akan berpencar di sekitar angka
nol (0 pada sumbu Y) dan tidak membentuk sutu pola atau trend tertentu. Dari chart di atas
terlihat sebaran data sebagian besar terfokus di sekitar titik nol, serta tidak tampaknya suatu pola
atau trend tertentu pada sebaran data tersebut. Dapat dikatakan model regresi memenuhi
syaratuntuk memprediksi variabel dependennya.
Modul Praktikum V: Analisis Asosiasi

10

c. Persyaratan model Fit Tiap Data


Gambar ketiga menunjukkan hubungan antara variabel dependen dengan nilai prediksinya.
Scatterplot

Dependent Variable: produksi


Cariu

Regression Standardized Predicted


Value

3
Jonggol

Ciampea
Pamijahan
Cigudeg
Rumpin

Caringin
Tenjo
Cibungbula
Parung Pan
Sukajaya Leuwiliang
Tamansari
Sukamakmur
0
Jasinga
DramagaNanggung
CiteureupCiomas
CijerukCiawi
Cileungsi
Kemang Klapanungg
Parung
Cisarua
Rancabungu
Megamendun
-1 Gunung PutSukarajaBojonggede
Babakan Ma
0.00

10000.00

20000.00

30000.00

40000.00

50000.00

produksi

Jika model memenuhi syarat, maka sebaran data akan berada mulai dari kiri bawah lurus ke arah
kanan atas. Terlihat sebaran data di atas memang membentuk arah seperti yang disyaratkan
sehingga bisa dikatakan model regresi sudah layak digunakan.

Modul Praktikum V: Analisis Asosiasi

11

Anda mungkin juga menyukai