Analisis - Korelasi Regresi Linear
Analisis - Korelasi Regresi Linear
BAB X
ANALISIS KORELASI DAN REGRESI LINIER
A. Pengantar
Penentuan teknik analisis yang akan digunakan dalam suatu analisis -- biasanya dibahas
dalam metodologi penelitian -- sangat tergantung dari kerangka konseptual yang menjadi dasar
analisis dan tujuan dari pelaksanaan analisis. Agar hasil analisis dapat ditafsirkan secara tepat,
maka harus dihindari penggunaan teknik analisis yang tidak sesuai dengan skala pengukuran dari
variabel yang digunakan dalam analisis. Dalam mengkaji hubungan antara dua variabel atau
lebih, penting dipahami skala pengukuran dari setiap variabel tersebut, sehingga teknik analisis
yang akan digunakan untuk menjelaskan hubungan atau kaitan antara variabel tersebut dapat
dipilih yang paling sesuai. Apabila hal ini diabaikan, maka dapat menghasilkan interpretasi hasil
yang kurang tepat (misleading). Sebagai contoh, analisis regresi mensyaratkan bahwa variabel
yang digunakan paling tidak diukur secara interval, sehingga kalau ada salah satu variabel yang
diukur secara nominal atau ordinal maka hasil yang diperoleh tidak dapat ditafsirkan secara tepat,
oleh karena asumsi dalam penggunaan teknik ini yang tidak dapat dilanggar adalah bahwa
variabel yang digunakan mengikuti distribusi normal.
Pada bab ini teknik yang dibahas merupakan teknik analisis statistik inferensial, yaitu
teknik yang mendasarkan pada pemanfaatan data yang diperoleh dari suatu sampel acak, sehingga
hasilnya merupakan gambaran keadaan populasi dari mana sampel acak tersebut diambil. Teknik
statistik semacam ini memberikan jaminan bahwa kesimpulan dan penafsiran dibuat dengan
tingkat kesalahan yang rendah,5 biasanya dipakai 0,05 (5 %).
5 Tingkat kesalahan tersebut dalam teori probabilita dan uji hipotesis merupakan besarnya probabilita menolak
hipotesis benar, atau disebut kesalahan tipe-1. Istilah umum yang dipakai adalah tetapi istilah lain yang juga sering
dipakai adalah p-value, significancy of statistic (T, Z, 2, atau F), atau Pr>T, Pr>Z, Pr > 2, Pr > F tergantung
statistik uji yang digunakan.
BPS-UNFPA 96
Analisis Korelasi Dan Regresi Linier
Teknik analisis statistik yang dibahas dalam bab ini bersumber pada SPSS yang difokuskan
hanya pada teknik yang dapat menjelaskan hubungan atau kaitan antara beberapa variabel, baik
hubungan antara dua variabel (bivariate) maupun banyak variabel (multivariate). Pembahasan
diutamakan pada cara membaca dan menafsirkan arti dari parameter yang diperoleh dari hasil
pengolahan data yang terdapat pada output SPSS. Teknik analisis6 statistik yang dibahas meliputi
Analisis Regresi, Analisis Path, Multiple Classification Analysis (MCA), Tabel Kontingensi,
Model Logit, Model Log-Linear, Analisis Diskriminan, dan Analisis Faktor.
di mana ̂ i , i = 1,2,........p adalah koefisien regresi yang berarti besarnya perubahan pada Yˆ ,
jika Xi bertambah satu satuan dan variabel yang lain konstan, ̂ 0 adalah intercept. Residual e
mengikuti distribusi normal dengan rata-rata 0 dan varians konstan sebesar 2.
6 Para pembaca dianggap sudah memahami prinsip dasar dari Analysis of Variance (ANOVA), karena semua uji
statistik pada umumnya didasarkan pada dekomposisi dari total variance atas berbagai faktor penyebab perbedaan.
7 Analisis regresi dapat dipandang sebagai alat yang menjelaskan hubungan linear dari satu variabel ke variabel
lainnya didekomposisikan dan diuraikan (descriptive tool), dan sebagai alat untuk menginduksikan (to infer) hubungan
antar variabel pada populasi. Namun demikian keduanya dipandang dari segi teknik statistik sangat erat kaitannya,
tetapi keduanya dapat dipandang terpisah paling tidak pada tingkat konseptual. Lebih jelasnya lihat Kim, J. and F.J.
Kohout dalam Nie et. al Statistical Package for Social Sciences. Second edition. pp 321-322. New York: McGraw Hill
Book Company 1975.
BPS-UNFPA 97
Analisis Korelasi Dan Regresi Linier
Asumsi dasar dalam analisis regresi adalah (i) setiap Y yang merupakan kombinasi linier
atas X dan mengikuti distribusi normal, (ii) e tersebar secara acak dan tidak berpola mengikuti
besarnya nilai X, (iii) tidak terdapat hubungan (korelasi) yang tinggi antar variabel X.
Dengan model seperti pada persamaan (3.2) maka hipotesis yang diajukan untuk diuji adalah H 0:
1 = 0 terhadap H1: 1 0. Untuk menolak H0 harus dapat dibuktikan secara empirik bahwa 1 0
atau 1 bermakna (significant) atau dengan kata lain ada hubungan linier regresi antara Y dan X
seperti pada persamaan (3.2).
Dalam output SPSS 9.0 for Windows untuk subprogram REGRESION, yang pertama perlu
diketahui adalah apakah regresi Y pada X bermakna. Hal ini dapat dilihat pada output ANOVA
sebagai berikut:
ANOVA
Sum of Mean Uji hipotesis untuk mengetahui
Df F Sig.
Squares Squares apakah regresi Y pada X ada,
Tabel ANOVA dengan ̂
Model 1 Regresion 6475.18 1 6475.18 168.698 .000 =0,00 menunjukkan bahwa H
0
Residual 3185.81 83 38.38
ditolak regresi Y pada X
Total 9660.99 84
bermakna.
Selanjutnya adalah untuk mengetahui besarnya estimate koefisien regresi ( ̂ 1 ) serta standard
error-nya, ini dapat dilihat pada output COEFFICIENTS sebagai berikut:
BPS-UNFPA 98
Analisis Korelasi Dan Regresi Linier
COEFFICIENTS
Unstandardized Standardized
̂ 0 = 47,17 (intercept)
Coefficients Coefficients
B Std. Error Beta t Sig. ̂ 1 = 0,307 (koeffisien regresi)
Model 1 (Constant) 47.170 1.726 27.337 .000 Y akan berubah sebesar 0,31 unit
X .307 .024 .819 12.988 .000 untuk setiap perubahan satu unit
dari X.
Dapat dilihat bahwa karena regresi linier sederhana, maka pada dua tabel di atas t 2= F.
Beta=0,819 yang merupakan koef. regresi baku sebenarnya adalah sama dengan r = koefisien
korelasi antara Y dan X, karena beta dihitung berdasarkan vaiabel baku Z yang dihitung dengan
cara
X X
Z= , dengan SD = standard deviasi
SD x
Koefisien determinasi r2 = 0,670 (yaitu nilai Beta dikuadratkan atau (0.819) 2) berarti bahwa
variasi Y yang dapat dijelaskan oleh model sebesar 67 persen. Beberapa statistik dan estimasi dari
parameter dapat pula diperoleh seperti rata-rata dan standard deviasi serta korelasi dari Y dan X.
Para pembaca lebih lanjut dianjurkan untuk membaca SPSS Base 9.0 Application Guide.
BPS-UNFPA 99
Analisis Korelasi Dan Regresi Linier
pada variabel Y. Suatu kajian tersendiri perlu dilakukan untuk kemudian dapat memilah variabel
X yang berpengaruh secara parsial pada variabel Y.
Dengan model pada persamaan (3.1) maka uji hipotesis-nya adalah:
H0: 1 = 2 = .........= p = 0 dengan H1: salah satu i 0, (i = 1,2,.....,p) yang dari ouput SPSS
dapat dilihat pada output ANOVA dengan p=2 sebagai berikut
ANOVA
Sum of Mean
df F Sig.
Squares Squares
Dengan ̂ =0,00
Model 1 Regression 11101.959 2 5550.980 684.793 .000
mengindikasi-kan bahwa
Residual 843.031 104 8.106
regresi Y pada X1 dan X2
Total 11944.991 106 signifikan.
Secara umum model regresi dengan Y pada X 1 dan X2 dapat digunakan lebih lanjut, namun
demikian untuk mengetahui apakah X1 dan X2 secara parsial berpengaruh terhadap Y dapat diuji
dengan melihat output COEFFICIENT sebagai berikut:
COEFFICIENTS
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
Model 1 (Constant) 82.677 .626 132.176 .000 X1 dan X2 secara parsial ber-
X1 -.662 .263 -.119 -2.518 .013 pengaruh nyata pada Y tingkat
-.240 .013 -.863 -18.326 signifikansi (p-value) masing-
X2 .000
masing 0,013 dan 0,000.
Seberapa besar variasi dari variabel Y yang dapat dijelaskan oleh model dapat dilihat dari
koefisien determinasi pada output MODEL SUMMARY berikut:
MODEL SUMMARY
Variables Std. Error
Model Adjusted of the
Entered Removed R R Square R Square Estimate
BPS-UNFPA 100
Analisis Korelasi Dan Regresi Linier
Dengan menggunakan R2a = 0,928 maka variasi dari Y yang dapat dijelaskan oleh model adalah
sebesar 93 persen.
8 Terdapat dua cara lain, yaitu forward selection dan backward elimination, tetapi stepwise selection merupakan
metode pemilihan yang paling tepat. Lebih lanjut tentang hal ini lihat SPSS Base 9.0 Application Guide pp. 216.
BPS-UNFPA 101
Analisis Korelasi Dan Regresi Linier
MODEL SUMMARY
Isian kolom Adjusted R Square Change merupakan selisih
Model Adjusted
R Adjusted dari Adjusted R Square pada suatu baris terhadap baris
(variables in R R Square
Square R Square sebelumnya di mana suatu variabel belum termasuk dalam
the model) Change
model.
Interpretasi
3. Diagnostik Model
Perlu dipastikan apakah model yang secara empirik adalah signifikan atau [Pr>F]<0,05
merupakan model yang tepat (fit). Dalam hal ini uji kecocokan model (Gooodness of Fit test)
yang secara umum ditunjukkan oleh besarnya R2 masih harus dilanjutkan dengan beberapa
langkah lain untuk melihat apakah asumsi dasar pembentukan model dipenuhi atau tidak.
Asumsi yang perlu diuji adalah (1) residual (e) tersebar secara acak dan tidak mempunyai
pola tertentu mengikuti X serta mempunyai varians konstan, dan (2) tidak adanya
multikolinieritas antara variabel X.
BPS-UNFPA 102
Analisis Korelasi Dan Regresi Linier
Sebagai contoh analisis korelasi dan regresi linier pada bab ini adalah mendapatkan
persamaan regresi linier antara variabel fertilitas (jumlah anak kandung yang dilahirkan hidup)
dengan umur saat perkawinan pertama, jumlah tahun dalam ikatan perkawinan, jumlah anak yang
telah meninggal dan pemakaian alat KB, bagi wanita pernah kawin dan berusia 10 – 49 tahun.
Untuk menyiapkan data analisis ini diperlukan data k99p17i.sav dengan manipulasi data sebagai
berikut:
a. Pastikan Anda bekerja dengan data Susenas individu (k99p17i.sav).
b. Lakukan proses Select Cases untuk case jenis kelamin wanita, usia 10 – 49 tahun dan pernah
kawin. Case yang tidak sesuai dengan kondisi, akan difilter.
c. Lakukan Recode variabel k7r35 menjadi variabel KB dengan kondisi jika variabel k7r35
berisi 1 maka variabel KB berisi kode 1, jika variabel k7r35 berisi selain kode 1 maka
variabel KB berisi kode 2, sedangkan jika variabel k7r35 berupa missing value (responden
tersebut tidak termasuk target fertilitas) maka pada variabel KB berisi kode 0.
d. Simpan data tersebut dengan nama Multiple Regresi.sav.
BPS-UNFPA 103
Analisis Korelasi Dan Regresi Linier
Regression
Linear
d. Ketika muncul kotak dialog Linear Regression, maka lakukan beberapa hal antara lain.
Isikan variabel k7r34a
sebagai Dependent
Variabel k7r32, k7r33,
k7r34c dan KB ke dalam
kotak Independent(s).
Untuk memilih metode
regresi ini, Anda dapat
memilihnya pada drop
down list pada Method.
Sebagai contoh Anda pilih
Stepwise.
Jika Anda menginginkan
untuk menghitung regresi hanya pada daerah kota saja (daerah = 1).
e. Klik Statistics… sehingga muncul
kotak dialog Linear Regression:
Statistics, kemudian lakukan beberapa
hal antara lain:
pilih beberapa pilihan dalam
Regression Coefficients.
Pilih pilihan Durbin-Watson
dalam Residuals.
Pilih beberapa pilihan yang lain.
Klik Continue.
BPS-UNFPA 104
Analisis Korelasi Dan Regresi Linier
f. Klik Plots.. sehingga muncul kotak dialog Linear Regression: Plots, kemudian lakukan
beberapa hal antara lain:
Pilhlah pilihan pada Standardized
Residual Plots.
Masukkan variabel DEPENDENT
ke dalam kotak X, sedangkan
variabel *ZRESID pada kotak Y.
Klik Continue.
g. Klik Save… jika Anda ingin menyimpan hasil penghitungan regresi ini menjadi variabel
dalam data Anda. Ketika muncul kotak dialog Linear Regression: Save, pilihlah variabel
yang akan disimpan ke dalam data Anda. Lanjutkan dengan klik Continue.
h. Klik Options… untuk mengatur:
Kriteria uji signifikasi uji F yang akan digunakan oleh SPSS 9.0 for Windows dalam
setiap tahapan proses sesuai dengan metode yang digunakan.
Memasukkan atau tidak memasukkan konstanta dalam output regresi.
Menangani missing value.
Klik Continue.
i. Klik OK.
BPS-UNFPA 105
Analisis Korelasi Dan Regresi Linier
Output yang dihasilkan oleh prosedur regresi linier pada SPSS 9.0 for Windows yang telah
Anda lakukan tersebut antara lain sebagai berikut.
Descriptive Statistics
BPS-UNFPA 106
Analisis Korelasi Dan Regresi Linier
Correlations
BPS-UNFPA 107
Analisis Korelasi Dan Regresi Linier
Variables Entered/Removeda
Variables Variables
Model Entered Removed Method
1 Stepwise
(Criteria:
Probabilit
Jml thn y-of-F-to-e
dlm ikatan nter <=
,
perkawina ,050,
n Probabilit
y-of-F-to-r
emove >=
,100).
2 Stepwise
(Criteria:
Probabilit
y-of-F-to-e
A.K sudah nter <=
,
meninggal ,050,
Probabilit
y-of-F-to-r
emove >=
,100).
3 Stepwise
(Criteria:
Probabilit
y-of-F-to-e
Pernah KB nter <=
,
Atau Tidak ,050,
Probabilit
y-of-F-to-r
emove >=
,100).
a. Dependent Variable: A.K lahir hidup
BPS-UNFPA 108
Analisis Korelasi Dan Regresi Linier
Model Summaryd
Change Statistics
Adjusted Std. Error of R Square Durbin-W
Model R R Square R Square the Estimate Change F Change df1 df2 Sig. F Change atson
1 ,757a ,574 ,573 1,29 ,574 2674,772 1 1989 ,000
2 ,822b ,676 ,676 1,13 ,103 630,596 1 1988 ,000
3 ,825c ,681 ,681 1,12 ,005 30,542 1 1987 ,000 1,951
a. Predictors: (Constant), Jml thn dlm ikatan perkawinan
b. Predictors: (Constant), Jml thn dlm ikatan perkawinan, A.K sudah meninggal
c. Predictors: (Constant), Jml thn dlm ikatan perkawinan, A.K sudah meninggal, Pernah KB Atau Tidak
d. Dependent Variable: A.K lahir hidup
ANOVAd
Sum of
Model Squares df Mean Square F Sig.
1 Regression 4469,949 1 4469,949 2674,772 ,000a
Residual 3323,920 1989 1,671
Total 7793,868 1990
2 Regression 5270,397 2 2635,198 2076,019 ,000b
Residual 2523,471 1988 1,269
Total 7793,868 1990
3 Regression 5308,598 3 1769,533 1414,760 ,000c
Residual 2485,271 1987 1,251
Total 7793,868 1990
a. Predictors: (Constant), Jml thn dlm ikatan perkawinan
b. Predictors: (Constant), Jml thn dlm ikatan perkawinan, A.K sudah meninggal
c. Predictors: (Constant), Jml thn dlm ikatan perkawinan, A.K sudah meninggal,
Pernah KB Atau Tidak
d. Dependent Variable: A.K lahir hidup
BPS-UNFPA 109
Analisis Korelasi Dan Regresi Linier
Coefficientsa
Standardi
zed
Unstandardized Coefficien
Coefficients ts 95% Confidence Interval for B Correlati
Model B Std. Error Beta t Sig. Lower Bound Upper Bound Zero-order Partia
1 (Constant) ,430 ,056 7,696 ,000 ,321 ,540
Jml thn dlm ikatan
,185 ,004 ,757 51,718 ,000 ,178 ,192 ,757 ,7
perkawinan
2 (Constant) ,516 ,049 10,554 ,000 ,420 ,612
Jml thn dlm ikatan
,161 ,003 ,658 49,306 ,000 ,154 ,167 ,757 ,7
perkawinan
A.K sudah meninggal ,937 ,037 ,335 25,112 ,000 ,864 1,010 ,529 ,4
3 (Constant) ,893 ,084 10,665 ,000 ,728 1,057
Jml thn dlm ikatan
,158 ,003 ,646 48,086 ,000 ,151 ,164 ,757 ,7
perkawinan
A.K sudah meninggal ,952 ,037 ,341 25,632 ,000 ,879 1,024 ,529 ,4
Pernah KB Atau Tidak -,295 ,053 -,071 -5,526 ,000 -,400 -,190 -,160 -,1
a. Dependent Variable: A.K lahir hidup
BPS-UNFPA 110
Analisis Korelasi Dan Regresi Linier
efficientsa
00 ,420 ,612
BPS-UNFPA 111
Analisis Korelasi Dan Regresi Linier
Excluded Variablesd
Collinearity Statistics
Partial Minimum
Model Beta In t Sig. Correlation Tolerance VIF Tolerance
1 Umur perkawinan a
-,045 -2,955 ,003 -,066 ,906 1,103 ,906
pertama
A.K sudah meninggal ,335a 25,112 ,000 ,491 ,913 1,095 ,913
Pernah KB Atau Tidak -,047a -3,188 ,001 -,071 ,978 1,023 ,978
2 Umur perkawinan b
-,024 -1,814 ,070 -,041 ,903 1,108 ,843
pertama
Pernah KB Atau Tidak -,071b -5,526 ,000 -,123 ,972 1,028 ,888
3 Umur perkawinan c
-,020 -1,510 ,131 -,034 ,900 1,111 ,825
pertama
a. Predictors in the Model: (Constant), Jml thn dlm ikatan perkawinan
b. Predictors in the Model: (Constant), Jml thn dlm ikatan perkawinan, A.K sudah meninggal
c. Predictors in the Model: (Constant), Jml thn dlm ikatan perkawinan, A.K sudah meninggal, Pernah KB Atau Tidak
d. Dependent Variable: A.K lahir hidup
BPS-UNFPA 112
Analisis Korelasi Dan Regresi Linier
Coefficient Correlationsa
BPS-UNFPA 113
Analisis Korelasi Dan Regresi Linier
Collinearity Diagnosticsa
Variance Proportions
Jml thn dlm
Condition ikatan A.K sudah Pernah KB
Model Dimension Eigenvalue Index (Constant) perkawinan meninggal Atau Tidak
1 1 1,855 1,000 ,07 ,07
2 ,145 3,582 ,93 ,93
2 1 2,120 1,000 ,05 ,05 ,07
2 ,742 1,690 ,05 ,02 ,87
3 ,138 3,918 ,90 ,93 ,05
3 1 2,903 1,000 ,01 ,02 ,03 ,01
2 ,808 1,895 ,01 ,00 ,87 ,01
3 ,232 3,534 ,01 ,64 ,08 ,20
4 5,623E-02 7,185 ,98 ,33 ,02 ,77
a. Dependent Variable: A.K lahir hidup
BPS-UNFPA 114
Analisis Korelasi Dan Regresi Linier
Casewise Diagnosticsa
A.K lahir
Case Number Std. Residual hidup
494 5,492 11
549 3,323 10
1055 -3,243 2
1163 3,139 9
1421 3,430 13
1772 3,562 9
2339 -4,221 0
3219 3,233 8
4186 3,931 11
4295 -3,384 2
4361 6,104 12
4860 -3,093 0
4963 3,532 12
5605 3,233 8
5709 3,403 9
5895 3,421 9
6431 3,257 9
7193 -3,450 1
7615 3,253 9
7678 3,119 6
7723 -3,093 0
7855 3,920 8
7904 3,374 8
8697 3,210 8
9486 -3,327 1
9750 3,210 8
9837 -3,375 0
10217 3,233 8
a. Dependent Variable: A.K lahir hidup
BPS-UNFPA 115
Analisis Korelasi Dan Regresi Linier
Residuals Statisticsa
Histogram
Dependent Variable: A.K lahir hidup
600
500
400
300
200
Frequency
,75
E x p e c te d C u m P ro b
,50
,25
0,00
0,00 ,25 ,50 ,75 1,00
BPS-UNFPA 116
Analisis Korelasi Dan Regresi Linier
Scatterplot
R e g re s s io n S ta n d a r d iz e d R e s id u a l
Dependent Variable: A.K lahir hidup
8
-2
-4
-6
-2 0 2 4 6 8 10 12 14
BPS-UNFPA 117