DENGAN SOFTWARE R
1
Langkah Penting dalam
Perencanaan Model Bagi
Peneliti
2
MODEL REGRESI LINEAR GANDA
• Model Populasi
POPULASI 𝑦 = 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝜀
• Taksiran Model
𝑦ො = 𝛽መ0 + 𝛽መ1 𝑥1 + ⋯ + 𝛽መ𝑘 𝑥𝑘
𝑦ො = 𝑏0 + 𝑏1 𝑥1 + ⋯ + 𝑏𝑘 𝑥𝑘
SAMPEL
Contoh Tabel 5.1 Hal 127
Misalnya, kita akan meneliti variasi berat badan (Y)
dikaitkan dengan tinggi badan (X1) dan umur (X2)
untuk anak-anak yang memiliki masalah atau
kekurangan gizi.
- Peubah terikat: berat badan,
- Peubah Bebas : tinggi badan dan umur
- Andaikan bahwa sebuah sampel acak terdiri dari
12 anak yang mengunjungi sebuah klinik.
- Data berat (kg), tinggi (cm), dan umur (tahun)
diperoleh untuk setiap anak .
4
Analisis dengan Software R
- Perintah untuk menghapus semua objek dari “Global
Environment”
> rm (list=ls())
> remove (list =ls())
- Perintah untuk menghapus beberapa objek saja misalnya
variable X1, X2 dan y
> remove (list=c (“y”, “X1”, “X2”))
- Perintah untuk melihat semua objek dari “Global
Environment
> ls ( )
5
Analisis dengan Software R
- Perintah untuk membersihkan layer: Ctr +L
- Operator Assignment
Operator panah kiri ( <-)
- Vector : object data dalam R
jenis vector: numeric dan character
Fungsi untuk membuat sebuah vector: c ( )
6
Beberapa referensi yang bisa dibaca untuk mengenal R
dan R studio dan Analisis Regresi dengan R
https://bookdown.org/aepstk/intror/
http://www.blognafaro.com/2013/10/analisis-regresi-linear-berganda-dengan-
Software-R.html
https://www.konsultanstatistik.com/2011/07/koefisien-determinasi-pada-regresi.html
https://statlover.wordpress.com/2012/04/27/analisis-regresi-linear-aplikasi-pada-
r-software/
7
Langkah Analisis dengan Software R
8
Langkah Analisis dengan Program
R
4. Membaca data dengan menulis script
Data3 <- read.csv("Latih3.csv")
5. Lakukan Analisis Regresi dengan menulis
script:
g3<-lm(y ~ X1 + X2, data=Data3)
summary(g3)
anova(g3)
9
Langkah Analisis dengan Software R
Langkah Alternative:
Jika data relative sedikit, data bisa langsung diketik
pada layar sbb:
Contoh:
y <- c (32, 36, 27, 34, 28, 29, 39, 29, 28, 26, 38, 39)
X1<-c(57, 59, 49, 62, 51, 50, 55, 48, 42, 42, 61, 57)
X2 <- c(8, 10, 6, 11, 8, 7, 10, 9, 10, 6, 12, 9)
10
Langkah Analisis dengan Software R
11
Langkah Analisis dengan Software R
12
Langkah Analisis dengan Software R
13
Langkah Analisis dengan Software R
14
Langkah Analisis dengan Software R
15
Langkah Analisis dengan Software R
(Langkah alternative)
16
Hasil Analisis dengan Software R
> #Contoh Tabel 5.1 Hal 127 Buku Analisis Korelasi dan Regregi
> #data berat, tinggi, dan umur 12 anak
> #input Data
> y <- c (32, 36, 27, 34, 28, 29, 39, 29, 28, 26, 38, 39)
> X1 <- c(57, 59, 49, 62, 51, 50, 55, 48, 42, 42, 61, 57)
> X2 <- c(8, 10, 6, 11, 8, 7, 10, 9, 10, 6, 12, 9)
> #untuk mengecek jumlah data
> length (y)
[1] 12
> length (X1)
[1] 12
> length (X2)
[1] 12
17
Hasil Analisis Regresi dengan
Program R
> #analisis Regresilinear Ganda
> g <- lm(y ~ X1 + X2)
> summary(g)
Call:
lm(formula = y ~ X1 + X2)
Residuals:
Min 1Q Median 3Q Max
-3.9166 -1.1626 -0.4743 0.4228 4.9709
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.9393 6.8470 0.283 0.7834
X1 0.4231 0.1632 2.593 0.0291 *
X2 0.8861 0.5863 1.511 0.1650
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.915 on 9 degrees of freedom
Multiple R-squared: 0.7113, Adjusted R-squared: 0.6471
F-statistic: 11.09 on 2 and 9 DF, p-value: 0.003733
> anova(g)
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
X1 1 169.025 169.025 19.8898 0.001578 **
X2 1 19.409 19.409 2.2839 0.165005
Residuals 9 76.483 8.498
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
18
Interpretasi Hasil Analisis Regresi
Kriteria kesimpulan:
Pengujian signifikan : p-value <
Pengujian tidak signifikan : p-value
20
Interpretasi Hasil Analisis Regresi
- Daya ramal model: R2 (Koefisien Determinasi)
Multiple R-squared = 0,7113
Artinya model mempunyai daya ramal 71,13%
(variasi Y dapat dijelaskan oleh model).
21
Interpretasi Hasil Analisis Regresi
22
Interpretasi Hasil Analisis Regresi
R-squared
- Nilai R-squared akan meningkat jika ada penambahan variable
independen dalam model.
akibatnya, hasil bisa bias jika peneliti menambahkan
sembarang peubah independent.
Adjusted R square
- Interpretasinya sama dengan R-squared
- nilainya dapat naik turun tergantung dari hubungan antara
variable independen tambahan dengan variable
independennya.
- Umumnya peneliti menyarankan menggunakan Adjusted R
square
- Jika ingin membandingkan model gunakan Adjusted R square
23
Interpretasi Hasil Analisis Regresi
24
Contoh Data Tabel 5.4 Hal 140
26
Langkah Analisis dengan Software R
27
Hasil Analisis Regresi Linear
Ganda dengan Software R
> #analisis Regresi
> g4 <- lm(Y ~ X1 + X2 + X3 + X4, data=Data4)
> summary(g4)
Call:
lm(formula = Y ~ X1 + X2 + X3 + X4, data = Data4)
Residuals:
Min 1Q Median 3Q Max
-0.7478 -0.2049 -0.0245 0.2939 0.6552
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -5.172098 0.883621 -5.853 4.19e-05 ***
X1 0.990244 0.476582 2.078 0.056607 .
X2 0.008088 0.163362 0.050 0.961213
X3 2.318482 0.481637 4.814 0.000275 ***
X4 0.003489 0.140570 0.025 0.980549
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
28
Hasil Analisis Regresi Linear
Ganda dengan Software R
> anova(g4)
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X1 1 8.2446 8.2446 43.5248 1.195e-05 ***
X2 1 1.1968 1.1968 6.3179 0.0248083 *
X3 1 4.4330 4.4330 23.4027 0.0002633 ***
X4 1 0.0001 0.0001 0.0006 0.9805488
Residuals 14 2.6519 0.1894
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
29
Interpretasi Hasil Analisis Regresi
Kriteria kesimpulan:
Pengujian signifikan : p-value <
Pengujian tidak signifikan : p-value
31
Interpretasi Hasil Analisis Regresi
- Daya ramal model: R2 (Koefisien Determinasi)
Multiple R-squared = 0,8395
Artinya model mempunyai daya ramal 83,95%
(variasi Y dapat dijelaskan oleh model sekitar
84%).
Kemampuan variable independen dalam
menjelaskan varians dari variable dependen
sebesar 84%, sisanya 16% varians variable
dependen dijelaskan oleh faktor lain yang tidak
terdapat dalam model regresi tersebut.
32
Interpretasi Hasil Analisis Regresi
34
Korelasi Pearson dengan Software R
- Tidak signifikannya beberapa peubah bebas dapat
diakibatkan oleh adanya interkorelasi di antara peubah
bebas.
#Korelasi Pearson
nilaikor <- cor(Data4, method="pearson")
nilaikor
Setelah dirun hasilnya sbb:
35
Korelasi Pearson dengan Software R
36
Korelasi Pearson dengan Software R
Sintaks mencari matrik korelasi Pearson dengan level
signifikan (nilai p-value):
library(Hmisc)
nilaikor1 <- rcorr(as.matrix(Data4), type ="pearson")
nilaikor1$r
nilaikor1$P
Catatan:
Untuk menghitung Matrik Korelasi Pearson dibutuhkan
fungsi rcorr pada “Hmisc Package” dengan cara
menuliskan sintaks:
library(Hmisc)
37
Korelasi Pearson dengan Software R
library(Hmisc)
Error in library(Hmisc) : there is no
package called ‘Hmisc’
Saat kita run library(Hmisc) dan hasilnya error seperti di
atas, berarti belum ada Package “Hmisc”.
Kita harus menginstall Package “Hmisc” di console, dengan
sintaks berikut:
>install.packages("Hmisc")
Silahkan klik run
Catatan: Kita hanya cukup menginstall satu kali suatu
package tertentu.
38
Korelasi Pearson dengan Software R
39
Korelasi Pearson dengan level
signifikan dengan Software R
nilaikor1$r: nilai koefisien korelasi Pearson
nilaikor1$P: nilai p-value nya
Bandingkan hasil Korelasi pearson pada buku hal 142 (hasilnya sama)
> library(Hmisc)
> nilaikor1 <- rcorr(as.matrix(Data4), type ="pearson")
>Pear
nilaikor1$r
X1 X2 X3 X4 Y
X1 1.00000000 0.04760523 0.5868836 0.17971690 0.7063106
X2 0.04760523 1.00000000 0.3944926 -0.01649777 0.3024196
X3 0.58688362 0.39449255 1.0000000 0.16316574 0.8870721
X4 0.17971690 -0.01649777 0.1631657 1.00000000 0.1707932
Y 0.70631062 0.30241958 0.8870721 0.17079324 1.0000000
> nilaikor1$P
X1 X2 X3 X4 Y
X1 NA 0.84654555 8.252811e-03 0.4616014 7.247060e-04
X2 0.846545551 NA 9.464302e-02 0.9465545 2.082308e-01
X3 0.008252811 0.09464302 NA 0.5044950 4.162764e-07
X4 0.461601387 0.94655448 5.044950e-01 NA 4.844942e-01
Y 0.000724706 0.20823082 4.162764e-07 0.4844942 NA
40
Interpretasi Korelasi Pearson
Koefisien korelasi X1 dan X3 signifikan yang ditunjukkan
dengan r=0,59 dan nilai p=0,0083<0,05.
Hal ini berarti sebagian variasi yang dapat dijelaskan oleh
X1, dapat juga dijelaskan oleh X3.
Proporsi variasi ini ditentukan oleh koefisien determinasi
r2 = (0,59)2 = 0,3481 (35%).
41
Pengujian Asumsi pada model
Regresi Linear dengan Software R
Uji asumsi kenormalan menggunakan nilai residual model.
Residual model diperoleh dengan sintaks:
residumodel <- resid(g4)
residumodel
43
Pengujian Asumsi pada model
Regresi Linear dengan Software R
• Nilai p-value > : data berasal dari sebaran normal
• > #Uji asumsi kenormalan dengan Shapiro-Walk
> library(stats)
> shapiro.test(residumodel)
Shapiro-Wilk normality test
data: residumodel
W = 0.95108, p-value = 0.4122
> #alternativ uji asumsi kenormalan dengan Uji Jarque Bera
> library(tseries)
> jarque.bera.test(residumodel)
Jarque Bera Test
data: residumodel
X-squared = 0.9234, df = 2, p-value = 0.6302
44
Pengujian Asumsi pada model
Regresi Linear dengan Software R
45
Pengujian Asumsi pada model
Regresi Linear dengan Software R
46
Pengujian Asumsi pada model
Regresi Linear dengan Software R
47
Pengujian Asumsi pada model
Regresi Linear dengan Software R
> #Uji Homoskedastisitas menggunakan uji Breush Pagan
> library(lmtest)
> bptest(g4, studentize=F)
Breusch-Pagan test
data: g4
BP = 1.9095, df = 4, p-value = 0.7524
Durbin-Watson test
data: g4
DW = 2.1799, p-value = 0.5841
alternative hypothesis: true autocorrelation is greater than 0
48
Kesimpulan
Tahapan dalam analisis regresi linear telah
dipaparkan dengan software R dan juga cara
menginterpetasikannya.
Asumsi yang diperlukan dalam analisis regresi
linear juga telah dipaparkan dengan software R,
dan semua asumsi telah terpenuhi.
Jika terdapat asumsi yang tidak terpenuhi, maka
dapat dipertimbangkan langkah: transformasi
variable, menggunakan model yang lain seperti
model regresi nonlinear dan lain sebagainya.
49
George Box's famous quote
“All models are wrong but some
models are useful”
50
Referensi
51