Anda di halaman 1dari 51

ANALISIS REGRESI LINEAR GANDA

DENGAN SOFTWARE R

• Prof. Drs.H.M.Arif Tiro, M.Pd., M.Sc., Ph.D.


• Aswi, S.Pd., M.Si., Ph.D

1
Langkah Penting dalam
Perencanaan Model Bagi
Peneliti

- Rumusan Masalah dan Peubah


- Pentingnya dan ketersediaan
Peubah

2
MODEL REGRESI LINEAR GANDA

• Model Populasi
POPULASI 𝑦 = 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝜀

• Taksiran Model
𝑦ො = 𝛽መ0 + 𝛽መ1 𝑥1 + ⋯ + 𝛽መ𝑘 𝑥𝑘

𝑦ො = 𝑏0 + 𝑏1 𝑥1 + ⋯ + 𝑏𝑘 𝑥𝑘
SAMPEL
Contoh Tabel 5.1 Hal 127
Misalnya, kita akan meneliti variasi berat badan (Y)
dikaitkan dengan tinggi badan (X1) dan umur (X2)
untuk anak-anak yang memiliki masalah atau
kekurangan gizi.
- Peubah terikat: berat badan,
- Peubah Bebas : tinggi badan dan umur
- Andaikan bahwa sebuah sampel acak terdiri dari
12 anak yang mengunjungi sebuah klinik.
- Data berat (kg), tinggi (cm), dan umur (tahun)
diperoleh untuk setiap anak .

4
Analisis dengan Software R
- Perintah untuk menghapus semua objek dari “Global
Environment”
> rm (list=ls())
> remove (list =ls())
- Perintah untuk menghapus beberapa objek saja misalnya
variable X1, X2 dan y
> remove (list=c (“y”, “X1”, “X2”))
- Perintah untuk melihat semua objek dari “Global
Environment
> ls ( )

5
Analisis dengan Software R
- Perintah untuk membersihkan layer: Ctr +L
- Operator Assignment
Operator panah kiri ( <-)
- Vector : object data dalam R
jenis vector: numeric dan character
Fungsi untuk membuat sebuah vector: c ( )

Contoh objek X berupa vector numerik


X < - c (1, 2, 3, 4 5)

6
Beberapa referensi yang bisa dibaca untuk mengenal R
dan R studio dan Analisis Regresi dengan R

https://bookdown.org/aepstk/intror/

http://www.blognafaro.com/2013/10/analisis-regresi-linear-berganda-dengan-
Software-R.html

https://www.konsultanstatistik.com/2011/07/koefisien-determinasi-pada-regresi.html

https://statlover.wordpress.com/2012/04/27/analisis-regresi-linear-aplikasi-pada-
r-software/

7
Langkah Analisis dengan Software R

1. Ketik data pada Table 5.1 tersebut dengan


menggunakan Excel.
2. Simpan file ke dalam format *.csv
misalnya dengan nama Latih3. csv
3. Buka R studio, lalu panggil data kita
dengan mengetik script (tergantung
dimana kita menyimpan data kita), misal
setwd("C:\\Users\\Aswi\\Documents")

8
Langkah Analisis dengan Program
R
4. Membaca data dengan menulis script
Data3 <- read.csv("Latih3.csv")
5. Lakukan Analisis Regresi dengan menulis
script:
g3<-lm(y ~ X1 + X2, data=Data3)
summary(g3)
anova(g3)

9
Langkah Analisis dengan Software R
Langkah Alternative:
Jika data relative sedikit, data bisa langsung diketik
pada layar sbb:
Contoh:
y <- c (32, 36, 27, 34, 28, 29, 39, 29, 28, 26, 38, 39)
X1<-c(57, 59, 49, 62, 51, 50, 55, 48, 42, 42, 61, 57)
X2 <- c(8, 10, 6, 11, 8, 7, 10, 9, 10, 6, 12, 9)

10
Langkah Analisis dengan Software R

11
Langkah Analisis dengan Software R

12
Langkah Analisis dengan Software R

13
Langkah Analisis dengan Software R

- Untuk kemudahan, kita bisa mengcopy directory tempat


kita menyimpan data di Excel,
C:\Users\Aswi\Documents (dicopy dari Excel)

- Cara mengimport data csv ke R studio dengan


menggunakan sintaks berikut:
setwd("C:\\Users\\Aswi\\Documents") atau
setwd("C:/Users/Aswi/Documents")

Perhatikan: gunakan tanda / atau \\ bukan tanda / untuk


menentukan direktori.

14
Langkah Analisis dengan Software R

15
Langkah Analisis dengan Software R
(Langkah alternative)

16
Hasil Analisis dengan Software R
> #Contoh Tabel 5.1 Hal 127 Buku Analisis Korelasi dan Regregi
> #data berat, tinggi, dan umur 12 anak
> #input Data
> y <- c (32, 36, 27, 34, 28, 29, 39, 29, 28, 26, 38, 39)
> X1 <- c(57, 59, 49, 62, 51, 50, 55, 48, 42, 42, 61, 57)
> X2 <- c(8, 10, 6, 11, 8, 7, 10, 9, 10, 6, 12, 9)
> #untuk mengecek jumlah data
> length (y)
[1] 12
> length (X1)
[1] 12
> length (X2)
[1] 12

17
Hasil Analisis Regresi dengan
Program R
> #analisis Regresilinear Ganda
> g <- lm(y ~ X1 + X2)
> summary(g)

Call:
lm(formula = y ~ X1 + X2)
Residuals:
Min 1Q Median 3Q Max
-3.9166 -1.1626 -0.4743 0.4228 4.9709

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.9393 6.8470 0.283 0.7834
X1 0.4231 0.1632 2.593 0.0291 *
X2 0.8861 0.5863 1.511 0.1650
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.915 on 9 degrees of freedom
Multiple R-squared: 0.7113, Adjusted R-squared: 0.6471
F-statistic: 11.09 on 2 and 9 DF, p-value: 0.003733
> anova(g)
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
X1 1 169.025 169.025 19.8898 0.001578 **
X2 1 19.409 19.409 2.2839 0.165005
Residuals 9 76.483 8.498
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

18
Interpretasi Hasil Analisis Regresi

Taksiran parameter model dapat


diperoleh dari “Estimate”
𝑦ො = 𝛽መ0 + 𝛽መ1 𝑥1 + 𝛽መ2 𝑥2
𝑦ො = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2
𝑏0 =1,9393, 𝑏1 =0,4231, dan 𝑏2 =0,8861
Sehingga Persaman Regresi :
𝑦ො = 1,9393 + 0,4231𝑥1 + 0,8861 𝑥2
Kita menggunakan taraf kesignifikanan
=5%.
19
Interpretasi Hasil Analisis Regresi
Kesignifikanan Model: Uji F
Nilai F -statistic = 11.09 dengan nilai p-value = 0.003733
memberikan informasi tentang kesignifikanan model.

Karena nilai p-value < , ini berarti model signifikan secara


statistis.

Kriteria kesimpulan:
Pengujian signifikan : p-value < 
Pengujian tidak signifikan : p-value  

Jadi, penaksiran, peramalan, atau inferensi yang lain dapat


dilakukan dengan menggunakan model regresi tersebut
karena model signifikan

20
Interpretasi Hasil Analisis Regresi
- Daya ramal model: R2 (Koefisien Determinasi)
Multiple R-squared = 0,7113
Artinya model mempunyai daya ramal 71,13%
(variasi Y dapat dijelaskan oleh model).

Kemampuan variable independen dalam


menjelaskan varians dari variable dependen
sebesar 71, 13%, sisanya 29% varians variable
dependen dijelaskan oleh faktor lain yang tidak
terdapat dalam model regresi tersebut.

21
Interpretasi Hasil Analisis Regresi

- Nilai R-squared terletak antara 0 dan 1.


- Adjusted R-squared = 0.6471, artinya tinggi dan
umur secara bersama sama dapat menjelaskan
sekitar 64,71% variasi berat (Y).

22
Interpretasi Hasil Analisis Regresi

R-squared
- Nilai R-squared akan meningkat jika ada penambahan variable
independen dalam model.
akibatnya, hasil bisa bias jika peneliti menambahkan
sembarang peubah independent.
Adjusted R square
- Interpretasinya sama dengan R-squared
- nilainya dapat naik turun tergantung dari hubungan antara
variable independen tambahan dengan variable
independennya.
- Umumnya peneliti menyarankan menggunakan Adjusted R
square
- Jika ingin membandingkan model gunakan Adjusted R square

23
Interpretasi Hasil Analisis Regresi

Kesignifikanan masing masing peubah bebas

Hanya peubah x1 yang signifikan


karena nilai t value=2.593 dengan nilai p=0,0291 < 

koefisien regresi untuk X1, yaitu b1=0,4231 dapat


diinterpretasi bahwa:
Jika tinggi (X1) bertambah satu cm, maka berat (Y) dapat
bertambah sebesar 0,4231 kg untuk anak-anak yang
mempunyai umur yang sama

24
Contoh Data Tabel 5.4 Hal 140

Syahriani (2000) mengukur empat peubah


bebas, yaitu komitmen pemerintah (X1),
partisipasi masyarakat (X2), kapasitas
organisasi (X3), dan komitmen aparat
pelaksana (X4) yang dianggap mempunyai
pengaruh signifikan terhadap pencapaian
tujuan kebijaksanaan otonomi daerah (Y) di
Kabupaten Tanah Laut, Provinsi Kalimantan
Selatan. Data yang terkumpul semuanya
diukur dengan skala interval
25
Contoh Data Tabel 5.4 Hal 140

26
Langkah Analisis dengan Software R

27
Hasil Analisis Regresi Linear
Ganda dengan Software R
> #analisis Regresi
> g4 <- lm(Y ~ X1 + X2 + X3 + X4, data=Data4)
> summary(g4)

Call:
lm(formula = Y ~ X1 + X2 + X3 + X4, data = Data4)

Residuals:
Min 1Q Median 3Q Max
-0.7478 -0.2049 -0.0245 0.2939 0.6552
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -5.172098 0.883621 -5.853 4.19e-05 ***
X1 0.990244 0.476582 2.078 0.056607 .
X2 0.008088 0.163362 0.050 0.961213
X3 2.318482 0.481637 4.814 0.000275 ***
X4 0.003489 0.140570 0.025 0.980549
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.4352 on 14 degrees of freedom


Multiple R-squared: 0.8395, Adjusted R-squared: 0.7937
F-statistic: 18.31 on 4 and 14 DF, p-value: 1.884e-05

28
Hasil Analisis Regresi Linear
Ganda dengan Software R

> anova(g4)
Analysis of Variance Table

Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X1 1 8.2446 8.2446 43.5248 1.195e-05 ***
X2 1 1.1968 1.1968 6.3179 0.0248083 *
X3 1 4.4330 4.4330 23.4027 0.0002633 ***
X4 1 0.0001 0.0001 0.0006 0.9805488
Residuals 14 2.6519 0.1894
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

29
Interpretasi Hasil Analisis Regresi

Taksiran parameter model dapat diperoleh


dari “Estimate”
𝑦ො = 𝛽መ0 + 𝛽መ1 𝑥1 + 𝛽መ2 𝑥2 + 𝛽መ3 𝑥3 + 𝛽መ4 𝑥4
𝑦ො = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 + 𝑏3 𝑥3 + 𝑏4 𝑥4
𝑏0 =-5.172, 𝑏1 =0,990, 𝑏2 =0,008,
𝑏3 =2,318, dan 𝑏4 =0,003
Sehingga Persamaan Regresi :
𝑦ො = −5,172 + 0,990𝑥1 + 0,008𝑥2 + 2,318𝑥3 +
0,003𝑥4
Kita menggunakan taraf kesignifikanan =5%.
30
Interpretasi Hasil Analisis Regresi
Kesignifikanan Model: Uji F
Nilai F -statistic = 18,31 dengan nilai p-value = 1,884e-05,
memberikan informasi tentang kesignifikanan model.

Karena nilai p-value < , ini berarti model signifikan secara


statistis.

Kriteria kesimpulan:
Pengujian signifikan : p-value < 
Pengujian tidak signifikan : p-value  

Jadi, penaksiran, peramalan, atau inferensi yang lain dapat


dilakukan dengan menggunakan model regresi tersebut
karena model signifikan

31
Interpretasi Hasil Analisis Regresi
- Daya ramal model: R2 (Koefisien Determinasi)
Multiple R-squared = 0,8395
Artinya model mempunyai daya ramal 83,95%
(variasi Y dapat dijelaskan oleh model sekitar
84%).
Kemampuan variable independen dalam
menjelaskan varians dari variable dependen
sebesar 84%, sisanya 16% varians variable
dependen dijelaskan oleh faktor lain yang tidak
terdapat dalam model regresi tersebut.

32
Interpretasi Hasil Analisis Regresi

- Adjusted R-squared = 0,7937, artinya


bahwa X1, X2, X3, dan X4 secara bersama
sama dapat menjelaskan sekitar 79 %
variasi Y.
- Nilai Adjusted R-squared berbeda sekitar
5% dari R-squared .
- Jadi konstanta (0) mempunyai kontribusi
sekitar 5% terhadap model dalam kaitannya
dengan peramalan Y.
33
Interpretasi Hasil Analisis Regresi

Kesignifikanan masing masing peubah bebas


Hanya peubah x3 yang signifikan,
karena nilai t value=4.814 dengan nilai p=0,000275 < 

Koefisien regresi untuk X3, yaitu b3=2,318 dapat


diinterpretasi bahwa:
Bila kapasitas organisasi (X3) dinaikkan satu satuan skor,
maka pencapaian tujuan kebijaksanaan otonomi daerah
(Y) dapat ditingkatkan sebesar 2,318 satuan apabila
peubah-peubah bebas lainnya dipertahankan tidak
berubah.

34
Korelasi Pearson dengan Software R
- Tidak signifikannya beberapa peubah bebas dapat
diakibatkan oleh adanya interkorelasi di antara peubah
bebas.

- Sintaks untuk mencari koefisien korelasi Pearson

#Korelasi Pearson
nilaikor <- cor(Data4, method="pearson")
nilaikor
Setelah dirun hasilnya sbb:

35
Korelasi Pearson dengan Software R

> nilaikor <- cor(Data4, method="pearson")


> nilaikor
X1 X2 X3 X4 Y
X1 1.00000000 0.04760523 0.5868836 0.17971690 0.7063106
X2 0.04760523 1.00000000 0.3944926 -0.01649777 0.3024196
X3 0.58688362 0.39449255 1.0000000 0.16316574 0.8870721
X4 0.17971690 -0.01649777 0.1631657 1.00000000 0.1707932
Y 0.70631062 0.30241958 0.8870721 0.17079324 1.0000000

36
Korelasi Pearson dengan Software R
Sintaks mencari matrik korelasi Pearson dengan level
signifikan (nilai p-value):
library(Hmisc)
nilaikor1 <- rcorr(as.matrix(Data4), type ="pearson")
nilaikor1$r
nilaikor1$P

Catatan:
Untuk menghitung Matrik Korelasi Pearson dibutuhkan
fungsi rcorr pada “Hmisc Package” dengan cara
menuliskan sintaks:
library(Hmisc)
37
Korelasi Pearson dengan Software R
library(Hmisc)
Error in library(Hmisc) : there is no
package called ‘Hmisc’
Saat kita run library(Hmisc) dan hasilnya error seperti di
atas, berarti belum ada Package “Hmisc”.
Kita harus menginstall Package “Hmisc” di console, dengan
sintaks berikut:
>install.packages("Hmisc")
Silahkan klik run
Catatan: Kita hanya cukup menginstall satu kali suatu
package tertentu.
38
Korelasi Pearson dengan Software R

39
Korelasi Pearson dengan level
signifikan dengan Software R
nilaikor1$r: nilai koefisien korelasi Pearson
nilaikor1$P: nilai p-value nya
Bandingkan hasil Korelasi pearson pada buku hal 142 (hasilnya sama)
> library(Hmisc)
> nilaikor1 <- rcorr(as.matrix(Data4), type ="pearson")
>Pear
nilaikor1$r
X1 X2 X3 X4 Y
X1 1.00000000 0.04760523 0.5868836 0.17971690 0.7063106
X2 0.04760523 1.00000000 0.3944926 -0.01649777 0.3024196
X3 0.58688362 0.39449255 1.0000000 0.16316574 0.8870721
X4 0.17971690 -0.01649777 0.1631657 1.00000000 0.1707932
Y 0.70631062 0.30241958 0.8870721 0.17079324 1.0000000
> nilaikor1$P
X1 X2 X3 X4 Y
X1 NA 0.84654555 8.252811e-03 0.4616014 7.247060e-04
X2 0.846545551 NA 9.464302e-02 0.9465545 2.082308e-01
X3 0.008252811 0.09464302 NA 0.5044950 4.162764e-07
X4 0.461601387 0.94655448 5.044950e-01 NA 4.844942e-01
Y 0.000724706 0.20823082 4.162764e-07 0.4844942 NA

40
Interpretasi Korelasi Pearson
Koefisien korelasi X1 dan X3 signifikan yang ditunjukkan
dengan r=0,59 dan nilai p=0,0083<0,05.
Hal ini berarti sebagian variasi yang dapat dijelaskan oleh
X1, dapat juga dijelaskan oleh X3.
Proporsi variasi ini ditentukan oleh koefisien determinasi
r2 = (0,59)2 = 0,3481 (35%).

Koefisien korelasi X3 dengan Y (r=0,89) signifikan dengan


p=0,0001.
Koefisien korelasi X1 dengan Y (r=0,71) juga signifikan
dengan p=0,0007.

41
Pengujian Asumsi pada model
Regresi Linear dengan Software R
Uji asumsi kenormalan menggunakan nilai residual model.
Residual model diperoleh dengan sintaks:
residumodel <- resid(g4)
residumodel

#Uji asumsi kenormalan dengan Shapiro-Walk


library(stats)
shapiro.test(residumodel)
#alternativ uji asumsi kenormalan
library(tseries)
jarque.bera.test(residumodel)
42
Pengujian Asumsi pada model
Regresi Linear dengan Software R

43
Pengujian Asumsi pada model
Regresi Linear dengan Software R
• Nilai p-value >  : data berasal dari sebaran normal
• > #Uji asumsi kenormalan dengan Shapiro-Walk
> library(stats)
> shapiro.test(residumodel)
Shapiro-Wilk normality test

data: residumodel
W = 0.95108, p-value = 0.4122
> #alternativ uji asumsi kenormalan dengan Uji Jarque Bera
> library(tseries)
> jarque.bera.test(residumodel)
Jarque Bera Test

data: residumodel
X-squared = 0.9234, df = 2, p-value = 0.6302

44
Pengujian Asumsi pada model
Regresi Linear dengan Software R

Uji Homoskedastisitas menggunakan uji


Breush Pagan
library(lmtest)
bptest(g4, studentize=F)

#Uji autokorelasi dengan uji Durbin-Watson


dwtest(g4)

45
Pengujian Asumsi pada model
Regresi Linear dengan Software R

- Uji multikolinieritas dengan Variance


Inflation Factor (VIF)
- Umumnya, standar VIF yang menunjukkan
tdk ada multikolinieritas VIF<10
- Sintaks:
library(car)
vif(g4)

46
Pengujian Asumsi pada model
Regresi Linear dengan Software R

47
Pengujian Asumsi pada model
Regresi Linear dengan Software R
> #Uji Homoskedastisitas menggunakan uji Breush Pagan
> library(lmtest)
> bptest(g4, studentize=F)

Breusch-Pagan test

data: g4
BP = 1.9095, df = 4, p-value = 0.7524

> #Uji autokorelasi dengan uji Durbin-Watson


> dwtest(g4)

Durbin-Watson test

data: g4
DW = 2.1799, p-value = 0.5841
alternative hypothesis: true autocorrelation is greater than 0

> #uji multikolinieritas dengan Variance Inflation Factor (VIF)


> #Umumnya, standar VIF yang menunjukkan tdk ada multikolinieritas VIF<10
> library(car)
> vif(g4)
X1 X2 X3 X4
1.636795 1.266838 1.936959 1.043317

48
Kesimpulan
Tahapan dalam analisis regresi linear telah
dipaparkan dengan software R dan juga cara
menginterpetasikannya.
Asumsi yang diperlukan dalam analisis regresi
linear juga telah dipaparkan dengan software R,
dan semua asumsi telah terpenuhi.
Jika terdapat asumsi yang tidak terpenuhi, maka
dapat dipertimbangkan langkah: transformasi
variable, menggunakan model yang lain seperti
model regresi nonlinear dan lain sebagainya.

49
George Box's famous quote
“All models are wrong but some
models are useful”

50
Referensi

R Core Team. (2019). R: A language and


environment for statistical computing. Vienna,
Austria: R Foundation for Statistical
Computing. Retrieved from http://www.R-
project.org

Tiro, M, A. (2019), Analisi Korelasi dan


Regresi, Makassar: Andira Publisher

51

Anda mungkin juga menyukai