Statistika Pendidikan - Pertemuan Kedua

ANALISIS REGRESI LINEAR GANDA
DENGAN SOFTWARE R
• Prof. Drs.H.M.Arif Tiro, M.Pd., M.Sc., Ph.D.

• Aswi, S.Pd., M.Si., Ph.D
1
Langkah Penting dalam
Perencanaan Model Bagi
Peneliti
- Rumusan Masalah dan Peubah

- Pentingnya dan ketersediaan
Peubah
2
MODEL REGRESI LINEAR GANDA
• Model Populasi
POPULASI 𝑦 = 𝛽0 + 𝛽1 𝑥1 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝜀
• Taksiran Model
𝑦ො = 𝛽መ0 + 𝛽መ1 𝑥1 + ⋯ + 𝛽መ𝑘 𝑥𝑘
𝑦ො = 𝑏0 + 𝑏1 𝑥1 + ⋯ + 𝑏𝑘 𝑥𝑘
SAMPEL
Contoh Tabel 5.1 Hal 127
Misalnya, kita akan meneliti variasi berat badan (Y)
dikaitkan dengan tinggi badan (X1) dan umur (X2)
untuk anak-anak yang memiliki masalah atau
kekurangan gizi.
- Peubah terikat: berat badan,
- Peubah Bebas : tinggi badan dan umur
- Andaikan bahwa sebuah sampel acak terdiri dari
12 anak yang mengunjungi sebuah klinik.
- Data berat (kg), tinggi (cm), dan umur (tahun)
diperoleh untuk setiap anak .
4
Analisis dengan Software R
- Perintah untuk menghapus semua objek dari “Global
Environment”
> rm (list=ls())
> remove (list =ls())
- Perintah untuk menghapus beberapa objek saja misalnya
variable X1, X2 dan y
> remove (list=c (“y”, “X1”, “X2”))
- Perintah untuk melihat semua objek dari “Global
Environment
> ls ( )
5
Analisis dengan Software R
- Perintah untuk membersihkan layer: Ctr +L
- Operator Assignment
Operator panah kiri ( <-)
- Vector : object data dalam R
jenis vector: numeric dan character
Fungsi untuk membuat sebuah vector: c ( )
Contoh objek X berupa vector numerik

X < - c (1, 2, 3, 4 5)
6
Beberapa referensi yang bisa dibaca untuk mengenal R
dan R studio dan Analisis Regresi dengan R
https://bookdown.org/aepstk/intror/
http://www.blognafaro.com/2013/10/analisis-regresi-linear-berganda-dengan-
Software-R.html
https://www.konsultanstatistik.com/2011/07/koefisien-determinasi-pada-regresi.html
https://statlover.wordpress.com/2012/04/27/analisis-regresi-linear-aplikasi-pada-
r-software/
7
Langkah Analisis dengan Software R
1. Ketik data pada Table 5.1 tersebut dengan

menggunakan Excel.
2. Simpan file ke dalam format *.csv
misalnya dengan nama Latih3. csv
3. Buka R studio, lalu panggil data kita
dengan mengetik script (tergantung
dimana kita menyimpan data kita), misal
setwd("C:\\Users\\Aswi\\Documents")
8
Langkah Analisis dengan Program
R
4. Membaca data dengan menulis script
Data3 <- read.csv("Latih3.csv")
5. Lakukan Analisis Regresi dengan menulis
script:
g3<-lm(y ~ X1 + X2, data=Data3)
summary(g3)
anova(g3)
9
Langkah Alternative:
Jika data relative sedikit, data bisa langsung diketik
pada layar sbb:
Contoh:
y <- c (32, 36, 27, 34, 28, 29, 39, 29, 28, 26, 38, 39)
X1<-c(57, 59, 49, 62, 51, 50, 55, 48, 42, 42, 61, 57)
X2 <- c(8, 10, 6, 11, 8, 7, 10, 9, 10, 6, 12, 9)
10
11
12
13
- Untuk kemudahan, kita bisa mengcopy directory tempat

kita menyimpan data di Excel,
C:\Users\Aswi\Documents (dicopy dari Excel)
- Cara mengimport data csv ke R studio dengan

menggunakan sintaks berikut:
setwd("C:\\Users\\Aswi\\Documents") atau
setwd("C:/Users/Aswi/Documents")
Perhatikan: gunakan tanda / atau \\ bukan tanda / untuk

menentukan direktori.
14
15
(Langkah alternative)
16
Hasil Analisis dengan Software R
> #Contoh Tabel 5.1 Hal 127 Buku Analisis Korelasi dan Regregi
> #data berat, tinggi, dan umur 12 anak
> #input Data
> y <- c (32, 36, 27, 34, 28, 29, 39, 29, 28, 26, 38, 39)
> X1 <- c(57, 59, 49, 62, 51, 50, 55, 48, 42, 42, 61, 57)
> X2 <- c(8, 10, 6, 11, 8, 7, 10, 9, 10, 6, 12, 9)
> #untuk mengecek jumlah data
> length (y)
[1] 12
> length (X1)
[1] 12
> length (X2)
[1] 12
17
Hasil Analisis Regresi dengan
Program R
> #analisis Regresilinear Ganda
> g <- lm(y ~ X1 + X2)
> summary(g)
Call:
lm(formula = y ~ X1 + X2)
Residuals:
Min 1Q Median 3Q Max
-3.9166 -1.1626 -0.4743 0.4228 4.9709
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.9393 6.8470 0.283 0.7834
X1 0.4231 0.1632 2.593 0.0291 *
X2 0.8861 0.5863 1.511 0.1650
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.915 on 9 degrees of freedom
Multiple R-squared: 0.7113, Adjusted R-squared: 0.6471
F-statistic: 11.09 on 2 and 9 DF, p-value: 0.003733
> anova(g)
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
X1 1 169.025 169.025 19.8898 0.001578 **
X2 1 19.409 19.409 2.2839 0.165005
Residuals 9 76.483 8.498
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
18
Interpretasi Hasil Analisis Regresi
Taksiran parameter model dapat

diperoleh dari “Estimate”
𝑦ො = 𝛽መ0 + 𝛽መ1 𝑥1 + 𝛽መ2 𝑥2
𝑦ො = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2
𝑏0 =1,9393, 𝑏1 =0,4231, dan 𝑏2 =0,8861
Sehingga Persaman Regresi :
𝑦ො = 1,9393 + 0,4231𝑥1 + 0,8861 𝑥2
Kita menggunakan taraf kesignifikanan
=5%.
19
Kesignifikanan Model: Uji F
Nilai F -statistic = 11.09 dengan nilai p-value = 0.003733
memberikan informasi tentang kesignifikanan model.
Karena nilai p-value < , ini berarti model signifikan secara

statistis.
Kriteria kesimpulan:
Pengujian signifikan : p-value < 
Pengujian tidak signifikan : p-value  
Jadi, penaksiran, peramalan, atau inferensi yang lain dapat

dilakukan dengan menggunakan model regresi tersebut
karena model signifikan
20
- Daya ramal model: R2 (Koefisien Determinasi)
Multiple R-squared = 0,7113
Artinya model mempunyai daya ramal 71,13%
(variasi Y dapat dijelaskan oleh model).
Kemampuan variable independen dalam

menjelaskan varians dari variable dependen
sebesar 71, 13%, sisanya 29% varians variable
dependen dijelaskan oleh faktor lain yang tidak
terdapat dalam model regresi tersebut.
21
- Nilai R-squared terletak antara 0 dan 1.

- Adjusted R-squared = 0.6471, artinya tinggi dan
umur secara bersama sama dapat menjelaskan
sekitar 64,71% variasi berat (Y).
22
R-squared
- Nilai R-squared akan meningkat jika ada penambahan variable
independen dalam model.
akibatnya, hasil bisa bias jika peneliti menambahkan
sembarang peubah independent.
Adjusted R square
- Interpretasinya sama dengan R-squared
- nilainya dapat naik turun tergantung dari hubungan antara
variable independen tambahan dengan variable
independennya.
- Umumnya peneliti menyarankan menggunakan Adjusted R
square
- Jika ingin membandingkan model gunakan Adjusted R square
23
Kesignifikanan masing masing peubah bebas
Hanya peubah x1 yang signifikan

karena nilai t value=2.593 dengan nilai p=0,0291 < 
koefisien regresi untuk X1, yaitu b1=0,4231 dapat

diinterpretasi bahwa:
Jika tinggi (X1) bertambah satu cm, maka berat (Y) dapat
bertambah sebesar 0,4231 kg untuk anak-anak yang
mempunyai umur yang sama
24
Contoh Data Tabel 5.4 Hal 140
Syahriani (2000) mengukur empat peubah

bebas, yaitu komitmen pemerintah (X1),
partisipasi masyarakat (X2), kapasitas
organisasi (X3), dan komitmen aparat
pelaksana (X4) yang dianggap mempunyai
pengaruh signifikan terhadap pencapaian
tujuan kebijaksanaan otonomi daerah (Y) di
Kabupaten Tanah Laut, Provinsi Kalimantan
Selatan. Data yang terkumpul semuanya
diukur dengan skala interval
25
Contoh Data Tabel 5.4 Hal 140
26
27
Hasil Analisis Regresi Linear
Ganda dengan Software R
> #analisis Regresi
> g4 <- lm(Y ~ X1 + X2 + X3 + X4, data=Data4)
> summary(g4)
Call:
lm(formula = Y ~ X1 + X2 + X3 + X4, data = Data4)
Residuals:
Min 1Q Median 3Q Max
-0.7478 -0.2049 -0.0245 0.2939 0.6552
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -5.172098 0.883621 -5.853 4.19e-05 ***
X1 0.990244 0.476582 2.078 0.056607 .
X2 0.008088 0.163362 0.050 0.961213
X3 2.318482 0.481637 4.814 0.000275 ***
X4 0.003489 0.140570 0.025 0.980549
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.4352 on 14 degrees of freedom

Multiple R-squared: 0.8395, Adjusted R-squared: 0.7937
F-statistic: 18.31 on 4 and 14 DF, p-value: 1.884e-05
28
Hasil Analisis Regresi Linear
Ganda dengan Software R
> anova(g4)
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X1 1 8.2446 8.2446 43.5248 1.195e-05 ***
X2 1 1.1968 1.1968 6.3179 0.0248083 *
X3 1 4.4330 4.4330 23.4027 0.0002633 ***
X4 1 0.0001 0.0001 0.0006 0.9805488
Residuals 14 2.6519 0.1894
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
29
Taksiran parameter model dapat diperoleh

dari “Estimate”
𝑦ො = 𝛽መ0 + 𝛽መ1 𝑥1 + 𝛽መ2 𝑥2 + 𝛽መ3 𝑥3 + 𝛽መ4 𝑥4
𝑦ො = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 + 𝑏3 𝑥3 + 𝑏4 𝑥4
𝑏0 =-5.172, 𝑏1 =0,990, 𝑏2 =0,008,
𝑏3 =2,318, dan 𝑏4 =0,003
Sehingga Persamaan Regresi :
𝑦ො = −5,172 + 0,990𝑥1 + 0,008𝑥2 + 2,318𝑥3 +
0,003𝑥4
Kita menggunakan taraf kesignifikanan =5%.
30
Kesignifikanan Model: Uji F
Nilai F -statistic = 18,31 dengan nilai p-value = 1,884e-05,
memberikan informasi tentang kesignifikanan model.
Karena nilai p-value < , ini berarti model signifikan secara

statistis.
Kriteria kesimpulan:
Pengujian signifikan : p-value < 
Pengujian tidak signifikan : p-value  
Jadi, penaksiran, peramalan, atau inferensi yang lain dapat

dilakukan dengan menggunakan model regresi tersebut
karena model signifikan
31
- Daya ramal model: R2 (Koefisien Determinasi)
Multiple R-squared = 0,8395
Artinya model mempunyai daya ramal 83,95%
(variasi Y dapat dijelaskan oleh model sekitar
84%).
Kemampuan variable independen dalam
menjelaskan varians dari variable dependen
sebesar 84%, sisanya 16% varians variable
dependen dijelaskan oleh faktor lain yang tidak
terdapat dalam model regresi tersebut.
32
- Adjusted R-squared = 0,7937, artinya

bahwa X1, X2, X3, dan X4 secara bersama
sama dapat menjelaskan sekitar 79 %
variasi Y.
- Nilai Adjusted R-squared berbeda sekitar
5% dari R-squared .
- Jadi konstanta (0) mempunyai kontribusi
sekitar 5% terhadap model dalam kaitannya
dengan peramalan Y.
33
Kesignifikanan masing masing peubah bebas

Hanya peubah x3 yang signifikan,
karena nilai t value=4.814 dengan nilai p=0,000275 < 
Koefisien regresi untuk X3, yaitu b3=2,318 dapat

diinterpretasi bahwa:
Bila kapasitas organisasi (X3) dinaikkan satu satuan skor,
maka pencapaian tujuan kebijaksanaan otonomi daerah
(Y) dapat ditingkatkan sebesar 2,318 satuan apabila
peubah-peubah bebas lainnya dipertahankan tidak
berubah.
34
Korelasi Pearson dengan Software R
- Tidak signifikannya beberapa peubah bebas dapat
diakibatkan oleh adanya interkorelasi di antara peubah
bebas.
- Sintaks untuk mencari koefisien korelasi Pearson
#Korelasi Pearson
nilaikor <- cor(Data4, method="pearson")
nilaikor
Setelah dirun hasilnya sbb:
35
> nilaikor <- cor(Data4, method="pearson")

> nilaikor
X1 X2 X3 X4 Y
X1 1.00000000 0.04760523 0.5868836 0.17971690 0.7063106
X2 0.04760523 1.00000000 0.3944926 -0.01649777 0.3024196
X3 0.58688362 0.39449255 1.0000000 0.16316574 0.8870721
X4 0.17971690 -0.01649777 0.1631657 1.00000000 0.1707932
Y 0.70631062 0.30241958 0.8870721 0.17079324 1.0000000
36
Sintaks mencari matrik korelasi Pearson dengan level
signifikan (nilai p-value):
library(Hmisc)
nilaikor1 <- rcorr(as.matrix(Data4), type ="pearson")
nilaikor1$r
nilaikor1$P
Catatan:
Untuk menghitung Matrik Korelasi Pearson dibutuhkan
fungsi rcorr pada “Hmisc Package” dengan cara
menuliskan sintaks:
library(Hmisc)
37
library(Hmisc)
Error in library(Hmisc) : there is no
package called ‘Hmisc’
Saat kita run library(Hmisc) dan hasilnya error seperti di
atas, berarti belum ada Package “Hmisc”.
Kita harus menginstall Package “Hmisc” di console, dengan
sintaks berikut:
>install.packages("Hmisc")
Silahkan klik run
Catatan: Kita hanya cukup menginstall satu kali suatu
package tertentu.
38
39
Korelasi Pearson dengan level
signifikan dengan Software R
nilaikor1$r: nilai koefisien korelasi Pearson
nilaikor1$P: nilai p-value nya
Bandingkan hasil Korelasi pearson pada buku hal 142 (hasilnya sama)
> library(Hmisc)
> nilaikor1 <- rcorr(as.matrix(Data4), type ="pearson")
>Pear
nilaikor1$r
X1 X2 X3 X4 Y
X1 1.00000000 0.04760523 0.5868836 0.17971690 0.7063106
X2 0.04760523 1.00000000 0.3944926 -0.01649777 0.3024196
X3 0.58688362 0.39449255 1.0000000 0.16316574 0.8870721
X4 0.17971690 -0.01649777 0.1631657 1.00000000 0.1707932
Y 0.70631062 0.30241958 0.8870721 0.17079324 1.0000000
> nilaikor1$P
X1 X2 X3 X4 Y
X1 NA 0.84654555 8.252811e-03 0.4616014 7.247060e-04
X2 0.846545551 NA 9.464302e-02 0.9465545 2.082308e-01
X3 0.008252811 0.09464302 NA 0.5044950 4.162764e-07
X4 0.461601387 0.94655448 5.044950e-01 NA 4.844942e-01
Y 0.000724706 0.20823082 4.162764e-07 0.4844942 NA
40
Interpretasi Korelasi Pearson
Koefisien korelasi X1 dan X3 signifikan yang ditunjukkan
dengan r=0,59 dan nilai p=0,0083<0,05.
Hal ini berarti sebagian variasi yang dapat dijelaskan oleh
X1, dapat juga dijelaskan oleh X3.
Proporsi variasi ini ditentukan oleh koefisien determinasi
r2 = (0,59)2 = 0,3481 (35%).
Koefisien korelasi X3 dengan Y (r=0,89) signifikan dengan

p=0,0001.
Koefisien korelasi X1 dengan Y (r=0,71) juga signifikan
dengan p=0,0007.
41
Pengujian Asumsi pada model
Regresi Linear dengan Software R
Uji asumsi kenormalan menggunakan nilai residual model.
Residual model diperoleh dengan sintaks:
residumodel <- resid(g4)
residumodel
#Uji asumsi kenormalan dengan Shapiro-Walk

library(stats)
shapiro.test(residumodel)
#alternativ uji asumsi kenormalan
library(tseries)
jarque.bera.test(residumodel)
42
43
• Nilai p-value >  : data berasal dari sebaran normal
• > #Uji asumsi kenormalan dengan Shapiro-Walk
> library(stats)
> shapiro.test(residumodel)
Shapiro-Wilk normality test
data: residumodel
W = 0.95108, p-value = 0.4122
> #alternativ uji asumsi kenormalan dengan Uji Jarque Bera
> library(tseries)
> jarque.bera.test(residumodel)
Jarque Bera Test
data: residumodel
X-squared = 0.9234, df = 2, p-value = 0.6302
44
Uji Homoskedastisitas menggunakan uji

Breush Pagan
library(lmtest)
bptest(g4, studentize=F)
#Uji autokorelasi dengan uji Durbin-Watson

dwtest(g4)
45
- Uji multikolinieritas dengan Variance

Inflation Factor (VIF)
- Umumnya, standar VIF yang menunjukkan
tdk ada multikolinieritas VIF<10
- Sintaks:
library(car)
vif(g4)
46
47
> #Uji Homoskedastisitas menggunakan uji Breush Pagan
> library(lmtest)
> bptest(g4, studentize=F)
Breusch-Pagan test
data: g4
BP = 1.9095, df = 4, p-value = 0.7524
> #Uji autokorelasi dengan uji Durbin-Watson

> dwtest(g4)
Durbin-Watson test
data: g4
DW = 2.1799, p-value = 0.5841
alternative hypothesis: true autocorrelation is greater than 0
> #uji multikolinieritas dengan Variance Inflation Factor (VIF)

> #Umumnya, standar VIF yang menunjukkan tdk ada multikolinieritas VIF<10
> library(car)
> vif(g4)
X1 X2 X3 X4
1.636795 1.266838 1.936959 1.043317
48
Kesimpulan
Tahapan dalam analisis regresi linear telah
dipaparkan dengan software R dan juga cara
menginterpetasikannya.
Asumsi yang diperlukan dalam analisis regresi
linear juga telah dipaparkan dengan software R,
dan semua asumsi telah terpenuhi.
Jika terdapat asumsi yang tidak terpenuhi, maka
dapat dipertimbangkan langkah: transformasi
variable, menggunakan model yang lain seperti
model regresi nonlinear dan lain sebagainya.
49
George Box's famous quote
“All models are wrong but some
models are useful”
50
Referensi
R Core Team. (2019). R: A language and

environment for statistical computing. Vienna,
Austria: R Foundation for Statistical
Computing. Retrieved from http://www.R-
project.org
Tiro, M, A. (2019), Analisi Korelasi dan

Regresi, Makassar: Andira Publisher
51

Statistika Pendidikan - Pertemuan Kedua

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Statistika Pendidikan - Pertemuan Kedua

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS REGRESI LINEAR GANDA

• Prof. Drs.H.M.Arif Tiro, M.Pd., M.Sc., Ph.D.

- Rumusan Masalah dan Peubah

Contoh objek X berupa vector numerik

1. Ketik data pada Table 5.1 tersebut dengan

- Untuk kemudahan, kita bisa mengcopy directory tempat

- Cara mengimport data csv ke R studio dengan

Perhatikan: gunakan tanda / atau \\ bukan tanda / untuk

Taksiran parameter model dapat

Karena nilai p-value < , ini berarti model signifikan secara

Jadi, penaksiran, peramalan, atau inferensi yang lain dapat

Kemampuan variable independen dalam

- Nilai R-squared terletak antara 0 dan 1.

Kesignifikanan masing masing peubah bebas

Hanya peubah x1 yang signifikan

koefisien regresi untuk X1, yaitu b1=0,4231 dapat

Syahriani (2000) mengukur empat peubah

Residual standard error: 0.4352 on 14 degrees of freedom

Taksiran parameter model dapat diperoleh

Karena nilai p-value < , ini berarti model signifikan secara

Jadi, penaksiran, peramalan, atau inferensi yang lain dapat

- Adjusted R-squared = 0,7937, artinya

Kesignifikanan masing masing peubah bebas

Koefisien regresi untuk X3, yaitu b3=2,318 dapat

- Sintaks untuk mencari koefisien korelasi Pearson

> nilaikor <- cor(Data4, method="pearson")

Koefisien korelasi X3 dengan Y (r=0,89) signifikan dengan

#Uji asumsi kenormalan dengan Shapiro-Walk

Uji Homoskedastisitas menggunakan uji

#Uji autokorelasi dengan uji Durbin-Watson

- Uji multikolinieritas dengan Variance

> #Uji autokorelasi dengan uji Durbin-Watson

> #uji multikolinieritas dengan Variance Inflation Factor (VIF)

R Core Team. (2019). R: A language and

Tiro, M, A. (2019), Analisi Korelasi dan

Anda mungkin juga menyukai