Anda di halaman 1dari 18

MAKALAH

STATISTIKA PENDIDIKAN MATEMATIKA


“REGRESI LINEAR BERGANDA”

Untuk memenuhi tugas mata kuliah statistikapendidikanmatematika

Oleh:
NURHAKIMAH MUJAHID (210007301037)
SITI HARDIANTI (210007301038)
ALIM ALQADRI AMIR (210007301039)
TUTUT MASSANG (210007301040)

PRODI PENDIDIKAN MATEMATIKA PROGRAM PASCASARJANA


UNIVERSITAS NEGERI MAKASSAR
2021
A. Regresi Linier Berganda

Regresi linier berganda adalah regresi dimana variabel terikatnya (Y)

dihubungkan /dijelaskan lebih dari satu variabel, mungkin dua, tiga, dan

seterusnya variabel bebas ¿ ¿). Regresi linier berganda merupakan analisis

regresi yang menjelaskan hubungan antara variabel dependent dengan variabel

independent. Regresi linier berganda hampir sama dengan regresi linier

sederhana namun pada regresi linier berganda variabel bebasnya lebih dari

satu variabel penduga. Regresi linier berganda seringkali digunakan untuk

mengatasi permasalaahan analisis regresi yang melibatkan hubungan dari dua

atau lebih variabel bebas.Analisis regresi bertujuan menganalisis besarnya

pengaruh variable bebas terhada variabel terikat.

Model regresi linier berganda untuk dua variabel bebas dan satu

variabel terikat adalah sebagai berikut:

Model diatas dapat dijelaskan bahwa dalam model regresi linier

berganda mempunyai dua uji pengaruh yaitu :

1. Pengaruh variabel X (bebas) secara simultan terhadap variabel Y (terikat)

2. Pengaruh variabel X (bebas) secara parsial terhadap variabel Y (terikat),

yaitu meliputi:

a. Pengaruh variabel X1 terhadap variabel Y

b. Pengaruh variabel X2 terhadap variabel Y


Bentuk Umum Model Regresi Linier berganda

Bentuk umum untuk sebuah model regresi linier berganda untuk k

peubah bebas diberikan oleh :

Y   0  1 X 1   2 X 2  ...   k X k  

Dimana :

 = Peubah acak

 0 , 1 ,  2 ,...,  k = Koefesien-koefesien regresi yang perlu ditaksir

X 1 , X 2 ,..., X k = Variable bebas

Y = Variabel terikat

Dari persamaan diatas, untuk mencari nilai taksiran  0 , 1 ,  2 untuk

dua variabel bebas akan dimisalkan nilai-nilai b0 , b1 , b2 dengan rumus

sebagai berikut :

b0  Y  b1 X 1  b2 X 2
 n 2  n   n  n 
  2i    1i i    1i 2i   x2i yi 
x x y  x x
b1   i 1   i 1   i 1  i 1
2

 n
2 
n
2  
n

  x1i   x2i     x1i x2i 
 i 1  i 1   i 1 
 n
2 
n
  n
 n 
  1i   2i i    1i 2i   x1i yi 
x x y  x x
b2   i 1  i 1   i 1  i 1
2

 n 2  n 2   n 
  x1i   x2i     x1i x2i 
 i 1  i 1   i 1 
Untuk regesi linier ganda dengan tiga atau lebih variabel bebas,

rumus taksiran koefesien regresinya dapat diturunkan dengan cara yang

sama. Namun, pada saat ini kita akan memanfaatkan computer untuk

menghitung koefisien-koefisien tersebut tanpa menuliskan rumusnya.

Dengan demikian, perhitungan manual tidak banyak dilakukan untuk

regresi ganda, karena rumusnya lebih rumit dan menghitungnya secara

manual juga memiliki peluang terjadi kesalahan yang cukup besar.

B. Asumsi Regresi Linier Berganda

1. Normalitas
Uji normalitas beertujuan untuk mengetahui normal atau tidaknya
suatu distribusi data..Uji normalitas adalah hal yang penting karena
merupakan salah satu syarat pengujian parametric-test (uji parametric)
dimana data harus berdistribusi normal.Data yang berdistribusi normal
artinya sampel dari data yang digunakan sudah mewakili
populasi.Begitupun sebaliknya, apabila data tidak berdistribusi normal
maka sampel tidak mewakili populasi dari data tersebut.
a) Hipotesis
H 0  Data berdistribusi normal

H1  Data tidak berdistribusi normal

b) Statistik uji
Statistik uji yang biasa digunakan dalam uji normalitas
adalah uji Chi Square, Skewness dan kurtosis atau uji Kolmogorov
Smirnov.
c) Daerah krits
Daerah kritis untuk uji Kolmogorov Smirnov yaitu

 Nilai signifikasi (P Value) ¿ 0,05 maka H 0 ditolak dan H1


diterima, artinya data tidak berdistribusi normal.

 Nilai signifikasi (P Value) ¿ 0,05 maka H 0 diterima dan H1


ditolak, artinya data berdistribusi normal.
2. Multikolinieritas
Multikolinieritas adalah terjadinya hubungan linier antara
variabel bebas dalam suatu model regresi linier berganda. Hubungan
linier antara variabel bebas dapaat terjadi dalam bentuk hubungan linier
yang sempurna (perfect) dan hubungan linier yang kurang sempurna
(imperfect).
a) Hipotesis

 H 0  Tidak terjadi multikolinieritas

 H1  Terjadi multikolinieritas

b) Statistik uji
Statistik uji yang biasa digunakan dalam uji multikolinieritas
adalah dengan Variance inflation factor (VIF), korelasi pearson
antara variabel-variabel bebas, atau dengan melihat eigenvalues dan
condition index (CI). Dengan rumus sebagai berikut :
1
VIF 
1  Ri2
c) Daerah krits
Daerah kritis pada uji multikoinieritas adalah

 Nilai VIF < 10 maka H 0 ditolak dan H1 diterima, artinya tidak


terjadi multikoinearitas.

 Nilai VIF > 10 maka H 0 diterima dan H1 ditolak, artinya telah


terjadi multikolinieritas.
3. Heterokedastisitas
Uji heteroskedastistas digunakan untuk mengetahui ada atau tidaknya
penyimpangan asumsi klasik heteroskedastistas, yaitu adanya
ketidaksamaan varian dari residual untuk semua pengamatan pada model
regresi. Prasayarat yang harus terpenuhi dalam model regresi adalah
tidak adanya gejala heteroskedastistas
a) Hipotesis

 H 0  Tidak terdapat heterokedastisitas

 H1  Terdapat heterokedastisitas
b) Statistik uji
Statistik uji yang biasa digunakan dalam uji
heterokedastisitas adalah uji Glejser, uji Park atau uji White.
c) Daerah krits
Daerah untuk uji Kolmogorov Smirnov adalah sebagai
berikut:

 Nilai signifikasi (P Value) < 0,05 maka H 0 ditolak dan H1


diterima, artinya terdapat heterokedastisitas.

 Nilai signifikasi (P Value) > 0,05 maka H 0 diterima dan H1


ditolak, artinya tidak terdapat heterokedastisitas.
C. Pengujian Hipotesis

Uij signifikan merupakan prosedur yang digunakan untuk menguji

kesalahan atau kebenaran dari hasil hipotesis nol (H0) dari sampel, uji

signifikan yang digunakan adalah sebagai berikut:

1) Koefisien Determinasi (R2)

Koefisien determinasi digunakan untuk mengetahui seberapa besar

hubungan dari beberapa variabel dalam pengertian yang lebih

jelas.Nilai koefisien ini antara 0 dan 1, jika hasil lebih mendekati

angka 0 berarti kemampuan variabel-variabel independen dalam

menjelaskan variasi variabel amat terbatas.Tapi jika hasil

mendekati angka 1 berarti variabel-variabel independen

memberikan hampir semua informasi yang dibutuhkan untuk

memprediksi variasi variabel dependen.

2) Uji t-Statistik (Uji Parsial)

Uji t digunakan untuk mengetahui apakah variabel-variabel

independen secara parsial berpengaruh nyata atau tidak terhadap

variabel dependen. Derajat signifikansi yang digunakan adalah


0,05. Apabila nilai signifikan lebih kecil dari derajat kepercayaan

maka kita menerima hipotesis alternatif, yang menyatakan bahwa

suatu variabel independen secara parsial mempengaruhi variabel

dependen.

3) Uji F-Statistik(Uji Simultan)

Uji F digunakan untuk mengetahui apakah variabel-variabel

independen secara simultan berpengaruh signifikan terhadap

variabel dependen. Derajat kepercayaan yang digunakan adalah

0,05. Apabila nilai F hasil perhitungan lebih besar daripada nilai F

menurut tabel maka hipotesis alternatif, yang menyatakan bahwa

semua variabel independen secara simultan berpengaruh signifikan

terhadap variabel dependen.

D. Contoh Soal

Kita akan meneliti variasi beratba dan (Y) dikaitkan dengan tinggi badan

(X1) dan umur (X2) untuk anak-anak yang memiliki masalah atau

kekurangan gizi. Peubah terikat adalah berat, serta dua peubah dasar tinggi

dan umur sebagai peubah bebas. Andaikan bahwa sebuah sampel acak

terdiri dari 12 anak yang mengunjungi sebuah klinik. Data berat (kg),

tinggi (cm), dan umur (tahun) diperoleh untuk setiap anak dan diberikan

pada table 5.1 (Buku Analisis Korelasi dan Regresi oleh Prof. Muhammad

Arif Tiro)

Anak 1 2 3 4 5 6 7 8 9 10 11 12

Y(kg) 32 36 27 34 28 29 39 29 28 26 38 39

X1(cm) 57 59 49 62 51 50 55 48 42 42 61 57

X2(thn) 8 10 6 11 8 7 10 9 10 6 12 9
Jawab:
Pertama-tama kita buat table pembantu agar memudahkan kita dalam
menghitung

NO Y X1 X2 Y^2 X1^2 X2^2 X1Y X2Y X1X2


1 32 57 8 1024 3249 64 1824 256 456
2 36 59 10 1296 3481 100 2124 360 590
3 27 49 6 729 2401 36 1323 162 294
4 34 62 11 1156 3844 121 2108 374 682
5 28 51 8 784 2601 64 1428 224 408
6 29 50 7 841 2500 49 1450 203 350
7 39 55 10 1521 3025 100 2145 390 550
8 29 48 9 841 2304 81 1392 261 432
9 28 42 10 784 1764 100 1176 280 420
10 26 42 6 676 1764 36 1092 156 252
11 38 61 12 1444 3721 144 2318 456 732
12 39 57 9 1521 3249 81 2223 351 513
3390
Jumlah 385 633 106 12617 3 976 20603 3473 5679
32,0833 8,83333
Rata2 3 52,75 3

x− Y
∑ x 1 y = ∑ X 1 Y – ∑ 1N ∑ =20603− ( 63312) −385
=294,25

( ∑ X 2 ) −∑ Y
∑ x 2 y=∑ X 2 Y − N
=75,617

2
(∑ X 1 ) ( 633 )2
2
∑ x 1 =∑ X 1 −2 = 33903 - =¿512,25
N 12

∑ x 22=39,667
∑ y2 =264,917
∑ x 1 x2=87,5
a) Persamaan model regresi

b1∑ x 12+ b2∑ x 1 x2= ∑ x 1 y


b1∑ x 1 x2+ b1∑ x 22= ∑ x 2 y

x1 y ∑ x1 x2
b 1=
|∑∑ x2 y ∑ x 22 | =
( ∑ x 1 y ) (∑ x 22 )−(∑ x1 x2 )(∑ x 2 y )
2 =
x 12 ∑ x1 x2 (∑ x12 )(∑ x 22 )−(∑ x 1 x 2 )
|∑∑ x1 x 2 ∑ x 22 |
( 294,25 )( 39,667 )−( 87,5)(75,617)
=¿
( 512,25 )( 39,667 )−( 87,5)2

5,357,7153
= =0,4231
12663,17
∑ x12 ∑ x1 y
b 2=
|
∑ x 1 x2 ∑ x2 y
=
| (∑ x 12) (∑ x 2 y )−(∑ x 1 x 2)(∑ x 1 y)
2 =
∑ x 12 ∑ x 1 x 2 (∑ x 12 )(∑ x22 )−(∑ x 1 x2 )
|
∑ x1 x 2 ∑ x 22 |
11219,56
=0,8861
12663,17

b0 = Ý −b1 X́ 1−b 2 X́ 2

= 32,083 – (0,4231)(52,75) – (0,8861)(8,833)

= 32,083 – 22,318 – 7,826

= 1,939

Sehingga persamaan model regresinya adalah :

Y^ =¿ 1,939 + 0,4231X1 + 0,8861X2

b) Uji Signifikansi Persamaan Regresi Ganda Y atas X1 dan X2


1) Menghitung Jumlah Kuadrat
JK(T) = ∑ y2 =264,917
JK(Reg) = b1∑ x 1 y + b2∑ x 2 y

= (0,4231)(294,25) + (0,8861)(75,617)

= 191,501

JK(Res) = JK(T) – JK(Reg)

= 264,917 – 191,501

= 73,416
2) Menentukan derajat bebas (db)

db(T) = 19 – 1

= 18

db(Reg) =k

=4

db(Res) =n–k–1

= 19 – 4 – 1

= 15

3) Menghitung rata-rata Jumlah kuadrat (RJK)

JK ( Reg) 191,501
RJK(Reg) = = =¿ 47,8752
db (Reg) 4

JK ( Res) 73,416
RJK(Sisa) = = =¿ 4,8944
db (Res) 15

4) Menentukan Fhitung
Uji signifikansi regresi Y atas X1 dan X2
Hipotesis :
H0: regresi tak berarti
H1: regresi berarti
RJK ( Reg) 47,8752
Fhitung = = =¿ 9,78162, bandingkan dengan Ftab(0,05;4;15) = 3,06.
RJK (sisa) 4,8944

Sehingga Fhit(Reg) >Ftab atau H0 ditolak. Sehingga persamaan regresi

signifikan atau terdapat pengaruh linear X1dan X2 terhadap variabel Y.

5) Menyusun tabel ANOVA Regresi

Tabel uji signifikansi regresi ganda

Sumber Ftab
JK db RJK Fhit
Varians
Regresi 191,501 4 47,8752
Sisa 73,416 15 4,8944
Total 264,917 18

6) Uji signifikansi koefisien regresi ganda Y atas X1 dan X2


a) koefisien Korelasi ganda
JK ( Reg) 191,501
R y .122= = =¿ 0,7228
JK (T ) 264,917

R y .12= √0,7228 = 0,8502

a) Uji signifikansi koefisien korelasi ganda


H0 : ρ y .12=0
H1 : ρ y .12 ≠ 0

R 2 (n−k−1) (0,7228)(15) 10,842


Fhitung = = = =¿ 9,778 bandingkan dengan
k (1−R 2) 4 (1−0,7228) 1,1088

Ftab(0,05;4;15)= 3,06sehingga Fhit > Ftabatau H0 ditolak. Hal ini koefisien korelasi
ganda signifikan.

b) Koefisien determinasi
0,7228 x 100% = 72,28%.
7) Uji signifikansi koefisien persamaan Regresi Ganda
a) Menghitung galat baku taksiran (s y .12 ¿= √ 4,8944=2,2123
b) Menghitung Ri2
karena r12 = r21 maka R12=R22
koefisien R1 = R2 dihitung dengan rumus :
x x 87,5
R1 ¿ ∑ 1 2 = =1,4853
√¿ ¿ ¿ √(512,25)(39,667)
Sehingga menghasilkan R12=R22=¿ 2,2061

c) Menghitung Sbi 2

2 S y.12 …2
Sbi =
∑ x i2(1−R2)
2 S y.12… 2 2,2123 2,2123
Sb 1 = 2 2
= = =0,0069
∑ x 1 (1−R ) (512,25)(1−0,3767) (512,25)( 0,6233)
sb 1= √0,0069 = 0,083

Selanjutnya,
2 S y.12 …2 2,2123 2,2123
Sb 2 = 2 2
= = =0,0894
∑ x 2 ( 1−R ) (39,667)(1−0,3767) (39,667)(0,6233)
sb 1= √ 0,0894 = 0,2991

8) Menghitung statistik Uji-t


H0 : β 1 ≤ 0
H1 : β 1 > 0
Uji signifikansi koefisien b1
bi
t i=
s bi
b1 0,4231
t 1= = =5,0975> ttab
s b 1 0,083
b2 0,8861
t 2= = =2,9625> ttab
s b 2 0,2991

ttab(0,05;9) = 1,833
Secara umum, dapat disimpulkan bahwa variabel bebas yang berpengaruh
signifikan adalah (𝑋1) dan (𝑋2) berpengaruh terhadap nilai variabel (Y).
.10) Uji Normalitas Liliefors
a) Pengujian Normalitas X1 menggunakan liliefors
NO X1 fi Z F(Z) S(Z) |F(zi)- S(zi)|

1 42 2 -1,76749 0,03853 0,16667 0,12809391

2 48 1 -0,83723 0,20123 0,25 0,04876964

3 49 1 -0,68219 0,24759 0,33333 0,08577424

4 50 1 -0,52715 0,29906 0,41667 0,11762117

5 51 1 -0,3721 0,35498 0,5 0,14509237

6 55 1 0,24809 0,59796 0,58333 0,01462638

7 57 2 0,55816 0,71161 0,75 0,03836887

8 59 1 0,86823 0,80739 0,83333 0,02596394

9 61 1 1,17833 0,880667 0,916667 0,03599927

1
0 62 1 1,333373 0,908795 1 0,09120469

Dari X1 diperoleh Mean = 52,75


SD = 6,449806
Maks (Lhit) = 0,11881
Ltab = a =0,05 dan n = 12 diperoleh 0,242
Karena Lhit< Ltab dengan demikian data tersebut berdistribusi normal

b) Pengujian Normalitas X2 menggunakan liliefors


NO X2 fi Z F(Z) S(Z) |F(zi)- S(zi)|

1 6 2 -1,38873 0,082457 0,166667 0,084209

2 7 1 -0,92582 0,17727 0,25 0,07273

3 8 2 -0,46291 0,321714 0,416667 0,094952

4 9 2 0 0,5 0,583333 0,083333

5 10 3 0,46291 0,678286 0,833333 0,155048

6 11 1 0,92582 0,82273 0,916667 0,093936

7 12 1 1,38873 0,917543 1 0,082457

Dari X2 diperoleh Mean = 8,833


SD = 2,160247
Maks (Lhit) = 0,127911
Ltab = a =0,05 dan n = 12 diperoleh 0,242
Karena Lhit< Ltab dengan demikian data tersebut berdistribusi normal

|F(zi)-
N0 Y fi Z F(Z) S(Z) S(zi)|
1 26 1 -1,24536 0,106499 0,083333 0,023166
2 27 1 -1,04065 0,14902 0,166667 0,017647
3 28 2 -0,83593 0,201597 0,333333 0,131736
4 29 2 -0,63121 0,263951 0,5 0,236049
5 32 1 -0,01706 0,493194 0,583333 0,090139
6 34 1 0,392375 0,652609 0,666667 0,014057
7 36 1 0,80181 0,788668 0,75 0,038668
8 38 1 1,211244 0,887099 0,833333 0,053766
9 39 2 1,415962 0,921607 1 0,078393
Dari Y diperoleh Mean = 32,8833
SD = 4,884784
Maks (Lhit) = 0,236
Ltab = a =0,05 dan n = 12 diperoleh 0,242
Karena Lhit< Ltab dengan demikian data tersebut berdistribusi normal

11) Uji Multikolinearitas


Pengujian manual multikolinearitas menggunakan VIF, dengan
menggunakan nilai korelasi antar variabel bebas X1X2 atau r x 1 x2 lalu
dikuadratkan, diperoleh nilai
rx 1 x2 = 0,61377
r 2x
1
x2 = 0,37671
Tolerance (TOL) = 1 – 0,37671 = 0,62329
1
VIF = =1,6043
0,62329
Karena VIF < 10 maka tidak terjadi multikolinearitas.
12) Uji Heterokedastisitas
H0 : tidak terjadi masalah heterokedastisitas.
H1 : terjadi masalah heterokedastisitas.
Uji heterokedastisitas menggunakan rank spearmen berikut lampiran tabel 1.6

Y^ |e|
Y X1 X2 E RANK X1 RANK D D^2
|e|
32 57 8 33,1445 -1,1445 1,1445 8 7 -1 1
36 59 10 35,7629 0,2371 0,2371 10 1 -9 81
27 49 6 27,9875 -0,9875 0,9875 4 6 2 4
34 62 11 37,9183 -3,9183 3,9183 12 10 -2 4
28 51 8 30,6059 -2,6059 2,6059 6 9 3 9
29 50 7 29,2967 -0,2967 0,2967 5 2 -3 9
39 55 10 34,0705 4,9295 4,9295 7 11 4 16
29 48 9 30,2227 -1,2227 1,2227 3 8 5 25
28 42 10 28,5702 -0,5702 0,5702 1 4 3 9
26 42 6 25,0258 0,9742 0,9742 1 5 4 16
38 61 12 38,3813 -0,3813 0,3813 11 3 -8 64
39 57 9 34,0306 4,9694 4,9694 8 12 4 16
Jumlah 254

Rumus Rank Spearmen (Thit) = 1 - ¿ ¿


(6)(254) 1524
=1- 2
=1− = 0,1118
12(12 −1) ( 12 ) ( 143 )

1) H0 : R , H1 : R
2) Statistik Uji : z
3) Uji 2 arah
4) Taraf nyata pengujian = a = 5% atau a/2 = 0,025
5) Daerah penolakan H0
6) Ztab = 1 – 0,025 = 1,96
-z ≤ z hit ≤ z tab maka pernyataan H0 diterima .
z hit > ztab maka pernyataan H1 diterima
Karena Thit = 0,1118 sehingga -1,96 ≤ 0,1118≤ 1,96 berarti ragam/varian
untuk data X1tidak terjadi masalah heterokedastisitas.
RANK X2 RANK e D D^2
4 7 3 9
8 1 -7 49
1 6 5 25
11 10 -1 1
4 9 5 25
3 2 -1 1
8 11 3 9
6 8 2 4
8 4 -4 16
1 5 4 16
12 3 -9 81
6 12 6 36
272

Rumus Rank Spearmen = 1 - ¿ ¿


( 6)(272) 1632
=1- 2
=1− = 0,0489
12(12 −1) ( 12 ) ( 143 )

1) H0 : R , H1 : R
2) Statistik Uji : z
3) Uji 2 arah
4) Taraf nyata pengujian = a = 5% atau a/2 = 0,025
5) Daerah penolakan H0
6) Ztab = 1 – 0,025 = 1,96
-z ≤ z hit ≤ z tab maka pernyataan H0 diterima .
z hit > ztab maka pernyataan H1 diterima

Karena Thit = 0,1118 sehingga -1,96 ≤ 0,0489 ≤ 1,96 berarti ragam/varian


tidak terjadi masalah heterokedastisitas.
HasilAnalisisdenganProgram R
Sintax

Output
Interpretasi Output dengan software R
Berdasarkanhasil di atasdidapatkanpersamaanregresi:
Y^ =¿ 1,939 + 0,4231X1 + 0,8861X2

Adapunkoefisiendeterminasi (R2) yaitu multiple R-squared = 0,7113 yang artinya


model mempunyaidayaramalsebesar 71%. Kemampuan variable
independenyaituTinggi (X1) danUmur (X2 ) dalammenjelaskanmenjelaskan
variable dependenBeratbadan (Y) sebesar 71%. sisanya 29% dijelaskanoleh
factor lain yang tidakterdapatdalam model.
Kesignifikanan model: Uji F
Nilai F statistic = 11,09dengannilai p-value = 0,0037
Karena (P Value) yaitu 0,0037< α maka variable
independenberpengaruhsecarasignifikaterhadapvariabeldependen.
Jadiuntukpenaksiran, peramalan, atauinterferensi yang lain dapatdilakukandengan
model tersebutkarena model signifikan.
Kesignifikanan model: Uji T
Nilai t value = 2,593 dengannilai p = 0,0291< α
Karena p-value < α jadipenaksiran, peramalan, dan yang
lainnyadapatdilakukandenganmenggunakan model regresitersebutkarena model
signifikan.
DAFTAR PUSTAKA

Anda mungkin juga menyukai