ANALISIS REGRESI
OLEH
1. ALDIANSYAH (1917031044)
2. AJENG PUJA KUSUMA (1917031050)
3. DINI DESITA (1917031042)
4. SINTA MEUDI AMALIA (1917031049)
5. RACHMA ADJI RAMADANTI (1917031046)
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
BANDAR LAMPUNG
2021
PENDAHULUAN
Analisis regresi merupakan alat statistik yang banyak digunakan dalam berbagai
bidang. Analisis tersebut bertujuan untuk mengetahui hubungan antara variabel
dependen dan variabel independen. Analisis regresi linier berganda mempunyai
lebih dari satu variabel bebas, sering menimbulkan masalah karena terjadinya
hubungan kuat antara dua variabel bebasnya yang mengakibatkan terjadinya
kolenieritas ganda (multikolenierity). Gejala ini menimbulkan masalah dalam
pemodelan regresi. Kolerasi yang sangat tinggi akan menghasilkan penaksiran
yang berbias, tidak stabil dan mungkin jauh dari nilai sasaran sehingga galat yang
dihasilkan menjadi besar dan variansi parameternya menjadi tak hingga. Metode
kuadrat terkecil akan memberikan efek dari kolenieritas yaitu tingginya nilai
koefisien determinasi tetapi tidak diikuti dengan hasil uji hipotesis yang
signifikan. Salah satu cara untuk mendapatkan koefisien regresi pada persamaan
regresi linier berganda adalah melalui metode kuadrat terkecil. Penggunaan
metode ini memerlukan beberapa asumsi klasik yang harus dipenuhi yaitu
normalitas, tidak terdapat heteroskedastisitas, tidak terdapat autokorelasi, tidak
terdapat multikolinieritas, dan kebebasan galat. Jika asumsi-asumsi klasik dalam
metode kuadrat terkecil terpenuhi maka penduga parameter yang diperoleh
bersifat Best Linier Unbiased Estimation (BLUE). Analisis regresi linear berganda
ini dapat dilakukan dengan menggunakan bantuan software SAS. SAS (Statistical
Analysis System) adalah program komputer untuk analisis statistika yang
dikembangkan oleh perusahaan SAS Institute. Perangkat lunak ini dirancang
untuk keperluan berbagai bidang dengan fitur Analisis Statistika, Riset Operasi,
dan Managemen Proyek. Dalam praktikum kali ini kami mengambil kasus yaitu
mengenai pengaruh jumlah followers dan total postingan terhadap jumlah like
yang diperoleh pada akun social media instagram yang dimiliki oleh Mahasiswa
Matematika FMIPA Unila angkatan 2019. Untuk menyelesaikan kasus tersebut,
memerlukan metode analisis regresi linear berganda. Maka dari itu kami
memanfaatkan software SAS untuk membantu pekerjaan kamidalam mengolah
data yang akan dibahas dibawah ini.
PEMBAHASAN
1. Uji Inferensia
Penyelesaian :
Script SAS untuk menganalisis data tersebut
TITLE 'Analisis Regresi Linear Berganda';
DATA Prak9;
INPUT Like Followers Postingan Following;
DATALINES;
1590 465 7 1342
1702 868 8 1191
1734 694 9 844
1783 1179 10 1022
2147 1074 11 1279
2289 893 13 906
2374 1237 13 1325
2946 524 14 363
3068 816 15 981
3181 669 15 1003
3348 324 15 1466
3646 1385 17 609
3726 396 17 739
3764 1068 19 621
3862 1070 20 519
3866 997 23 1326
4340 1072 24 861
4393 1083 26 1103
4795 647 26 482
4815 1116 27 1459
4878 408 27 743
4956 1222 29 529
5203 1165 29 305
5303 1307 29 803
5541 1322 30 1138
5625 403 31 575
5705 1412 31 1403
5742 803 33 379
5835 882 34 1138
6268 749 35 498
6534 1186 36 1405
6590 1054 36 1384
6962 1473 36 647
227 1476 2 1483
353 979 3 1215
468 923 4 1461
476 775 4 1193
592 977 5 1075
896 1054 5 614
1211 711 6 1341
1319 923 6 521
;
PROC CORR DATA=Prak9;
VAR Like Followers Postingan Following;
ODS GRAPHICS ON;
PROC MODEL DATA=Prak9;
PARMS a1 b1 b2 b3;
Like=a1+b1*Followers+b2*Postingan+b3*Following;
FIT Like / WHITE BREUSCH=(1 Followers Postingan Following);
PROC REG DATA=Prak9;
MODEL Like= Followers Postingan Following/VIF DW;
OUTPUT OUT=resids R=res;
PROC UNIVARIATE DATA=resids NORMAL PLOT;
VAR res;
RUN;
ODS GRAPHICS OFF;
Analysis of Variance
Source D Sum of Mean F Value Pr > F
F Squares Square
Model 3 157603091 5253436 742.81 <.0001
4
Error 37 2616779 70724
Corrected Total 40 160219870
H 0 : Tidak ada pengaruh jumlah Followers (X1), total Postingan (X2) dan
jumlah following (X3) secara simultan terhadap jumlah Like (Y) yang
diperoleh pada akun social media instagram (Model yang dihasilkan tidak
signifikan atau model tidak cocok)
H1: Ada pengaruh jumlah Followers (X1), total Postingan (X2) dan
jumlah following (X3) secara simultan terhadap jumlah Like (Y) yang
diperoleh pada akun social media instagram (Model yang dihasilkan
signifikan atau model cocok dan dapat digunakan)
Aturan keputusan :
Tolak H 0 jika p-value < 0,05
Terima H 0 jika p-value > 0,05
Karena p-value (<0,0001)<0,05 maka Tolak H 0. Jadi dapat disimpulkan
bahwa ada pengaruh jumlah Followers (X1), total Postingan (X2) dan
jumlah following (X3) secara simultan terhadap jumlah Like (Y) yang
diperoleh pada akun social media instagram (Model yang dihasilkan
signifikan atau model cocok dan dapat digunakan).
2. Uji Parsial
Parameter Estimates
Variable DF Parameter Standard t Valu Pr > |t| Variance
Estimate Error e Inflation
Intercept 1 389.61424 183.54416 2.12 0.0405 0
Followers 1 -0.18251 0.14107 -1.29 0.2038 1.06549
Postinga 1 178.95760 4.01871 44.53 <.0001 1.12098
n
Followin 1 -0.11276 0.12011 -0.94 0.3539 1.10721
g
b. Uji Parameter β 1
H 0 : β1 =0 ¿Tidak terdapat pengaruh antara jumlah followers dengan
jumlah like)
H 1 : β 1 ≠ 0(Terdapat pengaruh antara jumlah followers dengan jumlah like)
Taraf signifikansi : 5% = 0,05
Aturan keputusan :
Tolak H 0 jika p-value < 0,05
Terima H 0 jika p-value > 0,05
Kesimpulan : Karena p-value(0.2038) > 0,05, maka terima H 0. Jadi dapat
disimpulkan bahwa tidak terdapat pengaruh antara jumlah followers
dengan jumlah like.
c. Uji Parameter β 2
H 0 : β2 =0 ¿Tidak terdapat pengaruh antara total postingan dengan jumlah
like)
H 1 : β 2 ≠ 0(Terdapat pengaruh antara total postingan dengan jumlah like)
Taraf signifikansi : 5% = 0,05
Aturan keputusan :
Tolak H 0 jika p-value < 0,05
Terima H 0 jika p-value > 0,05
Kesimpulan : Karena p-value(<.0001) < 0,05, maka tolak H 0. Jadi dapat
disimpulkan bahwa terdapat pengaruh antara total postingan dengan
jumlah like.
d. Uji Parameter β 3
H 0 : β3 =0 ¿Tidak terdapat pengaruh antara jumlah following dengan
jumlah like)
H 1 : β 3 ≠ 0 (Terdapat pengaruh antara jumlah following dengan jumlah like)
Taraf signifikansi : 5% = 0,05
Aturan keputusan :
Tolak H 0 jika p-value < 0,05
Terima H 0 jika p-value > 0,05
Kesimpulan : Karena p-value(0.3539) > 0,05, maka terima H 0. Jadi dapat
disimpulkan bahwa tidak terdapat pengaruh antara jumlah following
dengan jumlah like.
3. Koefisien Determinasi
Root MSE 265.93939 R- 0.9837
Square
Dependent 3513.48780 Adj R-Sq 0.9823
Mean
Coeff Var 7.56910
Nilai R square sebesar 0.9837 atau 98,37% berarti variabel bebas jumlah
Followers (X1), total Postingan (X2), dan jumlah following (X3) secara
simultan(bersama-sama) berpengaruh terhadap lama jumlah Like (Y) sebesar
98,37% sedangkan 1,63 % jumlah like dipengaruhi oleh faktor lain yang
tidak diteliti. Nilai R square sebesar 0.9837 berarti kualitas modelnya sangat
baik. Selain itu diperoleh nilai Adjusted R-square sebesar 0.9823 yang berarti
juga kualitas modelnya sangat baik
4. Korelasi
Dari output diatas, dapat dilihat bahwa korelasi di diagonal utama yaitu like
dengan like, followers dengan followers, postingan dengan postingan, dan
following dengan following semuanya sama dengan 1. Ini karena sebuah
variable selalu berkorelasi sempurna dengan dirinya sendiri.
Untuk hubungan like dengan followers dan sebaliknya memiliki nilai korelasi
yang sama yaitu 0.13811. Yang berarti korelasi antar variabel sangat lemah.
Nilai korelasi positif berarti jika jumlah followers bertambah maka jumlah like
juga akan bertambah dan sebaliknya.
Untuk hubungan like dengan postingan dan sebaliknya memiliki nilai korelasi
yang sama yaitu 0.99111. Yang berarti korelasi antar variabel sangat kuat.
Nilai korelasi positif berarti jika total postingan bertambah maka jumlah like
juga akan bertambah dan sebaliknya.
Untuk hubungan like dengan following dan sebaliknya memiliki nilai korelasi
yang sama yaitu -0.27821. Yang berarti korelasi antar variabel lemah. Nilai
korelasi negatif berarti jika jumlah following bertambah maka jumlah like
akan berkurang dan sebaliknya.
Scipt
TITLE 'Analisis Regresi Linear Berganda';
DATA Prak9;
INPUT y x1 x2 x3;
DATALINES;
1590 465 7 1342
1702 868 8 1191
1734 694 9 844
1783 1179 10 1022
2147 1074 11 1279
2289 893 13 906
2374 1237 13 1325
2946 524 14 363
3068 816 15 981
3181 669 15 1003
3348 324 15 1466
3646 1385 17 609
3726 396 17 739
3764 1068 19 621
3862 1070 20 519
3866 997 23 1326
4340 1072 24 861
4393 1083 26 1103
4795 647 26 482
4815 1116 27 1459
4878 408 27 743
4956 1222 29 529
5203 1165 29 305
5303 1307 29 803
5541 1322 30 1138
5625 403 31 575
5705 1412 31 1403
5742 803 33 379
5835 882 34 1138
6268 749 35 498
6534 1186 36 1405
6590 1054 36 1384
6962 1473 36 647
227 1476 2 1483
353 979 3 1215
468 923 4 1461
476 775 4 1193
592 977 5 1075
896 1054 5 614
1211 711 6 1341
1319 923 6 521
;
PROC PRINT Data=Prak9;
run;
Langkah 1:
Forward Selection: Step 1
Model
Variable Tolerance R-Square F Value Pr > F
Parameter Standard
Variable Estimate Error Type II SS F Value Pr > F
Kita pilih variabel yang memberikan R2 terbesar atau 𝑓 terbesar. Maka kita
pilih x 2 untuk dimasukkan dalam model. Cek signifiikansi melalui nilai p-
value. Karena nilai p-value lebih kecil dari tingkat signifikansi (α=0.05) maka
kita masukkan x 2 ke dalam model. Sehingga diperoleh model untuk langkah 1
Y =107.09156+ 179.05416 x 2.
Langkah 2:
Model
Variable Tolerance R-Square F Value Pr > F
No other variable met the 0.0500 significance level for entry into the model
2
Pilih variabel yang memberikan kenaikan R terbesar apabila variabel tersebut
dimasukkan ke dalam model yang diperoleh pada langkah 1. Maka kita pilih
x 1 untuk dimasukkan dalam model. Karena nilai p-value lebih besar dari nilai
signifikansi yang kita inginkan (α=0.05) maka x 2 dimasukkan ke dalam model.
Maka diperoleh model akhir: Y =107.09156+ 179.05416 x 2.
2. Metode Backward
D Sum of Mean
Source F Squares Square F Value Pr > F
Parameter Standard
ariable Estimate Error Type II SS F Value Pr > F
Langkah 1:
Partial Model
Variable R-Square R-Square F Value Pr > F
Partial Model
Variable R-Square R-Square F Value Pr > F
Parameter Standard
Variable Estimate Error Type II SS F Value Pr > F
Dari tabel pada step 0, pilih variabel yang memiliki Type II SS (Restricted
SSR) terkecil sebagai kandidat yang akan dikeluarkan dari model (yaitu x 3).
Karena nilai p-value (0.3539) lebih besar dari tingkat signifikansi (α=0.05)
maka x 3 kita keluarkan dari model. Maka persamaan regresi langkah 1:
Y =283.98632−0.20670 x1 +180.03281 x2.
Langkah 2
Partial Model
Variable R-Square R-Square F Value Pr > F
Dari tabel pada langkah 1, pilih variabel yang memiliki Type II SS (Restricted
SSR) terkecil sebagai kandidat yang akan dikeluarkan dari model (yaitu x 1).
Karena nilai p-value (0.1438) lebih besar dari tingkat signifikansi (α=0.05)
maka 1 kita keluarkan dari model. Maka persamaan regresi langkah 2:
Y =107.09156+ 179.05416 x 2.
Langkah 3:
Dari tabel pada langkah 2, pilih variabel yang memiliki Type II SS (Restricted
SSR) terkecil sebagai kandidat yang akan dikeluarkan dari model (yaitu x 2).
Karena nilai p-value (<.0001) lebih kecil dari tingkat signifikansi (α=0.05)
maka x 2 tidak kita keluarkan dari model. Maka model regresi akhir adalah:
Y =107.09156+ 179.05416 x 2 .
Numbe
Ste Variable r Partial Model
p Removed Vars In R-Square R-Square C(p) F Value Pr > F
3. Metode Stepwise
Langkah 1:
Stepwise Selection: Step 1
Statistics for Entry
DF = 1,39
Model
Variable Tolerance R-Square F Value Pr > F
Parameter Standard
Variable Estimate Error Type II SS F Value Pr > F
Sama halnya dengan metode forward, kita pilih variabel yang memberikan R
2
terbesar atau 𝑓 terbesar. Maka kita pilih x 2 untuk dimasukkan dalam model.
Cek signifiikansi melalui nilai p-value. Karena nilai p-value lebih kecil dari
tingkat signifikansi (α =0.05) maka kita masukkan x 2 ke dalam model.
Sehingga diperoleh model untuk langkah 1: Y =107.09156+ 179.05416 x 2
Langkah 2:
Stepwise Selection: Step 2
Model
Variable Tolerance R-Square F Value Pr > F
All variables left in the model are significant at the 0.0500 level.
2
Pilih variabel yang memberikan kenaikan R terbesar apabila variabel tersebut
dimasukkan ke dalam model yang diperoleh pada langkah 1. Maka kita pilih
x 1 untuk dimasukkan dalam model. Karena nilai p-value lebih besar dari nilai
signifikansi yang kita inginkan (α=0.05) maka x 2 dimasukkan ke dalam model.
Maka diperoleh model akhir: Y =107.09156+ 179.05416 x 2
.
Partial Model
Variable Variable Number R- R-
Step Entered Removed Vars In Square Square C(p) F Value Pr > F
Uji Parsial didapat terdapat pengaruh antara nilai intercept dengan variabel
jumlah like, bahwa tidak terdapat pengaruh antara jumlah followers
dengan jumlah like, terdapat pengaruh antara total postingan dengan
jumlah like, dan tidak terdapat pengaruh antara jumlah following dengan
jumlah like.
Korelasi didapat jika jumlah followers bertambah maka jumlah like juga
akan bertambah dan sebaliknya, jika total postingan bertambah maka
jumlah like juga akan bertambah dan sebaliknya, jika jumlah following
bertambah maka jumlah like akan berkurang dan sebaliknya, jika total
postingan bertambah maka jumlah following akan berkurang dan
sebaliknya, jika jumlah followers bertambah maka jumlah following juga
akan bertambah dan sebaliknya, serta jika jumlah followers bertambah
maka total postingan juga akan bertambah dan sebaliknya.