Anda di halaman 1dari 10

TUGAS ANALISIS BEST MODEL LINEAR REGESSION BESERTA UJI ASUMSI DAN

PENANGANNYA

Dosen Pengampu: Ir. Ekaria M.Si.

Disusun Oleh

Kelompok 2 :

1. Mira Octavia (212112189)

2. Muhammad Ilzam Falahuddin (212112216)

3. Riski Tommi Mardoni (212112327)

4. Vilanata Tesalonika Lana (212112412)

5. Wimbi Uelsan Gurusinga (212112416)

PROGRAM STUDI DIPLOMA IV STATISTIKA

POLITEKNIK STATISTIKA STIS, JAKARTA

2022/2023
A. BEST MODEL LINEAR REGRESSION

METODE

Pada penentuan model terbaik ini digunakan all possible regression. Dalam prosedur
pengujiannya terdapat beberapa kriteria untuk memilih model trebaik.

1. Kriteria R p2 atau 𝑆𝑆𝐸𝑝

Kriteria ini menggunakan nilai koefisien determinasi berganda untuk


mengidentifikasi beberapa kelompok variabel prediktor yang BAIK, dengan nilai R2
yang besar. Penggunaan Koefisien Determinasi Berganda ekuivalen dengan 𝑆𝑆𝐸𝑝,
dimana sekelompok variabel prediktor yang BAIK, dengan nilai 𝑆𝑆𝐸𝑝 yang kecil.

2 SSEp
R p =1−
SST

Dimana: nilai SST adalah tetap, berapapun banyaknya Variabel Prediktor. Model
yang BAIK adalah model yang memiliki 𝑅𝑝 2 tinggi dengan jumlah variable bebas
minimal.

2. Kriteria Radj , p2 atau 𝑀𝑆𝐸𝑝

Penggunaan kriteria R p2 tidak melibatkan/mempertimbangkan jumlah parameter


dalam modelnya. Kriteria Radj , p2 mempertimbangkan jumlah parameter dalam model
melalui derajat bebas:

Kriteria Radj , p2 mencari sekelompok kecil variabel dimana nilai 𝑅𝑎𝑑𝑗, 𝑝 2 pada
posisi maksimum atau mendekati titik maksimum ketika penambahan variabel tidak
terlalu berguna.

3. Kriteria Mallows’ 𝐶𝑝
Kriteria 𝐶𝑝, mencari model dengan: nilai 𝐶𝑝 yang kecil (nilai Total Mean Square juga
kecil), dan nilai 𝐶𝑝 ≈ 𝑝 (mendekati nilai p, biasnya kecil). Jika semua variabel
dimasukkan dlm model, nilai 𝐶𝑝 = 𝑝.

4. Akaike’s Information Criterion (AICp) dan Schwarz’ Bayesian Criterion (SBCp)

𝐴𝐼𝐶𝑝 = 𝑛 ln 𝑆𝑆𝐸𝑝 − 𝑛 ln 𝑛 + 2𝑝

𝑆𝐵𝐶𝑝 = 𝑛 ln 𝑆𝑆𝐸𝑝 − 𝑛 ln 𝑛 + [ln 𝑛]𝑝

Bagian pertama: 𝑛 ln 𝑆𝑆𝐸𝑝 menurun akan menurun seiring dengan bertambahnya p


(𝑆𝑆𝐸𝑝 menurun seiring bertambahnya variabel); Bagian kedua: 𝑛 ln 𝑛 tetap; Bagian
ketiga: 2𝑝 atau [ln 𝑛]𝑝 meningkat akan meningkat seiring bertambahnya p (𝑆𝐵𝐶𝑝
lebih ketat/kikir). Kita mencari model dengan nilai 𝐴𝐼𝐶𝑝 atau 𝑆𝐵𝐶𝑝 yang KECIL.

Data dan Struktur Data

HASIL DAN PEMBAHASAN

Dengan menggunakan bantuan software R, didapatkan hasil pengolahan data


menggunakan metode all possible regression sebagai berikut.

Cp
R- Adj R-
Model p df SSE MSE AIC SBC Mallo
Square Square
w
x1 x3 x4 39,0 1,30 124,47
5 30 0,657 0,612 115,14 5,599
x5 3 1 2
x1 x3 x4 6 29 36,7 0,677 1,26 0,622 115,03 125,92 5,814
x5 d2 5 7 6 3
x1 x2 x3 1,24 115,22 127,66
7 28 34,9 0,693 0,628 6,362
x4 x5 d2 6 6 9

Hasil output di atas merupakan hasil penyaringan dengan mencari nilai maximal dari adj
R-Square dan minimal dari MSE, AIC, SBC dan Cp Mallow. Sehingga didapatkan ketiga
kemungkinan model yang mendekati kriteria model terbaik. Setelah dibandingkan
ketiganya dapat diambil bahwa model dengan variabel bebas X1, X3, X4, X5 merupakan
model yang paling mendekati kriteria model terbaik.

Sehingga didapatkan persamaan model terbaik regresi linear sebagai berikut

Y =65,605−0,102 X 1−0,253 X 3−0,018 X 4 +0,074 X 5

Selanjutnya dilakukan uji parsial dan uji simultan untuk menentukan pengaruh variabel
bebas terhadap variabel tidak bebasnya.

Uji Simultan

Hipotesis

Hipotesis

H 0 : β i=0

H 1 : βi ≠ 0

Dengan menggunakan bantuan software SPSS didapatkan output sebagai berikut:


Berdasarkan uji simultan didapatkan p-value sebesar 0,000 yang lebih kecil daripada
tingkat signifikansi 5%. Sehingga dapat disimpulkan bahwa secara simultan variabel
independent berpengaruh signifikan terhadap variabel dependennya.

Uji Parsial

Hipotesis

H 0 : β i=0

H 1 : βi ≠ 0

Dengan menggunakan bantuan software SPSS didapatkan output sebagai berikut:

Berdasarkan uji parsial tiap variabel independent didapatkan nilai p-value seluruh
variabel independent < 0,05. Sehingga dapat diambil kesimpulan bahwa cukup bukti
untuk menyatakan bahwa seluruh variabel independent dalam model berpengaruh
signifikan terhadap variabel dependennya.

Uji Asumsi

a. Uji Normalitas

Hipotesis
H0 : ℇ~𝑁(0, 𝜎 2 ) (error berdistribusi normal)

H1 : ℇ ≁ 𝑁(0, 𝜎 2 ) error tidak berdistribusi normal

Wilayah kritis

Tolak Ho ketika p-value < 0.05

Statistik Uji

Histogram

Normal Q-Q Plot


Dengan menggunakan uji Kolmogorov-Smirnov maupun uji Shapiro-Wilk
didapatkan p-vaue > 0,05. Artinya, pengujian menghasilkan keputusan Gagal Tolak
H0 sehingga terdapat cukup bukti untuk mengatakan bahwa error berdistribusi
normal. Dari distribusi data pada histogram dapat dilihat bahwa residual telah
berdistribusi simetris. Selain itu, dari analisis Q-Q plot, dapat dilihat bahwa titik-titik
menyebar mengikuti garis.

b. Uji Homoskedastis

Hipotesis

𝐻0: 𝜎 2 = 𝜎 2 (varians error konstan normal)

𝐻1: ∃ 𝜎 2 ≠ 𝜎 2 (terdapat minimal 𝜎 2 ≠ 𝜎 2 untuk i = 1, 2, …, n)

Wilayah kritis

Tolak H0 ketika p-value < 0.05

Statistik Uji Park


Dari output di atas dapat dilihat bahwa nilai koefisien regesi untuk lnX1, lnX3, lnX4,
dan lnX5 tidak signifikan. Sehingga dapat dapat disimpulkan Gagal Tolak H0.
Dengan demikian, cukup bukti untuk menunjukkan bahwa tidak terjadi
heteroskedastisitas pada model.

Scatter Plot

Dari plot tersebut dapat dilihat bahwa residual menyebar acak dan tidak membentuk
suatu pola.

c. Uji Multikolinearitas

Identifikasi nilai VIF

Didapatkan hasil bahwa nilai VIF untuk seluruh variabel bebas < 10. Sehingga dapat
disimpulakn bahwa cukup bukti untuk menunjukkan tidak adanya multikolinearitas
antar variable independent pada model.

d. Uji Autokorelasi

Hipotesis

H 0 : ρ=0(non−autokorelasi)
H 1 : ρ≠ 0 (autokorelasi)

Wilayah Kritis

Tolak H0 ketika p-value < 0.05

Statistik Uji Durbin Watson

Didapatkan nilai Durbin-Watson sebesar 1,283. Dengan menggunakan R didapatkan


hasil sebagai berikut.

Nilai p-value < 0,05 sehingga diambil keputusan tolak Ho. Dengan demikian, dapat
diambil kesimpulan terjadi autokorelasi pada model dan akan dilakukan Upaya
perbaikan pada model.

Perbaikan Autokorelasi

Statistik Uji
Dari olah SPSS didapatkan nilai Durbin-Watson sebesar 2,287 dan dengan olah data
di R didapatkan sebagai berikut.

P-value menunjukkan nilai yang lebih besar daripada tingkat signifikansi 5%.
Sehingga dapat diambil keputusan gagal tolak H0. Hal ini mengartikan bahwa cukup
bukti untuk menyatakan bahwa pelanggaran autokorelasi pada model sudah dapat
diatasi.

Anda mungkin juga menyukai