Disusun untuk Memenuhi Tugas Kelompok Mata Kuliah Metode Peramalan yang
diampu Oleh Bapak Nurcahya Yulian Ashar, S.Si, M.Sc.
Kelompok 2
1. Devita Aulia Putri Agmi (24010120120003)
2. Shinta Apriliani (24010120130063)
3. Rita Dwi Pangesti (24010120130067)
4. Pramishvary Aisyah Hanny (24010120140085)
5. Muhammad Fahri Almasah (24010120140147)
6. Tara Afri Melandari (24010120140157)
7. Ferdi Hasan (24010120140165)
ii
BAB I PENDAHULUAN
A. Latar Belakang
Analisis regresi adalah suatu analisis yang dilakukan terhadap dua
variabel yaitu variabel independen (prediktor) dan variabel dependen (respon)
untuk mengetahui apakah ada pengaruh variabel prediktor terhadap variabel
respon sehingga variabel respon dapat diduga berdasarkan variabel
prediktornya. Berdasarkan jumlah variabel independennya, analisis regresi
linier dibagi menjadi dua macam yaitu, analisis regresi linier sederhana dan
analisis regresi linier ganda. Pada analisis regresi linier sederhana, jumlah
variabel independen yang digunakan sebagai penduga variabel dependen adalah
satu. Sedangkan pada analisis regresi linier ganda, jumlah variabel independen
yang digunakan sebagai penduga variabel dependen adalah lebih dari satu.
Saat ini, analisis regresi yang lebih sering digunakan adalah analisis
regresi linier berganda. Dapat dilihat dari berbagai kejadian yang terjadi dalam
kehidupan sehari-hari yaitu suatu peristiwa dapat disebabkan oleh berbagai
faktor yang mempengaruhinya. Contohnya, tinggi bayi sekarang yang
dipengaruhi oleh usia bayi, panjang bayi waktu lahir, berat bayi waktu lahir,
dan ukuran dada bayi waktu lahir. Dengan menggunakan metode analisis
regresi linier berganda kita dapat mengetahui faktor apa yang paling
berpengaruh terhadap pertumbuhan bayi. Oleh karena itu di dalam makalah ini
yang kami beri judul “Analisis Regresi Linier Berganda (Studi Kasus: Data
Pertumbuhan Bayi di Kelurahan Namaelo RT 001, Kota Masohi)”, kami akan
membahas bagaimana penggunaan metode analisis regresi linier berganda
untuk mengetahui variabel apa yang paling berpengaruh terhadap pertumbuhan
bayi di Kelurahan Namaelo RT 001, Kota Masohi.
B. Rumusan Masalah
Berdasarkan latar belakang diatas maka dapat dirumuskan permasalahannya
sebagai berikut.
1. Apa definisi dari analisis regresi linier berganda?
2. Bagaimana penggunaan analisis regresi linier berganda pada data
pertumbuhan bayi di Kelurahan Namaelo RT 001, Kota Masohi?
C. Tujuan
Tujuan dari pembuatan makalah ini adalah sebagai berikut.
1. Untuk mengetahui definisi dari analisis regresi linier berganda.
2. Untuk mengetahui variabel apa yang paling berpengaruh terhadap
pertumbuhan bayi di Kelurahan Namaelo RT 001, Kota Masohi.
1
BAB II PEMBAHASAN
𝑌 = 𝑎 + 𝑏1 𝑋1 + 𝑏2 𝑋2 + ⋯ + 𝑏𝑛 𝑋𝑛
Yang mana:
𝑌 = variabel tak bebas (nilai variabel yang akan diprediksi)
𝑎 = konstanta
𝑏1 , 𝑏2 , ⋯ , 𝑏𝑛 = nilai koefisien regresi
𝑋1 , 𝑋2 , ⋯ , 𝑋𝑛 = variabel bebas
Bila terdapat 2 variabel bebas, yaitu 𝑋1 dan 𝑋2, maka bentuk persamaan
regresinya adalah:
𝑌 = 𝑎 + 𝑏1 𝑋1 + 𝑏2 𝑋2
2
3. Nilainya positif. Disini terjadi hubungan yang searah antara variabel tak
bebas Y dengan variabel bebas 𝑋1 dan 𝑋2.
[(∑ 𝑥2 2 × ∑ 𝑥1 𝑦) − (∑ 𝑥2 𝑦 × ∑ 𝑥1 𝑥2 )]
𝑏1 =
[(𝑥1 2 × ∑ 𝑥2 2 ) − (∑ 𝑥1 × ∑ 𝑥2 )2 ]
[(∑ 𝑥1 2 × ∑ 𝑥2 𝑦) − (∑ 𝑥2 𝑦 × ∑ 𝑥1 𝑥2 )]
𝑏2 =
[(𝑥1 2 × ∑ 𝑥2 2 ) − (∑ 𝑥1 × ∑ 𝑥2 )2 ]
Yang mana:
2 2 (∑ 𝑋1 )2
∑ 𝑥1 = ∑ 𝑋1 −
𝑛
(∑ 𝑋2 )2
∑ 𝑥2 2 = ∑ 𝑋2 2 −
𝑛
(∑ 𝑌)2
∑ 𝑦 2 = ∑ 𝑌2 −
𝑛
∑ 𝑋1 ∑ 𝑌
∑ 𝑥1 𝑦 = ∑ 𝑋1 𝑌 −
𝑛
∑ 𝑋2 ∑ 𝑌
∑ 𝑥2 𝑦 = ∑ 𝑋2 𝑌 −
𝑛
∑ 𝑋1 ∑ 𝑋2
∑ 𝑥1 𝑥2 = ∑ 𝑋1 𝑋2 −
𝑛
𝑎𝑛 + 𝑏1 ∑ 𝑋1 + 𝑏2 ∑ 𝑋2 = ∑ 𝑌
𝑎 ∑ 𝑋1 + 𝑏1 ∑ 𝑋1 2 + 𝑏2 ∑ 𝑋1 𝑋2 = ∑ 𝑋1 𝑌
3
𝑎 ∑ 𝑋2 + 𝑏1 ∑ 𝑋2 𝑋1 + 𝑏2 ∑ 𝑋2 2 = ∑ 𝑋2 𝑌
𝑑𝑒𝑡 𝑀1
𝑎=
𝑑𝑒𝑡 𝑀
𝑑𝑒𝑡 𝑀2
𝑏1 =
𝑑𝑒𝑡 𝑀
𝑑𝑒𝑡 𝑀3
𝑏3 =
𝑑𝑒𝑡 𝑀
ℎ1 𝑚12 𝑚13
𝑀1 = [ℎ2 𝑚22 𝑚23 ]
ℎ3 𝑚32 𝑚33
𝑚11 ℎ1 𝑚13
𝑀2 = [𝑚21 ℎ2 𝑚23 ]
𝑚31 ℎ3 𝑚33
𝑚11 𝑚12 ℎ1
𝑀3 = [𝑚21 𝑚22 ℎ2 ]
𝑚31 𝑚32 ℎ3
4
(𝑏1 ∑ 𝑥1 𝑦) + (𝑏2 ∑ 𝑥2 𝑦)
𝑟2 =
∑ 𝑦2
Korelasi Parsial
Korelasi parsial merupakan suatu korelasi yang menjelaskan korelasi
antara 1 variabel dengan 1 variabel dan variabel lainnya dianggap konstan.
Terdapat 3 macam bentuk korelasi parsial, yaitu :
1. Korelasi antara 𝑋1 dengan 𝑋2 yang mana Y dianggap konstan (𝑟12.𝑌 )
5
Yang mana:
𝑛 × ∑ 𝑋1 𝑌 − (∑ 𝑌 × ∑ 𝑋1 )
𝑟𝑌1 =
√[(𝑛 × ∑ 𝑌 2 ) − (∑ 𝑌 2 )] × [(𝑛 × ∑ 𝑋1 2 ) − (∑ 𝑋1 )2 ]
𝑛 × ∑ 𝑋2 𝑌 − (∑ 𝑌 × ∑ 𝑋2 )
𝑟𝑌2 =
√[(𝑛 × ∑ 𝑌 2 ) − (∑ 𝑌 2 )] × [(𝑛 × ∑ 𝑋2 2 ) − (∑ 𝑋2 )2 ]
𝑛 × ∑ 𝑋1 𝑋2 − (∑ 𝑋1 × ∑ 𝑋2 )
𝑟12 =
√[(𝑛 × ∑ 𝑋1 2 ) − (∑ 𝑋1 2 )] × [(𝑛 × ∑ 𝑋2 2 ) − (∑ 𝑋2 )2 ]
∑ 𝑌 2 − (𝑎 ∑ 𝑌) − (𝑏1 ∑ 𝑋1 𝑌) − (𝑏2 ∑ 𝑋2 𝑌)
𝑆𝑒 (𝑆𝑦𝑥 ) = √
𝑁−3
6
cocok dengan data mentah, dibandingkan dengan fungsi nonlinear yang
dilinearkan.
2. Kebebasan nilai sisa/autokorelasi (independence of residuals)
Autokorelasi adalah terjadinya korelasi antara satu variabel error
dengan variabel error yang lain. Autokorelasi seringkali terjadi pada data
time series dan dapat juga terjadi pada data cross section tetapi jarang
(Widarjono, 2007). Selanjutnya untuk mendeteksi adanya autokorelasi
dalam model regresi linier berganda dapat digunakan metode Durbin-
Watson.
Nilai Statistik Durbin-Watson Hasil
Menolak hipotesis nol; ada
0 < 𝑑 < 𝑑𝐿
autokorelasi positif
Daerah keragu-raguan; tidak ada
𝑑𝐿 ≤ 𝑑 ≤ 𝑑𝑈
keputusan
Menerima hipotesis nol; tidak ada
𝑑𝑈 ≤ 𝑑 ≤ 4 − 𝑑𝑈
autokorelasi positif/negatif
Daerah keragu-raguan; tidak ada
4 − 𝑑𝑈 ≤ 𝑑 ≤ 4 − 𝑑𝐿
keputusan
Menolak hipotesis nol; ada
4 − 𝑑𝐿 ≤ 𝑑 ≤ 4
autokorelasi positif
3. Homoskedastisitas (homoscedasticity)
Homoskedastisitas merupakan salah satu asumsi klasik pada analisis
regresi linear agar model bersifat BLUE (Best Linear Unbiased Estimator).
Homoskedastisitas adalah kondisi dimana terdapat varians yang sama dari
setiap sisaannya, atau 𝐸(𝜀𝑖2 ) = 𝜎 2 . Asumsi homoskedastisitas menyatakan
bahwa nilai – nilai varians sisaan tidak tergantung pada nilai – nilai variabel
bebas. Setiap varians sisaan akan tetap sama baik untuk variabel bebas
bernilai kecil maupun besar (Celik, 2017).
Heteroskedastisitas adalah keadaan dimana terdapat varians sisaan
berbeda dari suatu observasi ke observasi lainnya, atau nilai - nilai varians
sisaan tergantung pada nilai – nilai variabel bebas (X). Heteroskedastisitas
dalam suatu model regresi akan mengakibatkan estimasi Metode Kuadrat
Terkecil (MKT) tetap tidak bias dan konsisten, tetapi estimasi tersebut tidak
effisien baik bagi sampel besar maupun sampel kecil. Jika tetap
menggunakan estimasi MKT dalam kondisi heteroskedastisitas, maka
varians estimasi parameter koefisien regresi akan underestimate
(mengestimasi terlalu rendah) atau overestimate (mengestimasi terlalu
tinggi). Heteroskedastisitas juga menyebabkan hasil dari uji t dan uji F tidak
valid dan selang kepercayaan tidak dapat dibuat (Syukriyah, 2011).
4. Normalitas nilai sisa (normality of residuals)
7
Uji normalitas ialah untuk melihat apakah ada nilai residu normal
atau tidak. Model regresi yang baik ialah model yang memiliki residu dan
terdistribusi secara normal. Tes normalitas, tidak perlu dilakukan kepada
setiap variabel yang ada, akan tetapi untuk nilai-nilai residual saja. Tes
normalitas dapat dilakukan dengan tes normal P-Plot, tes histogram, tes Chi
-square, tes kurtosis, tes skewness, tes kolmogorov-Smirnov. Namun, tes
normalitas tidak memiliki metode terbaik atau model paling tepat.
Apabila ditemukan residu tidak normal akan tetapi dekat dengan
nilai kritis, maka metode lain pun dapat digunakan untuk memberikan
justifikasi normal. Apabila jauh dari nilai normal, maka dapat dilakukan
penggubahan data, menambahkan data observasi serta memangkas outlier.
Transformasi pun dapat dilakukan dalam bentuk akar kuadrat, logaritma
natural, invers dan lainnya bergantung pada normal kurva apakah ke arah
kanan, kiri atau tengah dan lainnya.
B. Studi Kasus
Sebuah penelitian dilakukan untuk mengkaji hubungan antara 4 variabel
yaitu usia bayi, tinggi bayi waktu lahir, berat bayi waktu lahir, dan ukuran dada
bayi waktu lahir terhadap tinggi bayi sekarang. Penelitian dilakukan pada
Posyandu Binaya. Posyandu Binaya merupakan salah satu Posyandu yang
bertugas untuk melihat perkembangan Bayi pada kota Masohi terkhusus pada
Kelurahan Namaelo RT 001. Data yang diperoleh adalah sebagai berikut
(Wasilaine et al., 2014).
No Y 𝑋1 𝑋2 𝑋3 𝑋4
1 62.0 216.0 51.0 2.7 19.0
2 50.0 104.0 50.0 3.1 16.0
3 61.0 106.0 51.0 2.4 21.0
4 60.0 147.0 52.0 2.0 26.0
5 60.0 71.0 52.0 2.3 23.0
6 63.0 144.0 49.0 2.2 22.0
7 58.0 73.0 50.0 2.3 22.0
8 63.0 235.0 50.0 2.1 24.0
9 55.0 23.0 51.0 3.2 16.0
10 56.0 92.0 50.0 2.9 17.0
11 56.0 53.0 51.0 3.0 17.0
12 67.0 85.0 52.0 2.6 20.0
13 59.0 100.0 48.0 2.4 20.0
14 55.0 80.0 48.0 3.0 16.0
15 55.0 80.0 48.0 3.0 16.0
16 64.0 133.0 51.0 2.4 21.0
8
17 60.0 140.0 52.0 2.6 20.0
18 62.0 141.0 51.0 2.3 22.0
19 68.0 233.0 50.0 2.3 22.0
20 60.0 167.0 48.0 2.3 21.0
Keterangan :
𝑌 = Tinggi bayi sekarang (cm)
𝑋1 = Usia Bayi (hari)
𝑋2 = Tinggi bayi waktu lahir (cm)
𝑋3 = Berat bayi waktu lahir (kg)
𝑋4 = Ukuran dada bayi waktu lahir (cm)
Dengan menggunakan data di atas, akan kita lakukan uji analisis regresi linier
berganda dengan langkah-langkah sebagai berikut.
1. Menentukan Tujuan untuk Uji Linier Berganda
Tujuan : Untuk mengetahui hubungan antara variabel bebas
yaitu usia bayi (𝑋1 ), tinggi bayi waktu lahir (𝑋2 ), berat
bayi waktu lahir (𝑋3 ), dan ukuran dada bayi waktu
lahir (𝑋4 ) dengan variabel terikat yaitu tinggi bayi
sekarang (Y)
9
(2) Kemudian, klik Graphs, centang Regular pada Residuals for Plots dan
pada Residual Plots centang Histogram of residuals, Normal plot of
residuals, dan Residual versus fits, klik OK.
10
(4) Berikutnya, klik Storage, centang Residuals, Coefficients, dan Fits,
klik OK.
(5) Klik OK untuk melihat output. Dan outputnya adalah sebagai berikut.
11
Interpretasi:
12
Autokorelasi : Pada output Durbin-Watson statistics, terlihat bahwa
nilainya sebesar 2.01346. Diketahui pula, n = 20 dan
p = 4. Dengan tabel Durbin-Watson, maka diperoleh
nilai dL = 0.90 dan dU = 1.83. Sehingga, d > dU
gagal tolak H0. Dapat disimpulkan bahwa tidak
terdapat autokorelasi.
Persamaan Regresi:
13
T-Test Result
Interpretasi:
(1) Besarnya selisih pada Y dan 𝑋1 adalah sebesar -61,5. Hasil nilai t hitung
sebesar -4,71 pada degree of freedom (df) 38 dengan p value sebesar
0.000 di mana lebih kecil daripada 0.05 sehingga dapat disimpulkan
14
bahwa menerima 𝐻1 atau berarti terdapat perbedaan mean yang
signifkan antara Y dan 𝑋1.
(2) Besarnya selisih pada Y dan 𝑋2 adalah sebesar 9,45. Hasil nilai t hitung
sebesar 9,17 pada degree of freedom (df) 38 dengan p value sebesar
0.000 di mana lebih kecil daripada 0.05 sehingga dapat disimpulkan
bahwa menerima 𝐻1 atau berarti terdapat perbedaan mean yang
signifkan antara Y dan 𝑋2.
(3) Besarnya selisih pada Y dan 𝑋3 adalah sebesar 57,145. Hasil nilai t
hitung sebesar 58,01 pada degree of freedom (df) 38 dengan p value
sebesar 0.000 di mana lebih kecil daripada 0.05 sehingga dapat
disimpulkan bahwa menerima 𝐻1 atau berarti terdapat perbedaan mean
yang signifkan antara Y dan 𝑋3.
(4) Besarnya selisih pada Y dan 𝑋4 adalah sebesar 39,65. Hasil nilai t hitung
sebesar 33,60 pada degree of freedom (df) 38 dengan p value sebesar
0.000 di mana lebih kecil daripada 0.05 sehingga dapat disimpulkan
bahwa menerima 𝐻1 atau berarti terdapat perbedaan mean yang
signifkan antara Y dan 𝑋4.
15
Residuals Versus Fits
Residual Histogram
16
Normplot of Residual
Interpretasi : Uji F
Terlihat bahwa nilai F sebesar 8,22 dan nilai P = 0.001 maka nilai P < 0.05.
Sehingga diperoleh keputusan bahwa 𝐻0 ditolak dan 𝐻1 diterima. Dapat
disimpulkan bahwa variabel bebas 𝑋1 , 𝑋2 , 𝑋3 , 𝑋4 memiliki pengaruh yang
signifikan terhadap variabel terikat Y.
17
(2) Klik Analyze→Regression→Linear
(3) Masukan variabel terikat (Y) kedalam Dependent dan masukan variabel
bebas (X) kedalan Independents
18
(4) Klik Statistics → centang Rsquared change → continue
(5) Klik Ok
Dapat dilihat bahwa nilai Sig. F Change adalah 0,001 sehingga nilai
sig. F Change 0,001<0,005 maka dapat disimpulkan antara variabel usia
bayi (𝑋1 ), tinggi bayi waktu lahir (𝑋2 ), berat bayi waktu lahir (𝑋3 ), dan
ukuran dada bayi waktu lahir (𝑋4 ) secara bersama-sama atau simultan
berhubungan dengan veriabel tinggi bayi sekarang (Y).
19
Koefisien Korelasi
Nilai R yang menunjukan nilai koefisien korelasinya adalah 0,829
hal ini menunjukan bahwa antara variabel terikat dan variabel bebas
memiliki hubungan yang kuat karena nilainya cukup tinggi antara 0-1. Serta
berkolerasi positif yang berarti jika variabel terikat (Y) membesar maka
variabel bebas (X) juga membesar begitu juga sebaliknya
Koefisien Determinan
Nilai R Square yang menunjukan nilai koefisien determinasinya
adalah 0,687 atau 68,7% hal ini berarti variabel usia bayi (𝑋1 ), tinggi bayi
waktu lahir (𝑋2 ), berat bayi waktu lahir (𝑋3 ), dan ukuran dada bayi waktu
lahir (𝑋4 ) secara bersama-sama berpengaruh terhadap variabel tinggi bayi
sekarang (Y) sebesar 68,7%. Sedangkan sisanya adalah 31,3% dipengaruhi
oleh variabel lain diluar yang tidak terdapat pada data.
(2) Masukan semua variabel kedalam variables, lalu centang Person dan
Two-tailed, kemudian klik OK
20
(3) Diperoleh hasil sebagai berikut
Sehingga diperloleh:
21
berkorelasi positif yang berarti jika variabel Y membesar maka
variabel 𝑋2 juga membesar begitu juga sebaliknya.
22
6. Penggunaan Uji F Dan Uji T dalam Menentukan Variabel-Variabel
yang Signifikan
a. Uji F
Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Regression 4 251,464 62,8661 8,22 0,001
X1 1 26,182 26,1825 3,42 0,084
X2 1 55,335 55,3348 7,23 0,017
X3 1 51,016 51,0158 6,67 0,021
X4 1 35,330 35,3297 4,62 0,048
Error 15 114,736 7,6491
Lack-of-Fit 14 114,736 8,1954 * *
Pure Error 1 0,000 0,0000
Total 19 366,200
Hipotesis
𝐻0 : tidak terdapat pengaruh yang signifikan antara variabel usia
bayi (𝑋1), tinggi bayi waktu lahir (𝑋2), berat bayi waktu lahir
(𝑋3), dan ukuran dada bayi waktu lahir (𝑋4) terhadap tinggi
bayi sekarang (𝑌)
𝐻1 : terdapat pengaruh yang signifikan antara variabel signifikan
antara variabel usia bayi (𝑋1), tinggi bayi waktu lahir (𝑋2),
berat bayi waktu lahir (𝑋3), dan ukuran dada bayi waktu lahir
(𝑋4) terhadap tinggi bayi sekarang (𝑌)
Taraf Signifikansi (𝛼)
𝛼 = 0,05
Statistik Uji
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = 8,22
Nilai Kritis
𝐹(0.05,4,15) = 3,0556
Kriteria Penolakan
Tolak 𝐻0 jika 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 atau 𝑃ℎ𝑖𝑡𝑢𝑛𝑔 < 𝛼.
Kesimpulan
Karena 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = 8,22 > 𝐹(0.05,4,15) = 3,0556 dan P-value =
0,001 < 0,05, maka 𝐻0 ditolak. Jadi, dapat disimpulkan bahwa
terdapat pengaruh yang signifikan antara variabel usia bayi (𝑋1),
tinggi bayi waktu lahir (𝑋2), berat bayi waktu lahir (𝑋3), dan ukuran
dada bayi waktu lahir (𝑋4) terhadap tinggi bayi sekarang (𝑌).
23
b. Uji t
(1) Untuk variabel Usia Bayi (𝑋1)
Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 54,25 1,91 28,40 0,000
X1 0,0450 0,0143 3,15 0,006 1,00
Hipotesis
𝐻0 : tidak terdapat pengaruh yang signifikan antara variabel
usia bayi (𝑋1 ) terhadap tinggi bayi sekarang (𝑌)
𝐻1 : terdapat pengaruh yang signifikan antara variabel usia bayi
(𝑋1) terhadap tinggi bayi sekarang (𝑌)
Taraf signifikansi (𝛼)
𝛼 = 0,05
Statistik uji
𝑇ℎ𝑖𝑡𝑢𝑛𝑔 = 3,15
Nilai kritis
𝑇(0.05,15) = 2,1314
Kriteria Penolakan
Tolak 𝐻0 jika 𝑇ℎ𝑖𝑡𝑢𝑛𝑔 > 𝑇𝑡𝑎𝑏𝑒𝑙 atau 𝑃ℎ𝑖𝑡𝑢𝑛𝑔 < 𝛼.
Kesimpulan
Karena 𝑇ℎ𝑖𝑡𝑢𝑛𝑔 = 3,15 > 𝑇(0.05,15) = 2,1314 dan P-value =
0,006 < 0,05, maka 𝐻0 ditolak. Jadi, dapat disimpulkan bahwa
terdapat pengaruh yang signifikan antara variabel usia bayi (𝑋1)
terhadap tinggi bayi sekarang (𝑌).
Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 13,8 35,3 0,39 0,701
𝑋2 0,914 0,702 1,30 0,209 1,00
Hipotesis
𝐻0 : tidak terdapat pengaruh yang signifikan antara variabel
tinggi bayi waktu lahir (𝑋2) terhadap tinggi bayi sekarang
(𝑌)
𝐻1 : terdapat pengaruh yang signifikan antara variabel tinggi
bayi waktu lahir (𝑋2) terhadap tinggi bayi sekarang (𝑌)
Taraf Signifikansi (𝛼)
𝛼 = 0,05
24
Statistik Uji
𝑇ℎ𝑖𝑡𝑢𝑛𝑔 = 1,30
Nilai Kritis
𝑇(0.05,15) = 2,1314
Kriteria Penolakan
Tolak 𝐻0 jika 𝑇ℎ𝑖𝑡𝑢𝑛𝑔 > 𝑇𝑡𝑎𝑏𝑒𝑙 atau 𝑃ℎ𝑖𝑡𝑢𝑛𝑔 < 𝛼.
Kesimpulan
Karena 𝑇ℎ𝑖𝑡𝑢𝑛𝑔 = 1,30 < 𝑇(0.05,15) = 2,1314 dan P-value =
0,209 > 0,05, maka 𝐻0 diterima. Jadi, dapat disimpulkan bahwa
tidak terdapat pengaruh yang signifikan antara variabel tinggi
bayi waktu lahir (𝑋2 ) terhadap tinggi bayi sekarang (𝑌).
Hipotesis
𝐻0 : tidak terdapat pengaruh yang signifikan antara variabel
berat bayi waktu lahir (𝑋3) terhadap tinggi bayi sekarang
(𝑌)
𝐻1 : terdapat pengaruh yang signifikan antara variabel berat
bayi waktu lahir (𝑋3) terhadap tinggi bayi sekarang (𝑌)
Taraf Signifikansi (𝛼)
𝛼 = 0,05
Statistik Uji
|𝑇ℎ𝑖𝑡𝑢𝑛𝑔 | = 4,02
Nilai Kritis
𝑇(0.05,15) = 2,1314
Kriteria Penolakan
Tolak 𝐻0 jika 𝑇ℎ𝑖𝑡𝑢𝑛𝑔 > 𝑇𝑡𝑎𝑏𝑒𝑙 atau 𝑃ℎ𝑖𝑡𝑢𝑛𝑔 < 𝛼.
Kesimpulan
Karena |𝑇ℎ𝑖𝑡𝑢𝑛𝑔 | = 4,02 > 𝑇(0.05,15) = 2,1314, dan P-value
= 0,001 < 0,05 maka 𝐻0 ditolak. Jadi, dapat disimpulkan bahwa
terdapat pengaruh yang signifikan antara variabel berat bayi
waktu lahir (𝑋3) terhadap tinggi bayi sekarang (𝑌).
25
(4) Untuk variabel Ukuran Dada Bayi Waktu Lahir (𝑋4)
Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 39,85 5,37 7,42 0,000
X4 0,990 0,265 3,73 0,002 1,00
Hipotesis
𝐻0 : tidak terdapat pengaruh yang signifikan antara ukuran dada
bayi waktu lahir (𝑋4) terhadap tinggi bayi sekarang (𝑌)
𝐻1 : terdapat pengaruh yang signifikan antara variabel ukuran
dada bayi waktu lahir (𝑋4) terhadap tinggi bayi sekarang
(𝑌)
Taraf Signifikansi (𝛼)
𝛼 = 0,05
Statistik Uji
𝑇ℎ𝑖𝑡𝑢𝑛𝑔 = 3,73
Nilai Kritis
𝑇(0.05,15) = 2,1314
Kriteria Penolakan
Tolak 𝐻0 jika 𝑇ℎ𝑖𝑡𝑢𝑛𝑔 > 𝑇𝑡𝑎𝑏𝑒𝑙 atau 𝑃ℎ𝑖𝑡𝑢𝑛𝑔 < 𝛼.
Kesimpulan
Karena 𝑇ℎ𝑖𝑡𝑢𝑛𝑔 = 3,73 > 𝑇(0.05,15) = 2,1314, dan P-value =
0,002 < 0,05 maka 𝐻0 ditolak. Jadi, dapat disimpulkan bahwa
terdapat pengaruh yang signifikan antara variabel ukuran dada
bayi waktu lahir (𝑋4 ) terhadap tinggi bayi sekarang (𝑌).
26
Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 97,1 38,9 2,50 0,025
X1 0,0248 0,0134 1,85 0,084 1,51
X2 2,060 0,766 2,69 0,017 2,89
X3 -30,6 11,9 -2,58 0,021 45,83
X4 -3,27 1,52 -2,15 0,048 49,39
Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 113,8 40,6 2,81 0,013
X2 1,987 0,821 2,42 0,028 2,89
X3 -33,8 12,6 -2,68 0,016 44,91
X4 -3,38 1,63 -2,07 0,055 49,32
Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 48,9 28,0 1,74 0,099
X2 0,623 0,533 1,17 0,259 1,02
X3 -8,00 2,08 -3,85 0,001 1,02
27
Berdasarkan data di atas variabel 𝑋2 memiliki nilai P-value > 0,05
terbesar, maka variabel 𝑋2 harus dikeluarkan dari model.
(7) Meregresikan Y dengan 𝑋3 (tanpa 𝑋1 , 𝑋2, dan 𝑋4 )
Regression Analysis: Y versus X3
Regression Equation
Y = 81,02 - 8,34 X3
Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 81,02 5,35 15,14 0,000
X3 -8,34 2,07 -4,02 0,001 1,00
Model Summary
S R-sq R-sq(adj) R-sq(pred)
3,27376 47,32% 44,39% 35,90%
Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Regression 1 173,28 173,28 16,17 0,001
X3 1 173,28 173,28 16,17 0,001
Error 18 192,92 10,72
Lack-of-Fit 9 95,88 10,65 0,99 0,507
Pure Error 9 97,03 10,78
Total 19 366,20
Karena nilai P-value < 0,05, maka proses berhenti. Dengan Regresi
Stepwise Mundur diperoleh model regresinya yaitu 𝑌 = 81,02 −
8,34𝑋3 dengan koefisien determinasi yang didapatkan sebesar 47,32%,
berarti kemampuan variabel 𝑋3 dalam menjelaskan variansi dari
variabel Y sebesar 47,32%.
b. Pencarian model regresi terbaik dengan regresi stepwise maju (stepwise
forward regression)
Berikut adalah langkah-langkahnya:
Meregresikan variabel Y dengan setiap variabel 𝑋1 , 𝑋2 , 𝑋3, dan 𝑋4
lalu pilih variabel yang menghasilkan model dengan koefisien
determinasi tertinggi.
Y dengan 𝑋1
S R-sq R-sq(adj) R-sq(pred)
3,62023 35,58% 32,00% 23,71%
28
Y dengan 𝑋2
S R-sq R-sq(adj) R-sq(pred)
4,31194 8,61% 3,53% 0,00%
Y dengan 𝑋3
Y dengan 𝑋4
S R-sq R-sq(adj) R-sq(pred)
3,38734 43,60% 40,47% 27,23%
Y dan 𝑋3 dengan 𝑋2
S R-sq R-sq(adj) R-sq(pred)
3,24109 51,23% 45,50% 34,21%
Y dan 𝑋3 dengan 𝑋4
S R-sq R-sq(adj) R-sq(pred)
3,36548 47,42% 41,23% 26,21%
29
Berdasarkan data di atas model yang dibentuk variabel Y dan
𝑋3 ditambah dengan 𝑋1 menghasilkan model dengan koefisien
determinasi tertinggi yaitu sebesar 48,09 %, tetapi nilai P-value dari
𝑋1 adalah 0,149 > 0,05. Sehingga variabel 𝑋1 tidak dapat
dimasukkan ke dalam model dan proses berhenti. Jadi, pemilihan
model terbaik dengan metode ini hanya melibatkan satu variabel
prediktor yaitu 𝑋3.
Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 81,02 5,35 15,14 0,000
X3 -8,34 2,07 -4,02 0,001 1,00
Model Summary
S R-sq R-sq(adj) R-sq(pred)
3,27376 47,32% 44,39% 35,90%
Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Regression 1 173,28 173,28 16,17 0,001
X3 1 173,28 173,28 16,17 0,001
Error 18 192,92 10,72
Lack-of-Fit 9 95,88 10,65 0,99 0,507
Pure Error 9 97,03 10,78
Total 19 366,20
30
BAB III PENUTUP
31
DAFTAR PUSTAKA
Celik, R. (2017). A New Test To Detect Monotonic and Non Monotonic Types For
Heteroscedasticity. Journal of Applied Statistics, 44(2), 1-20.
Kutner, M. H., Nachtsheim, C. J., & Neter, J. (2004). Applied Linear Regression
Models (4th ed.). McGraw-Hill Companies, Inc.
Sunyoto, Danang. (2007). Analisis Regresi dan Korelasi Bivariat. Amara Books.
Yogyakarta.
Wasilaine, T. L., Talakua, M. W., & Lesnussa, Y. A. (2014). Model Regresi Ridge
untuk Mengatasi Model Regresi Linier Berganda yang Mengandung
Multikolinieritas (Studi Kasus: Data Pertumbuhan Bayi di Kelurahan
Namaelo RT 001, Kota Masohi). Jurnal Barekeng, 8(1), 31–37.
32