LAPORAN PRAKTIKUM
Analisis Regresi Terapan
Modul 5 : Regresi Nonlinier
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2019
i
Daftar Isi
1 Pendahuluan .................................................................................................... 5
2 Deskripsi Kerja................................................................................................ 6
2.1 Studi Kasus ............................................................................................. 6
2.2 Langkah Kerja ......................................................................................... 6
3 Pembahasan ................................................................................................... 13
3.1 Kasus Pertama ........................................Error! Bookmark not defined.
3.1.1 Identifikasi..................................................................................... 14
3.1.2 Estimasi Parameter ........................................................................ 15
3.1.3 Validasi atau Pengujian Asumsi Klasik ........................................ 19
3.1.4 Interpretasi..................................................................................... 22
3.2 Kasus Kedua.......................................................................................... 23
3.2.1 Identifikasi..................................................................................... 24
4 Penutup.......................................................................................................... 27
4.1 Kesimpulan ........................................................................................... 27
4.2 Saran ...................................................................................................... 27
5 Daftar Pustaka ............................................................................................... 28
ii
Daftar Gambar
Gambar 2.1. Tampilan klik R pada desktop .......................................................... 7
Gambar 2.2. Tampilan awal program RStudio ...................................................... 7
Gambar 2.3. Sintaks input data kasus 1 dari clipboard ......................................... 7
Gambar 2.4. Sintaks statistic deskriptif kasus 1 .................................................... 8
Gambar 2.5. Sintaks membuat plot dan garis regresinya ...................................... 8
Gambar 2.6. Sintaks untuk analisis regresi linier sederhana ................................. 8
Gambar 2.7. Sintaks untuk analisis regresi kuadratik ........................................... 9
Gambar 2.8. Sintaks untuk analisis regresi polynomial berderjat tiga .................. 9
Gambar 2.9. Sintaks untuk analisis regresi polynomial berderjat tiga .................. 9
Gambar 2.10. Sintaks untuk melihat data residual ................................................ 9
Gambar 2.11. U Sintaks uji kenormalan residual ................................................ 10
Gambar 2.12. Sintaks uji kebebasan residual ...................................................... 10
Gambar 2.13. Sintaks uji kehomogenan variansi residual................................... 10
Gambar 2.14. Sintaks input data kasus 2 dari clipboard ..................................... 10
Gambar 2.15. Sintaks statistic deskriptif kasus 2 ................................................ 11
Gambar 2.16. Sintaks membuat plot dan garis regresinya .................................. 11
Gambar 2.17. Sintaks untuk analisis regresi linier sederhana ............................. 11
Gambar 2.18. Sintaks untuk analisis regresi kuadratik ....................................... 12
Gambar 2.19. Sintaks untuk analisis regresi polynomial berderjat tiga .............. 12
Gambar 3.1. Output importing data dari clipboard ............................................. 13
Gambar 3.2. Output plot data kasus 1 ................................................................. 14
Gambar 3.3. Ouput statistic deskriptif untuk kasus 1.......................................... 15
Gambar 3.4. Output analisis regresi .................................................................... 17
Gambar 3.5. Residual data kasus 1 ...................................................................... 19
Gambar 3.6. Output Kolmogorov Smirnov test .................................................. 20
Gambar 3.7. Output bptest................................................................................... 20
Gambar 3.8. Output dwtest .................................................................................. 21
Gambar 3.8. Output importing data kasus 2 ........................................................ 23
Gambar 3.8. Output statistics deskriptif kasus 2 ................................................. 24
Gambar 3.8. Plot dan garis regresinya ................................................................. 25
iii
Daftar Tabel
iv
1 Pendahuluan
Regresi non linier adalah suatu metode untuk mendapatkan model non linier
yang menyatakan veriabel dependen dan independen. Apabila hubungan fungsi
antara variabel bebas X dan variabel tidak bebas Y bersifat non linier, tansformasi
bentuk nonlinier ke bentuk linier. Untuk mendapatkan linieritas dari hubungan non
linier, dapat dilakukan transformasi pada variabel dependen atau variabel
independen atau keduanya.
Dalam kasus regresi non linier, yang banyak digunakan yaitu model regresi
eksponensial dan regresi geometri. Regresi non linier dimaksudkan sebagai satu
bentuk regresi yang melihat hubungan antara variabel predictor (X) dengan variabel
respon (Y), yang tidak bersifat linier. Kemudahan model regresi non linier tersebut
karena dapat ditransformasikan ke model regresi linier.
Penggunaan regresi non linier telah banyak dikaji sebelumnya diantaranya oleh
A.Donny Harhara (2003), yang mengkaji pengujian selang kepercayaan parameter
regresi non linier dengan OLS, dan kajian-kajian tersebut hanya penekanan pada
model regresi non linier untuk satu populasi saja. Sedangkan permasalahan-
permasalahan yang sama pada beberapa populasi juga sangat penting diteliti,
termasuk kesamaan parameternya. Seperti halnya yang telah dilakukan oleh Budi
Barmana (2008) yang menguji kesamaan parameter beberapa populasi dengan
regresi linier. (Yanti L, 2019).
5
2 Deskripsi Kerja
Pada bab sebelumnya telah dijelaskan tentang regresi nonlinier. Pada bagian
deskripsi kerja praktikan akan mempraktikkan langkah-langkah melakukan
analisis regresi nonlinier dari data dengan program R agar dapat menyelesaikan
persoalan pada studi kasus.
6
Gambar 2.1. Tampilan klik R pada desktop
2. Maka akan muncul tampilan awal program RStudio seperti pada Gambar
2.2.
8
kuadrat=lm(LungCap~Height +I(Height^2),data=lung) untuk melihat
ringkasan dari output kuadrat menggunakan perintah summary(kuadrat).
9
metode Kolmogorov Smirnov test karena jumlah sampel lebih dari 50
dengan sintaks Lillie.test(resid).
10
Gambar 2.15. Sintaks statistic deskriptif kasus 2
17. Lalu praktikan membuat plot untuk menduga model regresinya dengan
sintaks plot(kasus2$Permintaan_Minyak,kasus2$Jumlah_Pendapatan
)) serta garis regresinya dengan sintaks lines(smooth.spline
(kasus2$Permintaan_Minyak,predict(linier)),col="blue",lwd=2)
untuk model linier, lines(smooth.spline(kasus2$Permintaan_
Minyak+I(Permintaan_Minyak^2),predict(kuadrat)),col="red",lw
d=2) untuk model kuadratik, lines(smooth.spline(kasus2
$Permintaan_Minyak+I(Permintaan_Minyak^2)+I(Permintaan_Minya
k^3),predict(derajat3)),col="red",lwd=2)) untuk model
polynomial berderajak tiga.
11
Gambar 2.18. Sintaks untuk analisis regresi kuadratik
20. Begitu juga dengan analisis regresi nonlinier untuk model kubik atau
berderajat tiga pada variable harga minyak dan permintaan minyak
menggunakan sintaks kubik= lm(Jumlah_Pendapatan~Permintaan_
Minyak+I(Permintaan_Minyak^2)+I(Permintaan_Minyak^3),data=ka
sus2), untuk melihat ringkasan dari output reglin menggunakan perintah
summary(kubik).
12
3 Pembahasan
14
Gambar 3.3. Ouput statistic deskriptif untuk kasus 1
Pada output statistic deskriptif di atas dapat dilihat bahwa kapasitas paru-
paru yang terendah yaitu sebesar 0.507cc dan tinggi badan yang terendah sebesar
45.3 cm sedangkan kapasitas paru-paru yang tertinggi yaitu sebesar 14.675 cc
dan tinggi badan yang tertinggi sebesar 81.8 cm. Pada rentang jarak antara
terendah dan tertinggi kapasitas paru-paru sebesar 14.1680000 cc sedangkan
rentang jarak antara terendah dan tertinggi pada tinggi badan sebesar 36.50000
cm. Jumlahan semua data pada kapasitas paru-paru sebesar 5700.782cc dan
jumlahan semua data tinggi badan sebesar 47006.30 cm. Rata-rata kapasitas paru-
paru sebesar 7.8631476 cc sedangkan rata-rata tinggi badan sebesar 64.83628 cm.
Variansi atau sebaran data kapasitas paru-paru sebesar 7.0862879 sedangkan
variansi dari tinggi badan sebesar 51.87088.
3.1.2 Estimasi Parameter
Estimasi parameter adalah estimasi yang digunakan untuk menduga suatu
populasi dari sampel. Pada analisis regresi linier tahap estimasi parameter meliputi
Uji overall atau uji F dan uji parsial atau uji t. Pada pembahasan ini parktikan akan
melakukan uji F dari data pada kasus 1 yaitu sebagai berikut :
15
Tabel 3.1 Perbandingan Empat Metode Regresi
Parameter
𝟐
Metode 𝑹 Error P-value Signifikan
Linier 83.21% 1.092 2.2𝑒 −16 Semua
Kuadratik 83.28% 1.09 2.2𝑒 −16 Dua
Kubik (derajat 3) 83.29% 1,091 2.2𝑒 −16 Tidak ada
Derajat 4 83.29% 1.091 2.2𝑒 −16 Tidak ada
Dari table di atas dapat dilihat bahwa metode dengan koefisien determinasi
terbesar yaitu model regresi polynomial berderajat 4 namun semua parameternya
tidak signifikan, begitu juga dengan polinomial berderajat dua dan tiga tidak semua
parameternya signifikan.oleh karena itu praktikan memilih metode regresi linier
sederhana karena pada metode ini signifikan pada setiap parameternya dan
didukung oleh model plot yang terbentuk serta garis regresinya. Maka untuk
menyelesaikan permasalahan kasus 1 adalah dengan metode regresi linier
sederhana.
Uji Overall
Uji kelayakan model atau yang lebih populer disebut sebagai uji overall atau
uji F merupakan tahapan awal mengidentifikasi model regresi yang diestimasi layak
atau tidak. Layak disini maksudnya adalah model yang diestimasi layak digunakan
untuk menjelaskan pengaruh variabel-variabel bebas terhadap variabel terikat.
Nama uji ini disebut sebagai uji F, karena mengikuti mengikuti distribusi F yang
kriteria pengujiannya seperti One Way Anova. Tampilan hasil yang telah dicari
menggunakan R Studio sebagai berikut :
16
Gambar 3.4. Output analisis regresi
Pada Gambar 3.3 tersebut terdapat output dari analisis regresi linier untuk
permasalahan pada kasus 1. Untuk melihat ada tidaknya pengaruh (signifikan)
antara variable height (tinggi badan) terhadap variable lung capacity (kapasitas
paru-paru). Berikut ini hasil pengujian hipotesisnya :
(i) Hipotesis :
H0 : 𝛽𝑖 = 0 (i=0,1) (model regresi tidak layak digunakan)
H1 : 𝛽𝑖 ≠ 0 (i=0,1) (model regresi layak digunakan)
(i) 𝛼 = 0,05 (5%)
(ii) Daerah Kritis :
Tolak H0 jika p-value ≤ α
(iv) Statistik Uji :
Diperoleh p-value = 2.2𝑒 −16
(v) Keputusan :
Karena nilai p-value < α yaitu 2.9𝑒 −09 < 0.05, maka tolak H0
(vi) Kesimpulan :
Dengan menggunakan tingkat kepercayaan 95% data yang ada mendukung
untuk tolak hipotesis H0 yang artinya model regresi tidak layak untuk digunakan.
17
Karena model tersebut layak digunakan maka dapat dilanjutkan ke tahap
selanjutnya yakni uji parsial.
Uji Parsial
Langkah selanjutnya setelah melakukan uji overall adalah uji parsial atau
uji t. Uji parsial atau uji t digunakan untuk menguji bagaimana pengaruh masing-
masing variabel bebas secara sendiri-sendiri terhadap variabel terikatnya. Uji ini
dapat membandingkan t-hitung dengan t-tabel. Hasil uji t dapat dilihat pada tabel
coefficients pada kolom Pr(>|t|). Jika probabilitas nilai t atau signifikansi < 0,05,
maka dapat dikatakan bahwa terdapat pengaruh antara variabel bebas terhadap
variabel terikat secara parsial. Namun, jika probabilitas nilai t atau signifikansi >
0,05, maka dapat dikatakan bahwa tidak terdapat pengaruh yang signifikan antara
masing-masing variabel bebas terhadap variabel terikat. Tampilan hasil uji t dari
data pada kasus 1 menggunakan R Studio seperti pada Gambar 3.4.
Uji t (Uji parsial) digunakan untuk menguji parameter secara parsial,
dengan kata lain untuk mengetahui apakah variable height (tinggi badan)
berpengaruh secara signifikan terhadap variable lung capacity (kapasitas paru-
paru). Berikut ini hasil pengujian hipotesisnya :
(i) Hipotesis :
H0 : 𝛽𝑖 = 0 (i=0,1) (Koefisien regresi tidak signifikan dalam model)
H1 : 𝛽𝑖 ≠ 0 (i=0,1) (Koefisien regresi signifikan dalam model)
(ii) 𝛼 = 0,05 (5%)
(iii) Daerah Kritis :
Tolak H0 jika p-value ≤ α
(iv) Statistik Uji dan keputusan
No Koefisien P-value Tanda α Keputusan
1 β0 (intercept) 2𝑒 −12 < 0.05 Tolak H0
2 β1 2𝑒 −12 < 0.05 Tolak H0
(v) Kesimpulan
Dengan menggunakan tingkat kepercayaan 95% data yang ada menyatakan
bahwa intercept serta koefisien X1 signifikan terhadap model maka artinya variable
18
height (tinggi badan) secara masing-masing memberikan pengaruh terhadap
variable lung capacity (kapasitas paru-paru).
3.1.3 Validasi atau Pengujian Asumsi Klasik
Berdasarkan metode yang peneliti gunakan dalam hal ini regresi linear
sederhana, terdapat beberapa asumsi yang harus dipenuhi agar model yang
didapatkan bersifat BLUE (Best Linear Unbiased Estimator), asumsinya antara
lain:
Kenormalan Residual
Residual adalah selisih antara nilai duga (predicted value) dengan nilai
pengamatan sebenarnya apabila data yang digunakan adalah data sampel . Resisual
untuk data Kecelakaan di Indonesia tahun 1992-2017 yaitu sebegai berikut :
23
3.2.1 Identifikasi
24
Gambar 3.11. Plot dan garis regresinya
Dari gambar di atas dapat dilihat bahwa garis regresi dengan model
kuadratik dan derajat tiga lebih mendekati titik-titik data tersebut. Maka model yang
akan digunakan adalah regresi non linier.
Tabel 3.1 Perbandingan Tiga Model Regresi
Parameter
𝟐
Metode 𝑹 Error P-value Signifikan
Linier 92.8% 105.4 7.589𝑒 −06 Semua
Kuadratik 99.94% 9.859 3.936𝑒 −12 Semua
Kubik (derajat 3) 100% 3.662𝑒 −15 2.2𝑒 −16 Satu
Berdasarkan perbandingan tiga model regresi di atas, praktikan memilih model
kuadratik sebagai model terbaik, meskipun koefisien determinasi model
polynomial berderajat tiga lebih besar namun parameternya hanya satu yang
signifikan sedangkan pada model kuadratik semua model signifikan. Kemudian
praktikan tidak memilih linier karena sepert pada grafik, model linier masih belum
mendekati titik-titik sebaran data tersebut dan koefisien determinasi kuadratik lebih
25
tinggi daripada model linier. Dengan kata lain model kuadratik lebih memenuhi
persyaratan daripada dua model lainnya.
26
4 Penutup
4.1 Kesimpulan
1. Model untuk data pada kasus 1 yang cocok adalah model analisis regresi linier
sederhana.
2. Nilai konstan sebesar -13.996829 memeiliki arti, apabila variable height
(tinggi badan) bernilai 0 (konstan), maka variable lung capacity (kapasitas
paru-paru) akan bernilai -13.996829 cc.
3. Apabila variable height (tinggi badan) meningkat sebesar satu cm dan faktor
lain diasumsikan konstan, maka lung capacity (kapasitas paru-paru) akan
meningkat sebesar 0.337157 cc.
4. Model yang dipilih dan terbaik untuk kasus kedua yaitu model regresi nonlinier
kuadratik.
4.2 Saran
Praktikan harus teliti dalam menentukan variable mana yang akan menjadi
variable independen dan mana yang akan menjadi variable dependen.
27
5 Daftar Pustaka
Utari, Tri Dina. (2019). Analisis Regresi dengan R. Yogyakarta: Universitas Islam
Indonesia.
28