Tugas Kelompok Ku Ekonometrika
Tugas Kelompok Ku Ekonometrika
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
2023
DAFTAR ISI
Halaman
LAMPIRAN
iv
DAFTAR TABEL
Tabel Halaman
1. Tabel Klasifikasi………………………………….........................................11
iv
v
DAFTAR GAMBAR
Gambar Halaman
v
I. TINJAUAN PUSTAKA
Analisis regresi linier adalah teknik statistika yang dapat digunakan untuk
menjelaskan pengaruh variabel bebas (independent variable) terhadap variabel tak
bebas (dependent variable). Jika hanya menggunakan satu variabel bebas dalam
model, maka teknik ini disebut sebagai regresi linear sederhana. Model regresi
linear sedehana:
( )
dengan,
= variabel tak bebas
= variabel bebas
dan = parameter regresi
= galat
Sedangkan, jika menggunakan lebih dari satu variabel bebas maka teknik ini
disebut sebagai regresi linear berganda. Model regresi linear berganda dengan
variabel bebas dapat dirumuskan sebagai berikut:
( )
2
dengan,
= variabel tak bebas
= variabel bebas
= parameter regresi
= galat pengamatan ke-i
= 1,2,3,…,
Uji normalitas digunakan untuk menguji apakah model regresi dalam penelitian
ini memiliki residual yang berdistribusi normal atau tidak. Indikator model regresi
yang baik adalah memiliki data berdistribusi normal yang dapat diuji dengan
menggunakan uji Kolmogorov-Smirnov. Distribusi data dapat dikatakan normal
apabila nilai signifikansi lebih dari 0,05 (Ghozali, 2018).
a. Jika ada pola tertentu, seperti titik-titik yang ada membentuk pola tertentu
yang teratur (bergelombang, melebar kemudian menyempit) maka
mengindikasikan telah terjadi heteroskedastisitas.
b. Jika tidak ada pola yang jelas, serta titik-titik menyebar di atas dan dibawah
angka 0 pada sumbu Y, maka tidak terjadi heteroskedastisitas (Ghozali,
2018).
Uji autokorelasi adalah hubungan antara residual satu observasi dengan residual
observasi lainnya (Winarno, 2015).
4
Menurut Ghozali (2018), uji autokorelasi bertujuan untuk menguji apakah dalam
model regresi liner ada korelasi antara kesalahan pengganggu pada periode t
dengan kesalahan pengganggu pada periode t-1 (sebelumnya). Diharapkan bahwa
tidak terjadi autokorelasi yang dapat diuji dengan menggunakan uji Durbin-
Watson dengan kriteria sebagai berikut:
a. 0 < d < dl, berarti tidak ada autokorelasi positif dan keputusannya ditolak.
b. dl ≤ d ≤ du, berarti tidak ada autokorelasi positif dan keputusannya no
desicison.
c. (4 – dl) < d < 4, berarti tidak ada autokorelasi negatif dan keputusannya
ditolak.
d. (4 – du) ≤ d ≤ (4 – dl), berarti tidak ada autokorelasi negatif dan
keputusannya no desicison.
e. du < d < (4 – du), berarti tidak ada autokorelasi positif atau negatif dan
keputusannya tidak ditolak.
Analisis regresi logistik adalah analisis yang digunakan untuk melihat hubungan
fungsional antara variabel respon yang bersifat kategori (dikotomus dan
polikotomus) dan variabel-variabel penjelas berupa data kualitatif (nominal atau
ordinal) maupun kuantitatif (interval atau rasio).
Menurut Hosmer, dkk. (2013), analisis regresi logistik ordinal merupakan metode
statistik yang digunakan untuk menganalisis hubungan antara variabel tak bebas
(dinotasikan dengan Y) dan variabel bebas (dinotasikan dengan X), dimana
variabel tak bebasnya bersifat polikotomus dengan skala ordinal. Menurut Agresti
(2007), model regresi logistik adalah sebagai berikut:
( )
( ) ( )
( )
5
Perlu diketahui bahwa fungsi ( ) buanlah fungsi yang linear, maka dari itu perlu
dilakukan transformasi agar menjadi fungsi yang linear. Transformasi yang akan
digunakan adalah transformasi logit. Bentuk ( ) apabila ditransformasi akan
menghasilkan:
( )
( )
( )
[ ( )][ ( )] ( )
[ ( ) +[ ( ) ( )] ( )
( ) ( ) ( ) ( )
( ) [ ( )[ ( )
( )
( )
( ( ))
( )
( ) ( ( )
( )
( )
( ) ( )
( )
( ) ( )
dengan ( ) disebut sebagai bentuk logit. Maka bentuk regresi logistik dengan
variabel bebas adalah:
( )
( ) ( )
( )
( ) ( )
6
Selanjutnya model regresi logistik pada persamaan (3.2) dapat dituliskan dalam
bentuk:
( ( ))
( ) ( )
( ( ))
Model logit dalam regresi logistik ordinal disebut dengan cumulative logit models.
Pada model logit ini sifat ordinal dari respon dimasukkan dalam peluang
kumulatif, sehingga cumulative logit models merupakan model yang didapat
dengan membandingkan peluang kumulatif ( ) didefinisikan sebagai
berikut:
( ∑ )
( ) ( )
( ∑ )
( ) ∏[( ( ) )( ( ) ) ( ( ) ) ( )
dimana,
= nilai respon kategori ke- pada pengamatan ke-
( ) = peluang respon kategori ke- pada pengamatan ke-
dan
7
( ) ∑( [ ( ) [ ( ) [ ( )]) ( )
( ) ∑ ( [ ( ) [ ( ) [ ( )])
( )
Menurut Hosmer & Lameshow (1989), model dari estimasi parameter yang telah
diperoleh perlu diuji signifikasinya dengan melakukan pengujian statistik baik
secara serentak (simultan) maupun secara parsial.
Hipotesis :
Statistik uji yang digunakan adalah statistik uji G atau Likelihood Ratio Test :
∏ ( )
[ ] ( )
∏ [( ( ) )( ( ) ) ( ( ) )
∑ ∑
Keterangan :
: banyaknya nilai pengamatan
: banyaknya nilai pengamatan ; dan seterusnya.
: banyaknya pengamatan
Hipotesis :
9
( ) ( )
( )
Hipotesis :
Model sesuai
Model tidak sesuai
( )
∑∑ ( )
dengan,
= banyaknya grup
= banyaknya kategori skala ordinal
= observasi ke- pada skala ordinal
= estimasi ke- pada skala ordinal
10
( ) ( )
( )
( ) ( )
( )
Ketepatan klasifikasi adalah suatu evaluasi untuk melihat peluang kesalahan yang
dilakukan oleh suatu fungsi klasifikasi. Ketepatan klasifikasi pada penelitian ini
menggunakan APER (Apparent Error Rate). Nilai APER ini menunjukkan
proporsi observasi yang salah diklasifikasikan oleh fungsi klasifikasi (Johnson &
Wichern, 2007).
11
dengan,
: jumlah dari yang tepat diklasifikasikan sebagai
: jumlah dari yang tepat diklasifikasikan sebagai
: jumlah dari yang tepat diklasifikasikan sebagai
: jumlah dari yang tepat diklasifikasikan sebagai
: banyaknya kategori variabel tak bebas
Misalkan terdapat empat kategori variabel tak bebas maka perhitungan APER
adalah sebagai berikut:
( )
∑ ∑
1.8 Multikolinearitas
( )
Menurut Gujarati (2004), tolerance (TOL) merupakan invers dari VIF. Sehingga
nilai TOL untuk koefisien regresi-k dapat diidentifikasi sebagai berikut:
( )
( )
dengan ketentuan:
Jika tidak berkorelasi dengan variabel bebas lainnya maka TOL akan
bernilai 1.
Jika berkorelasi dengan variabel bebas lainnya maka TOL akan bernilai 0.
Data yang digunakan dalam penelitian ini adalah data sekunder, yaitu data Indeks
Pembangunan Manusia (IPM) yang secara signifikan berpengaruh terhadap
pertumbuhan ekonomi beserta faktor-faktor yang memengaruhi pada setiap
provinsi di Indonesia pada tahun 2022 yang diperoleh dari web Badan Pusat
Statistik Republik Indonesia.
Data yang digunakan dalam penelitian ini adalah data Indeks Pembangunan
Manusia (IPM) yang secara signifikan berpengaruh terhadap pertumbuhan
ekonomi beserta faktor-faktor yang memengaruhi pada setiap provinsi di
Indonesia pada tahun 2022. IPM berperan sebagai variabel tak bebas dengan
skala ordinal, dimana IPM rendah dilambangkan 1, IPM sedang dilambangkan 2,
IPM tinggi dilambangkan 3, dan IPM sangat tinggi dilambangkan 4. Sementara
untuk variabel-variabel bebas yang diduga memiliki pengaruh terhadap IPM
adalah persentase penduduk yang mempunyai keluhan kesehatan selama sebulan
terakhir ( ), persentase penduduk miskin per provinsi ( ), dan angka partisipasi
sekolah ( ). Data tersebut disajikan dalam tabel berikut:
Provinsi X1 X2 X3 Y IPM
Aceh 32,91 14,75 31,72 3 72,8
Sumatera Utara 30,01 8,33 26,6 3 72,71
Sumatera Barat 28,12 6,04 35,41 3 73,26
Riau 27,07 6,84 28,65 3 73,52
Jambi 25,87 7,7 23,35 3 72,14
Sumatera Selatan 32,3 11,95 18,61 3 70,9
Bengkulu 26,66 14,34 29,42 3 72,16
Lampung 32,52 11,44 20,72 3 70,45
Kep. Bangka
35,11 4,61 17,68 3 72,24
Belitung
Kep. Riau 18,41 6,03 19,5 3 76,46
17
Tabel 3 (lanjutan)
Berikut ini merupakan gambaran karakteristik dari variabel tak bebas yang
disajikan dalam bentuk diagram lingkaran:
Sedang
Tinggi
Sangat Tinggi
71%
Kategori Provinsi
Bengkulu, Lampung, Kep. Bangka Belitung, Kep. Riau, Jawa Barat, Jawa
Terdapat tiga variabel bebas pada penelitian ini, yaitu persentase penduduk yang
mempunyai keluhan kesehatan selama sebulan terakhir ( ), persentase penduduk
miskin per provinsi ( ), dan angka partisipasi sekolah ( ).
20
Variabel bebas yang kedua, yaitu persentase penduduk miskin per provinsi ( ).
Variabel ini memiliki nilai minimum sebesar 4,530 yang terdapat pada Provinsi
Bali dan memiliki nilai maksimum sebesar 26,800 yang terdapat pada Provinsi
Papua dengan rata-rata (mean) sebesar 10,299 serta varians sebesar 27,938.
Variabel bebas yang ketiga, yaitu angka partisipasi sekolah ( ). Variabel ini
memiliki nilai minimum sebesar 17,680 yang terdapat pada Provinsi Kepulauan
Bangka Belitung dan memiliki nilai maksimum sebesar 50,430 yang terdapat pada
Provinsi DI Yogyakarta dengan rata-rata (mean) sebesar 27,430 serta varians
sebesar 40,561.
Berdasarkan Tabel 7, diperoleh nilai VIF dari setiap variabel bebas semuanya
kurang dari 10, sehingga dapat disimpulkan bahwa tidak terjadi multikolinearitas
pada penelitian ini.
Variabel Estimate
[ -0,6053
[ 4,8168
0,0055
-0,3484
0,1639
22
14,1404 3 7,815
dengan tingkat kepercayaan sebesar 95% paling sedikit ada satu variabel bebas
yang memengaruhi variabel tak bebas secara signifikan.
23
Variabel ( ) W ( )
Berdasarkan Tabel 10, dari tiga variabel bebas yang diduga memberikan pengaruh
terhadap variabel tak bebas hanya terdapat dua variabel bebas yang memiliki
Karena pada model tersebut masih terdapat variabel bebas yang tidak berpengaruh
secara signifikan terhadap variabel tak bebas, maka variabel-variabel bebas
tersebut dapat dieliminasi dari model dan selanjutnya akan dilakukan kembali
pengujian regresi logistik ordinal dengan variabel bebas yang berpengaruh secara
signifikan.
24
Variabel Estimate
[ -0,7566
[ 4,6681
-0,3473
0,1639
Setelah melalui tahap analisis diperoleh nilai uji G sebesar 14,1338 dan nilai chi-
square tabel dengan taraf signifikansi ( ) = 0,05 serta derajat bebas 2 yaitu 5,991.
25
14,1338 2 5,991
dengan tingkat kepercayaan sebesar 95% paling sedikit ada satu variabel bebas
yang memngaruhi variabel tak bebas secara signifikan.
Variabel ( ) W ( )
Karena model telah terbrntuk, maka selanjutnya akan diuji apakah model tersebut
sudah sesuai atau belum. Pengujian dilakukan dengan statistik uji Hosmer-
Lemeshow Goodness of Fit dengan dan . Berikut ini disajikan hasil
dari analisis uji Hosmer-Lemeshow:
Karena nilai ( ) lebih besar dari hasil perhitungan dan juga nilai
maka tidak tolak . Sehingga dapat disimpulkan bahwa model sudah
sesuai.
Perhitungan nilai odds ratio dilakukan pada variabel bebas yang secara signifikan
memberikan pengaruh terhadap variabel tak bebas. Perhitungan ini digunakan
untuk menginterpretasi koefisien regresi logistik ordinal. Berikut ini disajikan
hasil perhitungan nilai odds ratio:
Berdasarkan Tabel 15, diperoleh nilai odds ratio untuk variabel (persentase
penduduk miskin per provinsi) sebesar ( ) . Hal ini
menunjukkan bahwa jika nilai persentase penduduk miskin per provinsi
bertambah sebesar satu satuan, maka kecenderungan untuk dikategorikan ke
dalam IPM dengan kategori sedang adalah kali lipat dibandingkan masuk
ke dalam IPM dengan kategori tinggi atau sangat tinggi.
Sementara itu, nilai odds ratio untuk variabel (angka partisipasi sekolah)
sebesar ( ) . Hal ini menunjukkan bahwa jika nilai angka
partisipasi sekolah bertambah sebesar satu satuan, maka kecenderungan untuk
dikategorikan ke dalam IPM dengan kategori sedang adalah kali lipat
dibandingkan masuk ke dalam IPM dengan kategori tinggi atau sangat tinggi.
Berikut adalah hasil ketepatan klasifikasi antara hasil observasi dengan prediksi
berdasarkan model logit yang terbentuk:
Observasi
Prediksi Sedang Tinggi Sangat Tinggi Total
(2) (3) (4)
Sedang
3 1 0 4
(2)
Tinggi
5 23 2 30
(3)
Sangat Tinggi
0 0 0 0
(4)
Total 8 24 2 34
28
Berdasarkan Tabel 16 dapat dihitung besarnya nilai Apparent Error Rate (APER),
yaitu:
Hal ini berarti bahwa nilai ketepatan akurasi yang diberikan model adalah sebesar
. Angka ini cukup baik karena ketepatan klasifikasi
sudah lebih dari , sehingga dapat disimpulkan bahwa model dianggap baik.
IV. KESIMPULAN
Nurmalasari, R., Ispriyanti, D., & Sudarno. 2017. Analisis Faktor-Faktor Yang
Mempengaruhi Indeks Pembangunan Manusia (IPM) Menggunakan
Metode Regresi Logistik Ordinal dan Regresi Probit Ordinal (Studi Kasus
Kabupaten/Kota di Jawa Tengah Tahun 2014). Jurnal Gaussian. 6(1):
111-120.
Pentury, T., Aulele, S. N., & Wattimena, R. 2016. Analisis Regresi Logistik
Ordinal (Studi kasus: Akreditasi SMA di Kota Ambon). Jurnal Ilmu
Matematika dan Terapan. 10(1): 55-60.
Budiman, M. A., & Cahyani, N. 2022. Pemodelan Regresi Logistik Ordinal Pada
Indeks Pembangunan Manusia (IPM) Di Jawa Timur Tahun 2020. Jurnal
Statistika dan Komputasi. 1(2): 64-73.
Agresti, A. 2013. Categorical Data Analysis. John Wiley & Sons, New Jersey.
Imaslihkah, S., Ratna, M., & Ratnasari, V. 2013. Analisis Regresi Logistik
Ordinal terhadap Faktor-faktor yang Mempengaruhi Predikat Kelulusan
Mahasiswa S1 di ITS Surabaya. Jurnal Sains dan Seni POMITS. 2(2):
117-182.
Supriyadi, E., Mariani, S., & Sugiman. 2017. Perbandingan Metode Partial
Least Square (PLS) dan Principal Component Regression (PCR) Untuk
Mengatasi Multikolinearitas Pada Model Regresi Linear Berganda.
UNNES Journal of Mathematics. 6(2): 118-128.
library(readxl)
library(nnet)
library(ordinal)
library(foreign)
library(MASS)
library(pscl)
library(zoo)
library(lmtest)
library(carData)
library(car)
library(rmarkdown)
library(generalhoslem)
data_kp$Y=as.ordered(data_kp$Y)
str(data_kp)
summary(data_kp)
var(data_kp)
W1=(Value_X1/SE_X1)^2
W2=(Value_X2/SE_X2)^2
W3=(Value_X3/SE_X3)^2
Wald1=cbind(W1,W2,W3)
Wald1
pred=predict(model,data_kp,type = 'prob')
pred
print(pred,digits=3)
SE_X21 = 0.1270
SE_X31 = 0.0761
W21 = (Value_X21/SE_X21)^2
W31 = (Value_X31/SE_X31)^2
Wald2=cbind(W21,W31)
Wald2
#Ketepatan Klasifikasi
pred=predict(model2,data_kp)
pred
(tab=table(pred,data_kp$Y))
(mis_klas=1-sum(diag(tab))/sum(tab))
#Odds Ratio
(OR=exp(coef(model2)))