Anda di halaman 1dari 40

TUGAS KELOMPOK

ANALISIS REGRESI LOGISTIK ORDINAL


MATA KULIAH EKONOMETRIKA B

Disusun Oleh (Kelompok B):


NANDA EVITARINA (2017031069)
CITRA MARIA MAGDALENA NAIBAHO (2017031073)
EDWAN DIO PRAYUDA (2057031010)
NIKEN NADIA PRABAWATI (2017031076)

JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS LAMPUNG
2023
DAFTAR ISI

Halaman

DAFTAR TABEL ................................................................................................. .iv

DAFTAR GAMBAR .............................................................................................. v

I. TINJAUAN PUSTAKA ............................................................................ 1

1.1 Analisis Regresi Linear ...................................................................... 1


1.1.1 Asumsi Klasik Regresi Linear ...................................................... 2
3.1.1.1 Uji Normalitas ........................................................................ 2
3.1.1.2 Uji Multikolinearitas .............................................................. 2
3.1.1.3 Uji Heteroskedastisitas ........................................................... 3
3.1.1.4 Uji Autokorelasi ..................................................................... 3
1.2 Analisis Regresi Logistik Ordinal...................................................... 4
1.3 Pendugaan Parameter ......................................................................... 6
1.4 Pengujian Hipotesis ........................................................................... 7
1.4.1 Uji Simultan ................................................................................. 7
1.4.2 Uji Parsial .................................................................................... 8
1.5 Uji Kesesuaian Model ........................................................................ 9
1.6 Uji Odds Ratio ................................................................................. 10
1.7 Ketepatan Klasifikasi ....................................................................... 10
1.8 Multikolinearitas .............................................................................. 11
1.9 Indeks Pembangunan Manusia ........................................................ 12

II. METODOLOGI PENELITIAN ............................................................ 14

2.1 Waktu dan Tempat Penelitian .......................................................... 14


2.2 Data Penelitian ................................................................................. 14
2.3 Metode Penelitian ............................................................................ 14

III. HASIL DAN PEMBAHASAN ............................................................... 16

3.1 Data Penelitian ................................................................................. 16


3.2 Analisis dan Pembahasan................................................................. 17
3.2.1 Statistika Deskriptif ................................................................... 17
3.2.2 Identifikasi Multikolinearitas ..................................................... 20
3.2.3 Model Regresi Logistik Ordinal Sementara .............................. 21
3.2.4 Pengujian Simultan Model Regresi Logistik Ordinal
Sementara................................................................................... 22
3.2.5 Pengujian Parsial Model Regresi Logistik OrdinalSementara .. 23
3.2.6 Model Regresi Logistik Ordinal ................................................ 24
3.2.7 Pengujian Simultan Model Regresi Logistik Ordinal ................ 24
3.2.8 Pengujian Parsial Model Regresi Logistik Ordinal ................... 25
3.2.9 Uji Kesesuaian Model ................................................................ 26
3.2.10 Perhitungan Nilai Odds Ratio .................................................... 26
3.2.11 Ketepatan Klasifikasi ................................................................. 27

IV. KESIMPULAN ........................................................................................ 29

DAFTAR PUSTAKA ......................................................................................... .30

LAMPIRAN
iv

DAFTAR TABEL

Tabel Halaman

1. Tabel Klasifikasi………………………………….........................................11

2. Pembagian Kategori IPM................................ ...............................................13

3. Data Indeks Pembangunan Manusia Tahun 2022 beserta faktor-faktor yang


memengaruhinya…………………….............................................................16

4. Daftar Provinsi di Indonesia Berdasarkan Kategori IPM...............................19

5. Statistika Deskriptif Variabel Bebas...............................................................19

6. Nilai VIF Variabel Bebas................................................................................21

7. Parameter Fungsi Logit Model Sementara......................................................21

8. Hasil Pengujian Simultan Model Sementara..................................................22

9. Hasil Pengujian Parsial Model Sementara......................................................23

10. Parameter Fungsi Logit Model.......................................................................24

11. Hasil Pengujian Simultan Model....................................................................25

12. Hasil Pengujian Parsial Model........................................................................25

13. Hasil Uji Kesesuaian Model...........................................................................26

14. Hasil Odds Ratio.............................................................................................26

15. Ketepatan Klasifikasi......................................................................................27

iv
v

DAFTAR GAMBAR

Gambar Halaman

1. Persentase Karakteristik IPM di Indonesia pada tahun 2022..........................18

v
I. TINJAUAN PUSTAKA

1.1 Analisis Regresi Linear

Analisis regresi linier adalah teknik statistika yang dapat digunakan untuk
menjelaskan pengaruh variabel bebas (independent variable) terhadap variabel tak
bebas (dependent variable). Jika hanya menggunakan satu variabel bebas dalam
model, maka teknik ini disebut sebagai regresi linear sederhana. Model regresi
linear sedehana:

( )

dengan,
= variabel tak bebas
= variabel bebas
dan = parameter regresi
= galat

Sedangkan, jika menggunakan lebih dari satu variabel bebas maka teknik ini
disebut sebagai regresi linear berganda. Model regresi linear berganda dengan
variabel bebas dapat dirumuskan sebagai berikut:

( )
2

dengan,
= variabel tak bebas
= variabel bebas
= parameter regresi
= galat pengamatan ke-i
= 1,2,3,…,

1.1.1 Asumsi Klasik Regresi Linear

Menurut Ghozali (2018), untuk menentukan ketepatan model perlu dilakukan


pengujian atau beberapa asumsi klasik yaitu, uji normalitas, uji multikolinearitas,
uji heteroskedastisitas, dan uji autokorelasi.

1.1.1.1 Uji Normalitas

Uji normalitas digunakan untuk menguji apakah model regresi dalam penelitian
ini memiliki residual yang berdistribusi normal atau tidak. Indikator model regresi
yang baik adalah memiliki data berdistribusi normal yang dapat diuji dengan
menggunakan uji Kolmogorov-Smirnov. Distribusi data dapat dikatakan normal
apabila nilai signifikansi lebih dari 0,05 (Ghozali, 2018).

1.1.1.2 Uji Multikolinearitas

Uji multikolinearitas digunakan untuk menguji apakah suatu model regresi


terdapat korelasi antar variabel independen. Model regresi yang baik adalah jika
tidak terjadi korelasi antara variabel independen dan bebas dari gejala
multikolinearitas.
3

Mengetahui ada atau tidaknya gejala multikoliniearitas yaitu dengan melihat


besaran dari nilai Variance Inflation Factor (VIF) dan juga nilai Tolerance.
Tolerance mengukur variabilitas variabel terpilih yang tidak dijelaskan oleh
variabel independen lainnya. Nilai yang dipakai untuk menunjukkan tidak terjadi
multikolinearitas yaitu adalah jika nilai VIF < 10 dan nilai Tolerance > 0,10
(Ghozali, 2018).

1.1.1.3 Uji Heteroskedastisitas

Uji heteroskedastisitas bertujuan untuk menguji apakah dalam model regresi


terjadi ketidaksamaan ragam dari residual satu pengamatan ke pengamatan yang
lain (Ghozali, 2018). Pengujian heteroskedastisitas dapat dengan melihat grafik
scatterplot antara SRESID dan ZPRED yaitu ada atau tidaknya pola tertentu.
Dasar pengambilan keputusannya adalah sebagai berikut:

a. Jika ada pola tertentu, seperti titik-titik yang ada membentuk pola tertentu
yang teratur (bergelombang, melebar kemudian menyempit) maka
mengindikasikan telah terjadi heteroskedastisitas.
b. Jika tidak ada pola yang jelas, serta titik-titik menyebar di atas dan dibawah
angka 0 pada sumbu Y, maka tidak terjadi heteroskedastisitas (Ghozali,
2018).

1.1.1.4 Uji Autokorelasi

Uji autokorelasi adalah hubungan antara residual satu observasi dengan residual
observasi lainnya (Winarno, 2015).
4

Menurut Ghozali (2018), uji autokorelasi bertujuan untuk menguji apakah dalam
model regresi liner ada korelasi antara kesalahan pengganggu pada periode t
dengan kesalahan pengganggu pada periode t-1 (sebelumnya). Diharapkan bahwa
tidak terjadi autokorelasi yang dapat diuji dengan menggunakan uji Durbin-
Watson dengan kriteria sebagai berikut:

a. 0 < d < dl, berarti tidak ada autokorelasi positif dan keputusannya ditolak.
b. dl ≤ d ≤ du, berarti tidak ada autokorelasi positif dan keputusannya no
desicison.
c. (4 – dl) < d < 4, berarti tidak ada autokorelasi negatif dan keputusannya
ditolak.
d. (4 – du) ≤ d ≤ (4 – dl), berarti tidak ada autokorelasi negatif dan
keputusannya no desicison.
e. du < d < (4 – du), berarti tidak ada autokorelasi positif atau negatif dan
keputusannya tidak ditolak.

1.2 Analisis Regresi Logistik Ordinal

Analisis regresi logistik adalah analisis yang digunakan untuk melihat hubungan
fungsional antara variabel respon yang bersifat kategori (dikotomus dan
polikotomus) dan variabel-variabel penjelas berupa data kualitatif (nominal atau
ordinal) maupun kuantitatif (interval atau rasio).

Menurut Hosmer, dkk. (2013), analisis regresi logistik ordinal merupakan metode
statistik yang digunakan untuk menganalisis hubungan antara variabel tak bebas
(dinotasikan dengan Y) dan variabel bebas (dinotasikan dengan X), dimana
variabel tak bebasnya bersifat polikotomus dengan skala ordinal. Menurut Agresti
(2007), model regresi logistik adalah sebagai berikut:

( )
( ) ( )
( )
5

Perlu diketahui bahwa fungsi ( ) buanlah fungsi yang linear, maka dari itu perlu
dilakukan transformasi agar menjadi fungsi yang linear. Transformasi yang akan
digunakan adalah transformasi logit. Bentuk ( ) apabila ditransformasi akan
menghasilkan:

( )
( )
( )
[ ( )][ ( )] ( )
[ ( ) +[ ( ) ( )] ( )
( ) ( ) ( ) ( )
( ) [ ( )[ ( )
( )
( )
( ( ))
( )
( ) ( ( )
( )
( )
( ) ( )
( )
( ) ( )

dengan ( ) disebut sebagai bentuk logit. Maka bentuk regresi logistik dengan
variabel bebas adalah:

( )
( ) ( )
( )

dimana adalah pengamatan ke- ( ).

Apabila fungsi ( ) ditransformasikan dengan bentuk logit maka akan


menghasilkan:

( ) ( )
6

Selanjutnya model regresi logistik pada persamaan (3.2) dapat dituliskan dalam
bentuk:

( ( ))
( ) ( )
( ( ))

Model logit dalam regresi logistik ordinal disebut dengan cumulative logit models.
Pada model logit ini sifat ordinal dari respon dimasukkan dalam peluang
kumulatif, sehingga cumulative logit models merupakan model yang didapat
dengan membandingkan peluang kumulatif ( ) didefinisikan sebagai
berikut:

( ∑ )
( ) ( )
( ∑ )

dimana j adalah banyaknya kategori variabel respon (j = 1,2,3,….) dan k adalah


banyaknya variabel bebas.

1.3 Pendugaan Parameter

Metode kemungkinan nilai maksimum (Maximum Likelihood Estimation)


merupakan metode yang digunakan untuk menaksir parameter-parameter model
regresi logistik dengan memberikan nilai estimasi dengan memaksimumkan
fungsi likelihood (Agresti, 2013). Menurut Hosmer, dkk. (2013), fungsi
likelihood untuk n sampel prediktor dapat dinyatakan sebagai berikut:

( ) ∏[( ( ) )( ( ) ) ( ( ) ) ( )

dimana,
= nilai respon kategori ke- pada pengamatan ke-
( ) = peluang respon kategori ke- pada pengamatan ke-
dan
7

dari persamaan (3.9) diperoleh fungsi ln-Likelihood sebagai berikut:

( ) ∑( [ ( ) [ ( ) [ ( )]) ( )

Kemudian maksimumkan ln-Likelihood dengan mendiferensialkan ( ) terhadap


dan menyamakan dengan nol sedemikian hingga:

( ) ∑ ( [ ( ) [ ( ) [ ( )])
( )

Selanjutnya berdasarkan teori maximum likelihood, estimasi varian kovarian


didapatkan dari turunan kedua fungsi ln-likelihood-nya. Nilai parameter
diestimasi dengan menggunakan metode numerik karena persamaannya bersifat
nonlinier. Metode numerik tersebut adalah metode iterasi Newton-Raphson
(Efron & Tibshirani, 1993).

1.4 Pengujian Hipotesis

Menurut Hosmer & Lameshow (1989), model dari estimasi parameter yang telah
diperoleh perlu diuji signifikasinya dengan melakukan pengujian statistik baik
secara serentak (simultan) maupun secara parsial.

1.4.1 Uji Simultan

Pengujian ini dilakukan untuk memeriksa signifikansi koefisien terhadap


variabel tak bebas secara bersama-sama.

Hipotesis :

paling sedikit ada satu ;


8

Statistik uji yang digunakan adalah statistik uji G atau Likelihood Ratio Test :

∏ ( )
[ ] ( )
∏ [( ( ) )( ( ) ) ( ( ) )

dengan, adalah kategori variabel tak bebas ( ), maka :

∑ ∑
Keterangan :
: banyaknya nilai pengamatan
: banyaknya nilai pengamatan ; dan seterusnya.
: banyaknya pengamatan

Daerah penolakan adalah jika ( )


dengan derajat bebas atau nilai

Statistik uji G mengikuti distribusi Chi-square dengan derajat


bebas p.

1.4.2 Uji Parsial

Uji parsial digunakan untuk memeriksa signifikansi koefisien secara individu.


Uji signifikansi secara individu dilakukan dengan menggunakan uji Wald yang
diperoleh dengan cara mengkuadratkan rasio estimasi parameter dengan estimasi
standar error nya. Uji Wald dilakukan untuk mengetahui signifikansi parameter
terhadap variabel bebas (Hosmer & Lemeshow, 2000).

Hipotesis :
9

Statistik uji yang digunakan adalah statistik uji Wald :

( ) ( )
( )

Daerah penolakan adalah atau ( ) dengan derajat bebas


atau nilai .

1.5 Uji Kesesuaian Model

Pengujian kesesuaian model dilakukan dengan menggunakan Hosmer-Lemeshow


Goodness of Fit. Pengujian ini bertujuan untuk menguji bagaimana kesesuaian
model yang dihasilkan berdasarkan uji signifikansi parameter secara serentak,
dengan kata lain tidak terdapat perbedaan antara hasil pengamatan dengan
kemungkinan hasil prediksi model (Hosmer, dkk., 2013).

Hipotesis :
Model sesuai
Model tidak sesuai

Statistik uji yang digunakan:

( )
∑∑ ( )

dengan,
= banyaknya grup
= banyaknya kategori skala ordinal
= observasi ke- pada skala ordinal
= estimasi ke- pada skala ordinal
10

Statistik uji Hosmer-Lemeshow mengikuti distribusi Chi-square dengan derajat


bebas sebesar sehingga diperoleh keputusan tolak jika nilai ( )

atau (Hosmer, dkk., 2013).

1.6 Uji Odds Ratio

Interpretasi model regresi logistik ordinal dilakukan dengan menggunakan nilai


odds ratio. Nilai odds ratio menunjukkan perbandingan tingkat kecenderungan
dari dua kategori atau lebih dalam satu variabel bebas dimana salah satu kategori
dipilih sebagai pembanding kategori lainnya. Variabel tak bebas dengan
diasumsikan sebagai pembanding.

Secara sederhana odds ratio dirumuskan sebagai berikut:

( ) ( )
( )
( ) ( )

atau dapat juga menggunakan rumus:

( )

1.7 Ketepatan Klasifikasi

Ketepatan klasifikasi adalah suatu evaluasi untuk melihat peluang kesalahan yang
dilakukan oleh suatu fungsi klasifikasi. Ketepatan klasifikasi pada penelitian ini
menggunakan APER (Apparent Error Rate). Nilai APER ini menunjukkan
proporsi observasi yang salah diklasifikasikan oleh fungsi klasifikasi (Johnson &
Wichern, 2007).
11

Tabel 1. Tabel Klasifikasi

dengan,
: jumlah dari yang tepat diklasifikasikan sebagai
: jumlah dari yang tepat diklasifikasikan sebagai
: jumlah dari yang tepat diklasifikasikan sebagai
: jumlah dari yang tepat diklasifikasikan sebagai
: banyaknya kategori variabel tak bebas

Misalkan terdapat empat kategori variabel tak bebas maka perhitungan APER
adalah sebagai berikut:

( )
∑ ∑

1.8 Multikolinearitas

Multikolinearitas adalah suatu kondisi dimana terjadi korelasi antara variabel


bebas atau antar variabel bebas tidak bersifat saling bebas. Besaran (quality) yang
dapat digunakan untuk mendeteksi adanya multikolinearitas adalah nilai
Tolerance dan faktor inflasi ragam (Variance Inflation Factor/VIF). Suatu model
regresi dapat dikatakan bebas multikolinearitas jika mempunyai nilai VIF tidak
lebih dari 10 dan mempunyai angka tolerance tidak kurang dari 0,10, (Ghozali,
2013).
12

VIF untuk koefisien regresi-k diidentifikasi sebagai berikut:

( )

dengan : adalah koefisien determinasi antara dengan variabel bebas lainnya


pada persamaan/model dugaan ; dimana .

Menurut Gujarati (2004), tolerance (TOL) merupakan invers dari VIF. Sehingga
nilai TOL untuk koefisien regresi-k dapat diidentifikasi sebagai berikut:

( )
( )

dengan ketentuan:

 Jika tidak berkorelasi dengan variabel bebas lainnya maka TOL akan
bernilai 1.
 Jika berkorelasi dengan variabel bebas lainnya maka TOL akan bernilai 0.

1.9 Indeks Pembangunan Manusia

Indeks pembangunan manusia merupakan suatu ukuran yang digunakan untuk


mengukur pencapaian pembangunan manusia di suatu wilayah. Meskipun tidak
mengukur semua dimensi dari pembangunan manusia, namun IPM dinilai mampu
mengukur dimensi pokok dari pembangunan manusia (BPS, 2013). IPM disusun
berdasarkan tiga dimensi kehidupan, yaitu kesehatan, pendidikan dan ekonomi.
Dimensi kesehatan bisa menggunakan indikator persentase penduduk yang
mempumyai keluhan kesehatan selama sebulan terakhir, pendidikan bisa
menggunakan indikator angka partisipasi sekolah, dan ekonomi bisa
menggunakan indikator persentase penduduk miskin per provinsi.
13

Menurut BPS (2014), IPM dikategorikan menjadi 4:

Tabel 2. Pembagian Kategori IPM

Interval Nilai IPM Kategori


Rendah
Sedang
Tinggi
Sangat Tinggi
II. METODOLOGI PENELITIAN

2.1 Waktu dan Tempat Penelitian

Penelitian ini dilaksanakan pada semester genap tahun ajaran 2022/2023 di


Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam,
Universitas Lampung.

2.2 Data Penelitian

Data yang digunakan dalam penelitian ini adalah data sekunder, yaitu data Indeks
Pembangunan Manusia (IPM) yang secara signifikan berpengaruh terhadap
pertumbuhan ekonomi beserta faktor-faktor yang memengaruhi pada setiap
provinsi di Indonesia pada tahun 2022 yang diperoleh dari web Badan Pusat
Statistik Republik Indonesia.

2.3 Metode Penelitian

Langkah-langkah yang dilakukan pada penelitian ini adalah sebagai berikut:


1. Menginput data.
2. Mengidentifikasi data dengan melihat deskripsi statistiknya.
3. Melakukan uji multikolinearitas.
4. Membuat model regersi logistik ordinal sementara.
15

5. Melakukan uji simultan model regersi logistik ordinal sementara.


6. Melakukan uji parsial model regersi logistik ordinal sementara.
7. Jika semua variabel bebas telah diuji dan memiliki pengaruh terrhadap
variabel tak bebas maka selanjutnya membangun model regresi logistik
ordinal yang sudah tetap. Jika ternyata pada langkah ke 6 masih ada variabel
bebas yang diduga tidak berpengaruh terhadap variabel tak bebas maka ulangi
langkah 5 sampai 6.
8. Melakukan uji simultan pada model yang sudah tetap.
9. Melakukan uji parsial pada model yang sudah tetap.
10. Melakukan uji kesesuaian model.
11. Menghitung nilai odds ratio.
12. Menghitung ketepatan klasifikasi.
13. Menarik kesimpulan.
III. HASIL DAN PEMBAHASAN

3.1 Data Penelitian

Data yang digunakan dalam penelitian ini adalah data Indeks Pembangunan
Manusia (IPM) yang secara signifikan berpengaruh terhadap pertumbuhan
ekonomi beserta faktor-faktor yang memengaruhi pada setiap provinsi di
Indonesia pada tahun 2022. IPM berperan sebagai variabel tak bebas dengan
skala ordinal, dimana IPM rendah dilambangkan 1, IPM sedang dilambangkan 2,
IPM tinggi dilambangkan 3, dan IPM sangat tinggi dilambangkan 4. Sementara
untuk variabel-variabel bebas yang diduga memiliki pengaruh terhadap IPM
adalah persentase penduduk yang mempunyai keluhan kesehatan selama sebulan
terakhir ( ), persentase penduduk miskin per provinsi ( ), dan angka partisipasi
sekolah ( ). Data tersebut disajikan dalam tabel berikut:

Tabel 3. Data Indeks Pembangunan Manusia Tahun 2022 beserta faktor-faktor


yang memengaruhinya

Provinsi X1 X2 X3 Y IPM
Aceh 32,91 14,75 31,72 3 72,8
Sumatera Utara 30,01 8,33 26,6 3 72,71
Sumatera Barat 28,12 6,04 35,41 3 73,26
Riau 27,07 6,84 28,65 3 73,52
Jambi 25,87 7,7 23,35 3 72,14
Sumatera Selatan 32,3 11,95 18,61 3 70,9
Bengkulu 26,66 14,34 29,42 3 72,16
Lampung 32,52 11,44 20,72 3 70,45
Kep. Bangka
35,11 4,61 17,68 3 72,24
Belitung
Kep. Riau 18,41 6,03 19,5 3 76,46
17

Tabel 3 (lanjutan)

DKI Jakarta 16,76 4,61 24,89 4 81,65


Jawa Barat 31,17 7,98 23,99 3 73,12
Jawa Tengah 35,34 10,98 23,76 3 72,79
DI Yogyakarta 35,73 11,49 50,43 4 80,64
Jawa Timur 32,14 10,49 26,21 3 72,75
Banten 24,09 6,24 22,14 3 73,32
Bali 20,45 4,53 30,18 3 76,44
Nusa Tenggara Barat 43,62 13,82 25,64 2 69,46
Nusa Tenggara Timur 29,06 20,23 29,36 2 65,9
Kalimantan Barat 25,3 6,81 24,5 2 68,63
Kalimantan Tengah 24,32 5,22 24,29 3 71,63
Kalimantan Selatan 31,88 4,61 24,52 3 71,84
Kalimantan Timur 26,46 6,44 29,33 3 77,44
Kalimantan Utara 34,87 6,86 25,62 3 71,83
Sulawesi Utara 23,31 7,34 23,43 3 73,81
Sulawesi Tengah 21,93 12,3 27,04 3 70,28
Sulawesi Selatan 33,49 8,66 35,07 3 72,82
Sulawesi Tenggara 30,98 11,27 31,81 3 72,23
Gorontalo 35,85 15,51 30,06 2 69,81
Sulawesi Barat 29,53 11,92 23,43 2 66,92
Maluku 15,6 16,23 40,15 3 70,22
Maluku Utara 16,41 6,37 30,67 2 69,47
Papua Barat 20 21,43 30,69 2 65,89
Papua 11,68 26,8 23,58 2 61,39

3.2 Analisis dan Pembahasan

3.2.1 Statistika Deskriptif

Analisis statistika deskriptif dilakukan untuk melihat gambaran secara umum


mengenai data yang digunakan dalam penelitian sebelum melakukan analisis
regresi logistik ordinal. Pada penelitian ini variabel tak bebas yang digunakan
adalah Indeks Pembangunan Manusia 34 Provinsi di Indonesia pada tahun 2022.
18

Berikut ini merupakan gambaran karakteristik dari variabel tak bebas yang
disajikan dalam bentuk diagram lingkaran:

Indeks Pembangunan Manusia


6%
23%

Sedang
Tinggi
Sangat Tinggi

71%

Gambar 1. Persentase Karakteristik IPM di Indonesia pada tahun 2022


.
Pada gambar 1 dapat di interpretasikan bahwa nilai Indeks Pembangunan Manusia
di 34 Provinsi di Indonesia pada tahun 2022 hanya dikategorikan menjadi tiga
kategori, yaitu sedang, tinggi, dan sangat tinggi. Pada tahun 2022 terdapat 23%
atau 8 provinsi di Indonesia yang nilai Indeks Pembangunan Manusianya masuk
dalam kategori sedang, sebanyak 71% atau 24 provinsi masuk dalam kategori
tinggi, dan sisanya yaitu 3% atau 2 provinsi masuk dalam kategori sangat tinggi.
Daftar nama daerah-daerah yangmasuk dalam kategori sedang, tinggi, dan sangat
tinggi disajikan dalam tabel berikut:
19

Tabel 4. Daftar Provinsi di Indonesia Berdasarkan Kategori IPM

Kategori Provinsi

Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Gorontalo,


Sedang
Sulawesi Barat, Maluku Utara, Papua Barat, Papua.

Aceh, Sumatera Utara, Sumatera Barat, Riau, Jambi, Sumatera Selatan,

Bengkulu, Lampung, Kep. Bangka Belitung, Kep. Riau, Jawa Barat, Jawa

Tinggi Tengah, Jawa Timur, Banten, Bali, Kalimantan Tengah, Kalimantan

Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi

Tengah, Sulawesi Selatan, Sulawesi Tenggara, Maluku.

Sangat Tinggi DKI akarta dan DI Yogyakarta.

Setelah melakukan analisis statistika deskriptif pada variabel tak bebas,


selanjutnya adalah melakukan analisis statistika deskriptif pada variabel bebas.
Berikut ini disajikan hasil dari analisis statistika deskriptif untuk variabel bebas.

Tabel 5. Statistika Deskriptif Variabel Bebas

Variabel Bebas Minimum Maksimum Mean Median Varians


11,680 43,620 27,620 28,590 50,365
4,530 26,800 10,299 8,495 27,938
17,680 50,430 27,430 25,930 40,561

Terdapat tiga variabel bebas pada penelitian ini, yaitu persentase penduduk yang
mempunyai keluhan kesehatan selama sebulan terakhir ( ), persentase penduduk
miskin per provinsi ( ), dan angka partisipasi sekolah ( ).
20

Variabel bebas yang pertama, yaitu persentase penduduk yang mempunyai


keluhan kesehatan selama sebulan terakhir ( ). Variabel ini memiliki nilai
minimum sebesar 11,680 yang terdapat pada Provinsi Papua dan memiliki nilai
maksimum sebesar 43,620 yang terdapat pada Provinsi Nusa Tenggara Barat
dengan rata-rata (mean) sebesar 27,620 serta varians sebesar 50,365.

Variabel bebas yang kedua, yaitu persentase penduduk miskin per provinsi ( ).
Variabel ini memiliki nilai minimum sebesar 4,530 yang terdapat pada Provinsi
Bali dan memiliki nilai maksimum sebesar 26,800 yang terdapat pada Provinsi
Papua dengan rata-rata (mean) sebesar 10,299 serta varians sebesar 27,938.

Variabel bebas yang ketiga, yaitu angka partisipasi sekolah ( ). Variabel ini
memiliki nilai minimum sebesar 17,680 yang terdapat pada Provinsi Kepulauan
Bangka Belitung dan memiliki nilai maksimum sebesar 50,430 yang terdapat pada
Provinsi DI Yogyakarta dengan rata-rata (mean) sebesar 27,430 serta varians
sebesar 40,561.

3.2.2 Identifikasi Multikolinearitas

Sebelum dilakukan analisis regresi logistik ordinal, maka perlu dilakukan


pengujian multikolinearitas antar variabel bebas untuk melihat kebebasan antar
variabel bebasnya. Untuk mengetahui adanya multikolinearitas dapat dilihat
melalui nilai VIF dari setiap variabel bebas. Nilai VIF lebih besar dari 10
mengidentifikasi adanya masalah multikolinearitas yang serius (Ryan, 1997).
Setelah dilakukan analisis, diperoleh nilai VIF dari masing-masing variabel bebas
sebagai berikut:
21

Tabel 6. Nilai VIF Variabel Bebas

Variabel Bebas Nilai VIF


1,015
1,317
1,299

Berdasarkan Tabel 7, diperoleh nilai VIF dari setiap variabel bebas semuanya
kurang dari 10, sehingga dapat disimpulkan bahwa tidak terjadi multikolinearitas
pada penelitian ini.

3.2.3 Model Regresi Logistik Ordinal Sementara

Karena tidak ditemukan adanya multikolinearitas pada penelitian ini, langkah


selanjutnya yaitu pembentukan model. Model regresi ini dikatakan sementara
karena perlu dlakukan pengujian terlebih dahulu baik secara simultan maupun
parsial. Berikut ini adalah parameter logit yang diperoleh:

Tabel 7. Parameter Fungsi Logit Model Sementara

Variabel Estimate

[ -0,6053

[ 4,8168

0,0055
-0,3484
0,1639
22

Berdasarkan Tabel 8 dapat dibentuk fungsi logit sebagai berikut:


( ) ( )
( ) ( )

Sehingga diperoleh model regresi logistik ordinal sementara sebagai berikut:


( )
( ) ( )
( )
( )
( ) ( )
( )

3.2.4 Pengujian Simultan Model Regresi Logistik Ordinal Sementara

Pengujian ini dilakukan untuk memeriksa signifikansi koefisien terhadap


variabel tak bebas secara bersama-sama. Setelah dilakukan analisis diperoleh
nilai uji G sebesar 14,1404 dan nilai chi-square tabel dengan taraf signifikansi ( )
= 0,05 serta derajat bebas 3 yaitu 7,815.

Tabel 8. Hasil Pengujian Simultan Model Sementara

Uji G Derajat bebas ( )

14,1404 3 7,815

Karena nilai uji ( ) maka tolak . Sehingga dapat disimpulkan bahwa

dengan tingkat kepercayaan sebesar 95% paling sedikit ada satu variabel bebas
yang memengaruhi variabel tak bebas secara signifikan.
23

3.2.5 Pengujian Parsial Model Regresi Logistik Ordinal Sementara

Pada pengujian simultan telah diperoleh kesimpulan bahwa setidaknya terdapat


satu variabel bebas yang memengaruhi variabel tak bebas secara signifikan maka
langkah selanjutnya yaitu melakukan pengujian secara parsial untuk melihat
pengaruh dari koefisien terhadap variabel tak bebas. Berikut ini disajikan hasil
dari analisis pengujian parsial yang diperoleh:

Tabel 9. Hasil Pengujian Parsial Model Sementara

Variabel ( ) W ( )

0,0055 0,0677 0,0066 3,481 0,9354


-0,3484 0,1286 7,3396 3,841 0,0067
0,1639 0,0759 4,6631 3,841 0,0308

Berdasarkan Tabel 10, dari tiga variabel bebas yang diduga memberikan pengaruh
terhadap variabel tak bebas hanya terdapat dua variabel bebas yang memiliki

( ) dan , yaitu variabel dan yang berarti bahwa


variabel bebas tersebut berpengaruh signifikan terhadap variabel tak bebas.

Karena pada model tersebut masih terdapat variabel bebas yang tidak berpengaruh
secara signifikan terhadap variabel tak bebas, maka variabel-variabel bebas
tersebut dapat dieliminasi dari model dan selanjutnya akan dilakukan kembali
pengujian regresi logistik ordinal dengan variabel bebas yang berpengaruh secara
signifikan.
24

3.2.6 Model Regresi Logistik Ordinal

Setelah melakukan eliminasi terhadap variabel-variabel bebas yang tidak


berpengaruh secara signifikan maka kita dapat membentuk kembali model regresi
logistik ordinal yang baru. Berikut disajikan parameter fungsi logit yang
diperoleh dari hasil analisis:

Tabel 10. Parameter Fungsi Logit Model

Variabel Estimate

[ -0,7566

[ 4,6681

-0,3473
0,1639

Berdasarkan Tabel 11 dapat dibentuk fungsi logit sebagai berikut:


( ) ( )
( ) ( )

Sehingga diperoleh model regresi logistik ordinal sementara sebagai berikut:


( )
( ) ( )
( )
( )
( ) ( )
( )

3.2.7 Pengujian Simultan Model Regresi Logistik Ordinal

Setelah melalui tahap analisis diperoleh nilai uji G sebesar 14,1338 dan nilai chi-

square tabel dengan taraf signifikansi ( ) = 0,05 serta derajat bebas 2 yaitu 5,991.
25

Tabel 11. Hasil Pengujian Simultan Model

Uji G Derajat bebas ( )

14,1338 2 5,991

Karena nilai uji ( ) maka tolak . Sehingga dapat disimpulkan bahwa

dengan tingkat kepercayaan sebesar 95% paling sedikit ada satu variabel bebas
yang memngaruhi variabel tak bebas secara signifikan.

3.2.8 Pengujian Parsial Model Regresi Logistik Ordinal

Pada pengujian simultan telah diperoleh kesimpulan bahwa setidaknya terdapat


satu variabel bebas yang memengaruhi variabel tak bebas secara signifikan maka
langkah selanjutnya yaitu melakukan pengujian secara parsial. Berikut ini
disajikan hasil dari analisis pengujian parsial yang diperoleh:

Tabel 12. Hasil Pengujian Parsial Model

Variabel ( ) W ( )

-0,3473 0,1270 7,4783 3,841 0,0062

0,1639 0,0761 4,6386 3,841 0,0313

Berdasarkan Tabel 13, diketahui bahwa variabel bebas dan memiliki

( ) dan , yang berarti bahwa variabel-variabel bebas


tersebut secara parsial berpengaruh signifikan terhadap variabel tak bebas.
26

3.2.9 Uji Kesesuaian Model

Karena model telah terbrntuk, maka selanjutnya akan diuji apakah model tersebut
sudah sesuai atau belum. Pengujian dilakukan dengan statistik uji Hosmer-
Lemeshow Goodness of Fit dengan dan . Berikut ini disajikan hasil
dari analisis uji Hosmer-Lemeshow:

Tabel 13. Hasil Uji Kesesuaian Model

Chi-square Derajat bebas p-value ( )

8,951 9 0,4418 16,919

Karena nilai ( ) lebih besar dari hasil perhitungan dan juga nilai
maka tidak tolak . Sehingga dapat disimpulkan bahwa model sudah
sesuai.

3.2.10 Perhitungan Nilai Odds Ratio

Perhitungan nilai odds ratio dilakukan pada variabel bebas yang secara signifikan
memberikan pengaruh terhadap variabel tak bebas. Perhitungan ini digunakan
untuk menginterpretasi koefisien regresi logistik ordinal. Berikut ini disajikan
hasil perhitungan nilai odds ratio:

Tabel 14. Hasil Odds Ratio

Variabel Nilai Odds Ratio


0,7065
1,1780
27

Berdasarkan Tabel 15, diperoleh nilai odds ratio untuk variabel (persentase
penduduk miskin per provinsi) sebesar ( ) . Hal ini
menunjukkan bahwa jika nilai persentase penduduk miskin per provinsi
bertambah sebesar satu satuan, maka kecenderungan untuk dikategorikan ke
dalam IPM dengan kategori sedang adalah kali lipat dibandingkan masuk
ke dalam IPM dengan kategori tinggi atau sangat tinggi.

Sementara itu, nilai odds ratio untuk variabel (angka partisipasi sekolah)
sebesar ( ) . Hal ini menunjukkan bahwa jika nilai angka
partisipasi sekolah bertambah sebesar satu satuan, maka kecenderungan untuk
dikategorikan ke dalam IPM dengan kategori sedang adalah kali lipat
dibandingkan masuk ke dalam IPM dengan kategori tinggi atau sangat tinggi.

3.2.11 Ketepatan Klasifikasi

Berikut adalah hasil ketepatan klasifikasi antara hasil observasi dengan prediksi
berdasarkan model logit yang terbentuk:

Tabel 15. Ketepatan Klasifikasi

Observasi
Prediksi Sedang Tinggi Sangat Tinggi Total
(2) (3) (4)
Sedang
3 1 0 4
(2)
Tinggi
5 23 2 30
(3)
Sangat Tinggi
0 0 0 0
(4)

Total 8 24 2 34
28

Berdasarkan Tabel 16 dapat dihitung besarnya nilai Apparent Error Rate (APER),
yaitu:

Hal ini berarti bahwa nilai ketepatan akurasi yang diberikan model adalah sebesar
. Angka ini cukup baik karena ketepatan klasifikasi
sudah lebih dari , sehingga dapat disimpulkan bahwa model dianggap baik.
IV. KESIMPULAN

Berdasarkan hasil analisis dan pembahasan diperoleh kesimpulan sebagai berikut:


1. Berdasarkan pengujian parsial model regresi logistik ordinal, secara
signifikan Indeks Pembangunan Manusia (IPM) di Indonesia tahun 2022
dipengaruhi oleh faktor persentase penduduk miskin per provinsi dan angka
partisipasi sekolah.
2. Analisis regresi logistik ordinal berhasil digunakan untuk memodelkan Indeks
Pembangunan Manusia (IPM) dimana persentase penduduk miskin per provinsi
dan angka partisipasi sekolah terbukti secara signifikan memberikan
pengaruh dengan tingkat ketepatan klasifikasi model sebesar 76,47%.
DAFTAR PUSTAKA

Badan Pusat Statistik (BPS). 2023. Indeks Pembangunan Manusia.


https://www.bps.go.id/. Diakses pada tanggal 10 Juni 2023.

Rahmadeni, & Yunita, V. 2019. Pemodelan Indeks Pembangunan Manusia di


Provinsi Riau dengan Menggunakan Regresi Logistik Ordinal. Jurnal
Sains Matematika dan Statistika. 5(1): 120-126.

Agresti, A. 2007. An Introduction to Categorical Data Analysis. 2nd Edition.


John Wiley & Sons, New Jersey.

Nurmalasari, R., Ispriyanti, D., & Sudarno. 2017. Analisis Faktor-Faktor Yang
Mempengaruhi Indeks Pembangunan Manusia (IPM) Menggunakan
Metode Regresi Logistik Ordinal dan Regresi Probit Ordinal (Studi Kasus
Kabupaten/Kota di Jawa Tengah Tahun 2014). Jurnal Gaussian. 6(1):
111-120.

Hosmer, D. W., Lemeshow, S. & Sturdivant, X. R. 2013. Applied Logistic


Regression 3rd Edition. John Wiley & Sons, New Jersey.

Pentury, T., Aulele, S. N., & Wattimena, R. 2016. Analisis Regresi Logistik
Ordinal (Studi kasus: Akreditasi SMA di Kota Ambon). Jurnal Ilmu
Matematika dan Terapan. 10(1): 55-60.

Budiman, M. A., & Cahyani, N. 2022. Pemodelan Regresi Logistik Ordinal Pada
Indeks Pembangunan Manusia (IPM) Di Jawa Timur Tahun 2020. Jurnal
Statistika dan Komputasi. 1(2): 64-73.

Sriliana, I. 2012. Analisis Regresi Ordinal Untuk Mengetahui Faktor-Faktor


Yang Mempengaruhi Kualitas Pelayanan Kesehatan Pada Komunitas
Latino. Jurnal Gradien. 8(2): 802-808.
31

Ghozali, I. 2018. Aplikasi Analisis Multivariate Dengan Program IBM SPSS


Edisi Sembilan. Badan Penerbit Universitas Diponegoro, Semarang.

Agustina, S., Agoestanto, A., & Hendikawati, P. 2017. Klasifikasi Tingkat


Kesejahteraan Keluarga Jawa Tengah Tahun 2015 Menggunakan Metode
Regresi Logistik Ordinal dan Support Vector Machine (SVM). UNNES
Journal of Mathematics. 6(1): 59-69.

Johnson, R. A., & Wichern, D. W. 2007. Applied Multivariate Statistical


Analysis. 6th Edition. Pearson Education, New Jersey.

Hosmer, D. W., & Lemeshow, S. 2000. Applied Logistic Regression. John


Wiley & Sons, New Jersey.

Fitriah, W. W., Mashuri, M., & Irhamah. 2012. Faktor-Faktor yang


Mempengaruhi Keparahan Korban Kecelakaan Lalu Lintas di Kota
Surabaya dengan Pendekatan Bagging Regresi Logistik Ordinal. Jurnal
Sains dan Seni ITS. 1(1): 253-258.

Agresti, A. 2013. Categorical Data Analysis. John Wiley & Sons, New Jersey.

Imaslihkah, S., Ratna, M., & Ratnasari, V. 2013. Analisis Regresi Logistik
Ordinal terhadap Faktor-faktor yang Mempengaruhi Predikat Kelulusan
Mahasiswa S1 di ITS Surabaya. Jurnal Sains dan Seni POMITS. 2(2):
117-182.

Hosmer, W. D & Lemeshow, S. 1989. Applied Logistic Regression. John Wiley


& Sons, New Jersey.

Supriyadi, E., Mariani, S., & Sugiman. 2017. Perbandingan Metode Partial
Least Square (PLS) dan Principal Component Regression (PCR) Untuk
Mengatasi Multikolinearitas Pada Model Regresi Linear Berganda.
UNNES Journal of Mathematics. 6(2): 118-128.

Sriningsih, M., Hatidja, D., & Prang, J. D. 2018. Penanganan Multikolinearitas


Dengan Menggunakan Analisis Regresi Komponen Utama Pada Kasus
Impor Beras Di Provinsi Sulawesi Utara. Jurnal Ilmiah Sains. 18(1):
19-24.
LAMPIRAN
Script Program R :

library(readxl)
library(nnet)
library(ordinal)
library(foreign)
library(MASS)
library(pscl)
library(zoo)
library(lmtest)
library(carData)
library(car)
library(rmarkdown)
library(generalhoslem)

data_kp=read_excel("D:/Data_KP.xlsx", sheet = "Sheet1")


str(data_kp)

data_kp$Y=as.ordered(data_kp$Y)
str(data_kp)
summary(data_kp)
var(data_kp)

#Membangun Model Pertama


model=polr(Y~X1+X2+X3, data_kp, Hess=TRUE)
summary(model)
vif(model)

#Kecocokan Model Pertama


pR2(model)
#Menghitung p-value
(coeftab<-coef(summary(model)))
p<-pnorm(abs(coeftab[,"t value"]),lower.tail = FALSE)*2
(coeftab<-cbind(coeftab,"p value"=p))

#Menghitung Manual Nilai Uji Wald


Value_X1= 0.0055
Value_X2= -0.3484
Value_X3= 0.1639
SE_X1= 0.0677
SE_X2= 0.1286
SE_X3= 0.0759

W1=(Value_X1/SE_X1)^2
W2=(Value_X2/SE_X2)^2
W3=(Value_X3/SE_X3)^2

Wald1=cbind(W1,W2,W3)
Wald1

pred=predict(model,data_kp,type = 'prob')
pred
print(pred,digits=3)

#Membangun Model Kedua


model2=polr(Y~X2+X3,data_kp,Hess=TRUE)
summary(model2)

#Kecocokan Model Kedua


pR2(model2)
#Menghitung p-value
(coeftab<-coef(summary(model2)))
p<-pnorm(abs(coeftab[,"t value"]),lower.tail = FALSE)*2
(coeftab<-cbind(coeftab,"p value"=p))

#Menghitung Manual Nilai Uji Wald


Value_X21 = -0.3473
Value_X31 =0.1639

SE_X21 = 0.1270
SE_X31 = 0.0761

W21 = (Value_X21/SE_X21)^2
W31 = (Value_X31/SE_X31)^2

Wald2=cbind(W21,W31)
Wald2

#John-Lemeshow Goodness of Fit


logitgof(data_kp$Y, fitted(model2), g=6, ord=TRUE)

#Ketepatan Klasifikasi
pred=predict(model2,data_kp)
pred

(tab=table(pred,data_kp$Y))

(mis_klas=1-sum(diag(tab))/sum(tab))

#Odds Ratio
(OR=exp(coef(model2)))

Anda mungkin juga menyukai