Anda di halaman 1dari 15

Model Regresi Linier Berganda pada Indeks Pembangunan Manusia

di Provinsi Jawa Barat Tahun 2022

Disusun oleh : Kelompok 6


1. Nanda Putri Cintari (G1401201024)
2. Hanung Safrizal (G1401201050)
3. Billy (G1501231034)
4. Uswatun Hasanah (G1501231040)
5. Silvia Tri Wahyuni (G1501231050)

PENDAHULUAN

1. LATAR BELAKANG

Indeks Pembangunan Manusia merupakan suatu indeks yang mencakup tiga bidang
pembangunan manusia yang dianggap sangat mendasar yang dilihat dari kualitas fisik dan
non fisik penduduk. Indeks Pembangunan Manusia (IPM) adalah pengukuran perbandingan
dari harapan hidup, melek huruf, pendidikan dan standar hidup di suatu negara.
Untuk melihat sejauh mana keberhasilan pembangunan dan kesejahteraan manusia, United
Nations Development Programme (UNDP) telah menerbitkan suatu indikator yaitu Indeks
Pembangunan Manusia (IPM) untuk mengukur kesuksesan pembangunan dan kesejahteraan
suatu Negara. Konsep Indeks Pembangunan Manusia menurut UNDP dan Badan Pusat
Statistik (BPS,2023) mengacu pada pengukuran pencapaian pembangunan manusia berbasis
sejumlah komponen dasar kualitas hidup:
1. Angka harapan hidup untuk mengukur pencapaian di bidang Kesehatan.
2. Angka melek huruf dan rata–rata lama sekolah untuk mengukur pencapaian di bidang
Pendidikan.
3. Standar kehidupan yang layak yang diindikasikan dengan logaritma normal dari produk
domestik regional bruto per kapita penduduk dalam prioritas daya beli.
Keberhasilan pembangunan khususnya pembangunan manusia dapat dinilai secara parsial
dengan melihat seberapa besar permasalahan yang paling mendasar di masyarakat tersebut
dapat teratasi. Permasalahan – permasalahan tersebut diantaranya adalah kemiskinan,
pengangguran, buta huruf, ketahanan pangan, usia harapan hidup, dan penegakan demokrasi.
Indeks Pembangunan Manusia menjelaskan bagaimana penduduk dapat mengakses hasil
pembangunan dalam memperoleh pendapatan, kesehatan, pendidikan, dan sebagainya.
Namun persoalannya adalah pencapaian pembangunan manusia secara parsial sangat
bervariasi dimana beberapa aspek pembangunan tertentu berhasil dan beberapa aspek
pembangunan lainnya gagal.
Jawa Barat merupakan salah satu provinsi di Indonesia yang terdiri dari 27
Kabupaten/Kota. IPM Jawa Barat setiap tahun semakin meningkat, berturut-turut mulai tahun
2019 sampai tahun 2021 sebesar 72,03; 72,09 dan 72,45 (BPS, 2021). Ini berarti bahwa
upaya pembangunan manusia terus diupayakan guna meningkatkan kualitas dan
kesejahteraan penduduk di Jawa Barat. Walaupun terus meningkat setiap tahunnya, peringkat
IPM Jawa Barat secara nasional menempati peringkat ke-9 (BPS, 2021). Peringkat ini
termasuk dalam kategori sedang apabila mengingat Jawa Barat sebagai pusat pertumbuhan
ekonomi Pulau Jawa. Hal tersebut menunjukkan bahwa faktor yang mempengaruhi tinggi
rendahnya IPM tidak bisa ditentukan dengan melihat satu faktor saja. Oleh karena itu perlu
dilakukan analisis untuk melihat faktor apa saja yang berpengaruh terhadap Indeks
Pembangunan Manusia di Jawa Barat.

2. PERMASALAHAN

1. Bagaimana analisis dalam eksplorasi data peubah terikat Indeks Pembangunan


Manusia dan peubah bebas berupa usia harapan hidup, harapan lama sekolah, rata-rata
lama sekolah, pengeluaran perkapita, dan kepadatan penduduk ?
2. Apakah terdapat hubungan yang linear antara tiap peubah?
3. Bagaimana model regresi dari data Indeks pembangunan Manusia?
4. Apakah terjadi pelanggaran asumsi dalam model regresi yang telah dibuat?
5. Apakah terdapat isu multikolinearitas, pencilan, atau titik pengungkit? jika iya,
bagaimana cara mengatasi isu tersebut?
6. Seperti apa model regresi terbaik dan seberapa baik model regresi yang telah
diperoleh?
7. Bagaimana hasil dari inferensi terhadap model terbaik yang telah diperoleh?
8. Bagaimana interpretasi dari hasil yang diperoleh beserta insights yang dapat diperoleh
dari model tersebut?

3. TUJUAN

1. Untuk mendapatkan informasi mengenai analisis dalam eksplorasi data peubah terikat
Indeks Pembangunan Manusia dan peubah bebas berupa usia harapan hidup, harapan
lama sekolah, rata-rata lama sekolah, pengeluaran perkapita, dan kepadatan penduduk.
2. Untuk mendapatkan informasi mengenai hubungan yang linear antara tiap peubah.
3. Untuk mendapatkan informasi mengenai model regresi dari data Indeks pembangunan
Manusia.
4. Untuk mendapatkan informasi mengenai ada atau tidaknya pelanggaran asumsi dalam
model regresi yang telah dibuat.
5. Untuk mendapatkan informasi mengenai isu multikolinearitas, pencilan, atau titik
pengungkit.
6. Untuk mendapatkan informasi mengenai model regresi terbaik dan seberapa baik model
regresi yang telah diperoleh.
7. Untuk mendapatkan informasi mengenai hasil dari inferensi terhadap model terbaik
yang telah diperoleh.
8. Untuk mendapatkan informasi mengenai interpretasi dari hasil yang diperoleh beserta
insights yang dapat diperoleh dari model tersebut.
METODE

1. Data

Penelitian ini menggunakan data Indeks Pembangunan Manusia (IPM) dan


beberapa faktor yang mempengaruhinya di Jawa Barat mencakup 27 kabupaten/kota tahun
2022. Data ini merupakan data sekunder yang diperoleh dari satu sumber yaitu Badan
Pusat Statistik (BPS) Jawa Barat tahun 2022. Berikut adalah peubah respon dan peubah
penjelas yang digunakan.

Tabel 1. Peubah yang digunakan


Peubah Definisi
IPM (Indeks Indeks Pembangunan Manusia merupakan indeks yang
Pembangunan mengukur pencapaian pembangunan sosio-ekonomi suatu
Manusia negara
UHH (Usia Harapan Usia harapan hidup merupakan banyaknya tahun yang ditempuh
Hidup) penduduk yang masih hidup sampai umur tertentu
HLS (Harapan Lama Harapan Lama Sekolah didefinisikan sebagai lamanya sekolah
Sekolah) yang diharapkan akan dirasakan oleh anak pada umur tertentu
di masa mendatang
RLS (Rata-Rata Lama Rata-rata Lama Sekolah adalah Rata-rata jumlah tahun yang
Sekolah) dihabiskan oleh penduduk berusia 15 tahun ke atas untuk
menempuh semua jenis pendidikan yang pernah dijalani.
PPK (Pengeluaran Pengeluaran rata-rata per kapita adalah biaya yang dikeluarkan
Perkapita) untuk konsumsi semua anggota rumah tangga selama sebulan
baik yang berasal dari pembelian, pemberian maupun produksi
sendiri dibagi dengan banyaknya anggota rumah tangga dalam
rumah tangga tersebut
KP (Kepadatan Kepadatan penduduk adalah banyaknya penduduk per satuan
Penduduk) luas.Kegunaannya adalah sebagai dasar kebijakan pemerataan
penduduk dalam program transmigrasi.

2. Prosedur
Prosedur analisis yang digunakan dalam penelitian ini sebagai berikut :
1. Melakukan analisis dalam eksplorasi data peubah terikat Indeks Pembangunan
Manusia dan peubah bebas berupa usia harapan hidup, harapan lama sekolah, rata-rata
lama sekolah, pengeluaran perkapita, dan kepadatan penduduk.
2. Melakukan pengujian untuk melihat hubungan yang linear antara tiap peubah
3. Memperoleh model regresi dari data Indeks pembangunan Manusia
4. Menguji apakah terdapat pelanggaran asumsi dalam model regresi yang telah dibuat
5. Menguji apakah terdapat isu multikolinearitas, pencilan, atau titik pengungkit
6. Melakukan perbaikan model untuk mengatasi isu multikolinearitas, pencilan, atau titik
pengungkit
7. Memperoleh model regresi terbaik dan menganalisis model regresi yang telah
diperoleh
8. Melakukan analisis untuk memperoleh hasil dari inferensi terhadap model terbaik
9. Melakukan interpretasi dari hasil yang diperoleh beserta insights yang diperoleh dari
model tersebut

HASIL DAN PEMBAHASAN

1. Eksplorasi Data
Indeks Pembangunan Manusia atau IPM Jawa Barat tahun 2022 sebesar 73,12
berada pada status tinggi. IPM Jawa Barat mengalami peningkatan setiap tahunnya.
Wilayah Jawa Barat terdiri dari 27 kabupaten/kota dengan nilai IPM yang berbeda.
Berikut nilai Indeks Pembangunan Manusia berdasarkan kabupaten/kota di Jawa Barat
pada tahun 2022.

Gambar 1. Indeks pembangunan manusia berdasarkan kabupaten/kota di Jawa Barat 2022

Berdasarkan Gambar 1, terlihat bahwa Kota Bandung memiliki IPM tertinggi


sebesar 82,5%, diikuti Kota Bekasi dan Kota Depok. Kabupaten Cianjur memiliki IPM
terendah sebesar 65,94%. Nilai IPM baik kota maupun kabupaten tidak terbeda terlalu
jauh. Namun, IPM di kota-kota Jawa Barat memiliki nilai lebih tinggi dibandingkan di
kabupaten.

Tabel 2. Statistik deskriptif peubah yang digunakan


Peubah Nilai Kuartil Nilai Rataan Kuartil Nilai
Minimum Pertama Tengah Ketiga Maksimum
IPM 65.94 69.03 71.56 72.61 75.31 82.5
UHH 69.95 71.75 72.63 72.72 74.02 75.48
HLS 11.78 12.21 12.59 12.84 13.45 14.28
RLS 6.83 7.78 8.22 8.785 9.835 11.47
PPK 8177 9524 10791 11143 11992 17639
KP 383 814.5 1439 3824 5682.5 14776
Berdasarkan Tabel terlihat statistik deskriptif dari peubah-peubah yang
digunakan baik peubah respon maupun penjelas. Nilai-nilai tersebut memiliki sebaran data
yang beragam dikarenakan perbedaan satuan antar peubah yang digunakan. Berikut
disajikan boxplot dan histogram IPM Jawa Barat tahun 2022.

(a) (b)
Gambar 2. Sebaran IPM Jawa Barat 2022

Pada Boxplot Indeks Pembangunan Manusia Provinsi Jawa Barat tahun 2022
menunjukkan bahwa data cenderung condong ke arah kiri karena jarak antara Q1 dan Q2
lebih panjang dibandingkan jarak antara Q2 dan Q3 sehingga data lebih terpusat di sebelah
kanan serta tidak ada outlier yang ditemukan dalam data. Berdasarkan Histogram diatas,
diperhatikan bahwa Indeks Pembangunan Manusia Provinsi Jawa Barat tahun 2022 dapat
diasumsikan tidak mengikuti sebaran normal. Hal ini terlihat secara eksploratif dari
histogram yang cenderung menggambarkan sebaran data yang tidak simetris.

2. Linearitas

Hubungan linier atau pola hubungan antar peubah respon dan penjelas yang
digunakan dalam penelitian digambarkan melalui scatter plot pada Gambar 3 dan nilai
korelasi Pearson pada Tabel 3. Hubungan peubah yang positif menunjukkan kenaikan dan
penurunan nilai antar peubah akan menunjukkan arah yang bersesuaian. Sebaliknya nilai
korelasi yang negatif menunjukkan bahwa kenaikan satu peubah akan diiringi penurunan
peubah yang lain.

Gambar 3. Hubungan linier atau pola hubungan antar peubah respon dan penjelas
Berdasarkan Gambar 3, terlihat bahwa semua peubah memiliki hubungan linier karena
memiliki garis lurus. Selain itu, semua peubah memiliki hubungan positif. Hubungan positif
antara IPM dengan kelima peubah penjelas, yaitu usia harapan hidup, harapan lama sekolah,
rata-rata lama sekolah, pengeluaran perkapita dan kepadatan penduduk. Hal ini berarti bahwa,
semakin tinggi nilai kelima peubah tersebut maka nilai IPM akan semakin tinggi. Korelasi yang
tinggi antara peubah kelima peubah penjelas dengan IPM tentu menunjukkan hubungan yang
sangat erat atau kuat antar dua peubah ini.

Tabel 3. Nilai korelasi peubah penjelas


Peubah Nilai Korelasi
UHH 0.837
HLS 0.829
RLS 0.948
PPK 0.919
KP 0.907

3. Model Regresi Linier Berganda


Setelah melakukan eksplorasi data, dilakukan pendugaan model regresi terhadap
model penuh dikarenakan peubah yang digunakan tersebut diasumsikan berpengaruh
terhadap IPM. Maka dari itu, peubah-peubah tersebut digunakan untuk diidentifikasi
apakah akan mempengaruhi IPM di Jawa Barat dengan analisis regresi berganda.

Tabel 4. Summary pendugaan model regresi penuh


Coefficients:
Estimate Std. Error t value Pr (>|t|)
Intercept 3.139e+00 4.413e+02 0.711 0.4847
UHH 4.858e-01 6.255e-02 7.767 1.32e-07 ***
HLS 9.765e-01 1.166e-01 8.375 3.92e-08 ***
RLS -1.425e+00 1.073e-01 13.274 1.11e-11 ***
PPK 1.425e+00 4.221e-05 19.835 4.43e-15 ***
KP -6.174e-05 -6.174e-05 -1.983 0.0606
----
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error : 0.2667 on 21 degrees of freedom
Multiple R-Square : 0.9974, Adjusted R-Square : 0.9968
F-statistics: 1625 on 5 and 21 DF, p-value : <2.2e-16
* Signifikan taraf nyata α=5%

IPM = 3.139e+00 + 4.858e-01 UHH + 9.765e-01 HLS - 1.425e+00 RLS + 1.425e+00 PPK
- 6.174e-05 KP
Berdasarkan Tabel 4 terlihat bahwa nilai­ p-value sebesar <2.2e-16 yang berarti
nilai p-value lebih kecil dari taraf nyata (alpha) 0.05 maka belum terdapat cukup bukti
untuk menyatakan tiap-tiap peubah penjelas tidak berpengaruh signifikan secara simultan
terhadap peubah respon. Dengan kata lain, terdapat minimal satu peubah yang
berpengaruh terhadap peubah respon. Selain itu, diduga terdapat 4 peubah yang
berpengaruh secara signifikan pada taraf nyata 5%. Hal ini dapat dilihat dari nilai p-value
(Pr (>|t|)) pada peubah UHH, HLS, RLS, dan PPK kurang dari taraf nyata α=5%. Nilai
R-Square yakni ukuran kekuatan prediksi dari model sebesar 0.9974 artinya 99,74%
keragaman dari IPM dapat dijelaskan oleh peubah yang mempengaruhinya, sedangkan
keragaman yang lain dijelaskan oleh peubah lain yang tidak ada di dalam model.

Tabel 5. Summary pendugaan model regresi tanpa kepadatan penduduk


Coefficients:
Estimate Std. Error t value Pr (>|t|)
Intercept 4.038e+00 4.673e+02 0.864 0.397
UHH 5.929e-01 6.648e-02 7.415 2.03e-07 ***
HLS 9.705e-01 1.241e-01 7.822 8.57e-08 ***
RLS -1.289e+00 8.825e-02 14.612 8.32e-13 ***
PPK 8.023e-04 4.083e-05 19.651 1.92e-15 ***
----
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error : 0.2839 on 22 degrees of freedom
Multiple R-Square : 0.9969, Adjusted R-Square : 0.9964
F-statistics: 1791 on 4 and 22 DF, p-value : <2.2e-16
* Signifikan taraf nyata α=5%

IPM = 4.038e+00 + 5.929e-01 UHH + 9.705e-01 HLS - 1.289e+00 RLS + 8.023e-04 PPK

Berdasarkan Tabel 5 terlihat bahwa nilai­ p-value sebesar <2.2e-16 yang berarti
nilai p-value lebih kecil dari taraf nyata (alpha) 0.05 maka belum terdapat cukup bukti
untuk menyatakan tiap-tiap peubah penjelas tidak berpengaruh signifikan secara simultan
terhadap peubah respon. Dengan kata lain, terdapat minimal satu peubah yang
berpengaruh terhadap peubah respon. Selain itu, diduga terdapat semua peubah yang
berpengaruh secara signifikan pada taraf nyata 5%. Hal ini dapat dilihat dari nilai p-value
(Pr (>|t|)) pada peubah UHH, HLS, RLS, dan PPK kurang dari taraf nyata α=5%. Nilai
R-Square yakni ukuran kekuatan prediksi dari model sebesar 0.9969 artinya 99,69%
keragaman dari IPM dapat dijelaskan oleh peubah yang mempengaruhinya, sedangkan
keragaman yang lain dijelaskan oleh peubah lain yang tidak ada di dalam model.
4. ASUMSI-ASUMSI

1) Nilai harapan sisaan sama dengan nol


H₀ : Nilai harapan sisaan sama dengan nol
H₁ : Nilai harapan sisaan tidak sama dengan nol

Gambar 4. Residual dengan fitted value

Berdasarkan perhitungan menggunakan software R didapatkan hasil dari uji t-test


yaitu nilai­p-value sebesar 1 yang menunjukkan nilai p-value > 𝛼 = 0.05 maka Tak Tolak
H₀ terdapat cukup bukti untuk menyatakan bahwa nilai harapan sisaan sama dengan nol.
Gambar 4. secara eksploratif terlihat amatan sisaan berada di sekitar nol sehingga dapat
disimpulkan bahwa terindikasi nilai harapan sisaan sama dengan nol.

2) Ragam sisaan homogen


Hipotesis pengujian:
H₀ : Ragam homogen
H₁ : Ragam tidak homogen
Berdasarkan hasil uji Breusch Pagan, didapatkan nilai p-value adalah sebesar
0.4687. Dengan demikian, nilai p-value > 𝛼 = 0.05, yang berarti Terima H₀. Sehingga
terdapat cukup bukti untuk mengatakan bahwa tidak terjadi pelanggaran asumsi
homogenitas ragam.

3) Sisaan saling bebas atau tidak terdapat autokorelasi sisaan


H₀ : Sisaan saling bebas atau tidak terdapat autokorelasi sisaan
H₁ : Sisaan tidak saling bebas atau terdapat autokorelasi sisaan

Gambar 5. Sebaran Amatan Acak


Berdasarkan perhitungan menggunakan software R didapatkan hasil dari uji
durbin watson yaitu nilai­p-value sebesar 0.1949 yang menunjukkan nilai p-value > 𝛼 =
0.05 maka Tak Tolak H₀ terdapat cukup bukti untuk menyatakan bahwa sisaan saling
bebas atau tidak terdapat autokorelasi sisaan. Gambar 5. secara eksploratif terlihat bahwa
sebaran amatan acak atau tidak berpola sehingga dapat disimpulkan bahwa terindikasi
sisaan saling bebas atau tidak terdapat autokorelasi sisaan.

4) Kenormalan sisaan
Hipotesis pengujian:
H₀ : Sisaan berdistribusi normal
H₁ : Sisaan tidak berdistribusi normal

Gambar 6. Kenormalan Sisaan

Berdasarkan perhitungan menggunakan software R didapatkan hasil dari uji


Kolmogorov-Smirnov yaitu nilai­p-value sebesar 0.1673 yang menunjukkan nilai p-value
> 𝛼 = 0.05 maka Tak Tolak H₀ terdapat cukup bukti untuk menyatakan bahwa sisaan
berdistribusi normal. Gambar 5. secara eksploratif terlihat bahwa sebaran sisaan berada
di sekitar garis normal sehingga dapat disimpulkan bahwa terindikasi sisaan berdistribusi
normal.

5. ISU MULTIKOLINEARITAS, PENCILAN ATAU TITIK PENGUNGKIT

1) Isu Multikolinearitas
Multikolinieritas merupakan adanya hubungan linier antar beberapa atau semua
peubah penjelas dari model regresi berganda. Terdapat banyak metode untuk mendeteksi
multikolinieritas, salah satunya melihat nilai Variance Inflation Factor (VIF). Nilai VIF
=1 menunjukkan bahwa peubah bebas tidak berkorelasi satu sama lain. Jika nilai VIF 1<
VIF < 5, berarti peubah-peubah bebas tersebut berkorelasi sedang satu sama lain. Nilai
VIF yang berada di antara rentang 5 hingga 10 berarti antar peubah bebas yang
berkorelasi tinggi. Jika VIF ≥ 5 sampai 10 maka akan terjadi multikolinearitas antar
peubah bebas dalam model regresi dan VIF > 10 menunjukkan koefisien regresi
diestimasi lemah dengan adanya multikolinearitas. (Belsley, 1991)
Tabel 6. Nilai Multikolinearitas
Peubah VIF
UHH 2.7874
HLS 3.0579
RLS 4.874
PPK 3.5638
KP 7.3259

Berdasarkan Tabel 6. dilihat bahwa peubah Kepadatan Penduduk memiliki


nilai VIF lebih besar dari 5. Hal ini mengindikasikan bahwa peubah tersebut memiliki
multikolinearitas dengan efek cukup besar. Oleh karena itu, perlu dilakukan penanganan
dengan menghapus peubah yang memiliki nilai VIF besar.

Tabel 7. Nilai Multikolinearitas


Peubah VIF
UHH 2.7782
HLS 3.05589
RLS 4.846
PPK 2.9416

Berdasarkan Tabel 7. dilihat bahwa peubah Usia Harapan Hidup, Harapan Lama
Sekolah, Rata-rata lama sekolah, dan Pendapatan Perkapita memiliki nilai VIF kurang
dari 5. Hal ini mengindikasikan bahwa peubah tersebut memiliki korelasi sedang satu
sama lain.

2) Pencilan atau Titik Pengungkit


Outlier (pencilan) menggambarkan ketidakkonsistenan suatu observasi dengan
observasi lainnya karena nilainya terletak sangat jauh dengan kelompok data. Terdapat
dua jenis pencilan, yaitu pencilan pada Y dan pencilan pada X (high leverage point).
Pencilan yang merupakan high leverage point (disebut juga titik pengungkit) dapat
mengganggu model sehingga perlu ditangani.

Gambar 7. Outlier dan Diagnosis Leverage


Berdasarkan Gambar 8 didapatkan hasil bahwa terdapat data outlier yakni
observasi ke-5 dan ke-21, leverage yakni observasi ke-7 dan ke-21, dan outlier dan
leverage yakni observasi ke 21.

6. PENANGANAN TITIK PENGUNGKIT

Pengujian pencilan dan titik pengungkit menunjukkan terdapat beberapa pencilan


dan titik pengungkit. Oleh karena itu, perlu dilakukan pengujian ulang dengan
mengeluarkan data observasi yang merupakan pencilan, yakni data observasi 5 dan 21,
titik pengungkit, yakni data observasi ke 7 dan observasi ke-21, serta data observasi
pencilan dan titik pengungkit, yakni observasi 21 yang selanjutnya dilakukan pengujian
ulang dan didapat hasil sebagai berikut:

Tabel 8. Summary pendugaan model regresi tanpa observasi outlier ( 5 dan 21)
Coefficients:
Estimate Std. Error t value Pr (>|t|)
Intercept 4.329e+00 3.863e+02 1.120 0.276
UHH 4.821e-01 5.536e-02 8.703 3.07e-08 ***
HLS 1.000e+00 1.056e-01 9.468 7.87e-09 ***
RLS 1.259e+00 7.643e-02 16.467 4.25e-13 ***
PPK 8.412e-04 4.173e-05 20.158 9.30e-15 ***
----
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.2346 on 20 degrees of freedom
Multiple R-squared: 0.9976, Adjusted R-squared: 0.9971
F-statistic: 2056 on 4 and 20 DF, p-value: < 2.2e-16
* Signifikan taraf nyata α=5%

IPM = 4.329e+00 + 4.821e-01 UHH + 1.000e+00 HLS + 1.259e+00 RLS + 8.412e-04 PPK

Berdasarkan Tabel 8 terlihat bahwa nilai­ p-value F-Statistics sebesar <2.2e-16


yang berarti nilai p-value lebih kecil dari taraf nyata (alpha) 0.05 maka belum terdapat
cukup bukti untuk menyatakan tiap-tiap peubah penjelas tidak berpengaruh signifikan
secara simultan terhadap peubah respon. Dengan kata lain, terdapat minimal satu peubah
yang berpengaruh terhadap peubah respon. Selain itu, diduga terdapat semua peubah yang
berpengaruh secara signifikan pada taraf nyata 5%. Hal ini dapat dilihat dari nilai p-value
(Pr (>|t|)) pada peubah UHH, HLS, RLS, dan PPK kurang dari taraf nyata α=5%. Nilai
R-Square yakni ukuran kekuatan prediksi dari model sebesar 0.9976 artinya 99,76%
keragaman dari IPM dapat dijelaskan oleh peubah yang mempengaruhinya, sedangkan
keragaman yang lain dijelaskan oleh peubah lain yang tidak ada di dalam model.
Tabel 9. Summary pendugaan model regresi tanpa observasi leverage ( 7 dan 21)
Coefficients:
Estimate Std. Error t value Pr (>|t|)
Intercept 3.885e+00 4.888e+02 0.795 0.436
UHH 4.787e-01 6.223e-02 7.692 2.13e-07 ***
HLS 1.062e-01 1.997e-01 5.317 3.33e-05 ***
RLS 1.219e+00 1.139e-02 10.698 1.01e-09 ***
PPK 8.631e-04 4.402e-05 19.607 1.58e-14 ***
----
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.2548 on 20 degrees of freedom
Multiple R-squared: 0.9973, Adjusted R-squared: 0.9967
F-statistic: 1833 on 4 and 20 DF, p-value: < 2.2e-16
* Signifikan taraf nyata α=5%

IPM = 3.885e+00 + 4.787e-01 UHH + 1.062e-01 HLS + 1.219e+00 RLS + 8.631e-04 PPK

Berdasarkan Tabel 9 terlihat bahwa nilai­ p-value F-statistics sebesar <2.2e-16


yang berarti nilai p-value lebih kecil dari taraf nyata (alpha) 0.05 maka belum terdapat
cukup bukti untuk menyatakan tiap-tiap peubah penjelas tidak berpengaruh signifikan
secara simultan terhadap peubah respon. Dengan kata lain, terdapat minimal satu peubah
yang berpengaruh terhadap peubah respon. Selain itu, diduga terdapat semua peubah yang
berpengaruh secara signifikan pada taraf nyata 5%. Hal ini dapat dilihat dari nilai p-value
(Pr (>|t|)) pada peubah UHH, HLS, RLS, dan PPK kurang dari taraf nyata α=5%. Nilai
R-Square yakni ukuran kekuatan prediksi dari model sebesar 0.9973 artinya 99,73%
keragaman dari IPM dapat dijelaskan oleh peubah yang mempengaruhinya, sedangkan
keragaman yang lain dijelaskan oleh peubah lain yang tidak ada di dalam model.

Tabel 10. Summary pendugaan model regresi tanpa observasi outlier dan leverage
( observasi 21)
Coefficients:
Estimate Std. Error t value Pr (>|t|)
Intercept 4.374e+00 4.098e+00 1.067 0.298
UHH 4.755e-01 5.861e-02 8.112 6.58e-08 ***
HLS 1.030e+00 1.109e-01 9.289 6.94e-09 ***
RLS 1.234e+00 7.991e-02 15.442 6.13e-13 ***
PPK 8.646e-04 4.231e-05 20.436 2.43e-15 ***
----
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.2489 on 21 degrees of freedom
Multiple R-squared: 0.9973, Adjusted R-squared: 0.9968
F-statistic: 1924 on 4 and 21 DF, p-value: < 2.2e-16
* Signifikan taraf nyata α=5%

IPM = 4.374e+00 + 4.755e-01 UHH + 1.030e+00 HLS + 1.234e+00 RLS + 8.646e-04 PPK

Berdasarkan Tabel 10 terlihat bahwa nilai­p-value F-Statistics sebesar <2.2e-16 yang


berarti nilai p-value lebih kecil dari taraf nyata (alpha) 0.05 maka belum terdapat cukup
bukti untuk menyatakan tiap-tiap peubah penjelas tidak berpengaruh signifikan secara
simultan terhadap peubah respon. Dengan kata lain, terdapat minimal satu peubah yang
berpengaruh terhadap peubah respon. Selain itu, diduga terdapat semua peubah yang
berpengaruh secara signifikan pada taraf nyata 5%. Hal ini dapat dilihat dari nilai p-value
(Pr (>|t|)) pada peubah UHH, HLS, RLS, dan PPK kurang dari taraf nyata α=5%. Nilai
R-Square yakni ukuran kekuatan prediksi dari model sebesar 0.9973 artinya 99,73%
keragaman dari IPM dapat dijelaskan oleh peubah yang mempengaruhinya, sedangkan
keragaman yang lain dijelaskan oleh peubah lain yang tidak ada di dalam model.

Tabel 11. Summary pendugaan model regresi tanpa observasi observasi, outlier, dan
outlier dan leverage
( observasi 5,7, dan 21)
Coefficients:
Estimate Std. Error t value Pr (>|t|)
Intercept 4.027e+00 4.617e+00 0.872 0.394
UHH 4.841e-01 5.885e-02 8.226 1.11e-07 ***
HLS 1.020e+00 1.899e-01 5.371 3.49e-05 ***
RLS 1.249e+00 1.088e-01 11.477 5.48e-10 ***
PPK 1.249e+00 4.335e-05 19.385 5.61e-14 ***
----
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.2406 on 19 degrees of freedom
Multiple R-squared: 0.9976, Adjusted R-squared: 0.9971
F-statistic: 1950 on 4 and 19 DF, p-value: < 2.2e-16
* Signifikan taraf nyata α=5%

IPM = 4.027e+00 + 4.841e-01 UHH + 1.020e+00HLS + 1.249e+00 RLS + 1.249e+00 PPK

Berdasarkan Tabel 11 terlihat bahwa nilai­p-value F-Statistics sebesar <2.2e-16 yang


berarti nilai p-value lebih kecil dari taraf nyata (alpha) 0.05 maka belum terdapat cukup
bukti untuk menyatakan tiap-tiap peubah penjelas tidak berpengaruh signifikan secara
simultan terhadap peubah respon. Dengan kata lain, terdapat minimal satu peubah yang
berpengaruh terhadap peubah respon. Selain itu, diduga terdapat semua peubah yang
berpengaruh secara signifikan pada taraf nyata 5%. Hal ini dapat dilihat dari nilai p-value
(Pr (>|t|)) pada peubah UHH, HLS, RLS, dan PPK kurang dari taraf nyata α=5%. Nilai
R-Square yakni ukuran kekuatan prediksi dari model sebesar 0.9976 artinya 99,76%
keragaman dari IPM dapat dijelaskan oleh peubah yang mempengaruhinya, sedangkan
keragaman yang lain dijelaskan oleh peubah lain yang tidak ada di dalam model.

7. MODEL REGRESI TERBAIK

Berdasarkan Perhitungan sebelumnya, dapat dilihat perbandingan nilai R-Square sebagai


berikut :

Tabel 12. Perbandingan nilai R-Square


R-Square
Seluruh Observasi 0.9969
Tanpa observasi Outlier (Observasi 5 dan 21) 0.9976
Tanpa observasi Leverage(Observasi 7 dan 21) 0.9973
Tanpa observasi Outlier dan Leverage (Observasi 21) 0.9973
Tanpa observasi Outlier, Leverage, dan Outlier dan 0.9976
Leverage (Observasi 5, 7, dan 21)

Berdasarkan Tabel 12 yang membandingkan nilai R-Square untuk berbagai skenario


regresi, terlihat bahwa nilai R-Square antara model-model tersebut tidak memiliki perbedaan
yang signifikan. Nilai R-Square untuk "Seluruh Observasi" (0.9969), "Tanpa observasi
Outlier" (0.9976), "Tanpa observasi Leverage" (0.9973), "Tanpa observasi Outlier dan
Leverage" (0.9973), dan "Tanpa observasi Outlier, Leverage, dan Outlier dan Leverage"
(0.9976) hanya memiliki selisih kecil. Hal ini mengindikasikan bahwa model-model tersebut
secara keseluruhan mampu menjelaskan variasi dalam data dengan baik, dan titik outlier dan
leverage tidak secara signifikan mengganggu performa model.
Dengan demikian, dapat disimpulkan bahwa model dengan semua observasi (tanpa
penghapusan outlier atau leverage) menjadi pilihan yang baik karena memiliki nilai R-Square
yang cukup tinggi dan tidak ada kebutuhan untuk menghapus observasi outlier atau leverage
seperti yang telah disebutkan, karena tidak secara signifikan mengganggu hasil analisis.
Pemilihan model ini dapat meningkatkan generalitas dan tidak mempengaruhi secara negatif
interpretasi regresi.
KESIMPULAN

Berdasarkan analisis yang telah dilakukan, maka didapatkan beberapa kesimpulan sebagai
berikut:
1. Indeks Pembangunan Manusia (IPM) di Indonesia cenderung mengalami kenaikan dari
tahun ke tahun. Pada 2021, IPM Jawa Barat menempati urutan ke-9 secara nasional.
Kota Bandung memiliki IPM tertinggi sebesar 82,5%, diikuti Kota Bekasi dan Kota
Depok. Kabupaten Cianjur memiliki IPM terendah sebesar 65,94%.
2. Semua peubah penjelas memiliki hubungan linier positif yang kuat dengan peubah IPM.
Namun, hanya peubah Usia Harapan Hidup, Harapan Lama Sekolah, Rata-Rata Lama
Sekolah, dan Pengeluaran Perkapita. Peubah Kepadatan Penduduk tidak dipilih karena
tidak berpengaruh signifikan terhadap peubah IPM.
3. Pada model yang dipilih tidak terdapat pelanggaran asumsi. Namun, model memiliki
multikolinieritas dengan efek cukup besar, outlier dan titik leverage. Salah satu cara yang
dapat dilakukan yaitu dengan membuang peubah dan amatan yang terindikasi
multikolinieritas, outlier dan titik leverage.
4. Model dengan semua observasi menjadi pilihan yang baik karena memiliki nilai
R-Square yang tinggi. Model dengan penghapusan observasi outlier atau leverage tidak
dipilih karena tidak berpengaruh secara signifikan terhadap hasil analisis. Didapatkan
persamaan model regresi:

IPM = 4.038e+00 + 5.929e-01 UHH + 9.705e-01 HLS - 1.289e+00 RLS + 8.023e-04 PPK

5. Berdasarkan hasil perhitungan diperoleh nilai Adjusted R-Square sebesar 0.9969 yang
menunjukan bahwa 99.7% keragaman dari IPM dapat dijelaskan oleh peubah yang
mempengaruhinya, sedangkan keragaman yang lain dijelaskan oleh peubah lain yang
tidak ada di dalam model.
6. Berdasarkan persamaan model regresi tersebut, dapat dinyatakan bahwa Usia Harapan
Hidup, Harapan Lama Sekolah, Rata-Rata Lama Sekolah, dan Pengeluaran Perkapita
berpengaruh signifikan positif terhadap Indeks Pembangunan Manusia di Jawa Barat
2022.

DAFTAR PUSTAKA

Belsley, D.A., Conditioning diagnostics: Collinearity and weak data in regression, John
Wiley & Sons, Inc., New York, 1991

Anda mungkin juga menyukai