Anda di halaman 1dari 10

Machine Translated by Google Tersedia online di www.sciencedirect.

com

Ilmu Komputer Procedia 00 (2020) 000–000


ScienceDirect www.elsevier.com/locate/procedia
Tersedia online di www.sciencedirect.com
Procedia Computer Science 00 (2020) 000–000
www.elsevier.com/locate/procedia
ScienceDirect
Ilmu Komputer Procedia 176 (2020) 3418–3427
Konferensi Internasional ke-24 tentang Informasi & Rekayasa Berbasis Pengetahuan dan Cerdas
Sistem
Konferensi Internasional ke-24 tentang Informasi & Rekayasa Berbasis Pengetahuan dan Cerdas
Penerapan model regresiSistem logistik untuk menilai
keputusan keuangan rumah tangga terkait utang
Penerapan model regresi logistik untuk menilai
Agnieszka Strzeleckakeuangan
keputusan a *, Agnieszka Kurdyÿ-Kujawskaa
rumah , Danuta
tangga terkait Zawadzkaa
utang
A
Universitas Teknologi Koszalin, Fakultas Ilmu Ekonomi, Departemen Keuangan, Kwiatkowskiego 6e, 75-343 Koszalin, Polandia
Agnieszka Strzelecka a *, Agnieszka Kurdyÿ-Kujawskaa , Danuta Zawadzkaa
A
Universitas Teknologi Koszalin, Fakultas Ilmu Ekonomi, Departemen Keuangan, Kwiatkowskiego 6e, 75-343 Koszalin, Polandia
Abstrak

Makalah ini menyajikan asumsi metodologis mengenai model regresi logistik dan contoh penggunaan metode penelitian Abstrak ini
untuk
mengevaluasi keputusan keuangan yang diambil oleh rumah tangga. Tujuan dari penelitian ini adalah untuk mengidentifikasi dan
mengevaluasi faktor sosial ekonomi yang menentukan utang rumah tangga di Central Pomerania menggunakan model regresi logistik.
Makalah ini menyajikan asumsi metodologis mengenai model regresi logistik dan contoh penggunaannya. Sumber data adalah hasil survei yang dilakukan di antara 1.000 rumah tangga di Central Pomerania

(Polandia). Metode penelitian untuk mengevaluasi keputusan keuangan yang diambil oleh rumah tangga. Tujuan dari penelitian ini adalah untuk mengidentifikasi dan mengevaluasi hasil yang diperoleh

membuktikan bahwa faktor-faktor berikut berhubungan dengan karakteristik sosial ekonomi rumah tangga: faktor sosial ekonomi ekonomi menentukan utang rumah tangga di Central Pomerania menggunakan

model regresi logistik. pendidikan kepala rumah tangga, tahap perkembangan rumah tangga, tipe sosial ekonomi rumah tangga Sumber data adalah hasil survei yang dilakukan terhadap 1.000 rumah tangga di

Central Pomerania (Polandia). Dampak positif yang signifikan secara statistik terhadap kemungkinan rumah tangga Pomeranian Tengah menggunakan hasil eksternal yang diperoleh membuktikan bahwa faktor-

faktor berikut terkait dengan karakteristik sosial ekonomi rumah tangga: sumber pembiayaan ekonomi: pendapatan rumah tangga dan pendapatan rumah tangga. Faktor-faktor tersebut meningkatkan

kemungkinan pendidikan rumah tangga kepala rumah tangga, fase perkembangan rumah tangga, jenis sosial ekonomi rumah tangga yang menggunakan sumber pembiayaan eksternal. Pada gilirannya, dampak

negatif yang signifikan secara statistik pada fenomena yang dianalisis memiliki dampak positif yang signifikan secara statistik pada kemungkinan rumah tangga Pomeranian Tengah menggunakan diversifikasi

pendapatan rumah tangga eksternal dan usia kepala rumah tangga. sumber pembiayaan: pendapatan rumah tangga dan pendapatan rumah tangga. Faktor-faktor ini meningkatkan kemungkinan rumah tangga

menggunakan sumber pembiayaan eksternal. Pada gilirannya, dampak negatif yang signifikan secara statistik pada fenomena yang

dianalisis memiliki diversifikasi pendapatan rumah tangga dan usia kepala rumah
tangga. © 2019 Penulis. Diterbitkan oleh Elsevier BV © 2020 Para Penulis. Diterbitkan oleh Elsevier BV
Ini adalah artikel akses terbuka di bawah lisensi CC BY-NC-ND(https://creativecommons.org/licenses/by-nc-nd/4.0/)
Ini adalah artikel akses terbuka di bawah lisensi CC BY-NC-ND (https://creativecommons.org/licenses/by-nc-nd/4.0)
Peer-review di bawah tanggung jawab KES International.
Peer-review
Diterbitkan oleh
di bawah
Elsevier
tanggung
BV jawab komite ilmiah KES International. © 2019 Penulis.

Ini adalah artikel akses terbuka di bawah lisensi CC BY-NC-ND(https://creativecommons.org/licenses/by-nc-nd/4.0/) Kata kunci: utang rumah tangga; regresi logistik; kerentanan terhadap hutang; faktor-faktor yang

mempengaruhi utang; Pomerania Tengah, Polandia Peer-review di bawah tanggung jawab KES International.

Kata kunci: hutang rumah tangga; regresi logistik; kerentanan terhadap hutang; faktor-faktor yang mempengaruhi utang; Pomerania Tengah, Polandia

* Penulis yang sesuai. Tel.: +48-94-3439-216 Alamat


email : agnieszka.strzelecka@tu.koszalin.pl

* Penulis yang sesuai. Tel.: +48-94-3439-216 Alamat email :


agnieszka.strzelecka@tu.koszalin.pl 1877-0509© 2019 Penulis. Diterbitkan oleh Elsevier BV
Ini adalah artikel akses terbuka di bawah lisensi CC BY-NC-ND (https://creativecommons.org/licenses/by-nc-nd/4.0/)
Peer-review di bawah tanggung jawab KES International.
1877-0509© 2019 Penulis. Diterbitkan oleh Elsevier BV
Ini adalah artikel akses terbuka di bawah lisensi CC BY-NC-ND (https://creativecommons.org/licenses/by-nc-nd/4.0/)
Peer-review di bawah tanggung jawab KES International.

1877-0509 © 2020 Para Penulis. Diterbitkan oleh Elsevier BV


Ini adalah artikel akses terbuka di bawah lisensi CC BY-NC-ND (https://creativecommons.org/licenses/by-nc-nd/4.0)
Peer-review di bawah tanggung jawab komite ilmiah KES International. 10.1016/j.procs.2020.09.055
Machine Translated by Google

Agnieszka Strzelecka dkk. / Ilmu Komputer Procedia 176 (2020) 3418–3427 3419
2 Nama penulis / Procedia Computer Science 00 (2020) 000–000

1. Perkenalan

Rumah tangga, sebagai unit ekonomi dasar, setiap hari melakukan sejumlah tindakan dan keputusan yang berjuang
untuk memenuhi kebutuhan bersama dan kebutuhan individu para anggotanya. Di antara keputusan keuangan rumah
tangga ada yang berhubungan dengan penggunaan sumber pembiayaan eksternal - keputusan kredit [6]. Hutang rumah
tangga merupakan salah satu aspek penelitian yang dilakukan di bidang keputusan keuangan rumah tangga. Dalam
beberapa tahun terakhir, peningkatan minat terhadap masalah ini telah diamati, terutama mengingat efek yang diamati dari
krisis keuangan global terhadap rumah tangga [12][22]. Popularitas isu penelitian ini ditunjukkan dengan banyaknya karya
ilmiah yang berfokus terutama pada isu-isu seperti: (1) tingkat utang rumah tangga [2] [5] [11] [13] [14] [21] [25] [ 28]; (2)
diferensiasi utang antar rumah tangga tergantung pada karakteristik sosio-demografis mereka [9] [13] [14] [21]; (3) bentuk,
motif dan tujuan kewajiban rumah tangga yang menimbulkan [13] [33]. Salah satu wilayah penelitian juga menjadi faktor
penentu utang rumah tangga. Hasil penelitian sebelumnya di daerah ini membuktikan bahwa faktor-faktor berikut yang
berkaitan dengan karakteristik sosial ekonomi rumah tangga, seperti pendapatan, usia kepala rumah tangga, jenis kelamin
kepala rumah tangga, pendidikan kepala rumah tangga rumah tangga dapat berdampak, pada tingkat pertumbuhan rumah
tangga, jumlah dan komposisi rumah tangga, lokasi rumah tangga dan jenis sosial ekonomi rumah tangga [1] [7] [8] [11] [18]
[19] [22] [31] [32]. Karya ini merupakan bagian dari penelitian tentang determinan utang rumah tangga.
Tujuan dari penelitian ini adalah untuk mengidentifikasi dan menilai faktor-faktor sosial ekonomi yang menentukan hutang rumah tangga di
Central Pomerania menggunakan model regresi logistik.

2. Metode

Regresi logistik (juga dikenal sebagai regresi logit atau model logit) adalah metode multidimensi yang banyak digunakan
untuk memodelkan hasil dikotomis (lihat misalnya [4] [17] [24] [34]). Sangat cocok untuk model yang mencakup masalah
pengambilan keputusan, oleh karena itu sering digunakan dalam analisis statistik yang muncul dalam literatur ekonomi dan
keuangan. Model regresi memiliki dua tujuan: (1) dapat memprediksi variabel hasil untuk nilai baru dari variabel prediksi, dan
(2) dapat membantu menjawab pertanyaan tentang fenomena yang diteliti, karena koefisien dari setiap variabel prediksi
dengan jelas menggambarkan kontribusi relatif dari variabel ini ke variabel hasil, secara otomatis mengendalikan pengaruh
variabel prediksi lainnya [3]. Model regresi logistik memungkinkan untuk menguji pengaruh banyak variabel independen
terhadap variabel
1 ,… , dependen Y. Variabel Y hanya mengambil dua nilai dan bersifat dikotomis. Nilai-nilai ini dikodekan sebagai
1 dan 0. Nilai variabel Y sama dengan 1 berarti peristiwa yang diinginkan terjadi. Sebaliknya, ketika kejadian buruk terjadi,
variabel ini mengasumsikan nilai 0 [16]. Proses analisis regresi memungkinkan Anda untuk menentukan faktor mana yang
paling penting, yang dapat Anda abaikan, dan bagaimana pengaruhnya satu sama lain.
Regresi logit menggunakan fungsi logistik untuk deskripsi, yang nilai keluarannya berada dalam kisaran (0; 1) dan yang
menciptakan kurva dalam pembentukan huruf S. Tiga tahap perubahan nilai fungsi dapat dibedakan: awalnya, hingga
ambang tertentu, mereka praktis tidak mengubah probabilitas, setelah mencapai nilai ambang batas, probabilitas meningkat
menjadi satu dan tetap pada level ini [29]. Bentuk analitis dari fungsi logistik yang digunakan dalam regresi logistik
didefinisikan dengan persamaan [30]:

z
e 1
fz ( ) = z
= ÿ

z ,
zR ÿ (1)
1+e 1+e

Model regresi logistik untuk variabel dikotomis Y menentukan probabilitas adopsi bersyarat
nilai yang dibedakan oleh variabel ini dan dinyatakan dengan hubungan berikut [26]:
ÿ +++
ÿ 0
1
XX
1 ... ÿ
kk
e
( =X 1/
PYX k 1,..., ) =
ÿ 0 1 ...
+ ÿ+ +XX 1 kkÿ
1+e

Di mana: ÿ
0 ,1ÿ ,...,ÿ k
adalah parameter model, 1 ,… ,
variabel independen yang dapat bersifat kualitatif dan
kuantitatif.
Machine Translated by Google

3420 Agnieszka Strzelecka dkk. / Procedia Computer Science 176 (2020) 3418–3427
Nama Penulis / Procedia Computer Science 00 (2020) 000–000 3

Koefisien model regresi logistik dicari dengan metode kemungkinan maksimum dan dengan metode umum kuadrat terkecil.
Dalam praktiknya, metode yang paling kredibel paling sering digunakan. Algoritme perhitungan metode kemungkinan maksimum
didasarkan pada estimasi berganda dari semua koefisien regresi untuk memaksimalkan kemungkinan memperoleh hasil yang
dicapai dalam sampel yang diteliti [16]. Ada dua formula terpisah untuk memperkirakan rasio kemungkinan maksimum [20]. Ini
adalah metode tak bersyarat dan metode bersyarat.
Karena non-linieritas model relatif terhadap variabel dan parameter independen, model logistik diubah menjadi model linier.
Untuk tujuan ini, diperkenalkan konsep Odds Ratio, yaitu rasio probabilitas terjadinya suatu peristiwa tertentu terhadap probabilitas
bahwa kasus ini tidak akan terjadi, yaitu

= ÿ + ÿ+ +XX ...k kÿ
0 11
PYX X
( ) ( 1/ k1/ 1,..., e 1 = ÿ + ÿ+ 1+XX
10 ... ÿ kk
= : e (3)
+ ÿ+ 1+X10X ... ÿ + ÿ+ 1+XX
10 ...
1 PYXX k =
ÿ ÿ kk ÿ ÿ kk
1,..., ) 1+e 1+e

Oleh karena itu, odds ratio menyatakan berapa kali probabilitas bahwa suatu peristiwa akan terjadi meningkat atau menurun jika
terjadi perubahan unit variabel independen (dengan nilai yang ditentukan dari variabel independen lainnya). Rasio ini dihitung
sebagai berikut:

() = ()
()= . (4)
() 1ÿ ( )

Rasio odds mengacu pada situasi ketika terjadinya fenomena tertentu dipelajari dalam dua kelompok independen.
Dinyatakan dengan rasio peluang fenomena ini terjadi di grup atau ( ), dengan peluang fenomena ini terjadi di grup atau ( ).
Rumus untuk rasio odds adalah:

= () = ( ) ( ) / 1ÿ ( )
(5)
() 1ÿ ( )

dimana: ( )- probabilitas terjadinya peristiwa (nilai 1 variabel dependen) dalam kategori (nilai 1 variabel independen); ( ) -
probabilitas terjadinya peristiwa (nilai 1 variabel dependen) dalam kategori observasi (nilai 0 variabel independen).

Diasumsikan bahwa jika:


> 1, kemudian merangsang peristiwa tersebut menunjukkan seberapa besar probabilitas 1 dalam variabel dependen
terjadi. meningkat ketika nilai prediktor meningkat satu unit;
< 1, maka destimulasi terjadinya peristiwa tersebut. menunjukkan seberapa besar probabilitas 1 dalam tanggungan
variabel menurun ketika nilai prediktor meningkat satu unit; = 1, maka
tidak mempengaruhi terjadinya kejadian tersebut.

Dalam analisis rasio odds, interval kepercayaan (CI) ditentukan untuk masing-masing prediktor. Ini adalah rentang numerik
yang, dengan probabilitas 1-ÿ yang ditentukan oleh peneliti dan didefinisikan sebagai tingkat kepercayaan, akan berisi nilai
estimasi parameter populasi yang tidak diketahui.

Setelah mengestimasi parameter model regresi logistik, nilai teoritis variabel Y dapat diperoleh
ditentukan sesuai dengan prinsip perkiraan standar:

ˆ
ˆ ÿ 1, gdy 0,5 1 ÿ ÿ pi
y = ˆ
ÿ 0, gdy 0 ÿ ÿ ÿpi _0,5
Saya

dimana:pi ˆ probabilitas teoretis diperoleh dari model regresi logistik yang diperkirakan
berdasarkan sampel acak.
Machine Translated by Google

Agnieszka Strzelecka dkk. / Ilmu Komputer Procedia 176 (2020) 3418–3427 3421
4 Nama penulis / Procedia Computer Science 00 (2020) 000–000

Dalam situasi di mana sampel tidak seimbang, yaitu di mana jumlah satu berbeda secara signifikan dari jumlah nol, modifikasi
aturan standar dapat digunakan untuk meramalkan nilai teoritis dan perkiraan sesuai dengan prinsip nilai batas optimal ÿ dapat dihitung:

ˆ
ˆ ÿ 1, gdy ÿ ÿ ÿP1
=
Saya

y saya ˆ
ÿ ÿ pi ÿ
ÿ ÿ 0, gdy 0
.

Batas ÿ ditetapkan sebagai bagian dari satu dalam sampel. Anda kemudian dapat menilai kebenaran estimasi model dengan menghitung
kasus yang diklasifikasikan dengan benar dan salah (Tabel 1).

Tabel 1. Matriks klasifikasi kasus


Kepemilikan sebenarnya dari
Klasifikasi objek berdasarkan logit Jumlah
model yi =1 objek yi = 0

yˆi =1 n11 n12 n 1•

yˆi = 0 n21 n22 n2•


Sum n •1 N
n•2
Sumber: studi sendiri berdasarkan [10].

Untuk menilai derajat penyesuaian model regresi logistik terhadap data empiris, ukuran penghitungan R2 adalah

digunakan, yang mengambil nilai dari rentang 0,1 didefinisikan sebagai berikut [26]:

2 n 22 +
n 11
R hitungan = . (6)
nnn 12
+++21n 22
11

Semakin dekat satu nilai dari ukuran ini, semakin baik model logistik akan cocok dengan data empiris dari studi yang menunjukkan
2
fenomena. R hitungan persentase kasus yang diklasifikasikan dengan benar. Model bekerja dengan baik dalam peramalan
mempelajari fenomena kapan. Artinya klasifikasi berdasarkan model lebih baik daripada random. Kualitas model regresi logistik yang
dibangun juga dapat dinilai dengan ukuran lain, misalnya

LnL FM
Semu R 2Semu
1 =ÿ (7)
LnL 0

dimana: LFM - maksimum fungsi kemungkinan model dengan semua variabel, L0 - maksimum fungsi kemungkinan model yang hanya

berisi kata bebas. Dibutuhkan nilai dari rentang 0,1). Nilai yang mendekati 1 menunjukkan kecocokan model yang sangat baik,
sedangkan nilai yang mendekati 0 menunjukkan tidak ada kecocokan. Karena faktor Pseudo R2 tidakmengambil nilai 1 dan peka
terhadap jumlah variabel dalam model, ditentukan nilai yang benar: R2 Nagelkerke dan R2
Cox-Snell.

(2 / )(LnL
n LnL FM 0 )
ÿ ÿ

2 1 ÿ

e LnLFM LnL n
2 2( 0) /
= , R 1ÿCox-Snell = ÿ
ÿ

R Nagelkerke e (8)
(2 / )LnL
n 0e
1 ÿ

Tes Hosmer-Lemeshow [15], dapat digunakan untuk menilai kualitas model regresi logistik yang dibangun, yang membandingkan
jumlah kejadian yang diamati dalam subkelompok objek tertentu dengan fitur Og yang berbeda dan jumlah yang diharapkan Eg dari
nilai yang dibedakan untuk subgrup data yang berbeda. Jika Og dan Eg cukup dekat, maka dapat diasumsikan bahwa model yang
terpasang dengan baik telah dibangun. Biasanya pengamatan dibagi menjadi subkelompok G untuk perhitungan, misalnya menggunakan
desil. Hipotesis dalam tes mengambil bentuk berikut:
Machine Translated by Google

3422 Agnieszka Strzelecka dkk. / Procedia Computer Science 176 (2020) 3418–3427
Nama Penulis / Procedia Computer Science 00 (2020) 000–000 5

H Og
:0 = Eg untuk semua kategori,

H Og
: 1 ÿ Eg setidaknya untuk satu kategori.

Nilai statistik uji ditentukan sebagai berikut:

2
G (OE gg ÿ

)
H = (9)
ÿ =G 1 ÿ
ÿ ÿ
Misalnya _

Misalnya _
Ng
_ ÿÿÿ

ÿ 1 ÿ ÿ dimana: Ng banyaknya observasi pada kelompok g, g ÿ{1,...,G}.

2
Statistik ini memiliki distribusi asimtotik ÿ dengan derajat kebebasan G-2.

Selain itu, kurva ROC digunakan untuk menilai kualitas klasifikasi yang diperoleh dengan regresi logistik. Kurva ROC adalah ukuran
visual dari kinerja classifier. Untuk regresi logistik, tabel klasifikasi standar adalah matriks 2 × 2 yang menyertakan kelas keputusan
yang diprediksi oleh model dan benar-benar diamati [16]. Dengan menggunakan persentase poin data positif yang benar dianggap
positif dan persentase poin data negatif yang salah dianggap positif, grafik dibuat yang menunjukkan pertukaran antara kecepatan
prediksi yang benar dan kecepatan prediksi yang salah . Elemen penting dari analisis tabel adalah menentukan persentase dari tiga
parameter: akurasi (ACC), sensitivitas dan spesifisitas. Yang pertama menentukan berapa persentase pengamatan kasus yang
diklasifikasikan dengan benar secara positif atau negatif oleh model. Keakuratan kemampuan mengklasifikasikan model dapat diukur
sebagai area under the curve (AUC). Sensitivitas menggambarkan kemampuan untuk mendeteksi unit yang memiliki status tertentu [23]:

n 11
kepekaan = (10)
+ 21
nn 11

Namun, spesifisitas menentukan persentase kasus dengan benar, tetapi diklasifikasikan secara negatif oleh model di antara semua
kasus yang diamati secara negatif [23]:

n 22
kekhususan = (11)
nn 12+ 22

Kurva ROC dibuat dengan menghubungkan titik-titik dalam sistem koordinat Cartesian dengan koordinat (1-spesifisitas, sensitivitas).
Kurva ROC yang dihasilkan, dan khususnya area di bawahnya (AUC), mengilustrasikan kualitas klasifikasi model. Area di bawah kurva
ROC mengambil nilai dari rentang ÿ0,1ÿ. Kualitas klasifikasi model baik ketika area di bawah kurva ROC jauh lebih besar daripada area
di bawah garis lurus x = y , sehingga lebih besar dari 0,5. Anda dapat memverifikasi hipotesis:

H0 : AUC = 0,5 ;
H1 : AUC ÿ 0,5 .

Statistik uji digunakan untuk memverifikasi hipotesis ini:

AUC ÿ

0,5
AS = (12)
SE
0,5
Machine Translated by Google

6 Nama penulis / Procedia Computer Science 00 (2020) 000–000


Agnieszka Strzelecka dkk. / Ilmu Komputer Procedia 176 (2020) 3418–3427 3423

n1 1++n
Di mana: SE = • 2• , n1• - ukuran unit yang memiliki karakteristik khusus, n2• - ukuran unit tidak
0,5
12 ÿ
nn •1 2
ÿ


memiliki ciri khas.

Jika kurva bertepatan dengan diagonal x = y , itu berarti model tidak terlibat dalam analisis, karena klasifikasi yang
dibuat oleh model sama baiknya dengan keputusan acak. Semakin dekat kurva ke kuadran kiri, semakin baik hasil yang
dicapai dalam model. Tingkat sensitivitas yang tinggi (mendekati 1) berarti model mengidentifikasi kasus dengan benar,
dan nilai 1-S yang rendah membuktikan bahwa hanya beberapa kasus negatif yang diklasifikasikan sebagai positif.
Jika, ketika nilai variabel diagnostik meningkat, peluang terjadinya fenomena yang dipelajari meningkat atau menurun,
yang disebut titik potong optimal, yaitu probabilitas yang diprediksikan untuk mana variabel dependen membagi komunitas
menjadi kelompok-kelompok terbaik: di mana fenomena yang dipelajari terjadi dan tidak terjadi. Salah satu cara untuk
menentukan titik potong optimal adalah nilai variabel diagnostik di mana ekspresi: Sensitivitas (Spesifisitas ÿ 1) ÿmÿ

mencapai minimum, di mana m - kemiringan garis singgung ke kurva ROC [35].

3. Hasil empiris

3.1. Sumber data

Sumber data empiris adalah hasil survei yang dilakukan terhadap 1.000 rumah tangga Pomerania Tengah di Polandia.
Kajian dilakukan pada triwulan II tahun 2019, dengan menggunakan teknik survei langsung. Selama penelitian, diperoleh
746 kuesioner yang diisi dengan benar (tingkat pengembalian 74,6%). Ruang lingkup kajian mencakup tahun 2018.

Kelompok rumah tangga yang dominan adalah entitas yang tinggal di pedesaan (46,2%), diikuti oleh rumah tangga dari
kota dengan lebih dari 50 ribu jiwa (27,2%) dan kota kecil (hingga 50 ribu jiwa - 26,5%).
Berdasarkan fase perkembangan rumah tangga, ditemukan kelompok yang paling banyak adalah perkawinan/kemitraan
dengan tanggungan anak (47,1%). Setengah dari kelompok itu adalah rumah tangga yang terdiri dari tiga orang. Di antara
entitas yang dimasukkan dalam analisis, yang kepala rumah tangganya didominasi laki-laki (62,2%), rata-rata usia kepala
rumah tangga adalah 45 tahun. Hampir 65% dari populasi adalah individu yang kepala rumah tangganya paling banyak
berpendidikan menengah. 27,9% responden menyatakan berpendidikan tinggi
Bagi 61,1% responden, sumber penghasilan utama adalah upah dari pekerjaan. Selanjutnya, responden menunjukkan:
penghasilan dari kegiatan usaha non-pertanian (14,5%), pensiun dan pensiun cacat (13,5%) dan penghasilan dari kegiatan
pertanian (9,5%). Ditemukan juga bahwa 17,6% dari unit yang termasuk dalam penelitian memiliki rata-rata pendapatan
bersih bulanan per kapita dalam rumah tangga tidak melebihi PLN 1.000. Dalam kasus lebih dari 1/3 responden (36,6%),
jumlah kategori pendapatan dianggap lebih tinggi dari PLN 2.000/orang. 50,9% rumah tangga yang dianalisis ditandai
dengan peningkatan pendapatan yang stabil pada tahun 2004-2018, sementara 61,4% entitas ditandai dengan peningkatan
pengeluaran yang stabil pada periode ini. Rata-rata 1/3 pengeluaran (34,5%) dialokasikan untuk pembelian makanan dan
minuman non-alkohol. Lebih dari setengah populasi (50,9%) melakukan diversifikasi sumber pendapatan mereka.

Di antara kelompok rumah tangga Pomerania Tengah yang disurvei, 34,3% entitas terlilit hutang, mengalokasikan rata-
rata 17,6% pendapatan untuk membayar kewajiban. Struktur utang entitas yang disurvei didominasi oleh pinjaman hipotek,
yang merupakan rata-rata 40,7% dari seluruh kewajiban. Rata-rata, pinjaman dari institusi selain bank menyumbang 5,1%
dari semua kewajiban, sedangkan pinjaman dari keluarga / teman - 3%.

3.2. Identifikasi faktor-faktor yang mempengaruhi utang rumah tangga - model regresi logistik

Model regresi logistik digunakan untuk memverifikasi secara empiris faktor-faktor yang mempengaruhi kecenderungan
utang rumah tangga yang disurvei di Central Pomerania. Hutang rumah tangga (variabel nol-satu) diasumsikan sebagai
variabel dependen. Dalam kasus rumah tangga yang disurvei berutang pada tahun 2018, variabel mengambil nilai 1 (256
kasus), sebaliknya - nilai 0 (490 kasus). Variabel penjelas dipilih berdasarkan studi literatur. Untuk penilaian
Machine Translated by Google

3424 Agnieszka Strzelecka dkk. / Procedia Computer Science 176 (2020) 3418–3427
Nama Penulis / Procedia Computer Science 00 (2020) 000–000 7

dari probabilitas yang diperiksa, 9 faktor yang terkait dengan karakteristik sosial-ekonomi rumah tangga Pomeranian Tengah
diadopsi dan 30 variabel independen berikut diberikan kepada mereka: (1) usia: x1 - usia kepala rumah tangga [tahun]; (2)
jenis kelamin: x2 - jenis kelamin kepala rumah tangga [perempuan = 1, laki-laki = 0]; (3) pendidikan: karena variabel pertama
yang dianggap mengacu pada tingkat pendidikan rumah tangga memiliki beberapa varian, kelompok referensi dibedakan
(untuk variabel x3-x6) - rumah tangga dengan pendidikan paling dasar; x3 - kejuruan dasar [ya = 1, tidak ada = 0]; x4 - sedang
[ya = 1, tidak = 0]; x5- perguruan tinggi [ya = 1, tidak ada = 0]; x6 - lebih tinggi [ya = 1, tidak = 0]; x7 - pendidikan ekonomi
kepala rumah tangga [ya = 1, tidak ada = 0]; (4) jumlah dan komposisi rumah tangga: x8 - jumlah anggota rumah tangga
[orang]; x9 - bagian tanggungan anak [%]; (5) kegiatan ekonomi anggota rumah tangga: x10 - bagian anggota rumah tangga
yang terlibat dalam pekerjaan yang menguntungkan dalam jumlah total orang dalam rumah tangga [%]; (6) fase pengembangan
rumah tangga: karena variabel yang dimaksud memiliki beberapa varian, kelompok referensi telah diidentifikasi - pertanian
seorang pemuda yang kesepian; x11 - pernikahan muda / kemitraan tanpa anak [ya = 1, tidak ada = 0]; x12 - orang yang
kesepian dengan tanggungan anak / anak [ya = 1, tidak ada = 0]; x13 - pernikahan / kemitraan dengan anak tanggungan [ya =
1, tidak ada = 0]; x14 - pernikahan / kemitraan di usia paruh baya atau lebih tua tanpa tanggungan anak [ya = 1, tidak ada = 0];
x15 - manajemen orang tua yang kesepian [ya = 1, tidak ada = 0]; x16 - selain fase pengembangan (termasuk rumah tangga
multigenerasi) [ya = 1, tidak ada = 0]; (7) tipe sosial ekonomi rumah tangga: karena variabel yang dimaksud memiliki
beberapa varian, kelompok referensi telah diidentifikasi - rumah tangga karyawan; x17 - petani [ya = 1, tidak ada = 0]; x18 -
wiraswasta [ya = 1, tidak ada = 0]; x19 - pensiunan [ya = 1, tidak ada = 0]; x20 - lainnya (termasuk mereka yang hidup dengan
tunjangan sosial) [ya = 1, tidak ada = 0]; (8) lokasi rumah tangga: karena variabel yang dimaksud memiliki beberapa varian,
sebuah kelompok acuan telah diidentifikasi - rumah tangga desa; x21 - kota hingga 50.000 penduduk [ya = 1, tidak ada = 0];
x22 - kota dengan lebih dari 50.000 penduduk [ya = 1, tidak ada = 0]; (9) pendapatan rumah tangga: karena variabel pertama
yang diadopsi untuk pendapatan rumah tangga memiliki beberapa varian, kelompok referensi telah dipisahkan (untuk variabel
x23-x25) - pendapatan bersih bulanan rata-rata per orang dalam rumah tangga hingga PLN 1.000; x23 - dari 1001 hingga 1500
PLN / orang [ya = 1, tidak ada = 0]; x24 - dari 1501 hingga 2000 PLN / orang [ya = 1, tidak ada = 0]; x25 - di atas PLN 2.000 /
orang [ya = 1, tidak ada = 0]; x26 - peningkatan pendapatan yang stabil sejak 2004 [ya = 1, tidak ada = 0]; x27 - diversifikasi
sumber pendapatan dalam rumah tangga - lebih dari satu jenis sumber pendapatan [ya = 1, tidak ada = 0]; x28 - peningkatan
biaya yang stabil sejak 2004 [ya = 1, tidak ada = 0]; x29 - bagian pengeluaran untuk makanan dan minuman non-alkohol dalam
pengeluaran rumah tangga [%]; x30 - apakah Anda pernah mengalami kesulitan dalam mengakses layanan atau produk keuangan [ya = 1
Menggunakan metode eliminasi mundur, berdasarkan kriteria informasi Akaike (AIC), prediktor selanjutnya dihilangkan dari
model keluaran dan perubahan nilai kriteria yang digunakan untuk menilai kualitas model dinilai. Terakhir, 13 variabel
independen, yang pengaruhnya terhadap probabilitas tidak signifikan secara statistik, dihilangkan. Pada setiap tahap,
peningkatan nilai ukuran kecocokan yang diadopsi (pengurangan nilai AIC) diamati. 17 prediktor tetap dalam model akhir
(Tabel 2).

Tabel 2. Hasil estimasi parameter model – model final


Variabel Standar z Wald Tingkat Kemungkinan
Variabel
parameter kesalahan tes signifikansi perbandingan

x1 -0,047 0,011 -4.448 <0,001* 0,954


x7 0,605 0,214 2.823 0,005* 1.832
Fase pembangunan rumah tangga
x11 0,795 0,359 2.213 0,027** 2.214
x12 1.543 0,570 2.705 0,007* 4.677
x13 1.941 0,360 5.386 <0,001* 6.966
x14 2.026 0,497 4.075 <0,001* 7.587
x15 1.208 0,827 1.461 0,144 3.346
x16 2.050 0,478 4.292 <0,001* 7.770
Tipe sosial ekonomi
x17 0,603 0,289 2.084 0,037** 1.827
x18 0,640 0,241 2.655 0,008* 1.897
x19 -0,297 0,408 -0,729 0,466 0,743
x20 -1,070 1.098 -0,975 0,330 0,343
Pendapatan rumah tangga

x23 0,002 0,277 0,006 0,995 1.002


x24 0,516 0,287 1.797 0,072*** 1.675
Machine Translated by Google

Agnieszka Strzelecka dkk. / Ilmu Komputer Procedia 176 (2020) 3418–3427 3425
8 Nama penulis / Procedia Computer Science 00 (2020) 000–000

x25 0,593 0,273 2.172 0,030** 1.809


x27 -0,295 0,179 -1.647 0,100*** 0,745
x30 0,806 0,244 3.304 0,001* 2.239
Mencegat -0,735 0,475 -1,549 0,121 0,480
AIK = 889,56
Cox-Snell R2 = 0,132
Nagelkerke R2 = 0,183
hitung R2 = 0,705
AUC = 0,716
LR = 105,97 (df = 17; p = <0,001)
* variabel yang signifikan secara statistik pada tingkat signifikansi 1% **
variabel yang signifikan secara statistik pada tingkat signifikansi 5% ***
variabel yang signifikan secara statistik pada tingkat signifikansi 10% Sumber:
studi sendiri.

Model estimasi kerentanan rumah tangga Pomeranian Tengah terhadap utang berupa:

Prob(Y=1) = ÿ(-0,047x1 + 0,605x7 + 0,795x11 + 1,543x12 + 1,941x13 + 2,026x14 + 1,208x15 + 2,050x16 + 0,603x17 +
0,640x18 – 0,297x19 – 1 0,070x20 + 0,002x23 + 0,516 x24 + 0,593x25 – 0,295x27 + 0,806x30 – 0,735)
mantan

dimana: ÿ(x) =
1+ex fungsi distribusi logistik

Gambar 1. Odds ratio


plot Sumber: studi sendiri.

Tabel 3. Matriks Model Klasifikasi Kasus Kerentanan Rumah Tangga Pomeranian Tengah Terhadap Utang Kepemilikan Nyata
Benda Yi = 0
Klasifikasi objek berdasarkan model logit Jumlah
yi =1
yˆi =1 154 136 290

yˆi = 0 102 354 456

Sum 256 490 746


Sumber: studi sendiri.

70,5% kasus diklasifikasikan dengan benar berdasarkan model (countR2 = 0,705). Penilaian kualitas model yang dibangun
dilakukan berdasarkan koefisien Cox-Snell R2 (0,132), R2 Nagelkerk (0,183) dan menggunakan kurva ROC (Gbr. 2).
Machine Translated by Google

3426 Agnieszka Strzelecka dkk. / Procedia Computer Science 176 (2020) 3418–3427
Nama Penulis / Procedia Computer Science 00 (2020) 000–000 9

Gambar 2. Kurva ROC untuk Model Kecenderungan Utang Rumah Tangga di Pomerania Tengah
Sumber: Kajian Sendiri.

Area di bawah kurva ROC (AUC) adalah 0,716. Karena bidang lebih besar dari 0,5 diperoleh, ini menunjukkan kualitas yang baik dari
model yang dibangun. Nilai LR-statistik adalah 105,97 (p = <0,001), nilai kritis statistik ini untuk 17 derajat kebebasan adalah 33,41.

Hasil penelitian membuktikan bahwa faktor-faktor berikut yang terkait dengan karakteristik sosial ekonomi rumah tangga memiliki
dampak positif yang signifikan secara statistik terhadap probabilitas yang diteliti: pendidikan ekonomi kepala rumah tangga (x7), fase
perkembangan rumah tangga (x12, x13, x14, x16) , tipe sosial - rumah tangga ekonomi (x17, x18) dan pendapatan rumah tangga
(x24, x25, x27, x30). Pada gilirannya, dampak negatif yang signifikan secara statistik terhadap kecenderungan utang rumah tangga
Pomerania Tengah memiliki diversifikasi pendapatan oleh rumah tangga (x27) usia kepala rumah tangga (x1).
Peluang penggunaan sumber pembiayaan eksternal oleh rumah tangga sebesar 83,2% lebih tinggi pada situasi kepala rumah tangga
memiliki pendidikan ekonomi, dibandingkan dengan rumah tangga yang belum dilaporkan hubungan (ceteris paribus ) . Ditemukan juga
bahwa kemungkinan di antara entitas dari Central Pomerania berdampak pada fase perkembangan di mana rumah tangga berada (orang
yang kesepian di usia muda ditetapkan sebagai kelompok referensi).
Dengan perkembangan rumah tangga dan transisi ke fase berikutnya (ceteris paribus), kemungkinan penggunaan sumber pembiayaan
eksternal meningkat. Hal ini antara lain disebabkan oleh munculnya kebutuhan rumah tangga baru (misalnya pembelian rumah/rumah susun,
kenaikan pengeluaran karena munculnya anak) dan pencarian sumber pembiayaan pengeluaran yang berkaitan dengan pemenuhan
kebutuhan tersebut. Studi ini juga membuktikan bahwa dampak terhadap kecenderungan utang dari entitas yang disurvei dari Central
Pomerania memiliki tipe sosial ekonomi rumah tangga. Kesempatan untuk menggunakan sumber pembiayaan eksternal lebih tinggi 89,7%
pada rumah tangga yang sumber pendapatan utamanya adalah pendapatan usaha tani (ceteris paribus) dan sebesar 82,7% lebih tinggi jika
sumber pendapatan rumah tangga utamanya berasal dari kegiatan usaha (ceteris paribus ) daripada di rumah tangga yang sumber
pendapatan dasarnya adalah pendapatan dari pekerjaan berbayar. Hal ini antara lain dapat diakibatkan oleh penggunaan pinjaman untuk
tujuan investasi yang berkaitan dengan kegiatan usaha, termasuk kegiatan pertanian. Tercatat juga bahwa peluang untuk menggunakan
sumber pembiayaan eksternal 124% lebih tinggi pada rumah tangga yang mengalami kesulitan dalam mengakses produk atau jasa keuangan
(ceteris paribus) setidaknya satu kali, terkait dengan entitas yang tidak mengalami fenomena ini. Juga diamati bahwa dalam kasus entitas
yang mendiversifikasi sumber pendapatannya, peluang terjadinya probabilitas yang dianalisis adalah 25,5% lebih rendah daripada dalam
kasus rumah tangga di mana karakteristik yang ditunjukkan (ceteris paribus) tidak dicatat . Hasil penelitian juga membuktikan bahwa dengan
bertambahnya usia kepala rumah tangga, kecenderungan untuk berutang semakin menurun, yang sejalan dengan asumsi hipotesis daur
hidup [Modigliani 2005].

4. Kesimpulan

Makalah ini menyajikan asumsi metodologis mengenai model regresi logistik dan contoh penggunaan metode penelitian ini untuk
mengevaluasi keputusan keuangan yang diambil oleh rumah tangga. Hasil penelitian yang disajikan dalam bagian empiris penelitian
membuktikan bahwa faktor-faktor berikut yang terkait dengan karakteristik sosial ekonomi rumah tangga memiliki dampak positif
yang signifikan secara statistik terhadap kemungkinan rumah tangga Pomeranian Tengah memiliki: pendidikan ekonomi kepala
rumah tangga (x7) , rumah tangga fase perkembangan (x12, x13, x14, x16), tipe rumah tangga sosial ekonomi (x17, x18) dan
pendapatan rumah tangga (x24, x25, x27, x30). Faktor-faktor ini meningkatkan kemungkinan rumah tangga menggunakan sumber
pembiayaan eksternal. Pada gilirannya, dampak negatif yang signifikan secara statistik pada fenomena yang dianalisis memiliki a
Machine Translated by Google

Agnieszka Strzelecka dkk. / Procedia Computer Science 176 (2020) 3418–3427 3427
10 Nama Penulis / Procedia Computer Science 00 (2020) 000–000

diversifikasi pendapatan rumah tangga (x27) dan usia kepala rumah tangga (x1). Hasil yang diperoleh untuk rumah tangga Pomerania
Tengah mengkonfirmasi hasil penelitian yang sejauh ini disajikan dalam literatur tentang faktor-faktor yang menentukan kemungkinan
penggunaan sumber pembiayaan eksternal (terutama pinjaman) oleh rumah tangga.
Penggunaan model regresi logistik memungkinkan identifikasi dan penilaian faktor-faktor yang menentukan kecenderungan hutang
rumah tangga Pomeranian Tengah.

Referensi

[1] Altundere, Merve Büÿra. (2014) “Hubungan Antara Sosiabilitas dan Hutang Rumah Tangga.” Adam Academy Jurnal Ilmu Sosial/ Adam Akademi Sosyal Bilimler Dergisi 4(2):27-58.

[2] Andre, Christophe. (2016). "Utang rumah tangga di negara-negara OECD: Fakta bergaya dan masalah kebijakan." Kertas Kerja Departemen Ekonomi OECD 1277, OECD Publishing,
Paris.
[3] Bagley, Steven C., White Halbert, Golomb Beatrice A. (2001) "Regresi logistik dalam literatur medis: Standar penggunaan dan pelaporan, dengan perhatian khusus pada satu domain
medis." Jurnal Epidemiologi Klinis, 54: 979–985.
[4] Bennouna, Ghita, dan Mohamed Tkiouat. (2019) “Mencetak skor dalam keuangan mikro: alat manajemen risiko kredit –Kasus Maroko-.” Ilmu Komputer Procedia 148: 522-531.

[5] Bobolik, Piotr. (2020) “Perkembangan rasio utang terhadap PDB rumah tangga di seluruh negara OECD sejak krisis keuangan global.” Acta Sci. Pol.
Ekonomi 19(1): 5-12.
[6] Bodie, Zvi, dan Robert C. Merton. (1998), Keuangan, Prentice Hall, Upper Saddle River, New Jersey, hal. 4.
[7] Breuer, Wolfgang; Ayam Thorsten; Astrid Juliane Salzmann, dan Mei Wang. (2015) “Tentang determinan pilihan jatuh tempo utang rumah tangga.” Ekonomi Terapan 47(5): 449-465.

[8] Chien, Yi-Wen, dan Sharon A. DeVaney. (2001) “Pengaruh sikap kredit dan faktor sosial ekonomi pada kartu kredit dan utang cicilan.” Jurnal Urusan Konsumen 35(1): 162-179.

[9] Collins, J. Michael, Erik Hambre, dan Carly Urban. (2020) “Menjelajahi munculnya pinjaman hipotek di antara orang Amerika yang lebih tua.” Ilmu Daerah dan Ekonomi Perkotaan 83:
1-23.
[10] Dobosz, Marek. (2004) Wspomagana komputerowo statis analisis wyników badaÿ. Akademicka Oficyna Wydawnicza KELUAR, Warszawa.
[11] Ebrahimi, Zahra. (2020) “Dampak meningkatnya utang rumah tangga di kalangan orang Amerika yang lebih tua.” Laporan Singkat EBRI 502: 1-22.
[12] Elvery, Joel A., dan Mark E. Schweitzer. (2020) “Rasio layanan utang tingkat rumah tangga yang terpilah sebagian: konstruksi, validasi, dan hubungan dengan tingkat kebangkrutan.”
Kebijakan Ekonomi Kontemporer 38(1):166-187.
[13] Garriga, Carlos, Bryan Noeth, dan Don Schlagenhauf. (2017) “Hutang Rumah Tangga dan Resesi Hebat.” Ulasan 99(2): 183-205.
[14] Haughwout, Andrew F., Donghoon Lee, Joelle Scally, Lauren Thomas, and Wilbert van der Klaauw. (2019) “Tren Hutang dan Kredit Rumah Tangga.”
FRB Laporan Staf New York 882.
[15] Hosmer, David W., Lemenshow, Stanley, Mei, Susanne. (2008) Analisis Kelangsungan Hidup Terapan: Pemodelan Regresi Waktu ke Data Peristiwa. Wiley Blackwell.

[16] Hosmer, David. W., Lemeshow, Stanley. (2000) Regresi Logistik Terapan, New York: John Wiley & Sons.
[17] Jain, Hemlata, Ajay Khunteta, dan Sumit Srivastava. (2020) “Prediksi churn dalam telekomunikasi menggunakan regresi logistik dan peningkatan logit.”
Ilmu Komputer Procedia 167: 101-112.
[18] Khan, Hafizah Hammad Ahmad, Hussin Abdullah, and Shamzaeffa Samsudin,. (2016) “Pemodelan Determinan Utang Rumah Tangga Malaysia.”
Jurnal Internasional Ekonomi dan Keuangan Econjournals 6(4): 1468-1473.
[19] Kim, Kyoung Tae, Melissa J. Wilmarth, dan Robin Henager. (2017) “Tingkat kemiskinan dan indikator utang di antara rumah tangga berpendapatan rendah sebelum dan sesudah
Resesi Hebat.” Jurnal Konseling & Perencanaan Keuangan 28(2): 196-212.
[20] Kleinbaum, David, G., Klein, Mitchel. (2002) Regresi logistik – teks belajar mandiri. New York: Springer.
[21] Korzeniowska, Anna. (2019) “Sumber pembiayaan utang rumah tangga di Polandia.” Folia Oeconomica Stetnensia 19(2): 56-67.
[22] Košÿálová, Zuzana. (2019) “Menjelajahi kekuatan pendorong utang rumah tangga di Slovakia.” Tinjauan Ekonomi 48(4): 399-414.
[23] Kumar, Rajeev, Indrayan, Abhaya. (2011) "Kurva Karakteristik Operasi Penerima (ROC) untuk Peneliti Medis." Pediatri India, 48.
[24] Kuswanto, Heri, Ayu Asfihani, Yogi Sarumaha, dan Hayato Ohwada. (2015) “Ansambel regresi logistik untuk memprediksi pembelotan pelanggan dengan ukuran sampel yang
sangat besar.” Procedia Ilmu Komputer 72: 86-93.
[25] Lusardi, Annamaria, Olivia S. Mitchell, dan Noemi Oggero. (2018) “Perubahan Wajah Utang dan Kerapuhan Keuangan di Usia Tua.” Makalah dan Prosiding AEA 108: 407-11.

[26] Maddala, Gangadharrao S. (2001) Pengantar Ekonometrika. Edisi ketiga. John Wiley & Sons.
[27] Modigliani, Franco, dan Richard Brumberg. (2005) "Analisis Utilitas dan Fungsi Konsumsi: Sebuah Interpretasi Data Cross-Section", di Franco Modigliani (eds) The Collected Papers
of Franco Modigliani, Vol. 6, The MIT Press, Cambridge-Massachusetts-London.
[28] Scott III, Robert H., dan Steven Pressman. (2015) “Deleveraging Rumah Tangga yang Tidak Memadai: Pendapatan, Hutang, dan Penyediaan Sosial.” Jurnal Masalah Ekonomi
(Taylor & Francis Ltd) 49(2):483-492.
[29] Sompolska-Rzechuÿa, Agnieszka, ÿwitÿyk Michaÿ. (2016) "Faktor-faktor yang mempengaruhi probabilitas peningkatan pendapatan dalam kepemilikan pertanian yang berspesialisasi
dalam produksi susu." Masalah Ekonomi Pertanian, 4(349): 107-121.
[30] Stanisz, Andrzej. (2007), Przystÿpny kurs and zastosowaniem Statistica PL na przykÿadach z medycyny. Statsoft, Kraków, Tom 3.
[31] Turinetti, Erin, dan Hong Zhuang. (2011) "Menjelajahi Penentu Hutang Rumah Tangga AS." Jurnal Riset Bisnis Terapan (JABR) 27(6): 85- 92.

[32] Waÿÿga, Grzegorz. (2012) “Penentu sosio-ekonomi utang rumah tangga di Polandia (Spoÿeczno-ekonomiczne determinanty zadÿuÿenia gospodarstw domowych w Polsce).”
Makalah Penelitian Universitas Ekonomi Wrocÿaw/ Prace Naukowe Uniwersytetu Ekonomicznego we Wrocÿawiu 245: 600-610.
[33] Jalan-jalan, Alan. (2018) “Membuat orang miskin berhutang? Pinjaman mobil, kerugian transportasi, dan ketergantungan mobil.” Kebijakan Transportasi 66:137- 149.

[34] Zahi, Sara, dan Boujemâa Achchab. (2020) “Memodelkan pembayaran di muka pinjaman mobil menggunakan pembelajaran mesin yang diawasi.” Ilmu Komputer Procedia
170: 1128-1133.
[35] Zweig, Mark. H. Campbell, Gregory. (1993) "Plot karakteristik operasi-penerima (ROC): alat evaluasi mendasar dalam kedokteran klinis."
Kimia Klinis, 39.

Anda mungkin juga menyukai