DSF - Tugas Proyek Data Science
DSF - Tugas Proyek Data Science
• Segmentasi APBD berdasarkan nilai APBD, porsi belanja modal, diperlukan dalam hal:
• Evaluasi pengelolaan APBD yang optimal
• Menjadi rujukan dalam prioritas pendampingan Pemda
• Mewujudkan belanja daerah yang lebih bertanggung jawab
Data Understanding
• 542 Tuples
• 6 Variabel
• Tidak terdapat missing values
• Size APBD berkumpul di 500M s.d. 7T
• Bila membandingkan Size APBD dengan variable lainnya,
DKI Jakarta, Jabar, Jateng, dan Jatim merupakan outlier atau
memiliki kecenderungan performa yang luar biasa baik
dibandingkan pemda lainnya. Dalam kasus ini, pemda
tersebut akan dikeluarkan dari dataset.
Data Preparation
2. Select Attributes, karena kolom kodepemda di dataset tidak 4. Setting role kolom Nama Pemda menjadi Id
diperlukan,