Buku Hackathon+ 2021 - HD













FORMULA
YANG BIKIN DATAMU BUNYI
Berbagai pengalaman peserta Kemenkeu Data Hackathon+ 2021
untuk membuat data menjadi informasi yang berharga
Central Transformation Office

Kementerian Keuangan RI
Formula yang Bikin Datamu Bunyi
Pembina: Sekretaris Jenderal Kementerian Keuangan, Staf Ahli bidang OBTI, dan Staf Ahli
bidang Penerimaan Negara
Pengarah: Yan Inderayana, Deny Agung Pribadi, dan Wawan Juswanto

Penulis: Iskandar, Anas Faisal, Bagus Utomo, Muhammad Hadiyan Ridho, Adrianta Ras
Sembiring, Arzak Yuniagi Nugraha, Erfan Fiddin, Andy Pratama, Audra Rizki Himawan,
Maftuh Prihantono, Ian Hermawan, Affan Fais Amrullah, Tau�iq Mahendra, Muhammad
Fajar Nugraha, Prabu Kusuma Nusa Putra, Ika Kartika Sari, Nikodemus Sigit Rahardjo, Hanif
Noer Ro�iq, Yogy Arif Pratama, Beno Pinantau Rohman, Hermawan Effendi, Febrian, Aldi
Pratama, Beta Andri Anggiano Uliansyah, Danar Sutopo Sidig, Bima Jatmiko Abadi, Irvan
Pratama Putra, Ari Sandi Robert, Eko Supriyono, Silvia Arini, Rendra Achyunda Anugrah
Putra, Yesi Febriani, Ceng Kodir, Tau�ik Sukmawan, Diananto Krisnandono, Vitri
Nurmalasari, Hermawan Sudibya, Fajar Eka Prasetyo, Anggar Tri Pamungka, Moch Rifqi
Rizal, M. Abdul Rochim, Siti Arifaatus Saadah, Zhein Adhi Mahendra Setiawan, Defy
Oktaviani, Nabiilatul Arifah, Fajar Dimar Habibi, Caesario Oktanto Kisty, Egi Anggriawan,
Fairuz Su�i Aziz, Dwi Purnomo, Reza Darmawan, Sigit Wahyu Kartiko, Erdhany Dwi Cahyadi,
Catur Panggih Pamungkas, Mohammad Fuad Atmantha, Erick Harmawan, dan Kresia
Ramadanty
Editor: Muhammad Nur, Eva Maulina Aritonang, Muhamad Rahmat
Pengulas: Dody Dharma Hutabarat, Donny Maha Putra, Canrakerta, Lazuardi Zul�ikar
Wicaksana, Lysa Novita Sirait, Sindhu Wardhana, Khomsun Ari�in, Arief Tirtana, Dimas
Rahadian
Desainer gra�is dan perancang sampul : Aditio Wahyudi dan Wida Ha�izah
Penerbit: Central Transformation Of�ice, Sekretariat Jenderal, Kementerian Keuangan,

Gedung Djuanda I Lantai 6, Jalan Dr. Wahidin Raya No. 1, Jakarta 10710. Email:
transformasi@kemenkeu.go.id
Diterbitkan tahun 2022.

Ciptaan disebarluaskan di bawah Lisensi Creative Commons
AtribusiNonKomersial-BerbagiSerupa 4.0 Internasional
(https://creativecommons.org/licenses/by-nc-sa/4.0/deed.id).
Dipersilakan menggunakan sebagian atau seluruh isi buku ini dengan menyebut
sumbernya. Dipersilakan untuk menggunakan, memperbanyak, menggandakan,
membagikan, dan menyebarkan buku ini dengan bentuk, format, dan cara apa pun bukan
untuk tujuan komersial. Dilarang menggunakan, memperbanyak, menggandakan,
membagikan, dan menyebarkan sebagian atau seluruh isi buku ini untuk tujuan komersial.
Perpustakaan Nasional : Katalog Dalam Terbitan

ISBN (Cetak)
ISBN (pdf)
164 halaman; 17.6 x 25 cm

Transformasi organisasi berbasis data analitik (data-driven
organization) merupakan sebuah keniscayaan. Berbicara tentang
data-driven organization, kita tidak hanya berbicara mengenai tools atau
aplikasi, namun juga bagaimana data analitik menjadi bagian dari system,
proses, dan strategi organisasi. Data analitik tidak hanya sekedar menjadi
tren bagi insan yang berminat di bidang data, namun juga dapat menjadi
sebuah budaya kerja bagi seluruh pegawai. Data analitycs memberi ruang
yang luas bagi mereka untuk menyalurkan minat dan mendorong
munculnya inovasi baru bagi organisasi yang sinergi, adaptif, berteknologi,
dan unggul serta mampu memberikan dampak yang lebih kuat dan luas.
Kompetisi Kemenkeu Data Hackathon 2021 bukanlah sekedar
event semata, namun dimaknai sebagai sebuah ikhtiar bersama untuk
membangun budaya data dan melakukan transformasi secara substansial
dan lebih cepat lagi. Kegiatan ini bertujuan untuk menggali ide, insight,
kreati�itas, menemukan talenta, serta meningkatkan kapasitas dan
kepedulian pegawai tentang Data Analytics dalam mendukung organisasi.
Hal ini ditunjukkan dengan banyaknya usecase yang sangat menarik dan
inovatif yang perlu diabadikan dalam sebuah buku agar ide-ide tersebut
tidak berhenti hanya pada level kompetisi.
Buku ini hadir untuk menggugah, memotivasi, membuka

cakrawala, serta inspirasi bagi kita semua sebagai upaya untuk membuat
data lebih berbicara. Bukan hanya untuk kesenangan dan hasrat pribadi,
namun bagaimana pemanfaatan data dapat diimplementasikan serta
menghasilkan arti dan kontribusi bagi negeri.
Yan Inderayana
Daftar Formula
Analisis Ekspor
01 AI Cash Forecasting 02 Komoditas Sumber
hal. 1 Daya Alam Indonesia
(Penerapan Visualisasi Dashboard dan Machine Learning)
hal. 10
Analisis Historis dan Analisis Potensi

03 Prediktif Penarikan 04 Tercapainya Target
Pinjaman Luar Negeri Penerimaan Pajak
(PLN) hal. 26
hal. 17
Analisis Klasifikasi Permasalahan Analisis

05 yang Disampaikan pada Email
06 Pemantauan Risiko
Contact Center INSW Keuangan Global
hal. 31 hal. 39
Analisis Prediktif untuk Analisis Realisasi

07 Memprediksi Harga 08 Pemeliharaan
Objek Lelang Aset Tetap
hal. 48 hal. 54
Analisis Tiket HAI DJPb:

09 Pemodelan Prediksi
Kebutuhan Pelatihan
Satuan kerja
hal. 62
Data Storytelling Project
10 pada Faktur Pajak
Keluaran Identifikasi Kompetensi
11 Pegawai Berbasis Data
hal. 71 Analytics
Jabatanku hal. 80
12 di Masa Depan:
Explorative Project Memprediksi PNBP
Analysis Histori 13 dengan Time series
Pelatihan Pegawai hal. 93
Kementerian Keuangan
hal. 85
Mengawal PelatihanLOKA,
14 Kepercayaan Publik dan 15 Marketplace Pelayanan
Audit yang Berkualitas Pelatihan Pemerintah
melalui Optimalisasi Pusat
Data Profesi hal. 104
hal. 98
Perancangan Benchmark
16 Behavioral Model Wajib Pajak
Sektor Pertambangan SIAS -
Batubara 17 SLDK’S INTEGRATED
hal. 111 ANALYSIS SYSTEM
hal. 117
Use Case Realisasi Anggaran
18 versus RPD: Kreativitas
Engineering
hal. 125 Berapa Nilai Impor Barang?
19 Analisis Regresi Pada
Harmonized System
Debt Sustainability Analytics : hal. 132
20 Upaya Mencegah Krisis
Utang
hal. 139 Nakula Pro : Analisis
21 Keuangan dan Layanan
Publik Daerah yang “Pro”
hal. 149
Analisis Prediktif Kualitas

22 Penjaminan Pelaku UMKM
dalam Rangka Program PEN
hal. 153
Pre-Processing by EDITORs
ompetisi Kemenkeu Data Hackathon 2021 adalah sebuah kompetisi yang

menarik bagi kami. Mungkin kita masih awam tentang data analytics, machine
learning, arti�icial intelligence, dan semacamnya. Namun ternyata, suka atau tidak
suka, kita juga akan terjun ke dalamnya. Analisis data bukanlah sesuatu yang
tabu dan hanya dibicarakan oleh para programmer saja. Kita, orang awam sekalipun saat ini,
dikala orang-orang berkata bahwa ini eranya industri 4.0, sudah selayaknya mulai bisa
mengerti, memahami, atau setidaknya tahu tentang data analytics. Jika dicerna lebih jauh,
saat ini adalah juga eranya semua organisasi untuk memproduksi kebijakan, program,
kegiatan, output, dan outcome yang berbasis data. Dalam konteks ini, perlu juga dipahami
secara sederhana bahwa “data” tidak hanya berupa angka-angka semata. Data, adalah
segala macam informasi yang bisa kita dapatkan, kumpulkan, dan olah lebih lanjut menjadi
bentuk informasi lain yang bisa lebih memiliki “nilai”, “harga”, dan “bunyi”.
Tidak sedikit orang yang mengatakan bahwa “data is a new oil”. Mungkin benar
demikian, karena era ini dapat pula dikatakan bahwa barangsiapa menguasai data
(informasi) maka ia akan menguasai dunia. Untuk bisa menguasai informasi atau data,
dengan meminjam analogi masakan, maka data yang “mentah” tersebut haruslah juga bisa
diolah menjadi sesuatu “menu” baru yang enak dan lezat untuk dinikmati. Artinya, data
mentah yang belum ada artinya atau relatif sulit dibaca oleh orang awam, perlu kita olah,
perlu kita analisis menjadi sesuatu yang lain sehingga data tersebut bisa dibaca, dimengerti,
dipahami dengan mudah oleh semua orang, baik itu manajer, pimpinan tinggi, atau bahkan
orang awam sekalipun. Maka, dalam konteks inilah data analytics menjadi bagian yang
penting dan perlu kita ketahui. Kompetisi Kemenkeu Data Hackaton 2021 ini adalah salah
satu awal mula dari bagaimana orang awam dapat pula mempelajari atau setidaknya
mengetahui mengenai data analytics.
Dalam proses editing naskah-naskah para kompetitor di dalam Kemenkeu Data

Hackaton 2021 Kemenkeu, para editor merasa bahwa dengan pengalih-bahasa-an yang
lebih sederhana maka data analytics bukanlah sesuatu yang harus ditakuti, dianggap
“tinggi” atau hanyalah merupakan mainan dari para programmer saja. Banyak sekali naskah
atau project yang memperlihatkan bahwa terkadang untuk menganalisis data hanya
dibutuhkan kreativitas, berpikir di luar kotak, dan juga bahkan tidak memerlukan coding.
Dengan aplikasi sederhana seperti Microsoft Excel atau yang sedikit lebih advance seperti
Microsoft Power BI Desktop sekalipun sebenarnya kita juga bisa melakukan data analytics.
Melakukan penyuntingan atas naskah luar biasa dari peneliti brillian, tentu menjadi
sebuah kebanggaan. Data yang disajikan oleh para penulis tentu bukan main-main. Butuh
ketelitian, ketekunan dan kegigihan dalam menemukan solusi yang diharapkan. Sehingga,
menjadi sebuah tantangan untuk para editor dalam mencoba menerjemahkan dan
mewarnai ilmu yang beragam agar dapat dilahap oleh semua kalangan. Editor harus
memberanikan diri untuk memperbaiki struktur kalimat agar terlihat singkat tetapi
mengena. Selain itu, meng-edit beberapa gambar-gambar analisa yang tentu saja penting,
agar pembaca dapat dengan mudah memahami gambar dan ilustrasi tersebut. Para penulis
Formula yang Bikin Datamu Bumi - vi
di dalam buku ini menggambarkan secara mudah dan ringkas bagaimana mengolah data
mentah yang tadinya berserakan dan seolah dianggap kurang berharga, terbengkalai
di dalam database, ternyata bisa diolah menjadi sesuatu yang lebih berarti, bisa
menjadi umpan bagi kebijakan organisasi, atau bahkan bisa memberi
makna untuk apa data-data itu selanjutnya dimanfaatkan.
Para penulis di dalam buku ini hanyalah sebagian kecil dari

para kompetitor yang berhasil mendapatkan kemenangan dalam
kompetisi. Namun, yang belum berhasil bukan berarti tidak
bagus. Bisa jadi, beberapa atau bahkan semua data analytics
project dan model-model yang dibuat o l e h
para kompetitor ini adalah sebuah
“berlian” di masa depan. Kreativitas,
kejelian, ketahanan, keuletan, dan
inovasi menjadi kunci keberhasilan
para kompetitor ini.
Editor berharap, ke depannya

data analytics tidak lagi menjadi sesuatu yang sulit
dipahami. Melalui buku ini, editor berharap agar
semua orang dapat lebih mudah memahami data
analytics, termasuk memunculkan ide-ide, kreativitas,
inovasi, dan rasa penasaran lain sehingga muncul lagi
kompetisi-kompetisi serupa atau produk-produk data analytics lain
yang tentu akan sangat bermanfaat bagi organisasi, pimpinan, dan para
pengambil kebijakan. Namun dibalik itu semua, kami para editor sangat
senang mendapat kesempatan untuk menjadi orang pertama yang dapat menyantap
goresan ilmu dalam buku ini.
Semoga dari genggaman pembaca buku ini, akan lahir pula ide dan penelitian baru
yang memberi dampak luas yang positif demi kemakmuran bangsa dan negara.
Tim Editor :
Muhammad Nur, Eva Maulina Aritonang, Muhamad Rahmat
Formula yang Bikin Datamu Bumi -vii

AI Cash Forecasting
Disusun oleh: Iskandar, Anas Faisal, dan Bagus Utomo
engelolaan Utang Negara (Debt Management) dan Pengelolaan Kas
Negara (Cash Management) di Indonesia masih dilakukan oleh Unit
Eselon I yang berbeda. Hal ini mengakibatkan kebijakan pembiayaan
anggaran yang tidak sejalan dengan kebijakan pengelolaan kas dalam hal
kebutuhan dana untuk periode tertentu. Posisi Saldo Kas Negara yang tinggi
pada beberapa tahun terakhir dan cenderung meningkat menunjukkan adanya
mismatch antara penyediaan dana, melalui
pembiayaan anggaran, dan kebutuhan
“...adanya mismatch dana. Hal tersebut meningkatkan Cost of
antara penyediaan dana Fund pemerintah yang dapat dihindari
melalui pembiayaan dengan adanya Prakiraan Kebutuhan Kas
anggaran.” yang memiliki tingkat akurasi yang
diterima oleh pengelola kas negara (Debt
Manager dan Cash Manager).
Beberapa penelitian yang ada mende�inisikan pengelolaan kas negara yang

efektif sebagai kesesuaian antara kapan dana pemerintah tersebut dibutuhkan dengan
kapan dana tersebut dikeluarkan untuk membiayai kegiatan pemerintah. Oleh karena
itu, untuk mewujudkan pengelolaan kas negara yang efektif, kebijakan pembiayaan
anggaran harus memperhatikan posisi kas negara. Upaya untuk memprakirakan
kebutuhan dana di masa yang akan datang menjadi kunci meminimalisir mismatch
antara penyediaan dana dan kebutuhan dana yang pada gilirannya akan mengurangi
cost of fund yang tidak diperlukan. Kami membuktikan bahwa dengan menggunakan
Arti�icial Intelligence (AI) hal tersebut dapat diwujudkan. Dengan dukungan akses data
dan sumber daya yang dimiliki oleh Kementerian Keuangan tingkat akurasi kebutuhan
dana di masa yang akan datang dapat terus ditingkatkan.
Sebagaimana perumpamaan yang sering digunakan untuk menggambarkan

proses pengolahan data, garbage in garbage out, maka peran data analytics sangat
penting. Di era Industry 4.0 saat ini, dimana ketersedian data yang berlimpah, kebijakan
pemerintah haruslah didasarkan pada analisis yang baik. Pemilahan data yang tepat
menjadi hal yang tidak kalah pentingnya dibandingkan dengan pengolahan data yang
kemudian akan menghasilkan informasi yang bisa dijadikan dasar pengambilan
kebijakan. Konsep black-box dalam metode analisis menggunakan pendekatan AI
cenderung membuat kita “tergoda” untuk memasukkan semua data/variabel yang ada
kedalam model/sistem yang kita bangun. Meski konsep black-box merupakan
keunggulan yang sangat bermanfaat, namun berdasarkan pengalaman kami, intuisi
terhadap data/variabel yang digunakan juga diperlukan untuk menghasilkan model
yang diinginkan.
The Interesting Facts

Sebelum melakukan data analytics, kami melakukan studi literatur dan
pencarian informasi untuk menemukan akar masalah atau hal utama yang bisa kami
analisis lebih lanjut. Beberapa fakta menarik kami temukan selama proses
pembelajaran awal kami dan brainstorming ide. Beberapa diantaranya sebagai berikut:
AI Cash Forecasting - 02
01. Sistem Perencanaan Kas Berbasis Laporan RPD
Kementerian Keuangan selaku Chief Financial Of�icer melaksanakan fungsi
Bendahara Umum Negara dengan salah satu core function dalam bidang pengelolaan kas
negara. Dalam rangka pengelolaan kas negara, Kementerian Keuangan sejak tahun 2009
telah menyusun suatu mekanisme perencanaan kas yang secara umum dapat
dikelompokkan menjadi dua kelompok besar. Untuk Belanja K/L, penyusunan perencanaan
kas dilakukan melalui mekanisme penyampaian Laporan Rencana Pencairan Dana (RPD)
oleh seluruh satuan kerja secara berkala (harian, mingguan, dan bulanan) kepada Kantor
Pelayanan Perbendaharaan Negara (KPPN) yang selanjutnya dikonsolidasikan pada tingkat
pusat. Informasi terkait perencanaan kas untuk Belanja K/L tersebut akan di kompilasi
dengan perencanaan kas untuk Belanja BUN yang dibahas dalam forum Asset Liability
Committee (ALCo) dan Cash Planning Information Network (CPIN).
Pada awal penerapannya, seluruh satuan kerja diwajibkan menyampaikan Laporan

RPD untuk semua transaksi pengajuan SPM ke KPPN. Meski telah dilakukan
penyempurnaan mekanisme penyusunan dan penyampaian Laporan RPD - antara lain
dengan penyederhanaan periode pelaporan menjadi Bulanan dan Harian dan hanya untuk
transaksi dengan nilai SPM tertentu saja yang dilaporkan - data yang kami terima
menunjukkan bahwa pada bulan April 2020 saja terdapat 7.147 laporan RPD yang
disampaikan ke KPPN. Dengan kenyataan pencairan dana ke KPPN cenderung meningkat di
akhir tahun, dapat kita perkirakan secara kasar bahwa dalam satu tahun anggaran
setidaknya terdapat 100 ribu laporan RPD yang disampaikan oleh seluruh satker di
Indonesia. Meski dibantu oleh sistem dan teknologi informasi, namun penyusunan laporan
tersebut cukup menguras sumber daya yang ada. Selain itu, dari reviu internal yang
dilakukan, tingkat akurasi RPD yang disampaikan oleh satuan kerja masih belum
memenuhi harapan.
02. Saldo Kas Pemerintah yang Tinggi
Sementara itu, kami juga menemukan fakta bahwa dari sisi ketersedian dana
pemerintah, dalam beberapa tahun terakhir dapat terlihat bahwa terdapat indikasi
tingginya saldo kas pemerintah yang cenderung meningkat. Beberapa penelitian
menyatakan bahwa pengelolaan kas negara yang efektif ditunjukkan melalui kesesuaian
antara kapan dana pemerintah tersebut dibutuhkan dengan kapan dana tersebut
disediakan untuk membiayai kegiatan pemerintah.
Merujuk pada hal tersebut, dapat kita simpulkan bahwa pengelolaan kas negara di
Indonesia belum efektif. Berkaca dari pengalaman Yunani tahun 2010, pengelolaan kas
negara yang tidak dilakukan dengan baik membawa krisis keuangan yang tidak hanya
berdampak pada perekonomian domestik, namun juga perekonomian regional dan global.
Wiliams (2010) menyatakan bahwa prakiraan kas pemerintah dapat disusun

menggunakan dua pendekatan yaitu Bottom-Up (informasi dari spending unit disampaikan
kepada pengelola kas) dan Top-Down (pengelola kas menyusun perencanaan kas
berdasarkan data historis kebutuhan kas yang dimiliki). Selama ini pemerintah Indonesia
lebih menggunakan pendekatan Bottom-Up dalam menyusun perencanaan kas, sementara
pendekatan Top-Down belum banyak dikembangkan. Dalam project ini kami menggunakan
data yang dimiliki Kementerian Keuangan untuk membangun model perencanaan kas.
Selanjutnya, penelitian terdahulu memberikan clues bagaimana membangun model
perencanaan kas dengan menggunakan pendekatan Top-Down. Berbagai metode dan jenis
data yang digunakan menjadi justi�ikasi bagi kami dalam mengunakan metode dan data
untuk membangun model perencanaan kas.
Peneliti Metode yang digunakan Hasil
Iskandar et al. (2017) Statistik dan Machine Learning Akurasi Metode ML lebih baik
(ML)
Sumando et al. (2018) Beragam Metode Statistik untuk Tidak dapat disimpulkan
setiap jenis belanja K/L metode terbaik
Iskandar et al. (2018) Statistik, Machine Learning, dan Meski tidak dapat disimpulkan
Hybrid untuk setiap jenis metode terbaik, data aggregate
belanja dan data aggregate terbukti lebih akurat
Iskandar (2019) Statistik, Machine Learning, dan Akurasi Metode ML (Deep
Hybrid untuk aggregate jenis Learning) lebih baik
belanja K/L
Sautomo dan Pardede (2021) Statistik, Machine Learning Akurasi Metode ML (Deep
(Deep Learning) Learning) lebih baik
Logical Framework
Kedua fakta di atas kemudian mendasari kami selaku Insan Kementerian Keuangan
untuk urun rembug dalam upaya pengelolaan keuangan negara yang lebih baik. Kami
berpendapat bahwa pengelolaan kas negara akan lebih efektif jika pemerintah dapat
mengelaborasi data yang dimiliki oleh Kementerian Keuangan untuk membangun sebuah
model perencanaan kas berbasis arti�icial intelligent (AI). Dengan perencanaan kas yang
memiliki tingkat akurasi yang diterima oleh pengelola kas negara, maka pemerintah dapat
memastikan dana yang dibutuhkan untuk membiayai kegiatan pemerintah tersedia pada
waktu yang tepat sehingga cost of fund yang ada dapat ditekan seminimal mungkin.
Model Development
Model Perencanaan Kas dalam project yang kami buat dibangun dengan tahapan
berikut. Mengikuti penelitian sebelumnya yang menunjukkan bahwa penggunaan data
aggregate terbukti menghasilkan model perencanaan kas yang lebih akurat jika
dibandingkan dengan membangun model perencanaan kas untuk masing-masing jenis
belanja, maka dalam project ini kami menggunakan data harian realisasi belanja K/L yang
merupakan hasil aggregasi dari Belanja Pegawai, Belanja Barang dan Jasa, Belanja Modal,
dan Belanja Bantuan Sosial.
Sebelum digunakan untuk membangun model, terhadap data yang sudah kami
lakukan cleansing akan dipilah terlebih dahulu untuk mengetahui signi�ikansi
masing-masing variabel dalam dataset yang dimiliki sebagai predictor melalui tahapan
attribute selection. Meskipun secara teori menyebutkan bahwa menggunakan predictor
yang dipilih melalui proses attribute selection akan menghasilkan model yang lebih akurat,
pada project ini kami membangun dua model untuk masing-masing metode. Model
pertama menggunakan seluruh variabel dalam dataset yang ada. Sedangkan model kedua
menggunakan variabel terpilih hasil proses attribute selection. Hal ini dilakukan untuk
mengkon�irmasi teori yang ada.
Selanjutnya pada tahapan forecasting, kami menggunakan Metode Statistik, dalam
hal ini ARIMA Model dan metode Machine Learning, dalam hal ini Arti�icial Neuaral
Network. Arti�icial Neuaral Network memiliki beragam arcithecture yang secara umum
dapat dikategorikan menjadi dua, yaitu shallow learning dan deep learning. Meski penelitian
sebelumnya menyebutkan bahwa penggunaan deep learning menghasilkan akurasi yang
lebih baik, namun kami menggunakan keduanya sekaligus untuk memastikan tingkat
akurasi model yang dihasilkan. Untuk memastikan model yang kami pilih merupakan
model yang terbaik yang menghasilkan prediksi dengan tingkat akurasi yang paling akurat,
kami menggunakan metode penilaian kinerja model Mean Absolute Error (MAE), Root,
Mean Squared Error (RMSE), dan Symmetric Mean Absolute Percentage Error (SMAPE).
Berdasarkan teori yang ada, masing-masing metode penilaian kinerja memiliki keunggulan
dan kelemahan. Dengan menggunakan berbagai metode penilaian kinerja, kami berharap
dapat meyakinkan kami bahwa model yang terpilih merupakan model yang terbaik.
The Best Model: GRU method

Secara total ada enam model yang kami bangun. Berdasarkan ketiga metode
penilaian kinerja model, dapat dilihat bahwa model terbaik adalah model yang dibangun
dengan metode GRU, yang termasuk dalam klasi�ikasi deep learning, dan menggunakan data
hasil attribute selection.
Berdasarkan model yang terpilih tersebut, kami lalu membuat sebuah dashboard
yang bisa digunakan oleh Pengelola Kas Negara. Kebutuhan Kas Harian merupakan
gabungan antara Belanja K/L yang diprakirakan oleh model dan Belanja BUN yang telah
diputuskan oleh ALCo dan CPIN. Dashboard yang kami buat ini masih sangat minimalis dan
pastinya perlu pengembangan dan penambahan �itur-�itur tertentu yang dapat membantu
Pengelolaan Kas Negara secara lebih baik lagi ke depannya.
Selanjutnya, pada informasi yang diberi highlight kuning kami harapkan dapat
terkoneksi dengan database yang ada (misalnya SPAN) sehingga lebih memudahkan
Pengelola Kas Negara untuk mengambil keputusan. Jika dashboard ini terkoneksi dengan
SPAN, maka kinerja model dapat terpantu secara real-time. Sementara interkoneksi dengan
data Bank Indonesia akan memudahkan pengelola kas negara untuk mengetahui posisi kas
saat ini dan mengambil keputusan berkenaan hal tersebut.
Simpli�ikasi, Optimalisasi, dan Minimalisasi Cost of Funds
Jika diimplementasikan, project kami diharapkan dapat memberikan dampak secara
nasional dimana lebih dari 23 ribu satuan kerja dan 178 KPPN di seluruh Indonesia akan
merasakan langsung simpli�ikasi proses bisnis. Lebih dari 100 ribu laporan pertahunnya
akan dieliminir dengan penerapan Cash Forecasting Model 4.0 yang kami usulkan. Dampak
tersebut juga akan dirasakan oleh Direktorat Pengelolaan Kas Negara, DJPb yang selama ini
melakukan konsolidasi atas lebih dari 100 ribu laporan tersebut. Lalu dengan perencanaan
kas yang dihasilkan oleh Model yang kami bangun, pemerintah diperkirakan akan memiliki
dana sebesar Rp.150 Triliun per hari yang dapat optimalisasikan. Lebih jauh lagi, dengan
model yang kami bangun, diharapkan pemerintah dapat memilimalisir cost of fund dana
pemerintah sejak dini. Sehingga idle cash pemerintah dapat diminimalisir.
Implementation Strategy
Kami juga telah menyusun strategi implementasi dari project kami, dimana pada
tahapan awal laporan RPD dari Satker K/L masih tetap dipertahankan dengan tetap
dilakukan penyesuaian (�ine-tuning) pada Model Perencanaan Kas yang kami bangun
terhadap data real-time. Ke depannya jika pengelola kas negara telah puas dengan kinerja
model, maka pelaporan RPD dari satuan kerja dapat dihentikan.
AI Cash Forecasting
Metode Machine Learning memiliki variasi yang sangat beragam. Usaha untuk
menemukan metode yang dapat memberikan tingkat akurasi model yang terbaik harus
terus diupayakan. Berdasarkan pengalaman kami, penggunaan data yang berbeda akan
menghasilkan tingkat akurasi yang berbeda pula. Pemilihan data yang tepat akan
menghasilkan tingkat akurasi yang lebih baik. Namun demikian, data tersebut terkadang
sulit diperoleh. Data terkait transaksi keluar masuk dana pemerintah pada Rekening Kas
Umum Negara dapat menjadi alternatif.
Membangun Model Prakiraan Kas berbasis AI terbukti feasible. Kerangka ber�ikir
yang digunakan dalam project ini dapat dijadikan acuan dalam membangun Model
Prakiraan Kas berbasis AI. Project kami juga menunjukkan bahwa menyusun Perencanaan
Kas dengan menggunakan Model berbasis AI dapat memberikan berdampak secara
nasional. Menggunakan pendekatan AI dalam pengelolaan kas negara merupakan hal yang
baru dan dapat menjadi alternatif bagi pendekatan konvensional seperti metode statistik
dan pembobotan sederhana secara manual. Dengan strategi yang telah kami sampaikan
sebelumnya, kami yakin bahwa project yang kami rancang dapat diimplementasikan tanpa
syarat. Dari perspektif regulasi, kami tidak melihat ada peraturan yang harus disesuaikan
agar project kami dapat diimplementasikan.
Posisi saldo kas negara yang tinggi dan cenderung meningkat menunjukkan bahwa
pengelolaan kas negara di Indonesia belum efektif. Kami berharap data analytic project
yang kami ajukan dapat memberi sumbangsih pada pengelolaan kas negara yang lebih baik
di masa depan. Lebih lanjut kami melihat bahwa kebijakan penarikan pembiayaan yang
dilakukan oleh Debt Manager kurang mempertimbangkan saldo kas pemerintah. Hal ini
disebabkan belum tersedianya prakiraan kebutuhan kas yang memenuhi harapan dari
pengelola kas negara, dalam hal ini Debt Manager. Kami berharap model perencanaan kas
yang kami susun, dapat memberikan keyakinan yang memadai dan menjadi bahan
pengambilan keputusan terkait kebijakan penarikan pembiayaan. Dengan demikian maka
cost of fund pemerintah dapat diminimalisir.
02
Analisis Ekspor
Komoditas Sumber
Daya Alam Indonesia
(Penerapan Visualisasi Dashboard dan
Machine Learning)
Disusun oleh: Muhammad Hadiyan Ridho,

Adrianta Ras Sembiring, dan Arzak Yuniagi Nugraha
Use Case Realisasi Anggaran versus RPD: Kreativitas Engineering - 06

Komoditas Potensial, Penerapan Machine Learning
ndonesia terkenal sebagai negara dengan kekayaan sumber daya alam yang
melimpah. Pemanfaatan sumber daya alamnya menghasilkan bahan pangan, bahan
baku industri, sumber energi, dan produk jadi yang bernilai tinggi. Melimpahnya
kuantitas dan baiknya kualitas komoditas sumber daya alam yang dihasilkan Indonesia,
berpotensi ekspor ke negara lain. Wajar, jika Indonesia menjadi negara pengekspor
terbesar untuk beberapa komoditas sumber daya alam seperti minyak sawit, kopi, kakao,
vanili, karet, dan sebagainya.
Namun, terdapat beberapa isu terkait ekspor komoditas sumber daya alam.
Pertama, adanya isu untuk membatasi ekspor sumber daya alam ke luar negeri. Ekspor
bahan mentah perlu dialihkan kepada ekspor produk jadi yang mempunyai nilai lebih.
Kedua, dibutuhkan pengenaan bea keluar terhadap komoditas tertentu. Sehingga,
Kementerian Keuangan melalui DJBC, perlu melakukan pengawasan (pemeriksaan �isik)
terhadap ekspor komoditas tersebut. Ketiga, diperlukan sebuah usaha untuk menggali
potensi negara tujuan ekspor. Sehingga akan membuka pasar baru untuk dimasuki oleh
produk-produk asal Indonesia.
Berdasarkan ide-ide tersebut, dibutuhkan data analytic untuk menemukan insight
baru sebagai masukan kebijakan. DJBC membutuhkan pemetaan terhadap komoditas dan
negara tujuan potensial, bagi ekspor komoditas sumber daya alam, dan penerapan machine
learning untuk mendeteksi pelanggaran di bidang kepabeanan khususnya ekspor
komoditas sumber daya alam.
Untuk mencapai analisa komperehensif terhadap ekspor komoditas sumber daya
alam, kami masih menemukan kendala. Proyek ini masih membutuhkan helicopter view,
terhadap proses bisnis ekspor komoditas sumber daya alam yang beririsan di berbagai
instansi pemerintah. Sehingga dapat menghasilkan keandalan hasil analisa. Oleh sebab itu
kami mencoba untuk membuat sebuah prototype dengan menggunakan data DJBC, SLDK
Kementerian Keuangan, dan instansi lain.
Tujuan & Dampak

Proyek ini, dikembangkan dengan tujuan:
1. Menyediakan visualisasi data kegiatan ekspor komoditas sumber daya dalam bentuk
dashboard yang menampilkan:
Statistik umum (General Statistic) Pemetaan negara potensial yang

ekspor komoditas sumber daya menjadi tujuan ekspor komoditas
alam sektor pertambangan, perke- sumber daya alam;
bunan, kehutanan, dan perikanan;
Analisis Ekspor Komoditas Sumber Daya Alam Indonesia - 11

2. Pemanfaatan Machine Learning untuk melakukan analisa terhadap potensi pelanggaran
dan/atau kekurangan penerimaan negara dari kegiatan ekspor komoditas sumber daya
alam;
3. Penyediaan data sebagai bahan masukan dalam penyusunan kebijakan ekspor sumber
daya alam.
Penyelesaian proyek ini, diharapkan memberikan dampak:

1. Adanya dashboard yang menyajikan data secara komprehensif mengenai kegiatan
ekspor komoditas sumber daya alam. Dengan adanya dashboard diharapkan dapat
memberikan informasi (insight) baru yang dibutuhkan oleh pembuat keputusan
terkait:
a. Monitoring realisasi nilai dan volume ekspor, realisasi penerimaan negara (Bea
Keluar), dan hubungannya dengan faktor-faktor lain yang berpengaruh terhadap
nilai realisasi tersebut (misalnya nilai tukar rupiah terhadap dollar, harga patokan
ekspor, harga pasar komoditas, jumlah produksi dan konsumi dalam negeri);
b. Memberikan informasi kepada eksportir mengenai komoditas potensial dan potensi
negara tujuan ekspor. Sehingga mendorong pelaku usaha untuk dapat menjangkau
pasar internasional.
2. Meningkatkan e�isiensi pengawasan oleh Bea dan Cukai terhadap kegiatan ekspor
komoditas sumber daya alam melalui penggunaan machine learning dalam penentuan
(memprediksi) kegiatan ekspor yang berpotensi adanya kesalahan dalam
pemberitahuan jumlah dan jenis barang.
3. Apabila kedua dampak tersebut berjalan efektif, maka akan berpotensi untuk dapat
meningkatkan penerimaan negara.
Kebutuhan Data
Kebutuhan data Proyek ini diperoleh dari:
1. Sumber Internal
Data kegiatan ekspor komoditas sumber daya alam, dengan HS Code yang terlampir
dalam KMK Nomor 1523 Tahun 2019. Data yang digunakan adalah data BC 3.0, Surat
Penetapan Perhitungan Bea Keluar (SPPBK) periode 2017-Agustus 2021 dan data SLDK
Kementerian Keuangan.
2. Sumber Eksternal
a. Data importasi sumber daya alam pada negara-negara di dunia dengan rentang waktu
2017-2021 yang bersumber dari UN-Comtrade.
b. Data produksi dalam negeri atas komoditas sumber daya alam.
c. Data konsumsi dalam negeri atas komoditas sumber daya alam.

Data Pre-processing
Proyek ini menggunakan pendekatan CRISP-DM, dengan melewati tahapan data
understanding, data cleansing, dan data engineering. Aplikasi yang digunakan untuk
melakukan data pre-processing adalah Rapid Miner dan Python. Dalam tahap ini, proses
yang dilakukan sama seperti data pre-processing pada umumnya. Kami memahami struktur
data yang dimiliki dan menyamakan periode dari data tersebut. Pemahaman struktur data
merupakan hal penting dan perlu sebuah usaha agar setiap anggota dalam tim memiliki
konsep dan pandangan yang sama.
Tahap selanjutnya adalah data celansing dan data engineering. Tahap ini dapat
dikatakan menjadi tahap yang membutuhkan waktu paling lama. Dalam tahap ini, kami
mendapat banyak saran dan ilmu baru yang diberikan oleh Coach. Kami mendapat banyak
ilmu terkait coding apa yang paling baik untuk menyiapkan data.
Modelling
Setelah semua data telah berhasil dikumpulkan dan disiapkan, dilakukan
pemilihan model yang paling tepat untuk memenuhi tujuan proyek ini. Pada analisa ini
digunakan beberapa metode antara lain:
1. Visualization, digunakan untuk menampilkan atau mempresentasikan data terstruktur
maupun tidak terstruktur. Metode ini, juga digunakan untuk menampilkan informasi
yang tersembunyi. Sedangkan untuk visualisasi data dan dashboard, menggunakan
aplikasi Power BI. Dashboard digunakan untuk menampilkan secara sekilas tentang
indikator kinerja atas suatu proses bisnis tertentu.
2. Logistic Regression untuk mengukur hubungan antara satu variabel dengan variabel
yang lain. Model ini digunakan untuk memprediksi nilai yang menjadi target
berdasarkan variabel-variabel yang menjadi input.
Visualisasi Dashboard Kegiatan Ekspor Sumber Daya Alam

Gambar tersebut, merupakan visualiasi atau tampilan dashboard secara umum.
Pada bagian kiri tree map, menunjukkan 10 komoditas ekspor potensial dari sumber daya
alam. Dashboard komoditas tersebut, memberikan informasi bahwa diantara 10 komoditas
tertinggi, terdapat 8 komoditas berasal dari sektor pertambangan. Pada diagram batang
dan diagram pie di sebelah kanan menunjukkan komoditas ekspor sumber daya alam yang
sudah dibagi ke empat sektor yaitu pertambangan, perikanan, perkebunan dan kehutanan.
Diagram tersebut jelas menginformasikan bahwa sektor pertambangan mendominasi
ekspor sumber daya alam.
Kami mengangkat 3 sampel komoditas potensial yaitu batubara, gas bumi dan
minyak mentah. Deskripsi berdasarkan kode HS terdapat pada slicer kiri atas. Kemudian,
saya membuat diagram batang negara tujuan ekspor terbesar komoditas tertentu,
batubara. Diagram tersebut dibuat dengan data yang diperoleh dari Direktorat Jenderal Bea
dan Cukai. India menjadi negara tujuan ekspor batubara tertinggi dari Indonesia diikuti
oleh 4 negara lainnya. Pada bagian kiri gambar, selain deskripsi terdapat slicer negara
tujuan dan tanggal eksportasi. Pada diagram batang bawah, ditampilkan 10 negara tertinggi
yang mengimpor komoditas yang sama, batu bara. Diagram tersebut dibuat menggunakan
data dari UN Comtrade. Negara Jepang dan Korea tidak termasuk dalam 5 negara tujuan
ekspor untuk batubara, hal ini mengimplikasikan bahwa ekspor batubara dapat
dimaksimalkan ke 2 negara tersebut yaitu Jepang dan Korea. Analisa yang sama dapat
diterapkan di komoditas-komoditas lainnya.
Machine Learning, Proyeksi Kekurangan Penerimaan Negara

Perlu dipahami, bahwa dalam melakukan kegiatan eksportasi, komoditas tertentu
dikenakan bea keluar. Kami mencoba membuat Analisa identi�ikasi komoditas yang akan
terkena SPPBK. Kami menggunakan pendekatan algoritma Machine Learning yang nantinya
digunakan sebagai Early Warning System.

Fitur yang digunakan diantaranya Pelabuhan Muat Akhir, Negara Tujuan, HS Code,
Uraian Barang, Jenis Satuan dan Flag SPPBK. Pada tahap data pre-processing, dilakukan
standarisasi atas kalimat pada Fitur yang digunakan seperti menghilangkan tanda baca,
menghilangkan angka, menerjemahkan Bahasa Indonesia ke Bahasa Inggris,
menghilangkan slang word dan sebagainya.
Langkah selanjutnya adalah feature extraction. Memberikan pembobotan nilai
pada kalimat, dengan metode algoritma Term Frequency-Inverse Document Frequency
(TF-IDF). Tahap berikutnya, feature engineering dengan metode One Hot Encoding. Metode
ini merepresentasikan data bertipe kategori sebagai vektor biner yang bernilai integer 0
dan 1. Semua elemen akan bernilai 0, kecuali satu elemen yang bernilai 1, yaitu elemen yang
memiliki nilai kategori tersebut.
Pemodelan Machine Learning diawali dengan pemisahan data training dan data
test. Setelah itu, menggunakan beberapa algoritma diantaranya Decission Tree, Logistic
Regression, Linear SVM, K-Nearest Neighbour. Tahap terakhir, melakukan evaluasi atas
model Machine Learning yang digunakan dengan metode F1 Score. Gambar berikut ini akan
menunjukkan prototype mockup design Early Warning System yang digunakan.
Terakhir, kami berharap gagasan-gagasan yang dituangkan, minimal dapat memicu

awareness para pembaca dan pemangku kebijakan terhadap potensi ekspor yang dimiliki
oleh Indonesia.

Download Versi Digital di :
https://bit.ly/BudayaData

Analisis Historis dan
Prediktif Penarikan
Pinjaman Luar
Negeri (PLN)
Disusun oleh:
Erfan Fiddin, Andy Pratama, Audra Rizki Himawan
“Pengalaman yang kami terima dalam
mengikuti lomba ini adalah berkesempatan
untuk melakukan aktualisasi terhadap ilmu
yang dimiliki.”
Erfan - Andy - Audra
Analisis Historis dan Prediktif Penarikan Pinjaman Luar Negeri - 18

injaman Luar Negeri (PLN) merupakan salah satu instrumen yang dimanfaatkan
pemerintah dalam pembiayaan anggaran. Instrumen tersebut di antaranya
digunakan untuk mendanai proyek secara langsung dan spesi�ik (earmarked) dalam
rangka percepatan pembangunan. Keluaran dari kegiatan PLN tersebut dapat terlihat
langsung dan dirasakan manfaatnya. Namun, terdapat dampak sampingan yang timbul dari
permasalahan manajemen proyek. Dampak tersebut berupa keterlambatan yang
menyebabkan munculnya biaya tambahan atas keterlambatan dan potensi keusangan
teknologi pada output PLN.
Untuk mengatasi permasalahan tersebut, pemerintah memerlukan suatu acuan

alternatif yang objektif untuk mengukur potensi keterlambatan penyelesaian kegiatan yang
dibiayai PLN, tambahan waktu yang diperlukan untuk menyelesaikan kegiatan PLN, dan
estimasi biaya yang timbul atas keterlambatan kegiatan PLN. Namun demikian, pemerintah
masih menghadapi permasalahan dalam melakukan asesmen terhadap tiga fokus utama
tersebut sehingga pemerintah sulit mengukur manfaat dari suatu keputusan atas
kelanjutan kegiatan tersebut. Hal tersebut menimbulkan potensi penggerusan kapasitas
�iskal dan penurunan kemampuan APBN dalam mendukung pertumbuhan ekonomi
Indonesia.
Dalam pemantauan kegiatan yang dibiayai dengan PLN, diperlukan metode yang
dapat memberikan indikasi potensi keterlambatan penyelesaian kegiatan. Indikasi potensi
keterlambatan berfungsi sebagai early warning system untuk Direktorat Jenderal
Pengelolaan Pembiayaan dan Risiko (DJPPR) dan pemangku kepentingan yang berkaitan
dengan kegiatan PLN. Dengan demikian, seluruh pihak dapat menyusun rencana mitigasi
untuk mengatasi akar masalah yang menyebabkan keterlambatan tersebut. Dengan
demikian, kondisi pelaksanaan proyek berubah dari kondisi yang buruk menjadi lebih baik
dan dapat meminimalkan kebutuhan tambahan waktu. Upaya tersebut juga sejalan dengan
fokus dalam memastikan delivery manfaat kegiatan tersebut tepat waktu dan tepat guna
sesuai dengan perencanaan yang telah ditetapkan.
Namun demikian, tidak jarang perpanjangan waktu penyelesaian kegiatan tersebut
dilakukan beberapa kali sebagai implikasi dari lemahnya perencanaan oleh Executing
Agency. Untuk menguji usulan perpanjangan oleh Executing Agency, pemerintah
memerlukan metode yang memadai untuk mengestimasi kebutuhan perpanjangan waktu
dengan mengacu pada kegiatan yang sejenis pada masa lampau. Metode yang digunakan
sebagai pembanding yang objektif tersebut memberikan kemampuan bagi DJPPR untuk
mengukur kualitas perencanaan kegiatan yang diusulkan untuk diperpanjang target
penyelesaiannya.
Dalam pengambilan keputusan untuk memperpanjang availability period pinjaman,
pemerintah perlu menghitung biaya setelah dilakukan perpanjangan availability period.
Dalam beberapa portofolio kegiatan PLN, terdapat pengenaan biaya atas komitmen
pinjaman yang belum ditarik (commitment fee). Pada saat negosiasi dengan pemberi
pinjaman, pemerintah memperhitungkan seluruh biaya tersebut termasuk commitment fee.
Dalam hal hasil estimasi biaya tersebut berada dalam level kesanggupan (appetite),
Pemerintah akan menyepakati perjanjian pinjaman.

Keterlambatan penyelesaian kegiatan PLN yang menimbulkan perpanjangan
availability period pinjaman akan mengakibatkan bertambahnya commitment fee. Dengan
disusunnya metode yang dapat menghitung biaya akibat perpanjangan availability period
pinjaman, pemerintah memiliki pertimbangan yang lebih matang dalam menetapkan
keputusan perpanjangan availability period pinjaman.
Dengan memperhatikan ketiga fokus di atas, muncul urgensi untuk membangun
suatu sistem yang dapat memberikan indikasi potensi keterlambatan pelaksanaan
kegiatan, tingkat keterlambatan kegiatan, serta biaya akibat perpanjangan availability
period pinjaman. Hal ini untuk memastikan bahwa kegiatan yang dibiayai dengan PLN
tersebut memang layak untuk diprioritaskan agar dapat selesai tepat waktu dan dapat
memberikan dampak bagi masyarakat melalui pelaksanaan APBN yang sehat dan
berkesinambungan.
Adapun tujuan dari sistem ini adalah untuk memberikan analisis terkait:
1. Early warning system terhadap kemungkinan keterlambatan pelaksanaan kegiatan yang

dibiayai dengan PLN;
2. Estimasi dari tambahan waktu yang diperlukan untuk menyelesaikan kegiatan
berdasarkan trajectory terkini; dan
3. Estimasi biaya akibat perpanjangan availability period pinjaman.
Ketiga tujuan tersebut mendukung pengambilan keputusan terhadap

keberlangsungan kegiatan dan manajemen risiko kegiatan yang dibiayai dengan PLN.
Dalam merumuskan solusi, sistem ini menggunakan pendekatan ekonometrik

dengan melakukan analisis data panel. Dengan pendekatan tersebut, maka dilakukan
langkah sebagai berikut:
1. Membangun model ekonometrika dengan data time series untuk mengestimasi
trajectory penarikan PLN hingga berakhirnya availability period pinjaman berdasarkan
tingkat penarikan dan waktu yang telah terlewati (elapsed time) serta karakteristik
kegiatan.
2. Membangun model untuk mengestimasi waktu penyelesaian proyek PLN berdasarkan
perencanaan yang telah ditetapkan dan dirancang dalam perjanjian pinjaman.
3. Menyusun analisis perkiraan biaya yang dapat muncul atas keterlambatan penyelesaian
proyek PLN.

Dalam memahami permasalahan bisnis, ada permasalahan yang dihadapi. Apabila
dikembalikan pada de�inisi berdasarkan PMBOK Edisi Keenam Tahun 2017, tidak dapat
dipungkiri bahwa setiap proyek memiliki keunikan masing-masing baik dari sisi spesi�ikasi,
komponen, proses, keluaran dan dampak, pendokumentasiannya, serta aspek yang lain.
Dengan demikian, dapat dipahami bahwa semua proyek yang dikerjakan oleh pemerintah
tidak dapat serta merta langsung dibandingkan tanpa penyesuaian.
Agar dapat mengkonstruksi benchmark, aspek perkembangan proyek dinotasikan

sebagai disbursement ratio dan aspek waktu dinotasikan sebagai elapsed time ratio.
Disbursement ratio menunjukkan perbandingan antara dana yang telah ditarik oleh
pemerintah dan nilai komitmen pinjaman. Elapsed time ratio merupakan persentase waktu
yang telah terlewati dibandingkan dengan masa penyelesaian proyek.
Pemahaman Data (EDA)
Data yang digunakan dalam model adalah data historis penarikan pinjaman luar
negeri yang digunakan untuk membiayai kegiatan pemerintah yang ditandatangani sejak
tahun 2011 dan masa penarikannya berakhir pada tahun 2020. Penggunaan periode
tersebut mempertimbangkan awal berlakunya rezim pengaturan pinjaman luar negeri
yang sesuai dengan Peraturan Pemerintah Nomor 10 tahun 2011 mengenai Tata Cara
Pengadaan Pinjaman Luar Negeri dan Penerimaan Hibah.
Selain itu, data pinjaman yang digunakan adalah pinjaman yang mekanisme
penarikannya menggunakan skema pembayaran langsung dan Letter of Credit (L/C). Hal ini
untuk memastikan bahwa penarikan pinjaman mere�leksikan kinerja pelaksanaan kegiatan
yang dibiayai.
Dari data dengan karakteristik tersebut, dilakukan pengelompokkan kegiatan

menjadi 3 kategori, yaitu:
1. Multi kontrak- Fisik
Kegiatan yang memiliki lebih dari satu kontrak dengan banyak penyedia barang dan
jasa dan membutuhkan pengadaan lahan. Terdapat 20 perjanjian pinjaman untuk jenis
kegiatan ini;
2. Multi kontrak-non Fisik

Kegiatan yang memiliki lebih dari satu kontrak dengan banyak penyedia barang dan
jasa dan tidak membutuhkan pengadaan lahan. Terdapat 20 perjanjian pinjaman untuk
jenis kegiatan ini;
3. Pembelian barang
Kegiatan yang hanya memiliki satu kontrak dengan satu penyedia barang dan jasa.
Terdapat 129 perjanjian pinjaman untuk jenis kegiatan ini.

Statistik deskriptif dari data dimaksud dapat dilihat pada gra�ik sebagai berikut:
Gra�ik di atas menunjukkan terdapat perbedaan antara ketiga kelompok kegiatan

tersebut. Secara umum, pada kegiatan Multi Kontrak Infrastruktur dan Multi Kontrak Non
Infrastruktur membutuhkan waktu beberapa saat sebelum terdapat progres kegiatan yang
membutuhkan pembayaran dari pinjaman dengan bentuk S-Curve. Sementara, pada
kegiatan pembelian barang, penarikan dana pinjaman sudah dilakukan sejak awal dengan
bentuk kurva eksponensial. Dari sisi sebaran data, pada kegiatan Multi Kontrak Non
Infrastruktur dan Pembelian Barang cenderung konvergen pada akhir masa penarikan
pinjaman dan bergerak menuju penarikan terhadap seluruh fasilitas pinjaman.
Selain itu, ditemukan beberapa hal yang dapat menyebabkan permasalahan dalam
penyusunan project analytic ini. Pertama, diperkirakan terdapat data anomali pada ketiga
kelompok kegiatan yang bisa dikategorikan sebagai pencilan. Hal ini disebabkan bahwa
adanya kegiatan yang dalam perjalanannya mengalami kendala yang dapat meliputi antara
lain perubahan kebijakan, permasalahan lahan, maupun faktor politik luar negeri yang
mengakibatkan terkendalanya penarikan pinjaman.
Temuan berikutnya adalah dalam dua rentang waktu terjadinya penarikan
pinjaman, terdapat idle time yang dapat menimbulkan anggapan bahwa dalam kurun waktu
tersebut tidak dilakukan pelaksanaan kegiatan. Sementara itu, yang terjadi adalah terdapat
beberapa ketentuan pada perjanjian pinjaman terkait batas minimum penarikan dana dan
ketentuan terkait termin pembayaran. Temuan terakhir, terdapat keterbatasan dalam data
pinjaman yang tersedia. Hal ini merupakan kewajaran mengingat data dimaksud tidak
bersifat high frequency data. Temuan yang didapat pada tahap ini akan dijadikan sebagai
dasar untuk melakukan pengolahan data untuk mendapat data yang lebih memadai.
Preprocessing (Cleansing dan Engineering)

Terkait temuan pada tahap EDA, dilakukan langkah sebagai berikut:
1. Terkait temuan terkait data penarikan yang berpotensi menimbulkan persepsi bahwa
tidak ada progress pelaksanaan kegiatan yang dibiayai dengan pinjaman, dilakukan
smoothing data dengan menerapkan kenaikan penarikan pinjaman secara linear;
2. Terhadap temuan atas keterbatasan data, kami melakukan pembagian setiap data
historis penarikan ke dalam 100 selang elapsed time ratio (ETR), sehingga data yang
didapat menjadi memadai;
3. Untuk temuan mengenai data pencilan yang disebabkan faktor eksternal, dilakukan
pengujian terhadap tingkat anomali data. Dilakukan pembersihan data bahwa jika
suatu pinjaman lebih dari 50% histori penarikannya berada di luar area mean + 2
standar deviasi, maka pinjaman tersebut dikeluarkan dari data observasi;
4. Pada beberapa pinjaman dari lembaga multilateral, terdapat proses pengembalian dana
yang dikategorikan sebagai ineligible expenditure. Pada project ini, setiap pengembalian
dana tersebut dikeluarkan dari data observasi karena akan menimbulkan anomali
bahwa terdapat penurunan total penarikan dana pinjaman;
5. Salah satu amandemen perjanjian yang dilakukan adalah pembatalan sebagian fasilitas
pinjaman. Hal ini dapat menimbulkan kesalahpahaman bahwa penarikan pinjaman
yang telah dilakukan sudah cukup tinggi. Hal ini tidak sejalan dengan tujuan project
analytic ini yang ingin mengukur kemungkinan waktu yang dibutuhkan untuk
menyelesaikan penarikan atas seluruh pinjaman. Untuk itu, digunakan nilai pinjaman
sebelum dilakukan amandemen tersebut.
Berdasarkan proses cleansing tersebut, maka didapat 12 pinjaman multi kontrak �isik, 12
pinjaman multi kontrak non �isik, dan 112 pinjaman pembelian barang.
Modelling dan Evaluasi

Dalam melakukan analisis panel data, pendekatan yang digunakan mengacu pada James H.
Stock dan Mark W. Watson pada buku Introduction to Econometrics edisi kedua yang
menyampaikan:
“The key insight is that if the unobserved variable does not change over time, then any
changes in dependent variable must due to in�luences other than these �ixed
characteristics”
Untuk itu, dilakukan panel data analisis untuk menguji �ixed effect, random effect, dan
common effect berdasarkan pinjaman dan selang waktu etr. Adapun sistematika pemilihan
model yang dilakukan adalah sebagai berikut:
Berdasarkan pendekatan tersebut, metode seleksi model yang dilakukan adalah sebagai
berikut:
1. Untuk penentuan penggunaan Fixed Effect dan Random Effect pada data, dilakukan
pengujian Hausman Test dengan null hypothesis untuk tidak terdapat perbedaan atas
penggunaan Fixed Effect.
2. Dalam hal Fixed Effect yang digunakan, maka dilakukan uji parameter dengan Hausman
Test.
3. Dalam hal tes pada butir (1) mengarah pada Random Effect atau tes pada butir (2)
menunjukkan kegagalan pada uji parameter, maka dilakukan uji Breusch-Pagan
Lagrangian Multiplier untuk memilih antara Random Effect atau Common Effect.
Berdasarkan metode seleksi tersebut, maka pada ketiga kategori pinjaman
tersebut, digunakan Common Effect menggunakan model ekonometrika Squared Least
Dummy Variable (SLDV) dengan data time series untuk mengestimasi trajectory penarikan
PLN hingga berakhirnya availability period pinjaman berdasarkan tingkat penarikan dan
waktu yang telah terlewati (elapsed time) serta karakteristik kegiatan.
Pada model tersebut kemudian dilakukan uji antara lain Jarque-Bera Test untuk uji
normalitas error Breusch-Pagan untuk uji heteroskedastisitas error, Durbin Watson Test
untuk uji autokorelasi pada error, dan uji Variance In�lation Factor (VIF) untuk uji
multikolinearitas. Hal ini dilakukan untuk memastikan bahwa tidak terdapat
permasalahan pada analisis yang dilakukan. Adapun dari seluruh pengujian yang
dilakukan, terdapat permasalahan pada normalitas error. Hal ini akan dicoba untuk diatasi
pada masa mendatang jika data yang tersedia sudah lebih memadai.
Key Takeaways
Dalam penyusunan solusi dari project analytic ini, kami mengedepankan
simplisitas baik dari sisi data yang diperlukan dan analisis yang dilakukan. Hal ini
mengingat parameter yang digunakan dalam model adalah data yang sehari-hari bisa
diakses oleh para stakeholder pada aplikasi internal. Hal ini sangat penting karena
bertujuan untuk mempermudah para pemangku kepentingan dalam melakukan replikasi
dan memahami hasil analisis, sehingga akan memberikan keyakinan untuk
mengimplementasikan project ini.
Selain itu, telah dibangun desain visualisasi dan akses terhadap analisis dan solusi
preskriptif yang diberikan. visualisasi tersebut dapat diakses melalui website dan aplikasi
pesan singkat WhatsApp dengan hak akses terbatas. Adapun tampilannya adalah
sebagaimana gambar berikut:
Di masa mendatang, dalam hal data yang tersedia sudah lebih memadai, dapat
dilakukan pengukuran untuk pinjaman kegiatan yang memiliki karakteristik berbeda
seperti: (1) skema penarikan rekening khusus, (2) modalitas Program for Result, dan
lain-lain. Hal ini mengingat banyaknya modalitas baru dalam karakteristik pinjaman yang
dilaksanakan pemerintah.

Pengalaman Menarik
Pengalaman yang
kami terima dalam mengikuti
lomba ini adalah
berkesempatan untuk
melakukan aktualisasi
terhadap ilmu yang dimiliki. Kami
pun dapat mengukur hasil analisis dan desain
aplikasi yang dibangun kepada pihak luar unit kami
bekerja. Hal tersebut dengan harapan untuk mendapatkan
masukan dari perspektif yang berbeda.
Selama mengerjakan proyek ini, selain mendapatkan

feedback dari internal DJPPR, kami mendapatkan feedback
dari lomba ini berupa sharing pengalaman dan saran
perbaikan baik dari coach dan juri. Coach dari Kemenkeu
Data Hackathon 2021 memberikan kontribusi yang
signi�ikan dalam mempertajam business case ini salah
satunya adalah membantu agar project ini dapat
mengungkapkan keluaran yang bersifat preskriptif untuk
membantu pengambilan keputusan oleh pimpinan.

Analisis Potensi
Tercapainya Target
Penerimaan Pajak
Disusun oleh: Maftuh Prihantono
ercapainya target penerimaan pajak menjadi tantangan yang tidak mudah. Kita
tidak saja bicara mengenai pajak pekerja, tapi juga perusahaan, pengusaha, sampai
yang sedang “hot issue” yakni UMKM. Sebagai pegawai pada unit yang mengawasi
Direktorat Jenderal Pajak atau disebut Inspektorat Jenderal, saya memiliki keresahan
terhadap sulitnya target penerimaan pajak, tercapai. Terutama beberapa tahun belakangan
ini. Permasalahan ini, harus dioptimalkan.
Menggunakan pengetahuan yang saya miliki, saya putuskan untuk menjalankan
proyek ini, sendiri. Mungkin proyek ini sedikit terlihat kurang maksimal, karena saya
masih memiliki keterbatasan dalam penentuan variabel prediksi penerimaan. Namun
dengan berbagai keterbatasan, saya meyakini pengetahuan yang sedikit ini akan membuka
jalur perhatian banyak pihak, sehingga membentuk pola sinergi untuk kemudian mengem-
bangkannya menjadi analisa data yang semakin optimal.
Reformasi Pajak melalui Self Assessment System
Dalam rangka meningkatkan reformasi di bidang perpajakan dan meningkatkan

penerimaan pajak, Direktorat Jenderal Pajak (DJP) menyempurnakan sistem administrasi
pemungutan pajaknya. Mekanisme of�icial assessment system diubah menjadi self
assessment system.
Masyarakat atau Wajib Pajak diberikan kebebasan untuk menghitung,

memperhitungkan, menyetorkan dan melaporkan kewajiban pajaknya sendiri sesuai
ketentuan berlaku. Kemudahan memenuhi kewajiban perpajakannya ini, bukan saja
satu-satunya tujuan utama. Tujuan lainnya adalah meningkatkan transparansi di bidang
perpajakan, mengurangi, dan mempersempit penyalahgunaan wewenang pegawai pajak
(�iscus) terhadap masyarakat atau Wajib Pajak.
Rasio Pajak
Tingkat keberhasilan DJP dalam menggali potensi-potensi pajak, dalam
meningkatkan penerimaan sektor pajak dapat dilihat melalui rasio pajak (tax ratio)
Indonesia. Rasio pajak merupakan perbandingan antara jumlah penerimaan pajak dengan
Produk Domestik Bruto (PDB). Semakin besar rasio pajak, semakin besar penerimaan
pajak yang dihimpun oleh DJP. Semakin kecil rasio pajak, semakin kecil penerimaan pajak
yang dihimpun oleh DJP.
Berdasarkan data pada www.oecd.org/southeast-asia/data/tax.ht, rasio pajak

Indonesia sejak tahun 2016 s/d 2019 sebesar 12,01%, 11,61%, 11,97% dan 11,59%. Rasio
pajak Indonesia tersebut tergolong rendah, jika dibandingkan dengan negara-negara lain
yang memiliki kondisi perekonomian yang hampir sama dengan Indonesia.
Analisis Potensi Tercapainya Target Penerimaan Pajak - 27

Berdasarkan data laporan realisasi APBN yang telah diaudit oleh Badan Pemeriksa
Keuangan (BPK) dan laporan keuangan pemerintah pusat yang dapat diakses pada situs
https://www.bpk.go.id/lkpp, ringkasan realisasi penerimaan perpajakan dapat dilihat pada
gra�ik berikut:
Ekstensi�ikasi Variabel yang Perlu
DJP persisten melakukan optimalisasi penerimaan pajak, melalui peningkatan

akurasi pemeriksaan pajak serta melakukan penambahan jumlah wajib pajak
(ekstensi�ikasi). Pemeriksaan pajak dilakukan untuk menguji kepatuhan yang wajib pajak.
Sedangkan ekstensi�ikasi wajib pajak, dengan cara meningkatkan jumlah wajib Pajak.
Peningkatan penerimaan pajak, juga dipengaruhi oleh faktor ekternal seperti

pertumbuhan ekonomi. Pertumbuhan ekonomi yang baik akan menciptakan kondisi
perekonomian yang kondusif. Perekonomian yang kondusif ini akan memicu kinerja
ekonomi pelaku usaha sehingga laba yang diperoleh semakin meningkat. Peningkatan laba
akan memicu peningkatan pendapatan bagi pelaku usaha yang kemudian berlanjut pada
peningkatan konsumsi. Dengan adanya peningkatan konsumsi ini pada akhirnya akan
menambah pendapatan negara khususnya dari sektor PPN dan PPNBM. Instrumen utama
pengukur tingkat pertumbuhan ekonomi di Indonesia adalah Produk Domestik Bruto
(PDB). Analisis terhadap PDB ini dapat digunakan sebagai acuan untuk menilai
pertumbuhan ekonomi di Indonesia.

Selain hal-hal yang telah disebutkan diatas, efekti�itas pencapaian penerimaan pajak
juga dipengaruhi variabel-variabel lainnya. Sumber daya manusia dan sumber daya
anggaran. Sumber daya manusia tercermin dalam jumlah pegawai aktif terutama yang
berkaitan langsung dengan penerimaan pajak. Sedangkan sumber daya anggaran tercermin
dalam daftar isian pelaksanaan anggaran (DIPA) DJP.
Pada tahun 2020, DJP memiliki memiliki pegawai sebanyak 46.305 yang terbagi
menjadi beberapa peran, baik struktural maupun fungsional (Laporan Tahunan DJP 2020).
Variabel lain yang tidak kalah penting, yang dapat mempengaruhi ketercapaian penerimaan
pajak yaitu kinerja perusahaan-perusahaan (wajib pajak) multinasional. Data yang
tercermin dalam laporan keuangan emiten dalam Bursa Efek Indonesia (BEI).
Proyeksi Dampak Bisnis

Analisis yang saya lakukan, bertujuan untuk mengetahui dan memprediksi unit kerja
yang berpotensi tidak mencapai penerimaan yang ditargetkan. Sehingga DJP dapat
mengambil langkah-langkah strategis yang dapat membantu unit kerja dalam mencapai
penerimaan berdasarkan variabel-variabel yang mempengaruhi.
Dampak yang diharapkan dari analisis ini adalah sebagai berikut:
1. Menjadi bahan pertimbangan bagi DJP dalam melakukan realokasi dan refocusing
sumber daya. Memberikan perhatian lebih, terhadap satuan kerja yang diprediksi tidak
mencapai target penerimaan di masa datang. Sehingga, diharapkan dengan perhatian
dan realokasi sumber daya dapat meningkatkan kinerja unit satuan kerja dan
penerimaan dapat tercapai;
2. Sebagai bahan evaluasi atas ketercapaian penerimaan pajak;
3. Menjadi salah satu dasar/pertimbangan bagi Inspektorat Jenderal dalam pemilihan
sampel satuan kerja yang akan diawasi lebih mendalam;
4. Deteksi dini penyebab ketidaktercapaian penerimaan pajak per unit kerja. Sehingga
dapat menentukan langkah-langkah strategis meningkatkan ketercapaian penerimaan
pajak, dengan ekstensi�ikasi pajak, intensi�ikasi pajak, menambah pegawai, maupun
kegiatan extra effort lainnya.
Klasi�ikasi dan Visualisasi Prediksi

Metode dan pendekatan yang saya gunakan dalam proyek ini adalah klasi�ikasi dan
visualisasi. Metode ini akan menentukan, memprediksi, dan menampilkan unit kerja yang
berpotensi mencapai/tidak mencapai target penerimaan.
No Kebutuhan Data Kategori Sumber Data
1 Data target Penerimaan per Kantor Data Internal Sistem Layanan Data Kementerian
Pelayanan Pajak Keuangan
2 Data realisasi penerimaan per Kantor Data Internal Sistem Layanan Data Kementerian

No Kebutuhan Data Kategori Sumber Data
3 Data jumlah pegawai per per Kantor Data Internal Sistem Layanan Data Kementerian
4 Data piutang pajak per Kantor Data Internal Sistem Layanan Data Kementerian
5 Data Daftar Isian Penggunaan Data Internal Sistem Layanan Data Kementerian
Anggaran (DIPA) per Kantor Keuangan
Pelayanan Pajak
6 Data pertumbuhan ekonomi Data Eksternal Badan Pusat Statistik
7 Data Indeks Pembangunan Manusia Data Eksternal Badan Pusat Statistik

per wilayah
8 Data tingkat pengangguran terbuka Data Eksternal Badan Pusat Statistik
9 Data laporan keuangan perusahaan Data Eksternal Bursa Efek Indonesia

terbuka
Saya melakukan simulasi atas data dummy, sehingga dapat divisualisasikan

beberapa hal berikut ini:
1. Visualisasi penerimaan pajak per unit kerja berdasarkan data train (dummy).
2. Prediksi ketercapaian target penerimaan, berdasarkan data dummy menggunakan

beberapa data variabel. Data tersebut antara lain jumlah pegawai yang dibagi
berdasarkan pegawai yang berperan sebagai AR dan fungsional pemeriksa pajak, jumlah
piutang pajak, nama kanwil, dan jumlah wajib pajak.

Analisis Klasifikasi
Permasalahan
yang Disampaikan
pada Email Contact
Center INSW
Disusun oleh: Ian Hermawan, Affan Fais Amrullah,
dan Taufiq Mahendra
“Kompetisi Kemenkeu Data Hackathon 2021 adalah sebuah
moment untuk Tim ini. Kami melihat tantangan dan wadah, mencetak
perubahan dengan praktik data science dan data analytics. Because
data is the new gold, and we are sitting on top of it. Istilah tersebut yang
menjadi pegangan kami dalam mencari pendekatan dan membuka
ruang berpikir tim. Penelitian ini harus melahirkan ide liar tak terbatas
tanpa terpaku pada dampak yang diinginkan. Prinsipnya data yang
ada, harus menelurkan manfaat.”
Analisisi Klasifikasi Permasalahan pada email CS INSW - 32

Pemahaman Bisnis
Kami akhirnya memutuskan untuk mengangkat isu masalah yang disampaikan
lewat email contact centre INSW. Permasalahan yang disampaikan lewat email contact
center INSW, sangat beragam. Agent contact center diharuskan membaca, memahami,
mengecek dan mengklasi�ikasikan informasi permasalahan secara manual. Selain itu
tingkat kecepatan memahami permasalahan pengguna jasa, oleh tiap-tiap agent tidaklah
sama. Hal tersebut cukup memerlukan waktu yang berpengaruh pada kecepatan
penyelesaian permasalahan. Oleh sebab itu, diperlukan sebuah sistem informasi dan
rekomendasi solusi yang dapat membantu agent menyelesaikan permasalahan tersebut.
Pemahaman Data (EDA)

Analisis data dan pembangunan model pada penelitian ini, menggunakan data
dengan tipe format .eml dan .meta. Data tersebut merupakan data hasil export dari aplikasi
email client zimbra dengan ukuran total 4,31 GB (unzipped) atau 2,63 GB (zipped).
1. Parsing �ile .eml menjadi Pandas DataFrame
Python dengan sejak versi 3.6+, sudah dibekali modul internal untuk memproses
data email, melalui email.message. Namun karena constraint waktu dan keterbatasan
knowledge saya atas module tersebut, diputuskan untuk menggunakan library pihak ketiga
yang bernama mail-parser untuk parsing �ile .eml. Saya menggunakan snippet code berikut
ini untuk melakukan parsing data .eml :
def readEmail():
top = os.getcwd()
masterobj = []
for subdir, dirs, files in os.walk(top):
for filename in files:
filepath = subdir + os.sep + filename
if filepath.endswith(".eml"):
obj = []
with open(f'{filepath}', 'rb') as �dl:
raw_email = �dl.read()
try:
mail = mailparser.parse_from_bytes(raw_email)
obj.extend((
mail.from_,
mail.to,
mail.text_html,
mail.text_plain,
mail.subject
))
masterobj.append(obj)
except:
print("error")
return masterobj
masterobj = readEmail()
df = pd.DataFrame(masterobj, columns=['from',
'to','html_body','plain_body','subject'])
Analisisi Klasifikasi Permasalahan pada email CS INSW -33
2. Menggabungkan multi-receiver menjadi satu string
Beberapa item email yang ditarik datanya, memiliki lebih dari satu penerima.
Sehingga diputuskan untuk menggabungkan penerima email, dengan separator pipe (|)
menggunakan snippet code berikut:
def lstToStringName(a):
data = a
name = ""
try:
for idx, x in enumerate(data):
if len(data) > 1 and idx != len(data):
name += x[0] + " | "
else:
name += x[0]
except:
pass
return name
def lstToStringAddress(a):
data = a
address = ""
try:
for idx, x in enumerate(data):
if len(data) > 1 and idx != len(data):
address += x[1] + " | "
else:
address += x[1]
except:
pass
return address
df['from_name'] = df['from'].apply(lstToStringName)
df['from_address'] = df['from'].apply(lstToStringAddress)
df['to_name'] = df['to'].apply(lstToStringName)
df['to_address'] = df['to'].apply(lstToStringAddress)
df.drop(columns=['from', 'to','html_body'], inplace=True)
3. Data Shape, Head dan Null Values

import missingno as msno
: df.shape
In [459] :
%matpotlib inline
: (9496, 6)
msno.matrix(df)
Out [459] : <AxesSubplot:>

4. Data Shape dan jumlah email yang ditujukan ke alamat info@insw.go.id
(setelah data null dihapus)
In [464] : df.shape
Out [464] : (8134, 6)
In [466] : df[df[’to_address’].str.contains(’info@insw.go.id’)].shape
Out [466] : (2371, 6)
5. Word Cloud
Preprocessing (Cleansing dan Engineering)

Data text yang kami miliki, terdapat banyak noise yang mengganggu proses analisis
data. Sehingga, perlu dilakukan prosedur standar dalam cleansing data text. Setelah
melakukan cleansing, ditemukan fakta bahwa model pada machine learning tidak terlalu
‘bersahabat’ dengan huruf atau kata-kata. Sehingga, perlu dibuat representasi huruf dan
kata-kata dalam bentuk angka. Metode representasi yang digunakan adalah Term
Frequency – Inverse Document Frequency (TF-IDF).
1. Standard Text Processing

Kami melakukan beberapa prosedur yang biasa dilakukan dalam proses
‘membersihkan’ data berbentuk text. Konversi huruf menjadi lowercase, menghilangkan
karakter berupa angka, menghilangkan tanda baca, dan menghilangkan spasi yang
berlebih. Selain itu, dilakukan penyaringan kata-kata stopwords dari NLTK dan beberapa
kata yang diambil secara manual. Berikut snippet code yang digunakan:
def cleanText(a):
text = a
text = text.lower()
text = re.sub(r"\d+", "", text)
text = text.translate(str.maketrans("","",string.punctua�on))

text = text.strip()
return text
df['plain_body'] = df['plain_body'].apply(cleanText)
df['subject'] = df['subject'].apply(cleanText)
dfToinfo = df[df['to_address'].str.contains('info@insw.go.id',
regex=False)]
dfFrominfo = df[df['from_address'].str.contains('info@insw.go.id',
regex=False)]
stop_words = set(stopwords.words('indonesian'))
stop_words.update(stopwords.words('english'))
stop_words.update(['insw','pt','re', 'world', 'ptparkland', 'sistem',
'indonesia', 'need','informa�on', 'chris�na', 'hd', 'jkb', 'gies�an',
'nadya'])
2. Feature Engineering menggunakan TF-IDF

Seperti yang sudah disebutkan sebelumnya, data berbentuk text harus
direpresentasikan dalam angka yang lebih friendly dibaca oleh model. Kami menggunakan
representasi TF-IDF, karena TF-IDF dapat memberi pembobotan kata yang dianggap
penting atau tidak dalam sebuah model. Selain itu, secara umum, performa dari TF-IDF
lebih baik daripada Bag-of-Words sederhana. Berikut snippet code yang digunakan:
from sklearn.feature_extraction.text import T�idfVectorizer
vect = T�idfVectorizer(stop_words=stop_words, max_df=0.50, min_df=3)
X = vect.�it_transform(dfToinfo['subject'] + ' ' + dfToinfo['plain_body'])

Model yang digunakan dalam analisis ini adalah K-Means Clustering. Penentuan
jumlah cluster yang optimal menggunakan Silhouette Scoring, yang memiliki nilai antara -1
dan 1, dengan semakin mendekati 1 maka klaster semakin baik.
1. Let’s plot our data �irst

2. Mencari jumlah cluster paling optimal menggunakan Silhouette Scoring
Terlihat dari gambar jumlah klaster 4 dan 5 kurang begitu optimal, karena terdapat
klaster yang memiliki silhouette score di bawah rata-rata. Kemudian, ukuran plot antar
klaster tidak seragam. Sedangkan untuk jumlah klaster 2 dan 3, semua skor klaster di atas
skor rata-rata dan ukuran plot relatif seragam. Sehingga, dengan pertimbangan hasil
klastering yang lebih bervariatif, diputuskan untuk menggunakan jumlah klaster 3.
3. Fit and predict the model

Setelah mendapatkan jumlah 3 klaster yang optimal. Maka proses training sekaligus
clustering dapat dimulai. Setelah training selesai, dilakukan plot cluster tiap-tiap data
dengan warna-warna yang berbeda. Berikut adalah hasilnya:

4. Evaluate the model
Pada ketiga klaster tersebut, terdapat pattern permasalahan yang muncul, yaitu :
Cluster 1 : Permasalahan Request Registrasi User / Akun INSW
Cluster 2 : Permasalahan menyangkut User (Lupa Password, Gagal Login, dll)
Cluster 3 : Permasalahan terkait transaksi (COO, SSm QC, PIB, dll)
Kesimpulan/Key Takeaways
Metode representasi TF-IDF yang digunakan untuk data text dan clustering model
K-Means, membentuk suatu model untuk mengklasi�ikasikan data email menjadi tiga
kategori. Email terkait request registrasi user, permasalahan akun dan permasalahan
transaksional. Pada penelitian berikutnya diharapkan dapat dikembangkan model lain,
yang dapat mengklasi�ikasikan email secara lebih mendalam. Penggunaan neural network
atau supervised learning dengan labeling manual terlebih dahulu, mungkin dapat
memperkaya penelitian ini.
Apa yang terlintas dalam benak kita, bisa menjadi awal dari sesuatu yang luar biasa.
Komunikasikan ide dengan atasan, rekan, dan senior yang berpengalaman. Diskusikan
objek permasalahan dan goals yang ingin didapat. Menggunakan data analytics adalah hal
wajib yang harus dilakukan. Mengangkat semuanya dalam satu kompetisi, akan
menentukan sekuat apa ide tersebut dapat bermanfaat.
Never stop Learning. Dunia data science sangat luas dan nggak pernah habis untuk
dieksplorasi, akan terus ada yang baru. Jadi, teruslah belajar.

Analisis
Pemantauan Risiko
Keuangan Global
Disusun oleh: Muhammad Fajar Nugraha, Prabu
Kusuma Nusa Putra, dan Ika Kartika Sari
“Emerging markets cannot “afford” a repeat of the 2013 “taper tantrum” market
disruption that occurred when the US Federal Reserve signalled a sooner-than-ex-
pected withdrawal of stimulus, sparking a surge in global borrowing costs.”
Gita Gopinath, IMF Chief Economist (Financial Times, 2021)
su normalisasi kebijakan moneter Amerika Serikat (AS) menjadi

perbincangan hangat di berbagai media dunia terutama pada paruh kedua
2021. Banyak pihak, termasuk Kementerian Keuangan, mewanti-wanti
langkah The Fed (bank sentral AS) untuk memulai tapering off
(pengurangan quantitative easing) dan menaikkan suku bunga acuan. Reaksi ini
tidak mengherankan, mengingat pengalaman pahit berbagai negara atas
krisis-krisis keuangan sebelumnya, khususnya Taper Tantrum 2013. Dalam hal ini,
keputusan AS (selaku raksasa ekonomi dunia) untuk mulai menarik stimulus
moneter dikhawatirkan akan menimbulkan �inancial contagion effect1 yang
menjalar ke pasar keuangan global yang semakin terintegrasi dan mengganggu
pemulihan ekonomi di tengah pandemi Covid-19 yang masih berjalan.
1Dornbusch et al. (2000) mende�inisikan �inancial contagion sebagai penyebaran gangguan pasar dari satu negara
ke negara lain, yang diamati melalui pergerakan bersama dalam nilai tukar, harga saham, spread obligasi, dan arus
modal.
Analisis Ekspor Komoditas Sumber Daya

Analisis Alam Indonesia
Pemantauan Risiko - 40
10
Taper Tantrum 2013: Lesson Learned
Taper tantrum 2013 dimulai ketika Ben Bernanke (Gubernur The Fed saat itu)
menyampaikan rencana pengurangan quantitative easing2 (QE) dalam pidatonya di bulan
Mei 2013. Investor melihat langkah ini sebagai tanda pemulihan AS berjalan kuat pasca
krisis keuangan global. Namun di sisi lain, pernyataan The Fed menimbulkan gejolak cukup
besar di pasar keuangan global.
Taper tantrum 2013 menciptakan volatilitas di pasar keuangan global, terutama

negara berkembang. Sentimen pasar memburuk dan indeks volatilitas naik tajam.
Indonesia turut mengalami dampak taper tantrum melalui capital out�low, depresiasi nilai
tukar (hingga ke 14ribu/USD di 2015) dan kenaikan imbal hasil SBN (Surat Berharga
Negara) 10 Tahun (5,45% di Mar 2013 dan 8,39% di Sep 2013). Tidak hanya itu, Indonesia
(bersama Afrika Selatan, Brazil, India, dan Turki) disebut sebagai The Fragile Five atau
kelompok negara yang mengalami tekanan besar akibat Taper Tantrum 2013.
Risiko Taper Tantrum Jilid II
Seperti halnya saat taper tantrum 2013, isu normalisasi kebijakan moneter AS
mencuat di 2021 didorong oleh pemulihan ekonomi AS yang terus menguat pasca krisis
(pandemi Covid-19). Ekonomi telah tumbuh positif sejak Q1 2021, in�lasi naik ke >5% sejak
Mei (target 2%), dan tingkat pengangguran terus menurun.
Tren positif ini di satu sisi adalah hal baik, namun juga membuka potensi penarikan
stimulus yang sebelumnya digelontorkan secara masif (a.l. menurunkan suku bunga ke
0,25% dan melakukan QE USD120 miliar/bulan sejak Juni 2020). Hingga Oktober 2021,
estimasi waktu tapering off dan kenaikan suku bunga masih terus berubah, artinya
ketidakpastian memang masih tinggi. Namun, pengalaman taper tantrum 2013 seharusnya
membuat kita belajar untuk mewaspadai risiko spillover ke Indonesia.
Dari perspektif macro-account, adanya syok pada sektor keuangan global, dalam hal
ini tapering off, dapat berdampak pada: 1) sektor eksternal melalui aliran modal keluar
akan mempengaruhi komponen investasi portofolio dalam Neraca Pembayaran; 2) moneter
melalui pelemahan nilai tukar; 3) Pemerintah melalui kecenderungan kenaikan imbal hasil
SBN di seluruh tenor; hingga 4) sektor riil. Kenaikan imbal hasil SBN akan menekan belanja
negara karena biaya bunga utang yang lebih tinggi. Padahal, saat ini Indonesia masih butuh
sumber pembiayaan dalam jumlah besar untuk memperkuat pemulihan ekonomi. Pada
akhirnya, efek syok akan merambat ke sektor riil yang berpotensi menghambat laju
pertumbuhan ekonomi.
2Quantitative easing (QE) merupakan kebijakan moneter non-konvensional berupa pembelian aset keuangan (a.l. obligasi
Pemerintah) dalam jumlah besar yang bertujuan untuk menambah likuiditas, mengurangi suku bunga dan mendorong arus
kredit ke bisnis/konsumen
Analisis Pemantauan Risiko - 41

Waspada, Antisipatif dan Responsif
Meskipun kepastian terkait kapan tapering off ini akan benar-benar dilakukan masih
belum jelas, efek rambatan ke ekonomi global termasuk Indonesia pasti terjadi. Untuk itu,
yang perlu kita lakukan setidaknya adalah bersikap waspada, antisipatif, dan responsif.
Berangkat dari latar belakang tersebut, kami mengajukan dua alat bantu utama berupa
Simulasi Dampak dan Dasbor Pantauan untuk melakukan monitoring dan analisis,
sekaligus sebagai early warning system bagi pimpinan dan analis Kementerian Keuangan
terkait risiko keuangan global dimaksud.
1. Simulasi Dampak Syok Ekonomi Global Terhadap Pasar Keuangan Indonesia
Simulasi diharapkan dapat menjadi alat bantu bagi pengambil kebijakan untuk
mengestimasikan dampak kenaikan VIX Index (menangkap faktor volatilitas) maupun
US Treasury 10 Tahun (menangkap kondisi likuiditas global) terhadap empat indikator
keuangan Indonesia, yaitu arus modal pasar Surat Berharga Negara (SBN), yield SBN,
nilai tukar, serta Indeks Harga Saham Gabungan (IHSG).
Simulasi menghasilkan interpretasi bahwa adanya syok keuangan global melalui
proxy kebijakan moneter AS (US Treasury 10 Tahun) dan volatilitas global (VIX)
berpengaruh pada keluarnya arus modal dari pasar obligasi, penurunan indeks saham,
depresiasi nilai tukar, dan peningkatan yield obligasi Indonesia dengan tingkat
signi�ikansi α=1%.
Variable dependen: imbal Time frame: data harian Regresi dengan e-Views 10.
hasil SBN 10 tahun, nilai Jan 2024 - 24 Sep 2021. Metode GARCH dengan prinsip parsimonious.
tukar rupiah, indeks harga
Data Bloomberg Tingkat Signi�ikansi atau
saham Indonesia.
dianggap sudah bersih
Variable independen: dan sesuai dengan
Imbal hasil obligasi AS 10 standar market.
tahun & indeks volatilitas.
Sumber: Bloomberg, CEIC,
SLDK
Keterangan variabel: ID10Y = yield obligasi Indonesia 10 Tahun, IDR = nilai tukar rupiah,
IDEQ = IHSG, NFBOBLIGASI = arus modal dari pasar obligasi Indonesia, US10Y = yield
obligasi AS, VIX = indeks volatilitas saham global
Hasil Simulasi Regresi

Mean NFBOBLIGAS
ID10Y IDEQ IDR
equation I
C 1.429995*** 10.27974*** 9.905869*** 9.288986***
US10Y 0.423806*** -0.696306*** -0.397070*** -1.304881 ***
VIX 0.107314*** -0.450266*** -0.067083*** -0.804959***

2. Dasbor Pantauan Risiko Pasar Keuangan Global
Sesuai dengan nama tim kami “Parsimonious”, dalam penyusunan dasbor pantauan
ini digunakan prinsip parsimonious theory: menggunakan sumber daya dan penjelasan
sesederhana mungkin, namun dapat menggambarkan dan memberikan dampak yang
sangat besar untuk menjelaskan sebuah fenomena.
Dasbor ini, bertujuan untuk memonitor perkembangan risiko global dalam

frekuensi tinggi yang dipicu oleh faktor ekonomi maupun non-ekonomi yang berpotensi
memiliki efek �inancial contagion kepada perekonomian dan sistem keuangan Indonesia.
Berikut ini adalah alur pembuatan dasbor beserta penjelasannya.
Alur Pembuatan Dasbor
Pemilihan Variabel dan Indikator

Penentuan variabel dan indikator merupakan hal yang sangat krusial, kami
menyebutnya sebagai peletakan batu pertama untuk pondasi dalam pembangunan dasbor
yang kuat dan dapat diandalkan. Data-data tersebut kami kelompokkan dalam tiga kategori
utama, yaitu volatilitas global, moneter global, dan aset keuangan global, dengan data input
dari Bloomberg, CEIC, dan SLDK.
1. Volatilitas Global
Variabel-variabel kategori volatilitas merupakan variabel yang menggambarkan

pergerakan dan posisi harian terkini atas risiko maupun sentimen keuangan global yang
berpotensi berdampak pada guncangan perekonomian global.
● VIX Index (CboE Volatility Beberapa indikator utama untuk memantau

Index), pergerakan harian serta posisi terkini atas risiko
● Financial Stress Index Emerging maupun sentimen keuangan global. Gauge chart
Market dan Amerika Serikat, serta menunjukkan posisi indikator pada hari terkini
● Treasury Euro Dolar (TED) (normal, siaga, atau tertekan).
Spread.

Twitter Market Uncertainty Memantau sentimen pasar keuangan yang
berkembang melalui sosial media Twitter.
Simulasi Dampak Syok Ekonomi Alat bantu bagi pengambil kebijakan, untuk
Global menghitung dampak syok ekonomi global
terhadap indikator-indikator pasar keuangan
Indonesia.
2. Moneter Global
Kategori ini digunakan untuk memonitor perkembangan kebijakan moneter seluruh

negara dan memantau leading indicators ekonomi AS (antisipasi potensi tapering off).
Dalam tangkapan layar dasbor, beberapa negara telah menaikkan suku bunganya didorong
tingkat in�lasi yang tinggi. Ekonomi AS juga menunjukkan hal serupa, dengan in�lasi jauh
melampaui target dan tingkat pengangguran terus menurun, dan hal ini patut diwaspadai
karena memperbesar potensi tapering off.
3. Aset Keuangan Global
Indikator-indikator dalam menu ini berfungsi untuk memantau pergerakan nilai

aset keuangan suatu negara, khususnya yield SBN masing-masing negara. Dengan
membandingkan yield SBN di negara-negara berkembang yang memiliki credit rating
setara dengan Indonesia, pengambil kebijakan di Indonesia dapat menyusun strategi
pricing SBN-nya dengan optimal.
Penyiapan Data
Tahapan berikutnya adalah mengolah data mentah menjadi bahan yang siap untuk
disajikan (visualization). Tahapan yang dilakukan:
1. Unduh data dari sumbernya dalam format excel dihubungkan langsung ke server
Bloomberg dan CEIC update secara otomatis dan real-time;
2. Data cleansing missing data dan data-data yang tidak digunakan; dan
3. Data formatting penyesuaian dengan bentuk tableau database untuk memudahkan
dalam melakukan visualisasi. Selain itu, data-data tersebut juga disiapkan sebagai data
input dalam perhitungan model simulasi dampak.
Visualisasi Data
Visualisasi dasbor menggunakan aplikasi Tableau karena mudah untuk dipelajari,
mempunyai tampilan menarik, dan mudah dipahami. Dalam dasbor ini, kami ingin
menampilkan indikator-indikator terpenting untuk memantau risiko pasar keuangan
global.

Tidak hanya data historis dan data ter-update, namun juga menampilkan early
warning system antara lain dalam bentuk gauge chart. Selain itu, simulasi dampak syok juga
diintegrasikan ke dalam dasbor supaya users dapat melakukan perhitungan sendiri untuk
memperkirakan estimasi efek goncangan global ke pasar keuangan Indonesia.
Tangkapan Layar Dasbor Pantauan Risiko Pasar Keuangan Global

Sumber: Dasbor Pantauan Risiko Pasar Keuangan Global di website Parsimoni-
ous https://parsimoniousteam.wixsite.com/my-site
Visualisasi dasbor tersebut dikembangkan secara web-based dan aplikasi

smartphone untuk �leksibilitas dan mempermudah akses bagi semua users. Dengan
demikian, users dapat melakukan monitoring dan analisis keuangan global, serta
melakukan simulasi dampak gejolak kapanpun dan di manapun.

Kita tidak akan pernah memenangkan suatu peperangan jika tidak mengetahui posisi
dan risiko yang dihadapi saat ini. Proyek data analytic yang berfungsi sebagai
surveilans risiko ekonomi dan keuangan mampu menjadikan Indonesia lebih
waspada, antisipatif, dan responsif atas berbagai risiko eksternal yang dapat
mengganggu stabilitas sistem keuangan Indonesia
-Tim Parsimonious-
Analisis
Analisis Ekspor Komoditas Sumber Pemantauan
Daya Risiko-- 46
Alam Indonesia 16
Analisis Prediktif
untuk Memprediksi
Harga Objek Lelang
Disusun oleh: Nikodemus Sigit Rahardjo,
Hanif Noer Rofiq, Yogy Arif Pratama
Tujuan dari proyek ini adalah untuk mengidenti�ikasi
potensi besaran hasil lelang. Hasil proyeksi tersebut dapat
digunakan untuk memproyeksikan penerimaan negara
khususnya PNBP Lelang (MAP 425782) yang berasal dari
penjualan BMN. Proses identi�ikasi tersebut dilakukan
dengan membuat visualisasi data terkait Lelang BMN.
Analisis Prediktif untuk Memprediksi Harga Objek Lelang - 48

elang merupakan salah satu tugas dan fungsi utama Direktorat Jenderal Kekayaan
Negara (DJKN) yang menghasilkan penerimaan negara. Sejak 2017, tiap kantor
vertikal wajib melaporkan data lelangnya melalui dua cara, yaitu pelaporan KEP-96
dan dropbox.
Sebagai pengelola aset, DJKN memiliki daftar Barang Milik Negara (BMN) milik
seluruh satuan kerja. Dari data BMN tersebut, kami mencoba untuk mengkombinasikan
dengan data historis berupa hasil lelang BMN untuk memperkirakan harga penjualan BMN
yang akan dilelang.
Tujuan dari proyek ini adalah untuk mengidenti�ikasi potensi besaran hasil lelang.
Hasil proyeksi tersebut dapat digunakan untuk memproyeksikan penerimaan negara
khususnya PNBP Lelang (MAP 425782) yang berasal dari penjualan BMN. Proses
identi�ikasi tersebut dilakukan dengan membuat visualisasi data terkait Lelang BMN. Kami
juga menggunakan machine learning model regresi untuk membuat perkiraan mengenai
harga lelang yang akan terbentuk.
Tujuan lain dari projek ini adalah untuk mengukur kualitas data dari laporan
dropbox. Untuk itu, kami mengambil sampel berupa data BMN agar bisa disandingkan
dengan data BMN yang ada. Hal tersebut dilatarbelakangi oleh ketersediaan data yang
berasal dari hadil input.
Data yang kami gunakan berasal dari folder/�ile sharing Dropbox Lelang untuk
periode laporan tahun 2017-2021. Regulasi yang berlaku saat ini mengatur bahwa
mekanisme pelaporan kinerja lelang dilakukan melalui �ile/folder sharing (Aplikasi
Dropbox). Data tersebut merupakan data transaksi lelang yang diadakan oleh unit
vertikal/kantor operasional DJKN berupa BMN dan Barang Milik Daerah (BMD) yang
berbentuk barang bergerak dan tidak bergerak milik kementerian/lembaga.
Kegiatan analisis ini dilakukan dengan menggunakan Python dengan teknik data
engineering sederhana. Secara umum langkah yang kami lakukan dalam melakukan analisis
ini adalah sebagai berikut:
Data Gathering
Proses pengumpulan data dilakukan dengan membuat permintaan secara resmi
melalui nota dinas permintaan data sekaligus permohonan izin untuk menggunakan data
terkait Lelang dan BMN pada direktorat teknis terkait selaku pemilik data. Namun, kami
hanya memperoleh data lelang saja, sehingga visualisasi data maupun data preprocessing
yang dilakukan hanya menggunakan data lelang.
Exploratory Data Analysis (EDA)

Data Preparation: Informasi dataset sebagai berikut:

No Uraian Keterangan
1 Data Data Transaksi Lelang
2 Periode 2017 - 2021
3 Dimensi 79410 rows x 59 columns
4 Format data .xlsx
Dataset tersebut beberapa tantangan, yaitu:

1. Format dataset yang diperoleh dari tahun 2017-2021 memiliki feature data yang
berbeda, sehingga perlu dilakukan penyeragaman terlebih dahulu sebelum data
dikompilasikan. Proses penyeragaman dan kompilasi dilakukan secara manual.
2. Banyak feature data yang memiliki nilai null atau 0 sampai 90% dan ke atas, sehingga
tidak semua feature data kompilasi digunakan dalam proses analisis.
3. Inputan data yang salah, tidak standar, dan tidak sesuai dengan format sebenarnya.
Data Cleansing
Feature data yang telah kami seleksi untuk digunakan dalam analisis ini adalah
‘KPKNL’, 'URAIAN BARANG', 'JENIS LELANG', ‘JENIS PENAWARAN’, ‘SIFAT BARANG’, ‘NILAI
LIMIT’, ’JAMINAN PENAWARAN LELANG’, ‘BEA LELANG PEMBELI’, ‘KATEGORI PEMOHON
LELANG/PENJUAL’, ‘TAHUN LAPORAN’, ‘STATUS LELANG’ dan ‘POKOK LELANG’. Terhadap
data tersebut kemudian dilakukan proses cleansing data untuk mendeteksi dan
memperbaiki (atau menghapus) data/format data yang corrupted dan tidak akurat.
Misalnya, pada URAIAN BARANG, informasi seharusnya yang diinput adalah untuk
satu barang yang dilelang tiap baris data. Namun, pada data yang tersedia, data yang diinput
adalah beberapa barang yang dilelang dalam satu baris data. Akibatnya, nilai-nilai yang
tercantum pada kolom lainnya tidak menggambarkan untuk satu barang saja, namun untuk
beberapa barang. Sehingga hal ini dapat mempengaruhi hasil evaluasi dan prediksi yang
dilakukan.
Data cleansing menghasilkan feature data yang baru yaitu ‘MEDIA LELANG’ dan
‘TIPE LELANG’ yang berasal dari feature ‘JENIS PENAWARAN’. Untuk feature data yang
bersifat numerik memerlukan dua tahap proses normalisasi/tranformasi data untuk
menghasilkan nilai skew yang lebih baik. Hasilnya sebagai berikut :

Sementara, untuk feature data yang bersifat non numerik/data kategori akan
dilakukan proses ekstraksi data untuk menghasilkan beberapa kategori sesuai dengan
kandungan informasi yang ada. Hasilnya sebagai berikut :
Hasil data cleansing tersebut yang akan digunakan untuk proses data modelling.
Data Modelling
Proses selanjutnya adalah melihat seberapa besar tingkat korelasi antara
independent feature dengan dependent feature/target. Hasilnya adalah sebagai berikut :
Gra�ik Korelasi
Analisis korelasi menggunakan matriks korelasi untuk menjelaskan hubungan antar
dua variabel sehingga dapat diambil kesimpulan variabel mana yang akan digunakan dalam
pemodelan untuk memprediksi hasil lelang.
Dari hasil tingkat korelasi di atas, kami hanya menggunakan feature data yang
memiliki nilai 0,005 dan ke atas (nilai ini kami tentukan sesuai dengan tingkat kualitas data
saat ini). Feature data dimaksud adalah sebagai berikut:
1. 'TAP' [0]
2. 'WANPRESTASI' [1]
3. 'BATAL' [2]
4. 'MEDIA_LELANG_LENC' [3]
5. 'TIPE_LELANG_closed' [4]
6. 'BEA LELANG PEMBELI' [5]
7. 'SELAIN_RODA_2' [6]
8. 'BONGKARAN' [7]
9. 'PERALATAN_MESIN' [8]
10. 'JENIS_LELANG_LENC' [9]
11. 'NILAI LIMIT ENC' [10]
12. 'TAHUN LAPORAN' [11]
13. 'PEMOHON_k_l' [12]
14. 'PEMOHON_pemda' [13]
15. 'PEMOHON_polisi_jaksa_pengadilan' [14]

Terlihat pada gra�ik korelasi BEA LELANG PEMBELI, NILAI LIMIT, dan STATUS
LELANG WANPRESTASI memiliki korelasi terhadap nilai POKOK LELANG yang cukup besar
dibandingkan dengan feature lainnya. Feature data yang dipilih dari hasil korelasi
digunakan dalam proses data modelling. Data modelling menggunakan beberapa teknik
dengan hasil evaluasi sebagai berikut:
Skor MAE dan RMSE adalah skor yang berorientasi negatif, yang berarti nilai yang
lebih rendah (semakin mendekati 0) lebih baik. Namun, RMSE memberikan bobot yang
relatif tinggi untuk kesalahan/error yang besar. RMSE lebih diprioritaskan ketika
kesalahan/error yang besar sangat tidak diinginkan. Untuk kegiatan prediktif nilai lelang
ini, kami memilih teknik/metode pemodelan data LGBMRegressor yang memberikan nilai
error moderate dibandingkan dengan teknik/metode yang lain. Selanjutnya kami
melakukan identi�ikasi feature data yang dapat digunakan untuk proses prediksi dengan
metode LGBMRegressor tersebut. Berikut hasilnya:
Dari gra�ik di atas kemungkinan dapat digunakan tiga atau empat feature ([10], [5],
[11], [4]) dari lima belas feature sebagai feature yang penting untuk proses prediksi data.
Tentunya hal ini berdasarkan kondisi/kualitas data saat ini.

Visualisasi
Visualisasi digunakan untuk menampilkan informasi yang telah diolah dalam bentuk
dashboard, adapun dashboard tersebut memuat informasi seperti trend lelang BMN, jenis
lelang, status lelang, jumlah lelang BMN pada kantor vertikal, objek lelang populer, dan
besaran BMN yang menjadi scrap.
Gambar: konsep dashboard untuk visualisasi data
Simpulan
Dengan menggunakan metode LGBMRegressor didapat skor evaluasi dengan nilai

MAE 29818895.8279921 dan RMSE 426347111.658527. Tentu saja ini nilai yang kurang
bagus. Hal yang bisa dilakukan untuk memperbaiki hasil ini salah satunya bisa dari sumber
data, terutama terkait uraian barang agar bisa dilakukan standarisasi atas isian uraian
barang untuk meningkatkan kualitas data yang ada.

Analisis Realisasi
Pemeliharaan
Aset Tetap
Disusun oleh: Beno Pinantau Rohman
08 Analisis
Analisis Potensiuntuk
Prediktif Tercapainya TargetHarga
Memprediksi Penerimaan Pajak -- 24
Objek Lelang 46
anyaknya aset yang dimiliki negara saat ini, tentu bukan hal yang mudah bagi setiap
instansi dalam melakukan pengelolaan. Salah satunya terkait pemeliharaan.
Bahkan dapat dikatakan proses pemeliharaan belum mendapat perhatian khusus.
Sebagaimana kondisi di lapangan yang sering kali menganggarkan biaya pemeliharaan
dengan hanya melihat data tahun sebelumnya.
Berbekal pengalaman sebagai operator BMN, saya menyaksikan tren penggunaan
barang persediaan/ATK yang berganti dengan kerusakan mouse/keyboard dan PC yang
semakin perlu perawatan, dll. Permasalahan semacam itu memang terlihat kecil, tetapi
berdampak pada frekuensi revisi anggaran. Meskipun tidak ada yang salah dengan revisi
anggaran. Namun, secara tidak langsung menunjukkan ketidakmampuan instansi untuk
merencanakan.
Fakta ini, memicu batas keilmuan saya terkait data analytic yang masih awam. Saya
yang baru mengenal Python beberapa bulan belakangan, bahkan belum familiar dengan
sintaksnya, memberanikan diri untuk maju dengan segala keterbatasan. Berusaha
menampilkan sesuatu yang tampak kecil, namun memiliki dampak yang cukup besar dalam
mendukung optimalisasi anggaran.
Meskipun di luar ekspektasi, saya berhasil menjadi 10 besar dan mendapatkan
dukungan penuh rekan kerja dan apresiasi dari Kepala Kantor Wilayah Jawa Timur II. Bagi
saya, ini adalah bonus.
Identi�ikasi Kondisi Aset
Operator dan pengambil keputusan terbiasa melihat nilai buku atau kondisi �isik
barang real, tanpa mengetahui seberapa besar biaya pemeliharaan yang telah dibebankan
pada periode sebelumnya. Padahal jika merujuk pada kebijakan akuntansi pemerintah, nilai
buku atas suatu aset dihitung menggunakan metode penyusutan garis lurus. Dimana
metode tersebut belum dapat menggambarkan kondisi aset secara real time.
Permasalahan lain yang timbul, terkait perencanaan anggaran. Mengingat
pentingnya pemeliharaan aset dalam kegiatan operasional, perencanaan anggaran
pemeliharaan seharusnya dilakukan dengan berbagai pertimbangan. Tidak cukup hanya
dengan melihat anggaran tahun sebelumnya. Namun membutuhkan pertimbangan kondisi
aset itu sendiri. Selain itu, belum ada sarana untuk melakukan monitoring dan evaluasi atas
biaya pemeliharaan yang telah dibebankan.
Berangkat dari permasalahan tersebut, perlu dikembangkan aplikasi yang dapat
mengidenti�ikasi kondisi aset, dengan memanfaatkan data transaksi pemeliharaan.
Bidikan Proyek
Proyek ini bertujuan antara lain: (1) untuk mengidenti�ikasi apakah suatu aset masih
layak digunakan dalam kegiatan operasional secara ekonomis, jika dibandingkan dengan
biaya pemeliharaan yang dikeluarkan; (2) sebagai salah satu langkah dalam upaya
optimalisasi penggunaan anggaran; serta (3) agar dapat menjadi bahan pertimbangan
dalam perencanaan kebutuhan aset maupun perencanaan anggaran biaya pemeliharaan.
Analisis Realisasi Pemeliharaan Aset Tetap - 55

Kebutuhan Data
Dalam proyek ini, saya menggunakan dua dataset yang tersedia di portal SLDK
sebagai prototype. Daftar Aset Alat Angkutan (DJKN.V_MA_ASET_ALAT_ANGKUTAN) dan
Daftar Transaksi Pemeliharaan Aset Alat Angkutan
(DJKN.V_MA_PELIHARA_ALAT_ANGKUTAN).
Kedua data tersebut bersumber dari aplikasi SIMAN yang dimiliki oleh DJKN. Untuk
mempermudah penggambaran atas kedua dataset, saya menggunakan data dummy yang
telah disesuaikan dengan contoh data yang tersedia pada portal SLDK.
Bahasa Pemrograman dan Library-nya

Awal membuat kertas kerja analisis, saya mengawalinya dengan menggunakan
Javascript. Saya ragu atas kemampuan saya mempelajari Python dengan cepat. Namun
ternyata Python menyediakan banyak library yang mempermudah saya menganalisis data.
Sehingga saya putuskan melanjutkan analisa saya menggunakan Python dan Jupyter
Notebook. Sedangkan library yang saya gunakan, yaitu: pandas, matplotlib, seaborn, sklearn,
numpy dan scipy. Selanjutnya pembuatan dashboard menggunakan framework Streamlit.
Pra-pemrosesan
Pada tahap pra-pemrosesan data, saya menggabungkan metode join antara
dataframe aset dan realisasi pemeliharaan. Cara ini digunakan untuk mendapatkan detail
barang pada seluruh transaksi pemeliharaan. Dataframe gabungan ini, nantinya akan
digunakan pada proses-proses selanjutnya.
Eksplorasi Data
Eksplorasi data dimulai dengan melakukan visualisasi data secara keseluruhan
untuk mendapatkan gambaran atas: (1) Total biaya pemeliharaan per tahun; (2) Biaya
pemeliharaan masing-masing barang per tahun; dan (3) Frekuensi pemeliharaan
masing-masing barang per tahun.
Rata-rata biaya pemeliharaan per tahun sebesar Rp 149.692.606,00.

Biaya pemeliharaan tertinggi terdapat pada tahun 2019 sebesar Rp179.677.742.

Proyeksi Anggaran Biaya Pemeliharaan
Untuk memproyeksikan anggaran tahun berikutnya, saya menggunakan tiga jenis
�itur, antara lain ID_BARANG (gabungan antara kode satker, kode barang dan nomor urut
pendaftaran atau NUP) yang dikonversi ke dalam angka dengan LabelEncoder, tahun
pemeliharaan dan tahun perolehan. Sedangkan targetnya adalah nilai pemeliharaan.
Biaya Pemeliharan per Barang
Frekuensi Pemeliharan per Barang

Deteksi Anomali
Pada tahap ini saya menggunakan dua jenis �itur untuk mencari anomali pada
distribusi data, yaitu frekuensi dan biaya pemeliharaan. Dimana pada kedua �itur tersebut
dilakukan normalisasi terlebih dahulu, agar mendapatkan rentang nilai yang sama dalam
plotting pada sumbu x dan y dalam bentuk scatter plot. Tahap selanjutnya adalah
menentukan titik tengah, saya menggunakan metode K-Means dengan nilai cluster sama
dengan satu, kemudian fungsi Euclidean untuk menentukan jarak antara data dengan titik
tengah.
Scatter Plot untuk pencarian Data Outliers
Salah satu poin penting dalam pencarian outliers yaitu menentukan threshold atau
batas yang dianggap sebagai jarak terjauh. Dengan metode tersebut, diharapkan operator
bisa menentukan sendiri nilai yang dianggap sebagai batas normal. Meski demikian, saya
memberikan nilai default sebesar 99% sebagai batas terjauh. Sebagai contoh pada gambar
8.4, terdapat dua barang dengan lingkaran merah yang menjadi outliers.
Proses ini menghasilkan daftar barang yang merupakan outliers untuk selanjutnya
dapat dilakukan penelitian lebih lanjut atas transaksi pemeliharaan dari barang-barang
tersebut. Selain itu, outliers juga dapat dihapus agar tidak mengganggu data lain pada saat
dibuat model untuk peramalan anggaran.

Data yang diolah berbentuk data panel, sehingga diperlukan metode analisis untuk
regresi data panel. Maka, dibuat tiga pilihan metode yaitu random forest, decision tree, dan
light gradient boosted machine (LightGBM) dalam pembuatan model regresi.
Analisis Lanjutan
Untuk mendapatkan daftar aset dengan kondisi-kondisi tertentu dan perlu

penelitian lebih lanjut, dibuat beberapa kriteria �ilter antara lain:
1. Frekuensi pemeliharaan rata-rata, dengan nilai default sebesar frekuensi pemeliharaan
rata-rata secara keseluruhan. Tujuannya untuk mencari barang dengan frekuensi
pemeliharaan yang lebih dari kewajaran;
2. Kondisi barang, dengan nilai default rusak ringan dan rusak berat;
3. Total biaya pemeliharaan sejak awal perolehan, dengan nilai default sebesar 100% dari
nilai perolehan, digunakan untuk mencari barang yang total biaya pemeliharaannya
sudah melebihi nilai perolehan;
4. Prediksi tahun berikutnya, dengan nilai default 200% dari rata-rata biaya pemeliharaan
per tahun sejak perolehan. Tujuannya untuk mencari barang yang nilai prediksi tahun
berikutnya melebihi dua kali lipat dari rata-rata pemeliharaan sebelumnya.

Filter tersebut disediakan, agar pengambil keputusan dapat memperoleh informasi
kondisi suatu aset. Sehingga dapat digunakan sebagai bahan pertimbangan pengambilan
keputusan, apakah aset-aset tersebut akan tetap digunakan untuk operasional atau
diusulkan penghapusan.
Tambahan lainnya, saya menampilkan tautan pencarian barang sejenis pada situs
e-katalog. Sehingga, operator maupun pengambil keputusan dapat dengan mudah
membandingkan antara harga perolehan, biaya pemeliharaan, dan harga baru atas barang
yang sama.

Gagasan Pengelolaan Anggaran
Analisis sederhana pada data realisasi pemeliharaan ini, menghasilkan informasi

penting baik untuk satker maupun tingkat pusat. Formula ini akan membantu monitoring
serta memberikan pertimbangan terkait pengelolaan BMN seperti rencana penghapusan,
rencana kebutuhan, maupun rencana penganggaran biaya pemeliharaan.
Meski demikian, masih ada kelemahan dalam proyek ini baik dari sisi teknis maupun
non teknis. Masih banyak faktor yang perlu dijadikan pertimbangan untuk menentukan
keputusan atas aset, seperti rata-rata waktu penggunaan dalam sehari, jumlah pegawai,
kondisi ruangan tempat aset digunakan, dan lain-lain. Saya berharap proyek ini menjadi
salah satu gagasan untuk membantu mewujudkan pengelolaan anggaran yang optimal
dengan memanfaatkan data yang ada.
Belajar itu penting, tetapi kesehatan dan

waktu tidur jauh lebih penting
–Beno-

Analisis Tiket HAI
DJPb:
Pemodelan Prediksi
Kebutuhan
Pelatihan Satuan
kerja
09
Disusun oleh:
Hermawan Effendi

enyerapan Anggaran Pendapatan dan Belanja Negara (APBN) dari tahun ke tahun
selalu mengalami kendala. Pola penyerapan anggaran kementerian lembaga yang
menumpuk pada akhir tahun merupakan kejadian berulang dalam pelaksanaan
APBN. Banyak faktor yang mempengaruhi pola penyerapan anggaran salah satunya adalah
kompetensi sumber daya manusia. Semakin kompeten pegawai pengelola keuangan, maka
penyerapan anggaran lebih mudah direalisasikan dengan baik. Pembinaan kompetensi
sumber daya manusia pada satuan kerja instansi Kementerian/Lembaga terkait
pengelolaan keuangan negara menjadi tanggungjawab masing-masing instansi yang
berkoordinasi dengan Direktorat Jenderal Perbendaharaan. Wujud pengembangan
kompetensi SDM pada satuan kerja selama ini berupa pelatihan, workshop, dan
pembangunan knowledge management.
Jika diperhatikan, pola penyerapan anggaran Kementerian/Lembaga (K/L)

seringkali menumpuk di akhir tahun. Hal ini sebenarnya dapat dilihat sebagai sebuah
“anomali” dari penyerapan Anggaran Pendapatan dan Belanja Negara (APBN). Apabila
dianalisis lebih lanjut, terdapat beberapa faktor penyebab mengapa hal ini masih terus
terjadi. Salah satu kendala utamanya adalah kompetensi sumber daya manusia (SDM) dari
para pengelola keuangan di K/L. Berkaitan dengan pembinaan dan peningkatan
kompetensi SDM tersebut, K/L dapat bekerja sama dengan DJPb terutama berkaitan
dengan aspek-aspek pengelolaan APBN di masing-masing K/L atau satuan kerja (satuan
kerja). Selama ini, model peningkatan kompetensi SDM yang diselenggarakan adalah
pelatihan/diklat dan workshop atau bimbingan teknis (bimtek). Namun demikian,
sebenarnya terdapat model pengembangan kompetensi SDM yang dipandang lebih efektif,
e�isien, serta lebih praktis,
[1]
misalnya knowledge management yang didukung oleh machine
learning/arti�icial intelligence (ML/AI).
Sebagai upaya melaksanakan proses bisnis, Direktorat Jenderal Perbendaharaan

membangun sistem knowledge management berupa layanan helpdesk yang terintegrasi
dengan nama HAI DJPb. HAI DJPb difungsikan sebagai sarana satuan kerja untuk
berkonsultasi tentang pengelolaan keuangan negara dengan Direktorat Jenderal
Perbendaharaan melalui penyampaian tiket permasalahan. HAI DJPb tersebut merupakan
bentuk layanan komunikasi Direktorat Jenderal Perbendaharaan dalam rangka
penyelenggaraan pelayanan publik yang efektif dan e�isien sehingga menciptakan
hubungan antar elemen dalam suatu negara secara online.
1Daniel Paschek, Larisa Ivascua, Anca Draghicia. Knowledge Management – The Foundation for a Successful Business Process
Management. Procedia - Social and Behavioral Sciences 238 (2018) 182 – 191
Analisis Tiket HAI DJPb: Pemodelan Prediksi Kebutuhan Pelathian Satker - 63

Dalam menjalankan tugasnya sebagai pengelola keuangan negara, satuan kerja
menyampaikan permasalahannya kepada Direktorat Jenderal Perbendaharaan melalui HAI
DJPb. Tiket permasalahan dari satuan kerja pada HAI DJPb dikelola oleh agent layer 1 yang
selanjutnya dieskalasi ke direktorat teknis terkait untuk mendapatkan penyelesaian.
[2]
Banyaknya permasalahan yang dikonsultasikan melalui HAI DJPb menunjukkan bahwa

satuan kerja masih mengalami kendala dalam proses pengelolaan keuangan negara,
terutama berkaitan dengan pengoperasian aplikasi. Proses transfer knowledge kepada
satuan kerja diperlukan untuk mengatasi masalah tersebut. Penentuan prioritas tema
pelatihan atau workshop merupakan hal yang penting dalam kegiatan transfer of
knowledge. Identi�ikasi kebutuhan pelatihan atau workshop ini dapat diperoleh dengan
[3]
melakukan proses klasi�ikasi permasalahan yang muncul pada suatu organisasi.
Sementara itu berdasarkan pengamatan penulis ketika bertugas pada Direktorat

teknis yang menaungi HAI DJPb, tiket permasalahan pada HAI DJPb umumnya berkaitan
dengan permasalahan dan kendala mengenai operasionalisasi aplikasi pengelolaan
keuangan, seperti SPAN, Aplikasi SAKTI, Aplikasi SIMAK/PERSEDIAAN, OM SPAN, serta
permasalahan lain seperti permasalahan insfrastruktur dan jaringan. Peningkatan
kompetensi satuan kerja atau stakeholder terhadap pengoperasian aplikasi merupakan
[6]
faktor penting dalam pelaksanaan pengelolaan keuangan negara atau pelaksanaan APBN.
Dengan ditemukannya banyak tiket permasalahan pada hal-hal tersebut, dapat
mengindikasikan bahwa proses knowledge transfer kepada satuan kerja belum berjalan
secara optimal. Maka, diperlukan metode penentuan skala prioritas tema yang dibutuhkan
dalam setiap diklat, workshop, atau bimtek kepada satuan kerja. Identi�ikasi kebutuhan
pelatihan atau workshop ini dapat diperoleh dengan melakukan proses klasi�ikasi
[3]
permasalahan yang muncul pada suatu organisasi. Salah satu tools yang dapat digunakan
pada proses klasi�ikasi ini adalah XGBoost.
XGBoost merupakan salah satu algoritma pada machine learning yang dapat
digunakan untuk melakukan prediksi dan klasi�ikasi dengan akurasi dan kecepatan yang
[4]
bagus karena algoritma tersebut menerapkan multithreading. XGBoost atau eXtreme
Gradient Boosting adalah algoritma berbasis pohon yang efektif jika digunakan untuk
[5]
sebaran kategori data yang tidak seimbang sehingga dapat lebih efektif dalam pengambilan
[4]
keputusan. Hasil klasi�ikasi permasalahan jika disandingkan dengan data pendukung
seperti hasil evaluasi pelaksanaan pelatihan dapat menjadi bahan analisis untuk kebutuhan
diklat sebagai upaya peningkatan kapasitas SDM dalam rangka pengelolaan keuangan
negara.
2 HAI DJPb Direktorat Jenderal Perbendaharaaan, 2020

3 Panji Hidayat Mazhisham et al. “Identification of Training Needs Assessment in Organizational Context”. International Journal of
Modern Trends in Social Sciences. 2018
4 Ramzan Talib, Muhammad Kashif Hanif, Shaeela Ayesha, and Fakeeha Fatima. “Text Mining: Techniques, Applications and
Issues”. International Journal of Advanced Computer Science and Applications, Vol. 7. 2016
5 Tianqi Chen, Carlos Guestrin (2016). XGBoost: A Scalable Tree Boosting System. The 22nd ACM SIGKDD International Conference
6 Ahmad Sirin. “Determinan Penyerapan Anggaran Dengan Komitmen Organisasi Sebagai Moderating Variable”. Jurnal Riset
Ekonomi dan Bisnis. Vol 13 (2) (2020) 147-163

Analisis kebutuhan pelatihan satuan kerja pengelola keuangan negara dapat
memberikan informasi permasalahan aplikasi yang ada pada satuan kerja atau stakeholder
sehingga dapat dipergunakan untuk penentuan prioritas pelaksanaan pelatihan atau
workshop. Peningkatan kompetensi satuan kerja atau stakeholder terhadap pengoperasian
aplikasi merupakan faktor penting dalam pelaksanaan pengelolaan keuangan negara yaitu
[6]
dalam rangka pelaksanaan APBN. Pemetaan kebutuhan pelatihan yang diperoleh
berdasarkan analisis klasi�ikasi permasalahan dan hasil pelatihan dapat membantu proses
perencanaan diklat yang dibutuhkan dalam pengelolaan keuangan negara. Dengan
optimalisasi, efektivitas, dan e�isiensi pelaksanaan pendidikan dan pelatihan, dapat
menghemat biaya pelaksanaan kegiatan (DIPA) serta perolehan output dan outcome
pelatihan yang lebih maksimal. Dengan terlaksananya pendidikan dan pelatihan sesuai
dengan permasalahan yang dihadapi oleh satuan kerja/stakeholder, dapat memberikan
dampak peningkatan pemahaman satuan kerja atau stakeholder terhadap pengelolaan
keuangan negara sehingga dapat menciptakan good governace dari sisi �inansial.
Mengapa XGBoost?
XGBoost merupakan salah satu algoritma pada machine learning yang dapat
digunakan untuk melakukan prediksi dan klasi�ikasi dengan akurasi dan kecepatan yang
[4]
bagus karena algoritma tersebut menerapkan multithreading. XGBoost adalah algoritma
berbasis pohon yang efektif jika digunakan untuk sebaran kategori data yang tidak
[4]
seimbang sehingga dapat lebih efektif dalam pengambilan keputusan. Dengan
menggunakan tools ini, analisis terhadap prioritas kebutuhan pelatihan satuan kerja dapat
dibuat berdasarkan klasi�ikasi permasalahan yang sering disampaikan melalui tiket HAI
DJPb.
Dalam praktiknya, XGBoost dapat digunakan untuk memetakan kebutuhan di atas
melalui pemrosesan teks data permasalahan pada HAI DJPb dengan menggunakan aplikasi
KNIME sebagai tools-nya. Proses yang dilakukan dapat dilihat pada gambar berikut.
Gambar di atas merupakan work�low yang digunakan dalam aplikasi KNIME sebagai
alat bantu dalam melakukan pemrosesan teks data permasalahan pada HAI DJPb Tahun
2020 sebanyak 15.735 tiket permasalahan aplikasi.

Tahapan Pemodelan
Sebelum melakukan pemodelan, penulis terlebih dahulu mengumpulkan data dari
tiket HAI DJPb pada tahun 2020 yaitu sebanyak 15.735 tiket tentang permasalahan aplikasi.
Lalu, dalam membuat pemodelan sebelum dilakukan analisis, penulis membuat beberapa
langkah/tahapan yaitu:
a. Labelling
Dalam membuat sebuah model klasi�ikasi permasalahan (supervised), langkah awal

yang perlu dipersiapkan adalah penentuan kategori [7] dan proses pelabelan sesuai dengan
dengan kategori yang telah ditetapkan sebelumnya. Pada studi kasus ini, penulis membuat
pelabelan berdasarkan kata kunci yang menjadi karakteristik dari masing-masing kategori,
yaitu (1) Aplikasi SPAN, (2) Aplikasi SAKTI, (3) Aplikasi SAS/SILABI/PIN PPSPM, (4)
Aplikasi E-Rekon/SAIBA, (5) Aplikasi SIMAK/ PERSEDIAAN, (6) Aplikasi SIKP, (7) Aplikasi
GPP/DPP/BPP/GAJI TERPUSAT, (8) OM SPAN, (9) Infrastruktur – Perangkat Lunak, (10)
Infrastruktur – Jaringan, dan (11) Infrastruktur - Perangkat Keras.
b. Pre-processing
Tahapan selanjutnya adalah melakukan tahap pre-processing data tiket
permasalahan sehingga dapat digunakan dalam proses prediksi klasi�ikasi menggunakan
algoritma XGBoost. Tantangan dalam pengolahan data teks komplain pengguna yang
didapatkan dari aplikasi HAI DJPb yaitu teks masih terdapat atribut HTML dan berdasarkan
pengamatan terdapat beberapa kesalahan penulisan (typographical error). Untuk
mengatasi hal tersebut, penggunaan node Markup Tag diperlukan untuk menghapus semua
tag markup language pada kolom yang akan dilakukan text processing. Proses stemming
dilakukan menggunakan node String Manipulation sehingga proses penghapusan awalan
dan akhiran kata dapat dikontrol. Selain itu, pengunaan node Dictionary Replacer
diperlukan untuk mengatasi isu kesalahan penulisan. Dalam melakukan prediksi klasi�ikasi
permasalahan pada tiket HAI DJPb menggunakan XGBoost Tree Ensemble Learner, inputan
permasalahan merupakan penjelasan yang rinci dari satuan kerja atau stakeholder. Pada
setiap baris permasalahan yang akan diprediksi, dapat berupa kalimat, paragraf, atau
[8]
gabungan dari beberapa paragraf.
7 Vladimer B. Kobayashi et al, “Text Mining in Organizational Research”. Organizational Research Methods 2018, Vol. 21(3) 733-765
8 Molovtsev, M. D., & Sineva, I. S. "Classification Algorithms Analysis in the Forest Fire Detection Problem” IT&QM&IS.
(pp. 548-553). IEEE. 2019

Namun demikian, pada proses ini penulis menghadapi sejumlah kendala seperti
atribut HTML pada teks di tiket permasalahan, serta adanya typographical error atau
kesalahan penulisan. Untuk mengatasi hal ini, penulis menggunakan node Markup Tag
dengan tujuan menghapus semua tag markup language pada kolom yang akan dilakukan
text processing. Kemudian proses stemming dilakukan dengan menggunakan node String
Manipulation sehingga proses penghapusan awalan dan akhiran kata dapat dikontrol.
Selain itu, penulis juga menggunakan node Dictionary Replacer untuk mengatasi isu
kesalahan penulisan.
Selanjutnya dalam melakukan prediksi klasi�ikasi permasalahan pada tiket HAI

DJPb menggunakan XGBoost Tree Ensemble Learner, inputan permasalahan merupakan
penjelasan yang rinci dari satuan kerja atau stakeholder. Kalimat, paragraf, atau gabungan
dari beberapa paragraf dapat digunakan pada setiap baris permasalahan yang akan
diprediksi. Untuk memperoleh model prediksi yang lebih akurat, kon�igurasi XGBoost Tree
[8]
Ensamble yang digunakan oleh penulis sebagaimana tabel berikut.
Pengaturan yang berbeda dengan default KNIME adalah kon�igurasi eta dari 0.5
menjadi 0.3 dan alpha dari 1 menjadi 0. Penyusutan nilai ini bertujuan untuk mencegah
over�itting sehingga membuat proses learning menjadi lebih konservatif. Setelah melalui
proses learning dan prediction dengan menggunakan pengaturan tersebut, akurasi model
klasi�ikasi yang telah dibuat sebesar 94,7%.
Pada tahun 2020, permasalahan terkait Sistem Aplikasi Keuangan Tingkat Instansi
(SAKTI) sebesar 65% dari keseluruhan tiket. SAKTI adalah aplikasi yang digunakan sebagai
sarana bagi satuan kerja dalam mendukung implementasi SPAN untuk melakukan
pengelolaan keuangan yang meliputi tahapan perencanaan hingga pertanggungjawaban
anggaran. SAKTI mengintegrasikan seluruh aplikasi satuan kerja yang ada. Mempunyai
fungsi utama dari mulai Perencanaan, Pelaksanaan hingga Pertanggungjawaban Anggaran.
Selain itu, SAKTI menerapkan konsep single database. Aplikasi SAKTI digunakan oleh

entitas akuntansi dan entitas pelaporan Kementerian /Lembaga. Seluruh Transaksi entitas
akuntansi dan entitas pelaporan dilakukan secara sistem elektronik .
Berdasarkan hasil analisis tersebut, ditemukan bahwa

permasalahan terbanyak yang disampaikan via tiket HAI
DJPb adalah mengenai aplikasi SAKTI (65%). Sistem
Aplikasi Keuangan Tingkat Instansi (SAKTI) adalah
aplikasi yang digunakan sebagai sarana bagi satuan kerja
dalam mendukung implementasi SPAN untuk melakukan
pengelolaan keuangan mulai dari perencanaan hingga
pertanggungjawaban anggaran. SAKTI juga
mengintegrasikan seluruh aplikasi yang ada di satuan kerja
saat ini, dengan menggunakan single database. Dengan
menggunakan SAKTI, maka seluruh transaksi satuan kerja
selaku entitas akuntansi dan entitas pelaporan dilakukan secara elektronik.
Sebagai pendukung analisis kebutuhan diklat, informasi awal tersebut dapat dilihat
dari sudut pandang pelaksanaan troubleshooting dan evaluasi pelaksanaan diklat sesuai
dengan tema Aplikasi SAKTI. Hal ini menunjukkan bahwa diperlukan transfer of knowledge
kepada seluruh agent sebagai langkah mewujudkan knowledge management operasional
dan troubleshooting aplikasi SAKTI yang lebih baik. Peran feedback untuk penilaian proses
sangat penting dan merupakan hal yang tidak terpisahkan dari sebuah kegiatan.
Lalu, Apa Artinya?

Informasi awal pada �igure di atas dapat digunakan sebagai pendukung analisis
kebutuhan diklat, terutama jika dilihat dari perspektif pelaksanaan troubleshooting dan
evaluasi pelaksanaan diklat pada kategori Aplikasi SAKTI. Analisis selanjutnya dari data
diperoleh informasi bahwa pada tahun 2020,
sentimen user atas tiket HAI DJPb terhadap
jawaban agent pada kategori ini cenderung
netral (81%). Namun demikian apabila dilihat
pada feedback dari para user aplikasi SAKTI
yang bernada positif masih sangat rendah
(18%). Hal ini dapat mengindikasikan bahwa
proses knowledge transfer mengenai Aplikasi
SAKTI kepada seluruh agent HAI DJPb maupun
dari agent kepada user masih belum optimal.
Padahal, peran feedback untuk penilaian proses
sangat penting dan merupakan hal yang tidak
terpisahkan dari sebuah kegiatan.

Dalam proses evaluasi EUT, posttest merupakan cara yang e�isien dalam melakukan
[9]
evaluasi pembelajaran pada suatu kelompok kelas. Berdasarkan studi kasus SAKTI,
pelaksanaan dan pelaporan menjadi fokus utama dalam pencapaian tujuan organisasi yaitu
terlaksananya pengelola keuangan negara yang baik pada seluruh satuan kerja. Kebutuhan
pelatihan bagi satuan kerja terkait aplikasi SAKTI khususnya modul pelaksanaan dan
pelaporan sangat diperlukan dari sisi kuliatas dan kuantitasnya, hal ini dapat dilihat
berdasarkan rata-rata pencapaian hasil posttest pelatihan aplikasi SAKTI (< 750). Melihat
deviasi perolehan posttest pada modul SAKTI pelaporan yang terlalu tinggi yaitu 157,53
memberikan informasi bahwa tingkat pemahaman materi satuan kerja yang tidak merata,
hal ini dimungkinkan karena kendala dalam penyampaian materi sehingga perlu menjadi
perhatian proses transfer of knowledge kepada satuan kerja. Selain itu, agent HAI DJPb juga
memerlukan pelatihan atau transfer knowledge yang intensif terkait aplikasi SAKTI dengan
harapan dapat meningkatkan persentase kepuasan atas layanan troubleshooting kepada
satuan kerja pelaksana APBN.
Selanjutnya, penulis juga melakukan analisis terhadap proses evaluasi kegiatan end
user training EUT) SAKTI pada tahun 2020. Dalam proses evaluasi EUT, posttest merupakan
cara yang e�isien dalam melakukan evaluasi pembelajaran pada suatu kelompok kelas .
[10]
Statistik Hasil Posttest Pelatihan Aplikasi SAKTI Tahun 2020
Kategori Nilai Nilai Rata Rata Deviasi

Tertinggi Terendah
SAKTI Administrator 975 675 807 77,04
SAKTI Penganggaran 875 600 753 78,80
SAKTI Pelaksanaan 675 325 518 96,39
SAKTI Pelaporan 900 325 654 157,53
Rata-rata 683
Berdasarkan hasil analisis di atas, ditemukan bahwa modul SAKTI Pelaksanaan dan
SAKTI Pelaporan adalah area fokus yang perlu diperhatikan pada saat melakukan pelatihan
kepada satuan kerja. Kedua modul ini merupakan fokus utama dalam pencapaian tujuan
organisasi yaitu terlaksananya pengelola keuangan negara yang baik pada seluruh satuan
kerja. Kebutuhan pelatihan bagi satuan kerja terkait aplikasi SAKTI khususnya modul
pelaksanaan dan pelaporan sangat diperlukan dari sisi kualitas dan kuantitasnya. Hal ini
dapat dilihat berdasarkan rata-rata pencapaian hasil posttest pelatihan aplikasi SAKTI (<
750). Selain itu, deviasi perolehan posttest pada modul SAKTI Pelaporan yang terlalu tinggi
(157,53) dapat mengindikasikan bahwa tingkat pemahaman materi oleh satuan kerja
diduga tidak merata. Selain itu, hal ini juga dimungkinkan karena kendala dalam
penyampaian materi sehingga perlu menjadi perhatian pada proses knowledge transfer
kepada satuan kerja.
9 Shivaraju PT, Manu G, Vinaya M, Savkar MK. Evaluating the effectiveness of pre- and post-test model of learning in a medical
school. Natl J Physiol Pharm Pharmacol 2017;7(9):947-951
10Direktorat Sistem Informasi dan Teknologi Perbendaharaan, 2020
Analisis Tiket HAI DJPb: Pemodelan

37 Prediksi Kebutuhan Pelathian Satker - 69
Namun demikian, yang tidak kalah pentingnya adalah bagaimana agent HAI DJPb
juga mendapatkan pelatihan atau knowledge transfer yang intensif terkait aplikasi SAKTI
dengan tujuan agar dapat meningkatkan persentase kepuasan atas layanan troubleshooting
kepada para satuan kerja.
Dapat digarisbawahi bahwa untuk menentukan kebutuhan pelatihan satuan kerja

dapat menggunakan pengolahan data teks pengaduan pengguna dengan algoritma machine
learning. Fokus dari masalah yang dihasilkan dapat menjadi informasi awal yang akan
dianalisis dengan menyandingkan data feedback atau data hasil posttest sehingga pembuat
kebijakan dapat menggunakan informasi analisis tersebut untuk menentukan kebutuhan
pelatihan guna pengelolaan keuangan negara yang lebih baik.
Jadi, Bagaimana Selanjutnya?
Dalam menentukan prioritas kebutuhan diklat bagi satuan kerja, kita dapat
menggunakan analisis pada tiket permasalahan HAI DJPb dengan bantuan salah satu tools
algoritma machine learning berupa XGBoost melalui aplikasi KNIME. Fokus dari masalah
yang dihasilkan dapat menjadi informasi awal yang akan dianalisis dengan menyandingkan
data feedback atau data hasil posttest, sehingga pembuat kebijakan dapat menggunakan
informasi analisis tersebut untuk menentukan kebutuhan pelatihan guna pengelolaan
keuangan negara yang lebih baik. Pemetaan kebutuhan pelatihan yang diperoleh
berdasarkan analisis klasi�ikasi permasalahan dan hasil pelatihan dapat membantu proses
perencanaan diklat yang dibutuhkan dalam pengelolaan keuangan negara. Selain itu,
dengan efektivitas dan e�isiensi pelaksanaan diklat, maka dapat juga diperoleh
penghematan biaya pelaksanaan kegiatan serta perolehan output dan outcome pelatihan
yang lebih maksimal. Selanjutnya dampak lain yang diharapkan dari pemodelan ini
adalah terjadinya peningkatan pemahaman satuan kerja atau stakeholder
terhadap pengelolaan keuangan negara sehingga dapat menciptakan good
governance dari sisi �inansial.

10
Data Storytelling
Project pada Faktur
Pajak Keluaran
Disusun oleh:
Febrian, Aldi Pratama, dan Beta Andri Anggiano Uliansyah

etiap pegawai Direktorat Jenderal Pajak (DJP) pada dasarnya tidak bisa
dilepaskan dari kegiatan/proses analisis data dalam pekerjaannya
sehari-hari. Salah satu yang bisa dianalisis untuk menggali potensi
perpajakan dan penerimaan negara adalah faktur pajak. Namun demikian,
pada umumnya perangkat yang tersedia di kantor-kantor perpajakan terbatas pada
Microsoft Excel dan spreadsheet yang relatif sederhana dan memiliki beberapa
kekurangan, seperti jumlah maksimal baris data yang bisa diolah, format data yang
bisa diolah, dan belum adanya �itur read only untuk melindungi adanya perubahan
sumber data.
Dalam kegiatan sehari-hari Tim kami selaku pengajar di Pusat Pendidikan

dan Pelatihan Pajak, Badan Pendidikan dan Pelatihan Keuangan (BPPK) terutama
berkaitan dengan minat dan keterampilan kami dalam data analytics dan data
storytelling, kami memiliki gagasan untuk menganalisis faktur pajak menggunakan
perangkat yang lebih advance yaitu Microsoft Power BI Desktop. Aplikasi ini menurut
kami memiliki beberapa kelebihan dibanding pendahulunya, seperti lebih banyak
jumlah maksimal baris data yang bisa diolah, adanya �itur read only untuk
mengatasi apabila ada perubahan sumber data, serta penambahan format data baru
untuk diolah (misal pdf). Beberapa kelebihan ini menurut kami relatif cukup untuk
digunakan oleh para pegawai DJP dalam hal analisis data, termasuk analisis data
faktur pajak.
Data Storytelling Project pada Faktur Pajak Keluaran - 72

Arsitektur Data Storytelling Project
Hingga saat ini masih sangat umum opini bahwa untuk dapat melakukan analisis
data maka kita harus memahami bahasa pemograman atau coding seperti python, R, atau
bahasa pemograman lainnya. Menurut kami, hal itu tidaklah relevan. Dengan perangkat
sederhana seperti Microsoft Excel sekalipun, sebenarnya kita tetap dapat melakukan
analisis data secara sederhana. Beragam rumus di Microsoft Excel dapat kita gunakan untuk
melakukan analisis data. Maka dengan menggunakan perangkat yang lebih advance seperti
Microsoft Power BI Desktop, kita dapat melakukan analisis data secara lebih baik dan lebih
lengkap. Melalui project ini kami berharap bahwa setiap pegawai DJP dapat melakukan
analisis data faktur pajak dan pemberitahuan ekspor barang. Gambaran arsitektur
Microsoft Power BI Desktop untuk analisis data tersebut, yang kami beri nama “Aplikasi
Analitika Data Perpajakan e-Faktur Keluaran” adalah sebagai berikut:
BI Architecture project
Diadopsi dari : https://t2client.com/bi/
Mengapa Project Data Storytelling?

Data storytelling adalah sebuah model presentasi data dengan membuat tampilan
yang menarik disertai narasi dengan tujuan agar memudahkan semua orang dalam
membaca data tersebut. Melalui project data storytelling ini, kami hendak menyampaikan
gagasan bahwa potensi penerimaan negara dari perpajakan dapat diperoleh dari analisis
faktur pajak melalui visualisasi dan narasi. Pada proses analisis nantinya, diharapkan
semua pegawai DJP dapat melakukan analisis dengan mudah karena saat ini sudah ada
perangkat yang mendukung hal tersebut yaitu Microsoft Power BI Desktop. Lalu,
bagaimana kami melakukan project data storytelling ini? Berikut adalah langkah-langkah
yang kami lakukan.

Data Collection
Langkah awal yang kami lakukan adalah melakukan pengumpulan data dengan
mengunduh data yang tersedia dari intranet DJP yaitu Apportal . Data yang tersedia untuk
kami gunakan dalam analisis ini kami peroleh pada tahun 2019, ketika kami masih menjadi
pegawai DJP. Dari situs tersebut, kami mengunduh data series faktur pajak dalam kurun
waktu 2017-2019. Jumlah data series yang kami peroleh adalah 355.227 baris data faktur
pajak, untuk selanjutnya kami olah pada tahap berikutnya.
Data Transformation
Tahap selanjutnya yang kami lakukan adalah mengubah atau mentransformasikan
data series mentah yang kami peroleh menjadi 36 dataset. Dengan menggunakan Microsoft
Power BI Desktop, proses transformasi data dapat dilakukan sekaligus melalui menu Get
Data from Folder. Menu ini tidak ada di dalam Microsoft Excel. Proses transformasi data yang
kami lakukan antara lain Extract, Transform (beberapa langkah), dan Load ke Data Model
selaku storage penampung data di dalam aplikasi. Setiap langkah data transformation
tersimpan dalam bentuk query sehingga dapat digunakan secara terus-menerus untuk data
series yang berbeda. Proses query ini tentu akan mempermudah bagi user lain yang akan
melakukan proses transformasi data pada data series faktur pajak lainnya. Berikut adalah
bentuk dari query yang kami lakukan.
Query Extract, Transform and Load

Data Visualization
Sebuah data tidak akan bermakna ketika hanya sedikit orang yang bisa membaca
data tersebut. Maka, visualisasi data adalah salah satu tahap yang penting untuk dilakukan
oleh data analyst. Visualisasi data dapat berupa tabel, diagram, gra�ik, gambar, dan
sebagainya. Dengan visualisasi yang tepat, diharapkan data dapat dengan mudah dibaca
dan dipahami semua pihak.
Pada tahap ini, kami memvisualisasikan dataset ke dalam bentuk Summary dan
Detail. Summary memuat ringkasan seperti Dasar Pengenaan Pajak (DPP), jumlah faktur,
jumlah pembeli selama kurun waktu, perbandingan DPP dan jumlah faktur per tahun, serta
perbandingan pembeli yang memiliki NPWP atau tidak. Berikut adalah tampilan dari data
visualization yang kami lakukan.
Summary Faktur Pajak Keluaran
Sementara itu, pada bagian Detail kami visualisasikan daftar nama barang yang
dijual dan nama pembeli pada kurun waktu, serta sebaran pembeli dalam format peta Indo-
nesia, sebagaimana berikut.
Detail Faktur Keluaran

Data Storytelling
Tahap ini adalah tahap paling krusial dalam project ini. Kami menggunakan narasi
dalam bentuk visual yang menceritakan analisis data faktur pajak keluaran. Model data
storytelling ini diharapkan dapat memperjelas visual berupa gambar dan gra�ik yang dibuat
sebelumnya melalui narasi.
Apa yang Kami Temukan?

Hasil dari project data storytelling kami menemukan bahwa faktur pajak keluaran
yang dilaporkan oleh Wajib Pajak berkisar di angka rata-rata Rp.190 milyar per tahunnya.
Hal ini dapat mengindikasikan kejenuhan volume penjualan atau kemungkinan lain seperti
accounting engineering dimana Wajib Pajak tidak melaporkan penjualan sebenarnya (dapat
dilihat pada Visualisasi Summary berikut).
Visualisasi Summary
Temuan tersebut dapat dianalisis lebih lanjut dengan menggunakan Clustered

Column Chart pada data DPP dan jumlah faktur. Hasil yang kami temukan adalah terdapat
anomali data DPP, dimana penjualan pada bulan Desember 2017 nilainya meningkat
signi�ikan dibandingkan dengan bulan-bulan lain di tahun yang sama, atau dibandingkan
dengan periode bulan yang sama di tahun 2018 dan 2019. Demikian pula untuk data faktur
pajak, dimana jumlah faktur pajak yang diterbitkan pada tahun 2019 jauh lebih banyak
dibandingkan periode tahunan di 2017 dan 2018 (dapat dilihat pada Visualisasi Summary
berikut).
Visualisasi Summary

Maka, dugaan adanya praktik accounting engineering dapat dibuktikan berdasarkan
analisis tersebut.
Selanjutnya, kami juga menemukan bahwa terdapat penjualan kepada pembeli
yang tidak memiliki NPWP sebesar 93,51% dari total penjualan 2017-2019 (dapat dilihat
pada Visualisasi Detail berikut).
Visualisasi Detail
Berdasarkan hal tersebut, DJP perlu melakukan kon�irmasi untuk mendapatkan

informasi yang lengkap dan benar mengenai status NPWP para pembeli tersebut
mengingat angka penjualan rata-rata yang cukup tinggi per tahunnya (190 miliar rupiah).
Selain itu, kami juga mendapatkan data detail mengenai nama barang-barang yang dijual
oleh Wajib Pajak (dapat dilihat pada Visualisasi Detail berikut). Data ini sangat bermanfaat
bagi DJP untuk melengkapi pro�il Wajib Pajak.
Visualisasi Detail Visualisasi Detail
Temuan menarik selanjutnya adalah perihal nama pembeli “CASH” yang digunakan
oleh Wajib Pajak untuk mengidenti�ikasi pembeli yang tidak memiliki NPWP. Hal ini tentu
sangat menarik, mengingat nama tersebut menjadi top buyer (14,18% dari total penjualan
selama kurun waktu 2017-2019).
Kemudian melalui Visualisasi Map pada bagian Detail, kami menemukan data seba-
ran pembeli hingga ke Pulau Sulawesi (Makassar), sementara penjual/Wajib Pajak
berdomisili di Pulau Sumatera.

Visualisasi Map
Sebenarnya hal ini sangatlah wajar di era e-commerse saat ini. Namun demikian,
informasi ini tentu dapat digunakan oleh DJP untuk melengkapi pro�il Wajib Pajak
mengenai sebaran wilayah dari klien Wajib Pajak itu sendiri, termasuk kebenaran data dari
sebaran tersebut.
Beberapa analisis di atas adalah contoh bagaimana model analisis sederhana dari
Data Storytelling Project kami pada faktur pajak keluaran. Beberapa temuan menarik dapat
menjadi insight bagi kebijakan perpajakan di Indonesia yang bisa diinisiasi oleh DJP. Dengan
demikian berdasarkan dari apa yang kami lakukan pada project ini, kami yakin bahwa
project ini dapat diaplikasikan di DJP terutama berkaitan dengan analisis untuk menggali
potensi penerimaan negara dari sektor perpajakan melalui tools yang lebih advance namun
relatif mudah untuk dioperasionalkan oleh semua pegawai DJP.

Identifikasi
Kompetensi
Pegawai Berbasis
Data Analytics
Disusun oleh:
Danar Sutopo Sidig, Bima Jatmiko Abadi,
dan Irvan Pratama Putra
denti�ikasi kompetensi pegawai merupakan satu tahapan

krusial dalam penataan pegawai pada sebuah organisasi,
mulai dari rekrutmen, pengembangan, penempatan,
maupun promosi pegawai. Lebih dari itu, identi�ikasi
kompetensi pegawai juga menjadi hal yang vital bagi
implementasi knowledge management dan learning organization.
Tidak kalah pentingnya, identi�ikasi kompetensi pegawai

merupakan sebuah strategi dalam menghadapi skill shift yang
diakibatkan oleh Revolusi Industri 4.0 dan pandemi Covid-19. Hal
tersebut telah memicu kebutuhan yang tak terhindarkan
terhadap berbagai keterampilan baru. Di sisi lain, berbagai
keterampilan lama telah mulai ditinggalkan.
Tantangan yang harus kita hadapi saat ini adalah
identi�ikasi kompetensi pegawai masih belum sepenuhnya
berbasis data analytics. Akibatnya, proses identi�ikasi
kompetensi memerlukan waktu yang tidak sebentar dan
menyebabkan rendahnya frekuensi pemutakhiran data
kompetensi pegawai. Konsekuensinya adalah akurasi database
kompetensi pegawai yang rendah dan meningkatnya risiko skill
mismatches dan skill shortages dalam sebuah organisasi.

Implementasi prinsip The Right Man on The Right Place
menjadi semakin sulit untuk diwujudkan. Untuk itu, kami
mengusulkan sebuah project identi�ikasi kompetensi pegawai
berbasis data analytics.
Identifikasi Kompetensi Pegawai Berbasis Data Analytics - 80

Memanfaatkan Data Analytics untuk Identi�ikasi Kompetensi
Di lingkungan Kementerian Keuangan, implementasi data analytics untuk

mengidenti�ikasi kompetensi pegawai dapat dilakukan dengan memanfaatkan data My
Task. My Task merupakan sebuah menu dari aplikasi Of�ice Automation Kementerian
Keuangan (OA Kemenkeu). My Task berfungsi layaknya diary yang mencatat tugas-tugas
harian pegawai Kementerian Keuangan.
Bukti empiris telah menunjukkan bahwa rutinitas pelaksanaan tugas akan
[1] [2]
berkontribusi dalam membangun kompetensi pegawai yang bersangkutan. Atau dalam
peribahasa kita dikenal dengan istilah “alah bisa karena biasa”. Dengan demikian, ekstraksi
informasi tugas-tugas pegawai dalam data My Task dapat digunakan untuk memperoleh
informasi kompetensi pegawai Kementerian Keuangan.
Lebih spesi�ik metode data analytics yang dapat digunakan untuk mengekstraksi
tugas dan kompetensi pegawai dari data My Task adalah metode topic modelling. Berbagai
bukti empiris telah mengon�irmasi penggunaan topic modelling dalam mengekstraksi
[3]
informasi spesi�ik tertentu dari sekumpulan teks . Meski begitu, penggunaan topic
modelling untuk mengidenti�ikasi kompetensi pegawai merupakan sebuah kebaruan. Hal
tersebut dapat dimulai dari Kementerian Keuangan sebagai inisiator lalu selanjutnya dapat
diadopsi oleh Kementerian/Lembaga lain secara nasional.
Alur kerja pelaksanaan topic modelling terhadap data My Task untuk
mengidenti�ikasi kompetensi pegawai ditunjukkan dalam gambar alur kerja topic modelling
data My Task. Berdasarkan gambar tersebut, data My Task yang diinput pegawai disimpan
dalam sebuah database. Secara berkala (batch) data tersebut digunakan sebagai data
training untuk melatih sebuah machine learning model yang disebut sebagai DMI LDA
Model.
Gambar Alur Kerja Topic Modelling Data My Task dan Identi�ikasi Kompetensi Pegawai
1 Reuber, R. (1997). Management experience and management expertise. Decision Support Systems, 21(2), 51–60. https://
doi.org/10.1016/S0167-9236(97)00017-1
2 Ericsson, K., Hoffman, R., Kozbelt, A., & Williams, A. (2018). Expertise as Reliably Superior (Expert) Performance on Representa
tive Tasks. In The Cambridge Handbook of Expertise and Expert Performance (2nd ed.).
3 Vayansky, I., & Kumar, S. A. P. (2020). A review of topic modeling methods. Information Systems, 94, 101582. https://
doi.org/10.1016/j.is.2020.101582

DMI LDA Model memiliki dua fungsi utama. Pertama, mengidenti�ikasi
kompetensi-kompetensi yang ada pada data training. Kedua, menggunakan kompetensi
yang teridenti�ikasi dari data training tersebut untuk memprediksi kompetensi yang terkait
dengan data My Task yang secara real-time diinput oleh pegawai Kementerian Keuangan.
Visualisasi dari kemampuan DMI LDA Model dalam memprediksi kompetensi yang
berkaitan dengan tugas-tugas yang diinput pegawai dalam My Task adalah sebagaimana
diilustrasikan pada Gambar Visualisasi Prediksi Kompetensi oleh DMI LDA Model di bawah
ini.
Gambar Visualisasi Prediksi Kompetensi oleh DMI LDA Model
Gambar tersebut menunjukkan deskripsi task “Rapat Koordinasi Tim TIK dan
Pusintek tentang Development Aplikasi Find-Pro�keu (Cari Data Profesi Keuangan)”
diprediksi oleh DMI LDA Model sebagai topik kompetensi yang berkesesuaian dengan
kompetensi Pengembangan Aplikasi.
Selanjutnya, data kompetensi yang telah diprediksi oleh DMI LDA Model tersebut
dapat disajikan pada sebuah Business Intelligence, atau di Kementerian Keuangan disebut
sebagai HRIS (Human Resource Information System). HRIS tersebut dapat dikases oleh
pegawai sebagai individu maupun pengelola kepegawaian di lingkungan Kementerian
Keuangan.
Manfaat Identi�ikasi Kompetensi bagi Pegawai dan Organisasi
Bagi pegawai, hasil identi�ikasi kompetensi dapat disajikan pada sebuah dashboard
sebagaimana disajikan pada Gambar Dasboard Kompetensi bagi Pegawai. Berdasarkan
gambar tersebut, setiap pegawai akan dapat mengunjungi sebuah laman dalam aplikasi
HRIS yang menampilkan kompetensi-kompetensi yang terkait dengan tugas-tugas yang
telah dilakukannya. Lebih lanjut, berdasarkan kompetensi yang teridenti�ikasi tersebut,
seorang pegawai juga akan mendapatkan rekomendasi pelatihan-pelatihan yang relevan
untuk diikuti.
Gambar Dasboard Kompetensi bagi Pegawai
Sementara, bagi pengelola kepegawaian tingkat satuan kerja (satker) maupun Biro
SDM, potensi manfaat yang diperoleh adalah sebagaimana ditunjukkan pada Gambar
Dashboard bagi Unit Pengelola Kepegawaian. Berdasarkan gambar tersebut, unit pengelola
kepegawaian akan memilki informasi mengenai struktur kompetensi yang terdapat dalam
satuan kerja yang dikelolanya. Bagi Biro SDM, informasi yang tersedia adalah struktur
kompetensi yang ada pada setiap Eselon I di lingkungan Kementerian Keuangan.
Gambar Dashboard bagi Unit Pengelola Kepegawaian
Dashboard tersebut akan menunjukkan persentase tingkat kesesuaian kompetensi

yang ada terhadap kompetensi yang dibutuhkan oleh Kementerian Keuangan. Informasi
tersebut juga dapat disajikan secara lebih terperinci sebagaimana ditunjukkan dalam
Gambar Rincian Informasi Tingkat Kesesuaian Kebutuhan dan Ketersediaan Kompetensi
Pegawai.

Gambar Rincian Informasi Tingkat Kesesuaian
Kebutuhan dan Ketersediaan Kompetensi Pegawai.
Berangkat dari informasi terperinci tentang jumlah kebutuhan dan ketersediaan

pegawai dari setiap jenis kompetensi, Kementerian Keuangan akan dapat merencanakan
rekrutmen, pengembangan, penempatan, dan promosi pegawai yang dimilikinya secara
lebih efektif. Lebih dari itu, ketersediaan informasi kompetensi pegawai juga akan
mendukung implementasi knowledge management dalam mewujudkan Kementerian
Keuangan sebagai sebuah learning organization.
Dari serangkaian proses yang kami lalui selama mengikuti kompetisi Hackathon
ASN Kemenkeu 2021, kami ingin berbagi pengalaman kepada rekan-rekan pegawai
Kementerian Keuangan. Pertama, jangan takut untuk menyuarakan ide, jangan menunda,
dan jangan takut penolakan. Tak jarang, hal tersebut akan berbuah manis seperti yang kami
alami. Kedua, dalam berproses, kita tidak perlu ragu belajar hal baru. Kita harus senantiasa
optimis meskipun dalam kondisi penuh keterbatasan. Terakhir, selalu curahkan best effort
dan terus berdoa karena sebagai manusia kita hanya berusaha, Tuhanlah yang menentukan.
Analisis Potensi
Identifikasi Tercapainya
Kompetensi PegawaiTarget Penerimaan
Berbasis Pajak - 84
Data Analytics 24
Jabatanku
di Masa Depan:
Explorative Project
Analysis Histori
Pelatihan Pegawai
Kementerian Keuangan
Disusun oleh: Ari Sandi Robert dan Eko Supriyono

andemi Covid-19 telah membawa perubahan pada pola
kehidupan manusia, termasuk dalam bagaimana cara kita
bekerja dan bagaimana kita memenuhi kebutuhan kompetensi
kita. Pola kerja dari sebelumnya of�line menjadi online tentu
membutuhkan peningkatan kompetensi SDM dari sisi teknologi
informasi. Bisa jadi, tidak semua pegawai/SDM memiliki kompetensi yang
serupa dalam bidang teknologi informasi tersebut. Maka, pemenuhan gap
kompetensi pegawai menjadi salah satu hal penting yang harus dilakukan
oleh organisasi untuk dapat bertahan dan menyesuaikan diri dengan
perubahan yang terjadi akibat pandemi ini. Hasil survei McKinsey1 tahun
2021 menunjukkan bahwa selama pandemi banyak perusahaan yang
memprioritaskan pemenuhan gap kompetensi pegawainya. Selain itu,
McKinsey juga memprediksi bahwa sampai dengan tahun 2030 akan ada
sekitar 107 juta orang membutuhkan penggantian jabatan karena kondisi
pandemi ini2.
Dengan demikian, organisasi perlu menyiapkan kebutuhan

pengembangan kompetensi pegawai, terutama untuk mengejar gap
kompetensi SDM serta mendorong pembelajaran berkelanjutan
(continuous learning) di dalam organisasi. Maka, organisasi juga perlu
memetakan kompetensi setiap pegawainya untuk kemudian membangun
learning path dan mengintegrasikan pengembangan kompetensi bagi
setiap pegawai dalam keseluruhan ekosistem organisasi.
1https://www.mckinsey.com/business-functions/people-and-organizational-performance/our-insights/
building-workforce-skills-at-scale-to-thrive-during-and-after-the-covid-19-crisis
2https://www.mckinsey.com/featured-insights/future-of-work/the-future-of-work-after-covid-19
Jabatanku diAset
Analisis Realisasi Pemeliharaan Masa Depan-
Tetap - 5486
Mengapa Gap Kompetensi Pegawai?
Organisasi perlu memetakan kompetensi para pegawai, lalu melihat dimana gap-nya
untuk kemudian mencari alternatif pengembangan kompetensi bagi para pegawai
bersangkutan. Explorative project analysis ini diharapkan dapat menjadi masukan berharga
bagi pola pengembangan kompetensi pegawai dalam suatu organisasi, terutama dalam
melihat serta menganalisis data yang dimiliki sebagai sebuah potensi tidak hanya dalam
memetakan kompetensi para pegawainya tetapi juga membuat model prediktif yang tepat
dalam hal pengembangan kompetensi pegawai di masa depan.
Bagaimana memulai analisis ini?

Sebelum memulai explorative project analysis ini, kami membuat beberapa rencana
dan langkah-langkah sehingga nantinya bisa diperoleh model prediktif yang tepat. Analisis
ini dilakukan dengan bantuan tools berupa python dengan library pandas dan numpy.
Dengan tools ini, penulis memanfaatkan machine learning dalam pengolahan data dan
membuat model prediktif. Beberapa langkah yang dilakukan antara lain pemahaman bisnis,
pemahaman data, pre-processing, serta modelling dan evaluasi.
Pemahaman bisnis
Dalam tahap perencanaan sebelum melakukan analisis, penting untuk para analis
dalam memahami proses bisnis dari suatu organisasi. Dengan cara ini, maka kita dapat
memperoleh gambaran dari arus data untuk selanjutnya memilih dan memilah data apa
saja yang kita butuhkan pada tahap analisis dan modelling. Konteks dari analisis ini adalah
data histori pelatihan pegawai Kementerian Keuangan yang ada dalam database Kemenkeu
Learning Center (KLC). Dari tahap ini, penulis memahami bahwa setiap pelatihan juga
menghasilkan database yang mungkin saja hanya menumpuk di data center tanpa diketahui
untuk apa data tersebut nantinya dimanfaatkan. Proyek ini berusaha memanfaatkan data
ini dengan menghubungkan proses pemenuhan pelatihan dengan kemungkinan jenjang
karir pegawai di lingkungan unit organisasi, yaitu Kementerian Keuangan.
Pemahaman Data
Untuk menganalisis jenjang karir pegawai, kami menggunakan data histori
pelatihan masing-masing individu sebagai dasar penghitungan kesesuaian antara pelatihan
dengan prediksi jenjang karir jabatan pegawai di masa depan. Model prediktif yang dibuat
akan lebih ideal jika didukung oleh data kebutuhan kompetensi jabatan. Akan tetapi
dikarenakan kami belum menemukan nomenklatur yang valid terkait isu ini, maka kami
menggunakan data alternatif berupa Laporan Analisis Kebutuhan Pembelajaran (AKP)
jabatan untuk mewakili data pelatihan atau kompetensi yang dibutuhkan dalam suatu
jabatan tertentu. Laporan AKP ini memuat data jenis jabatan, nomenklatur jabatan,
kompetensi teknis, dan kompetensi manajerial yang dibutuhkan dari sebuah jabatan.
Selanjutnya, kami juga menggunakan data alternatif berupa database KLC untuk
melengkapi data time series dari suatu pelatihan yang telah dijalani seorang pegawai.
Jabatanku di Masa Depan- 87

Pre-processing: Cleansing & Engineering
Dalam explorative analysis project ini, kami menggunakan phyton dengan library
pandas dan numpy sebagai alat utama pengolahan data awal. Laporan AKP yang digunakan
tidak dapat langsung diolah karena adanya format tabel yang berbeda (telah disesuaikan
untuk kebutuhan pelaporan). Maka, kami menggunakan pengolahan data awal di Microsoft
Excel untuk melihat pro�il data yang ada serta menghilangkan header dan footer untuk
menghasilkan data yang lebih ringkas sehingga dapat diproses lebih lanjut dengan pandas.
Query yang dilakukan adalah sebagai berikut.
# Load Analisis Kebutuhan Pembelajaran

rawdata_akp = pd.read_excel(‘data.xlsx', sheet_name='akp')
# Memilih data unik dari kombinasi jabatan dan nomenklatur

proc_akp = rawdata_akp\
.drop_duplicates(subset=['jenis_jabatan', 'nomenklatur'])\
[['jenis_jabatan', 'nomenklatur']]\
.reset_index(drop=True)
Secara garis besar, proses diatas dilakukan untuk memasukkan data awal yang
berupa sheet excel bernama ‘akp’ ke dalam pandas dataframe. Kemudian, dari data tersebut
akan dipilih hanya data jabatan unik saja sehingga duplikasi data yang lain akan dihapus
dengan drop_duplicates.
## Data kompetensi teknis

grup_diklat = []
for l in np.arange(len(proc_akp)):
data = []
left = proc_akp.loc[l]
for r in np.arange(len(rawdata_akp)):
right = rawdata_akp.loc[r]
if right.nomenklatur == left.nomenklatur:
nama = right.kompetensi_teknis
if isinstance(nama, str):
nama = nama[:nama.find('(')-1]
data.append(nama)
elif pd.isna(nama):
pass
grup_diklat.append(data)
# Membuat satu kolom yang menyimpan daftar diklat dalam jabatan
proc_akp[‘kompetensi'] = grup_diklat
Proses kedua yang dilakukan adalah menggabungkan seluruh baris pelatihan untuk
jabatan yang sama. Data yang dihasilkan dari proses ini akan menjadi referensi untuk
kebutuhan kompetensi jabatan. Dalam membuat referensi tersebut, kami menginisiasi
dengan membuat sebuah object list dalam phyton (grup_diklat). Objek ini juga akan
memuat object list yang berelasi dengan urutan jabatan. Setiap elemen di dalam object list
(grup_diklat) berelasi dengan sebuah jabatan tertentu. Data ini selanjutnya akan disimpan
ke dalam dataframe yang nantinya akan digunakan untuk melihat similaritas kompetensi
individu dengan kompetensi jabatan yang dibutuhkan.

Sementara itu untuk data alternatif yang berasal dari database KLC, kami tidak
melakukan terlalu banyak pre-processing. Library yang digunakan di proses ini adalah
sqlalchemy dan pandas. Setelah mengoneksikan dengan database KLC, kami menggunakan
pandas_sql untuk melakukan query ke tabel histori pelatihan. Pada proses ini, hanya dua
kolom yang akan diambil datanya untuk dianalisis yaitu nama pegawai dan nama
pelatihan3. Skema serupa juga dilakukan untuk menggabungkan setiap pelatihan dari
pegawai menjadi satu object list yang berelasi dengan nama pegawai yang bersangkutan.
Predictive Modelling dan Evaluasi

Untuk menghitung kesesuaian antara data histori kompetensi individu dengan
kebutuhan kompetensi suatu jabatan tertentu, kami menggunakan cosine similarity sebagai
tools utama. Teknik ini digunakan karena belum ada data atau nomenklatur yang pasti/val-
id terkait kebutuhan kompetensi jabatan di Kementerian Keuangan. Secara sistematis,
cosine similarity dapat dirumuskan sebagai berikut.
Similarity atau kesesuaian dapat diperoleh dengan menghitung kemiripan antara

daftar histori pelatihan seorang pegawai dengan daftar kebutuhan pelatihan setiap jabatan
di masing-masing unit Eselon I Kementerian Keuangan dari pegawai yang bersangkutan.
Secara konseptual, metode ini dapat digunakan untuk memperoleh tingkat pemenuhan
kompetensi seorang pegawai agar bisa menduduki jabatan tertentu. Dalam
implementasinya, kami menggunakan library sklearn dengan modul metric.pairwise
sebagaimana berikut.
from sklearn.feature_extraction.text import CountVectorizer
# Mengubah data menjadi vektor

kompetensi = proc_data[‘kompetensi’]
vectorised_kompetensi = CountVectorizer().fit_transform(kompetensi)
# Menyimpan hasil vektoriser ke dataframe awal

vectors = vectoriser.toarray()
proc_data[‘vectors'] = list(vectors)
Setelah semua proses di atas dilakukan, selanjutnya kami menyusun sebuah

mock-up dari predictive model yang dibuat. Akan tetapi sebelum tahapan tersebut
dilakukan, kami terlebih dahulu menghitung kesamaan dari seluruh data yang telah
diproses di atas. Langkah pertama yang dilakukan adalah mengubah setiap list kompetensi,
baik jabatan maupun individu menjadi vektor. Vektor di setiap baris kemudian akan
dihitung kembali tingkat similaritasnya antara satu dengan lainnya. Langkah terakhir
adalah menyimpan tingkat similaritas kompetensi seorang pegawai di setiap kemungkinan
posisi jabatan yang dapat diduduki pegawai tersebut.

Maka, akan ada penambahan jumlah kolom dalam dataframe sebanyak jumlah
jabatan pada unit dimana pegawai tersebut berada saat ini. Namun demikian, penambahan
kolom ini sebenarnya bukanlah sebuah solusi yang efektif, mengingat penambahan satu
jenis jabatan akan mengakibatkan jumlah perhitungan juga meningkat sebanyak
pegawai^n kali. Tetapi hal ini justru akan meringankan kinerja aplikasi karena tidak perlu
lagi dilakukan perhitungan setelah modelnya tersimpan ke dalam database.
from sklearn.metrics.pairwise import cosine_similarity
# fungsi untuk menghitung similarity dari dua vektor

def cosine_sim_vectors(vec1, vec2):
vec1 = vec1.reshape(1,-1)
vec2 = vec2.reshape(1,-1)
return cosine_similarity(vec1, vec2)[0][0]
## Memisahkan kembali data referensi dan data pegawai (ada 133 jabatan)
data_referensi = proc_data[:133].reset_index(drop=True)
data_pegawai = proc_data[133:].reset_index(drop=True)
# Proses kalkulasi
calc_comp_all = {}
for i in range(len(data_pegawai)): # untuk semua nomenklatur jabatan
v_pegawai = data_pegawai.loc[i, 'vectors']
nama_pegawai = data_pegawai.loc[i, 'nama']
calc_comp = []
for j in range(len(data_referensi)):
v_referensi = data_referensi.loc[j, 'vectors']
calc = cosine_sim_vectors(v_pegawai, v_referensi)
calc_comp.append(calc)
calc_comp_all[nama_pegawai] = calc_comp
# Menggabungkan hasil perhitungan

df_calc_comp = pd.DataFrame(calc_comp_all)
result = pd.concat([hasil_hitungan_kompetensi, df_calc_comp], axis=1)
# Mengekspor hasil perhitungan

result_hitungan_kompetensi.to_pickle(‘hasil_perhitungan.pkl’)
Inisiasi Project Analysis
Kami menggunakan mock-up aplikasi dengan tools berupa library streamlit dari
phyton. Proses pengolahan data dan pembuatan mock-up adalah dua proses yang berbeda.
Maka, kami lalu melakukan ekspor data hasil perhitungan kedalam sebuah format yang bisa
dibaca oleh aplikasi mock-up. Kami menggunakan format pickle karena format ini lebih
“ringan” dan lebih e�isien dibandingkan dengan format csv.
Sementara itu untuk source code aplikasi mock-up, kami mengakses laman
https://github.com/esup0001/streamlit/. Terdapat dua �itur pada aplikasi ini, yaitu
kesesuaian kompetensi berdasarkan jabatan yang ada (gambar �itur kesesuaian
kompetensi) dan �itur untuk melihat jabatan yang paling sesuai bagi seorang indvidu
(gambar �itur pelatihan individu).

Fitur kesesuaian kompetensi berdasarkan jabatan yang tersedia
Fitur jabatan yang sesuai bagi individu

Sebuah Alternatif
Explorative project analysis ini merupakan salah satu alternatif untuk memetakan
dan menganalisis kebutuhan kompetensi pegawai serta kaitannya dengan jabatan target
atau jabatan yang tersedia bagi setiap pegawai di masa depan. Metode yang digunakan oleh
penulis dalam project ini mungkin bukanlah satu-satunya metode yang ideal. Namun
demikian berdasarkan pengalaman selama menyelesaikan project ini, kami mendapatkan
gambaran bahwa data pelatihan pegawai adalah sebuah hal yang potensial untuk
digunakan sebagai alat/dasar analisis, misalnya mengenai kebutuhan kompetensi jabatan
bagi pegawai di masa depan.
Selanjutnya, kami juga dapat menyampaikan beberapa gagasan dari hasil explorative
project analysis ini. Pertama, Laporan AKP tidak dapat digunakan secara langsung sebagai
dasar analisa kesesuaian kompetensi jabatan. Maka, ke depannya pihak-pihak pemilik
otoritas atau pimpinan tinggi di Kementerian Keuangan perlu menyelaraskan antara
kompetensi pegawai, kompetensi dari sebuah pelatihan, serta Kamus Kompetensi
Kementerian Keuangan. Kedua, berbagai macam pelatihan yang akan diselenggarakan
perlu diselaraskan dengan kebutuhan kompetensi suatu jabatan. Hal ini mengingat bahwa
jenjang karir seorang pegawai untuk dapat menduduki jabatan tertentu juga memerlukan
serangkaian kompetensi tertentu pula. Maka, dengan cara ini akan dapat membantu
pegawai untuk merancang/menentukan jalur karir-nya sejak awal.
Dalam melakukan analisis ini, kami juga menghadapi beberapa tantangan. Pertama,
proses pemunculan ide dan pengolahan data awal yang memakan cukup banyak waktu.
Kedua, pengaturan environment lokal untuk database dan proses pengumpulan data juga
lebih kompleks jika dibandingkan dengan mengunduh data dengan format csv data dari
platform seperti kaggle. Hal ini memberikan banyak pengalaman tentang bagaimana proses
kerja dalam proyek data analitik sebenarnya. Ketiga, tidak terdapat metadata yang
memadai untuk mendukung analisis. Data yang dikelola juga tersimpan di berbagai sumber
yang menyulitkan analisis. Menurut kami, hal ini wajar karena peruntukan awal
penyimpanan data tidak termasuk untuk proses analisis lebih lanjut. Maka dalam rangka
memenuhi kebutuhan organisasi, dapat dipertimbangkan untuk melakukan proses
integrasi data dalam memenuhi kebutuhan analisis data di masa yang akan datang.

Memprediksi PNBP
dengan Time series
Disusun oleh:
Silvia Arini dan Rendra Achyunda Anugrah Putra
(Badan Pusat Statistik)
ata analytics menjadi populer seiring dengan meningkatnya kesadaran tentang
pentingnya data sebagai komoditi baru untuk pembangunan. Kementrian
Keuangan mendorong penerapan dan pengembangan data analisis di Indonesia,
khususnya di lingkungan Kementerian/Lembaga (K/L) dan Aparatur Sipil Negara
(ASN) dengan menyelenggarakan Hackathon ASN sebagai bagian dari rangkaian Road to
Festival Hari Oeang.
Hackaton Kemenkeu 2021 merupakan kesempatan untuk mendapatkan
pengetahuan data analytics dan menambah pengalaman dalam menerapkan di lingkungan
pemerintahan. Sebagai ASN di lingkungan Badan Pusat Statistik (BPS), ikut serta dalam
kegiatan ini juga memberikan kesempatan untuk lebih mengenal kegiatan data analytics di
K/L lainnya.
Kompetisi ini dilaksanakan menggunakan platform Kaggle dan memberikan sensasi

tersendiri. Kesempatan submit jawaban berkali kali dengan evaluasi untuk public
leaderboard 50% dataset membuat kompetisi ini cukup tricky dan menantang. Tidak hanya
dibutuhkan nilai evaluasi dari public leaderboard, tetapi juga sense apakah metode dan
output yang dihasilkan sudah optimal untuk memprediksi nilai sesungguhnya.
Dalam hackathon ini, Tim Kai diberi kepercayaan sebagai pemenang dalam
kompetisi Use Case 2, yakni Prediksi Penerimaan Negara Bukan Pajak (PNBP) dengan time
series. Pengalaman ini menjadi momen yang membahagiakan dan memicu semangat untuk
terus mengembangkan pengetahuan dalam data analytics di lingkungan lebih luas.
Prediksi PNBP dilakukan dalam beberapa langkah agar bisa mendapatkan hasil
prediksi yang cukup memuaskan. Langkah-langkah yang diimplementasikan selama
melaksanakan Use Case 2 ini didasarkan pada Hyndmand dan Athanasopoulus (2018) dan
diimplementasikan dengan menggunakan software R.
Pemahaman Masalah
Memahami masalah sebelum melakukan prediksi merupakan hal yang penting dan
perlu dilakukan secara hati-hati. Meskipun dalam kompetisi ini masalah telah diidenti�ikasi
oleh penyelenggara, tetapi sebagai ASN di luar Kemenkeu hal ini menjadi langkah penting
untuk memahaminya secara lebih dalam melalui artikel-artikel di internet ataupun
mengikuti forum tanya jawab pada grup Hackathon Kemenkeu.
Use Case 2 merupakan kompetisi untuk melakukan prediksi PNBP berdasarkan data
history empat tahun sebelumnya. Prediksi dilakukan pada PNBP minyak bumi dan PNBP
layanan Surat Izin Mengemudi (SIM). Proyeksi terhadap besaran PNBP menjadi suatu
kebutuhan untuk mendukung pengambilan keputusan dalam strategi perencanaan. Atas
dasar latar belakang tersebut, prediksi PNBP dilakukan dengan bertujuan untuk
membangun model yang mampu memprediksi PNBP minyak bumi dan layanan SIM yang
paling mendekati nilai aktual.
Analisis Tiket HAI DJPb: PemodelanMemprediksi

Prediksi Kebutuhan Pelathian
PNBP dengan TimeSatker
Series- - 62
94
Mengumpulkan Informasi
Dalam perlombaan ini, data PNBP beserta deskripsinya telah disediakan. Hal ini
memberikan kemudahan dalam pengumpulan informasi sebelum melakukan prediksi. Data
disediakan setiap hari, yakni hari kerja dan hari libur. Ada beberapa hal yang cukup menarik
dari data yang ada, di antaranya ada pemasukan PNBP di luar hari kerja dan ada data yang
bernilai negatif. Hal ini menimbulkan tanda tanya apakah hal tersebut memang mungkin
terjadi atau itu termasuk kesalahan input data.
Langkah mengumpulkan informasi tidak berhenti hanya menggunakan data yang
tersedia. Ada upaya untuk melakukan identi�ikasi data tambahan yang memiliki pengaruh
terhadap nilai PNBP. Hal ini dilakukan sebagai upaya meningkatkan akurasi prediksi.
Berdasarkan analisis awal dan ketersediaan data, prediksi terhadap PNBP di masa datang
dilaksanakan dengan menggunakan data PNBP.
Preliminary (Exploratory) Analysis
Analisis awal menjadi langkah penting untuk membangun sense terhadap data yang
dimiliki dan hasil prediksinya. Mengidenti�ikasi data outlier, anomali, dan distribusinya
melalui deskriptif data dan histogram serta visualisasi data dalam gra�ik sangat membantu
memahami fenomena yang ada dalam data.
Dekomposisi data menjadi beberapa komponen, yakni trend, seasonality, dan
remainder juga diimplementasikan. Ditambah dengan membangun gra�ik masing masing
tahun dalam jangka waktu prediksi juga dilakukan untuk mendapat sense terhadap hasil
prediksi, dalam hal ini membangun gra�ik dari 1 Januari s.d. 13 Februari di tiap tahunnya.
Gra�ik plot historical data
Memprediksi PNBP dengan Time Series - 95

Choosing and Fitting Models
a. Pre-processing :
Ada beberapa dataset yang disiapkan dalam proses ini, yaitu data asli dan beberapa
dataset yang telah dilakukan pre-processing. Hasil eksplorasi awal terhadap data
menunjukkan bahwa data PNBP minyak bumi memiliki lebih banyak outlier dan nilai
negatif jika dibandingkan dengan data PNBP Layanan SIM. Hal ini membuat data PNBP
minyak bumi membutuhkan leih banyak pilihan treatment jika dibandingkan dengan PNBP
Layanan SIM.
Ada beberapa pilihan treatment yang diimplementasikan sebelum membangun
beberapa dataset. Diantaranya mengganti nilai PNBP menjadi 0 saat weekend dan
mengimputasi data yang outlier ataupun negatif. Pilihan imputasi yang dilakukan juga
beragam, mulai dari imputasi sederhana seperti penggunaan mean atau median, sampai
imputasi kompleks, misal menggunakan interpolasi.
b. Modelling :
Ada beberapa model yang dibangun untuk diimplementasikan pada beberapa
dataset yang telah disiapkan. Selama kompetisi, ada beberapa model yang dicoba
diantaranya Multiple Seasonal and Trend Decomposition Based on Loess (MSTL), Neural
Network Autoregression (NNAR), Autoregresiive Integrated Moving Average (ARIMA), dan
TBATS.
Dari hasil run program awal, metode MSTL dan NNAR yang menghasilkan hasil yang
lebih optimal, sehingga dalam membangun model secara mendalam hanya fokus terhadap
MSTL dan NNAR. Eksplorasi model MSTL dan NNAR lebih dalam dilakukan dengan
melakukan setting terhadap parameter yang terlibat.
c. Evaluasi awal :
Evaluasi awal dari dataset dan model yang diimplementasikan dilakukan dengan
membandingkan gra�ik hasil prediksi dengan gra�ik historical data. Hasil prediksi yang
memiliki pattern dan nilai yang mirip dengan historical data dipilih untuk melakukan
prediksi dan menghasilkan output untuk di lakukan submit ke Kaggle . Tidak semua output
dari berbagai model dan dataset di-submit ke Kaggle.
Gra�ik Hasil Plot

Using and Evaluating A Forecasting Model
Dari sekian metode, MSTL dan NNAR dianggap sebagai model yang optimal untuk
melakukan prediksi data PNBP. Kedua metode ini yang dipilih untuk submit ke Kaggle.
Namun dari hasil public leaderboard, model MSTL menghasilkan hasil yang paling bagus,
sehingga explorasi lebih banyak dengan menggunakan model MSTL. Hal ini juga sejalan
dengan hasil private leaderboard Kaggle.
MSTL ini merupakan pengembangan dari dekomposisi STL. STL adalah metode
dekomposisi yang memiliki beberapa kelebihan, di antaranya bisa mengatasi berbagai
macam seasonality dan robust terhadap outlier. Selain itu, data yang digunakan ada data
harian. Penggunaan data ini bisa menjadi kompleks karena memungkinkan adanya multiple
seasonality, sehingga butuh metode yang bisa menangani multiple seasonality (Hyndmand
dan Athanasopoulus, 2018).
Model dan dataset yang terpilih sebagai pemenang dalam Use Case 2 Prediksi PNBP
adalah metode MSTL dengan dataset yang dilakukan imputasi pada nilai negatif dan outlier
menggunakan nilai mean pada PNBP minyak bumi dan menggunakan median pada data
PNBP layanan SIM. Outlier sendiri dideteksi menggunakan boxplot pada data PNBP minyak
bumi dan 3 kali standar deviasi pada data layanan SIM.
Simpulan
Banyak mencoba merupakan hal penting dalam meningkatkan
pengetahuan dalam data analytics. Selain itu, mengikuti langkah demi langkah
dalam melakukan prediksi sangat membantu dalam keseluruhan proses.
Mengidenti�ikasi masalah dan mengumpulkan informasi membantu
mendalami bisnis proses yang akan dilakukan prediksi, sehingga tidak
terjadi kesalahan analisis dan interpretasi.
Analisis awal juga penting untuk membangun sense dari data yang
tersedia dan memahami fenomena dari data tersebut. Langkah ini juga
penting untuk menentukan pre-procesing atau metode yang akan
diimplementasikan. Implementasi model dan evaluasi perlu dilakukan
secara bertahap dan dengan sistem eliminasi. Hal ini untuk
menyederhanakan dari banyaknya kemungkinan
kemungkinan membangun model dan dapat
menghemat waktu dan tenaga.

Mengawal
Kepercayaan Publik
dan Audit yang
Berkualitas melalui
Optimalisasi Data
Profesi
Disusun oleh: Yesi Febriani, Ceng Kodir,
14
dan Taufik Sukmawan

Integritas Akuntan Publik
Garuda Indonesia, Jiwasraya, Asabri, Hanson International, Tiga Pilar Sejahtera, dan
SNP Finance, merupakan sederet perusahaan domestik yang namanya sempat viral. Kasus
terkait laporan keuangannya, mencuri perhatian publik. Kasus tersebut juga kerap terjadi
dikancah internasional. Kasus gagal bayar obligasi Evergrande perusahaan kontruksi
terbesar kedua di China, belakangan mencuat dan berdampak negatif pada perekonomian
global.
Laporan keuangan entitas, memegang peranan yang sangat penting dalam
perekonomian. Informasi laporan keuangan yang telah diaudit, umumnya menjadi dasar
bagi para pengguna seperti investor, kreditur, pemerintah, atau pengguna lainnya dalam
pengambilan keputusan ekonomi. Mengingat penting dan luasnya penggunaan laporan
keuangan tersebut, maka audit yang berkualitas menjadi sangat penting. Infomasi yang
digunakan dalam laporan tersebut, dapat lebih diandalkan oleh penggunanya.
Kasus-kasus terkait laporan keuangan tersebut secara tidak langsung berkaitan
dengan profesi Akuntan Publik (AP). Profesi yang melakukan audit umum atas laporan
keuangan suatu entitas. Skandal atau adanya rekayasa atas laporan keuangan, memberi
sinyal negatif tehadap kualitas audit. Sehingga, harus dimitigasi agar tidak menimbulkan
kerugian bagi publik. Lalu, bagaimana kepentingan publik terlindungi, jika kasus-kasus
tersebut terjadi? Pada akhirnya, hal ini akan berujung pada pertanyaan besar, “Apakah
laporan keuangan perusahaan tersebut tepercaya?” dan “Apakah kualitas auditornya
bagus?”.
Praktik-praktik pemberian jasa yang tidak sesuai dengan regulasi dan standar yang
berlaku, tentu akan membawa dampak buruk bagi perekonomian dan menyebabkan
berkurangnya kepercayaan publik terhadap profesi tersebut. Profesi AP membutuhkan
integritas tinggi, etika memadai, serta kompetensi yang mumpuni, agar dapat menghasilkan
jasa yang berkualitas. Oleh karena itu dibutuhkan pengawasan otoritas berwenang yang
memadai, untuk mengawal kualitas jasa AP yang terpercaya. Terlebih pada era pandemi
Covid-19. Era yang mempengaruhi perekonomian global. Investor maupun stakeholder,
akan sangat membutuhkan audit yang berkualitas dan informasi keuangan yang lebih,
dibandingkan dengan era sebelumnya dan pada akhirnya akan meningkatkan ekspektasi
yang tinggi dari profesi AP sebagai auditor ekternal (Gould & Arnold, 2020).
Berdasarkan UU No.5 Tahun 2011 tentang Akuntan Publik, Kementerian Keuangan

c.q Pusat Pembinaan Profesi Keuangan (PPPK), mendapat mandat sebagai regulator di
bidang profesi keuangan untuk melakuan pembinaan dan pengawasan profesi Akuntan
Publik. PPPK dituntut untuk senantiasa menciptakan ekosistem dalam rangka
meningkatkan kualitas audit, diantaranya melakukan pemeriksaan atas ketaatan AP
terhadap ketentuan yang berlaku, dan standar yang dipakai dalam pemberian jasa. Fungsi
pengawasan ini, digunakan sebagai mitigasi risiko atas potensi adanya malpraktik oleh
profesi.
Mengawal Kepercayaan Publik37dan Audit yang Berkualitas - 99

Berdasarkan data statistik dari Pusat Pembinaan Profesi Keuangan (PPPK), terdapat
1.455 AP per April 2021. Sementara di tahun 2020, jumlah Laporan Auditor Independen
(LAI) yang diterbitkan oleh AP yang terdaftar mencapai angka 30.700 laporan. Data terse-
but memerlukan analisis dan pengolahan yang memadai, agar menghasilkan informasi
berdaya guna dalam menunjang fungsi pengawasan dan pembinaan profesi secara efektif
dan e�isien.
Sebuah Solusi, DATA PAPI

Saat ini hasil analisis dan pengolahan data profesi AP belum tersaji secara
komprehensif, visual dan interaktif. Kondisi ini menjadi suatu tantangan dan kebutuhan.
Kecepatan mengolah, menyajikan, dan menganalisis data pendukung pengambilan
keputusan menjadi sebuah keharusan. Berangkat dari hal-hal tersebut, tercetus ide untuk
mencari solusi terintegrasi. Pengoptimalan pemanfaatan data yang tersedia dari pro�il
profesi dan jasa yang diberikannya.
Salah satu alternatif solusi yang ditawarkan adalah DATA PAPI (Dashboard Terpadu
Profesi Akuntan Publik Indonesia). Proyek yang mengusung konsep data analytics data
profesi, dengan menggunakan aplikasi Orange untuk membuat clustering dan potensi
risiko pro�il AP dan KAP berdasarkan anomali data. Kemudian keseluruhan analisis data
ditampilkan dalam bentuk dashboard interaktif dengan menggunakan aplikasi dashboard
open-source, Apache Superset.
Selain infogra�is umum terkait data profesi AP dan KAP, DATA PAPI menawarkan
suatu Early Warning System yang berfungsi untuk mendeteksi, memetakan dan
menganalisis pro�il risiko AP/KAP secara realtime dan online. DATA PAPI juga menyajikan
analisis potensi penerimaan negara dari pajak atas jasa yang diberikan oleh profesi.
Proses Penentuan Sampel

Keterbatasan sumber daya organisasi menjadi salah satu kendala bagi PPPK untuk
melakukan pemeriksaan AP dan KAP secara populasi setiap tahun. Dengan demikian, objek
pemeriksaan harus melalui proses seleksi dengan pendekatan berbasis risiko (risk based
audit). Sampel yang dipilih adalah AP dan KAP, yang mempunyai potensi/dampak yang
cukup signi�ikan terhadap kepentingan publik.
Sekaligus mempunyai kerentanan terhadap potensi pelanggaran. Upaya tersebut

tidak lain sebagai langkah preventif maupun kuratif terhadap pelaksanaan audit oleh
profesi AP.
Melalui DATA PAPI, proses penentuan sampel AP dan KAP yang akan diperiksa dapat
dilakukan lebih tepat. Sehingga tujuan dari fungsi pengawasan PPPK, optimal. Selain itu
kebutuhan data dan informasi tertentu (terkait profesi AP dan KAP), dapat menjadi
pendorong dalam menciptakan formulasi kebijakan strategi pembinaan dan pengawasan
yang lebih efektif dan e�isien sehingga dapat mewujudkan kualitas audit.
Mengawal Kepercayaan Publik dan Audit yang Berkualitas - 100

Deteksi Anomali Risiko AP
Tampilan pada Gambar berikut, merupakan visualisasi dari data analytic yang
dilakukan terkait deteksi anomali risiko AP pada dimensi fee jasa auditnya. Salah satu
dimensi yang digunakan dalam penentuan pro�il risiko tersebut, sejalan dengan hasil riset
yang juga membuktikan adanya pengaruh dari fee jasa audit terhadap kualitas audit1 dan
juga risiko klien2.
Tampilan Anomali Detection Fee Jasa audit vs Aset Klien
Kondisi ini dapat menjadi suatu early warning awal bagi regulator profesi, untuk
menentukan langkah selanjutnya. Apakah perlu dilakukan analisis secara kualitatif
mendalam, dijadikan objek pemeriksaan mendatang, atau tindak lanjut konkrit lainnya.
Modelling
Dengan menggunakan permodelan K-Means pada aplikasi Orange, data profesi AP

dapat dilakukan clustering dan dibagi menjadi lima cluster. Sehingga diperoleh sekumpulan
data cluster tertentu, yang jumlahnya paling dominan dibandingkan cluster lainnya.
Selanjutnya pada data yang sama, juga dapat dilakukan permodelan DBSCAN pada
aplikasi Orange. Ini dilakukan untuk memilah-milah dan mengelompokkan AP, yang terde-
Disusun
teksi oleh:
berisiko. Data Febrian,
yang masukAldi
dalamPratama, Beta dengan
kelompok anomali, Andri dimensi-dimensi
Anggiano pro�il
Uliansyah
risiko yang telah ditentukan. Kedua permodelan tersebut merupakan salah satu alat bantu
untuk memformulasikan risk pro�iling AP dan KAP.
1Audit fee has positive and signi�icant in�luence on audit quality (Sukrisno Agoes, 2014)
2External audit fee are signi�icantly associated with client’s risk (Gonthier-Besacier & Schatt, 2007)

Visualisasi DATA PAPI
Apache Superset memiliki opsi visualisasi yang beragam. Sehingga DATA PAPI dapat
menampilkan model pro�il risiko, dalam gra�is yang menarik dan informatif. Bahkan, dapat
menampilkan visualisasi relasi antara AP dan klien-kliennya dengan network graph. Hal ini,
dapat mendukung kebutuhan pengguna data yang ingin mengetahui informasi AP atau
klien tertentu secara time series.
Network Graph Relasi AP-Klien Tampilan Skoring Risiko 1 KAP

dengan beberapa AP
Kemudian, dilakukan penyaringan data salah satu KAP yang memiliki beberapa AP.
Data tersebut divisualisasikan dalam bentuk radar chart, sehingga terlihat pro�il risiko
masing-masing AP.
DATA PAPI juga mencakup analisis potensi penerimaan negara dari pajak atas jasa,
yang diberikan oleh profesi AP. Data terkait pemberian jasa profesi meliputi besaran
imbalan jasa yang diberikan atas jasa tersebut. Analisis atas data tersebut dapat dijadikan
analisis historis. Hasilnya berupa veri�ikasi akurasi nilai penerimaan negara. Kemudian
analisis prediktif atas potensi penerimaan negara dari pajak jasa profesi, baik dari
pemberian jasa oleh AP itu sendiri, maupun dari sisi klien/Wajib Pajak Badan yang laporan
keuangannya diaudit dan disampaikan informasinya ke PPPK.
Dampak DATA PAPI

DATA PAPI berpotensi melahirkan dampak dan manfaat yang positif baik bagi
organisasi maupun pemangku kepentingan. Data dan informasi atas pemberian jasa oleh
AP dan KAP dapat diolah kemudian dijadikan informasi awal untuk memetakan pro�il
risiko AP dan KAP. Fungsi data analytic pada bagian early warning, membantu hasil
pengolahan data yang dapat digunakan sebagai basis penentuan sampel pemeriksaan dan
deteksi risiko dini pro�il risiko AP dan KAP.
Bagi PPPK yang memiliki peran sebagai regulator profesi AP dan KAP, dapat
memperoleh gambaran umum kondisi profesi melalui dashboard yang informatif. Proyek
ini dapat memberikan kemudahan dalam penentuan rencana kerja. Selain itu dapat
memfasilitasi pengambilan informasi berkala, yang diperlukan untuk mengalokasikan
sumber daya (anggaran, sumber daya manusia, dsb) yang lebih optimal.

Sedangkan pada level Kementerian Keuangan, ketersediaan DATA PAPI dapat
digunakan sebagai sarana pertukaran data antar unit di Kementerian Keuangan. DATA PAPI
juga berpeluang menjadi sarana untuk pengambilan kebijakan ekonomi, serta sarana untuk
menggali potensi penerimaan negara.
Tidak cukup sampai disitu saja. Ketersediaan informasi publik statistik yang
interaktif, dapat dijadikan bahan penelitian, diskusi, knowledge sharing, literatur
pengetahuan dan studi kasus penelitian untuk Stakeholder lain (kementerian/LPND,
akademisi, mahasiswa). Statistik dan informasi mengenai profesi dibutuhkan, pada
beberapa tahapan pekerjaan di pemerintahan/institusi. Contohnya, dalam pelaksanaan
lelang yang mensyaratkan laporan keuangan yang diaudit. Kerja sama antar institusi
pengawasan di bidang keuangan yang berhubungan dengan profesi ini, juga dapat menjadi
suatu early warning dan antisipasi potensi terjadinya krisis sistem keuangan. Publikasi dan
penyebaran data tersebut, tentunya tetap menganut ketentuan yang berlaku tentang
keterbukaan informasi publik.
Kementerian Keuangan sebagai regulator dari profesi AP berperan untuk

mengawasi dan melakukan pembinaan profesi. Pelaksanaan peran tersebut, membutuhkan
dukungan sistem yang menunjang tercapainya tujuan organisasi. Optimalisasi data yang
tersedia didukung dengan analisis yang memadai, dapat menjadi sarana pengambilan
kebijakan pembinaan dan pengawasan yang efektif dan e�isien. Terutama didukung dengan
basis data (data-driven decision). Pengawasan kualitas pekerjaan/pemberian jasa oleh AP,
diharapkan dapat meningkatkan kualitas audit. Sehingga dapat menjaga kepercayaan
publik terhadap audit di Indonesia.
Mengawal Kepercayaan Publik dan Audit yang Berkualitas -103

PelatihanLOKA,
Marketplace
Pelayanan Pelatihan
Pemerintah Pusat
Disusun oleh:
Diananto Krisnandono, Vitri Nurmalasari, dan
Hermawan Sudibya
15
ama tim kami, noWayBack, terinspirasi dari keputusan keikutsertaan kami
dalam Data Hackathon Kemenkeu 2021. Proposal Hackathon SLDK kami susun
hanya dalam tiga hari. Awalnya kami merasa kurang percaya diri karena di antara
kami tidak ada yang memiliki latar belakang IT. Kami hanya bertekad untuk
memanfaatkan data PNBP yang selama ini belum optimal. Kami berharap bisa
mengenalkan PNBP kepada komunitas yang lebih luas. Karena itu tidak ada alasan untuk
mundur, seperti nama tim kami, noWayBack. Upaya ini sejatinya sejalan dengan program
Direktorat PNBP K/L untuk lebih memanfaatkan data PNBP dalam mengawasi, mengelola,
serta mengoptimalkan PNBP untuk pendapatan negara.
Peran PNBP sebagai sumber pendapatan negara acap kali disampaikan dalam Nota
Keuangan APBN. Namun rasanya hingga saat ini belum banyak masyarakat yang mengenal
tentang PNBP. Hal ini berbeda dengan penerimaan pajak atau pendapatan negara dalam
APBN yang sangat familiar di telinga masyarakat. Misalnya saja kasus selebgram yang
memiliki nomor plat kendaraan bermotor mirip plat nomor pejabat negara hanya saja
dengan tiga digit angka. Hanya sedikit yang tahu kalau untuk mendapatkan nomor cantik
seperti itu sudah ada tarifnya dan itu termasuk PNBP?
PNBP terdiri dari beberapa klaster, salah satunya berasal dari penyediaan pelayanan
oleh Kementerian/Lembaga (K/L) kepada masyarakat. Pelayanan tersebut beraneka
ragam, seperti pelayanan di bidang transportasi, penegakan hukum, perlindungan sosial,
kesehatan, hingga pelatihan pengembangan kompetensi Sumber Daya Manusia (SDM).
Tarif pelayanannya pun sudah diatur melalui Peraturan Pemerintah (PP) atau
Peraturan Menteri Keuangan (PMK). Tujuannya adalah agar PNBP yang dibebankan kepada
masyarakat memiliki dasar pungutan yang sah dan menghindari pungutan liar melalui
penetapan tarif yang lebih tinggi dari seharusnya.
Kontribusi PNBP Pelayanan Pelatihan
Sampai dengan saat ini, tercatat sekitar 470 jenis pelatihan yang diselenggarakan
oleh 28 K/L. Pelaksanaan pelatihan tersebut sangat bervariasi, ada yang diperuntukkan
hanya khusus bagi Aparatur Sipil Negara (ASN) dan ada pula yang diperuntukkan bagi
masyarakat umum sesuai dengan minat dan bidang keahliannya, seperti tenaga kesehatan,
keamanan, akuntansi, penanggulangan bencana, dan sebagainya. Setiap tahun, PNBP dari
pelayanan pelatihan mencapai sekitar Rp222,52 miliar.
Realisasi PNBP pelayanan pelatihan yang tersebar pada K/L cukup bervariasi.
Namun, apabila diperhatikan lebih lanjut terjadi gap realisasi PNBP pelayanan pelatihan
yang cukup besar pada beberapa K/L. Pada tahun 2019 misalnya, terdapat 8 K/L dengan
realisasi PNBP pelayanan pelatihan yang kurang signi�ikan, yaitu di bawah Rp1 miliar per
tahun. Hal ini tentu menimbulkan pertanyaan, mengapa PNBP dari pelayanan tersebut
belum memiliki kinerja yang baik?
Pelatihan LOKA, Marketplace Pelayanan Pelatihan Pemerintah Pusat - 105

Banyak hipotesis yang muncul untuk menjawab pertanyaan ini, misalnya: pelatihan
yang ditawarkan kurang menarik minat atau tidak sesuai dengan kebutuhan pengguna
layanan, kapasitas penyelenggaraan pelayanan pelatihan yang kurang optimal pada K/L,
masyarakat tidak mengetahui adanya pelayanan pelatihan yang disediakan oleh K/L di
daerahnya, dan kebutuhan penyediaan pelatihan menggunakan perkembangan teknologi
informasi secara daring.
Dalam visi pemerintah tahun 2019-2024, salah satu aspek yang menjadi perhatian
adalah mengenai pembangunan SDM. Upaya ini dilakukan secara terintegrasi pada seluruh
bidang, baik pendidikan, kesehatan, maupun peningkatan kompetensi dan keahlian melalui
pelatihan. Pembangunan SDM yang baik merupakan kunci agar Indonesia mampu bergerak
menjadi negara maju.
Di sinilah PNBP dari pelayanan pelatihan mengambil peran, melalui penyediaan
pelatihan yang sesuai dengan kebutuhan masyarakat dan dapat diakses secara mudah. Pada
dasarnya, hal tersebut menunjukkan upaya pemerintah untuk membuka ruang belajar yang
seluas-luasnya kepada masyarakat, sehingga mendorong percepatan pembangunan SDM
Indonesia.
Akan tetapi, hingga saat ini belum terdapat tool atau portal informasi terpadu yang
menyediakan informasi mengenai pelayanan pelatihan yang diselenggarakan oleh K/L
secara lengkap dan komprehensif, serta dapat diakses oleh masyarakat. Beragam jenis
pelatihan yang ada, harus dicari informasinya satu per satu pada setiap K/L penyelenggara.
Hal ini tentu sangat menyulitkan, terlebih masyarakat juga belum familiar dengan
jenis-jenis pelatihan yang disediakan oleh K/L. Alhasil, wajar saja jika PNBP pelayanan
pelatihan belum mampu memberikan kontribusi yang optimal.
Ide PelatihanLOKA
Pada April 2020, pemerintah meluncurkan program Kartu Prakerja. Kartu Prakerja
diperuntukkan bagi para pencari kerja (korban PHK maupun lulusan SMK) atau pekerja
produktif (buruh, karyawan). Pencari kerja maupun pekerja produktif dapat mengikuti
pelatihan berserti�ikasi, baik yang disediakan pemerintah maupun lembaga pelatihan
swasta.
Kartu Prakerja bertujuan untuk mengurangi jumlah pengangguran melalui
penyediaan SDM dengan kemampuan yang sesuai kebutuhan dunia usaha. Lebih dari itu,
SDM yang memiliki kemampuan terserti�ikasi, juga mempunyai pilihan untuk berdikari.
Bahkan, bisa mereka n membuka lapangan usaha baru dalam skala mikro yang pada
akhirnya dapat mendorong pertumbuhan ekonomi nasional.
Dalam program Kartu Prakerja tersebut, masyarakat diberikan fasilitas untuk
memilih berbagai ragam pelatihan yang sesuai dengan minat dan kebutuhannya. Pelatihan
dilaksanakan secara luring maupun daring. Cara mengikuti program ini juga sangat mudah,
masyarakat tinggal mengunjungi platform digital yang telah bekerjasama dengan
pemerintah, lalu memilih jenis pelatihan yang dibutuhkan, atau mencari pelatihan yang
diinginkan melalui kolom pencarian (search). Hasilnya, akan muncul berbagai jenis
pelatihan yang berkorelasi dengan kata kunci yang dimasukkan, lengkap dengan informasi
biaya, kurikulum dan pengajar atau institusi penyelenggaranya.
Dari program tersebut, kemudian terbayangkan bahwa hingga saat ini belum ada
portal informasi terpadu mengenai pelatihan yang diselenggarakan oleh K/L secara
lengkap, komprehensif, dan dapat diakses oleh masyarakat. Terpadu, karena seluruh
informasi terkait penyelenggaraan pelatihan dapat diakses pada satu portal yang sama,
seperti: jenis pelatihan, tarif pelatihan, periode pelatihan, sasaran pengguna layanan,
maupun informasi terkait lainnya. Bayangkan saja seperti marketplace, masyarakat tinggal
mencari barang yang dibutuhkan, dan keluarlah berbagai pilihan produk dari beragam
penjual, lengkap dengan harga dan lokasinya.
Ide untuk mengumpulkan seluruh pelatihan yang diselenggarakan oleh K/L dalam
satu portal informasi, kemudian dimunculkan dengan istilah PelatihanLOKA. Pemilihan
kata “Loka” sebagaimana dalam Kamus Besar Bahasa Indonesia (KBBI), berarti dunia atau
tempat. Dengan demikian, portal PelatihanLOKA diharapkan dapat menjadi tempat tujuan
bagi masyarakat untuk mencari pelatihan yang diinginkan, lengkap dengan seluruh
informasi yang berkaitan dengan penyelenggaraan pelatihan tersebut. Kalau ide
PelatihanLOKA ini dapat diaplikasikan, maka setidaknya akan ada tiga manfaat yang
diperoleh.
Pertama, bagi masyarakat sebagai pengguna layanan, PelatihanLOKA dapat
meningkatkan aksesibilitas pelayanan pelatihan yang diselenggarakan oleh K/L. Dengan
terbukanya informasi dan akses atas pelayanan pelatihan tersebut, semakin banyak
masyarakat yang dapat mengikuti pelatihan sesuai dengan minat dan kebutuhan dalam
rangka pengembangan kompetensi dan keahliannya. Hal ini selanjutnya dapat mendukung
visi pemerintah dalam rangka pembangunan SDM.
Kedua, peningkatan jumlah peserta atau masyarakat yang mengikuti
pelatihan-pelatihan tersebut akan mengoptimalkan PNBP layanan pelatihan yang
selanjutnya berkontribusi terhadap pendapatan Negara pada APBN.
Ketiga, portal informasi ini menjadi salah satu media bagi pemerintah untuk
melakukan pengawasan pengelolaan PNBP pada K/L. Salah satunya dengan mengetahui
pelatihan apa yang banyak diminati oleh masyarakat, sehingga menjadi potensi PNBP yang
dapat dioptimalkan. Atau pelatihan yang kurang diminati sehingga dapat disusun strategi
untuk menarik minat peserta pelatihan. Dengan demikian, masing-masing K/L dapat
menyusun kebijakan dalam memperluas dan meningkatkan kualitas maupun kuantitas
layanan pelatihan kepada masyarakat.
PelatihanLOKA sebagai One Stop Information Pelayanan Pelatihan K/L

Ide PelatihanLOKA kemudian kami coba untuk diterjemahkan dalam bentuk yang
lebih nyata, yaitu dengan merinci data-data apa saja yang dibutuhkan, serta bagaimana
desain bangunan sistemnya akan dibuat.
Pertama, mengenai data. Untuk membangun portal informasi yang lengkap dan
terpadu, terdapat beberapa data yang diperlukan seperti:

01. Data jenis dan tarif atas jenis PNBP dari pelayanan pelatihan pada K/L (sumber data
internal dari database tarif PNBP – DJA dan database tarif BLU – DJPB);
02. Data realisasi PNBP dan realisasi volume layanan PNBP dari pelayanan pelatihan
K/L, sampai dengan level satuan kerja (satker) dan lokasi satker (sumber data
internal dari SIMPONI – DJA, OM-SPAN – DJPB, dan BIOS BLU – DJPB);
03. Data substansi besaran, persyaratan, dan tata cara pengenaan tarif PNBP sampai
dengan Rp0,00 atau nol persen terkait pelayanan pelatihan (sumber data eksternal
dari K/L terkait); serta
04. Data deksripsi pelatihan (materi, metodologi, waktu penyelenggaraan), persyaratan
peserta dan kapasitas peserta pelatihan, besaran tarif pelatihan, foto/gambar
terkait pelatihan, dan kontak penyelenggara pelatihan (sumber data eksternal dari
K/L terkait).
Dari daftar kebutuhan data tersebut, dapat tergambarkan dengan institusi mana
saja integrasi data akan dibangun. Agar proses integrasi data dapat terjalin dengan baik,
dapat dibuat kontrak kerja sama antar institusi. Kontrak tersebut dilengkapi dengan
kebutuhan data yang akan dipertukarkan, akses monitoring dari masing-masing institusi,
kewenangan pengelolaan sistem, serta aspek lainnya yang perlu diatur.
Kedua, desain sistem dari PelatihanLOKA. Mengingat keterbatasan sumber daya dan
pembangunan portal informasi PelatihanLOKA yang masih dalam tahap awal, maka
metodologi/pendekatan yang digunakan adalah visualisasi atas pelayanan pelatihan yang
diselenggarakan oleh K/L. Upaya tersebut dapat dilakukan melalui beberapa langkah yaitu:
pengumpulan data-data terkait pelayanan pelatihan K/L, koordinasi dengan instansi
terkait, pengolahan data, dan dilanjutkan dengan pembuatan desain visualisasi data.
Secara sederhana, visualisasi desain dari PelatihanLOKA ditunjukkan dalam gambar
berikut:
Halaman muka PelatihanLOKA

Halaman pelayanan pelatihan yang disediakan oleh LAN RI pada PelatihanLOKA
Halaman pelayanan pelatihan yang disediakan oleh LAN RI pada PelatihanLOKA
Halaman monitoring PNBP dari pelayanan pelatihan pada PelatihanLOKA

Potensi pengembangan portal informasi pelatihanLOKA masih sangat terbuka lebar.
Tidak hanya menyediakan data-data secara visual, namun potensi pengembangan
berikutnya dapat dilengkapi dengan beberapa �itur tambahan. Di antaranya pendaftaran,
interkoneksi dengan sistem layanan pada masing-masing K/L, dan sistem pembayaran
MPN G-3 (sistem billing SIMPONI dan sistem settlement), menu tematik pelatihan, dan
fasilitas call center terpadu.
Portal ini dapat berperan sebagai one stop service information mengenai ragam
pelatihan yang disediakan oleh K/L. Selain itu, proyek ini merupakan upaya untuk
mewujudkan data-driven decision-making. Pada akhirnya, pimpinan akan memiliki
landasan yang kuat dalam proses pengambilan keputusan.

Perancangan
Benchmark
Behavioral Model
Wajib Pajak Sektor
Pertambangan
Batubara
Disusun oleh:
Fajar Eka Prasetyo, Anggar Tri Pamungka,
Moch Rifqi Rizal

Self assessment system adalah azas yang digunakan dalam sistem
pemungutan pajak di Indonesia. Pada sistem ini wajib pajak diberi kepercayaan
untuk mengitung, membayar, dan melaporkan secara mandiri jumlah pajak
terutangnya. Kelemahan sistem ini adalah masih banyak wajib pajak yang dengan
sengaja tidak patuh, memiliki kesadaran rendah, atau bahkan gabungan dari
keduanya.
Penggunaan sistem ini bahkan dapat menimbulkan potensi kehilangan

pajak yang seharusnya masih harus dibayar akibat tidak terdeteksinya kesalahan
Wajib Pajak dalam melakukan pengisian pelaporan SPT. Untuk memitigasinya,
perlu dilakukan pengujian kepatuhan dan kebenaran Wajib Pajak dalam
melakukan pengisian pelaporan SPT.
Pengujian kepatuhan tersebut dapat dilakukan dengan penelitian maupun

pemeriksaan. Namun, pemeriksaan tidak mungkin dilakukan pada seluruh Wajib
Pajak karena membutuhkan banyak sumber daya manusia serta biaya yang besar.
Salah satu solusinya adalah dengan pembuatan benchmark behavioral model.
Benchmark behavioral model merupakan metode benchmarking yang

disusun oleh DJP dalam rangka meningkatkan e�isiensi dan efektivitas
pengawasan kepatuhan wajib pajak. Tujuannya antara lain adalah meningkatkan
e�isiensi SDM dalam melakukan pengawasan, meningkatkan kepatuhan Wajib
Pajak, meningkatkan akurasi basis data DJP, dan meningkatkan penerimaan
pajak.
Dalam proses penyusunan Benchmark Behavioral Model KLU

Pertambangan Produksi Batubara, dibutuhkan data internal berupa data
pelaporan SPT dan data laporan keuangan Wajib Pajak. Data internal tersebut
akan digunakan sebagai basis data project ini yang akan diolah lebih lanjut
menjadi nilai Benchmark Behavioral Model KLU Pertambangan Produksi
Batubara.
Perancangan Benchmark Behavioral Model Wajib Pajak Sektor Pertambangan Batubara- 112
Pembuatan Benchmark Behavioral Model KLU Pertambangan Produksi Batubara
memiliki tahapan sebagai berikut:
1. Pengujian Validitas Usaha Wajib Pajak
Pengujian validitas usaha dilakukan dengan menarik data NPWP dan nama
perusahaan dari Kementerian ESDM. Data tersebut berupa Izin Usaha Pertambangan (IUP)
produksi batubara yang kemudian disandingkan dengan NPWP yang terdaftar di KPP
Madya Banjarmasin. Data yang cocok kemudian dikon�irmasi kepada Account
Representative atas usaha Wajib Pajak tersebut.
2. Penarikan Data dan Pengisian Tabel SE-02/PJ/2016
Tabel SE-02/PJ/2016
Daftar Wajib Pajak yang sudah dikon�irmasi kepada Account Representative terkait
kemudian ditarik data SPT Tahunan PPh Badan dan laporan keuangannya menggunakan
aplikasi Lollipop. Data SPT tersebut kemudian diinput ke tabel SE-02IPJ/2016 yang sudah
disesuaikan dengan kebutuhan benchmark yang akan dibuat.
3. Validasi Tabel Menggunakan Laporan Keuangan
Data yang terdapat pada tabel dibandingkan dengan laporan keuangan yang telah
diupload terakhir. Wajib Pajak yang tidak melampirkan laporan keuangan dikeluarkan dari
daftar karena tidak dapat divalidasi. Khusus untuk Corporate Tax to Turn Over Ratio
(CTTOR), karena pembayaran pajak tidak dapat dipisahkan sehingga tidak perlu
dikeluarkan apabila tidak tersedia laporan keuangan. Apabila terdapat perbedaan antara
laporan keuangan dengan tabel, maka dilakukan koreksi dengan menggunakan data
laporan keuangan. Tabel yang sudah divalidasi dengan laporan keuangan kemudian
dilakukan pembuatan nilai. Apabila terdapat nilai yang kosong atau error, nilai tersebut
dikeluarkan dari nilai yang akan diambil.
4. Pembuatan Kurva Distribusi Normal
Kurva Distribusi Normal
Menurut tim Penelitian dan Pengembangan Universitas Gunadarma dalam buku

"Modul Praktikum Statistika 2", kurva normal menggambarkan kumpulan data yang
muncul dalam suatu penelitian. Sedangkan menurut Mulyono dalam buku "Statistika untuk
Ekonomi dan Bisnis", distribusi normal memiliki ciri-ciri sebagai berikut: 1) Kurvanya
mempunyai puncak tunggal.; 2) Kurvanya berbentuk seperti lonceng.; 3) Rata-rata terletak
ditengah distribusi dan distribusinya simetris di sekitar garis tegak lurus yang ditarik
melalui rata-rata.; 4) Kedua ekor kurva memanjang tak berbatas dan tak pernah memotong
sumbu horizontal.; dan 5) n. p z 5.
Nilai dari label kemudian dihitung dengan menggunakan rumus excel =NORM.DIST.
hasil perhitungan dari rumus tersebut kemudian dibuat gra�ik. Nilai yang persebarannya
diluar gra�ik kemudian dihilangkan agar sesuai dengan gra�ik distribusi normal
5. Membuat Kuartil Dari Nilai
Gambar Kuartil
Menurut lskandar dalam buku "Statistika Bisnis", ukuran posisi berfungsi untuk
menggambarkan posisi sebuah nilai data spesi�ik relatif terhadap nilai data lain di dalam
sebuah kelompok data. Kuartil yaitu bilangan yang dipakai untuk membagi sebuah data
menjadi 4 bagian yang besarnya sama banyak. Dengan kata lain apabila benchmark
menggunakan kuartil maka akan diketahui posisi rasio tersebut terhadap nilai
keseluruhan.
Dari nilai yang sudah terdistribusi normal kemudian dibuat kuartil dengan
menggunakan rumus =QUARTILE. Berdasarkan pengamatan tim BBM, nilai rasio Q3 lebih
sesuai sebagai benchmark karena lebih menggambarkan keadaan yang terjadi di lapangan.
Analisis
Perancangan Benchmark Behavioral Potensi
Model WajibTercapainya Target
Pajak Sektor Penerimaan
Pertambangan Pajak - 114
Batubara- 24
Harapan pengembangan selanjutnya adalah Benchmark Behavioral Model bisa
dibuat untuk seluruh KLU sehingga anomali pelaporan Wajib Pajak semakin terlihat. Untuk
pengembangan KLU pertambangan batubara secara sistem bisa dilakukan sebagai berikut:
Sistem Pengembangan KLU Pertambangan Batubara

Perancangan
Jabatanku Benchmark
di Masa Depan-Behavioral
83 Model Wajib Pajak Sektor Pertambangan Batubara- 115
Penyajian data yang baik tentunya memiliki tampilan yang mudah dipahami sehing-
ga akan memudahkan user dalam menggunakan data tersebut. Rencana antar muka tampi-
lan yang akan digunakan adalah sebagai berikut:
Rasio
Rasio WP Benchmark Status
Keuangan
GPM 15% 30% Tidak Wajar
OPM 10% 25% Tidak Wajar
CTTOR 3% 2% Wajar
PPM 4% 3,5% Wajar
NPM 3,5% 2,5% Wajar
Kesimpulan Wajar
Penutup
Nilai Benchmark yang telah diperoleh hanya sebagai deteksi dini dan tidak bisa
digunakan sebagai dasar koreksi terhadap Wajib Pajak yang memiliki nilai tidak wajar. Atas
hal tersebut sebaiknya user melakukan penggalian potensi lebih lanjut dengan data-data
konkret yang telah didapat.
Harapan kami dengan implementasi proyek ini adalah Account Representative

semakin dipermudah dalam melakukan pekerjaannya sehingga Wajib Pajak yang
sebelumnya tidak tersentuh juga dapat dilakukan penggalian potensi. Menurut kami,
apabila sebuah pekerjaan dilaksanakan dengan hati yang tulus untuk pengembangan diri
dan kemajuan sebuah instansi akan menimbulkan sikap memiliki terhadap instansi
sehingga timbul keresahan-keresahan yang positif. Berawal dari keresahan tersebut akan
muncul ide-ide yang dapat dilakukan untuk membangun instansi lebih baik. Ide yang telah
muncul tersebut dapat diimplementasikan dengan sinergi dan kolaborasi.
SIAS -
SLDK’S INTEGRATED
ANALYSIS SYSTEM
Disusun oleh:
M. Abdul Rochim dan Siti Arifaatus Saadah
17
Kementerian keuangan telah mengimplementasikan inisiatif strategis RBTK untuk
mendukung visi dan misi organisasi sebagai penggerak utama pertumbuhan ekonomi yang
produktif, kompetitif, inklusif, dan berkeadilan di Abad ke-21. Inisiatif strategis ini terdiri
atas IS RBTK Tema sentral, IS RBTK tema penerimaan, IS RBTK tema perbedaharaan, dan IS
RBTK tema penganggaran.
Optimalisasi penerimaan negara menjadi kunci utama pemenuhan sumber

anggaran, dalam rangka mendukung kebijakan pembangunan nasional. Sehingga dalam
pelaksanaannya, Joint program optimalisasi penerimaan negara menjadi salah satu inisiatif
strategis tema penerimaan yang dijalankan. Progam ini merupakan program sinergi antara
Direktorat Jenderal Pajak (DJP), Direktorat Jenderal Bea dan Cukai (DJBC) dan Direktorat
Jenderal Anggaran (DJA). Joint Program menjadi penting karena terdapat irisan proses
bisnis yang dapat disinergikan, untuk dapat menambah potensi penerimaan negara. Tindak
lanjut dari ide ini, diluncurkanlah program joint analysis. Program analisis Bersama antara
instansi terkait.
Lalu apa sebenarnya SLDK’S Integrated Analysis System (SIAS) dan

apa peranannya dalam pelaksanaan Joint Program Kementerian Keuangan?
SLDK’s Integrated Analysis System - 118

“The Behind Story” SLDK’S Integrated Analysis System (SIAS)
Sejak pelaksanaan joint analysis pada tahun 2018, terdapat beberapa fakta dan
tantangan yang harus dihadapi. Volume data objek analisis sangat besar. Ilustrasinya pada
area kepabeanan, jumlah dokumen BC 2.0 mencapai lebih dari 179 ribu per hari, lebih dari
49 ribu entitas aktif, lebih dari 37 juta seri barang impor. Ilustrasi tersebut baru dari sisi
kepabeanan untuk satu jenis dokumen. Sehingga dapat dibayangkan besarnya data-data
yang harus dianalisis dari sisi kepabeanan, perpajakan, dan PNBP. Hal yang kontradiktif
dari kondisi tersebut adalah jumlah sumber daya sangat terbatas, baik dari sisi sumber
daya manusia, waktu, anggaran, dan sebagainya.
Sehingga untuk dapat memperoleh insight maupun informasi untuk dapat

mendukung data driven decision making, perlu dilakukan analisis data. Salah satunya
adalah dengan pemanfaatan data analytics, untuk ekstraksi informasi ataupun pelaksanaan
analisis yang terintegrasi dan komprehensif. Pada Pelaksanaannya, Joint Analysis belum
didukung sistem analisis terintegrasi yang komprehensif maupun pemanfaatan data
analytics. Sehingga analisis yang dilakukan, cenderung bersifat parsial karena dilakukan
oleh masing-masing analis dan bersifat tematik dan belum terotomasi. Hal ini tentu akan
menjadi kurang efektif dan e�isien. Analisis yang dihasilkan kurang komprehensif serta
keberlangsungan analisis akan berhenti ketika terjadi perubahan tema analisis.
Hal-hal tersebut kemudian mendorong hadirnya SLDK’S Integrated Analysis System

(SIAS), yang diharapkan menjawab semua tantangan dalam pelaksanaan Joint Analysis, dan
mendukung keberhasilan pelaksanaan Joint Program optimalisasi penerimaan negara.
Tujuan proyek
Tujuan dari proyek ini adalah untuk mendukung pelaksanaan joint analysis yang
lebih komprehensif, efektif, dan e�isien. Di mana proses analisis akan dilakukan oleh sistem,
sedangkan analis berfokus pada proses data-driven decision making dan proses pembuktian
sesuai dengan fakta lapangan. Proses analisis yang dilakukan akan lebih komprehensif, real
time, dan kontinuitas tema analisis akan terdokumentasi dengan baik.
Langkah-langkah yang diambil dalam pembangunan proyek:
01. Pemahaman proses bisnis dan identi�ikasi risiko;
02. Pengumpulan dan penyiapan data;
03. Konstruksi parameter risiko;
04. Visualisasi.
Pemahaman Proses Bisnis dan Identi�ikasi Risiko

Pada tahapan ini, dilakukan pemahaman proses bisnis dari masing-masing unit baik
dari sisi kepabeanan (Direktorat Jenderal Bea dan Cukai), perpajakan (Direktorat Jenderal
Bea dan Cukai), dan PNBP (Direktorat Jenderal Anggaran).

Kemudian dilakukan identi�ikasi risiko-risiko pelanggaran pada masing-masing
unit. Selanjutnya dilakukan evaluasi irisan yang dapat diintegrasikan untuk ditindaklanjuti
dengan pembangunan parameter dalam sistem.
Pengumpulan data dan penyiapan data

Pada tahapan ini, dilakukan pengumpulan data-data yang dibutuhkan untuk
pembangunan parameter. Data diperoleh melalui SLDK dan data eksternal. Sehingga data
terintegrasi, teragregasi, dan terstruktur. Ruang lingkup data yang digunakan adalah
data-data atas wajib pajak, yang terdapat irisan setidaknya dua proses bisnis. Data yang
diperlukan adalah data transaksi impor kepabeanan, data transaksi ekspor kepabeanan,
data pelaporan SPT Masa PPN, data SPT badan, data penerimaan PPh pasal 22 ekspor dan
impor, SPT masa pph pasal 26 induk, serta data detil pembayaran PNBP dari aplikasi
Harmoni. Terutama terkait dengan PNBP atas pemanfaatan sumber daya alam, dan
data-data lain yang relevan.
proses penyiapan data dilakukan dengan cara dilakukan dengan proses
pembersihan dan analisis anomali data (outlier). Apabila terdapat anomali, akan dilakukan
kon�irmasi kepada pemilik data. Hal ini penting dilakukan sebagai pertimbangan, apakah
data tersebut dapat dimanfatkan dalam proses analisis atau tidak.
Konstruksi Parameter Risiko

Pada bagian ini, dilakukan penyusunan konstruksi parameter risiko dalam Joint
Analysis. Dua besaran risiko yang dibangun dalam SIAS, adalah risiko Custax (irisan risiko
antara data kepabeanan dan perpajakan) dan risiko PNBP (irisan risiko antara data
kepabeanan, perpajakan, dan PNBP SDA). Parameter risiko tersebut dibangun dengan
perhitungan ekonometrik ataupun pemanfaatan data analytics untuk identi�ikasi Indikasi
risiko pelanggaran.
Data Analytics Untuk Identi�ikasi Risiko Pelanggaran

Pada bagian ini, dilakukan pemanfaatan data analytics untuk prediksi nilai ekspor.
Variabel yang digunakan yaitu, HS Code, jumlah satuan, netto, negara penerima, dan
sebagainya. Hasil prediksi kemudian akan dibandingkan dengan nilai ekspor yang
dilaporkan wajib pajak. Hasil perbandingan ini menghasilkan informasi wajib pajak dan
transaksi ekspor dengan indikasi ketidaksesuaian pelaporan nilai devisa ekspor. Informasi
ini sangat diperlukan, karena nilai ekspor akan mempengaruhi nilai pembayaran PNBP, BK,
PPh badan dan PPH pasal 22 ekspor).
Pemodelan
Proses ini memanfaatkan machine learning Phyton, dengan menggunakan model
prediksi Random Forest dan Gradient Boosted Tree. Untuk mendapatkan model yang
memberikan hasil prediksi terbaik, diaplikasikan �itur randomized search dan model
prediksi dengan nilai mean absolute error (MAE) terkecil.

Gambar Sintax Pemodelan
Visualisasi
Visualisasi dalam SLDK’S Integrated Analysis System (SIAS) dibagi menjadi dua
bagian besar, yaitu Executive summary dan Analisis detil per entitas.
Gambar Fitur Executive summary
Pada bagian ini, SIAS akan menyajikan informasi executive summary atas monitoring
pelaksanaan Joint Analysis, risiko-risiko yang diidenti�ikasi, serta menu targeting objek joint
analysis berdasarkan �iltering pada besaran risiko.
Gambar analisis detil per entitas

Analisis Detil Risiko PNBP
SIAS menyajikan informasi per entitas terkait dengan resume risiko PNBP (alert),
infogra�is persandingan data kepabeanan, perpajakan, PNBP, hasil analisis risiko PNBP
dengan parameter ekonometrik dan infogra�is, serta informasi atas analisis nilai ekspor
dengan pemanfaatan data analytics. Hasil analisis pada bagian ini akan menjadi input pada
�itur executive summary sebagaimana telah dijelaskan pada bagian sebelumnya.
Analisis detil risiko Custax
SIAS menyajikan informasi per entitas terkait dengan resume risiko custax (alert),
infogra�is persandingan data kepabeanan, perpajakan atas transaksi impor dan ekspor, dan
hasil analisis risiko custax dengan parameter ekonometrik. Hasil analisis pada bagian ini,
akan menjadi input pada �itur executive summary sebagaimana telah dijelaskan pada bagian
sebelumnya.
Fitur-�itur dalam SIAS bersifat �leksibel dan dapat terus dikembangkan, seiring
dengan perkembangan identi�ikasi risiko pelanggaran pada Joint Analysis. Pada
penerapannya, SIAS dapat menggunakan data real time sehingga diharapkan mampu
memberikan informasi yang lebih relevan dan mutakhir.
Outcome yang diharapkan

Pemanfaatan SIAS dalam pelaksanaan Joint Analysis diharapkan memberikan
outcome berupa :
01. Meningkatkan efektivitas pelaksanaan Joint Analysis.
SIAS akan memberikan informasi atas hasil analisis risiko Joint Analysis secara lebih
komprehensif dan terintegrasi. Dengan demikian targeting Joint Analysis dapat
dilakukan dengan lebih tepat sasaran dan Coverage Analysis yang lebih luas;
02. Meningkatkan e�isiensi.
SIAS akan melakukan proses analisis terotomasi, sehingga analis dapat berfokus pada
proses data driven decision making dan pembuktian sesuai fakta di lapangan;
03. Meningkatkan integritas.
SIAS akan mewujudkan pelaksanaan seluruh kegiatan analisis dan monitoring
pelaksanaannya terdokumentasi dengan baik. Dan seluruh proses bersifat traceable;
04. Kontinuitas kegiatan analisis.
SIAS akan melakukan kegiatan analisis secara berkesinambungan dengan data yang
lebih mutakhir.
Outcome yang dihasilkan, diharapkan dapat memberikan kontribusi penerimaan
negara yang semakin tinggi. Tingkat kepatuhan pengguna jasa dalam jangka panjang akan
meningkat pula dengan pelaksanaan equal treatmet ketidakpatuhan.
SLDK’s Integrated Analysis System

37 - 123
“Perubahan adalah keniscayaan, menjadi adaptif adalah
jawaban, dan sinergi adalah keharusan” So, Break your wall,
open your mind and let’s start it.
M Abdul Rochim dan Siti Arifaatus Saadah

Use Case Realisasi
18
Anggaran versus
RPD: Kreativitas
Engineering
Disusun oleh:
Zhein Adhi Mahendra Setiawan, Defy Oktaviani,
dan Nabiilatul Arifah
alam pekerjaan sehari-hari kami sebagai ASN, kami juga tidak bisa
terlepas dengan pengolahan data. Namun demikian, data analytics dan
machine learning adalah hal baru bagi kami. Melalui media yang
disediakan pada kelas data analytics pada kompetisi Hackaton 2021
Kemenkeu, kami belajar mengenai phyton yang menurut kami akan sangat
bermanfaat untuk diaplikasikan dalam pekerjaan di unit kerja kami.
Selain dalam kelas tersebut, kami juga melakukan pembelajaran mandiri

dari platform Kaggle dan juga YouTube. Banyak hal yang kami pelajari yang
membuat kami semakin tertarik dengan data analytics. Kami meyakini bahwa
banyak hal yang bisa dilakukan dengan bantuan machine learning, baik untuk
menampilkan pro�il dari suatu data maupun juga forecasting, termasuk pada use
case yang kami pelajari dan jalani project-nya, yaitu pengolahan data mengenai
realisasi anggaran dan kaitannya dengan rencana penarikan dana (RPD).
Dalam use case tersebut, kami melakukan beberapa langkah dan strategi
untuk bisa menyelesaikan tantangan yang diberikan. Dengan mengkontemplasikan
pengalaman sebagai ASN dalam melakukan perencanaan dan pengelolaan
anggaran di unit kerja, kami mencoba memahami setiap dataset yang diberikan
sebagai studi kasus dan kemudian berusaha membuat modelling sebagai bagian
akhir dari analisis yang kami lakukan. Selain itu yang tidak kalah penting sebelum
kami melakukan pengolahan data, kami juga berusaha memahami proses bisnis,
memahami data itu sendiri, melakukan pre-processing, dan kemudian membuat
modelling dari data yang telah kami pelajari dan olah lebih lanjut.

Pemahaman Bisnis
Dalam use case yang kami kerjakan, kami melakukan studi kasus pada data realisasi
anggaran dari suatu satuan kerja dalam periode satu tahun anggaran. Studi kasus ini
mengisyaratkan bahwa estimasi realisasi anggaran pada satu periode tertentu (misal satu
bulan) adalah sebuah data berharga yang dapat digunakan sebagai dasar penyusunan
exercise kebijakan penganggaran, seperti refocusing anggaran, penghematan anggaran, dan
kebijakan lain pada tahun berjalan, termasuk untuk forecasting kebutuhan pagu pada
tahun anggaran yang akan datang.
Berdasarkan dari apa yang kami pelajari sebelumnya, realisasi anggaran periode
tertentu seharusnya merupakan bentuk nyata dari rencana penarikan dana (RPD) yang
telah disusun satuan kerja baik pada awal tahun anggaran, maupun pada periode tahun
anggaran berjalan ketika terjadi revisi anggaran. Dalam pengertian sederhana, realisasi
haruslah sama dengan RPD. Pemahaman inilah yang kami gunakan dalam menganalisis
data yang diberikan pada use case.
Pemahaman Data
Setelah kami memahami proses bisnis dari realisasi anggaran dan RPD, selanjutnya
kami juga harus memahami setiap dataset yang diberikan dalam use case. Pada tahap
pengerjaannya, kami diberikan dua dataset, yaitu untuk train dan test. Data train terdiri
dari 66.470 observasi sedangkan data test terdiri atas 16.618 observasi. Selanjutnya dari
kedua jenis dataset tersebut, terdapat sembilan variabel, yaitu:
THANG : Tahun anggaran dari kegiatan yang dilakukan
NM DEPT : Nama Kementerian/Lembaga sebagai pengguna anggaran
NMSATKER : Nama satuan kerja Kementerian/Lembaga
NMKEGIATAN : Nama kegiatan yang dilakukan
JENISBELANJA : Kelompok belanja yang dilakukan
RPHPAGU : Batas tertinggi nilai anggaran yang direncanakan pada periode

yang ditentukan
PERIODE : Bulan kegiatan
RPD : Nilai rencana penarikan dana anggaran pada periode yang

ditentukan
REALISASI : Status realisasi anggaran (Ada Realisasi/Tidak Ada Realisasi).

1 menandakan terdapat realisasi, 0 menandakan tidak terdapat
realisasi.
Use Case Realisasi Anggaran versus RPD: Kreativitas Engineering -127

Dari kedua jenis dataset dan juga variabel yang diberikan tersebut, kami
mendapatkan temuan yang menarik ketika memperhatikan feature ANGGARANID yang
seharusnya tidak memiliki korelasi dengan penyerapan. Namun dari scatterplot yang kami
buat berikut, dapat dilihat bahwa terdapat tendensi ID lebih dari 1000 memiliki kans lebih
tinggi untuk menyerap anggarannya.
Gambar 18.1 Scatterplot antara ANGGARANID dan RPHPAGU terhadap REALISASI
Sebenarnya, model memperlihatkan bahwa akurasi lebih baik ketika feature ini
diterapkan. Akan tetapi kami tidak menggunakan feature ini karena menurut logika kami,
feature ini seharusnya tidak berpengaruh terhadap target penyerapan. Fenomena ini
diduga terjadi karena adanya pengelompokan satuan kerja ketika membuat data, dimana
satuan kerja yang memiliki pagu yang besar diurutkan dari ID yang besar. Hal ini
menyebabkan antara feature RPHPAGU dan ANGGARANID akan memiliki korelasi yang
kuat. Dari fenomena ini, kami menyimpulkan bahwa ada banyak hal yang dapat direkayasa
dari feature RPHPAGU, sehingga kami memutuskan untuk menggunakannya dalam rangka
mendapatkan feature OPTIMIS dan N_OPTIMIS sebagai andalan untuk meningkatkan
public score.
Pre-processing (Cleansing & Engineering)

Tahapan selanjutnya setelah pemahaman bisnis dan pemahaman data adalah
cleansing dan engineering data. Dalam tahap cleansing data, kami menggunakan Power
Query, suatu aplikasi yang terintegrasi di dalam Microsoft Excel dan Power BI. Aplikasi ini
memiliki keunggulan dalam visualisasi data frame, sehingga perubahan yang dilakukan
dapat dikoreksi dengan mudah tanpa perlu menggunakan syntax tambahan.
Dari pengamatan kami atas dataset yang diberikan, kami merasa bahwa data yang
diberikan sudah relatif rapi sehingga tidak memerlukan terlalu banyak proses cleansing
data. Akan tetapi kami menghadapi permasalahan ketika kami menggunakan Power Query
pada tahap cleansing data. Data yang kami simpan dalam format .csv agar dapat dibaca
phyton justru memunculkan baris acak. Namun demikian, permasalahan tersebut dapat
kami selesaikan dengan cara memberikan indeks pada data tersebut.
Sebelum menentukan model terbaik untuk menganalisis Use Case 1 ini, kami
melakukan proses brainstorming untuk mendiskusikan feature yang mungkin dapat
dimodi�ikasi atau ditambahkan ke dalam dataset. Kami berusaha mengolah data untuk
melihat adanya pola-pola tertentu pada data yang dapat mempengaruhi hubungan antar
variabel dalam proses estimasi/forecasting yang kami susun. Dari hasil brainstorming
tersebut, kami memodi�ikasi atau menambahkan beberapa feature berikut:
1. Feature COVID dan PSBB. Feature ini kami tambahkan untuk menggambarkan
situasi sebelum dan pada masa pandemi covid-19, dan masa ketika dilaksanakan
PSBB dan tidak ada PSBB.
2. Feature D-RPD. Feature ini adalah dummy yang membedakan antara satuan kerja
yang menyusun RPD dan yang tidak menyusun RPD. Kami berasumsi bahwa RPD
yang disusun oleh satuan kerja (meskipun kecil) tetaplah merupakan faktor penting
dalam menentukan penyerapan anggaran pada satuan kerja dimaksud.
3. Feature BULAN, yang diberi angka sesuai urutannya (1-12). Feature ini ditambahkan
karena kami berasumsi bahwa selain feature PERIODE yang merupakan kategorikal,
kami mengamati data yang menunjukkan adanya tren kenaikan penyerapan
menjelang akhir tahun (Desember). Hal ini juga mengindikasikan bahwa data
tersebut bersifat ordinal. Maka, dengan penambahan feature BULAN, kami dapat
mengidenti�ikasi lebih detil pada periode mana tren kenaikan tersebut terjadi.
4. Memecah dua feature NMKEGIATAN yang sudah ada di dataset dengan

menambahkan kata “DAN”, sehingga menjadi NMKEGIATAN.1 DAN NMKEGIATAN.2.
Hal ini kami lakukan karena adanya indikasi bahwa nama kegiatan sebenarnya
terdiri dari kegiatan dan output. Namun, karena feature NMKEGIATAN pada dataset
tidak lengkap, maka kami menggantinya dengan angka “0” (nol).
5. Ketika menganalisis feature NMSATKER, kami menemukan hal menarik. Feature ini
menurut kami mengandung banyak informasi penting, seperti tipikal satuan kerja
dan juga nama lokasi dan tipe satuan kerja (�isik/non-�isik) yang seharusnya ada
dalam feature ini. Sementara itu, dikarenakan nama tersebut disamarkan di dalam
dataset, maka kami melakukan pengumpulan kata-kata yang sering muncul dalam
feature tersebut lalu menjadikannya data dummy. Dari proses ini, kami berhasil
membuat 29 feature tambahan.
6. Feature OPTIMIS dan N_OPTIMIS. Feature ini kami tambahkan untuk melihat
optimisme satuan kerja dalam melakukan penyerapan anggaran. Feature OPTIMIS
kami peroleh dari hasil perbandingan antara pagu dengan RPD, sementara feature
N_OPTIMIS diperoleh dari hasil pengurangan pagu dan RPD.

Sebelum menentukan model terbaik yang akan kami buat, kami telah mencoba
berbagai macam metode, seperti Random Forest, XGBoost, dan Light BGM. Kami
mempelajari optimasi dari setiap model tersebut. Dalam proses tersebut, kami juga
menemukan panduan model Catboost (dari developer yandex melalui tautan
https://youtu.be/usdEWSDisS0). Selanjutnya, berdasarkan praktik modelling yang kami
lakukan maka kami memperoleh hasil prediksi yang lebih baik dari beberapa model yang
telah kami buat sebelumnya. Pada tahap evaluasi, kami menggunakan tabel sederhana
untuk melihat tingkat akurasi dan optimasi dari setiap model yang kami buat.
Sementara itu untuk meningkatkan akurasi model, kami melakukan iterasi hyper
parameter dengan library OPTUNA. Selain itu, kami juga meniru contoh code dari Kaggle
untuk melakukan prediksi klasi�ikasi dengan cara menghilangkan data test. Dengan cara
tersebut, kami kemudian membuat seluruh data menjadi data train lalu membuat
beberapa model dengan iterasi pohon keputusan (5.000 hingga 10.000 pohon). Selanjutnya
kami mengevaluasi kinerja kami dengan mengunggahnya ke Kaggle untuk melihat hasil
dari public score. Dari hasil unggahan tersebut, kami membandingkan akurasi dari data test
dan akurasi dari public score untuk menentukan model terbaik yang akan dipilih.
Keterangan Accuracy Private Public

Metode Metode Model Score Score
CATboost Tanpa Data Tes dengan 8000 trees* 0,9657139 0,91786 0,92267
CATboost Tanpa Data Tes dengan 10000 trees 0,9654280 0,91866 0,92086
Banyak Features dengan optimasi
CATboost Optuna 0,9552239 0,91204 0,91530
CATboost Data Tes sangat kecil 0,9402985 0,91475 0,92176

Seluruh data kategorikal dijadikan Cat
features category, Logloss yang
CATboost diperoleh sangat Rendah 0,9402985 0,91505 0,92131
Data Tes sangat kecil, data
NMKEGIATAN yang kosong disubtitusi
CATboost dengan modus 0,9402985 0,91645 0,91981
Simple features dengan optimasi
CATboost Optuna* 0,9186099 0,91094 0,91981

Kreativitas Engineering
Menurut kami, kunci utama dalam memecahkan use case ini adalah proses kreatif
pada tahap feature engineering dan pemilihan metode yang tepat. Kreativitas yang kami
lakukan ketika memodi�ikasi/menambahkan feature di atas juga melibatkan proses
berpikir “out of the box”, dimana kami mencoba metode yang bahkan belum familiar
sekalipun. Model Catboost yang kami buat menggunakan 43 features, yaitu: 'RPD', 'D_RPD',
'RPHPAGU', 'PSBB', 'COVID', 'BULAN', 'OPTIMIS', 'N_OPTIMIS', 'THANG', 'NMDEPT',
'NMSATKER', 'NMKEGIATAN.1', 'NMKEGIATAN.2', 'JENISBELANJA', 'PERIODE', 'Muda',
'Tua', 'Pudar', 'Biasa', 'Bergaris', 'Berbintik', 'Bintik', 'Mengkilap', 'Cerah', 'Terang', 'Gelap',
'Kesan', 'Aprikot', 'Gading', 'Agak', 'Padam', 'Arang', 'Kekuningan', 'Lembayung', 'Air',
'Kekuning- Kuningan', 'Kecokelatan', 'Navy', 'Keunguan', 'Emas', 'Langit', 'Kemerahan', dan
'Marun'.
Namun demikian berdasarkan pengalaman kami dalam menyelesaikan use case ini,
kami merasa bahwa salah satu hal yang perlu diperbaiki adalah features turunan yang
didapatkan dari feature NMSATKER. Pengelompokan yang dibuat seharusnya dapat
disusun dengan lebih sederhana. Feature yang dipilih mungkin bukanlah kata per kata,
tetapi gabungan kata yang lebih logis. Hal ini perlu dilakukan untuk mengekstraksi
informasi satuan kerja unik yang mungkin saja sama dengan satuan kerja lainnya.

19
Berapa Nilai Impor
Barang?
Analisis Regresi
Pada Harmonized
System
Disusun oleh:
Fajar Dimar Habibi, Caesario Oktanto Kisty,
dan Egi Anggriawan
(Badan
Use Case Siberversus
Realisasi Anggaran dan RPD:Sandi
KreativitasNegara)
Engineering - 126
Business Understanding
Secara umum kita ketahui bahwa setiap barang yang diimpor ke Indonesia akan
diperiksa secara �isik maupun nilai barang oleh Direktorat Jenderal Bea dan Cukai untuk
ditentukan besaran pajak yang harus dibayarkan. Karena pada umumnya orang berusaha
menghindari pajak, kita patut menduga benarkah besaran pajak yang dibayarkan sudah
sesuai? Adakah kemungkinan manipulasi nilai barang agar besaran pajak yang harus
dibayarkan menjadi lebih kecil dari seharusnya? Dari hal inilah yang menggelitik rasa
penasaran kami untuk kemudian mencoba membangun model prediksi atas nilai barang
berdasarkan pada karakteristik dan informasi barang yang diimpor sehingga diperoleh
nilai yang akurat.
Data Understanding
Setelah kami mencoba memahami lebih baik proses bisnis dalam analisa nilai impor
barang, kami mencoba memilah terlebih dahulu data yang diberikan kepada tim kami. Pada
use case yang diberikan, kami memperoleh dua jenis data, yaitu data train dan data test.
Pada data train, kami memperoleh 797.269 records, yang terdiri dari 10 columns, 9
Independent Variable, dan 1 Dependent Variable (Harga_Barang_IDR). Sementara pada data
test, kami mendapatkan 99.318 records, 9 columns, dan 9 Independent Variable.
Harmonized System
Harmonized System atau biasa disebut HS adalah suatu daftar penggolongan barang
yang dibuat secara sistematis dengan tujuan mempermudah penarifan, transaksi
perdagangan, pengangkutan dan statistik yang telah diperbaiki dari sistem klasi�ikasi
sebelumnya. Terdapat 9 HS (atau "KODE_BARANG") pada dataset yang tersedia, baik pada
Data train maupun data test. Berikut ini sebaran data untuk setiap "KODE_BARANG":
Berapa Nilai Impor Barang? Analisis Regresi Pada Harmonized System - 133
Data Overview
Pre-processing
Tahapan yang kami lakukan sebelum membangun model prediksi adalah melakukan
pre-processing berupa data cleansing dan feature engineering. Secara prinsip, kami
melakukan cleansing pada kolom "DESKRIPSI_BARANG" adalah dengan menghapus 2 hal,
yaitu kata-kata 'BARU', 'BARANG BARU', 'BAIK & BARU', 'BAIK DAN BARU', 'BAIK/BARU',
'KEADAAN BARU', 'BAIK', serta Tanda Baca. Kemudian hasil cleansing disimpan di kolom
"TEXT_CLEANED".
Selanjutnya pada proses feature engineering, kami membuat kolom baru yang
berisikan jumlah kata untuk setiap baris di kolom "TEXT_CLEANED". Harapannya, kolom ini
dapat membantu model untuk mengenali membedakan satu barang dengan barang lainnya.
Kolom tersebut kami beri nama "TOKEN". Terdapat 8 kolom yang akan digunakan untuk
membangun model. Kedelapan kolom tersebut dilakukan pre-processing sesuai dengan tipe
data nya masing-masing, yang dibagi menjadi tiga tipe data, yaitu tipe Categorical, tipe Text,
dan tipe Numerical. Tahapan detail sebagaimana gambar berikut.
Modelling and Evaluation
Dalam membuat Pemodelan, kami menggunakan teknik Cluster-then-Predict Model.
Setelah dataset dipisahkan sesuai dengan cluster-nya, kemudian dilakukan model training
menggunakan algoritma LightGBM. Pemilihan algoritma tersebut merujuk pada
kesuksesan dalam mengolah data bertipe categorical, numerical dan text untuk melakukan
prediksi harga sebuah produk (Akshay, 2019) . Sementara pada model evaluation, kami
menggunakan Cross Validation dengan n_splits = 5 agar komposisi data train menjadi
80%-20%, bersamaan dengan hyperparameter tuning pada jumlah tree yang digunakan
(n_estimators). Kami juga melakukan perhitungan evaluasi menggunakan Root Mean
Square sehingga diperoleh gra�ik evaluasi dibawah ini.
1 Akhsay Raddy Chada, 2019. Strategic Pricing of Used Products for e-Commerce Sites. IOWA State University Thesis
Untuk menentukan n_estimators yang digunakan, dilakukan agregasi terhadap nilai
RMSE untuk setiap cluster dan n_estimators. Agregasi dilakukan menggunakan formula
berikut ini:
Selanjutnya, dengan menggunakan formula agregasi di atas, diperoleh nilai RMSE

seluruh cluster untuk setiap n_estimators sebagaimana digambarkan pada gra�ik dibawah
ini:
Berdasarkan gra�ik di atas, nilai RMSE mulai statis pada n_estimators 1500.
Berdasarkana hal tersebut dan dengan mempertimbangkan performa waktu training
model, dipilih tree sebanyak 1500 sebagai parameter n_estimators pada algoritma
LightGBM. Kemudian kami melakukan train model dengan seluruh data train untuk
melakukan prediksi pada data test yang disediakan. Berikut adalah hasil RMSE yang kami
submit pada platform Kaggle.
Key Result
Berdasarkan project yang kami buat di atas, kami meyakini bahwa model regresi
dapat digunakan untuk menganalisa nilai impor barang. Direktorat Jenderal Bea dan Cukai
dapat menggunakan model ini agar dapat mengetahui nilai sebenarnya dari barang-barang
yang diimpor ke Indonesia secara lebih baik sehingga besaran pajak pun dapat dihitung
dengan lebih akurat. Walaupun demikian, berdasarkan eksperimen diluar resume ini, kami
juga meyakini bahwa cluster-then-predict techniques dapat memperbaiki nilai RMSE. Selain
itu, data cleansing pada data variabel text memiliki peran penting pada hasil nilai RMSE.
Berdasarkan hal tersebut, kami berasumsi bahwa untuk pengembangan selanjutnya kita
dapat mencoba menerapkan model yang berbeda untuk setiap cluster. Hal lain yang dapat
dilakukan adalah dengan membuat hyperparameter tuning pada parameter lainnya.
Analisis
Berapa Nilai Impor Barang?Potensi Tercapainya
Analisis Target
Regresi Pada Penerimaan
Harmonized Pajak-- 138
System 24
Debt Sustainability
Analytics : Upaya
Mencegah Krisis
Utang
Disusun oleh:
Fairuz Sufi Aziz, Dwi Purnomo, dan Reza Darmawan
aat ini dapat dikatakan bahwa hampir semua negara memiliki utang. Tidak sedikit
pula negara-negara yang kemudian memiliki utang yang besar dan bahkan
“terjebak” oleh utang (terutama utang luar negeri). Fenomena ini tentu saja
semakin mengkhawatirkan dengan adanya ujian lain berupa pandemi Covid-19 yang
berlangsung hingga saat ini. Setiap negara tentu harus menyiapkan berbagai strategi untuk
mengatasi krisis di negaranya, termasuk krisis utang ini. Demikian halnya dengan negara
kita, Indonesia. Sudah kita ketahui bersama bahwa APBN kita menggunakan paradigma
de�isit, dimana salah satu instrumen pembiayaan untuk menutup celah de�isit tersebut
adalah dengan utang. Maka untuk menjaga agar utang tersebut tidak sampai menjadi
sebuah krisis, diperlukan alat analisis berupa Debt Sustainaibility Analysis (DSA).
DSA merupakan alat penting yang dapat digunakan oleh pemerintah untuk menilai
kerentanan utang negara serta dapat memberikan peringatan kepada instansi terkait
tentang risiko-risiko yang perlu diantisipasi dan kebijakan �iskal yang perlu disiapkan.
Bahkan, organisasi internasional menyatakan bahwa DSA merupakan praktik terbaik atas
pengelolaan utang pemerintah. IMF mengembangkan kerangka kerja formal dengan
menyusun DSA sebagai alat untuk mendeteksi, mencegah, dan menyelesaikan potensi krisis
dengan lebih baik. World Bank dan IMF (2019) dalam dokumen berjudul Developing A
Medium-Term Debt Management Strategy Framework (MTDS) – Updated Guidance Note For
Country Authorities (2019), menyebutkan bahwa DSA digunakan untuk menilai apakah
kebijakan �iskal memiliki kesinambungan/keberlanjutan dalam jangka panjang. Sementara
itu, Parlemen Uni Eropa dalam artikelnya yang berjudul Debt Sustainability Assessments: The
state of the Art tahun 2018 menyatakan bahwa Uni Eropa telah mengembangkan kerangka
kesinambungan utang dengan menerbitkan Debt Sustainability Monitoring (DSM) secara
tahunan sebagai bagian dari siklus tiga tahunan Fiscal Sustainability Report (FSR).
Dalam praktiknya, tanggung jawab untuk menyusun DSA terletak pada otoritas �iskal
pemerintah, yakni Kementerian Keuangan. Namun demikian, BPK RI dalam salah satu hasil
pemeriksaan kinerja pernah menyorot hal ini pada tahun 2019, di mana pada saat itu
Pemerintah belum secara khusus menyusun dan melaporkan DSA. Berdasarkan hal
tersebut, kami memiliki ide untuk mengembangkan tools DSA untuk membantu Pemerintah
dalam memantau perkembangan dan kondisi utang di Indonesia, termasuk memprediksi
kondisi utang di masa yang akan datang. Selain itu, dalam meningkatkan tata kelola atas
utang Pemerintah, tools ini dapat dimanfaatkan untuk menyiapkan analisis/asesmen atas
kesinambungan utang dan menyiapkan langkah-langkah antisipatif dalam rangka
pengelolaan utang. Kami berharap pengelolaan keuangan negara menjadi lebih akuntabel
sehingga kepercayaan dari masyarakat kepada Pemerintah semakin tumbuh.
Benchmark
DSA merupakan metodologi analisis yang dapat dimanfaatkan untuk mengukur
bagaimana tingkat sovereign debt suatu negara berpengaruh pada kemampuan negara
tersebut memenuhi kewajiban utangnya. Maka diperlukan sebuah kerangka kerja
(framework) yang sesuai untuk dapat menghasilkan analisis yang kredibel.
Debt Sustainability Analytics -140

Penyusunan tools yang kami beri nama Debt Sustainability Analytics ini mengacu
pada framework debt sustainability analysis yang diterbitkan oleh IMF pada tahun 2011,
dengan petunjuk teknis implementasi DSA yang diterbitkan kemudian pada tahun 2013.
Kami melihat bahwa Framework DSA yang diterbitkan oleh IMF untuk Market Access
Countries, sangat sesuai dengan karakteristik negara Indonesia.
Pendekatan framework yang berbasis risiko dan mengacu kepada benchmark
internasional memudahkan penerjemahan hasil analisis ke dalam langkah-langkah tindak
lanjut. Karena itu, analisis ini membutuhkan sejumlah besar rincian data untuk menilai
kesinambungan utang suatu negara.
Dalam framework debt sustainability analysis IMF, komponen analisis yang dilakukan
terdiri atas:
01. Basic Debt Sustanability Analysis, yang menggambarkan kondisi dan komposisi
utang dilihat dari sisi yang luas. Basic DSA melihat kondisi utang menggunakan
baseline scenario dan alternative scenario.
02. Realism of Baseline Assumptions, yang secara historis menilai track record proyeksi
variabel makro ekonomi kunci (meliputi pertumbuhan GDP riil, keseimbangan primer,
dan in�lasi) suatu negara secara relatif terhadap track record dari negara-negara lain.
03. Stress Tests, yang merupakan inti dari analisis kesinambungan utang, yaitu
memproyeksikan gross nominal public debt dan gross �inancing needs dalam berbagai
skenario terjadinya shock dalam kondisi makroekonomi.
04. Public DSA Risk Assessment, yang menyajikan heat map atas risiko-risiko
kesinambungan utang sebuah negara, debt fan chart, serta kerentanan pro�il utang
negara tersebut.
Data yang Diperlukan
Project ini bagi kami adalah sebuah project yang besar, terutama ditinjau dari data
yang dibutuhkan. Namun sebagai kementerian yang memegang peranan sebagai Bendahara
Umum Negara, Kementerian Keuangan telah memiliki sebagian besar dari data yang
diperlukan Namun demikian tantangan yang kami hadapi adalah menyebarnya data
tersebut di sejumlah unit Eselon I Kementerian Keuangan. Akan tetapi, dukungan dari
unit-unit terkait telah membantu kami dalam mewujudkan project ini.
Kami beruntung karena unit-unit eselon I pemilik data yang kami perlukan telah
mengalirkan data yang dimiliki ke Sistem Layanan Data Kementerian Keuangan (SLDK)
yang dikelola oleh Pusintek. Bagi kami SLDK adalah salah satu bentuk praktik terbaik (best
practice) yang dapat menjadi purwarupa (prototype) bagaimana antar instansi pemerintah
dapat saling bertukar data satu sama lain.
Berikut gambaran data yang kami pergunakan untuk pengembangan project Debt
Sustainability Analytics:
Debt Sustainability Analytics - 141

Internal Kementerian Keuangan OJK dan Bank Indonesia World Economic Outlook IMF
- Data kewajiban kontinjensi - Data aset perbankan - Data Pertumbuhan GDP Real
- Data Hasil Privatisasi Indonesia maupun potensial (dalam
- Histori Posisi Utang Pemerintah - Tingkat suku bunga riil current prices maupun
Pusat - Data tingkat kredit constant prices)
- Outlook pembiayaan utang sektor privat - Data Benchmark untuk
- Tabel Realisasi Belanja - Rasio Pinjaman emerging market atas tingkat
- Data transaksi penarikan Pinjaman, terhadap Deposit perubahan kredit sektor
Hibah dan SBN (Transaksi Perbankan privat (dalam satuan persen
Penerusan Pinjaman) terhadap GDP)
- Penerimaan negara dan hibah yang - Data Track Record Forecast
diterima pemerintah pusat Pertumbuhan GDP, In�lasi,
- Histori pembayaran pokok utang dan Keseimbangan Primer
(principal) dan debt service - Change in domestic arrears
- Aset lancar pemerintah and external arrears
- Debt relief
Analisis 1: Basic Debt Sustainability Analysis
Basic DSA menggambarkan kondisi dan komposisi utang dilihat dari sisi yang luas.
Basic DSA melihat kondisi utang menggunakan baseline scenario dan alternative scenario.
Basic DSA ini merupakan output dasar yang terdapat pada DSA dan terdapat pada negara
dengan tingkat pengawasan utang yang tinggi maupun pada negara dengan tingkat
pengawasan utang yang rendah. Analisis ini terdiri atas dua komponen, pertama adalah
analisis atas faktor-faktor yang berkontribusi terhadap perubahan nilai utang publik, dan
kedua adalah komposisi dari utang publik itu sendiri.
Berikut ini tampilan dari menu visualisasi data atas faktor yang berkontribusi
terhadap utang publik. Ada beberapa faktor yang dianalisis yakni de�isit primer,
pertumbuhan GDP riil, tingkat suku bunga riil, depresiasi nilai tukar, faktor lain, dan faktor
residual. Faktor residual perlu diminimalkan dari kontribusi atas penambahan tingkat
utang publik.
Gambar Contribution to Changes in Public Debt

Analisis Potensi Tercapainya
DebtTarget Penerimaan
Sustainability Pajak - 142
Analytics 24
Selanjutnya analisis atas komposisi dari utang publik pemerintah RI, yakni dari sisi
maturitas utang publik serta denominasi dari utang publik tersebut.
Gambar Composition of Public Debt
Dari gra�ik di atas dapat dilihat bahwa sebagian besar utang pemerintah didominasi
oleh utang jangka panjang, dan diproyeksikan untuk beberapa tahun ke depan,
komposisinya masih didominasi oleh utang jangka panjang. Tidak terlihat adanya risiko
peningkatan utang jangka pendek dalam waktu dekat.
Dari sisi denominasi utang pemerintah, sebagian besar utang pemerintah
merupakan utang dalam denominasi mata uang asing. Dan diproyeksikan untuk beberapa
tahun ke depan, komposisinya masih didominasi oleh utang dengan denominasi mata uang
asing tersebut. Hal ini akan berkaitan dengan analisis mengenai kerentanan pro�il utang
pemerintah RI.
Analisis 2: Realism of Baseline Assumptions

Sebuah baseline scenario yang realistis atas variabel-variabel makroekonomi
menjadi kunci bagi penilaian atas debt sustainability yang kredibel. Debt dynamics sangat
dipengaruhi oleh asumsi-asumsi variabel makroekonomi kunci yang meliputi
pertumbuhan GDP riil, keseimbangan primer, dan in�lasi (GDP De�lator).
Di dalam analisis ini, dilakukan penilaian atas track record dalam memproyeksikan
variabel makroekonomi kunci (meliputi pertumbuhan GDP riil, keseimbangan primer, dan
in�lasi) secara relatif terhadap track record dari negara-negara lain. Analisis juga
menyajikan 2 (dua) summary statistics yang meliputi median forecast error dan percentile
rank dari median forecast error tersebut dibandingkan negara lain yang termasuk Market
Access Country (MAC).

Gambar Forecast Track Record
Selain itu, dilakukan analisis untuk menilai proyeksi pertumbuhan di negara yang
diperkirakan telah memasuki boom-bust cycle. Trigger boom-bust cycle ditandai oleh salah
satu dari dua indikator, yakni credit benchmark breach dan output gap positif.
Gambar Boom Bust Analysis

Analytics 24
Indikator yang pertama adalah adanya credit benchmark breach, yang diindikasikan
dengan perubahan kumulatif selama 3 tahun dari tingkat kredit sektor privat (dalam satuan
persen terhadap GDP) dalam negeri jika dibandingkan dengan data benchmark dari negara
emerging market lainnya.
Indikator yang kedua yakni adanya output gap yang positif selama 3 tahun
berturut-turut. Output gap merupakan persentase selisih antara PDB riil dengan PDB
potensial (dalam harga konstan) terhadap PDB potensial. Artinya, selama 3 tahun
berturut-turut PDB riil negara melebihi PDB potensialnya.
Berdasarkan analisis tersebut dapat diketahui bahwa Indonesia mengalami credit
benchmark breach, yakni perubahan kumulatif tingkat kredit sektor privat sebesar 15,59
persen terhadap GDP. Jumlah ini melampaui benchmark 15% terhadap GDP. Di sisi lain,
Indonesia tidak memiliki output gap positif selama 3 tahun berturut-turut.
Analisis 3: Risk Assessment

Terakhir, disajikan rangkuman atas analisis kesinambungan utang publik yang telah
dilaksanakan pada bagian-bagian sebelumnya. Ada 3 informasi utama yang disajikan
meliputi heat map risk, debt fan chart, dan kerentanan pro�il utang pemerintah.
Gambar Heat Map Risiko
Pada menu pertama disajikan risiko-risiko berkaitan dengan debt sustainablity.

Risiko-risiko yang dilaporkan tersebut dapat diklasi�ikasikan sebagai tinggi (merah),
sedang (kuning), atau rendah (hijau). Heat Map tersebut bukan merupakan acuan untuk
menilai rating utang negara, melainkan menyajikan rangkuman atas hasil debt
sustainability analysis untuk menilai risiko kesinambungan utang pemerintah. Ada 3
klasi�ikasi risiko yang dipetakan yakni atas tingkat utang (debt level), kebutuhan pendanaan
bruto (gross �inancing needs) dan pro�il utang (debt pro�ile).

a. Debt Level
Merupakan sensiti�itas tingkat utang eksisting terhadap adanya shock pada
indikator makroekonomi yang meliputi pertumbuhan GDP, keseimbangan primer, tingkat
suku bunga riil, nilai tukar mata uang, dan kewajiban kontinjensi. Risiko dipandang rendah
jika benchmark beban utang, yaitu 70% dari GDP, tidak akan terlampaui dalam kondisi
shock tertentu yang menjadi baseline. Risiko sedang jika benchmark beban utang terlampaui
dalam kondisi shock tertentu, namun bukan kondisi yang menjadi baseline. Risiko tinggi,
jika benchmark beban utang terlampaui dalam kondisi baseline. Heat map juga dapat
diwarnai putih jika tidak relevan.
Dapat dilihat bahwa Indonesia memiliki risiko yang tinggi untuk tingkat utang
jika terjadi shock atas keseimbangan primer.
b. Gross �inancing needs

Merupakan sensiti�itas kebutuhan pembiayaan bruto terhadap adanya shock pada
indikator makroekonomi yang meliputi pertumbuhan GDP, keseimbangan primer, tingkat
suku bunga riil, nilai tukar mata uang, dan kewajiban kontinjensi. Risiko dipandang rendah
jika benchmark kebutuhan pembiayaan bruto, yaitu 15% dari GDP, tidak akan terlampaui
dalam kondisi shock tertentu yang menjadi baseline. Risiko sedang jika benchmark
kebutuhan pembiayaan bruto terlampaui dalam kondisi shock tertentu, namun bukan
kondisi yang menjadi baseline. Risiko tinggi, jika benchmark kebutuhan pembiayaan bruto
terlampaui dalam kondisi baseline. Heat map juga dapat diwarnai putih jika tidak relevan.
Dapat dilihat bahwa Indonesia memiliki risiko yang tinggi terhadap kebutuhan
pendanaan bruto jika terjadi shock atas nilai tukar.
c. Debt Pro�ile Risks
Merupakan risiko kesinambungan utang jika ditimbang berdasarkan pro�il

utangnya. Berikut kriteria kategorisasi risiko pro�il utang menurut benchmark IMF.
Low Moderate High Risk

Debt pro�ile Indicators
Risk Risk
EMBI global spreads atau Market Preception (bps) <200 200-600 >600
External �inancing requirements (% of GDP) <5 5-15 >15
Public debt in foreign currency (% of total debt) <20 20-60 >60
Change in the share of short-term debt (% of GDP) <0,5 0,5-1,0 >1,0
Public debt held by non-resident (% of total debt) <15 15-45 >45

Analytics 24
Secara umum dapat dilihat bahwa Indonesia berada pada risiko yang tinggi dari
sisi kebutuhan pendanaan eksternal, utang publik yang dipegang oleh non-residen,
serta utang publik dalam mata uang asing.
Selanjutnya adalah menu debt fan chart. Menu ini menyajikan informasi mengenai
kemungkinan perubahan rasio utang terhadap GDP (distribusi frekuensi) dalam jangka
menengah. Pada submenu ini disajikan fan chart yang dikonstruksikan dengan melihat
dampak (berdasarkan pada perhitungan atas rata-rata, varian, dan covarian) dari sejumlah
besar shock terhadap variabel-variabel makroekonomi yang relevan. Submenu ini didesain
secara interaktif sehingga pengguna bisa menyesuaikan shock individual mana saja yang
akan diterapkan dalam menghasilkan fan chart. Pengguna dapat menghilangkan pengaruh
shock tertentu untuk mengidenti�ikasi sumber dari uncertainty. Pengguna juga dapat
memilih untuk menghasilkan asymmetric fan chart dengan cara memberikan spesi�ikasi
berupa restriction terhadap besaran dari shock tertentu.
Gambar Evolution of Predictive Densities of Gross Nominal Public Debt
Berikutnya adalah kerentanan pro�il utang pemerintah yang menyajikan informasi

mengenai tingkat kerentanan pro�il utang Indonesia dengan membandingkannya dengan
benchmark penilaian risiko. Dari informasi tersebut, dapat ditarik kesimpulan apakah
kondisi pro�il utang Indonesia tengah berada pada tingkat lower early warning ataukah
upper early warning.

Gambar Debt Pro�ile Vulnerabilities
Dapat dilihat bahwa Indonesia berada pada posisi melampaui upper early warning
untuk external �inancing needs yang menurut benchmark IMF dibatasi pada 15%. Terdapat
juga 3 indikator yang menunjukkan posisi Indonesia melampaui lower early warning yaitu
bond spread, annual change in short-term public debt, serta public debt held by non-residents.
Penutup
Proyek ini mengacu pada Debt Sustainability Framework for Market Access Countries
yang diterbitkan oleh IMF pada tahun 2013. Namun pada Januari 2021, IMF menerbitkan
Policy Paper yang berisikan reviu atas Debt Sustainability Framework tersebut. Di dalamnya,
IMF mengusulkan framework DSA yang baru sebagai pengganti dari framework tahun 2013.
Berbeda dengan framework tahun 2013 yang berfokus pada proyeksi 5 tahun, di framework
terbaru yang diusulkan oleh IMF DSA atas Market-Access Country (MAC) berlandaskan pada
penilaian risiko di tiga horizon, yaitu jangka pendek, jangka menengah, dan jangka panjang.
Famework DSA terbaru tersebut akan berlaku secara efektif per tahun 2022.
Sehingga, pengacuan terhadap framework DSA 2013 menjadi batasan utama dalam proyek
ini. Pertimbangan penggunaan framework 2013 tersebut dilandasi bahwa framework DSA
terbaru masih bersifat usulan dalam policy paper IMF, dan belum terdapat petunjuk teknis
serta template pelaksanaan atas framework DSA tersebut.

Analytics 24
Nakula Pro : Analisis
Keuangan dan
Layanan Publik
Daerah yang “Pro”
Disusun oleh:
Sigit Wahyu Kartiko, Erdhany Dwi Cahyadi,
Catur Panggih Pamungkas
akula, tokoh protagonis pewayangan menjadi sangat ikonis sebab mempunyai
saudara kembar yang bernama Sadewa. Tokoh dari lima bersaudara yang kita
kenal sebagai Pandawa ini, dikenal memiliki watak yang jujur dan setia terhadap
negara Amarta dalam kisah mahabarata. Inspirasi nama proyek ini berasal dari arahan Pak
Agung, (saat ini menjabat sebagai Direktur ESI DJPK) yang menyampaikan bahwa
pemodelan tersebut terinspirasi dari aplikasi Sadewa di DJA sebagai tools analisis untuk
menyiapkan postur APBN, sementara Nakula (selaku saudara kembar Sadewa) nantinya
akan mendampingi dari sisi analisis APBD.
Bertolak dari hal tersebut kami mencoba “bersemedi” mencari apa kepanjangan
yang pas dari akronim Nakula tersebut. Lalu kami memutuskan bahwa kepanjangan Nakula
adalah Analisis Keuangan dan Layanan Publik Daerah Pro Growth, Pro Poor, dan Pro
Environment dengan menambahkan kata Pro menjadi “Nakula Pro”.
Nakula Pro: outcome ekonomi kebijakan publik Pemerintah Daerah

Gagasan beliau sebenarnya sangat jelas, bahwa data APBD yang dihimpun dari 542
daerah pada Sistem Informasi Keuangan Daerah (SIKD) seharusnya dapat meumuskan
suatu model ekonometrika sebagai salah satu alat skenario kebijakan �iskal nasional di
DJPK. Model tersebut menggambarkan dampak APBN berupa Transfer ke Daerah dan Dana
Desa (TKDD) terhadap perilaku APBD, yang ditransmisikan melalui output layanan publik
daerah sejauh mana menghasilkan outcome makro regional berupa pertumbuhan ekonomi
yang inklusif dan berkelanjutan. Studi-studi terkait tema TKDD, output layanan publik, dan
outcome ekonomi kami sebelumnya sudah pernah dilakukan oleh para analis di Kemenkeu
maupun akademisi. Namun demikian sependek pengetahuan kami, model ekonometriknya
masih bersifat parsial serta belum terlihat keterkaitannya dengan tema-tema
perekonomian inklusif dan berkesinambungan terhadap lingkungan hidup.
Hal itulah yang menjadi pemicu bagi tim kami untuk mengembangkan studi
sebelumnya ke arah data analitik tanpa menghilangkan esensi kerangka akademik.
Kebetulan, Kemenkeu sangat concern dengan pengembangan data analitik dan SLDK. Maka
ibarat pepatah "sambil menyelam minum air" dan atas seizin pak Direktur, kami
mengajukan Nakula Pro untuk diikutkan dalam kompetisi Hackathon SLDK. Meskipun
demikian, saat itu model Nakula Pro versi awal masih terdapat beberapa catatan yang perlu
diperbaiki.
Tantangan Kami
Berdasarkan pengalaman kami dalam membuat pemodelan ini, setidaknya terdapat
3 (tiga) tantangan utama, pertama pengembangan pemodelan persamaan simultan
ekonometrika yang BLUE (Best Linier Unbiased Estimator) yang dihimpun dari beberapa
persamaan ekonometrika yang saling terkait satu sama lain dalam suatu hubungan
causal-effect dengan karakteristik data daerah berupa data panel. Kami mengandalkan
kemampuan anggota tim yang berlatar belakang analis keuangan pusat dan daerah untuk
mengidenti�ikasi beberapa model yang relevan dari studi sebelumnya. Utilisasi machine
learning untuk melakukan training pemilihan variabel dependen dan independen, kami
percayakan pada anggota tim yang cukup berpengalaman memanfaatkan software R yaitu
library caret.
Nakula Pro -150
Kedua, pemodelan yang dilakukan harus dapat disajikan dalam bentuk visualisasi
agar memudahkan pimpinan dalam pengambilan kebijakan. Untuk mengatasi hal tersebut,
kami mempercayakan pada salah satu anggota tim yang memiliki latar belakang
pemorgraman basis data sekaligus desainer visualisasi dan UI. Pemanfaatan library
javascript echarts untuk gra�ik merupakan salah satu andalan untuk memberikan
experience atas aplikasi secara interaktif bagi pengguna. Tantangan terakhir adalah
framework/software statistik berbasis web yang lengkap, mudah, dan cepat untuk
menampilkan serta mensimulasikan analisis tersebut secara menarik dan interaktif.
Mengenai software R ini, salah seorang anggota tim kami memiliki cerita lama untuk
kembali melakukan ritual "napak tilas" pemanfaatan R sejak tahun 2010 yang waktu itu
masih versi 2. Paket software statistik free open source R ini dirasakan sangat lengkap dalam
membantu penyelesaian case ekonometrik seperti halnya software komersial seperti
STATA, EViews, dan SAS. Hampir bisa dikatakan bahwa R versi 4 terbaru bersifat fully
substituted atas software berbayar yang eksisting, karena perkembangannya didukung oleh
akademisi, komunitas developer, dan industri besar (Microsoft) sehingga lengkap dan andal
dalam hal pustaka-pustaka ekonometrika, visualisasi, dan platform dashboard berbasis web.
Misi penting Nakula Pro

Dengan menggabungkan berbagai potensi tersebut, Nakula Pro masuk sebagai 10
�inalis kompetisi hackathon SLDK Kemenkeu. Melalui Nakula Pro, kami menawarkan 2
(dua) misi penting dalam kompetisi yang bergengsi ini. Pertama, opensource tools untuk
evidence-and-academic based policy, yaitu pemanfaatan R kepada para analis data di
lingkungan Kemenkeu sebagai salah satu instrumen analitik kuantititatif yang powerful
tanpa meninggalkan tradisi akademik. Kedua, replicable. Artinya para analis bisa
melakukan replikasi untuk menguji model, sebab Nakula Pro memanfaatkan data yang
tersedia secara terbuka, umum, dan andal, baik melalui SLDK maupun publikasi web yang
bahkan data tersebut dapat diunduh dari platform web Nakula Pro.
Gambar Fitur Nakula Pro

Nakula Pro - 151
Walaupun tidak mampu lolos ke grand �inal, kami
bangga dengan delivery dua misi tersebut dan juga mampu
mempublikasi proof of concept secara terbuka dan tentu saja
soliditas tim kami yang memiliki kemampuan untuk saling
melengkapi satu sama lain. Kami meyakini bahwa prinsip,
value, spirit dalam membangun Nakula Pro ini ke depan akan
mampu meneguhkan Kemenkeu sebagai kementerian yang
terdepan dalam pengambilan kebijakan �iskal secara nasional
yang transparan, akuntabel, komprehensif, replicable, serta
berbasis sumber data dan metodologi (instrumen) yang
terbuka. Sejalan dengan karakter Nakula, yaitu jujur, setia, dan
taat terhadap negaranya Amarta. Amin…
Nakula Pro -152

22
Analisis Prediktif
Kualitas Penjaminan
Pelaku UMKM
dalam Rangka
Program PEN
Disusun oleh:
Mohammad Fuad Atmantha, Erick Harmawan, dan Kresia
Ramadanty
saha Mikro Kecil dan Menengah atau
yang lebih sering kita kenal sebagai
UMKM memiliki peranan penting dalam
pertumbuhan ekonomi negara. Sejarah
menceritakan bahwa UMKM lebih tangguh untuk
bertahan dalam situasi krisis ekonomi pada tahun
1998. Hal tersebut dikarenakan kecenderungan
modal yang digunakan tidak menggunakan
agunan dalam valuta asing. Beberapa penelitian
menyebutkan bahwa pembiayaan yang dimiliki
UMKM sebagai modal sebagian besar berasal dari
investasi pribadi. Jika terdapat pembiayaan yang
berasal dari luar dana pribadi, sudah dapat
dipastikan bahwa pembiayaan berasal dari bank
perkreditan rakyat atau bahkan rentenir. Di sisi
lain, peranan UMKM saat ini kembali berada pada
kondisi yang tidak menentu dengan adanya
pandemi. Dibutuhkan dukungan yang dapat
menjamin UMKM dapat terus berjalan dengan
adanya pembiayaan atau jaminan yang didukung
oleh Pemerintah.
Dalam rangka melaksanakan program
Pemulihan Ekonomi Nasional (PEN) akibat
pandemi COVID-19, Pemerintah menerbitkan PP
23 tahun 2020 tentang Pelaksanaan Program
Pemerintah berupa dukungan dalam bentuk
Penjaminan Pemerintah untuk UMKM. Model
penjaminan disediakan untuk pelaku UMKM yang
mengalami kesulitan dalam mendapatkan
pembiayaan dari perbankan pada masa pandemi.
Penjaminan PEN diperbolehkan untuk UMKM
yang pernah mendapatkan subsidi KUR. Namun,
jika dikemudian hari UMKM tersebut telah
menggunakan mekanisme PEN, tidak
diperkenankan untuk menggunakan mekanisme
KUR secara umum.
Skema penjaminan kredit modal kerja
UMKM melibatkan penugasan PT Jamkrindo dan
PT Askrindo sebagai penjamin. Pemerintah
memberikan dukungan melalui pembayaran IJP,
loss limit, dan PMN kepada PT Jamkrindo dan PT
Askrindo. Gambar di bawah ini menjelaskan
bagaimana proses bisnis penjaminan UMKM
tersebut beserta dukungan loss limit yang terjadi.
Analisis Prediktif Kualitas Penjaminan Pelaku UMKM - 154
Penjaminan kredit ditujukan untuk menurunkan risiko kredit bagi pelaku UMKM dan
Korporasi, sebagai dampak pandemi Covid-19 dan mendorong penyaluran kredit modal
kerja dari perbankan ke UMKM dimana tujuan akhirnya adalah melindungi,
mempertahankan, dan meningkatkan kemampuan ekonomi para Pelaku Usaha dari sektor
riil dan sektor keuangan dalam menjalankan usahanya.
Gambar Proses Bisnis Penjaminan UMKM dan Dukungan Loss Limit
Tim kami tertarik untuk melakukan analisis pada tema ini karena modalitas
penjaminan tersebut lahir di kala pandemi dan membutuhkan reviu dalam menentukan
apakah modalitas tersebut akan dilanjutkan atau menjawab pertanyaan mengenai dampak
penjaminan PEN terhadap UMKM dan pertumbuhan ekonomi. Inspirasinya adalah bahwa
kontribusi UMKM untuk PDB adalah porsi tertinggi, sehingga dukungan untuk UMKM
melalui penjaminan PEN diharapkan memberikan dampak langsung kepada
perekonomian. Selanjutnya karena penjaminan PEN merupakan modalitas baru pada
tahun 2020, maka diperlukan analisa yang memadai untuk memberikan masukan apakah
modalitas/dukungan kepada UMKM melalui penjaminan PEN dapat dilanjutkan, serta
bagaimana keterkaitan dengan dukungan UMKM lain yang sudah lebih dulu (contohnya
SIKP).
Berdasarkan proses bisnis yang telah digambarkan, terdapat beberapa risiko yang
harus dijaga oleh Pemerintah. Salah satu risiko tersebut adalah terkait kualitas dari
pinjaman yang diajukan serta risiko atas besarnya dana cadangan kewajiban yang harus
disiapkan Pemerintah pada APBN. Hal ini sangat penting untuk mengantisipasi
meningkatnya risiko klaim dari penjaminan pemerintah kepada pelaku UMKM. Untuk
menjaga risiko tersebut dapat ditangani dengan baik, maka perlu dikembangkan analisis
penjaminan tersebut berdasarkan data-data yang ada.
Pemanfaatan data dalam menjamin potensi risiko atas pembiayaan yang dilakukan
Pemerintah untuk mendukung UMKM memiliki beberapa tujuan. Secara umum,
Pemerintah membutuhkan sebuah early warning untuk melihat risiko peningkatan jumlah
klaim dari penjaminan pelaku UMKM yang mengalami gagal bayar. Di sisi lain, Pemerintah
juga berupaya untuk melihat proyeksi yang dibutuhkan terkait perencanaan keuangan
Pemerintah untuk menjaminkan UMKM.
Gambar Dashboard Analisis Secara General
Gambar Dashboard Analisis Berdasarkan Klaster Debitur
Untuk dapat merealisasikan proyek tersebut, dibutuhkan beberapa data dari sistem
informasi yang sudah ada, yaitu data penjaminan UMKM dan data SIKP. Kedua data tersebut
akan diintegrasikan untuk membentuk variabel-variabel yang dibutuhkan dalam
penyusunan analisis. Hasil analisis nantinya akan berupa dashboard yang tergambar pada
Gambar dashboard di atas. Selanjutnya hasil analisis yang telah dilakukan juga seharusnya
mampu diakses dengan cara yang lebih cepat, yaitu melalui mekanisme chat bot Whatsapp.
Melalui mekanisme pemodelan sederhana di atas, kami berharap bahwa

pengembangan proyek ini dapat memberikan beberapa dampak berikut:
01. Peningkatan kualitas pengelolaan risiko penjaminan UMKM secara lebih optimal;
02. Peningkatan kualitas penganggaran loss limit untuk penjaminan UMKM; serta
03. Peningkatan kualitas data analisis untuk penyusunan kebijakan strategis Pemerintah
tentang dukungan akses pembiayaan dan insentif �iskal lainnya bagi UMKM.

Gambar Chat Box Whatsapp
Namun demikian selama mengerjakan proyek ini kami juga mengalami beberapa
kendala dan tantangan. Salah satu yang paling menarik adalah bagaimana untuk tetap
optimis di tengah ketersediaan data yang minim dan menjalin sinergi dengan unit penjamin
UMKM (Askrindo) untuk mendapatkan data penjaminan pra-pandemi. Selain itu
faktor-faktor relaksasi OJK mengenai restrukturisasi pinjaman juga menjadi salah satu
minimnya default pada penjaminan PEN. Dalam menjalankan dan mengembangkan proyek
ini ke depannya, kami melihat bahwa integrasi kebijakan untuk mendukung UMKM perlu
dilakukan, sehingga unit-unit yang mengelola dukungan perlu melakukan evaluasi
bersama. Salah satu yang kami inisiasi adalah evaluasi dengan data SIKP, sehingga
perumusan kebijakan selanjutnya dapat dilakukan dengan lebih efektif.
Data Analytics adalah salah satu tools untuk penyelesaian masalah yang kompleks,
karena dapat mendapatkan pola-pola baru dari sekumpulan data. Namun hal terpenting
adalah bagaimana rumusan dan implementasi kebijakan setelah pola-pola ditemukan, serta
mendesain ukuran dalam menilai implementasi kebijakan. Jadi, Data Analytics perlu
diintegrasikan dengan pengetahuan proses bisnis. Selain itu, Data Analytics dapat menjadi
salah satu trigger untuk proses digitalisasi, karena kecukupan data menjadi salah satu
faktor model yang akurasinya tinggi dan efektif. Maka, Data Analytics dapat menjadi
forward looking (kebijakan yang akan dibuat) dan backward looking (kebutuhan data pada
proses digitalisasi), tergantung konteks yang akan dibangun dalam project Data Analytics.

Tidak sedikit kawan yang bercerita bahwa menganalisis data itu adalah hal yang sulit.
Namun faktanya menganalisis data dapat dilakukan dengan banyak pendekatan, bahkan
bisa dilakukan dengan memanfaatkan alat yang sering kita gunakan sehari-hari dalam
bekerja seperti spreadsheet. Menganalisis data juga tidak selalu sesuatu yang besar, namun
juga dapat dilakukan sebagai bagian dari proof of concept, analisis sebagai bahan diskusi
terbatas, hingga dimanfaatkan sebagai bagian dari sistem informasi yang ada untuk
membantu pengambilan keputusan pada proses bisnis. Buku FORMULA YANG
BIKIN DATAMU BUNYI akan membantumu untuk menemukan formula-formula
yang sesuai dengan kebutuhanmu dalam menganalisis data. Jika kamu sudah menemukan
formulamu, mari kita berbasah ria melakukan analisis data!


IG CTO: @transformasi_kemenkeu
Email CTO: transformasi@kemenkeu.go.id





Buku Hackathon+ 2021 - HD

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Buku Hackathon+ 2021 - HD

Diunggah oleh

Hak Cipta:

Format Tersedia



Central Transformation Ofﬁce

Pengarah: Yan Inderayana, Deny Agung Pribadi, dan Wawan Juswanto

Penerbit: Central Transformation Of�ice, Sekretariat Jenderal, Kementerian Keuangan,

Diterbitkan tahun 2022.

Perpustakaan Nasional : Katalog Dalam Terbitan

164 halaman; 17.6 x 25 cm

Buku ini hadir untuk menggugah, memotivasi, membuka

Analisis Historis dan Analisis Potensi

Analisis Klasifikasi Permasalahan Analisis

Analisis Prediktif untuk Analisis Realisasi

Analisis Tiket HAI DJPb:

Analisis Prediktif Kualitas

ompetisi Kemenkeu Data Hackathon 2021 adalah sebuah kompetisi yang

Dalam proses editing naskah-naskah para kompetitor di dalam Kemenkeu Data

Para penulis di dalam buku ini hanyalah sebagian kecil dari

Editor berharap, ke depannya

Formula yang Bikin Datamu Bumi -vii

Beberapa penelitian yang ada mende�inisikan pengelolaan kas negara yang

Sebagaimana perumpamaan yang sering digunakan untuk menggambarkan

The Interesting Facts

Pada awal penerapannya, seluruh satuan kerja diwajibkan menyampaikan Laporan

Wiliams (2010) menyatakan bahwa prakiraan kas pemerintah dapat disusun

The Best Model: GRU method

Disusun oleh: Muhammad Hadiyan Ridho,

Use Case Realisasi Anggaran versus RPD: Kreativitas Engineering - 06

Tujuan & Dampak

Statistik umum (General Statistic) Pemetaan negara potensial yang

Analisis Ekspor Komoditas Sumber Daya Alam Indonesia - 11

Penyelesaian proyek ini, diharapkan memberikan dampak:

Analisis Ekspor Komoditas Sumber Daya Alam Indonesia - 12

Visualisasi Dashboard Kegiatan Ekspor Sumber Daya Alam

Analisis Ekspor Komoditas Sumber Daya Alam Indonesia - 13

Machine Learning, Proyeksi Kekurangan Penerimaan Negara

Analisis Ekspor Komoditas Sumber Daya Alam Indonesia - 14

Terakhir, kami berharap gagasan-gagasan yang dituangkan, minimal dapat memicu

Analisis Ekspor Komoditas Sumber Daya Alam Indonesia - 15

Analisis Ekspor Komoditas Sumber Daya Alam Indonesia - 16

Erfan - Andy - Audra

Analisis Historis dan Prediktif Penarikan Pinjaman Luar Negeri - 18

Untuk mengatasi permasalahan tersebut, pemerintah memerlukan suatu acuan

Analisis Historis dan Prediktif Penarikan Pinjaman Luar Negeri - 19

1. Early warning system terhadap kemungkinan keterlambatan pelaksanaan kegiatan yang

Ketiga tujuan tersebut mendukung pengambilan keputusan terhadap

Dalam merumuskan solusi, sistem ini menggunakan pendekatan ekonometrik

Analisis Historis dan Prediktif Penarikan Pinjaman Luar Negeri - 20

Agar dapat mengkonstruksi benchmark, aspek perkembangan proyek dinotasikan

Pemahaman Data (EDA)

Dari data dengan karakteristik tersebut, dilakukan pengelompokkan kegiatan

2. Multi kontrak-non Fisik

Analisis Historis dan Prediktif Penarikan Pinjaman Luar Negeri - 21

Gra�ik di atas menunjukkan terdapat perbedaan antara ketiga kelompok kegiatan

Preprocessing (Cleansing dan Engineering)

Modelling dan Evaluasi

Analisis Historis dan Prediktif Penarikan Pinjaman Luar Negeri - 24

Selama mengerjakan proyek ini, selain mendapatkan

Analisis Historis dan Prediktif Penarikan Pinjaman Luar Negeri - 25

Reformasi Pajak melalui Self Assessment System

Dalam rangka meningkatkan reformasi di bidang perpajakan dan meningkatkan

Masyarakat atau Wajib Pajak diberikan kebebasan untuk menghitung,

Berdasarkan data pada www.oecd.org/southeast-asia/data/tax.ht, rasio pajak

Analisis Potensi Tercapainya Target Penerimaan Pajak - 27

Ekstensi�ikasi Variabel yang Perlu

C 1.429995* 10.27974* 9.905869* 9.288986*

US10Y 0.423806* -0.696306* -0.397070* -1.304881 *

VIX 0.107314* -0.450266* -0.067083* -0.804959*