Anda di halaman 1dari 35

ARTIFICIAL INTELLIGENCE &

BIG DATA FOR PUBLIC SECTOR


Dr. Arie Wahyu Wijayanto
Politeknik Statitika STIS

17 November 2022
1
Source: https://www.pexels.com/id-id/
PROFIL
PROFILE Head of Center for Research and Community Service at Politeknik Statistika STIS
Badan Pusat Statistik (BPS)

ariewahyu.github.io
ariewahyu@stis.ac.id h-index: 6

2
PENTINGNYA
PENTINGNYA DATA MENDUKUNG
DATA DALAM DALAM MENDUKUNG PEMBANGUNAN
PEMBANGUNAN

PERENCANAAN PELAKSANAAN
PEMBANGUNAN PEMBANGUNAN

Sebagai dasar informasi Sebagai panduan dalam


dalam penyusunan rencana pelaksanaan pembangunan
kebijakan pembangunan yang sesuai dengan tujuan dan
sasaran yang telah ditetapkan

PENGENDALIAN Siklus Pembangunan EVALUASI


PEMBANGUNAN sesuai dengan Perpres No. 39/2019
PEMBANGUNAN
tentang Satu Data Indonesia
Sebagai panduan dalam Sebagai acuan dalam
penentuan batasan-batasan pengukuran efektivitas dan
untuk menjamin ketercapaian dampak dari pencapaian
pembangunan pembangunan

3
Sensus :
pengumpulan data yang dilakukan melalui pencacahan semua
unit populasi di seluruh wilayah Republik Indonesia untuk
memperoleh karakteristik suatu populasi pada saat tertentu

Survey :
METODE cara pengumpulan data dilakukan melalui pencacahan sampel
PENGUMPULAN untuk memperkirakan karakteristik suatu populasi pada saat
tertentu.
DATA
Kompilasi data administrasi :
cara pengumpulan, pengolahan, penyajian, dan analisis data didasarkan
pada catatan administrasi yang ada pada pemerintah dan atau
masyarakat.

Big Data

4
ARTIFICIAL INTELLIGENCE
Artificial intelligence (AI) includes many machine No human intervention needed
(automation)
learning models which focuses on the use of data and
algorithms to imitate the way that humans learn,
gradually improving its accuracy. Handling multi-dimensional
and multi-variety data

Easily identifies trends and


patterns

Continuous Improvement

Wide Applications

5
ABOUT BIG DATA
Big Data are data sources that can be – • Click Stream
• Active/Pasive Sensor
• Unstructured
generally – described as: “high volume, • Log • Semi Stuctured
velocity and variety of data that demand cost- • Event • Structured
• Printed Corpus
effective, innovative forms of processing for • Speech
• Social Media
enhanced insight and decision making” - • Traditional
UNStats Huge Huge
Volume Variety

Huge Huge
Velocity Veracity
•Speed of Generation
•Rate Analysis

• Untrusted
• Uncleansed

6
AI AND BIG DATA, HOW DO THEY RELATE?

Big Data Artificial Intelligence

Huge amount of data. Automation of everything

Batch, real-time, or stream Handling multidimensional and


processing. multi-variety data:
● Image processing
Obtained in various forms: ● Natural language processing
image, voice, ect. ● etc
Uncertainty due to data
Easily identifies trends and
inconsistency and
patterns
incompleteness.
Need the use of huge amount data
for better learning

7
AI & BIG DATA FOR OFFICIAL STATISTIC

MOBILE POSITIONING DATA WEB-CRAWLING


• Tourism Statistics
• Commuter Statistics
• Metropolitan Statistical Area (MSA)

SATELLITE IMAGERY

• Poverty Mapping
• Agricultural Statistics
• Economic Activity

FACEBOOK RELATIVE WEALTH INDEX

• Economic Activity
• Poverty Mapping

GOOGLE AND FACEBOOK MOBILITY


INDEX
• Community mobility

8
THE USE OF AI & BIG DATA IN OFFICIAL STATISTICS

Artificial Intelligence

Big Data

Source: Towards big data as official statistics, 2020

9
AI PADA BIG DATA GEOSPASIAL
Pengolahan big data geospasial dilakukan
pada citra satelit, drone, dll:

• Ekstraksi fitur jaringan transportasi,


distribusi perumahan/pemukiman,
sebaran vegetasi/tumbuhan, dan banyak
lagi lainnya

• AI dengan model-model Machine


Learning dan Deep Learning sering
digunakan untuk mengolah data ini

AI untuk Analisis Geospasial


pada Big Data Citra Satelit
CONTOH SUMBER BIG DATA GEOSPASIAL

Landsat-8 Sentinel-1 Sentinel-2

Dipilih sebagai sumber citra satelit


utama,
karena ketersediaan dan
kemudahan
11
Gratis Gratis Gratis
30m Resolution 10m Resolution 10m Resolution
Optical Radar Optical
EKSTRAKSI DATA
Ekstraksi nilai pita spektrum pada masing-
masing unit piksel pada citra.

Penggabungan beberapa pita spektrum


dapat dilakukan untuk memperoleh
indeks komposit
PENGGUNAAN AI UNTUK DETEKSI OBJEK

Arsitektur deep learning yang digunakan untuk mengenali fitur-fitur pada objek
(misalnya gambar, citra, dst) untuk diklasifikasikan ke label-label tertentu
PUBLIKASI ILMIAH

Tangkapan citra satelit akan


dibandingkan label yang
sesungguhnya di lapangan (ground
truth).

Kemudian dibangun model prediksi


dengan teknik AI machine
learning/deep learning.

Source:
https://www.azavea.com/blog/2017/05/3
0/deep-learning-on-aerial-imagery/
BIG PICTURE: SUSTAINABLE DEVELOPMENT GOALS

▪ Innovative analysis of new sources of information – or big data – have the


potential to play a significant role in complementing official statistics.

▪ Within the scope of the global agenda, it’s very relevant to understand how big
data could be used for contributing to indicators on the Sustainable
Development Goals.

▪ Combining new information sources and traditional ones can result in powerful
outcomes for achieving the 2030 agenda more efficiently and effectively, and
ensure that ‘no one is left behind’.

▪ This is the promise of a data revolution for sustainable development.

15
CASE STUDY EXAMPLES

16
PERTANIAN: Penghitungan Jumlah Pohon Perkebunan Kelapa Sawit

VHR

Model object-based deep learning pada citra satelit resolusi


sangat tinggi Perkebunan Kelapa Sawit Sei Rokan, Kab. Rokan
Hulu dengan Average Precision mencapai 94,75% dibanding
hitung manual.
Kabupaten Rokan Hulu, Riau
PERTANIAN: Penghitungan Jumlah Pohon Perkebunan Kelapa Sawit
Scopus Q1

Oil palm trees detection and counting on Microsoft Bing Maps Very High Resolution
(VHR) satellite imagery and Unmanned Aerial Vehicles (UAV) data using image
processing thresholding approach

Yoga CahyaPutra, Arie Wahyu Wijayanto, Galdita Aruba Chulafak


https://www.sciencedirect.com/science/article/abs/pii/S1574954122003284
PERKOTAAN: Penghitungan Kepadatan Pemukiman

Sumber Data Anotasi


Seleksi Citra Label Processing

Segmen

Segmen
Seleksi wilayah sesuai kategori
Seleksi segmen yang Label bangunan
memiliki bangunan

19
PERKOTAAN: Penghitungan Kepadatan Pemukiman

Wilayah terjarang Wilayah menengah Wilayah terpadat


Kelurahan terpadat kedua Urutan terpadat kuartil 2 Urutan terjarang kuartil 1 sebesar
sebesar 91.079,38 jiwa/km2 sebesar 18.748,75 jiwa/km2 10.115, 5 jiwa/km2

Pondok Pinang Kembangan Utara Kampung Rawa


Jakarta Selatan Jakarta Barat Jakarta Pusat

• Bangunan sangat kecil • Bangunan berukuran kecil • Bangunan berukuran besar


hingga sedang
• Jalan sempit • Jalan lebar
• Jalan cenderung lebar
PERKOTAAN: Penghitungan Kepadatan Pemukiman
Scopus Q2

Model Latihan
pretrained Ulang

Building Footprint Extraction and Counting on Very High-Resolution Satellite


Imagery using Object Detection Deep Learning Framework

Wahidya Nurkarim, Arie Wahyu Wijayanto


KEBENCANAAN: Indeks Kerentanan Tsunami

The 14th Aceh International Workshop and Expo on Sustainable Tsunami Disaster Recovery:
Tsunami Spatial Vulnerability Index in Aceh Province 2020 using Remote Sensing and Geospatial Big Data
M Rifqi Jundullah, Arie Wahyu Wijayanto
KEBENCANAAN: Deteksi Kebakaran Hutan

Mono-temporal and Multi-temporal Approaches for Burnt Area Detection Using Sentinel-2 Satellite Imagery
(A Case Study of Rokan Hilir Regency, Indonesia)
Natasya Afira, Arie Wahyu Wijayanto
KEBENCANAAN: Deteksi Kebakaran Hutan
Scopus Q1

Mono-temporal and Multi-temporal Approaches for Burnt Area Detection Using Sentinel-2 Satellite Imagery
(A Case Study of Rokan Hilir Regency, Indonesia)
Natasya Afira, Arie Wahyu Wijayanto
https://www.sciencedirect.com/science/article/abs/pii/S1574954122001273
KEBENCANAAN: Deteksi Kebakaran Hutan

Dengan menggunakan model machine learning dan deep learning, kita dapat mendeteksi lokasi-lokasi
kebakaran hutan secara akurat.
EKONOMI: Pemetaan Kemiskinan di Indonesia
✓ Tingkat pengentasan kemiskinan melambat, tetapi kemiskinannya rendah.
✓ Namun, setelah periode penurunan selama delapan tahun, tingkat penurunan telah melambat menjadi 9%
dalam beberapa tahun terakhir.
✓ Dan meningkat lagi setelah COVID-19 masuk ke Indonesia (tahun 2020 – 2022).
✓ Kesenjangan pendapatan semakin besar.
✓ Pertumbuhan ekonomi Indonesia mengalir secara tidak proporsional ke orang kaya.
✓ Penduduk hampir miskin merupakan kelompok yang signifikan di Indonesia.

26
EKONOMI: Pemetaan Kemiskinan di Indonesia
Satellite Imagery
Nighttime Light Intensity (NTL) NOAA- VIIRS Detecting the distribution of economic activity.

Vegetation Index (NDVI) Sentinel 2 Detecting the distribution of rural area based on vegetation distribution.

Built-Up Index (NDBI) Sentinel 2 Detecting the distribution of urban area based on building distribution.
Water Indeks (NDWI) Sentinel 2 Land cover detection.
Carbon Monoxide (CO)
Nitrogen Dioxide (NO2) Sentinel 5P Detecting the distribution of economic activity based on air pollution.
Sulfur Dioxide (SO2)
Land Surface Temperature (LST) MODIS-Terra Detecting the distribution of urban area based on surface temperature.

Geospatial Big Data

27
EKONOMI: Pemetaan Kemiskinan di Indonesia
Ekstraksi Fitur Variabel Pembangunan Model
Variabel Independen Model Skenario 1 Machine Learning
Tempat Wisata

10 Fitur Hasil Zonal Statistics yang Diagregasi


Decision Tree
Vektor
pada Level Administratif
Input Regression (DTR)
Skenario 1

Swalay an

NTL NDVI BUI … POI Distance


Raster / Kec 1 Random Forest
Points
Fasilitas Kesehatan

Input Regression (RFR)


Fasilitas Pendidikan

Kec 2
Citra Satelit
Point of Vektor
Multisumber Output
… Support Vector
Interest (POI)
(NTL, NDVI, BUI,
(POI Density,
Regression (SVR)
NDWI, LST, CO, Zonal Statistics
NO2, dan SO2)
POI DIstance) Variabel Independen Model Skenario 2
512 Fitur Hasil Ekstraksi yang Diagregasi pada Pemilihan
Level Administratif hyperparameter:
Citra Satelit Siang Hari (1,5 km Grid)
Red, Green, Blue Fitur 1 Fitur 2 … Fitur 512
grid search
Kec 1

Kec 2 Deep Learning


Skenario 2

… Multiple Layer
Perceptron
(MLP)
Variabel Convolutional Neural
Dependen Network-1D
(CNN-1D)
Transfer Learning Kemiskinan
ResNet-34 Level Pemilihan
Tiga Kelas Nilai Intensitas
Cahaya Malam Administratif hyperparameter:
random search
EKONOMI: Pemetaan Kemiskinan di Indonesia
EKONOMI: Pemetaan Kemiskinan di Indonesia
Scopus Q1

https://www.mdpi.com/2220-9964/11/5/275
Integrasi AI & Big Data dengan Survei

AI & Big Data Citra Satelit Pendataan melalui Survei

Sumber yang tidak berbayar, proses relatif cepat, dan tidak Pengumpulan datanya memerlukan sumber daya yang
memerlukan banyak tenaga besar baik dari segi biaya, waktu, dan tenaga

Periode waktu update 1 bulan (level grid 1,5 km) Periode waktu update relatif lebih lama

Data populasi sesuai dengan keadaan lapangan Data sampel dengan pengakuan responden

Kualitas data bergantung pada tutupan awan dan input


pengguna OSM Kualitas data tidak tergantung pada tutupan awan

Belum dapat dilakukan validasi yang benar-benar akurat Dihitung dengan metodologi yang disepakati dunia dan
sampai level grid 1.5 km dipublikasikan sebagai official statistics

Tidak dapat menggambarkan indikator secara spesifik Lebih representatif dalam menggambarkan indikator
berdasarkan rumah tangga atau individu secara spesifik berdasarkan rumah tangga atau individu
PUBLIKASI ILMIAH
AI & BIG DATA UNTUK OFFICIAL STATISTICS

PADI Machine Learning Applied to Sentinel-2 and Landsat-8 Multispectral and Medium-Resolution Satellite
Imagery for the Detection of Rice Production Areas in Nganjuk, East Java, Indonesia. 2021.
http://jurnal.lapan.go.id/index.php/ijreses/article/view/3538
PADI Classification of Rice-Plant Growth Phase using Supervised Random Forest Method based on Landsat-8
Multitemporal Data. 2020. http://jurnal.lapan.go.id/index.php/ijreses/article/view/3217

JAGUNG Maize Field Area Detection in East Java, Indonesia: An Integrated Multispectral Remote Sensing and
Machine Learning Approach. 2020. https://ieeexplore.ieee.org/document/9271683/

KELAPA Oil Palm Plantation Detection in Indonesia Using Sentinel-2 and Landsat-8 Optical Satellite Imagery (Case
SAWIT Study: Rokan Hulu Regency, Riau Province). 2021.
http://jurnal.lapan.go.id/index.php/ijreses/article/view/3537

BANGUNAN Tinjauan Pemanfaatan Big Data Penginderaan Jauh dan Pembelajaran Mesin untuk Official Statistics di
/KONSTRUKSI
Wilayah Perkotaan. 2020. https://jurnal.stis.ac.id/index.php/jurnalasks/article/view/282
PUBLIKASI ILMIAH
AI & BIG DATA UNTUK OFFICIAL STATISTICS

KEMISKINAN Developing Relative Spatial Poverty Index Using Integrated Remote Sensing and Geospatial Big Data
Approach: A Case Study of East Java, Indonesia. 2022. https://www.mdpi.com/2220-9964/11/5/275

Eco-environment vulnerability assessment using remote sensing approach in East Kalimantan, Indonesia.
LINGKUNGAN 2022. https://www.sciencedirect.com/science/article/abs/pii/S2352938522000994

Mono-temporal and multi-temporal approaches for burnt area detection using Sentinel-2 satellite imagery
LINGKUNGAN (a case study of Rokan Hilir Regency, Indonesia). 2022.
https://www.sciencedirect.com/science/article/abs/pii/S1574954122001273
POLITEKNIK STATISTIKA STIS
For Better Official Statistics

Thank You
DISCUSSION

35

Anda mungkin juga menyukai