PROSIDING
Penyunting:
Ati Rahadiati, Sri Lestari Munajati, Tia Rizka Nuzula Rachma, Intan Pujawati,
Hanik Nurdiana Sabita, Ayu Nur Safi’i, Florence Elfriede Sinthauli Silalahi,
Aninda Wisaksanti Rudiastuti, Prayudha Hartanto, Mochamad Irwan Hariyono,
Maslahatun Nashiha, Yustisi Ardhitasari Lumban Gaol
ISSN 2614-7211
ii
PROSIDING
SEMINAR NASIONAL GEOMATIKA VI
“INOVASI GEOSPASIAL DALAM PENGURANGAN
RISIKO BENCANA”
Reviewer:
Prof. Dr. Dewayany, M.AppSc.
Prof. Dr.Ing Fahmi Amhar
Dr. Ir. Wiwin Ambarwulan, MSc.
Dr. Ratna Sari Dewi, S.Pi, M.Sc.
Dr. Ir. Mulyanto Darmawan, M.Sc.
Ir. Sri Lestari Munajati, M.Agr.
Dadan Ramdani, ST., M.T.
Ir. Yatin Suwarno, M.Sc.
Ir. Irmadi Nahib, M.Si
Dr. Susilo, ST., M.T.
Drs. Turmudi, M.Si.
Drs. Jaka Suryanta, M.Sc.
Dr. Ati Rahadiati, S.Si., M.Sc
Dr. Yosef Prihanto, S.Si., M.Si.
Agung Syetiawan, ST., MT.
Mochamad Irwan Hariyono, ST.
Aninda Wisaksanti Rudiastuti, SPi., MSi.
Ira Mutiara Anjasmara, ST., MPhil., Ph.D.
Dr. Daryono, SSi., MSi.
Dr. Heri Andreas, ST., MT.
Dr. Irwan Gumilar, ST., MSi.
Cecep Pratama, SSi., MSi., D.Sc.
37 TRANSFORMASI NDWI DALAM MELIHAT BATASAN GARIS PANTAI DAN 365 - 374
PEMANFAATAN DSAS DALAM MENGHITUNG LAJU PERUBAHAN GARIS
PANTAI DARI TAHUN 2000-2020 (Studi Kasus di Kecamatan Muara
Batang Gadis, Kab. Mandailing Natal)
Febri Nur Wijayanto, Defi Afriyanti, Beben Graha Putra
42 ANALISIS PERUBAHAN LAHAN SAWAH DAN UMUR PADI PADA TAHUN 413 - 422
2020 DARI CITRA SATELIT RESOLUSI TINGGI DENGAN METODE
NORMALIZED DIFFERENCE VEGETATION INDEX (Studi Kasus: Kecamatan
Cariu, Kabupaten Bogor, Provinsi Jawa Barat)
Rina Muthia Harahap, Dessy Apriyanti, Dennyta Prayogo
xiv
Klasifikasi Penggunaan Lahan dengan Algoritma Random Forest pada Google Earth Engine…………………………………..(Sukristiyanti, et al.)
ABSTRAK
Peta penggunaan lahan merupakan parameter penting dalam banyak studi yang terkait dengan analisis
geospasial. Tujuan penelitian ini adalah untuk melakukan klasifikasi citra penginderaan jauh pada Google
Earth Engine (GEE) untuk memperoleh peta penggunaan lahan di Cekungan Bandung tahun 2018. Metode
yang digunakan adalah klasifikasi supervised pada citra dengan metode machine learning pada GEE, dengan
menggunakan algoritma random forest. Variabel independen yang digunakan adalah delapan band citra
Landsat 8 dan indeks vegetasi NDVI (normalized difference vegetation index). Sementara itu, sepuluh kelas
penggunaan lahan digunakan sebagai variabel dependen. Kesepuluh penggunaan lahan tersebut adalah (0)
industri, (1) hutan, (2) perkebunan, (3) permukiman, (4) lahan terbuka, (5) tubuh air, (6) tegalan, (7)
sawah, (8) kebun campuran dan (9) area tambang. Hasil dari penelitian ini adalah peta penggunaan lahan di
daerah studi yang dikelaskan ke dalam sepuluh kelas. Nilai akurasi secara keseluruhan (overall accuracy)
peta penggunaan lahan yang dihasilkan adalah 0,94. Penggunaan metode machine learning dalam
pemerolehan penggunaan lahan di GEE terbukti sangat efektif sehingga dapat digunakan untuk mendukung
studi-studi aplikatif lainnya.
Kata kunci: algoritma random forest, Google Earth Engine (GEE), machine learning, penggunaan lahan
ABSTRACT
A land-use map is an important parameter in many studies related to geospatial analysis. This study
aims to classify remote sensing images in Google Earth Engine (GEE) to obtain a 2018 Bandung Basin land-
use map. A method used in this study was supervised classification on the images using machine learning
method in GEE, i.e. random forest algorithm. The independent variables used were eight bands of Landsat 8
and a vegetation index, namely NDVI (normalized difference vegetation index). Meanwhile, ten land-use
classes were used as the dependent variable. Those land-use classes are (0) industry, (1) forest, (2)
plantation, (3) settlement, (4) vacant area, (5) water body, (6) dryland agriculture, (7) wetland agriculture,
(8) mixed plantation, and (9) mining area. The result of this study is a land-use map of Cekungan Bandung
in ten classes. Overall accuracy of the resulted land-use map was 0.94. The use of machine learning,
especially the random forest algorithm, to obtain land-use in GEE has proven to be so effective that it could
be used to support other applicable studies.
Keywords: Google Earth Engine (GEE), land-use, machine learning, random forest algorithm
PENDAHULUAN
Seiring dengan perkembangan teknologi informasi, penggunaan big data kebumian dengan
teknologi cloud computing terus mengalami peningkatan, begitu juga dengan metode machine
learning. Google Earth Engine (GEE) memberikan fasilitas cloud computing tak berbayar untuk
memperoleh dan mengolah data penginderaan jauh seperti yang diinginkan melalui penyusunan
naskah pemrograman (Ar-Rahiem & Fakhlevi, 2019).
385
Seminar Nasional Geomatika 2021: Inovasi Geospasial dalam Pengurangan Risiko Bencana
Machine learning merupakan salah satu cabang kecerdasan buatan (artificial intelligence)
yang meniru kerja otak manusia dalam memecahkan masalah untuk membuat keputusan (Piralilou
et al., 2019). Dalam analisis geospasial, machine learning mampu mengatasi keterbatasan GIS
(Geographic Information System) dalam melakukan analisis. Beberapa algoritma machine learning
sudah ada di dalam GEE, misalnya decision tree, support vector machine (svm), naïve Bayes, dan
random forest (Yusri et al., 2019). Machine learning pada GEE sudah banyak digunakan di banyak
studi geospasial antara lain estimasi temperatur permukaan (Ermida et al., 2020), identifikasi
pulau panas (Ar-Rahiem & Fakhlevi, 2019), kerentanan longsoran (Yusri et al., 2019), penutup/
penggunaan lahan (Farda, 2017; Sidhu et al., 2018) dan pemetaan perkebunan kelapa sawit
(Sarzynski et al., 2020).
Penggunaan lahan adalah bentuk usaha manusia untuk memodifikasi lingkungan menjadi
lingkungan baru yang lebih mapan, seperti permukiman, industri, jalan, lahan pertanian dan lahan
perkebuman. Proses modifikasi tersebut pada umumnya menyebabkan deforestasi, berkurangnya
biodiversitas, hingga meningkatkan bencana alam, sehingga sering kali masalah lingkungan
dikaitkan dengan perubahan penggunaan lahan (Farda, 2017).
Penggunaan lahan menjadi parameter penting sebagai input dalam banyak studi, antara lain
monitoring penggunaan lahan (Farda, 2017; Sidhu et al., 2018), analisis tata ruang (Sejati et al.,
2020), pemilihan lokasi tertentu, perubahan ekosistem (Hasan et al., 2020) dan manajemen
bencana (Nohani et al., 2019). Oleh karena itu, penelitian ini melakukan ekstraksi penggunaan
lahan menggunakan GEE, untuk mengetahui kemudahan dan akurasi pemerolehan data tersebut.
METODE
Lokasi
Wilayah studi yang dipilih adalah Cekungan Bandung (Gambar 1), yaitu bagian hulu dari DAS
(daerah aliran sungai) Citarum (Ningrum & Narulita, 2018). Cekungan Bandung merupakan suatu
cekungan besar yang berada di dataran tinggi dengan ketinggian sekitar 650-700 m di atas
permukaan laut, yang dikelilingi oleh pegunungan vulkanik. Wilayah tesebut memiliki luas sekitar
2.300 km2 dan dihuni oleh lebih dari tujuh juta orang (Abidin et al., 2013). Pada Cekungan
Bandung tersebut, terdapat area metropolitan Bandung yang merupakan area metropolitan
terbesar ketiga di Indonesia, suatu wilayah yang memiliki karakteristik urbanisasi yang masif
karena peningkatan pertumbuhan ekonomi (Fuadina et al., 2020).
386
Klasifikasi Penggunaan Lahan dengan Algoritma Random Forest pada Google Earth Engine…………………………………..(Sukristiyanti, et al.)
Metode
Gambar 2. Diagram alir pemrosesan data pada google earth engine (GEE)
387
Seminar Nasional Geomatika 2021: Inovasi Geospasial dalam Pengurangan Risiko Bencana
Penggunaan lahan di dalam studi ini dibedakan menjadi 10 kelas, sehingga diperlukan 10
kelas sampel penggunaan lahan. Sampel penggunaan yang digunakan untuk data training berbeda
(tidak overlap) dengan yang digunakan untuk data validasi (Gambar 3b). Sampel yang diambil
berupa poligon yang mewakili setiap kelas penggunaan lahan secara merata. Sejumlah 98 poligon
sampel penggunaan lahan digunakan sebagai data training dan 20 poligon sebagai data validasi.
Variabel independen yang digunakan adalah sembilan (9) band yang digabung ke dalam satu
image stack, terdiri atas delapan band Landsat 8 dan satu band turunan berupa indeks vegetasi
NDVI (Gambar 3c). Pada Citra Landsat 8, pemerolehan indeks vegetasi melibatkan band 5
sebagai band inframerah dan band 4 sebagai band merah. Formula untuk memperoleh nilai NDVI
pada Citra Landsat 8 adalah (band 5 – band 4) / (band 5 + band 4). Nilai indeks vegetasi memiliki
rentang -1 hingga 1, semakin besar nilai menunjukkan kerapatan vegetasi yang semakin tinggi.
Indeks NDVI di Cekungan Bandung dari hasil pemrosesan pada studi ini adalah 0,107-0,747.
Pada proses pembangunan model dengan metode machine learning, data yang diproses
adalah data training yang berisi lokasi dan kelas-kelas penggunaan lahan beserta karakteristik
setiap data point-nya. Karakteristik yang dimaksud adalah informasi yang ada di variabel prediktor
(image stack) yaitu nilai-nilai spektral dari delapan band pada Landsat 8 dan 1 band berupa NDVI.
Oleh karena itu, pada tahapan ini dilakukan estraksi nilai image stack pada semua data point.
Jumlah data point dalam data training ini adalah 769 yang diperoleh dari 98 poligon. Satu data
point adalah satu piksel yang berukuran 30 m x 30 m, mengikuti ukuran piksel Citra Landsat 8.
Klasifikasi untuk penggunaan lahan yang digunakan adalah klasifikasi supervised, yaitu
dengan penggunaan sampel kelas-kelas pengggunaan lahan (land-use). Random forest dipilih
dalam kajian ini karena algoritma tersebut merupakan metode machine learning supervised yang
powerful, yang sudah banyak digunakan dalam aplikasi penginderaan jauh dan GIS (Piralilou et
al., 2019). Algoritma random forest pada GEE saat ini menggunakan nama smileRandomForest.
Algoritma random forest terdiri atas banyak tree atau decision tree. Pada studi ini, jumlah tree
yang dipakai adalah 25. Jumlah tree dan parameter lain dalam algoritma random forest dapat
dimodifikasi (parameter tuning) untuk memperoleh akurasi yang lebih baik. Algoritma digunakan
untuk melatih data training, kemudian dipakai untuk menghasilkan peta penggunaan lahan,
dengan image stack sebagai data inputnya. Peta penggunaan lahan yang merupakan hasil
pemrosesan pada playground GEE ditunjukkan oleh Gambar 4.
Algoritma random forest sesuai dengan namanya bahwa forest merupakan gabungan dari
banyak tree (decision tree) dan random karena pengambilan sample (data point) dilakukan secara
random. Setiap tree menggunakan data point yang tidak sama, satu dengan yang lain, karena
penggunaan bootstrap sample. Di dalam bootstrap sample, jumlah data point (sample) yang
digunakan untuk setiap tree sama, namun ada sejumlah sample yang digunakan berulang. Oleh
karenanya, setiap tree yang terbentuk akan berbeda satu dengan yang lain. Penggunaan algoritma
random forest pada kajian ini dilakukan untuk tujuan klasifikasi, sehingga hasil klasifikasi akhir
(prediksi) setiap sample merupakan hasil voting dari kelas yang dihasilkan oleh semua tree yang
dibangun dalam model random forest tersebut.
388
Klasifikasi Penggunaan Lahan dengan Algoritma Random Forest pada Google Earth Engine…………………………………..(Sukristiyanti, et al.)
Pada metode machine learning dengan random forest ini, kontribusi setiap variabel
prediktornya dapat diketahui (Gambar 5). Dari sembilan variabel yang digunakan, nilai NDVI
memiliki nilai kontribusi paling rendah dalam melakukan klasifikasi penggunaan lahan. Sementara
itu variabel yang paling berpengaruh adalah nilai spektral dari band 7.
Validasi model digunakan untuk melihat apakah model yang dibangun akurat atau tidak.
Dengan menggunakan data validasi, proses validasi dilakukan untuk mengetahui seberapa persen
hasil klasifikasi sesuai dengan penggunaan lahan sebenarnya (data validasi). Pada penelitian ini,
jumlah sample untuk validasi adalah 606 yang berasal dari 20 poligon yang mewakili 10 kelas
penggunaan lahan. Akurasi keseluruhan (overal accuracy) dari model ini sangat bagus yaitu 0,94
(94%), sedangkan nilai presisi (precision) masih cukup rendah yaitu 0,72 (72%). Nilai sempurna
adalah 1 atau 100% yang menunjukkan semua prediksi benar (tidak ada kesalahan sama sekali).
KESIMPULAN
GEE sangat membantu pemerolehan data citra (Landsat 8) dengan kualitas bagus (seamless
dan tidak tertutup awan) dan proses klasifikasi penggunaan lahan, sehingga klasifikasi
penggunaan lahan dapat dilakukan dengan efektif dan efisien. Dengan machine learning,
penggabungan beberapa variabel prediktor dari berbagai sumber data dapat dilakukan dalam
bentuk image stack. Bagus tidaknya model tidak hanya dilihat dari nilai overall accuracy-nya saja,
namun juga nilai presisinya. Untuk memperoleh model dan peta penggunaan lahan yang lebih
389
Seminar Nasional Geomatika 2021: Inovasi Geospasial dalam Pengurangan Risiko Bencana
baik, maka perlu diperhatikan beberapa hal berikut: (1) diperlukan sampel data training yang lebih
banyak dan jumlah antar kelas proporsional, (2) diperlukan penambahan variabel prediktor lain,
seperti data DEM dan turunannya, atau bahkan data citra lainnya, dan (3) perlu dilakukan tuning
paramater untuk mengoptimalkan model.
DAFTAR PUSTAKA
Abidin, H.Z., Gumilar, I., Andreas, H., Murdohardono, D., & Fukuda, Y. (2013). On causes and impacts of
land subsidence in Bandung Basin, Indonesia. Environmental Earth Sciences , 68(6), 1545–1553. DOI:
https://doi.org/10.1007/s12665-012-1848-z.
Ar-Rahiem, M.M., & Fakhlevi, M.R. (2019). Analisis fenomena pulau panas perkotaan Kota Bandung
menggunakan Google Earth Engine. Prosiding Seminar Nasional Penginderaan Jauh ke-6 Tahun 2019,
July, 1–8. DOI: https://doi.org/10.31227/osf.io/bej3n.
Ermida, S.L., Soares, P., Mantas, V., Göttsche, F.M., & Trigo, I.F. (2020). Google earth engine open-source
code for land surface temperature estimation from the landsat series. Remote Sensing, 12(9), 1–21.
DOI: https://doi.org/10.3390/RS12091471.
Farda, N.M. (2017). Multi-temporal land use mapping of coastal wetlands area using machine learning in
Google Earth Engine. IOP Conference Series: Earth and Environmental Science (The 5th Geoinformation
Science Symposium 2017), 98(1), 1-12. DOI: https://doi.org/10.1088/ 1755-1315/98/1/012042.
Fuadina, L.N., Rustiadi, E., & Pravitasari, A.E. (2020). The dynamic of land use changes and regional
development in Bandung metropolitan area. IOP Conference Series: Earth and Environmental Science
(The 6th International Conference of Jabodetabek Study Forum) , 556(1), 1–8. DOI:
https://doi.org/10.1088/1755-1315/556/1/012002.
Hasan, S.S., Zhen, L., Miah, M.G., Ahamed, T., & Samie, A. (2020). Impact of land use change on ecosystem
services: A review. Environmental Development, 34(April), 100527. DOI:
https://doi.org/10.1016/j.envdev.2020.100527.
Ningrum, W., & Narulita, I. (2018). Deteksi perubahan suhu permukaan menggunakan data satelit landsat
multi-waktu studi kasus Cekungan Bandung. Jurnal Teknologi Lingkungan, 19(2), 145-154. DOI:
https://doi.org/10.29122/jtl.v19i2.2250.
Nohani, E., Moharrami, M., & Sharafi, S. (2019). Landslide susceptibility mapping using different GIS-based
bivariate models. Water MDPI, 11(1402), 1-22.
Piralilou, S.T., Shahabi, H., Jarihani, B., Ghorbanzadeh, O., Blaschke, T., Gholamnia, K., Meena, S. R., &
Aryal, J. (2019). Landslide detection using multi-scale image segmentation and different machine
learning models in the higher himalayas. Remote Sensing, 11(21). DOI:
https://doi.org/10.3390/rs11212575.
Sarzynski, T., Giam, X., Carrasco, L., & Huay Lee, J.S. (2020). Combining radar and optical imagery to map
oil palm plantations in Sumatra, Indonesia, using the Google Earth Engine. Remote Sensing,
12(7),1220, 1-17. DOI: https://doi.org/10.3390/rs12071220.
Sejati, A.W., Buchori, I., Rudiarto, I., Silver, C., & Sulistyo, K. (2020). Open-source web GIS framework in
monitoring urban land use planning: Participatory solutions for developing countries. Journal of Urban
and Regional Analysis, 12(1), 19-34. DOI: https://doi.org/10.37043/JURA.2020.12.1.2.
Sidhu, N., Pebesma, E., & Câmara, G. (2018). Using Google Earth Engine to detect land cover change:
Singapore as a use case. European Journal of Remote Sensing, 51(1), 486-500. DOI:
https://doi.org/10.1080/22797254.2018.1451782.
Yusri, S., Retnowati, E., Prastowo, M., Idris & Fakhrurrozi. (2019). Combining participatory mapping, cloud
computing and machine learning for mapping climate induced landslide susceptibility in Lembeh Island,
North Sulawesi. IOP Conference Series: Earth and Environmental Science (LoCARNet: The 7th Annual
Meeting-Challenges for Asia to Meet 1.5°C Target), 363(1), 0–6. DOI: https://doi.org/10.1088/1755-
1315/363/1/012020.
390