Anda di halaman 1dari 21

FOTOGRAMETRI DIGITAL

Klasifikasi Decision Tree dan Random FOrest

Disusun Oleh:
Alfian Bimanjaya (6016211014)
Kelas:

Fotogrametri Digital - A

Dosen Pengampu:
Hepi Hapsari Handayani, ST.,M.Sc.,Ph.D

DEPARTEMEN TEKNIK GEOMATIKA

FAKULTAS TEKNIK SIPIL, PERENCANAAN, DAN KEBUMIAN

INSTITUT TEKNOLOGI SEPULUH NOPEMBER

SURABAYA

2021
DAFTAR PUSTAKA

DAFTAR PUSTAKA ............................................................................................................... 1


BAB II ....................................................................................................................................... 1
1.1 Latar Belakang ............................................................................................................ 1
1.2 Rumusan Masalah ....................................................................................................... 2
1.3 Tujuan Penelitian......................................................................................................... 2
1.4 Manfaat Penelitian....................................................................................................... 2
BAB II ....................................................................................................................................... 3
2.1. Penggunaan Lahan (Land Use) dan Tutupan Lahan (Land Cover) ............................ 3
2.2 Penginderaan Jauh ....................................................................................................... 3
2.3 Machine Learning ....................................................................................................... 4
2.3.1 Decision Tree ........................................................................................................... 4
2.3.2 Random Forest ......................................................................................................... 4
BAB III...................................................................................................................................... 6
BAB IV .................................................................................................................................... 18
5.1 Kesimpulan................................................................................................................ 18
DAFTAR PUSTAKA ............................................................................................................. 19

i
BAB II
PENDAHULUAN
1.1 Latar Belakang
Penginderaan jauh merupakan ilmu yang mengacu pada identifikasi fitur permukaan
bumi beserta sifat geo-biofisiknya. Data permukaan bumi yang terekam oleh sensor
penginderaan jauh terdiri dari panjang gelombang yang berbeda-beda, dan harus dilakukan
koreksi secara radiometrik serta geometrik sebelum data informasi spektral dapat diekstrak
(Havyas V.B, dkk., 2015). Penelitian menggunakan data citra satelit penginderaan jauh banyak
menaruh perhatian khusus dalam mengembangkan metode klasifikasi citra, hal ini dikarenakan
hasil klasifikasi citra digunakan sebagai dasar interpretasi, analisis serta pemodelan data spasial
yang akan membantu dalam menentukan beragam kebijakan lingkungan dan sosial ekonomi
(Jensen J.R, dkk., 1999).
Klasifikasi citra digunakan sebagai dasar interpretasi, analisis serta pemodelan data
spasial yang akan membantu dalam menentukan beragam kebijakan lingkungan dan sosial
ekonomi (Jensen J.R, dkk., 1999), Pemerintah dalam merencanakan tata ruang kota perlu untuk
mengetahui area kota mana saja yang telah digunakan beserta detail penggunaan lahan tersebut,
oleh karena itu dibuat peta tutupan lahan yang memiliki peran penting untuk mengidentifikasi
bagian tutupan lahan kota dan kegiatan utama (penggunaan lahan) yang terjadi disana (Natural
Resources Canada, 2015).
Metode klasifikasi yang telah lama ada merupakan Klasifikasi berdasarkan parameter
(Parametric Classification) seperti MLC (Maximum Likelihood Classification), metode ini
tidak bekerja dengan baik pada data yang memiliki resolusi spasial tinggi serta pada lingkungan
yang memiliki fitur objek yang kompleks (perkotaan, dan daerah padat bangunan) dikarenakan
pada Parametric Classification membutuhkan dataset yang terdistribusi secara normal.
Berbanding terbalik dengan Non-parametric Classifier yang bersifat independen terhadap sifat
distribusi data, sehingga dalam metode ini tidak dibutuhkan parameter statistik untuk dapat
memisahkan banyak kelas pada citra, sehingga metode ini sangat sesuai digunakan dalam
klasifikasi citra resolusi tinggi dengan fitur tutupan lahan yang kompleks, metode ini
merupakan hasil pendekatan Machine Learning Decision Trees, Random Forest, Neural
Networks dan Support Vector Machines (Havyas V.B, dkk., 2015).
Melalui tugas ini akan dilakukan perbandingan terhadap hasil klasfikasi Machine
Learning (Decision Tree dan Random Forest). Data yang digunakan merupakan Citra Satelit
Resolusi menegah. Pemilihan metode klasifikasi menggunakan pendekatan Machine Learning
Decision Tree dan Random Forest didasari oleh penelitian terdahulu yang dilakukan oleh
Havyas V.B (Havyas V.B, dkk., 2015). Melalui penelitiannya didapatkan kesimpulan bahwa
untuk memanfaatkan citra satelit resolusi tinggi dengan karakteristik fitur objek yang kompleks
(daerah urban) dalam klasifikasi tutupan lahan dibutuhkan metode non parametrik pendekatan
Machine Learning, hal ini dikarenakan metode ini bersifat independen terhadap sifat distribusi
data, sehingga tidak dibutuhkan parameter statistik untuk memisahkan banyak kelas pada citra
(Bharti S, dkk, 2019). Decision Tree dan Random Forest dipilih dengan tujuan mengevaluasi
performa klasifikasi yang dihasilkan, mengingat kedua metode memiliki kesamaan dalam
model induksi yang digunakan yakni tree based. Decision Tree terdiri dari satu pohon induk
pengambil keputusan sedangkan Random Forest terdiri dari gabungan banyak pohon

1
keputusan, sehingga analisis akan pengaruh model pohon keputusan terhadap hasil klasifikasi
menjadi alasan yang mendasari mengapa metode ini dipilih.
1.2 Rumusan Masalah
Rumusan masalah dalam penelitian tugas akhir ini adalah sebagai berikut:
a. Bagaimana cara melakukan klasifikasi tutupan lahan menggunakan pendekatan
Machine Learning (Random Forest dan Decision Tree)?
b. Bagaimana hasil klasifikasi tutupan lahan yang dihasilkan dari kedua metode
pendekatan Machine Learning (Random Forest dan Decision Tree) baik secara
kualitatif dan kuantitatif?
1.3 Tujuan Penelitian
Tujuan dalam tugas ini adalah sebagai berikut:
a. Melakukan klasifikasi tutupan lahan melalui pendekatan Machine Learning (Decision
Tree dan Random Forest).
a. Melakukan analisis perbandingan terhadap akurasi hasil klasifikasi tutupan lahan secara
kuantitatif (Melalui Nilai Koefisien Kappa, Overall Accuracy) serta secara kualitatif
(Melalui pengamatan citra secara visual berdasarkan kunci interpretasi)

1.4 Manfaat Penelitian


Manfaat yang diharapkan dari tugas ini adalah untuk mengetahui akurasi dari peta
tutupan lahan hasil klasifikasi Machine Learning (Decision Tree dan Random Forest).

2
BAB II
TINJAUAN PUSTAKA
2.1. Penggunaan Lahan (Land Use) dan Tutupan Lahan (Land Cover)
Penggunaan lahan (land use) dan tutupan lahan (land cover) pada hakekatnya berbeda
walaupun menggambarkan hal yang sama, yaitu keadaan fisik permukaan bumi. Tutupan lahan
merupakan perwujudan secara fisik objek-objek yang menutupi lahan tanpa mempersoalkan
kegiatan manusia terhadap ojek-objek tersebut, sedangkan penggunaan lahan berhubungan
dengan kegiatan manusia pada suatu bidang lahan. Penggunaan lahan untuk pemukiman
memiliki tutupan terdiri dari atap, permukaan yang diperkeras, rumput dan pepohonan
(Ardiansyah 2017). Menurut Undang-undang Nomor 4 Tahun 2011 Tentang Informasi
Geospasial, Tutupan lahan merupakan garis yang menggambarkan batas penampakan area
tutupan di atas permukaan bumi yang terdiri dari bentang alam dan/atau bentang buatan.
Sedangkan menurut SNI nomor 7645 tahun 2010, tutupan lahan dapat juga didefinisikan
sebagai tutupan biofisik pada permukaan bumi yang dapat diamati dan merupakan hasil
pengaturan, aktivitas, dan perlakuan manusia yang dilakukan pada jenis penutup lahan tertentu
untuk melakukan kegiatan produksi, perubahan, ataupun perawatan pada areal tersebut (Badan
Standardisasi Nasional 2010). Data tutupan lahan dapat dimanfaatkan untuk berbagai
kebutuhan antara lain:
a. Analisis dinamika perkembangan hutan (degradasi, deforestasi dan reforestasi).
b. Perhitungan cadangan dan emisi karbon.
c. Perencanaan dan pengembangan suatu daerah/ areal (tata ruang wilayah).
d. Pengawasan dan evaluasi terhadap kinerja pemegang izin usaha (konsesi) pada
kawasan hutan hutan (pemantauan areal penebangan, realisasi tanam dan
pembukaan tambang).
e. Pemantauan areal Kawasan Konservasi dan Kesatuan Pengelolaan Hutan dari
perambahan, pembalakan liar dan kebakaran lahan dan hutan.
2.2 Penginderaan Jauh
Penginderaan jauh merupakan gabungan dari dua kata dasar yaitu indera yang berarti
melihat dan jauh yang berarti dari jarak yang jauh. Sehingga berdasarkan etimologi,
penginderaan jauh adalah melihat objek dari jarak yang jauh. Penginderaan jauh didefinisikan
sebagai ilmu dan seni untuk memperoleh informasi tentang objek, daerah, atau gejala dengan
jalan menganalisis menggunakan kaidah ilmiah data yang diperoleh dengan menggunakan alat
tanpa kontak langsung terhadap objek, daerah atau gejala yang dikaji. Objek, daerah, atau yang
dikaji dalam definisi tersebut dapat berada di permukaan bumi, atmosfer, atau planet di luar
angkasa (Lillesan, dkk., 1990).
Sedangkan menurut Purwadhi (2001), penginderaan jauh adalah pengumpulan data
penginderaan jauh dapat dilakukan dalam berbagai bentuk sesuai dengan tenaga yang
digunakan. Sistem penginderaan jauh (inderaja) menurut Kusumowidagdo, dkk (2007) terdiri
atas berbagai komponen yang terintegrasi dalam satu kesatuan. Komponen-komponen tersebut
meliputi sumber tenaga, atmosfer, objek, sensor dengan wahana, pengolahan data,
interpretasi/analisis dan pengguna (user).

3
2.3 Machine Learning
Machine Learning, menurut definisinya, adalah bidang komputer sains yang
berkembang dengan cara mempelajari pola data dalam kecerdasan buatan. Machine Learning
merupakan algoritma yang dapat membuat prediksi pada set data yang diberikan. Prosedur ini
beroperasi melalui konstruksi model input data untuk membuat prediksi (Annina S. dkk, 2015).

Gambar 2. 1. Gambaran umum cara kerja Machine Learning (Sumber : Bharti S., 2019)
2.3.1 Decision Tree
Decision Tree merupakan salah satu induksi algoritma Machine Learning, algoritma
ini membentuk sebuah pohon klasifikasi untuk melakukan pemisahan kelas pada data. Pohon
klasifikasi dibuat dengan mempartisi ruang fitur secara rekursif berdasarkan pada training
sample data. Pada setiap percabangan, sebuah pengambilan keputusan secara otomatis
diterapkan, dimana pengambilan keputusan yang diterapkan melibatkan kombinasi lebih dari
satu input data atribut atau fitur (Quinlan J.R., 1993). Berikut beberapa kelebihan yang dimiliki
oleh metode Decision Tree: (Havyas V.B, 2015).
a. Decision Tree tidak terikat dengan parameter (non- parametric), metode ini tidak
dibatasai pada sifat distribusi data.
b. Dapat dengan cepat melakukan komputasi (training) data
c. Mampu melakukan pengolahan data dengan dimensi yang besar.
d. Memiliki algoritma yang sederhana dan dapat mengolah data yang hilang sebagian
(data yang bias)
e. Decision Tree dapat diaplikasikan pada berbagai macam situasi seperti melakukan
seleksi data penting pada suatu dataset yang besar dan menentukan peran data
tersebut apakah penting atau tidak (auto selection)
2.3.2 Random Forest
Random Forest membentuk sekelompok metode yang terdiri dari gabungan (atau
forest) dari beberapa Trees yang tumbuh melalui varian acak dari algoritma induksi tree-based
(Gilles L., 2014). Masing- masing tree bergantung pada nilai piksel pada tiap vektor yang
diambil secara acak dan independen (Breiman L., 2001).

4
Gambar 2. 2. Diagram Pohon Keputusan Random Forest (Sumber: Katmoko A.S, dkk, 2014)
Diagram diatas manampilkan alur kerja dari algoritma Random Forest. Secara garis besar cara
kerja algoritma Random Forest adalah sebagai berikut: (Katmoko A.S. dkk, 2014).
a. Dalam pembentukan tree, algortima Random Forest akan melakukan training terhadap
sampel data. Pengambilan sampel dilakukan dengan cara sampling with replacement.
b. Sebanyak sepertiga dari sampel akan digunakan untuk menentukan data Out of Bag
(OOB). Penentuan data out of bag dilakukan untuk mengistamasi error dan
menentukan variabel importance.
c. Variabel yang akan digunakan untuk menentukan pemisahan (split) terbaik ditentukan
secara acak. Setelah seluruh tree terbentuk, maka proses klasifikasi akan berjalan.
d. Penentuan kelas dilakukan dengan cara voting dari masing-masing tree, kelas dengan
jumlah vote terbanyak akan menjadi pemenangnya.
Berikut merupakan kelebihan dari algoritma Random Forest: (Breiman L., 2001)
a. Berjalan efisien untuk database yang besar
b. Dapat mengolah ribuan variabel inpt tanpa harus menghapus variabel lainnya
c. Dapat memberikan perkiraan variabel yang dianggap penting dalam klasifikasi
d. Menghasilkan hasil perkiraan yang tidak bias dalam hasil foresting (pengelompokan)
e. Mempu menjaga akurasi pengolahan data meskipun terdapat data yang hilang
f. Mampu mendistribusikan dan menyeimbagkan nilai bias pada kelas dengan dataset
yang memiliki populasi yang tidak seimbang.
g. Memungkinkan dilakukannya deteksi interaksi antar variabel.

5
BAB III
HASIL DAN PEMBAHASAN
1. Memanggil package yang dibutuhkan

2. Memanggil data raster


a. Mengatur direktori kerja

b. Melakukan stacking citra menjadi satu data raster dan menampilkan informasinya

Berikut tampilan informasi dari data citra

c. Melakukan plot data untuk tiap kanal dan data raster yang telah dilakukan stacking

Berikut tampilan plot citra untuk tiap kanal

Berikut tampilan plot citra yang telah distacking untuk kanal cahaya tampak (RGB)

6
3. Memanggil data training point
a. Memanggil data training point dan menampilkan informasi datanya

Berikut tampilan informasi dari data training point

b. Melakukan plot data training point

Berikut tampilan plot untuk training data yang akan dibuat untuk klasifikasi citra

7
4. Membuat Profil Spektral dari Landsat

Berikut tampilan plot profil spectral dari citra Landsat

5. Membuat dataframe training point dengan label berisi semua nilai reflektan
a. Membuat dataframe training point

b. Menghilangkan data NAs yang tidak memiliki nilai

8
6. Menyiapkan training data dan test data

7. Memeriksa statistik ringkasan (set training data dan test data)

8. Visualisasi densitas data training berdasarkan nilai kelas pada masing-masing band

Berikut plot estimasi densitas data training untuk setiap atribut berdasarkan nilai kelas
menggunakan fungsi featurePlot (). Plot densitas meringkas distribusi data.

9
9. Persiapan parameter model

10. Training model KNN


Pelatihan model KNN

Menampilkan akurasi pelatihan berdasarkan perbedaan nilai kernel

Berikut adalah akurasi dan grafik akurasi dari beberapa nilai kernel

Semakin besar nilai kernel semakin turun tingkat akurasi dan kappa yang dihasilkan,
Selanjutnya jalankan script berikut untuk menggunakan nilai kernel paling optimal (fit)
sebagai input model

Nilai kernel terbaik adalah 1 karena menghasilkan kesalahan klasifikasi yang paling minimal

10
11. Training model ANN
Pelatihan model KNN sebanyak 100 iterasi

Menampilkan akurasi pelatihan

Berikut adalah akurasi dan grafik akurasi pelatihan

Selanjutnya jalankan script berikut untuk menggunakan nilai parameter paling optimal dan
memplot jaringan model ANN

Berikut adalah tampilan jaringan model ANN paling optimal yang digunakan untuk
training

11
Membuat plot pengaruh variabel pada tiap band terhadap pelatihan model ANN

Terlihat bahwa band 6 memiliki pengaruh paling besar


12. Training model Decision Tree
Pelatihan model Decision Tree

Menampilkan akurasi pelatihan berdasarkan complexity parameter

12
Selanjutnya jalankan script berikut untuk menggunakan nilai parameter paling optimal dan
memplot jaringan model DT

Berikut adalah tampilan jaringan model DT paling optimal yang digunakan untuk
training

Membuat plot pengaruh variabel pada tiap band terhadap pelatihan model DT

13
Terlihat bahwa band 5 memiliki pengaruh paling besar
13. Training model Random Forest
Pelatihan model Random Forest

Menampilkan akurasi pelatihan berdasarkan randomly selected predictor

Selanjutnya jalankan script berikut untuk menggunakan nilai parameter paling optimal dan
memplot jaringan model RF

Berikut adalah tampilan jaringan model RF paling optimal yang digunakan untuk training

14
Membuat plot pengaruh variabel pada tiap band terhadap pelatihan model RF

Terlihat bahwa band 5 memiliki pengaruh paling besar


14. Perbandingan Klasifikasi Machine Learning

Berikut adalah perbandingan akurasi dari dan kappa dari tiap metode ML

15
Dari semua proses ini bisa disimpulkan bahwa Random Forest merupakan algoritma
klasifikasi ML terbaik dibandingkan yang lainnya.
15. Proses klasifikasi LU/LC menggunakan model Machine Learning
Berikut script untuk klasifikasi LU/LC menggunakan model ML

16. Visualisasi LU/LC hasil klasfikasi menggunakan model Machine Learning


Berikut script untuk visualisasi klasifikasi LU/LC menggunakan model ML

Berikut adalah tampilan dari LU/LC hasil klasifikasi menggunakan model ML

16
17
BAB IV
KESIMPULAN
5 Kesimpulan
Dari penelitian yang telah dilakukan, didapatkan beberapa hal yang dapat disimpulkan
sebagai berikut:
1. Telah dilakukan klasifikasi tutupan lahan menggunakan algoritma Decision Tree dan
Random Forest.
2. Telah dilakukan analisis uji kuantitatif hasil klasifikasi pada metode Decision tree
menghasilkan nilai akurasi sebesar 0,3159 (Kappa Keofisien), 0,5434 (Overall
Accuracy). Sedangkan, pada hasil klasifikasi metode Random Forest menghasilkan
akurasi sebesar 0,6585 (Kappa Koefisien), 0,7645 (Overall Accuracy).

18
DAFTAR PUSTAKA
Annina S, Mahima SD, S. Venkatesan, D.R. Ramesh B. 2015. An Overview of Machine Learning
and its Applications, International Journal of Electrical Sciences & Engineering (IJESE).

Ardiansyah, T. 2017. Proyeksi Perubahan Tutupan Lahan Daerah Aliran Sungai Bonehau Tahun
2031, Makassar:Universitas Hasanuddin.
Badan Standardisasi Nasional. 2010. Klasifikasi Penutup Lahan.
SNI 7645:2010.
Bharti S. 2019. An Explanation of Machine Learning, InternationalJournal of Computer Science and
Mobile Computing (IJSMC).
Breiman L. 2001. Random Forest. Handbook of Statistics Department University of California
Gilles L. 2014. Understanding Random Forests from Theory to Practice. University of Liege PhD
Disertation
Havyas V.B, Choodarathnakara A.L, Thribhuvan R, Chethan K.S.2015. Decision Tree Approach
for Classification of Satellite Imagery. International Journal of Soft Computing and
Engineering (IJSCE), ISSN: 2231-2307, Volume-5 Issue-2.
Jensen J.R, Cowen D.J. 1999. Remote sensing of urban/ suburban infrastructure and socio-
economic attributes; Photogram.Eng. Remote Sens. 65 611–622.
Katmoko A.S., Mulia I.R., Novie I., M. Natsir. 2014. Klasifikasi Hutan- Non Hutan data Alos Palsar
Menggunakan Metode Random Forest. Seminar Nasional Penginderaan Jauh, LAPAN.

Lillesan, T.M., dan Kiefer, R.W. 1990. Penginderaan Jauh danInterpretasi Citra Alih Bahasa R.
Dubahri. Yogyakarta: Gadjah Mada University.
Natural Resouces Canada. 2015. Land use mapping. Diakses pada 15 Januari 2020, dari
https://www.nrcan.gc.ca/
Purwadhi, F.S.H. 2001. Interpretasi Citra Digital. PT Grasindo, Jakarta
Quinlan J.R. 1993. C4.5: Programs for Machine Learning, MorganKaufmann, Los Altos.

19

Anda mungkin juga menyukai