1 PB
1 PB
I. PENDAHULUAN
Ekonomi Eksklusif (ZEE) 2,7 juta km2 dan wilayah laut Convolutional Neural Network (CNN) merupakan salah
teritorial 3,1 juta km2. Luas wilayah perairan Indonesia satu metode deep learning yang terus mengalami
tersebut telah diakui sebagai Wawasan Nusantara oleh United perkembangan. Penelitian sebelumnya mengenai penerapan
Nation Convention of the Law of the Sea (UNCLOS) pada CNN pada citra telah dilakukan oleh Alex Krihevsky pada
tahun 1982 [1]. Bentangan garis pantai Indonesia dengan tahun 2012 yang terbukti berhasil mengungguli metode
panjang 81.000 km2, menjadikan laut Indonesia dan wilayah machine learning lainnya yaitu Support Vector Machine
pesisir Indonesia memiliki kandungan kekayaan dan sumber (SVM) [3]. Algoritma You Only Look Once (YOLO) adalah
daya alam hayati laut yang sangat berlimpah, seperti ikan, sebuah algoritma yang dikembangkan untuk mendeteksi
terumbu karang, mutiara, mangrove, dan sebagainya. Namun, sebuah objek secara realtime dengan akurasi yang cukup
kondisi ini memicu maraknya kasus pencurian ikan atau baik. Sistem pendeteksian yang dilakukan adalah dengan
dengan kata lain adanya tindak kejahatan yang terjadi di menggunakan repurpose classifier atau localizer untuk
perairan Indonesia yaitu illegal fishing [2]. Selain itu, melakukan deteksi. Sebuah model diterapkan pada sebuah
kawasan laut Indonesia juga masih rawan terhadap peristiwa citra di beberapa lokasi dan skala. Daerah dengan citra yang
seperti illegal mining, illegal logging, drugs trafficking dan diberi score paling tinggi akan dianggap sebagai sebuah
people smuggling. Presiden Jokowi telah menetapkan visi pendeteksian [4]. Sumber data yang digunakan pada
kemaritiman yaitu menjadikan negara Indonesia sebagai penelitian ini adalah data remote sensing pada citra satelit
Poros Maritim Dunia. Mengingat suatu negara dapat berukuran 768×768 pixel sebagai data penelitian yang
dikatakan sebagai Poros Maritim Dunia apabila salah satunya diunduh dari Website OneAtlas Sandbox “Ships Detection
adalah dapat menjaga sumber daya laut dan kedaulatan Machine Learning Dataset”. Penelitian sebelumnya dengan
negaranya. Pengelolaan wilayah perairan Indonesia, terutama sumber data yang sama, digunakan data berjumlah 10.000
di daerah perairan yaitu perbatasan yang dikelola dengan citra yang diambil secara random, digunakan 2 kategori yaitu
baik, sehingga dapat digunakan untuk kesejahteraan kapal dan non kapal dengan menggunakan beberapa metode
masyarakat Indonesia. Berdasarkan situasi yang terjadi, maka machine learning (Naive Bayes, Linear Discriminant
diperlukan suatu sistem baru yang dapat menutupi kelemahan Analysis, K-Nearest Neighbors, Random Forest, Support
ini yang dapat dilakukan dengan deteksi kapal menggunakan Vector Machine) dan deep learning (Convolutional Neural
citra digital atau citra satelit. Networks), pada metode machine learning diperoleh hasil
JURNAL SAINS DAN SENI ITS Vol. 10 No. 1 (2021), 2337-3520 (2301-928X Print) D26
Tabel 1.
Variabel Penelitian
Variabel Keterangan
X1,i,j Nilai Red setiap pixel
X2,i,j Nilai Green setiap pixel
X3,i,j Nilai Blue setiap pixel
Yj Matriks Ground Truth BoundingBox
Tabel 2.
Tipe Kapal
Kelas Tipe Kapal
0 Boat
1 Cargo
2 Container
3 Tanker
4 Barge
5 Kapal
Gambar 3. Output K-means Hyperparameter Anchor Box.
sebagai fungsi f(a, b) dengan a dan b merupakan koordinat
pada sebuah bidang datar yang merepresentasikan kumpulan
pixel dalam dua dimensi [5].
B. Image Labelling
Image Labelling atau pelabelan gambar atau anotasi
gambar adalah proses mengidentifikasi atau mengenali unit
yang berbeda dalam suatu gambar [5]. Bounding box adalah
jenis anotasi pelabelan data yang paling umum digunakan
dalam computer vision berupa kotak persegi panjang yang
digunakan untuk menentukan lokasi objek target. Bounding
box biasanya diwakili oleh dua koordinat (𝑥1 , 𝑦1 ) dan
(𝑥2 , 𝑦2 ) atau dengan satu koordinat (𝑥1 , 𝑦1 ) dan lebar (w) dan
tinggi (h) dari kotak pembatas.
C. Convolutional Neural Network (CNN)
Gambar 4. Jumlah Objek setiap Kelas. CNN didesain untuk mengenali pola visual dari suatu
terbaik dengan metode Random Forest yang memiliki hasil gambar secara langsung dengan proses minimal. CNN pada
akurasi sebesar 93%, sedangkan untuk metode deep learning dasarnya adalah neural network dengan banyak layer.
dengan menggunakan Convolutional Neural Networks D. Transfer Learning
diperoleh akurasi sebesar 94%.
Transfer learning adalah proses menyalin pengetahuan
Pada penelitian ini penulis menggunakan metode YOLOv3
dari jaringan yang sudah ada ke jaringan yang baru untuk
sebagai metode untuk ekstraksi fitur pada citra. Penulis
menyelesaikan masalah serupa [6]. Teknik ini dimplemen-
mengajukan penggunaan deep learning dengan arsitektur
tasikan untuk mempercepat proses training dan
YOLOv3 dalam mendeteksi posisi suatu kapal pada citra
meningkatkan performa model [7].
satelit sehingga dapat dilakukan pendeteksian kapal secara
realtime. Tujuan yang ingin dicapai dalam penelitian ini E. You Only Look Once (YOLO)
adalah memperoleh model asitektur terbaik YOLOv3 dalam YOLO adalah sebuah pendekatan untuk sistem pen-
melakukan deteksi kapal dan tipe kapal serta mendapatkan deteksian objek, yang ditargetkan untuk pemrosesan secara
performa pendeteksian keberadaan kapal pada citra satelit realtime dan membingkai pendeteksian objek sebagai
dengan teknik deep learning terutama dengan arsitektur masalah regresi tunggal, dimana dari pixel gambar langsung
YOLOv3, dengan memperoleh nilai loss dan nilai mAP dari ke kotak pembatas (bounding box) spasial yang terpisah dan
data training serta hanya nilai mAP dari data testing pada probabilitas kelas yang terkait [4].
deteksi kapal. Diharapkan cara ini mampu menutupi Berdasarkan Gambar 1 YOLOv3 memiliki performa yang
kelemahan dari sistem VMS yang telah ada dan dapat cukup baik dibandingkan dengan metode deteksi objek
membantu petugas Angkatan Laut untuk meningkatkan lainnya dengan waktu pembelajaran yang tercepat.
keamanan di perbatasan perairan Indonesia tanpa harus selalu
1) Arsitektur YOLOv3
melakukan pengawasan wilayah perbatasan tersebut.
YOLOv3 menggunakan arsitektur dari Darknet 53 yang
artinya memiliki 53 convlutional layers. YOLOv3 memiliki
II. TINJAUAN PUSTAKA 53 lapisan konvolusional yang disebut Darknet 53 yang
A. Citra Digital terdiri dari struktur convolutional dan residual [4].
Citra digital adalah data digital pada komputer yang 2) Anchor Box
merepresentasikan sebuah citra. Sebuah citra yang diwakili Anchor box adalah satu set kotak pembatas yang telah
oleh f(a, b) berbentuk matriks yang terdiri dari A baris dan B ditentukan dengan tinggi dan lebar tertentu yang
kolom, dimana perpotongan antara kolom dan baris inilah didefinisikan untuk menangkap skala dan rasio aspek kelas
yang disebut pixel. Citra digital juga dapat digambarkan
JURNAL SAINS DAN SENI ITS Vol. 10 No. 1 (2021), 2337-3520 (2301-928X Print) D27
Tabel 3.
Hyperparameter Setiap Model
Model Hyperparameter Nilai
Image Size 416 x 416
Batch Size 64
Kedua model convolutional network Subdivisions 16
Training Step 12000
Learning Rate 0,001
Model1 Anchors (10x13); (16x30); (33,23); (30,61); (62,45); (59,119); (116,90); (156,198); (373,326)
Model2 Anchors (11x20); (24x38); (31x50); (42x65); (53x82); (60,85); (88x108); (100x163); (141x168)
objek yang ingin dilakukan deteksi dan biasanya dipilih 6) Batch Normalizationj
berdasarkan ukuran objek dalam kumpulan data pelatihan.
Batch Normalization adalah teknik untuk melatih deep
Dalam deteksi objek perlu dilakukan k-means clustering agar
neural networks dengan melakukan standardizes input layer
dapat disesuaikan anchor box yang digunakan pada model
untuk setiap minibatch. Batch normalization digunakan
dengan ground truth bounding box pada dataset sehingga
untuk mempercepat pelatihan jaringan dengan mengurangi
memiliki hasil prediksi yang baik.
internal covariate shift. Dimana internal covariate shift
3) Intersection over Union (IoU) mengacu pada adanya perubahan distribusi input pada
I ntersection over union menghitung luas area yang ber- learning system. Batch Normalization berguna untuk
potongan lalu membaginya dengan luas area gabungan antar meningkatkan kecepatan, performasi dan kestabilan pada
2 bounding box. Nilai IoU digunakan untuk menentukan jaringan [8]. Berikut persamaan untuk batch normalization.
kese- suaian bounding box yang diprediksi dengan luas objek (𝑘)2 1 (𝑘)
yang sesungguhnya pada citra (ground truth). IoU dapat 𝜇𝐵 = ∑𝑚
𝑖=1 𝑥𝑖 (4)
𝑚
dihitung dengan persamaan sebagai berikut.
(𝑘)2 1 (𝑘) (𝑘) 2
𝐴𝑟𝑒𝑎 𝐼𝑟𝑖𝑠𝑎𝑛 𝜎𝐵 = ∑𝑚
𝑖=1(𝑥𝑖 − 𝜇𝐵 ) (5)
𝐼𝑜𝑈 = (1) 𝑚
𝐴𝑟𝑒𝑎 𝐺𝑎𝑏𝑢𝑛𝑔𝑎𝑛
(𝑘) (𝑘)2
4) Non Max Supression (𝑘) 𝑥𝑖 −𝜇𝐵
𝑥𝑖 = 2
(6)
Non Max Suppression berhubungan dengan algoritma √𝜎 (𝑘) +𝜀
𝐵
objek deteksi untuk memfilter bounding box. Non Max Sup-
pression membuat seleksi berdasarkan IoU dengan mengu- 𝑦𝑖
(𝑘)
= 𝛾 (𝑘) 𝑥𝑖
(𝑘)
+ 𝛽 (𝑘) = 𝐵𝑁𝛾(𝑘),𝛽(𝑘) ( 𝑥𝑖 )
(𝑘)
(7)
rangi bounding box yang muncul secara berlebihan. Seleksi
dilakukan hingga tersisa satu saja bounding box dan memiliki Keterangan:
nilai confidence tertinggi. (𝑘)
𝑥𝑖 : input ke-i
5) Fungsi Aktivasi 𝜇𝐵 : mean mini batch
Fungsi aktivasi merupakan fungsi yang digunakan pada 𝜎𝐵2 : varians mini batch
jaringan saraf untuk mengaktifkan atau tidak mengaktifkan 𝜀 : numerical stability (konstanta bernilai 1e-5)
neuron. Hasil perhitungan antara input, weight dan bias akan (𝑘)
𝑥𝑖 : normalize xi
dihitung lagi dengan persamaan dari fungsi aktivasi untuk (𝑘)
𝑦𝑖 : output batch normalization
mendapatkan output dari setiap layer. Pada penelitian ini,
Dimana 𝑘 ∈ [1, 𝑑] dan 𝑖 ∈ [1, 𝑚]
penulis menggunakan fungsi aktivasi ReLU pada convolu-
Berikut merupakan diferensial untuk meminimumkan nilai
tional layer dan fungsi aktivasi softmax pada output layer
loss.
untuk mendapatkan hasil yang merupakan data kategoris. 𝜕𝑙
Fungsi ReLU akan merubah nilai pixel pada input namun 𝜕𝑦𝑖
(𝑘)
Tabel 6.
Precision dan Recall Training Model 1 dan Model 2
Model 1 Model 2
Kelas
Precision (%) Recall (%) Precision (%) Recall (%)
Boat 84,51 85,33 84,25 85,71
Cargo 91,28 100,00 86,83 100,00
Container 96,15 100,00 100,00 100,00
Tanker 88,83 98,76 93,53 98,76
Barge 90,28 98,48 89,19 100,00
Kapal 94,12 97,51 92,64 97,17
Mean 90,86 96,68 91,07 96,94
𝑝int 𝑒𝑟𝑝 = max 𝑝(𝑟̃ ) (18) [𝑐1 𝑏𝑥1 𝑏𝑦1 𝑏𝑤1 𝑏ℎ1 ] , 𝑗𝑖𝑘𝑎 𝑎 = 1
𝑟:𝑟̃ ≥𝑟̃𝑛
[𝑐𝑐1 𝑏𝑥1 𝑏𝑦1 𝑏𝑤1 𝑏ℎ1
𝑏𝑥 𝑏𝑦 𝑏𝑤 𝑏ℎ
] , 𝑗𝑖𝑘𝑎 𝑎 = 2
Perhitungan AP dengan menggunakan metode all-point 2 2 2 2 2
Tabel 7. Tabel 9.
Nilai Rata-Rata Loss dan mAP Training Hasil Deteksi dengan Ground Truth setiap Kelas
Model Avg Loss mAP (%) Ground Truth Model 1 Model 2
Model 1 0,2388 94,85 Boat
Model 2 0,1978 95,06
Tabel 8.
Nilai Average Precission Training Setiap Kelas
Average Precission/AP (%)
Kelas
Model 1 Model 2 Barge
Boat 80,96 79,60
Cargo 99,94 98,06
Container 98,67 100,00
Tanker 98,69 98,11
Barge 95,02 98,39
Kapal 95,82 96,21
Kapal
setiap trainstep dan mAP untuk setiap model.
4) Memperoleh nilai evaluasi performa untuk kedua model
pada data training dan testing sebagai berikut.
Memperoleh confusion matrix untuk mengetahui nilai
precision dan recall untuk kedua model. Menghitung nilai
mAP pada data untuk kedua model, dengan terlebih dahulu Cargo
mengubah format data dari output yolo txt menjadi partisi
beberapa file txt. Mendapatkan grafik mAP dibandingkan
dengan threshold. Mendapatkan grafik precision recall
curve. Menghitung model terbaik berdasarkan nilai evaluasi
performa pada setiap model.
Container
IV. HASIL DAN PEMBAHASAN
A. Karakteristik Deskripsi Data Hasil Preprocessing
Preprocessing data dalam penelitian ini adalah me-
nyeleksi data citra yang hanya terdapat objek kapal kemudian
melakukan anotasi atau pelabelan gambar sebagai data Tanker
ground truth bounding box. Anotasi dilakukan untuk
menandai dengan menggunakan bounding box pada objek
kapal yang terdapat pada citra satelit, sehingga diperoleh data
yang terdiri dari tipe kapal beserta lokasi dan spesifikasi
bounding box pada citra sebagai berikut. Pada Tabel 2 dapat
diketahui 6 kelas tipe kapal yaitu sebagai berikut.
data training sehingga diperoleh model custom sesuai data
Anotasi atau pelabelan tipe kapal dilakukan dengan
yang digunakan. YOLOv3 memprediksi 3 skala klasifikasi
melihat karakteristik kapal secara visual, setiap tipe kapal
dan lokalisasi tipe kapal yang berbeda, jadi jika kita
memiliki ciri yang berbeda dari warna, bentuk, dan
melakukan input gambar berukuran 416 x 416, akan
karakteristik lainnya. Dataset yang digunakan dalam
menghasilkan 3 output yaitu 13 x 13 x 33, 26 x 26 x 33, dan
penelitian ini yaitu terdiri dari 1465 gambar, 6 kategori kapal,
52 x 52 x 33. Klasifikasi dan lokalisasi tipe kapal dengan 3
dan 2687 kapal dalam dataset citra satelit. Dilakukan
skala yang dilakukan oleh arsitektur YOLOv3 memiliki
pembagian 2 kelompok data citra satelit hasil dari seleksi data
tujuan agar dapat dilakukan pada berbagai ukuran objek, baik
dan preprocessing yaitu data training dan testing. Dari
objek berukuran besar, sedang, dan kecil dengan lebih baik.
seluruh data kapal pada citra satelit dilakukan pembagian data
Pada setiap skala pada YOLOv3, setiap sel grid memprediksi
sebanyak 80% data yaitu 1172 citra satelit sebagai data
3 bounding box menggunakan 3 anchors, sehingga membuat
training dan sebanyak 20% data yaitu 293 citra satelit sebagai
jumlah total anchors yang digunakan sebanyak 9 anchors.
data testing. Data training digunakan untuk menangkap pola-
Pada proses training digunakan dua model jaringan konvo-
pola yang dimiliki oleh citra satelit sehingga diperoleh model
lusional yang dipertimbangkan, yaitu YOLOv3 dengan 9
terbaik dengan hasil perhitungan nilai mAP dan loss. Data
anchors default serta YOLOv3 dengan 9 anchors yang
testing dipergunakan untuk melakukan evaluasi dengan
dilakukan proses k-means, keduanya dilakukan pelatihan
menggunakan data yang baru dengan mendapatkan nilai
transfer learning pada jaringan arsitektur Darknet-53, Tabel
mAP.
3 menunjukkan hyperparameter yang digunakan untuk dua
B. Klasifikasi dan Lokalisasi Tipe Kapal YOLO-CNN model dalam penelitian.
Metode klasifikasi dan lokalisasi tipe kapal yang Pada penelitian ini dilakukan training dengan
digunakan adalah metode You Only Look Once (YOLO). membandingkan beberapa hyperparameter yang digunakan
Pada proses pelatihan dilakukan transfer learning arsitektur karena perbedaan nilai hyperparameter mempengaruhi
YOLOv3 yang disebut juga Darknet-53, yang dilakukan pada kecepatan dan kualitas proses pembelajaran yang dapat
JURNAL SAINS DAN SENI ITS Vol. 10 No. 1 (2021), 2337-3520 (2301-928X Print) D31
Tabel 10. training pada Model 1 dan Model 2 yang disajikan untuk
Nilai Average Precission Training Setiap Kelas mengetahui hasil kinerja klasifikasi.
Average Precission/AP (%) Berdasarkan hasil confusion matrix Model 1 pada Tabel 6,
Kelas
Model 1 Model 2
kelas BO (Boat) memiliki True Positive sebanyak 442, False
Boat 12,01 23,66
Cargo 68,25 70,58 Negative sebanyak 76, False Positive sebanyak 81; kelas CA
Container 66,83 70,52 (Cargo) memiliki True Positive sebanyak 75, False Negative
Tanker 60,10 79,43 sebanyak 0, False Positive sebanyak 17; kelas CO
Barge 10,00 22,00
Kapal 34,11 36,27 (Container) memiliki True Positive sebanyak 75, False
mAP (%) 41,88 50,41 Negative sebanyak 0, False Positive sebanyak 3; kelas TA
(Tanker) memiliki True Positive sebanyak 159, False
berpengaruh pada pembentukan model sehingga diperoleh Negative sebanyak 2, False Positive sebanyak 20; kelas BA
model yang terbaik. Pada proses training digunakan batch (Barge) memiliki True Positive sebanyak 65, False Negative
size sebesar 64 dan jumlah maksimal train step 12000. Batch sebanyak 1, False Positive sebanyak 65; kelas KA (Kapal)
size dengan nilai 64 menyebabkan terambilnya 64 gambar memiliki True Positive sebanyak 1136, False Negative
sebagai sampel dan update weight dan bias dalam 1 train step. sebanyak 29, False Positive sebanyak 71.
Subdivisions atau minibatch dengan nilai 16 artinya dalam 1 Pada Tabel 5, diperoleh hasil confusion matrix pada Model
subdivisions/minibatch diambil 4 citra. Train step/iterasi 2, kelas Boat memiliki True Positive sebanyak 444, False
yang terdiri dari update weight dan bias berdasarkan batch Negative sebanyak 74, False Positive sebanyak 83; kelas
size dan pengecekan rata-rata loss dan akurasi untuk data Cargo memiliki True Positive sebanyak 178, False Negative
training. Total banyak pelatihan citra yang dilakukan untuk sebanyak 0, False Positive sebanyak 27; kelas Container
memperoleh satu model adalah sebanyak total 768000 citra. memiliki True Positive sebanyak 75, False Negative
Perbedaan kedua model terletak pada hyperparameter sebanyak 0, False Positive sebanyak 0; kelas Tanker
anchors dengan jumlah anchors yang sama-sama berjumlah memiliki True Positive sebanyak 159, False Negative
9, namun memiliki nilai lebar dan tinggi anchors yang sebanyak 2, False Positive sebanyak 11; kelas Barge
berbeda. Pada Model 1 nilai anchors merupakan nilai memiliki True Positive sebanyak 66, False Negative
anchors default yang diperoleh dari pelatihan YOLOv3 yang sebanyak 0, False Positive sebanyak 8; kelas Kapal memiliki
berjumlah 9 dengan ukuran lebar dan tinggi (10x13); True Positive sebanyak 1132, False Negative sebanyak 33,
(16x30); (33,23); (30,61); (62,45); (59,119); (116,90); False Positive sebanyak 90. Dari hasil confusion matrix,
(156,198); dan (373,326). Pada Model 2 nilai anchors dapat dihitung precision dan recall pada masing-masing
diperoleh dari perhitungan meng-gunakan metode k-means kelas sebagai berikut.
dengan k=9 seperti halnya default pada YOLOv3 dengan Pada Tabel 6, diperoleh hasil perhitungan precision dan
hasil sebagai berikut. recall untuk masing-masing kelas pada Model 1 dan Model
Dalam Gambar 2 diperoleh plot pada koordinat x yang 2. Precission merupakan rasio prediksi benar positif
merupakan nilai lebar (bw) untuk sejumlah ground truth dibandingkan dengan keseluruhan hasil yang diprediksi
boundingbox, sedangkan pada koordinat y merupakan nilai positif. Mean precision Model 2 lebih tinggi dibandingkan
tinggi (bh) untuk setiap ground truth boundingbox. Selanjut- dengan Model 1, artinya secara rata-rata Model 2 lebih baik
nya dilakukan k-means dengan k=9 sehingga diperoleh 9 dalam melakukan prediksi tipe kapal dengan lebih akurat.
centroid sebagai pusat cluster. Diperoleh nilai 9 anchor box Recall merupakan rasio prediksi benar positif dibandingkan
sebagai output dari k-means hyperparameter anchor box dengan keseluruhan data yang benar positif. Mean recall
seperti yang ditunjukkan pada Gambar 3. Model 2 lebih tinggi dibandingkan dengan Model 1, artinya
Pada Gambar 3 diperoleh hasil dari k-means anchor box secara rata-rata Model 2 lebih baik dalam mengklasifikasikan
berjumlah 9 anchor box baru yang digunakan sebagai jenis kapal yang sesuai dengan ground truth.
hyperparameter anchors pada Model 2. Tujuan dari Hasil kinerja klasifikasi yang didapatkan pada metode
klusterisasi ini yaitu dapat disesuaikan anchor box yang YOLOv3 dengan menggunakan Loss dan mAP disajikan
digunakan dengan ground truth boundingbox pada dataset pada Tabel 7.
yang digunakan sehingga memiliki hasil yang baik. Sehingga Tabel 7 menunjukkan kinerja klasifikasi yang didapatkan
dalam penelitian untuk mengetahui performa kebaikan dari setiap model. Kinerja klasifikasi terbaik terdapat pada
pelatihan digunakan model dengan variasi hyperparameter model 2 dengan model yang dilakukan training
anchors yaitu default anchor box pada YOLOv3 pada coco menggunakan anchors sebanyak 9 anchors yang melalui
dataset pada Model 1 dibandingkan dengan model yang proses k-means. Hasil ini mendapatkan rata-rata loss model 2
dilakukan k-means anchor box pada Model 2. pada data training lebih kecil daripada model 1 yaitu senilai
Nilai evaluasi pertama pada penelitian ini adalah confusion 0,1978, artinya nilai bias prediksi terhadap lokalisasi
matrix, yang digunakan untuk mengetahui hasil kebaikan bounding box, confidence score serta klasifikasi secara
klasifikasi pada kedua model, selanjutnya dapat dihitung nilai keseluruhan pada model 2 yaitu sebesar 0,1978. Nilai mAP
precision dan recall pada masing-masing kelas setiap model. pada model 2 pada data training lebih tinggi dibandingkan
Nilai evaluasi kedua yaitu mAP yang merupakan nilai model 1 yaitu senilai 95,06%, nilai tersebut memiliki arti
evaluasi yang paling populer pada deteksi objek, nilai mAP bahwa rata-rata ketepatan prediksi kapal pada setiap kelas
dapat digunakan untuk membandingkan kebaikan model yaitu sebesar 95,06%. Penggunaan anchors dengan
dengan model lainnya pada tugas deteksi objek. Tabel 4 dan menggunakan metode k-means mengindikasikan adanya
Tabel 5 merupakan output confusion matrix untuk data penambahan kinerja klasifikasi.
JURNAL SAINS DAN SENI ITS Vol. 10 No. 1 (2021), 2337-3520 (2301-928X Print) D32
Selanjutnya ditampilkan kinerja kedua model pada setiap pada setiap kelas memiliki nilai yang lebih tinggi jika di-
kelas. Tabel 8 merupakan hasil kinerja untuk setiap kelas bandingkan dengan model 1, sehingga diperoleh nilai mAP
dengan metode YOLOv3. Model 1 dapat melakukan prediksi pada model 2 juga lebih tinggi jika dibandingkan dengan
tipe kapal yang lebih tinggi untuk tipe kapal “Boat” dan model 1, yaitu masing-masing sebesar 50,41% dan 41,88%.
“Cargo”, sedangkan model 2 dapat melakukan prediksi tipe Oleh karena itu, model 2 model yang menunjukkan kinerja
kapal yang lebih tinggi untuk tipe kapal “Container”, terbaik dari kedua model.
“Tanker”, “Barge”, dan “Kapal”. Pada Tabel 5 didapatkan
bahwa model terbaik yaitu model 2. Sehingga berdasarkan
V. KESIMPULAN
beberapa nilai evaluasi performa yang diperoleh dapat
disimpulkan bahwa model terbaik dengan metode YOLOv3 Berdasarkan analisis dan pembahasan yang telah
adalah Model 2 dengan menggunakan hyperparameter dilakukan, kesimpulan yang dapat ditarik adalah metode yang
anchors sebanyak 9 yang dilakukan k-means clustering. memiliki kinerja klasifikasi yang terbaik untuk melakukan
deteksi tipe kapal pada citra satelit merupakan model 2
C. Deteksi Tipe Kapal dengan model yang dilakukan training menggunakan
Deteksi tipe kapal untuk kedua model dengan hyperpara- anchors sebanyak 9 anchors dengan melalui proses k-means.
meter yang didapat digunakan sebagai acuan untuk Hasil ini mendapatkan rata-rata loss pada model 2 lebih kecil
melakukan deteksi citra satelit dengan objek kapal pada data daripada model 1 yaitu senilai 0,1978, serta nilai mAP pada
testing. Berikut ditampilkan ground truth bounding box untuk model 2 pada data training lebih tinggi dibandingkan model
setiap kelas pada data testing. 1 yaitu masing-masing senilai 95,06% dan 94,85%. Hasil
Berdasarkan Gambar 4 kelas “Kapal” memiliki jumlah deteksi tipe kapal pada data testing diperoleh hasil average
objek yang tertinggi pada data testing yaitu sebanyak 327 precission pada model 2 setiap kelas memiliki nilai yang
objek, kelas “Boat” sebanyak 104 objek, kelas “Cargo” lebih tinggi jika dibandingkan dengan model 1, sehingga
sebanyak 53 objek, kelas “Tanker” sebanyak 19 objek, kelas diperoleh nilai mAP pada model 2 lebih tinggi dibandingkan
“Container” sebanyak 18 objek, dan kelas “Barge” sebanyak model 1, yaitu masing-masing sebesar 50,41% dan 41,88%.
3 objek. Kedua model dibandingkan hasil deteksi pada setiap
kelas.
DAFTAR PUSTAKA
Dari Tabel 9, ditunjukkan bahwa pada masing-masing data
gambar memiliki hasil deteksi yang berbeda-beda dari segi [1] A. Q. Jaelani and U. Basuki, “Illegal unreported and unregulated
(IUU)fishing: upaya mencegah dan memberantas illegal fishing dalam
spesifikasi ukuran dan koordinat boundingbox, serta membangun poros maritim indonesia,” J. Kaji. Ilmu Huk., vol. 3, no. 1,
confidence score pada kelas yang diprediksi. Confidence 2014.
score yang diperoleh hampir pada semua gambar pada setiap [2] Y. D. Pratiwi, “Pertanggung jawaban pidana illegal fishing koporasi
dalam cita-cita indonesia poros maritim dunia,” J. Defendonesia, vol.
kelas yang ditampilkan cenderung pada model 2 didapatkan 1, no. 2, p. 66, 2016.
confidence score yang lebih tinggi dibandingkan dengan pada [3] W. S. Eka Putra, “Klasifikasi citra menggunakan convolutional neural
model 1. Pada kelas dengan ground truth bounding box network (CNN) pada caltech 101,” J. Tek. ITS, vol. 5, no. 1, 2016, doi:
10.12962/j23373539.v5i1.15696.
“Boat” pada model 1 terdapat kesalahan deteksi, dimana pada [4] R. Huang, J. Pedoeem, and C. Chen, “Yolo-Lite: a Real-Time Object
ground truth bounding box yang seharusnya merupakan Detection Algorithm Optimized for Non-GPU Computers,” in IEEE
“Boat” namun dideteksi sebagai “Kapal”. Hal ini disebabkan International Conference on Big Data, 2018, pp. 2503–2510, doi:
10.1109/BigData.2018.8621865.
karena adanya karakteristik pixel yang hampir mirip antara [5] R. C. Gonzalez and R. E. Woods, Digital Image Processing, 3th ed.
kelas “Boat” dengan kelas “Kapal”. Untuk mengetahui New Jersey: Pearson Education, 2008.
performa klasifikasi digunakan nilai mAP. Sebelum [6] M. Sewak, R. Karim, Md, and P. Pujari, Practical Convolutional
Neural Networks. Birmingham: Packt Publishing, 2018.
menghitung nilai mAP dibentuk confusion matrix yang [7] J. Petterson, Deep Learning: A Practitioner’s Appoarch, 1st ed.
menunjukkan kemampuan model dalam mengklasifikasikan Massachusetts: O’Reilly Medai, 2017.
tipe kapal. Pada data testing confusion matrix tidak [8] S. Ioffe and C. Szegedy, “Batch Normalization: Accelerating Deep
ditampilkan karena memilki perhitungan yang sama dengan Network Training by Reducing Internal Covariate Shift,” in
Proceedings of the 32nd International Conference on Machine
confusion matrix pada data training. Oleh karena itu berikut Learning, 2015, vol. 37, pp. 448–456.
merupakan daftar average precission untuk setiap kelas. [9] J. Bergstra, B. Kégl, Y. Bengio, and R. Bardenet, “Alogarithm for
Berdasarkan Tabel 10 diperoleh perbandingan average Hyper-Parameter Optimizaion,” in Advances in Neural Information
Processing System, 2011.
precission untuk kedua model, dimana model 2 tetap meru- [10] Kementrian Luar Negeri, Undang-Undang Republik Indonesia No. 17
pakan model yang terbaik, dengan hasil average precission Tahun 2008. Jakarta: Kementrian Luar Negeri, 2008.