1)
Stephen Mulyadi, 1)Raymond Budiraharjo, 2)Handri Santoso, Dr. Eng
1)
Program Studi Human Computer Interaction, Fakultas Ilmu Hayati, Surya University
Tanggerang, Banten, Indonesia, 15143
2)
Institut Sains dan Teknologi Pradita, Gading Serpong, Tanggerang, Banten, Indonesia, 15810
Stephenmulyadi97@gmail.com, vengeancenator@gmail.com, bondry@gmail.com
bahan. Langkah ketiga adalah proses manufaktur di mana yang dibuat adalah CNN dengan 5 convolution layer, 3
sampah yang sudah dipisah akan mulai didaur ulang sesuai pooling layer dan 3 fully connect layer, dengan hasil
dengan jenisnya masing-masing. Sampah baru dapat akurasi yang didapatkan sebesar 22% [13].
digunakan kembali sebagai produk baru [7].
Dalam penelitian ini akan dilakukan analisa mengenai
Computer vision merupakan salah satu teknologi yang model algoritma CNN yang sesuai untuk dapat melakukan
mempelajari bagaimana sebuah komputer dapat melihat pemilahan sampah secara maksimal. Sehingga algoritma
secara visual dan memahami visual yang dilihat [8]. Image ini dapat digunakan secara langsung untuk implementasi
classification atau pengkategorian gambar merupakan pemisahan sampah secara otomatis menggunakan sistem.
salah satu fitur yang ada dalam teknologi computer vision. Penelitian ini bertujuan untuk mengurangi waktu dan
Image classification memiliki banyak fungsi untuk mempermudahkah proses pengumpulan dan pemisahan
membedakan wilayah pada peta satelit, mengategorikan sampah dalam tahapan daur ulang sampah.
barang, dan lain-lain. Metode algoritma dari image
classification ada beberapa macam, seperti K-means, SVM II. METODELOGI PENELITIAN
(Support Vector Machine), dan CNN (Convolutional Proses training algoritma CNN dilakukan
Neural Network) [9]. menggunakan transfer learning. Model CNN yang akan
CNN merupakan perkembangan dari metode ANN diteliti adalah VGG 16, MobileNet V1, Inception V3, dan
(Artificial Neural Network) yang berfokus pada ResNet 50. Pemilahan sampah yang dilakukan dibagi
pemrosesan gambar, video, dan suara. CNN memiliki menjadi 4 jenis sampah, yaitu sampah plastik, kaca, besi,
sistem kerja yang sama seperti ANN dengan menggunakan dan lain-lain. Data train yang dikumpulkan berupa gambar
prinsip kerja sel otak manusia. Urutan dari algoritma CNN sampah berdasarkan jenisnya. Penggunaan metode cross
dimulai dari pre-processing dalam pengubahan data validation digunakan untuk menghitung nilai performa
gambar seperti ukuran dan pengurangan noise. Deteksi dari masing-masing model CNN. Hasil dari cross
regions of interest (ROI) bertugas untuk menghilangkan validation adalah akurasi dari train dan validation. Jumlah
background dan pengambilan fitur gambar. Pengenalan cross validation yang dilakukan sebanyak 5 kali sehingga
objek memiliki fungsi untuk mencocokkan kesamaan fitur masing-masing gambar dibagi menjadi 5 sama rata dan
yang didapat dengan objek pada gambar. Langkah terakhir 25% dari data tersebut dijadikan data validation. Total
adalah pengambilan keputusan, seperti hasil pergerakan jumlah gambar yang dikumpulkan sebanyak 1,746 gambar
dari gambar dan mencocokkan gambar [10]. dengan 4 kelas. Jumlah gambar sampah plastik sebagai
data train sebanyak 465-466 gambar dan data validation
CNN terdiri dari berbagai jenis layer yaitu convolution sebanyak 116-117 gambar. Jumlah gambar sampah kaca
layer, pooling layer, dan fully connected layer. sebagai data train sebanyak 383-384 gambar dan data
Convolution layer dan pooling layer merupakan layer yang validation 95-96 gambar. Gambar data train sampah besi
menyebabkan ANN dan CNN berbeda. ANN tidak sebanyak 339-340 gambar dan data validation sebanyak
memiliki kedua layer tersebut. Kedua layer tersebut 84-85 gambar. Gambar data train sampah lain-lain
melakukan filter gambar untuk menemukan fitur. Fungsi sebanyak 116-117 dan data validation sebanyak 52-53
dan cara kerja fully connected layer pada CNN merupakan gambar.
perhitungan ANN sehingga memiliki tugas untuk
menentukan hasil fitur dengan label yang telah tersedia Dua cara transfer learning model CNN akan
[11]. dibandingkan. Cara pertama adalah melakukan freeze
semua layer kecuali fully connected layer dan cara kedua
Pengembangan mengenai algoritma CNN telah banyak adalah menambahkan model cara pertama dengan
dilakukan. Pengembangan yang dilakukan adalah melakukan unfreeze layer terakhir dari sebelum fully
meningkatkan akurasi, mengurangi resource, dan connected layer. Masing-masing cara akan menggunakan
mengurangi error dari algoritma CNN. Hal ini dapat data yang sama dan sumber pembelajaran atau train
dilakukan dengan mengubah layer dari CNN. pertama dengan nilai weight yang sama yaitu ImageNet.
Pengembangan yang telah dilakukan terdapat beberapa Model yang dilatih dalam ImageNet menggunakan sekitar
model CNN yang telah dibuat dan dihitung untuk 1,2 juta gambar dengan 1000 jenis kelas.
mendapatkan hasil yang maksimal. Model-model tersebut
adalah VGG, ResNet, Inception, dan MobileNet. Masing- Model algoritma CNN dibuat menggunakan Bahasa
masing model yang telah ada memiliki kompleksitas, pemrograman python dengan batuan library tensorflow
bentuk layer, dan jumlah layer yang berbeda-beda [12]. dan keras. Library opencv digunakan untuk membaca
gambar dan mengambil gambar menggunakan kamera.
Beberapa perkembangan mengenai penerapan Jenis perangkat yang digunakan untuk melakukan training
computer vision dalam pemilahan sampah telah dilakukan algoritma adalah laptop Lenovo ideapad 330 dengan
oleh beberapa peneliti. Pengklasifikasian sampah yang spesifikasi :
telah dilakukan adalah penggunaan algoritma seperti SVM,
CNN, dan KNN. Dengan masing-masing memiliki hasil • Prosesor: 8th Gen Intel Quad Core i5-8250U
performa yang berbeda-beda. Seperti pada artikel berjudul • RAM: 8 GB
“Classification of Trash for Recyclability Status”
membahas mengenai pengenalan objek dengan Proses train algoritma terdapat beberapa nilai yang
menggunakan algoritma SVM dan CNN. Sampah dibagi digunakan. Dalam melakukan train, jumlah maksimal
menjadi 6 kelas berdasarkan bahan, yaitu kertas, kaca, epoch yang digunakan adalah 100. Untuk mencari
plastik, besi, kardus, dan trash. Dengan hasil akurasi SVM perbedaan antar model, pemberhentian pada training akan
yang mencapai 63% dan error 30%. Dan algoritma CNN dilakukan ketika nilai akurasi train tidak mengalami
Tabel 3. Hasil cross validation cara pertama VGG 16 Tabel 6. Hasil cross validation cara kedua Inception V3
Tabel 4. Hasil cross validation cara kedua VGG 16 Tabel 5 dan 6 menunjukkan hasil train dari model
Cross Akurasi Akurasi Jumlah Inception V3. Model ini memakan waktu sekitar 4 sampai
Validation Training Validation epoch 5 detik dalam 1 iteration sehingga 1 epoch membutuhkan
waktu sekitar 465 detik. Total waktu yang dibutuhkan
1 0.92780 0.80553 62 model Inception V3 dalam melakukan training satu kali
2 0.90650 0.81497 46 cross validation pada cara pertama sekitar 172 menit
3 0.89523 0.79078 42 sedangkan pada cara kedua memakan waktu sekitar 505
menit.
4 0.93282 0.78633 65
Jumlah parameter pada model ini sebanyak
5 0.91765 0.81434 51 21,810,980. Pada cara pertama parameter Inception V3
yang dilakukan freeze sebanyak 21,802,784 dan parameter
Tabel 3 dan 4 menunjukkan hasil train dari model yang dapat diubah pada fully connect layer sebanyak
VGG 16. Model ini memakan waktu sekitar 6 sampai 8 8,196. Cara kedua jumlah parameter yang dilakukan freeze
detik dalam 1 iteration sehingga 1 epoch membutuhkan sebanyak 15,729,248 dan parameter yang dapat diubah
sekitar 680 detik. Total waktu yang dibutuhkan model nilainya sebanyak 6,081,732
VGG 16 dalam melakukan training satu kali cross
validation pada cara pertama sekitar 300 menit sedangkan 4) ResNet 50
pada cara kedua memakan waktu sekitar 921 menit. Model ResNet 50 yang digunakan memiliki 50
convolutional layer. Layer awal memiliki convolutional
Parameter pada model ini berjumlah 14,716,740. Pada layer dengan 7X7 filter convolutional layer dan satu max
cara pertama, jumlah parameter yang dilakukan freeze pooling layer. Bentuk layer adalah convolutional layer
sebanyak 14,714,688 dan parameter yang fully connect dengan masing-masing memiliki residual blok setelah 3-
yang dapat berubah sebanyak 2,052. Pada cara kedua, layer convolutional untuk mengirimkan informasi. Bentuk
jumlah parameter VGG 16 yang dilakukan freeze convolutional layer yang ada adalah 1X1 filter dan 3X3
sebanyak 7,081,476 dan jumlah parameter yang dapat filter. Fully connect layer yang menggunakan GAP dan 1
berubah sebanyak 7,635,264. dense layer yang memiliki 4 nilai output class.
3) Inception V3
Model Inception V3 yang digunakan memiliki 42 layer Tabel 7. Hasil cross validation cara pertama ResNet 50
dengan menggunakan campuran beberapa bentuk Cross Akurasi Akurasi Jumlah
inception, yaitu inception module A, B, dan C. Total Validation Training Validation epoch
inception yang digunakan 3 inception module A, 4
1 0.7671 0.71025 15
inception module B, dan 2 inception module C. Masing-
masing tipe inception ini memiliki perbedaan dalam 2 0.7966 0.75742 29
faktorisasi dan kedalaman. Fully connect layer yang 3 0.79701 0.74197 26
menggunakan GAP dan 1 dense layer yang memiliki 4
4 0.77032 0.75901 16
nilai output class.
5 0.79045 0.76592 25
Tabel 5. Hasil cross validation cara pertama Inception V3
Tabel 8. Hasil cross validation cara kedua ResNet 50
Cross Akurasi Akurasi Jumlah
Validation Training Validation epoch Cross Akurasi Akurasi Jumlah
1 0.65919 0.66958 12 Validation Training Validation epoch
2 0.70670 0.68869 26 1 0.89185 0.78475 20
Berdasarkan gambar grafik 2, ResNet 50 dengan cara Model ResNet 50 memiliki jumlah layer dan parameter
pertama menghasilkan model dengan validasi akurasi yang paling banyak dari semua model yang ada. Jumlah
paling tinggi sebesar 75%. Model ResNet 50 dengan cara parameter yang dapat berubah memiliki jumlah yang sama
kedua merupakan model dengan validasi akurasi paling seperti Inception V3. Pada percobaan pertama, hasil
tinggi sebesar 80%. Berdasarkan gambar 2, semua model akurasi yang didapatkan lebih baik. Pada model ResNet
mengalami peningkatan akurasi baik train maupun terdapat ResNet blok yang dapat mengirimkan informasi
validation dari cara pertama menjadi cara kedua. hasil dari satu layer menuju langsung dua layer setelahnya.
Peningkatan jumlah parameter dan optimasi nilai weight Hal ini dilakukan untuk dapat mengurangi layer yang
dapat meningkatkan performa dari transfer learning menghasilkan output parameter salah atau tidak sesuai
model CNN. dengan fitur gambar. Jumlah parameter yang dapat
berubah pada cara kedua ResNet tidak sebanyak VGG 16
Dari kedua cara di atas model, MobileNet V1 memiliki dan tetap menghasilkan nilai akurasi yang berbeda kurang
nilai akurasi antara train dan validation yang paling dari 1%. Sehigga dapat dikatan bahwa model ResNet 50
mendekati satu dengan yang lain karena model ini merupakan model yang paling sesuai untuk
memiliki kompleksitas yang paling kecil diantara semua pengklasifikasi sampah dibandingkan ketiga model
model. Hal ini dibuktikan dengan jumlah parameter pada lainnya.
model ini paling sedikit dan waktu train model ini paling
cepat diantara keempat model. Hal ini dapat terjadi karena
perbedaan pada model ini menggunakan depthwise
convolutional filter. Filter ini memiliki perbedaan dalam
pembagian channel dengan filter pada umumnya. CNN
Tabel 9. Hasil Klasifikasi sampah Algoritma CNN model ResNet 50 ini, botol kaca hemaviton memiliki warna hitam sehingga
Sampah Kaca Besi Plastik Lain- dapat terbaca sampah kaca. Botol UC 1000 memiliki
lain ukuran yang lebih kecil dari pada sampah botol plastik
sehingga terbaca sampah kaca. Pada sampah lain-lain
Kaleng 29.05% 60.88% 4.8% 5.23% dilakukan ujicoba pada sampah kardus. Dalam percobaan
coca-cola ini, sampah kardus memiliki bentuk yang sangat berbeda
Kaleng 8.46% 91.27% 0.46% 0.2% dibandingkan sampah kaca, besi, dan plastik sehingga
coca-cola tidak mengalami permasalahan pada saat klasifikasi.
(berdiri)
IV. KESIMPULAN
Kaleng 0.07% 99.82% 0.1% 0.01% Berdasarkan hasil pengujian dan Analisa, penerapan
Fanta transfer learning cara pertama pada model ResNet 50
Botol 98.4% 0.07% 1.53% 0% menghasilkan akurasi paling tinggi. Pada cara kedua,
hemaviton Model VGG 16 mendapatkan hasil akurasi paling tinggi.
Model ResNet 50 masih memiliki performa yang lebih
Botol 87.38% 6.28% 6.33% 0.01%
baik dibandingkan dengan VGG 16 apabila melihat dari
hemaviton
segi waktu, jumlah epoch, dan param. Oleh karena itu,
(berdiri)
model ResNet 50 merupakan model yang memiliki
Botol UC 77.66% 8.12% 14.09% 0.13% peforma paling baik pada cara kedua.
1000
Penerapan model pada tempat sampah secara langsung
Botol 9.7% 0.48% 89.79% 0.03% dapat menggunakan model MobileNet karena model ini
airputih memiliki kompleksitas paling kecil dan waktu train yang
prima paling cepat sehingga model ini dapat digunakan apabila
Botol 0.01% 0.01% 99.95% 0.03% menggunakan perangkat seperti Raspberry Pi sebagai
airputih kontrol dari tempat sampah. Penerapan tempat sampah
prima menggunakan jaringan atau server untuk melakukan
(berdiri) prediksi maka dapat menggunakan model ResNet 50.
Botol 98.22% 0.02% 1.7% 0.07% Perkembangan penelitian ini dapat dilakukan dengan
Freshtea mencoba mengubah data menjadi kelas yang lebih banyak,
contohnya sampah plastik yang masih dapat dibagi
Botol 0% 0.01% 99.96% 0.03% menjadi botol plastik, tempat makan plastik, dan kantong
Freshtea plastik. Hal ini dapat dilakukan untuk meningkatkan
(berdiri)
akurasi karena proses train gambar yang lebih detail dan
Kotak 16.4% 4.06% 5.31% 74.23% memiliki bentuk yang hampir sama antar kelas.
kardus penambahan data lebih banyak juga dapat dilakukan
kecil seperti satu kelas 1000 data.
Kotak 0% 0% 0% 100% UCAPKAN TERIMA KASIH
Styrofoam
Ucapkan terima kasih disampaikan kepada Bapak
Kardus 0% 0.01% 0.01% 99.98% Handri Santoso, Dr. Eng selaku dosen pembimbing yang
pepsodent membantu dalam memberikan saran dan pendapat untuk
dapat menyempurnakan penelitian ini.