Bab 2

4
BAB II
DASAR TEORI
2.1 Pengertian Jalan Tol

Jalan tol adalah jalan umum yang kepada pemakainya dikenakan kewajiban
membayar tol dan merupakan jalan alternatif lintas jalan umum yang telah ada.
Jalan tol diselenggarakan dengan maksud untuk mempercepat pewujudan jaringan
jalan dengan sebagian atau seluruh pendanaan berasal dari pengguna jalan untuk
meringankan beban pemerintah. Jalan tol diselenggarakan dengan tujuan
meningkatkan efisien pelayanan jasa distribusi guna menujukkan pertumbuhan
ekonomi dengan perkembangan wilayah dengan memperhatikan rencana induk
jaringan jalan. Terdapat beberapa cara utuk mendefenisikan waktu pelayanan, hal
itu taergantung kepada apa yang sedang dilayani. Pelayanan berarti memberukan
suatu kepuasan bagi si penerima jasa yang di berikan kepada pemberi jasa
(Lestiawan, 2013).
c
Gambar 2.1 Golongan kendaraan pada tol (Lestiawan, 2013)
Adapun penggolongan kendaraan pada gerbang tol berikut ini : (Kargo, 2018)
1. Golongan 1
Kendaraan yang termasuk pada golongan ini :
1. Sedan
2. Jeep
3. Pick-up
4. Metromini
5. Bus elf
4
5
6. Bus antar kota dan dalam kota

Golongan dengan 1 gandar dapat dilihat pada Gambar 2.2. dibawah ini:
Gambar 2.2 Golongan dengan 1 gandar (Kargo, 2018)
2. Golongan 2
Truk ringan dengan 2 sumbu 6 roda kendaraan yaitu kendaraan barang dengan
muatan sumbu seberat 5 ton, pada sumbu belakang dengan bagian depan 2 roda
dan bagian belakang 4 roda. Truk pada golongan ini yaitu truk engkel, dimana
truk ini memiliki dua jenis engkel yaitu :
a. Truk engkel single memiliki jumlah roda 4, jumlah sumbu roda 2 dengan
konfigurasi 1-1 dengan muatan maksimal 12 ton.
b. Truk engkel double memiliki jumlah roda 6, jumlah sumbu roda 2 dengan
konfigurasi 1-2 dengan beban maksimal 16 ton.
Gambar 2.3 Golongan truk dengan 2 gandar (Kargo, 2018)

6
3. Golongan 3
Pada Gambar 2.4 diatas merupakan golongan truk dengan 3 gandar terbagi
menjadi dua jenis yaitu :
a) Truk trintin memiliki jumlah roda 8, jumlah sumbu roda 3 dengan
konfigurasi 1-1-2 dengan beban maksimal 18 ton.
b) Truk tronton memiliki jumlah roda 10, jumlah sumbu roda 3 dengan
konfigurasi 1-2-2 dengan beban maksimal 22 ton.
4. Golongan 4
Golongan truk dengan 4 gandar terbagi menjadi dua jenis, yaitu :
a) Truk trinton
Truk ini memiliki jumlah roda 12, jumlah sumbu roda 4 dengan konfigurasi
1.1-2.2 dengan beban maksimal 30 ton.
b) Truk trailer engkel
Truk ini memiliki jumlah roda 14, jumlah sumbu roda 4 dengan konfigurasi
1-2-2.2 dengan beban maksimal 28 ton.
Golongan dengan 4 gandar dapat dilihat pada Gambar 2.5 :
7
5. Golongan 5
Truk yang termasuk dalam 5 golongan gandar yaitu :
a) Truk trailer engkel
Truk ini memiliki 5 sumbu roda dengan total 18 buah roda dengan
konfigurasi 1-2-2.2.2. truk ini memiliki beban maksimal 40 ton.
b) Truk trailer tronton
Truk ini memiliki 5 buah sumbu dengan total 18 buah roda dengan
konfigurasi 1 – 2.2 – 2.2. truk ini memiliki beban maksimal 40 ton.
c) Truk trailer tronton
Truk ini memiliki 6 buah sumbu roda dengan total 22 buah roda dengan
konfigurasi 1 - 2.2 - 2.2.2. truk ini memiliki beban maksimal 43 ton
Golongan dengan 5 gandar dapat dilihat pada Gambar 2.6 dibawah ini :

8
2.2 Object Detection

Object detection menentukan keberadaan suatu objek dan ruang lingkupnya serta
lokasi pada sebuah gambar. Hal ini dapat diperlakukan sebagai pengenalan objek
kelas dua, dimana satu kelas mewakili kelas objek dan kelas lain mewakili kelas
non-objek. Deteksi objek dapat dibagi lagi menjadi soft detection dan hard
detection. Soft detection hanya mendeteksi adanya objek sedangkan hard detection
mendeteksi adanya objek serta lokasi objek (Jalled, 2016).
2.3 Definisi Citra

Citra (image) adalah gambar pada bidang dua dimensi dan disusun oleh
banyak piksel yang merupakan bagian terkecil dari citra. Pada umumnya, citra
dibentuk dari kotak-kotak persegi empat yang teratur sehingga jarak horizontal
dan vertikal antara piksel sama pada seluruh bagian citra
Citra sebagai keluaran dari suatu sistem perekaman data dapat bersifat :
a. Optik berupa foto,
b. Analog berupa sinyal video seperti gambar pada monitor televisi,
c. Digital yang dapat langsung disimpan pada media penyimpanan
magnetik.
Citra dapat dikelompokkan menjadi dua bagian yaitu citra diam (still image)
dan citra bergerak (moving image). Citra diam yang ditampilkan secara beruntun
(sekuensial), sehingga memberi kesan pada mata sebagai gambar yang bergerak.
Setiap citra didalam rangkaian tersebut disebut frame. Gambar-gambar yang
tampak pada film layar lebar atau televisi pada hakekatnya terdiri dari ratusan
sampai ribuan frame (Dewi, 2018).
2.4 Pengertian Deep Learning

Deep Learning merupakan salah satu bidang dari Machine Learning yang
memanfaatkan jaringan syaraf tiruan untuk implementasi permasalahan dengan
dataset yang besar. Teknik Deep Learning memberikan arsitektur yang sangat
kuat untuk Supervised Learning. Dengan menambahkan lebih banyak lapisan
maka model pembelajaran tersebut bisa mewakili data citra berlabel dengan lebih
9
baik. Pada Machine Learning terdapat teknik untuk menggunakan ekstraksi fitur
dari data pelatihan dan algoritma pembelajaran khusus untuk mengklasifikasi
citra maupun untuk mengenali suara. Namun, metode ini masih memiliki
beberapa kekurangan baik dalam hal kecepatan dan akurasi.
Aplikasi konsep jaringan syaraf tiruan yang dalam (banyak lapisan) dapat
ditangguhkan pada algoritma Machine Learning yang sudah ada sehingga
komputer sekarang bisa belajar dengan kecepatan, akurasi, dan skala yang besar.
Prinsip ini terus berkembang hingga Deep Learning semakin sering digunakan
pada komunitas riset dan industri untuk membantu memecahkan banyak masalah
data besar seperti Computer vision, Speech recognition, dan Natural Language
Processing. Feature Engineering adalah salah satu fitur utama dari Deep
Learning untuk mengekstrak pola yang berguna dari data yang akan
memudahkan model untuk membedakan kelas. Feature Engineering juga
merupakan teknik yang paling penting untuk mencapai hasil yang baik pada
tugas prediksi.
Algoritma yang digunakan pada Feature Engineering dapat menemukan
pola umum yang penting untuk membedakan antara kelas Dalam Deep Learning,
metode CNN atau Convolutional Neural Network sangatlah bagus dalam
menemukan fitur yang baik pada citra ke lapisan berikutnya untuk membentuk
hipotesis nonlinier yang dapat meningkatkan kekompleksitasan sebuah model.
Model yang kompleks tentunya akan membutuhkan waktu pelatihan yang lama
sehingga di dunia Deep Learning pengunaan GPU sudah sangatlah umum
(Danukusumo, 2017).
2.5 Karakteristik Deep Learning

Saat ini sudah cukup banyak model deep learning yang dikembangkan,
sehingga tidak mudah untuk menyimpulkan karakteristik deep learning secara
umum. Hal-hal berikut ini semoga dapat membantu kita untuk mengenali deep
learning yang lain: (Primartha, 2018)
10
 Neural network
Semua model deep learning mencoba meniru cara kerja otak manusia. Sehingga
ketika bertemu dengan slah satu model deep learning maka pasti kita aka
berurusan dengan artificial neuron.
 Supervised dan unsupervised learning
Tidak seperti metode lainnya yang umumnya secara tegas dapat digolongkan
sebagai supervised atau unsupervised learning. Model deep learning dapat
menggunakan supervised, semi supervised learning, dan unsupervised learning.
 Dataset
Deep learning dimaksudkan untuk meniru otak manusia, sehingga secara umum
dataset jenis apapun dapat diterima. Umumnya deep learning digunakan untuk
mengolah unlabeled dataset, seperti gambar, video, suara, dan lain-lain. Namun
labeled dataset pun cocok dengan deep learning.
 Multi layer
Jika diperhatikan diagram berbagai model deep learning maka akan dapat
dijumpai beberapa layer yang menghubungkan input dan output. Semakin
kompleks modelnya biasanya jumlah layer akan semakin banyak.
2.6 Convolutional Neuron Network (CNN)

Convolutional Neuron Network adalah salah satu jenis dari neural network yang
biasa digunakan pada data image. CNN bisa digunakan untuk mendeteksi dan
mengenali object pada sebuah image.Secara garis besar CNN tidak jauh beda dengan
neural network biasanya. Beberapa teknik populer yang memanfaatkan CNN,
diantaranya: (Primartha, 2018)
2.6.1 OverFeat
Salah satu arsitektur pertama yang menggunakan deep learning untuk mendeteksi
objek adalah OverFeat. Dipublikasikan pada tahun 2013 oleh peneliti dari New York
University, OverFeat memanfaatkan algoritma multi-scale sliding window dan
CNN .
11
2.6.2 R-CNN (Regional Convolutional Neural Network)

Permasalahan dengan menggunakan teknik sliding window adalah banyaknya
potongan-potongan gambar yang harus diproses oleh CNN. Setiap potongan tersebut
akan melalui proses konvolusi, untuk kemudian diklasifikasikan
menjadi background atau objek. Artinya, dengan banyaknya lokasi gambar serta
ukuran sliding window yang digunakan, komputasi dari keseluruhan proses tersebut
akan sangat berat! Maka muncul lah teknik Regions with CNN features atau R-
CNN yang diperkenalkan oleh peneliti dari UC Berkeley (Girschick, 2014).
Proses R-CNN sendiri terdiri dari 3 tahap;
 mencari region atau bagian gambar yang mungkin merupakan sebuah objek,
dengan metode region proposal. Salah satu contoh teknik region

proposal: Selective Search.
 setiap region tersebut kemudian dijadikan input untuk CNN sebagai feature
extractors dari tiap region tersebut.
setiap fitur-fitur yang dihasilkan, kemudian menjadi input untuk SVM (yang akan
menghasilkan kelas dari region tersebut) dan linear regressor (yang akan
menghasilkan bounding box). Arsitektur R-CNN dapat dilihat pada Gambar 2.7
Gambar 2.7 Arsitektur R-CNN (Girschick, 2014)
Seperti yang mungkin sudah Anda perhatikan, alih-alih memproses sejumlah besar
gambar yang dipangkas seperti di OverFeat, R-CNN “mengurangi” jumlah hal untuk
diproses ke beberapa wilayah. Dengan begitu, R-CNN berhasil meningkatkan
performa dari OverFeat hingga hampir 50%.
12
2.6.3 Fast R-CNN

Meskipun peningkatannya cukup signifikan, proses training dari R-CNN memiliki
banyak kendala. Kita perlu menghasilkan region sebelum dapat memulai
proses training! Selain itu, tidak hanya kita perlu melatih CNN itu sendiri, kita juga
perlu melakukan training untuk SVM yang digunakan. Oleh karena itu, setahun
berikutnya, yaitu pada tahun 2015, Ross Girschick mengembangkan R-CNN
menjadi Fast R-CNN. Alur kerja dari Fast R-CNN sedikit berbeda dari sebelumnya,
dimana bila sebelumnya tiap region-region dari region proposal method (Selective
Search) akan memiliki CNN untuk feature extraction masing-masing, Fast R-CNN
hanya menggunakan 1 CNN. Feature map yang dihasilkan kemudian “dicocokan”
dengan Region of Interest (ROI) yang didapat dari Selective Search tadi, untuk
kemudian diklasifikasi kelas nya dan dideteksi bounding box nya. Dengan kata
lain, Fast R-CNN melakukan feature extraction sebelum mengajukan regions.
R-CNN juga meninggalkan penggunaan SVM sebagai classifiers, menggantinya
dengan ROI pooling dan fully-connected layers. Pendekatan dengan 1 CNN, ROI
pooling layer dan feed forward network ini tidak hanya mempercepat performa R-
CNN menjadi lebih cepat, tetapi juga menambah kapabilitas R-CNN menjadi end-
to-end differentiable dan juga mempermudah proses training (karena tidak perlu
lagi melakukan train untuk SVMs dan hanya melatih 1 arsitektur CNN ketimbang
banyak CNN seperti sebelumnya). Arsitektur Fast R-CNN dapat dilihat pada
Gambar 2.8 (Girschick, 2014).
Gambar 2.8 Arsitektur Fast R-CNN (Girschick, 2014)

13
2.6.4 Faster R-CNN

Penggunaan region proposal method seperti Selective Search masih menjadi
“bottleneck” dalam proses deteksi objek menggunakan R-CNN, karena metode
seperti ini membutuhkan waktu yang relatif lama untuk menghasilkan regions. Tidak
lama setelah Fast R-CNN, Faster R-CNN hadir untuk mencoba menyelesaikan
masalah region proposal method diatas. Dikembangkan oleh Shaoqing Ren dan
dibantu oleh Girshick (pelopor R-CNN dan Fast R-CNN). Faster R-CNN
memperkenalkan Region Proposal Network (RPN). RPN adalah sebuah neural
network yang menggantikan peran Selective Search untuk mengajukan region
(bagian-bagian mana dari sebuah gambar yang perlu dilihat lebih jauh). RPN
menghasilkan beberapa bounding box, setiap box memiliki 2 skor probabilitas
apakah pada lokasi tersebut terdapat objek atau tidak. Region-region yang dihasilkan
tersebut akan menjadi input untuk arsitektur yang mirip seperti Fast R-CNN.
Arsitektur Faster R-CNN dapat dilihat pada Gambar 2.9 (Shaoqing, 2015).
Gambar 2.9 Arsitektur Faster R-CNN (Ren, 2015)
Penggunaan RPN untuk mengganti Selective Search ini mengurangi kebutuhan

komputasi yang cukup signifikan, dan membuat keseluruhan model dapat di-
train secara end-to-end (karena tidak lagi ada metode yang digunakan terpisah
seperti dengan region proposal method sebelumnya).
Selain itu, Faster R-CNN juga menghasilkan performa yang lebih cepat dan lebih
akurat bila dibandingkan dengan Fast R-CNN, dan saat ini telah menjadi pilihan
14
model yang umum digunakan untuk deteksi objek dengan solusi berbasis deep
learning (Ren, 2015).
2.6.5 SSD MobileNet

MobileNet, merupakan salah satu arsitektur Convolutional Neural Network (CNN)
yang dapat digunakan untuk mengatasi kebutuhan akan computing
resource berlebih.
Perbedaan mendasar antara arsitektur MobileNet dan arsitektur CNN pada
umumnya adalah penggunaan lapisan atau layer konvolusi dengan ketebalan filter
yang sesuai dengan ketebalan dari input image. Arsitektur SSD MobileNet dapat
dilihat pada Gambar 2.10 (Arabi, 2019).
Gambar 2.10 Arsitektur SSD MobileNets (Arabi, 2019)
Single Shot Detector (SSD) telah digunakan dalam penelitian ini sebagai detektor.
Model ini menggunakan jaringan bantu untuk ekstraksi fitur, juga dikenal sebagai
jaringan dasar. Kami menggunakan mobileNet, yang dijelaskan sebelumnya,
sebagai jaringan dasar di sini. SSD menggunakan peta fitur yang berbeda - beberapa
di antaranya dari jaringan dasar - untuk melakukan klasifikasi dan regresi lokalisasi.
Bentuk dari arsitektur SSD adalah fully connection neural network yang
menghasilkan koleksi ukuran tetap dari bounding boxes dan class score untuk
keberadaan objek di dalam boxes. SSD menggunakan feature maps yang berbeda -
beberapa di antaranya dari base network - untuk melakukan klasifikasi dan regresi
lokalisasi. Satu set kotak default yang ditetapkan untuk setiap cell dari feature
maps. Kemudian, SSD memprediksi skor untuk setiap kelas dan empat offset kotak
pembatas untuk setiap kotak default di setiap cell pada feature maps.
15
2.7 Arsitektur Convolutional Neural Network

Arsitektur dari CNN dibagi menjadi 2 bagian besar, yaitu : (Danukusumo, 2017).
2.7.1 Feature Extraction Layer
Proses yang terjadi pada arsitektur ini adalah melakukan encoding dari sebuah
image menjadi features yang berupa angka-angka yang mempresentasikan
image tersebut atau feature extraction.
Gambar 2.11 Image RGB (Danukusumo, 2017)
Pada Gambar 2.11 merupakan channel RGB (Red, Green, Blue) image berukuran
32x32 pixels yang sebenarnya adalah multidimensional array dengan ukuran
32x32x3 (3 merupakan jumlah channel). Convolutional layer terdiri dari neuron
yang tersusun sehingga membentuk sebuah filter dengan panjang dan tinggi
(pixels). Sebagai contoh, pada layer pertama pada feature extraction layer
biasanya adalah conv. layer dengan ukuran 5x5x3. Panjang 5 pixels, tinggi 5
pixels dan tebal/jumlah nya 3 buah sesuai dengan channel dari image tersebut.
Ketiga filter ini akan digeser keseluruh bagian dari gambar. Setiap pergeseran
akan dilakukan operasi “dot” antara input dan nilai dari filter tersebut sehingga
menghasilkan sebuah output atau biasa disebut dengan activation map atau
feature map, bisa dilihat pada Gambar 2.12 (Danukusumo, 2017).
Gambar 2.12 Feature Map (Danukusumo, 2017)

16
2.6.2 Fully Connected Layer

Feature map yang dihasilkan dari feature extraction layer masih berbentuk
multidimensional array, sehingga harus melakukan “flatten” atau reshape feature
map menjadi sebuah vector agar bisa digunakan sebagai input dari fully-connected
layer. Fully Connected Layer yang dimaksud disini adalah Multi Layer Perceptron
yang sudah pernah dipelajari.Lapisan Fully-Connected adalah lapisan di mana semua
neuron aktivasi dari lapisan sebelumnya terhubung semua dengan neuron di lapisan
selanjutnya seperti halnya jaringan saraf tiruan biasa. Setiap aktivasi dari lapisan
sebelumnya perlu diubah menjadi data satu dimensi sebelum dapat dihubungkan ke
semua neuron di lapisan. Lapisan Fully-Connected biasanya digunakan pada metode
Multi Layer Perceptron untuk mengolah data sehingga bisa diklasifikasikan. Perbedaab
antara lapisan Fully-Connected dan lapisan konvolusi biasa adalah neuron di lapisan
konvolusi terhubung hanya ke daerah tertentu pada input, sementara lapisan Fully-
Connected memiliki neuron yang secara keseluruhan terhubung. Namun, kedua lapisan
tersebut masih mengoperasikan produk dot, sehingga fungsinya tidak begitu berbeda
(Danukusumo, 2017).
2.8 Phyton
Python merupakan bahasa pemrograman dengan tujuan umum yang
dikembangkan secara khusus untuk membuat source code mudah dibaca. Python
juga memiliki library yang lengkap sehingga memungkinkan programmer untuk
membuat aplikasi yang mutakhir dengan menggunakan source code yang
tampak sederhana ( Perkovic, 2012).
2.9 Tensorflow
Tensorflow merupakan library perangkat lunak yang dikembangkan oleh Tim
Google Brain dalam organisasi penelitian Mesin Cerdas Google, untuk tujuan
melakukan pembelajaran mesin dan penelitian jaringan syaraf dalam. Tensorflow
menggabungkan aljabar komputasi teknik pengoptimalan kompilasi,
mempermudah penghitungan banyak ekspresi matematis dimana masalahnya
17
adalah waktu yang dibutuhkan untuk melakukan perhitungan. Fitur utamanya

meliputi: (Dewi, 2018)
1. Mendefinisikan, mengoptimalkan, dan menghitung secara efisien ekspresi
matematis yang melibatkan array multidimension (tensors).
2. Pemrograman pendukung jaringan syaraf dalam dan teknik pembelajaran
mesin.
3. Penggunaan GPU yang transparan, mengotomatisasi manajemen dan
optimalisasi memori yang sama dan data yang digunakan. Tensorflow bisa
menulis kode yang sama dan menjalankannya baik di CPU atau GPU. Lebih
khususnya lagi, Tensorflow akan mengetahui bagian perhitungan yang harus
dipindahkan ke GPU.
4. Kemampuan sistem komputasi yang tinggi di seluruh mesin dan kumpulan
data yang besar.

Bab 2

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab 2

Diunggah oleh

Hak Cipta:

Format Tersedia

4

2.1 Pengertian Jalan Tol

6. Bus antar kota dan dalam kota

Gambar 2.2 Golongan dengan 1 gandar (Kargo, 2018)

Gambar 2.3 Golongan truk dengan 2 gandar (Kargo, 2018)

Gambar 2.4 Golongan truk dengan 3 gandar (Kargo, 2018)

Gambar 2.5 Golongan truk dengan 4 gandar (Kargo, 2018)

Gambar 2.6 Golongan truk dengan 5 gandar (Kargo, 2018)

2.2 Object Detection

2.3 Definisi Citra

2.4 Pengertian Deep Learning

2.5 Karakteristik Deep Learning

2.6 Convolutional Neuron Network (CNN)

2.6.2 R-CNN (Regional Convolutional Neural Network)

dengan metode region proposal. Salah satu contoh teknik region

extractors dari tiap region tersebut.

Gambar 2.7 Arsitektur R-CNN (Girschick, 2014)

2.6.3 Fast R-CNN

Gambar 2.8 Arsitektur Fast R-CNN (Girschick, 2014)

2.6.4 Faster R-CNN

Gambar 2.9 Arsitektur Faster R-CNN (Ren, 2015)

Penggunaan RPN untuk mengganti Selective Search ini mengurangi kebutuhan

2.6.5 SSD MobileNet

Gambar 2.10 Arsitektur SSD MobileNets (Arabi, 2019)

2.7 Arsitektur Convolutional Neural Network

Gambar 2.11 Image RGB (Danukusumo, 2017)

Gambar 2.12 Feature Map (Danukusumo, 2017)

2.6.2 Fully Connected Layer

adalah waktu yang dibutuhkan untuk melakukan perhitungan. Fitur utamanya

Anda mungkin juga menyukai