Model CNN yang dalam terdiri dari kumpulan lapisan pemrosesan terbatas
yang dapat mempelajari berbagai fitur data input (misalnya gambar) dengan
beberapa tingkat abstraksi. Lapisan inisiasi mempelajari dan mengekstrak fitur
tingkat tinggi (dengan abstraksi lebih rendah), dan lapisan yang lebih dalam
mempelajari dan mengekstrak fitur tingkat rendah (dengan abstraksi lebih tinggi).
Model konseptual dasar CNN ditunjukkan pada Gambar 2, berbagai jenis lapisan
dijelaskan pada bagian selanjutnya.
1. Lapisan Jaringan
CNN terdiri dari beberapa blok penyusun (dikenal sebagai lapisanarsitektur),
dalam subbagian ini, kami menjelaskan beberapa blok penyusun ini secara
mendetail dengan gulungannya dalam arsitektur CNN.
2. Lapisan Konvolusional
Lapisan konvolusi1adalah komponen terpenting dari setiap arsitektur CNN.
Ini berisi satu set kernel konvolusional (juga disebut filter), yang
digabungkan dengan gambar masukan (metrik N- dimensi) untuk
menghasilkan peta fitur keluaran.
- Kernel
Kernel dapat digambarkan sebagai kisi nilai atau angka diskrit, di mana
setiap nilai dikenal sebagai bobot kernel ini. Selama awal proses
pelatihan model CNN, semua bobot kernel ditetapkan dengan angka acak
(pendekatan yang berbeda juga tersedia di sana untuk menginisialisasi
bobot). Kemudian, dengan setiap periode pelatihan, bobot disetel dan
kernel belajar untuk mengekstraksi fitur yang bermakna.
- Konvolusi
untuk memahami operasi konvolusi, jika kita mengambil gambar skala
abu-abu 4×4 diameter, ditunjukkan pada gambar 1 dan 2×2 dengan bobot
yang diinisialisasi secara acak seperti yang ditunjukkan pada gambar 2.
Sekarang, dalam operasi konvolusi, kita ambil 2×2 kernel dan geser ke atas
semua 4 lengkap×4 gambar secara horizontal maupun vertikal dan
sepanjang jalan kita mengambil produk titik antara kernel dan gambar
input dengan mengalikan nilai yang sesuai dari mereka dan menjumlahkan
semua nilai untuk menghasilkan satu nilai penskalaan dalam peta fitur
keluaran. Proses ini berlanjut hingga kernel tidak dapatlagi meluncur lebih
jauh.
Untuk memahami hal tersebut dengan lebih jelas, mari kita lakukan
beberapa perhitungan awal yang dilakukan pada setiap langkah secara
grafis seperti yang ditunjukkan pada Gambar 7, di mana 2×2 kernel
(ditampilkan dalam warna biru muda) dikalikan dengan wilayah berukuran
sama (ditampilkan dalam warna kuning) dalam 4×4 gambar input dan nilai
yang dihasilkan dijumlahkan untuk mendapatkan entri yang sesuai
(ditunjukkan dengan warna biru tua) di peta fitur output pada setiap
langkah konvolusi.
o Pembagian Berat:Di CNN, tidak ada bobot khusus yang ada di antara
dua neuron dari lapisan yangberdekatan alih-alih semua bobot bekerja
dengan setiap piksel dari matriks input. Alih-alih mempelajari bobot
baru untuk setiap neuron, kita dapat mempelajari satu set bobot untuk
semua masukan dan ini secara drastis mengurangi waktu pelatihan serta
biaya lainnya.
3. Lapisan Penyatuan