TEKNIK NEUROFUZZY
Semester Gasal T.A. 2021/2022
Dosen Pengampu : Dr. INDAH SOESANTI, S.T., M.T.
Oleh
Afner Sirait
18/431050/TK/47643
Fakultas Teknik
Universitas Gadjah Mada
2021
Intisari
Pada laporan ini, akan dibahas bagaimana penerapan teknologi Deep Learning CNN Inception-ResNet
V2 pada proses diagnosis COVID-19 melalui hasil CT Scan paru. Data set yang diperoleh melalui Git
Hub kemudian akan diolah menggunakan model Inception-ResNet V2 yang telah dibangun
berdasarkan beberapa referensi dan paper terkait. Dalam mengerjakan tugas juga dilakukan kajian
pustaka dari beberapa jurnal dan paper sebagai dasar informasi yang valid dalam mengerjakan tugas
ini. Secara keseluruhan, laporan ini mencakup kajian pustaka mengenai CT Scan Covid 19,
Inception-ResNet V2, dan Penerapan Deep Learning yang sudah ada dalam diagnose Covid-19
melalui citra medis, kemudian dasar teori, metodologi, hasil dan analisa, dan kesimpulan.
2
Daftar Isi
Intisari 2
Daftar Isi 3
PENDAHULUAN 4
METODOLOGI 16
Alat dan Bahan 16
Langkah Uji dan Metode 16
KESIMPULAN 19
DAFTAR PUSTAKA 20
3
I. PENDAHULUAN
Sejak Desember 2019, Covid-19 pertama kali muncul di Wuhan, China dan menyebar
dengan cepat ke seluruh dunia[2]. Hingga pada 12 Maret 2020, WHO telah menetapkan
Covid-19 sebagai Pandemi[3]. Coronavirus disease 2019 (Covid-19) adalah penyakit
menular yang disebabkan oleh SARSCoV-2 (Severe Acute Respiratory Syndrome
Coronavirus 2)[1]. Langkah awal untuk mendeteksi seseorang terjangkit Covid-19 adalah
melalui tes PCR, tes swab, Rapid test atau lainnya. Namun, menurut para ahli, hasil dari
tes ini dinilai kurang akurat. Dalam penelitian ditemukan sekitar 48% pasien yang di tes
swab yang hasilnya negatif, namun sebenarnya positif[4].
Para ahli di Amerika Serikat menyatakan bahwa CT scan adalah metode paling baik
untuk deteksi Covid-19 dibandingkan tes swab[4]. Metode CT scan dapat
mengidentifikasi bintik-bintik putih yang kabur, bercak-bercak pada paru paru, sehingga
dapat dengan cepat mendiagnosis Covid-19 meskipun gejala belum muncul[4]. Dalam
mendeteksi gejala Covid-19 melalui CT-Scan paru, dapat diterapkan teknologi Deep
Learning untuk mendeteksi adanya bintik-bintik atau bercak putih pada CT scan paru dan
mendiagnosis apakah positif terinfeksi atau tidak.
Saat ini, Deep Learning menjadi teknologi utama untuk meningkatkan Artificial
Inteligence dalam diagnosa otomatis pada deteksi penyakit paru-paru, melalui analisa foto
medis (seperti CT-scan, X-ray, dan lainnya)[5]. Deep learning merupakan bagian dari
Machine Learning yang dapat melakukan pengolahan data yang sangat banyak dan dapat
mengolah data yang rumit seperti foto/gambar, suara, teks, dan lainnya. Salah satu
teknologi Deep Learning yang sangat sering digunakan dalam deteksi medis ini adalah
Convolutional Neural Network (CNN) karena sangat baik dalam melakukan klasifikasi
gambar (image/object recognition and classification)[5].
CNN terinspirasi dari arsitektur saraf pada otak. Seperti halnya saraf di otak manusia,
neuron pada CNN menerima input, mengolahnya dan mengirimkannya sebagai output ke
neuron lapisan setelahnya hingga pada lapisan output untuk mendapatkan hasil akhir[6].
Salah satu arsitektur CNN adalah Inception-ResNet V2, yang merupakan kombinasi dari
arsitektur Inception dan Residual. ResNet dan Inception merupakan arsitektur CNN
dengan performa image recognition yang bagus dengan biaya komputasi yang rendah.
Inception-ResNet menggabungkan kelebihan dari kedua arsitektur ini untuk
menghasilkan arsitektur yang memiliki performa yang labih baik.
Dalam tugas ini, akan dilakukan simulasi deteksi Covid-19 melalui CT scan dengan
menggunakan teknologi Deep Learning arsitektur CNN Inception-ResNet V2. Simulasi
ini bertujuan untuk menghasilkan model yang memiliki performa yang baik dan layak
digunakan untuk melakukan deteksi Covid-19 melalui CT scan dengan menggunakan
Inception-ResNet V2
4
Inception-ResNet V2 serta penerapannya dalam analisa medis. Berikut beberapa hasil
kajian yang telah dilakukan:
1. Artikel oleh Thomas C. Kwee, MD dan Robert M. Kwee, MD, dari
Departemen Radiologi, Nuclear Medicine and Molecular Imading, University
Medical Center Groningen, tahun 2020 dengan judul Chest CT in COVID-19:
What the Radiologist Needs to Know[7].
Dalam artikel ini, disajikan suatu tinjauan mengenai citra CT dada
dan mengelola perawatan pasien COVID-19 dan membahas topik tentang
protokol CT dada, diagnosa COVID-19 dari CT dada dan komplikasinya
akurasi diagnosis dari CT dada dan aturan aturan dalam mengambil
keputusan diagnosis dan prognostikasi, dan pelaporan dan komunikasi
tentang hasil CT dada. Melalui artikel ini, kita dapat mengetahui ciri-ciri
infeksi COVID-19 pada CT scan paru yang menjadi patokan dalam
mengumpulkan dan memberi label pada data set untuk menjadi bahan
training, validasi, dan testing model Deep Learning.
2. Paper oleh Szgedy, Christian, dkk, tahun 2016 dengan judul Inception-v4,
Inception-ResNet and the Impact of Residual Connections on Learning[8].
Paper ini merupakan referensi utama dalam membangun struktur
Deep Learning Inception-ResNet V2 karena didalamnya dibahas secara detail
susunan tiap blok dan layer dari arsitektur CNN jenis ini, serta hasil evaluasi
dan perbandingannya dengan hasil yang diperoleh melalui arsitektur
Inception-v3 dan v4, dan Inception-ResNet V1. Dalam paper ini dikaji secara
mendalam mengenai kombinasi dari koneksi residual yang diperkenalkan
oleh He dkk dalam [9] dan versi arsitektur Inception terbaru [10].
Penggunaan koneksi residual dapat meningkatkan training speed dari model
Deep Learning. Setiap blok Inception pada arsitektur Inception-ResNet
diikuti oleh lapisan filter expansion (1x1 konvolusi tanpa aktivasi) yang
digunakan untuk meningkatkan dimensi filter bank sebelum penambahan
agar sesuai dengan kedalaman input. Penjelasan dan kajian secara lebih
mendalam mengenai struktur Inception-ResNet V2 yang disajikan dalam
paper ini akan dibahas pada bagian landasan teori.
Berdasarkan percobaan telah dilakukan, jika jumlah filter melebihi
1000, varian residual mulai menunjukkan ketidakstabilan dan jaringan akan
5
“mati” di awal training. Lapisan terakhir sebelum average pooling mulai
hanya menghasilkan nol setelah beberapa puluh ribu iterasi. Ini tidak dapat
dicegah baik dengan menurunkan learning rate maupun menambahkan batch
normalization ke lapisan/layer ini. Untuk menstabilkan training, dilakukan
scaling down residu dengan faktor penskalaan dipilih antara 0.1 dan 0.3.
3. Paper oleh Madallah Alruwaili, dkk, tahun 2020 dengan judul COVID-19
Diagnosis Using an Enhanced Inception-ResNetV2 Deep Learning Model in
CXR Images[5].
Dalam paper ini ditampilkan kajian sistem yang dibangun oleh
Madallah Alruwaili, dkk yang dapat melakukan diagnosa scan CXS dengan
akurasi yang tinggi untuk meningkatkan diagnosis dini dari COVID-19.
Sistem ini berkontribusi untuk mengendalikan epidemik dan mengurangi
waktu yang dibutuhkan untuk mendiagnosis kasus COVID-19. Selain itu juga
dibangun sebuah ansambel model Deep Learning dalam sebuah framework
baru dan diusulkan model Deep Learning yang disempurnakan yang
menggunakan algoritma transfer learning yang baru dengan kemampuan
untuk mengatasi masalah overfitting yang membuat model ini lebih efisien
secara real time. Dalam paper ini juga ditampilkan model
Inception-ResNet-v2 gabungan yang mengatasi performa studi terkait
lainnya.
Sistem yang dikaji ditunjukkan pada gambar di atas. Pada tahap (1) Citra
medis dikumpulkan dari Database Radiografi. (2) Selanjutnya dilakukan
preprocessing pada citra, dengan melakukan artifact removal, resizing,
contras handling, dan normalization.(3)Kemudian, citra diklasifikasi
menggunakan sebuah model ansambel Deep Learning dan fokus pada inti
model yaitu model Inception-ResNetV2. (4)Langkah terakhir adalah proses
6
diagnosis penyakit dan memperoleh feedback menggunakan algoritma
Grad-CAM. Detail lebih jauh mengenai arsitektur/jaringan sistem yang
diajukan dalam paper ini ditunjukkan pada gambar berikut:
B. Landasan Teori
1. Convolutional Neural Network (CNN)
CNN adalah sebuah jaringan saraf buatan, dengan sebuah algoritma yang
digunakan untuk mengenali pola dalam data. Jaringan saraf secara umum
terdiri dari kumpulan saraf yang tersusun dalam lapisan lapisan, dengan
bobot dan bias tiap saraf tersebut yang dapat belajar[11]. Berikut adalah blok
bangunan dasar CNN beserta uraiannya:
a. Tensor : dapat diartikan sebuah matriks dimensi-n.
b. Neuron : dapat diartikan sebagai sebuah fungsi yang mengambil
beberapa input dan menghasilkan sebuah keluaran.
c. Layer : secara sederhana merupakan kumpulan neuron dengan
operasi yang sama dan hyperparameter yang sama
d. Bobot dan bias Kernel : setiap neuron memiliki bobot dan bias kernel
yang berbeda-beda, disesuaikan selama fase latihan (training), dan
memungkinkan classifier untuk beradaptasi dengan masalah dan
dataset yang disediakan.
e. CNN menyampaikan fungsi skor yang dapat dibedakan, yang
direpresentasikan sebagai skor kelas dalam visualisasi pada lapisan
keluaran.
CNN menggunakan lapisan khusus, yang dinamai lapisan konvolusi, yang
membuat CNN berada pada posisi yang baik untuk belajar dari gambar dan
data seperti gambar. Mengenai data gambar, CNN dapat digunakan untuk
banyak tugas computer vision, seperti image processing, classification,
segmentation, dan object detection.
Berikut adalah penjelasan mengenai lapisan-lapisan yang terdapat dalan CNN
a. Input Layer (Lapisan masukan)
7
Input Layer mewakili gambar masukan ke CNN. Jika gambar RGB
digunakan sebagai masukan, Input Layer memiliki tiga saluran,
masing masing sesuai dengan saluran merah, hijau, dan biru.
b. Convolutional Layers (Lapisan-lapisan Konvolusi)
Convolutional Layers adalah dasar dari CNN, karena mengandung
kernel (bobot) hasil latihan/belajar, yang mengekstrak fitur yang
membedakan gambar satu sama lain. Saat berinteraksi dengan lapisan
konvolusi, kita akan melihat hubungan antara lapisan sebelumnya
dan lapisan konvolusi. Setiap tautan memiliki kernel yang unik untuk
operasi konvolusi untuk menghasilkan keluaran atau peta aktivasi
neuron konvolusi. Neuron konvolusi melakukan perkalian dot elemen
dengan kernel unik dan output dari neuron yang sesuai pada lapisan
sebelumnya. Ini akan menghasilkan hasil antara sebanyak kernel
unik. Neuron konvolusi adalah hasil dari semua hasil antara yang
dijumlahkan bersama dengan bias yang dipelajari.
c. Activation Functions
● ReLU (Rectified Linear Unit)
Sebagian alasan mengapa CNN dapat mencapai akurasi yang
tinggi adalah karena non-;inearitasnya[11]. ReLU
menereapkan non-linearitas yang sangat dibutuhkan ke
dalam model. Non-linearitas diperlukan untuk menghasilkan
batas-batas keputusan non-linier, sehingga output tidak dapat
ditulis sebagai kombinasi linier dari input. Jika fungsi
aktivasi non-linear tidak ada, arsitektur CNN yang dalam
akan berkembang menjadi lapisan konvolusi yang setara,
yang tidak akan bekerja dengan baik. Fungsi aktivasi ReLU
secara khusus digunakan sebagai fungsi aktivasi non-linear,
berbeda dengan fungsi non-linear lainnyaa seperti sigmoid
karena telah diamati secara empiris bahwa CNN yang
menggunakan ReLU lebih cepat dilatih daripada fungsi
non-linear lainnya.
Fungsi aktivasi ReLU adalah operasi matematika berikut:
8
dari 0. Fungsi ReLU dilakukan setelah setiap lapisan
konvolusi.
● Softmax
d. Pooling layers
Ada banyak jenis lapisan pooling dalam arsitektur CNN yang
berbeda, tetapi semuanya memiliki tujuan untuk secara bertahap
mengurangi tingkat spasial jaringan, yang mengurangi parameter dan
perhitungan keseluruhan jaringan. Salah satu lapisan pooling yang
digunakan pada Inception-ResNet v2 adalah Max-Pooling. Operasi
Max-Pooling membutuhkan pemilihan ukuran kernel dan panjang
langkah (stride) selama desain arsitektur. Setelah dipilih, operasi
menggeser kernel dengan langkah yang ditentukan di atas input
sementara hanya memilih nilai terbesar pada setiap irisan kernel dari
input untuk menghasilkan nilai output.
e. Flatten Layer
Lapisan ini mengubah lapisan tiga dimensi dalam jaringan menjadi
vektor satu dimensi agar sesuai dengan input lapisan yang terhubung
penuh untuk klasifikasi. Misalnya, tensor 5x5x2 akan diubah menjadi
vektor berukuran 50. Lapisan konvolusi jaringan sebelumnya
mengekstrak fitur dari gambar input, tetapi sekarang saatnya untuk
mengklasifikasikan fitur. Fungsi softmax digunakan untuk
mengklasifikasikan fitur-fitur ini, yang membutuhkan input satu
dimensi. Inilah alasan mengapa lapisan flatten diperlukan.
9
Berikut adalah beberapa Hyperparameter yang digunakan dalam CNN
● Padding
Padding sering diperlukan ketika kernel melampaui peta aktivasi.
Padding menghemat data di batas peta aktivasi, yang menghasilkan
kinerja yang lebih baik, dan dapat membantu menjaga ukuran spasial
input, yang memungkinkan perancang arsitektur untuk membangun
jaringan yang lebih baik dan berkinerja lebih tinggi. Ada banyak
teknik padding, tetapi pendekatan paling umum adalah zero-padding
karena kinerjanya, kesederhanaannya, dan efisiensi komputasinya.
Teknik ini melibatkan penambahan nol secara simetris di sekitar tepi
input. Pendekatan ini diadopsi oleh banyak CNN berkinerja tinggi
seperti AlexNet.
● Ukuran kernel
Ukuran ini mengacu pada dimensi jendela geser di atas input.
Memilih hyperparameter ini memiliki dampak besar pada proses
klasifikasi gambar. Misalnya, ukuran kernel yang kecil mampu
mengekstraksi informasi dalam jumlah yang jauh lebih besar yang
berisi fitur-fitur lokal dari input. Ukuran kernel yang lebih kecil juga
menyebabkan pengurangan lapisan yang lebih kecil, yang
memungkinkan arsitektur yang lebih dalam. Sebaliknya, ukuran
kernel yang besar mengekstrak lebih sedikit informasi, yang
mengarah pada pengurangan dimensi lapisan yang lebih cepat, yang
seringkali mengarah pada kinerja yang lebih buruk. Kernel besar
lebih cocok untuk mengekstrak fitur yang lebih besar. Pada akhirnya,
pemilihan ukuran kernel yang sesuai akan tergantung pada tugas dan
kumpulan data yang dimiliki, tetapi umumnya, ukuran kernel yang
lebih kecil menghasilkan kinerja yang lebih baik untuk tugas
klasifikasi gambar karena perancang arsitektur mampu menumpuk
lebih banyak lapisan bersama-sama untuk pelajari lebih banyak fitur
yang lebih kompleks.
● Stride
Stride menunjukkan berapa banyak piksel kernel yang harus digeser
pada suatu waktu. Dampak stride pada CNN mirip dengan ukuran
kernel. Saat stride berkurang, lebih banyak fitur dipelajari karena
lebih banyak data diekstraksi, yang juga mengarah ke lapisan
keluaran yang lebih besar. Sebaliknya, ketika stride meningkat, ini
mengarah pada ekstraksi fitur yang lebih terbatas dan dimensi lapisan
keluaran yang lebih kecil.
2. Inception-ResNetV2
ResNet dan Inception adalah pusat kemajuan terbesar dalam performa image
recognition dalam beberapa tahun terakhir, dengan performa yang bagus dan
relatif memiliki biaya komputasi yang rendah[12]. Inception-ResNetV2
adalah arsitektur CNN yang dibangun berdasarkan kombinasi arsitektur
Inception dan koneksi residual. Kegunaan koneksi residual tidak hanya
10
menghindari masalah degradasi yang disebabkan oleh struktur yang dalam
(deep) tetapi juga mengurangi waktu pelatihan[12]. Berikut adalah gambar
yang menunjukkan arsitektur jaringan dasar Inception-ResNetV2
● Scaling of Residuals
Jika jumlah filter melebihi
1000, varian residual mulai
menunjukkan ketidakstabilan
dan jaringan akan “mati” di
awal training. Lapisan terakhir
sebelum average pooling mulai
hanya menghasilkan nol setelah
beberapa puluh ribu iterasi. Ini
tidak dapat dicegah, baik
dengan menurunkan learning
rate maupun menambahkan
11
batch normalization ke lapisan/layer ini.
Melakukan Scaling down residu sebelum menambahkannya ke layer
activation akan menstabilkan training. Untuk menskalakan residu,
faktor penskalaan dipilih antara 0.1 dan 0.3
Notasi :
3x3 Conv : Filter Konvolusi
dengan ukuran kernel 3x3
12
2. Inception-ResNet A
3. Reduction A
13
4. Inception-ResNet B
Skema ini untuk 17x17 grid
Inception-ResNet B module.
Setelah melewati blok
Reduction A, kemudian
melewati blok
Inception-ResNet B
sebanyak 10 kali iterasi.
Keluaran dari blok ini
berukuran 17x17x896
5. Reduction-B
6. Inception-ResNet C
Skema ini untuk 8x8 grid Inception-ResNet B module. Setelah
melewati blok Reduction B, kemudian melewati blok
Inception-ResNet C sebanyak 5 kali iterasi. Keluaran dari blok ini
berukuran 8x8x1792
14
Arsitektur secara keseluruhan dapat dilihat pada aliran blok berikut:
III. METODOLOGI
● Alat dan Bahan
Pada tugas ini, alat yang digunakan adalah Laptop dan Internet.
Platform yang digunakan adalah Google Colab dengan Python sebagai bahasa
pemrograman utama. Untuk membangun arsitektur Deep Learning, digunakan
TensorFlow (Open-sourced end-to-end platform, sebuah library untuk tugas machine
learning) serta Keras (High-level API untuk membangun dan melatih model deep
learning).
15
2. Setelah dataset diperoleh, kemudian dataset dipilah ke dalam beberapa folder
yaitu folder Training, Validation, dan Test. Di dalamnya juga dibuat dua
folder bernama Covid (berisi CT scan positif Covid) dan Normal (Berisi CT
scan paru normal). Pada data set sudah diberikan label pada nama file
sehingga pemilahan dapat dilakukan dengan mudah. Tipe dataset yang
digunakan adalah TIFF dengan ukuran 512x512 (ukuran CT scan)
9. Setelah itu, dilakukan Evaluasi pada data uji (Test Data) untuk melihat
kemampuan klasifikasi model pada data yang belum pernah dilihat
sebelumnya. Model Deep Learning yang baik adalah model yang
menunjukkan akurasi yang tinggi baik pada saat Training, Validationing dan
Testing. Evaluasi dilakukan dengan menggunakan parameter accuracy.
10. Setelah dilakukan evaluasi, kemudian model disimpan dalam bentuk file .h5
yang berisi bobot-bobot model hasil training, yang kemudian siap digunakan
dalam implementasi diagnosa otomatis Covid-19 berdasarkan CT scan.
16
11. Program dan output yang diperoleh dalam tugas ini dapat diakses melalui link
berikut: https://github.com/afnersirait/Tugas-Teknik-Neurofuzi
Epoch 2/2
training - loss: 0.8333
training accuracy: 0.8146
validation_loss: 0.4695
validation_accuracy: 0.8814
Akurasi yang diperoleh saat melakukan evaluasi pada data set testing adalah sebagai
berikut:
Accuracy: 0.8590
Berikut adalah kurva dari loss dan accuracy saat training dan validation:
17
● Analisis
Berdasarkan hasil yang diperoleh, dapat dilihat bahwa akurasi saat melakukan
training, validation dan testing sama sama menunjukkan angka yang relatif tinggi
yaitu di atas 85%, dengan nilai loss di bawah 0.5. Hal ini menunjukkan bahwa
model yang telah dibangun memiliki akurasi yang baik dalam melakukan
klasifikasi dan image recognition untuk menentukan CT scan mana yang
menunjukkan kondisi postif Covid 19 atau tidak.
Berdasarkan kurva loss dan akurasi, dapat dilihat dalam kondisi Epoch=2, tidak
terjadi overfitting pada model. Hal ini ditunjukkan oleh grafik loss yang sama
sama rendah pada training dan validation. Selain itu juga kurva akurasi
menunjukkan peningkatan baik pada saat training dan validation.
Dengan kondisi ini, maka dapat dikatakan bahwa model termasuk layak untuk
digunakan dalam melakukan deteksi Covid 19 melalui CT scan.
V. KESIMPULAN
1. Diagnosa COVID-19 melalui CT-Scan Paru dapat dilakukan dengan lebih efisien
menerapkan Deep Learning, khususnya CNN: Inception-ResNetV2
2. Inception-ResNet-v2 merupakan versi Inception hybrid yang dikombinasikan dengan
model ResNet dengan kinerja recognition yang ditingkatkan secara signifikan.
3. Secara keseluruhan Performa Inception-ResNetV2 lebih baik jika dibandingkan
dengan Inception-ResnetV1, InceptionV4, dan InceptionV3 yang merupakan saingan
terberatnya.
4. Inception-Res-Net V2 mampu memberikan nilai Akurasi yang tinggi walaupun pada
Epoch yang rendah, dan model yang sudah dilatih tidak menunjukkan Overfitting
walaupun kedalaman arsitektur deep learning ini relatif cukup dalam
5. Ukuran batch size, serta augmentasi data, dan preprocessing sangat berpengaruh
dalam menghasilkan model yang baik dalam sisi akurasi dan agar tidak overfitting.
Batch size yang dipilih tidak boleh terlalu tinggi agar biaya komputasi dan durasi
training tidak terlalu besar.
6. Analisa performa model Deeplearning dapat diamati melalui kurva loss dan akurasi.
Model yang baik ketika kurva loss training dan validasi sama sama turun dan kurva
18
akurasi training dan validasi sama sama naik. Ini menunjukkan model mempelajari
data dengan baik dan dapat mengeneralisasi sehingga tidak overfitting dan mampu
mengklasifikasi data yang belum pernah diolah sebelumnya
[2] World Health Organization. “Pneumonia of unknown caus: China.” 5 January 2020,
https://www.who.int/csr/don/05-january-2020-pneumonia-of-unkown-cause-china/en/.
Accessed 18 October 2021.
[4] DetikHealth. “Ahli Sebut CT Scan Lebih Akurat Deteksi Virus Corona Dibanding Tes
Swab Baca artikel detikHealth, "Ahli Sebut CT Scan Lebih Akurat Deteksi Virus Corona
Dibanding Tes Swab" selengkapnya
https://health.detik.com/berita-detikhealth/d-4981665/ahli-sebut-ct-sc.” 18 April 2020,
https://health.detik.com/berita-detikhealth/d-4981665/ahli-sebut-ct-scan-lebih-akurat-dete
ksi-virus-corona-dibanding-tes-swab. Accessed 18 October 2021.
[7] Kwee, Thomas G., and Robert M. Kwee. “Chest CT in COVID-19: What the
Radiologist Needs to Know.” vol. 70, 2020.
[8] Szegedy, Christian, et al. “Inception-v4, Inception-ResNet and the Impact of Residual
Connections on Learning.” 2016.
[9] He, Kaiming, et al. “Deep Residual Learning for Image Recognition.” 2016.
[10] Szegedy, Christian, et al. “Rethinking the inception architecture for computer
vision.” 2015.
19
https://medium.com/@zahraelhamraoui1997/inceptionresnetv2-simple-introduction-9a20
00edcdb6. Accessed 18 October 2021.
20