Anda di halaman 1dari 9

PENDAHULUAN

Organisasi Kesehatan Dunia memperkirakan bahwa 422 juta orang menderita Diabetes.
Jumlah Diabetes pasien meningkat secara signifikan dari tahun ke tahun. Jumlah tersebut
diperkirakan akan meningkat menjadi 522 juta pada tahun 2034, seperti yang diperkirakan oleh
International Diabetes Federation (IDF). Diabetic Retinopathy (DR), dikenal sebagai mata
diabetik penyakit karena itu terjadi pada retina karena Diabetes. DR adalah salah satu penyebab
utama kebutaan yang dapat dicegah di Dunia. DR merupakan salah satu komplikasi Diabetes
pada pembuluh retina.

Stadium DR ringan, sedang, parah, dan Retinopati Diabetik Proliferatif (PDR). Setiap
tingkat keparahan DR telah masuk, seperti microanarysm, cotton wool spot, eksudat, eksudat
keras, dan neovaskularisasi. DR adalah penyakit yang parah, sehingga pengobatan yang sesuai
untuk pasien sangat penting dilakukan untuk mencegah kebutaan. Dalam pemeriksaan retina
dengan metode konvensional untuk mendeteksi DR, diperlukan keahlian profesional, biaya
tinggi dan memakan waktu untuk melakukan tingkat keparahan DR. Dokter harus melihat satu
per satu untuk memastikan kondisinya pasien dan retina mereka untuk memberikan pengobatan
yang sesuai untuk pasien. Dari sudut pandang kesehatan, itu lebih efektif bila DR terdeteksi dini.
Perkembangan teknologi terkini dalam big data telah memungkinkan penggunaan artificial
intelligence (AI), Machine Learning (ML), dan Deep Learning (DL) untuk kesehatan. Banyak
pendekatan berdasarkan ML telah diterapkan untuk deteksi dan klasifikasi DR dalam tingkat
keparahan melalui gambar fundus.

Gambar fundus digunakan untuk fitur ekstraksi. Penerapan ML menggunakan Histogram


Of Oriented Gradients dan Shallow learning untuk mengklasifikasikan DR ke dalam Kelas
Ringan dan Normal mencapai akurasi 85%. Salah satu metode yang digunakan dalam DL dapat
meningkatkan kinerja pendeteksian objek dan objek visual pengakuan. DL adalah subset dari
ML yang menggunakan banyak lapisan yang berisi unit pemrosesan non-linear. DL aplikasi
menggunakan deteksi objek dari fitur gambar, seperti fitur lesi pada gambar fundus, untuk
mendeteksi DR.

Convolutional Neural Network (CNN) adalah salah satu model DL yang memiliki
convolutional, pooling, dan full lapisan yang terhubung. Lapisan konvolusional mengekstraksi
fitur gambar, yang hasilnya masuk ke lapisan penyatuan, dimana jumlah ekstraksi fitur dihitung.
Lapisan yang terhubung sepenuhnya diklasifikasikan sebagai algoritma DL. Peneliti terbaru
menggunakan CNN untuk deteksi dan klasifikasi DR.

Artikel Penelitian Deteksi dan Klasifikasi Diabetic Retinopathy Menggunakan


GoogleNet dan Mekanisme Attention Melalui Gambar Fundus CNN telah banyak digunakan
untuk klasifikasi citra. Salah satu aplikasi utama CNN adalah di bidang medis gambar-gambar.
Baru-baru ini, menggunakan CNN untuk mendeteksi dan mengklasifikasikan DR melalui
gambar fundus menggunakan Googlenet dan tercapai kinerja 88% untuk mendeteksi normal dan
DR. Teknik berbasis CNN lain yang baru-baru ini diusulkan untuk DR klasifikasi dikembangkan
oleh, dua algoritma yang terlibat. Ada Googlenet dan transfer pembelajaran. Ini Eksperimen
membagi DR menjadi tiga tingkatan seperti Tanpa DR, ringan dan Parah menggunakan
Googlenet dan mentransfer pembelajaran mencapai sensitivitas 95% dan spesifisitas 96%.
Demikian pula, menggunakan dataset CNN dan membaginya menjadi lima DR tingkat
keparahan seperti normal, ringan, sedang, berat, dan PDR. Eksperimen menunjukkan kinerja
yang baik hingga 93% ketidaktepatan. Mereka merancang arsitektur berbasis CNN yang
melakukan tugas terkait klasifikasi rambu lalu lintas dengan tingkat pengakuan yang baik.

Salah satu algoritme yang membantu CNN untuk akurasi yang lebih baik dalam
mengklasifikasikan gambar adalah mekanisme perhatian (SAYA). AM adalah sebuah algoritma,
yang berisi tiga langkah implementasi, seperti global, lokal, dan fusi cabang. AM berfokus pada
area patologis setelah gambar fundus dibagi menjadi normal dan DR dan menjadi empat
tingkatan seperti ringan, sedang, berat, dan PDR.

Dalam penelitian ini, kami mengusulkan AM dan CNN sebagai metode untuk mendeteksi
dan mengklasifikasikan DR menggunakan fundus gambar-gambar. Kami menggunakan
Googlenet sebagai arsitektur CNN karena Googlenet memiliki arsitektur yang dalam. Kami
menggunakan AM karena dapat fokus pada area patologis, dan Googlenet digunakan untuk
mengklasifikasikan DR ke dalam NPDR normal dan ringan, NPDR sedang, NPDR berat, dan
PDR. Penelitian ini juga menggunakan arsitektur Googlenet tanpa perhatian mekanisme untuk
mendeteksi dan mengklasifikasikan DR menggunakan gambar fundus. Kami membandingkan
hasil antara Googlenet dengan dan tanpa mekanisme perhatian
Bahan dan Metode

Pada bagian ini, kami membahas metode Googlenet dan Mekanisme Perhatian yang
diusulkan. Model kami, Googlenet dan Googlenet dengan mekanisme perhatian melatih 250
gambar fundus dari kumpulan data Kaggle untuk mengklasifikasikan normal, ringan, sedang,
berat, dan PDR. Sebelum melatih data, kami melakukan image preprocessing saat gambar diubah
ukurannya paskan gambar input Googlenet dan potong gambar. Dengan proses ini, kita
mengetahui bobot dari setiap masukan. Kemudian, kami melatih data menggunakan arsitektur
Googlenet dan arsitektur Googlenet dengan mekanisme perhatian untuk diketahui hasil
klasifikasi. Nol menunjukkan gambar fundus normal, 1 menunjukkan gambar fundus ringan, 2
menunjukkan gambar fundus sedang, 3 menunjukkan gambar fundus parah, dan 4 menunjukkan
gambar fundus PDR. Yang diusulkan metode dalam penelitian ini menggunakan beberapa
langkah. Langkah pertama adalah melakukan praproses data, termasuk pemangkasan dan
pengubahan ukuran data menjadi ukuran yang pas. Kami menggunakan model CNN, seperti
Googlenet dan algoritma mekanisme perhatian, untuk pelatihan data. Googlenet memiliki kinerja
yang lebih cepat untuk melatih data, dan algoritme mekanisme perhatian membantu Googlenet t
untuk mengklasifikasikan data detail.

Kami menggunakan gambar fundus yang mengandung normal, ringan, sedang, berat, dan
PDR untuk data pelatihan. Kami memperoleh a database dari dataset Kaggle, yang terdiri dari
250 gambar yang kami gunakan untuk melatih model. Setiap tingkat keparahan DR memiliki 50
dataset gambar fundus. Kami membuat model untuk mengklasifikasikan DR menjadi lima level,
normal, ringan, sedang, berat, dan PDR. Normal atau Tanpa DR berarti mata sehat dan tidak
ada gejala DR; ringan berarti ada mikroaneurisma; sedang berarti jumlah
mikroaneurisma dan perdarahan lebih sedikit dari 20 di setiap kuadran serta adanya
eksudat keras; parah berarti bahwa jumlah mikroaneurisma dan perdarahan lebih dari 20
di lebih dari dua kuadran serta eksudat dan lesi merah; PDR berarti neovaskularisasi,
pembentukan pembuluh darah yang tidak normal, telah berkembang, seperti yang terlihat
pada gambar fundus.

Dalam beberapa tahun terakhir, pengembangan AI terapan untuk perawatan kesehatan


menjadi tantangan bagi para peneliti. Googlenet digunakan untuk mengklasifikasikan gambar
untuk deteksi penyakit. Dalam penelitian ini, kami menggunakan arsitektur dan perhatian
Googlenet algoritma mekanisme untuk mengklasifikasikan gambar fundus ke dalam kelas DR
berdasarkan gejala yang ditampilkan. Langkah kita percobaan ditunjukkan pada Gambar.1

Kami mengatur gambar menjadi ukuran yang pas dengan mengubah ukuran setiap
gambar fundus. Setiap gambar fundus diproses terlebih dahulu, dan data dibagi menjadi 80%
untuk data latih dan 20% untuk data uji. Kami menggunakan arsitektur Googlenet dan arsitektur
Googlenet dengan algoritme mekanisme perhatian untuk melatih dan menguji data. Keluaran
dari penelitian ini adalah klasifikasi DR menjadi normal, ringan, sedang, berat, dan PDR.

a. Dataset dan Preprocessing

Kami memperoleh dataset dari Kaggle Dataset, yang memiliki banyak dataset
gambar fundus dengan resolusi tinggi (https://www.kaggle.com). Selain itu, gambar
Fundus dari Kaggle diindeks oleh ahli patologi. Fundus gambar ditunjukkan pada Gbr.2

Kami menyediakan gambar Fundus data keseimbangan (normal, NPDR ringan,


sedang, berat, dan kriteria PDR ditampilkan pada Gambar.2). Jumlah setiap dataset
pengukuran adalah 50 citra fundus. Kami memiliki 250 gambar fundus dari dataset, dan
data dibagi menjadi 80% untuk data pelatihan dan 20% untuk data validasi.
Preprocessing data penting untuk dilakukan. Dalam penelitian, kami mengubah ukuran
gambar agar sesuai dengan ukuran input Googlenet 224x224x3 dan gambar yang
dipotong. Data preprocessing ditunjukkan pada Gambar.3

b. GoogleNet Googlenet
Mendapatkan popularitas dari berbagai komunitas riset dan diterapkan untuk
berbagai aplikasi. GoogLeNet dilatih di ImageNet dengan jutaan gambar beresolusi
tinggi untuk mengklasifikasikannya ke dalam 1000 kelas berbeda seperti keyboard,
mouse, dan banyak spesies hewan dengan tingkat kesalahan yang sangat rendah dengan
menyetel hampir tujuh juta parameter yang melakukan 1,5 miliar operasi . Arsitektur
awal struktur Googlenet menggunakan beberapa cabang pengklasifikasi menengah di
tengah arsitektur. Cabang-cabang ini hanya digunakan selama pelatihan model. Cabang-
cabang ini terdiri dari layer penyatuan rata-rata 5×5 dengan langkah 3, kemudian
konvolusi 1×1 dengan 128 filter, dua layer yang terhubung penuh dengan 1024 output
dan 1000 output, dan layer klasifikasi softmax. Loss yang dihasilkan dari layer-layer
tersebut ditambah dengan total loss dengan bobot 0,3. Lapisan-lapisan ini membantu
dalam memerangi masalah hilangnya gradien dan juga menyediakan regularisasi.
GoogleNet menggunakan CNN sedalam 22 lapis dalam kompetisi ILSVRC 2014, yang
lebih kecil dan lebih cepat daripada VggNet, dan lebih kecil dan lebih presisi daripada
AlexNet pada gambar ILSVRC asli. Itu dirancang untuk menjaga efisiensi komputasi
dalam proses. Itu dapat bekerja dalam sumber daya komputasi yang rendah. Untuk tugas
klasifikasi 5 teratas, tingkat kesalahannya adalah 5,5%. Struktur jaringan lebih kompleks
daripada VggNet, menambahkan lapisan 'Inception' ke struktur jaringan. Setiap lapisan
'Inception' berisi enam operasi convolutional dan satu pooling, yang mengurangi
ketebalan gambar fitur fusi. Arsitektur Googlenet ditunjukkan pada Gambar 4.
Kami menggunakan filter paralel untuk operasi pada data input dari lapisan
sebelumnya, dan banyak ukuran gambar bidang reseptif untuk konvolusi, masing-masing,
1x1, 3x3,5x5, dan operasi penyatuan adalah 3x3. Arsitektur ini memiliki dua lapisan
pengklasifikasi tambahan yang terhubung ke output lapisan awal dan awal. GoogleNet
memperoleh ukuran gambar 224x224 dengan saluran warna RGB format data gambar
adalah Tiff. Semua konvolusi di dalam arsitektur menggunakan Rectified Linear Units
(ReLU) sebagai fungsi aktivasi. ReLu mendapatkan piksel dari kumpulan data gambar,
dan jika piksel memiliki nilai positif, nilainya disimpan, dan jika nilainya negatif, maka
akan dikonversi menjadi nol.
c. GoogleNet dan Mekanisme Perhatian
Setelah preprocessing data, gambar fundus di output pertama melalui konvolusi
dan max pooling. Fungsi dari proses ini adalah untuk mengekstrak data dan menentukan
citra fundus normal dan DR. Setelah itu, bagian dari connate digunakan untuk
menghubungkan hasil output pertama dan memasukkan gambar ke dalam proses kedua,
seperti arsitektur Googlenet tanpa lapisan yang terhubung sepenuhnya, dan pada proses
akhir, kami menambahkan dekonvolusi agar sesuai dengan ukuran untuk proses
selanjutnya. Pada proses terakhir, kami menggunakan konsentrat lagi untuk
menghubungkan proses kedua ke proses terakhir. Proses terakhir menggunakan arsitektur
Googlenet, dan kami memperoleh klasifikasi multiclass.
Masukan gambar untuk model ini adalah 224x224x3. Input pertama digunakan
untuk membagi citra fundus menjadi dua output. Ada yang normal atau No DR dan DR.
Setelah memprediksi peta perhatian pada input kedua. Kami merancang area patologis
yang berisi gambar masukan dan keluaran proses pertama. Setelah itu, klasifikasi berasal
dari keluaran kedua dan digabungkan dengan citra masukan. Mekanisme Perhatian terdiri
dari tiga titik, cabang global, cabang lokal, dan cabang fusi. Pertama, kita harus mengatur
label untuk setiap gambar. Diberi label pada setiap gambar menjadi vektor untuk 1 2
[ , ,... ] L l l l  c dimana {0,1} c l  dan c l mewakili area patologis. Cabang global
dilambangkan dengan,
Mekanisme perhatian pada arsitektur Googlenet dibagi menjadi tiga bagian proses
pembelajaran. Pada bagian pertama, hasil proses pembelajaran berupa data yang
digunakan sebagai data input untuk proses kedua dan digunakan untuk mengetahui luas
DR dan luas normal. Pada proses kedua, kami mengklasifikasikan area DR menjadi
beberapa level. Semua level DR menjadi output pada proses terakhir menggunakan
softmax. Identifikasi sponsor yang berlaku di sini. Jika tidak ada sponsor, hapus kotak
teks ini (sponsor).

Hasil

Hasil Dalam penelitian ini, kami menggunakan bahasa pemrograman Google Collaboratory dan
Python bersama dengan library Pytorch untuk mensimulasikan model dengan 250 gambar fundus
yang diperoleh dari dataset Kaggle.

 Googlenet

Hasil arsitektur Googlenet yang kami bangun dalam penelitian ini ditunjukkan
pada Tabel I.

Ukuran input di googlenet adalah 224x224x3. Total layer yang kami gunakan
adalah 22 layer yang berisi Convolution, Max Pooling, Inception, Average Pooling layer,
Drop Out, dan softmax. Secara keseluruhan model googlenet sama dengan arsitektur
yang dikembangkan titik perbedaannya adalah softmax. Kami menggunakan lima output
dalam softmax yang menunjukkan tentang mengklasifikasikan gambar fundus ke dalam
lima tingkat keparahan seperti normal, ringan, sedang, berat, dan PDR. Proses running
time menggunakan Googlenet membutuhkan waktu 30 menit dengan learning rate 0,001.
 Googlenet dan Mekanisme
Perhatian Kelas normal menunjukkan tidak ada penyakit, dan kelas DR
menunjukkan mata yang terinfeksi atau sakit. Model ini dilatih sebelumnya pada 250 set
data hingga mencapai tingkat yang signifikan. Deteksi dan Klasifikasi Diabetic
Retinopathy Menggunakan GoogleNet dan Mekanisme Perhatian Melalui Gambar
Fundus 595 Input gambar untuk Googlenet dan model mekanisme perhatian adalah
224x224x3. Kami membagi model menjadi tiga bagian. Bagian pertama terdiri dari
lapisan konvolusi dan normalisasi batch. Proses ini digunakan untuk membagi citra
fundus menjadi dua keluaran. Ada yang normal atau No DR dan DR. Pada input kedua,
kami merancang model untuk fokus pada area patologis. Bagian ini berisi gambar
masukan dan keluaran proses pertama. Proses ini berisi convolutional layer, batch
normalization, dan deconvolutional layer. Proses ini membagi DR menjadi empat
tingkatan yaitu ringan, sedang, berat, dan PDR.
Proses terakhir dalam model adalah klasifikasi. Input berasal dari output kedua
dan Gabungkan dengan gambar input. Proses ini berisi beberapa lapisan seperti
convolutional layer, max pooling, inceptions, average max pooling, drop out dan softmax
pada akhirnya. Keluaran dari proses ini adalah klasifikasi DR menjadi lima tingkatan
yaitu normal, ringan, sedang, berat, dan PDR. Fungsi Concatenate menghubungkan setiap
proses dalam model. Fungsi gabungan adalah salah satu bagian yang menantang dari
model. Kita harus mengatur masukan gambar pertama dan keluaran gambar pertama
sesuai dengan masukan gambar kedua untuk kinerja yang baik pada model ini. Sorotan
dari Concatenate diperhatikan dalam bobot setiap gambar masukan dan keluaran.
Perbedaan bobot citra input dan output akan membuat model mengalami error.
Ukuran masukan gambar fundus sama antara arsitektur Googlenet dan Googlenet
dengan mekanisme perhatian. Googlenet dengan mekanisme perhatian menunjukkan
akurasi yang lebih baik daripada arsitektur Googlenet. Perbedaan akurasi kedua model
adalah 12%, dengan 85% pada arsitektur Googlenet dan 97% pada Googlenet dengan
mekanisme perhatian. Googlenet dengan mekanisme perhatian lebih cepat dari Googlenet
dalam hal runtime. Untuk pelatihan zaman, kedua model memiliki 20 zaman. Setiap
model diulang lima kali.
Pembahasan

Penelitian ini membandingkan model untuk mendeteksi dan mengklasifikasikan DR melalui


gambar fundus. Hasil penelitian ini menunjukkan bahwa Googlenet dan Mekanisme Perhatian
memiliki kinerja yang lebih baik daripada Googlener saja. Runtime Googlenet adalah 40 menit,
yang merupakan waktu pengembangan sepuluh kali lebih lama dari Googlenet dan Mekanisme
Perhatian (30 menit). Namun, Googlenet dan Mekanisme Perhatian menunjukkan akurasi yang
lebih baik (≥12%) daripada model Googlenet. Hasil penelitian ini setuju dengan hasil penelitian
sebelumnya [30-32] yang melaporkan bahwa kinerja CNN dan Mekanisme Perhatian lebih baik
daripada metode CNN (misalnya, AlexNet dan ResNet) untuk mendeteksi dan
mengklasifikasikan DR berdasarkan gambar fundus. Hasil penelitian ini menyiratkan bahwa
Mekanisme Perhatian untuk mengetahui area patologis efektif dalam membantu CNN
mengklasifikasikan DR menjadi lima tingkatan.

Kesimpulan

Retinopati Diabetik merupakan salah satu komplikasi Diabetes dan menyebabkan


kebutaan karena kerusakan pada retina. Deteksi otomatis dan klasifikasi tingkat DR memiliki
peran penting. Deteksi dini memungkinkan perawatan yang sesuai untuk pasien, yang sangat
penting karena deteksi dini dapat secara efektif mencegah kebutaan visual. Klasifikasi otomatis
gambar fundus DR dapat secara efektif membantu dokter dalam diagnosis DR, yang dapat
meningkatkan efisiensi diagnostik. Pada penelitian ini, aplikasi CNN untuk mendeteksi DR
dengan Attention Mechanism disajikan untuk mendeteksi dan mengklasifikasikan DR melalui
citra fundus. Pada saat yang sama, preprocessing data dapat mengurangi kekurangan gambar
fundus seperti gambar tidak proporsional. Selain itu konsentrat memiliki peran penting dari
model ini. Klasifikasi model eksperimental terbaik mencapai kinerja yang sangat baik hingga
akurasi 97%, dan hasil kami akurasi yang lebih baik pada klasifikasi citra DR menggunakan
mekanisme perhatian daripada tanpa mekanisme perhatian.

Ke depan, kami memiliki rencana untuk mengklasifikasikan DR menjadi lima kelas


seperti setiap level pada DR dapat mendeteksi dengan benar dan CNN dilatih untuk fokus tidak
hanya mendeteksi gambar fundus normal dan DR tetapi juga mengklasifikasikan level DR dari
ringan, sedang, berat, dan PDR. Selain itu, kami berencana untuk mendapatkan dataset dari
setting skrining nyata di Indonesia, seperti rumah sakit di Indonesia yang berspesialisasi dalam
perawatan mata. Pengembangan berkelanjutan untuk menggabungkan CNN dengan algoritme
pendukung lainnya memungkinkan jaringan yang lebih dalam untuk mempelajari data menjadi
lebih baik.

Ucapan Terima Kasih

Kami mengucapkan terima kasih kepada Universitas Indonesia, Fakultas Matematika dan Ilmu
Pengetahuan Alam, yang mendanai penelitian ini melalui hibah PDUPT Nomor: NKB-1

83/UN2.RST/HKP.05.00/2021.

Anda mungkin juga menyukai