Skripsi Rais

SKRIPSI
HALAMAN JUDUL
KLASIFIKASI PARASIT MALARIA DALAM SEL DARAH

MANUSIA MENGGUNAKAN DEEP LEARNING
Diajukan Sebagai Syarat Untuk Menyelesaikan

Pendidikan Program Strata-1 Pada
Program Studi Teknik Informatika
Oleh :
RAIS AMIN
NIM : 20.10.031.802.119
Program Studi Teknik Informatika

Sekolah Tinggi Manajemen Informatika dan Komputer Amik Riau
2023
HALAMAN PENGESAHAN SKRIPSI
i
HALAMAN TANDA LULUS UJIAN SKRIPSI
ii
PENGAKUAN KEASLIAN KARYA
iii
ABSTRAK
Malaria adalah penyakit dalam darah yang disebabkan oleh parasit Plasmodium
yang ditularkan oleh gigitan nyamuk Anopheles betina. Ahli mikroskopis biasanya
memeriksa sel darah untuk mendiagnosis penyakit malaria ini. Namun, akurasi
mereka tergantung pada kualitas alat dan keahlian dalam mengklasifikasikan dan
menghitung sel parasit dan yang tidak terinfeksi. Pemeriksaan semacam itu akan
sangat sulit dalam proses diagnosis skala besar dan menghasilkan kualitas yang
buruk. Beberapa dataset malaria telah dikembangkan, diantaranya adalah dataset yang
dikembangkan oleh LHNVBC yang berisikan 27.558 data gambar sel. Proses
pengolahan data science adalah salah satu proses yang dapat menggambarkan
protokol analitik prediktif yang umum untuk diinterogasikan pada dataset biomedis
dan kesehatan yang besar dan kompleks. Dalam penelitian ini dataset malaria akan di
proses melalui pengolahan data science dengan pembelajaran Deep Learning
menggunakan model Convolutional Neural Network – Long Short-Term Memory
dimana sistem akan melalui pelatihan dan kemudian dapat mengklasifikasi parasit
malaria dalam sel darah manusia. Hasil akurasi menjadi tolak ukur seberapa akurat
pembelajaran yang diterima untuk mengenali data gambar sel yang menjadi input
pada sistem sebanyak 95,6 % dan 96% setelah diuji coba pada data testing.
Kata Kunci : Malaria, Data Science, Deep Learning, Convolutional Neural

Network, Long Short-Term Memory
iv
KATA PENGANTAR
Assalamu’alaikum Wr. Wb.
Puji syukur senantiasa penulis panjatkan atas kehadirat Allah SWT yang telah
melimpahkan karunia, nikmat dan anugerah-Nya sehingga penulis dapat
menyelesaikan penelitian sampai akhir proses penulisan skripsi ini dengan judul
“Klasifikasi Parasit Malaria dalam Sel Darah Manusia menggunakan Deep
Learning”. Tak lupa shalawat serta salam senantiasa dihaturkan kepada junjungan
kita baginda Nabi Muhammad SAW beserta keluarga dan para sahabatnya.
Dalam proses penulisan skripsi ini, tidak terlepas dari bimbingan, bantuan,
dukungan, saran, dan motivasi yang penulis terima dari berbagai pihak. Oleh karena
itu, penulis ingin mengucapkan terima kasih banyak kepada :
1. Bapak Dr. Harris Simaremare, MT., Ketua Yayasan Komputasi Riau
2. Ibu Dr. Lusiana, M.Kom., Ketua STMIK Amik Riau, sekaligus sebagai
penguji dalam sidang komprehensif skripsi penulis.
3. Bapak Rahmaddeni, M.Kom., Wakil Ketua I bidang akademik.
4. Bapak Unang Rio, M.kom., Wakil Ketua II bidang SDM Keuangan dan
Administrasi Umum.
5. Bapak Junadhi, M.kom., Wakil Ketua III bidang kemahasiswaan, sekaligus
sebagai Dosen Pembimbing penulis.
6. Bapak M. Khairul Anam, M.Kom., Ketua Program Studi Teknik Informatika
v
vi
DAFTAR ISI
Halaman
HALAMAN JUDUL ............................................................................................ 1

HALAMAN PENGESAHAN SKRIPSI ............................................................. i
HALAMAN TANDA LULUS UJIAN SKRIPSI ............................................... ii
PENGAKUAN KEASLIAN KARYA ................................................................ ii
ABSTRAK ............................................................................................................ iv
KATA PENGANTAR .......................................................................................... v
DAFTAR ISI ......................................................................................................... vii
DAFTAR TABEL ................................................................................................ ix
DAFTAR GAMBAR ............................................................................................ x
BAB I PENDAHULUAN ..................................................................................... 1

1.1 Latar Belakang .................................................................................. 1
1.2 Rumusan Masalah ............................................................................. 6
1.3 Batasan Masalah................................................................................ 6
1.4 Tujuan Penelitian .............................................................................. 6
1.5 Manfaat Penelitian ............................................................................ 7
1.6 Sistematika Penulisan ....................................................................... 7
BAB II LANDASAN TEORI & TINJAUAN PUSTAKA ................................ 9

2.1 Landasan Teori ............................................................................ 9
2.1.1 Klasifikasi ................................................................................... 9
2.1.2 Malaria ........................................................................................ 10
2.1.3 Sel Darah ..................................................................................... 13
2.1.4 Data Science ................................................................................ 14
2.1.5 Dataset ......................................................................................... 14
2.1.6 Klasifikasi Gambar...................................................................... 15
2.1.7 Artificial Intellegence (AI) .......................................................... 16
2.1.8 Machine Learning ....................................................................... 18
2.1.9 Deep Learning ............................................................................. 20
2.1.10 Jaringan Syaraf Tiruan / Artificial Neural Network (ANN) ....... 21
2.1.11 Data Augmentation/ Data Augmentasi ....................................... 22
2.1.12 Convolutional Neural Network (CNN) ....................................... 23
vii
2.1.13 Long Short-Term Memory .......................................................... 32
2.1.14 Precision dan Recall .................................................................... 37
2.1.15 Epoch........................................................................................... 37
2.1.16 Confusion Matrix ........................................................................ 38
2.1.17 Python ......................................................................................... 39
2.1.18 OSEMN Framework ................................................................... 40
2.2 Tinjuan Pustaka ........................................................................... 41
BAB III METODOLOGI PENELITIAN .......................................................... 46

3.1 OSEMN Framework ......................................................................... 46
3.1.1 Obtain(Pengumpulan data) ......................................................... 46
3.1.2 Scrub(Data Preparation) .............................................................. 47
3.1.3 Explore(Eksplorasi data) ............................................................. 48
3.1.4 Model(Perancangan Model) ........................................................ 48
3.1.5 iNterpreting(Mengintrepretasikan hasil) ..................................... 50
BAB IV HASIL DAN PEMBAHASAN ............................................................. 51

4.1 Obtain (Pengumpulan Data) ............................................................. 51
4.2 Scrub (Preparasi Data) ...................................................................... 52
4.3 Explore (eksplorasi data)................................................................... 53
4.4 Model(Perancangan Model) .............................................................. 55
4.4.1 Convolution Layer....................................................................... 59
4.4.2 Proses Pooling............................................................................. 60
4.4.3 LSTM Layer ................................................................................ 60
4.4.4 Fully Connected Layer ................................................................ 60
4.5 iNterpreting ....................................................................................... 61
BAB V PENUTUP ................................................................................................ 68

5.1 Kesimpulan ....................................................................................... 70
5.2 Saran .................................................................................................. 71
DAFTAR PUSTAKA ........................................................................................... 72
viii
DAFTAR TABEL
No. Tabel Halaman
2.1 Perbandingan ANN, CNN dan RNN 31

2.2. Confusion Matrix 38
2.3 Perbandingan Penelitian sejenis 44
4.1 Sebaran data hasil pembagian dataset 53
4.2 Perbandingan nilai Akurasi dengan literatur sejenis 66
ix
DAFTAR GAMBAR
No. Gambar Halaman
2.1 Diagram Kecerdasan Buatan 17

2.2 Perbandingan Pemrograman Tradisional dengan Machine Learning 18
2.3 Augmentasi dengan perputaran gambar maksimal 90 ° 23
2.4 Contoh Jaringan Convolutional Neural Network (CNN) 25
2.5 Ilustrasi Arsitektur CNN 26
2.6 Feature Map 27
2.7 Plot learning rate terhadap loss 30
2.8 Arstitektur Long Short Term Memory (LSTM) 33
2.9 Struktur sel pada LSTM 33
2.10 Input gate pada LSTM 34
2.11 Operasi pada hasil input gate dan perkalian C’t dan it pada sel LSTM 36
2.12 Output gate pada sel LSTM 36
2.13 Hasil Penelitian Literatur 1 42
2.14 Hasil Penelitian Literatur 4 43
3.1 Alur Penelitian Menggunakan OSEMN Framework 46
3.2 Arsitektur Model CNN-LSTM 49
4.1 Sumber pengumpulan Dataset 51
4.2 Dataset Parasit Malaria 52
4.3 Source code Split Dataset. 53
4.4 Source Code Augmentasi data 55
4.5 Source Code arsitektur jaringan CNN-LSTM 55
4.6 Hasil training model 58
4.7 Source code Uji Akurasi Model 61
4.8 Hasil akurasi training model 62
4.9 Source code uji validasi model 62
4.10 Hasil uji validasi model 62
x
4.11 Hasil uji akurasi pada data testing 63
4.12 Source code visualisasi klasifikasi parasit malaria 67
4.13 Halaman utama visualisasi klasifikasi 67
4.14 Hasil klasifikasi dari upload gambar uninfected 68
4.15 Hasil klasifikasi dari upload gambar infected 69
xi
BAB I
PENDAHULUAN
1.1 Latar Belakang
Penyakit Malaria masih merupakan masalah kesehatan masyarakat yang
menyebabkan kematian terutama pada kelompok resiko tinggi yaitu bayi, anak balita,
ibu hamil, selain itu malaria secara langsung menyebabkan anemia dan dapat
menurunkan produktivitas kerja. Pada tahun 2021, diperkirakan 247 juta kasus
malaria terjadi di seluruh dunia dengan jumlah total kematian 619 ribu jiwa. Sebagian
besar kasus malaria pada tahun 2021 berada di Wilayah Afrika ( 234 juta kasus atau
sekitar 94,7%), diikuti oleh Wilayah Asia Tenggara dengan 2% dari kasus dan
Wilayah Mediterania Timur dengan 2,1% (WHO, 2022).
Penemuan kasus malaria dilakukan berdasarkan gejala klinis, melalui
pemeriksaan sediaan darah yang dilakukan dengan konfirmasi laboratorium
menggunakan mikroskop maupun Rapid Diagnostik Test (RDT). Tingkat akurasi
pemeriksaan sediaan darah sangat tergantung kepada keahlian manusia dan dapat
dipengaruhi oleh variabilitas antar pengamat dan terbatasnya sumber daya daerah
dalam pemeriksaan skala besar pada wilayah dimana malaria endemik. Teknik
alternatif seperti Polymerase Chain Reaction (PCR) dan Rapid Diagnostic Test
(RDT) telah digunakan, namun analisis PCR terbatas dalam kinerjanya dan RDT
kurang efektif dalam hal biaya pada pemeriksaan skala besar di wilayah dimana
malaria endemik (Rajaraman et al., 2018).
1
2
Beberapa dataset malaria telah dikembangkan guna membantu dalam hal
pemeriksaan dan diagnosis penyakit malaria. Penelitian ini meggunakan dataset
(Lhncbc.Nlm.Nih.Gov) yang berisikan repositori sel tersegmentasi dari aktivitas
penelitian Malaria Screener. Dataset ini dikembangkan oleh para peneliti di Lister
Hill National Center for Biomedical Communications (LHNCBC), yang tergabung
dalam bagian National Library of Medicine (NLM). Dataset ini diambil
menggunakan aplikasi seluler yang telah dikembangkan yang berjalan pada
smartphone Android yang terpasang pada mikroskop cahaya konvensional. Sel darah
yang diwarnai cairan Giemsa dari 150 pasien yang terinfeksi parasit dan sel darah dai
50 pasien sehat dikumpulkan dan difoto di Rumah Sakit Chittagong Medical College,
bangladesh. Kamera yang terpasang pada smartphone memperoleh gambar slide
untuk setiap bidang pandang mikroskopis. Gambar-gambar tersebut dianotasikan
secara manual oleh pembaca slide yang ahli di Mahidol-Oxford Tropical Medicine
Research Unit di Bangkok, Thailand. Peneliti NLM menerapkan algoritma berbasis
level-set untuk mendeteksi dan mensegmentasi sel darah merah. Dataset ini dibuat
untuk mengurangi beban para mikroskopis di daerah yang sumber dayanya terbatas
dan juga untuk meningkatkan akurasi diagnostik malaria. Dataset berisi total 27.558
gambar sel dengan jumlah data yang sama pada sel yang terkena parasit (Parasitized)
dan sel yang tidak terinfeksi (Uninfected)
(Https://Lhncbc.Nlm.Nih.Gov/Publication/Pub9932, n.d. ).
Jumlah, kompleksitas, dan kecepatan agregasi biomedis dan data layanan
kesehatan akan meningkat dengan cepat selama beberapa dekade berikutnya.

3
Kemungkinan akan berlipat ganda setiap 1-2 tahun. Ini didorong oleh langkah besar
dalam teknologi digital dan komunikasi, perangkat IoT, dan layanan Cloud, serta
kemajuan algoritmik, komputasi, dan perangkat keras yang cepat. Permintaan publik
yang semakin meningkat untuk deteksi waktu-nyata, interpretasi yang tepat, dan
sistem diagnosis yang dapat diandalkan manusia dalam hal kesehatan dan penyakit
juga mempercepat tren itu. Proses pengolahan data science adalah salah satu proses
yang dapat menggambarkan protokol analitik prediktif yang umum untuk
diinterogasikan pada dataset biomedis dan kesehatan yang besar dan kompleks.
Prosesnya dimulai dengan mengidentifikasi masalah, diikuti dengan menentukan
sumber data dan meta-data, pembersihan, penyelarasan komponent data,
preprocessing data, inferensi ilmiah berbasis model, dan diakhiri dengan prediksi,
validasi dan penyebaran data, perangkat lunak, protokol dan temuan penelitian
(Dinov, 2018). Dari uraian tersebut, proses pengolahan data science dapat menjadi
jawaban untuk dapat membuat sistem diagnosis otomatis dari dataset biomedis dan
kesehatan, termasuk penyakit malaria.
Sistem diagnosis otomatis bertujuan untuk melakukan tugas pemeriksaan
sediaan darah ini tanpa campur tangan manusia dan untuk menyediakan alat yang
obyektif, dapat diandalkan, dan efisien untuk melakukannya. Sistem diagnosis
otomatis dapat dirancang dengan memahami keahlian diagnostik dan
merepresentasikannya dengan algoritma pemrosesan gambar, analisis, dan
pengenalan pola khusus yang disesuaikan. Sistem diagnosis otomatis ini dapat
dirancang menggunakan proses penerapan metode Machine Learning (ML),

4
representasi fitur yang akurat merupakan inti dari kesuksesan untuk mencapai hasil
yang diinginkan. Mayoritas sistem diagnosis otomatis berbasis analisis gambar
menggunakan ML dengan representasi hand-engineered features dalam pengambilan
keputusan (Poostchi et al., 2018). Namun proses ini menuntut keahlian khusus dalam
menganalisis variabilitas ukuran, latar belakang, sudut, dan Region Of Interest (ROI)
pada gambar. Untuk mengatasi tantangan dalam perancangan hand-engineered
features yang menangkap variasi dalam data dasar, digunakanlah model Deep
Learning (DL) yang dikenal sebagai hierarchical learning yang dapat digunakan
dalam mencapai kesuksesan yang signifikan (Lecun et al., 2015).
Model DL menggunakan lapisan unit kaskade non-linier untuk menemukan
reprentasi fitur hirarki pada data mentah. Fitur dengan tingkat yang lebih tinggi
diabstraksikan dari tingkat yang lebih rendah untuk membantu dalam proses
pembelaaran yang kompleks, fungsi pengambilan keputusan non-linier, yang
dihasilkan dalam ekstraksi dan klarifikasi end-to-end (Schmidhuber, 2015). Tidak
seperti algoritma berbasil kernel seperti Support Vector Machine (SVM) pada model
ML, model DL menunjukkan peningkatan kinerja dengan peningkatan ukuran data
dan sumber daya komputasi, dan membuatnya memiliki skala yang lebih tinggi
(Srivasta et al., 2014).
Dalam penulisan ini, penulis akan menggunakan model DL dengan
menggabungkan dua metode Convolutional Neural Network dan Long Short Term
Memory sebagai fitur ekstraktor dalam mengklasifikasi parasitized dan uninfected
cells untuk membantu dalam peningkatan sistem diagnosis penyakit malaria. Dalam
5
penggabungannya, CNN digunakan untuk ekstraksi fitur pada gambar dan LSTM
digunakan untuk mengklasifikasikan parasit malaria berdasarkan fitur yang telah
dihasilkan. Jaringan LSTM memiliki memori internal yang mampu belajar dari
pengalaman penting dengan keadaan jangka panjang. Dalam fully connected
networks, lapisan terhubung sepenuhnya dan node antar lapisan tidak terhubung dan
hanya memproses satu masukan. Dalam kasus LSTM, node dihubungkan dari graf
berarah sepanjang urutan temporal yang dianggap sebagai input dengan urutan
tertentu.
6
1.2 Rumusan Masalah
Berdasarkan latar belakang tersebut, penulis merumuskan masalah sebagai berikut :
“Bagaimana klasifikasi parasit penyebab malaria menggunakan metode
Convolutional Neural Network-Long Short Term Memory?”
1.3 Batasan Masalah
Adapun batasan masalah pada penulisan ini adalah:
1. Klasifikasi dilakukan pada gambar sel darah manusia.
2. Perancangan sistem menggunakan bahasa pemrograman python.
3. Dalam melakukan pengolahan data science, menggunakan OSEMN
Framework, dan metode Convolutional Neural Network - Long Short Term
Memory.
4. Dataset berdasarkan studi literatur (Lhncbc.Nlm.Nih.Gov) dengan jumlah
dataset 27.558 gambar sel yang terbagi kedalam dua kategori yaitu
parasitized dan uninfected. Setiap kategori terdiri dari 13.779 gambar sel.
5. Binary Croosentropy digunakan dalam perhitungan Loss Function dalam
pelatihan model.
6. Perhitungan akurasi model menggunakan Confusion Matrix.
1.4 Tujuan Penelitian
Klasifikasi parasit penyebab malaria menggunakan metode Convolutional Neural
Network-Long Short Term Memory?.

7
1.5 Manfaat Penelitian
Manfaat dari penulisan ini antara lain:
Bagi pengguna
1. Dapat mengetahui bentuk parasit penyebab malaria dalam sel darah manusia.
2. Memudahkan untuk mendapatkan informasi tentang parasit penyebab malaria
guna untuk memahami dan mengklasifikasi parasit malaria.
Bagi penulis
1. Mendapatkan ilmu pengetahuan mengenai parasit penyebab penyakit malaria.
2. Mendapatkan pemahaman tentang data science, image processing dan metode
Convolutional Neural Network-Long Short Term Memory.
1.6 Sistematika Penulisan
Untuk memudahkan dalam penulisan skripsi, penulis menyusunnya ke dalam lima
bab. Setiap bab-nya terdiri dari beberapa sub bab tersendiri. Bab tersebut secara
keseluruhan saling berkaitan satu sama lain, dimana diawali dengan bab pendahuluan
dan diakhiri bab penutup yang berisi kesimpulan dan saran. Secara singkat akan
diuraikan sebagai berikut:
BAB I PENDAHULUAN
Dalam bab ini akan dibahas mengenai latar belakang, batasan masalah,
tujuan, dan manfaat serta sistematika penulisan.

8
BAB II LANDASAN TEORI
Dalam bab ini akan dibahas mengenai berbagai teori yang mendasari
analisis permasalahan dan berhubungan dengan topik yang dibahas.
BAB III METODOLOGI PENELITIAN
Bab ini membahas mengenai metode penelitian yang akan digunakan
dalam pengolahan data science pada Klasifikasi Parasit Malaria.
BAB V HASIL DAN PEMBAHASAN
Bab ini membahas mengenai hasil dan pembahasan tentang klasifikasi
parasit malaria menggunakan Deep Learning dengan metode
Convolutional Neural Network – Long Short-Term Memory.
BAB VI PENUTUP
Bab ini berisi tentang kesimpulan dari penelitian yang telah dilakukan
dan saran yang diusulkan untuk pengembangan lebih lanjut agar
tercapai hasil yang lebih baik.

BAB II
LANDASAN TEORI & TINJAUAN PUSTAKA
2.1 Landasan Teori
Landasan teori berisikan tentang dasar-dasar teori dan konsep yang berkaitan dengan
masalah dalam penelitian yang akan dijadikan sebagai referensi yang diambil dari
jurnal, buku atau skripsi pendukung.
2.1.1 Klasifikasi
Klasifikasi adalah tipe analisis data yang dapat membantu orang menentukan kelas
label dari sampel yang ingin di klasifikasi. Klasifikasi merupakan Metode supervised
learning, metode yang mencoba menemukan hubungan antara atribut masukan dan
atribut target. Tujuan klasifikasi untuk meningkatkan kehandalan hasil yang diperoleh
dari data (Hendrian, 2018).
Klasifikasi merupakan penempatan objek-objek ke salah satu dari beberapa
kategori yang telah ditetapkan sebelumnya. Klasifikasi telah banyak ditemui dalam
berbagai aplikasi. Sebagai contoh, pendeteksian pesan email spam berdasarkan
header dan isi atau mengklasifikasikan galaksi berdasarkan bentukbentuknya. Dalam
bab ini akan dibahas mengenai konsep klasifikasi, beberapa isi penting dalam
klasifikasi dan menyatakan metode untuk mengevaluasi dan membandingkan kinerja
teknik klasifikasi (Nugroho & Subanar, 2013).
Pada dasarnya, data yang diperoleh dari pengukuran atau suatu pengamatan
merupakan data mentah (raw data) yang mana berisikan deretan-deretan angka yang
9
10
acak dan sulit dimengerti. Agar data mentah ini menghasilkan informasi yang mudah
untuk didaptkan, maka perlu dilakukan klasifikasi data. Klasifikasi data adalah
pengelompokan data sesuai karakteristik yang dimiliki dengan keperluan
pengelompokan data (www.depkop.go.id). Tujuan dari klasifikasi data adalah sebagai
berikut:
1. Mengelempokkan sifat-sifat yang sama ke dalam kelompok atau kelas yang sama.
2. Memudahkan perbandingan.
3. Mengelompokkan informasi penting dan menghilangkan hal-hal yang tidak perlu.
4. Menunjukkan sifat yang menonjol sehingga mudah dilihat sekilas.
5. Memudahkan perlakukan statistik selanjutnya atas data yang telah dikumpulkan,
misalnya untuk analisis, interpretasi, atau penyusunan laporan.
2.1.2 Malaria
Malaria adalah suatu penyakit yang disebabkan oleh parasit yang termasuk dalam
anggota spesies dari genus Plasmodium. Plasmodium falciparum, Plasmodium vivax,
Plasmodium ovale dan Plasmodium malariae hampir disemua kasus terjadi pada
manusia. Malaria ditransmisikan dari manusia ke manusia oleh nyamuk Anopheles
betina kemudian berkembang dan bereplikasi didalam eritrosit inang vertebrata
(Millar & Cox-Singh, 2015).
Malaria adalah penyakit menular yang disebabkan plasmodium, yaitu makhluk
hidup bersel satu yang termasuk ke dalam kelompok protozoa. Malaria ditularkan
melalui gigitan nyamuk Anopheles betina yang mengandung Plasmodium di

11
dalamnya. Plasmodium yang terbawa melalui gigitan nyamuk akan hidup dan
berkembang biak dalam sel darah merah manusia. Penyakit ini menyerang semua
kelompok umur baik laki-laki maupun perempuan. Orang yang terkena malaria akan
memiliki gejala: demam, menggigil, berkeringat, sakit kepala, mual atau muntah
(PUSDATINKemenkesRI, 2016).
Menurut (Center for Disease Control and Prevention, 2018) dikenal lima jenis
spesies plasmodium penyebab malaria pada manusia, yaitu:
1. Plasmodium falciparum, adalah parasit malaria yang ditemukan di daerah
tropis dan subtropis di dunia. Diperkirakan setiap tahunnya ada 1 juta orang
yang terbunuh akibat parasit ini, terutama di Afrika. Plasmodium falciparum
adalah penyebab malaria tropika yang sering menyebabkan malaria yang
berat, karena memiliki kemampuan melipat ganda secara cepat dalam darah
sehingga dapat menyebabkan anemia. Selain itu Plasmodium falciparum
dapat menyumbat pembuluh darah kecil. Ketika ini terjadi di otak
akanmenyebabkan malaria serebral dengankomplikasiyang dapat berakibat
fatal (kematian).
2. Plasmodium vivax, adalah parasit malaria penyebab malaria tertiana yang
kebanyakan ditemukan di Asia, Amerika Latin, dan beberapa bagian di
Afrika. Karena padatnya penduduk terutama di Asia menyebabkan
Plasmodium vivax merupakan parasit malaria yang paling umum ditemukan
pada manusia. Plasmodium vivax memiliki tahapan dormansi dalam hati

12
(hypnozoites) yang dapat aktif dan menyerang darah(relapse) dalam beberapa
bulan atau tahun setelah gigitan nyamuk yang terinfeksi.
3. Plasmodium malariae, adalah penyebab malaria quartana yang ditemukan di
seluruh dunia. Plasmodium malariae adalah satu-satunya spesies parasit
malaria pada manusia yang memiliki siklus quartan (siklus tiga hari),
sedangkan tiga spesies lainnya memiliki siklus tertiana (siklus dua hari).
Infeksi Plasmodium malariae mampu bertahan dalam waktu yang lama jika
tidak diobati. Dalam beberapa kasus, infeksi kronis dapat berlangsung seumur
hidup. Pada beberapa pasien kronis yang terinfeksi.
4. Plasmodium ovale dapat menyebabkan komplikasi yang serius seperti
sindrom nefrotik. Plasmodium ovale, adalah parasit malaria yang
menyebabkan malaria ovale tetapi jenis ini jarang dijumpai. Plasmodium
ovale banyak ditemukandi Afrika (terutama Afrika Barat) dan pulau-pulau di
Pasifik Barat. Plasmodium ovale secara biologis danmorfologis sangat mirip
dengan Plasmodium vivax. Plasmodium ovale dapat menginfeksi individu
yang negatif untuk golongan darah duffy (salah satu penggolongan darah
selain ABO dan Rh) sedangkan Plasmodium vivax tidak. Golongan darah
duffy banyak ditemukan pada penduduk Sub-Sahara Afrika. Hal ini
menjelaskan prevalensi infeksi Plasmodium ovale banyak terjadi di sebagian
besar Afrika.
5. Plasmodium knowlesi merupakan parasit malaria baru yang bisa menginfeksi
manusia. Plasmodium knowlesi ditemukandi seluruh Asia Tenggara sebagai
pathogen alami dari kera ekor panjang dan babi. Baru-baru ini Plasmodium
13
knowlesi terbukti menjadi penyebab signifikan malaria zoonosis, terutama di
Malaysia. Plasmodium knowlesi memiliki siklus replikasi 24 jam dan begitu
cepat dapat berkembang menjadi infeksi yang parah.
2.1.3 Sel Darah

Darah merupakan salah satu jaringan dalam tubuh yang berbentuk cair
berwarna merah. Karena sifat darah yang berbeda dengan jaringan lain,
mengakibatkan darah dapat bergerak dari satu tempat ketempat lain sehingga dapat
menyebar ke berbagai kompartemen tubuh. Penyebaran harus terkontrol dan harus
tetap berada pada satu ruangan agar darah benar-benar dapat menjangkau seluruh
jaringan didalam tubuh melalui sistem yang disebut sistem kardiovaskular, yang
meliputi jantung dan pembuluh darah. Dengan sistem tersebut darah dapat
diakomodasikan secara teratur dan diedarkan menuju organ dan jaringan yang
tersebar diseluruh tubuh. Darah didistribusikan melalui pembuluh darah dari jantung
keseluruh tubuh dan akan kembali lagi menuju jantung. Sistem ini berfungsi untuk
memenuhi kebutuhan sel atau jaringan akan nutriendanoksigen, serta mentrasnport
sisa metabolisme sel atau jaringan keluar dari tubuh (Saadah, 2018).
Darah adalah jaringan ikat atau konektif berbentuk cair; terdiri dari 4 unsur
seluler, yaitu: sel-sel darah merah (eritrosit), sel-sel darah putih (leukosit), sel-sel
darah pembeku atau keping darah (trombosit) dan cairandarah (plasma darah)
(D’Hiru, 2013).
14
2.1.4 Data Science
Data science adalah sebuah bidang baru yang muncul dan menjadi ilmu yang sangat
transdisipliner, yang menjembatani antara bidang teoritis, komputasi, eksperimental,
dan biososial. Data science juga berurusan dengan sejumlah besar data yang
kompleks, tidak selaras, dan dinamis yang berasal dari berbagai sumber. Data
Science bertujuan untuk mengembangkan algoritma, metode, alat, dan layanan yang
mampu mengolah dataset dan menghasilkan sistem penunjang keputusan semi-
otomatis (Dinov, 2018).
Data Science adalah interdisipliner ilmu yang inheren dengan pendekatan sains.
Teknik eksperimental baru telah merevolusi biologi selama bertahun - tahun dari
sekuensing DNA dan mikroarray di masa lalu ke CRISPR dan cryo-EM baru-baru
ini. Data Science berbeda karena itu bukan merupakan teknik tunggal, melainkan
kerangka kerja untuk menyelesaikan seluruh jajaran masalah. Potensi Data Science
untuk menjawab pertanyaan dalam berbagai disiplin ilmu yang berbeda sangat
menggairahkan banyak peneliti (Ezer & Whitaker, 2019).
2.1.5 Dataset
Dataset adalah suatu database didalam memori (in-memory). Dataset memiliki semua
karateristik, fitur dan fungsi dari database biasa. Dataset dapat memiliki banyak tabel,
dan tabel-tabel dapat memiliki hubungan (relationship). Tabel-tabel pada suatu
dataset dapat memiliki foreign key dan integritas referensial. Dataset adalah objek
yang merepresentasikan data dan relasinya di memory. Strukturnya mirip dengan data
15
yang ada di database. Dataset berisi koleksi dari data tabel dan data. Jenis dataset ada
dua macam yaitu :
1. Private Dataset
Private dataset yaitu dataset yang dapat diambil dari organisasi yang kita jadikan
tempat atau objek penelitian. Adapun contoh-contohnya seperti instansi, rumah sakit,
pabrik, perusahaan jasa, dan lain-lain.
2. Public Dataset
Public dataset yaitu dataset yang dapat diambil dari repository public yang telah
disepakati oleh para peneliti. Adapun contoh-contohnya seperti: UCI.
2.1.6 Klasifikasi Gambar
Klasifikasi gambar atau citra adalah sebuah pekerjaan untuk memasukkan citra dan
menempatkan ke dalam suatu kategori. Ini merupakan salah satu dari permasalahan
yang ada pada Computer Vision yang dapat disederhanakan dan memiliki berbagai
macam aplikasinya. Salah satu aplikasi dalam klasifikasi citra adalah
pengklasifikasian nama tempat pada suatu citra .
Setiap citra yang di input pada training set data diberikan label atau penamaan.
Saat klasifikasi, label atau penamaan tersebut akan menjadi perbandingan dengan
hasil hipotesis yang diberikan oleh model pembelajaran dan akan menghasilkan nilai
error. Klasifikasi yang terawasi ini bisa sangat efektif dan akurat dalam
mengklasifikasikan citra tempat maupun objek lainnya. Banyak metode dan algoritma
16
yang dapat mendukung proses klasifikasi yang terawasi terutama dengan teknik Deep
Learning (Putri, 2018).
2.1.7 Artificial Intellegence (AI)
Kecerdasan Buatan atau Artificial Intelligence (AI) adalah teknik yang digunakan
untuk meniru kecerdasan yang dimiliki oleh makhluk hidup maupun benda mati
untuk menyelesaikan sebuah persoalan. Untuk melakukan hal ini, setidaknya ada tiga
metode yang dikembangkan.
a. Fuzzy Logic(FL).
Teknik ini digunakan oleh mesin untuk mengadaptasi bagaimana makhluk
hidup menyesuaikan kondisi dengan memberikan keputusan yang tidak kaku 0 atau 1.
Sehingga dimunculkan sistem logika fuzzy yang tidak kaku. Penerapan logika fuzzy
ini salah satunya adalah untuk sistem pengereman kereta api di Jepang.
b. Evolutionary Computing(EC).
Pendekatan ini menggunakan skema evolusi yang menggunakan jumlah
individu yang banyak dan memberikan sebuah ujian untuk menyeleksi individu
terbaik untuk membangkitkan generasi selanjutnya. Seleksi tersebut digunakan untuk
mencari solusi dari suatu permasalahan. Contoh dari pendekatan ini adalah Algoritma
Genetika yang menggunakan ide mutasi dan kawin silang, Particle Swarm
Optimization (PSO) yang meniru kumpulan binatang seperti burung dan ikan dalam
mencari mangsa, Simulated Annealing yang menirukan bagaimana logam ditempa,
dan masih banyak lagi.

17
c. Machine Learning (ML)
Machine Learning atau pembelajaran mesin merupakan teknik yang paling
populer karena banyak digunakan untuk menggantikan atau menirukan perilaku
manusia untuk menyelesaikan masalah. Sesuai namanya ML mencoba menirukan
bagaimana proses manusia atau makhluk cerdas belajar dan mengeneralisasi (Ahmad,
2017).
Skema utama dari AI bisa dilihat pada Gambar 2.1.
Gambar 2.1 Diagram Kecerdasan Buatan

Sumber (Ahmad, 2017)
Berdasarkan diagram pada gambar 2.1. dapat dijelaskan bahwa AI dibagi
menjadi beberapa macam algortima seperti Machine Learning, Fuzzy Logic,
Evolutionary Computation, dan lain-lain. Fuzzy Logic adalah suatu cabang ilmu
Artificial Intellegence, yaitu suatu pengetahuan yang membuat komputer dapat
meniru kecerdasan manusia sehingga diharapkan komputer dapat melakukan hal- hal
yang apabila dikerjakan manusia memerlukan kecerdasan. Evolutionary Computation
adalah algoritma untuk optimisasi global yang terinspirasi oleh evolusi biologis, dan
18
subbidang kecerdasan buatan dan komputasi lunak mempelajari algoritma ini. Dalam
istilah teknis, mereka adalah keluarga pemecah masalah trial and error berbasis
populasi dengan karakter optimisasi metaheuristik atau stokastik.
Didalam ANN terdapat Deep Learning yang mana mesin dilatih lebih
mendalam. Deep Learning adalah salah satu cabang Machine Learning (ML) yang
menggunakan Deep Neural Network untuk menyelesaikan permasalahan pada
domain ML.
2.1.8 Machine Learning
Machine Learning adalah serangkaian teknik yang dapat membantu dalam menangani
dan memprediksi data yang sangat besar dengan cara merepresentasikan data-data
tersebut dengan algoritma pembelajaran. Machine Learning dapat membuat komputer
memprogram diri mereka sendiri. Jika pemrograman adalah pekerjaan untuk
membuat otomatis, maka Machine Learning mengotomatisasi proses otomatis.
Berikut gambaran umum Machine Learning dibandingkan dengan pemrograman
secara tradisional.
Gambar 2.2 Perbandingan Pemrograman Tradisional dengan Machine Learning

19
Dari Gambar 2.2 dapat dilihat bahwa pemrograman secara tradisional data dan
programan dijalankan di komputer untuk menghasilkan output. Sedangkan pada
Machine Learning data dan output dijalankan di komputer untuk membuat sebuah
program.
Ada banyak algoritma Machine Learning yang dikembangkan setiap tahunnya.
Setiap algoritma pembelajaran mesin memiliki tiga komponen penting antara lain:
a. Representasi: bagaimana merepresentasikan pengetahuan.
Contohnya termasuk Decision tree, Neural Network, Support
Vector Machine dan lain-lain.
b. Evaluasi: cara mengevaluasi prediksi dan hipotesis. Contohnya
meliputi Mean Squared Error, Cost function dan lain-lain.
c. Optimasi: cara program dari model dihasilkan dan proses
pencarian parameter terbaik. Misalnya Convex Optimization dan
Gradient Descent.
Selain dari algoritma pembelajaran ada empat jenis cara pembelajaran
pada Machine Learning, yakni:
a. Supervised Learning: Data pembelajaran mencangkup keluaran
yang yang sudah ditentukan.
b. Unsupervised Learning: Data pembelajaran tidak mencangkup
keluaran yang ditentukan.

20
c. Semi-supervised Learning: Data pembelajaran mencangkup
beberapa keluaran yang ditentukan.
d. Reinforcement Learning: Pemberian hadiah dari setiap serangkaian
tindakanyang dilakukan.
2.1.9 Deep Learning
Deep Learning merupakan salah satu bidang dari Machine Learning yang
memanfaatkan jaringan syaraf tiruan untuk implementasi permasalahan dengan
dataset yang besar. Teknik Deep Learning memberikan arsitektur yang sangat kuat
untuk Supervised Learning. Dengan menambahkan lebih banyak lapisan maka model
pembelajaran tersebut bisa mewakili data citra berlabel dengan lebih baik.
Pada Machine Learning terdapat teknik untuk menggunakan ekstrak fitur dari
data pelatihan dan algoritma pembelajaran khusus mengklasifikasi citra maupun
untuk mengenali suara. Namun, metode ini masih memiliki beberapa kekurangan
baik dalam hal kecepatan dan akurasi. Aplikasi konsep jaringan syaraf tiruan yang
dalam (banyak lapisan) dapat ditangguhkan pada algoritma Machine Learning yang
sudah ada sehingga komputer sekarng bisa belajar dengan kecepatan, akurasi, dan
skala yang besar. Prinsip ini terus berkembangkan hingga Deep Learning semakin
sering digunakan pada komunitas riset dan industri untuk membantu memecahkan
banyak masalah data besar seperti Computer vision, Speech recognition, dan Natural
Language Processing.
Feature Engineering adalah salah satu fitur dari Deep Learning untuk
mengekstrak pola yang berguna dari data akan memudahkan model untuk
21
membedakan kelas. Feature Engineering juga merupakan teknik yang paling penting
untuk mencapai hasil yang baik pada tugas prekdiksi. Namun, sulit untuk dipelajari
dan dikuasai karena kumpulan data dan jenis data yang berbeda memerlukan
pedekatan teknik yang berbeda juga. Algoritma yang digunakan pada Feature
Engineering dapat menemukan pola umum yang penting untuk membedakan antara
kelas.
Ekstraksi fitur otomatis merupakan keunggulan deep learning dibanding
dengan algoritma machine learning terdahulu . ekstrasi fitur mengutamakan
pemberian label pada dataset yang ada dalam proses jaringan.
Secara historis, pelatihan machine learning menghabiskan berbulan-bulan,
bertahun-tahun, bahkan puluhan tahun dalam pembuatan set fitur lengkap untuk
klasifikasi data secara manual. Deep learning merupakan algoritma paling akurat
sejauh ini (Patterson & Gibson, 2017).
2.1.10 Jaringan Syaraf Tiruan / Artificial Neural Network (ANN)
Jaringan Syaraf Tiruan / Artificial Neural Network (ANN) merupakan metode yang
biasanya digunakan dalam peramalan maupun pengenalan pola. Pada peramalan
jaringan syaraf tiruan biasa digunakan sebagai peramalan nilai tukar mata uang asing,
peramalan harga saham, peramalan cuaca dan lain sebagainya, sedangkan untuk
pengenalan pola biasanya jaringan syaraf tiruan digunakan untuk pengenalan pola
huruf, pola tanda tangan hingga pola suara serta wajah (Kartika et al., 2016).
22
Berdasarkan (Nurhikmat, 2018), ANN merupakan sistem adatif yang dapat
mengubah strukturnya untuk memecahkan suatu masalah berdasarkan informasi
internal maupun eksternal. Menurut Pham dalam jurnal Hermantoro (Pham, 1994)
mengatakan bahwa ANN bersifat fleksibel terhadap inputan data dan menghasilkan
output respon konsisten. ANN telah banyak digunakan dalam area yang luas.
Menurut Kumar & Haynes (Kumar, 2003) dalam jurnal Ulil Hamida (Hamida, 2014)
menjelaskan, penerapan ANN dapat mengidentifikasi beberapa aplikasi yaitu:
a. Estimasi/prediksi (aproksimasi fungsi, peramalah)
b. Pengenalan Pola (klasifikasi, diagnosis, dan analisis diskriminan)
c. Klustering (pengelompokan tanpa adanya pengetahuan sebelumnya)
2.1.11 Data Augmentation/ Data Augmentasi

Augmentasi data adalah suatu proses dalam pengolahan data gambar, augmentasi
merupakan proses mengubah atau memodifikasi gambar sedemikian rupa sehingga
komputer akan mendeteksi bahwa gambar yang diubah adalah gambar yang berbeda,
namun manusia masih dapat mengetahui bahwa gambar yang diubah tersebut adalah
gambar yang sama (Perez & Wang, 2017). Augmentasi dapat meningkatkan akurasi
dari model CNN yang dilatih karena dengan augmentasi model mendapatkan data-
data tambahan yang dapat berguna untuk membuat model yang dapat melakukan
generalisasi dengan lebih baik. Salah satu jenis augmentasi yang umum dilakukan
adalah dengan melakukan perputaran gambar dengan besar tertentu, contoh dari
penggunaan augmentasi ini dapat dilihat pada Gambar 2.7

23
Gambar 2.3 Augmentasi dengan perputaran gambar maksimal 90 °

Sumber :
2.1.12 Convolutional Neural Network (CNN)
Convolutional Neural Network (CNN) adalah arsitektur deep learning yang terkenal
yang terinspirasi oleh mekanisme persepsi visual makhluk hidup di alam. Pada tahun
1959, Hubel & Wiesel menemukan bahwa sel-sel pada hewan visual cortex
bertanggung jawab untuk mendeteksi cahaya pada bidang reseptif. Terinspirasi oleh
penemuan ini, Kunihiko Fukushima menguslkan teori neocognitron pada tahun 1980,
yang dainggap sebagai pendahulu CNN. Pada tahun 1990, LeCun dkk. menerbitkan
jurnal yang membentuk kerangka kerja modern dari CNN, dan kemudian
memperbaikinya lagi pada tahun 1998. Mereka mengembangkan jaringan saraf tiruan
multi-layer yang disebut LeNet-5 yang dapat mengklasifikasikan digit tulisan tangan.
Dimulai pada tahun 1990 sebuah studi paralel oleh Zhang dkk. menggunakan Shift-
Invariant Artificial Neural Network (SIANN) untuk mengenali karakter dari sebuah
gambar. Namun, karena kurangnya data training yang besar dan daya komputasi
pada waktu itu, jaringan mereka tidak dapat bekerja dengan baik pada masalah yang
lebih kompleks, mis., klasifikasi gambar dan video skala besar.

24
Sejak 2006, banyak metode telah dikembangkan untuk mengatasi kesulitan
yang dihadapi dalam pelatihan mendalam pada CNN. Paling menonjol pada tahun
2012, Krizhevsky dkk. Mengusulkan arsitektur CNN klasik dan menunjukkan
perbaikan yang signifikan dari metode sebelumnya pada pengklasifikasian gambar.
Keseluruhan arsitektur dari metode mereka dikenal dengan sebutan AlexNet, mirip
dengan LeNet-5 tetapi dengan struktur yang lebih dalam. Dengan keberhasilan
AlexNet, banyak karya telah diusulkan untuk meningkatkan kinerja CNN (J Gu et al,
2015).
CNN temasuk kedalam kategori metode neural network. CNN tidak hanya
dapat mempelajari representasi fitur gambar secara otomatis, tetapi CNN juga
mengungguli banyak teknik buatan konvensional lainnya (Sang et al., 2017).
Model neural network memiliki representasi data hirarkis dan bergantung pada
perhitungan layer yang memiliki implementasi berurutan, output layer sebelumnya
akan menjadi input layer berikutnya. Setiap layer memberikan satu level representasi.
Dan, ada satu set bobot yang mengukur parameter layer. Dan juga, unit input
terhubung ke unit output melalui bobot di samping sekelompok bias. Bobot dalam
CNN, dibagikan secara lokal, yang berarti bahwa setiap lokasi input memiliki bobot
yang sama. Bentuk filter berdasarkan bobot yang dikaitkan dengan output yang sama
(Romero et al, 2016).

25
Gambar 2.4 Contoh Jaringan Convolutional Neural Network (CNN)

Sumber: cs23ln.github.io
Pada Gambar 2.4 menunjukkan setiap lapisan input yang dimasukkan memiliki
volume yang berbeda dan mewakili dengan kedalaman, tinggi dan lebar. Setiap
besaran yang didapatkan tergantung dari hasil filtrasi dari lapisan sebelumnya dan
juga banyak filter yang digunakan. Model jaringan seperti ini sudah terbukti sangat
ampuh dalam menangani permasalahan klasifikasi citra.
A. Arsitektur Jaringan CNN

Pada neural network, neuron dikumpulkan dalam lapisan-lapisan (layers) yan disebut
denan lapisan neuron (neuron layers). Neuron-neuron pada satu lapisan dihubungkan
dengan lapisan sebelumnya dan sesudahnya, kecuali pada lapisan input dan output.
Lapisan diantara lapisan biasa disebut dengan lapisan tersembunyi atau hidden layer.
Perambatan juga bisa dilakukan pada arah sebaliknya tergantungg pada algoritma
pembelajaran yang dipakai.
Faktor terpenting dalam menentukan sifat suatu neuron adalah pola bobot
(weights) dan fungsi aktivitas dari neuron tersebut. Pada setiap lapisan yang sama,
neuron-neuron memiliki fungsi aktivitas yang sama.
Arsitektur neural network biasa dibagi berdasarkan jumlah lapisannya menjadi:
1. Jaringan dengan lapisan tunggal (Single layer network).

26
Jaringan dengan lapisan tunggal adalah sebuah jaringan dengan semua
input terhubung langsung pada output tanpa melewati lapisan
tersembunyi.
2. Jaringan dengan banyak lapisan (multi-layer networks)
Jaringan dengan lapis banyak memiliki satu atau lebih lapisan
tersembunyi di antara lapisan input dan output.
Convolutional Neural Network (CNN) merupakan multi-layer networks yang
terdiri dari alternating layer yang secara local terhubung pada convolutional layer
dimana setiap layer memiliki jumlah filter yang sama. Downsampling layer dan fully
connected layer berfungsi sebagai classifier (Al-Waisy et al., 2017).
Gambar 2.5 Ilustrasi Arsitektur CNN

Sumber: (Al-Waisy et al., 2017)
Arsitektur CNN memiliki tiga konsep yang membuatnya efektif: local receptive
fields, weights sharing, dan downsampling operations. Local receptive fields
berisikan setiap neuron yang menerima input berupa porsi kecil dari layer
sebelumnya dan juga memiliki ukuran yang sama dari convolution filter. Local
receptive fields digunakan pada convolutional dan downsampling layer. Weight
sharing diterapkan pada convolutional layer untuk mengontrol kapasitas dan

27
mengurangi kompleksitas model. Terakhir, nonlinear downsampling yang digunakan
pada downsampling layer berfungsi untuk mengurangi ukuran spasial gambar serta
mengurangi jumlah parameter bebas dari model. Konsep-konsep ini membantu CNN
menjadi kuat dan efektif dalam tugas-tugas pengenalan gambar (Al-Waisy et al.,
2017).
Berikut adalah penjelasan beberapa layer yang terdapat pada CNN:
1. Convolutional layer
Bobot pada layer ini terbuat dari satu set learnable filters yang
diproduksi secara acak dan dipelajari melalui algoritma back-
propagation. Feature map adalah hasil dari setiap filter yang
terhubung melalui sebuah gambar. Feature map juga memiliki
jumlah yang sama dari filter yang diterapkan pada layer tersebut.
(Al-Waisy et al., 2017)
Gambar 2.6 Feature Map

Sumber oreilly.com
28
Seperti yang telah diilustrasikan pada Gambar 2.6, convolutional
layer yang pertama berisikan 6 filter yang menghasilkan 6 feature
map yang disusun bersama. Setiap feature map mewakili fitur
spesifik dari gambar, misalnya represented points atau represented
vertical edges seperti yang diilustrasikan pada Gambar 2.3. Operasi
convolution dirumuskan sebagai berikut.
𝑥𝑗𝑙 = 𝑓 (∑𝑖∈𝑀𝑗 𝑥𝑗𝑙−1 ∗ 𝑘𝑖𝑗

𝑙
+ 𝑏𝑗𝑙 ) (2.1)
l = layer pada CNN
j = specific convolution feature map
f = fungsi aktivasi
𝑀𝑗 = selection of input maps
𝑘𝑖𝑗 = filter
𝑏𝑗 = feature map bias
2. Pooling layer
Layer ini mengimplementasikan operasi downsampling untuk
mengurangi ukuran spasial dari convolutional layer. Pertama,
ukuran pooling mask dan jenis operasi pooling harus ditentukan dan
setelah itu dapatditerapkan pada pooling layer.
Operasi pooling diimplementasikan pada nilai-nilai piksel yang
ditangkap oleh pooling mask, lalu dikalikan dengan trainable
coefficient, setelah itu ditambahkan ke trainable bias. Operasi
pooling dirumuskan sebagai berikut.

29
𝑥𝑗𝑙 = 𝑓(𝐵𝑗𝑙 𝑝𝑜𝑜𝑙(𝑥𝑗𝑙−𝑖 ) + 𝑏𝑗𝑙 ) (2.2)
3. Fully Connected layers
Layer ini digunakan untuk mengekstrak feature pada layer
sebelumnya untuk selanjutnya dilakunnya tugas klasifikasi. Hasil
dari convolutional atau pooling layer terakhir akan diberikan ke
fully connected layers seperti dalam jaringan sraf asli.
B. Fungsi Aktivasi
Fungsi aktivasi adalah fungsi non linear yang memungkinkan sebuah neural network
untuk dapat mentransformasikan data input menjadi dimensi yang lebih tinggi
sehingga dapat dilakukan hyperlane sederhana yang memungkinkannya dilakukan
klasifikasi (Eka Putra, 2016).
Setiap fungsi aktivasi mengambil sebuah nilai dan melakukan operasi
matematika. Pada arsitektur CNN, fungsi aktivasi terletak pada perhitungan akhir
output feature map atau sesudah proses operasi convolution atau pooling untuk
menghasilkan suatu pola fitur (Zufar & Setiyono, 2016).
Beberapa macam fungsi aktivasi yang sering digunakan dalam penelitian CNN
antara lain fungsi sigmoid, tanh, Rectified Liniear Unit (ReLU), Leaky ReLU
(LReLU), SGD dan SoftMax.
C. Learning Rate
Learning rate adalah salah satu hyper parameter yang sangat mempengaruhi
performa suatu model CNN. Dalam melakukan pencarian learning rate yang tepat,
digunakan suatu metode yang bernama cyclical learning rates (Smith, 2017), dalam
30
metode ini, akan dilakukan beberapa epochs training, dengan learning rate yang
dimulai dari nilai yang kecil, dan setiap iterasi akan diperbesar learning rate-nya,
setiap iterasi akan dilihat loss yang didapat, dan jika loss yang didapat meningkat
cukup drastis maka proses pencarian akan diberhentikan. Berdasarkan data loss yang
didapat, maka dipilih learning rate sesaat sebelum loss memiliki nilai terendah.
Gambar 2.7 Plot learning rate terhadap loss
Dapat dilihat pada Gambar 2.7 bahwa pada saat learning rate−berada pada titik
1e-02 titik ini memiliki nilai loss terkecil kedua, maka titik ini cocok untuk dipilih
untuk menjadi learning rate (Smith, 2017).
Dalam pembelajaran Deep Learning terdapat beberapa metode yaitu Artificial
Neural Network (ANN), Recurrent Neural Network (RNN) dan Convolutional
Neural Network (CNN). Berikut perbedaan antara beberapa metode tersebut:

31
Tabel 2.1 Perbandingan ANN, CNN dan RNN
Perbedaan ANN CNN RNN

Tipe data Tabular Data, Text Image Data Sequence Data
data
Parameter No Yes Yes
Sharing
Fixed Length Yes Yes No
input
Recurrent No No Yes
Connections
Vanishing dan Yes Yes Yes
Exploding
Gradient
Spatial No Yes No
Relationship
Performa ANN dianggap CNN dianggap RNN mencakup
kurang powerful lebih powerful lebih sedikit
dibandingkan dibandingkan kompabilitas fitur
CNN dan RNN. ANN dan RNN. dibandingkan
dengan CNN.
Pengaplikasian Facial Recognition Facial Text-to-Speech
dan Computer Recognition, Conversion.
Vision Image
Classification dan
Natural Language
Processing.
Keuntungan Memiliki Fault Memiliki akurasi Mampu mengingat
Tolerance, yan tinggi dalam setiap informasi,
kemampuan untuk pengenalan time series
bekerja denan gambar dan weight prediction.
pengetahuan yang sharing
tidak lengkap.
Kekurangan Bergantung Membutuhkan Gradient vanishing
kepada perangkat data pelatihan dan exploding
keras yang yang besar. gradient.
digunakan,
perilaku jaringan
tidak dapat
dijelaskan.
32
2.1.13 Long Short-Term Memory
Long Short-Term Memory merupakan salah satu pendekatan menggunakan arsitektur
Recurrent neural network (RNN) yang pertama kali dikenalkan oleh Sepp Hochreiter
and Jürgen Schmidhuber pada tahun 1997. LSTM dikenalkan untuk menyelesaikan
masalah vanishing gradient yang terjadi dalam arsitektur vanilla RNN pada saat
menyimpan memori dalam jangka panjang. Hal ini karena LSTM memiliki unit yang
unik yang dapat mempelajari kapan waktu untuk membuka dan menutup gerbang
dalam jaringan untuk mengatur pergerakan error yang konstan dalam jaringan
tersebut (Sagheer & Kotb, 2019).
LSTM memiliki tiga gates atau gerbang yang masing-masing memiliki peran
untuk melindungi dan mengontrol cell state. Cell state merupakan garis horizontal
(jika dilihat dalam penggambaran pada Gambar 2.8) yang melewati bagian atas
diagram sel LSTM yang memiliki kemampuan untuk menghapus atau menambahkan
informasi baru yang masuk dalam waktu t dengan memanfaatkan struktur cermat
yang disebut gerbang. Gates atau gerbang sendiri adalah sebuah cara yang digunakan
oleh LSTM untuk melakukan seleksi terhadap informasi yang masuk ke dalam sel.
Gerbang tersebut tersusun atas layer yang menggunakan operasi sigmoid dan
perkalian pointwise (Olah, 2015).

33
Gambar 2.8 Arstitektur Long Short Term Memory (LSTM)
Forget gate merupakan gerbang pertama yang dioperasikan dalam sel LSTM.
Forget gate ini menentukan informasi mana yang harus dipertahankan dan yang harus
dibuang dari cell state. Gerbang ini menerima dua input, masing-masing dari ht-1 dan xt
yang dimana ht-1 merupakan keluaran dari proses LSTM pada time step t-1 dan xt
merupakan input pada time step t. Output dari gerbang ini adalah angka dengan
rentang 0 hingga 1. Diagram kerja forget gate ditunjukkan pada gambar 2.9.
Gambar 2.9 Struktur sel pada LSTM

34
Rumus yang digunakan pada gerbang tersebut adalah:
𝑓𝑡 = σ(𝑊𝑓 ∙ [ℎ𝑡−1 , 𝑥𝑡] + 𝑏𝑓) (2.3)
Keterangan:
ft = forget gate
σ = sigmoid function
Wf = bobot pada forget gate
ht-1 = hasil output pada time step t-1
xt = input pada time step t
bf = bias pada forget gate
Setelah didapatkan nilai dengan rentang 0 hingga 1 pada forget gate, maka
operasi selanjutnya adalah pada input gate. Input gate terdiri dari dua bagian, bagian
pertama menggunakan fungsi sigmoid yang menentukan informasi mana yang ingin
di-update. Sedangkan bagian kedua menggunakan fungsi tanh yang berfungsi untuk
menentukan vektor yang akan ditambahkan pada nilai cell state (C’t). Kedua bagian
tersebut berfungsi untuk menentukan informasi baru apa saja yang ingin disimpan
pada cell state. Layer input gate ini dapat dilihat pada gambar 2.10.
Gambar 2.10 Input gate pada LSTM

35
𝑖𝑡 = σ(𝑊𝑖 ∙ [ℎ𝑡−1 , 𝑥𝑡] + 𝑏𝑖) (2.4)
𝐶′𝑡 = tanh(𝑊𝐶 ∙ [ℎ𝑡−1 , 𝑥𝑡] + 𝑏𝐶) (2.5)
Keterangan:
it = input gate
Wi = bobot pada gerbang input bi = bias pada gerbang input
C’t = kandidat nilai cell state baru yang akan ditambahkan ke Ct-1
tanh = fungsi tanh
Wc = bobot pada operasi cell state baru
bc = bias pada operasi cell state baru
Hasil yang didapatkan dari operasi pada forget gate dan input gate selanjutnya
dioperasikan agar hasil dari operasi tersebut dapat digunakan untuk meng-update cell
state Ct-1 .Pada operasi ini dilakukan perkalian pada state sel Ct-1 dengan hasil dari
layer forget gate (ft). Lalu tambahkan hasil perkalian tersebut dengan it * Ct seperti
pada gambar 2.11. Setelah dua operasi tersebut (operasi perkalian Ct-1 dan ft lalu
penambahan dengan it * C’t ), langkah selanjutnya adalah dengan mengoperasikan
output gate. Pada output gate, layer sigmoid akan dioperasikan terlebih dahulu untuk
menentukan bagian dari cell state apa saja yang akan digunkan sebagai hasil keluaran.
Setelah operasi sigmoid dilakukan, selanjutnya operasi tanh dijalankan pada cell state
36
lalu dikalikan dengan keluaran dari layer sigmoid yang telah dihitung sebelumnya
(Olah, 2015). Operasi ini dapat dilihat pada gambar 2.12.
Gambar 2.11 Operasi pada hasil input gate dan perkalian C’t dan it pada sel
LSTM
Gambar 2.12 Output gate pada sel LSTM
𝐶𝑡 = 𝑓𝑡 ∗ 𝐶𝑡−1 + 𝑖𝑡 ∗ 𝐶′𝑡 (2.6)
𝑜𝑡 = σ(𝑊𝑜 ∙ [ℎ𝑡−1 , 𝑥𝑡] + 𝑏𝑜) (2.7)
ℎ𝑡 = 𝑜𝑡 ∗ tanh(𝐶𝑡) (2.8)
Keterangan:
Ct = Cell state pada time step t
ft = forget gate
37
Ct-1 = Cell state pada time step t-1
C’t = Nilai cell state baru pada hasil perhitungan gerbang input
ot = fungsi gerbang output
σ = sigmoid function
Wo = bobot pada gerbang output
bo = bias pada gerbang output
ht = output pada time step ke t
tanh = fungsi tanh
2.1.14 Precision dan Recall
Precision adalah tingkat ketepatan antara informasi yang diminta oleh pengguna
dengan jawaban yang diberikan oleh sistem. Sedangkan recall adalah tingkat
keberhasilan sistem dalam menemukan kembali sebuah informasi. Gunanya fungsi ini
agar akurasi model tidak serta merta dipercaya namun cukup dapat dipertanggung
jawabkan kebenarannya karena melihat akurasi model dari sisi lain.
2.1.15 Epoch
Epoch adalah ketika seluruh dataset sudah melalui proses training pada Neural
Netwok sampai dikembalikan ke awal untuk sekali putaran, karena satu Epoch terlalu
besar untuk dimasukkan (feeding) kedalam komputer maka dari itu kita perlu
membaginya kedalam satuan kecil (batches). Didalam epoch inilah tiap bobot/ weight
ditambahkan.
38
2.1.16 Confusion Matrix

Confusion matrix merupakan suatu metode yang dapat digunakan untuk mengukur
kinerja suatu metode klasifikasi. Confusion matrix mengandung informasi yang
membandingkan hasil klasifikasi yang dilakukan oleh sistem untuk diukur
keakuratannya. Confusion matrix juga merupakan salah satu cara dalam melakukan
visualisasi terhadap hasil pembelajaran sistem, visualisasi yang ditampilkan memuat
dua kategori atau lebih (Rahman, dkk., 2017). Tabel 2.2 di bawah merupakan contoh
hasil confusion matrix prediksi dua kelas.
Tabel 2.2. Confusion Matrix
Kelas Sebenarnya
1 2
Kelas Prediksi 1 True Positive False Negative
2 False Positive True Negative
Keterangan:
a. True Positive (TP): merupakan jumlah data dengan kelas positif yang
diklasifikasikan positif.
b. True Negative (TN): merupakan jumlah data dengan kelas negative yang
diklasifikasikan negatif.
c. False Positive (FP): merupakan jumlah data dengan kelas positif yang
diklasifikasikan negatif.
d. False Negative (FN): merupakan jumlah data dengan kelas negatif yang
diklasifikasikan positif.
39
Perhitungan Akurasi yang dilakukan oleh confusion matrix berdasarkan Tabel
2.2 dapat menggunakan persamaan sebagai berikut:
𝑇𝑃+𝑇𝑁
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑇𝑃+𝐹𝑁+𝐹𝑃+𝑇𝑁 × 100% (2.9)
𝑇𝑁
𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦 = 𝑇𝑁+𝐹𝑃 (2.10)
𝑇𝑃
𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 = (2.11)
𝑇𝑃+𝐹𝑁
2.1.17 Python
Python merupakan salah satu contoh bahasa tingkat tinggi. Contoh lain bahasa tingkat
tinggi adalah Pascal, C++, Pert, Java, dan sebagainya. Sedangkan bahasa tingkat
rendah merupakan bahasa mesin atau bahasa assembly. Secara sederhana, sebuah
komputer hanya dapat mengeksekusi program yang ditulis dalam bentuk bahasa
mesin. Oleh karena itu, jika suatu program ditulis dalam bentuk bahasa tingkat tinggi,
maka program tersebut harus diproses dulu sebelum bisa dijalankan dalam komputer.
Hal ini merupakan salah satu kekurangan bahasa tingkat tinggi yang memerlukan
waktu untuk memproses suatu program sebelum program tersebut dijalankan. Akan
tetapi, bahasa tingkat tinggi mempunyai banyak sekali keuntungan. Bahasa tingkat
tinggi mudah dipelajari, mudah ditulis, mudah dibaca, dan tentu saja mudah dicari
kesalahannya. Bahasa tingkat tinggi juga mudah diubah portabel untuk disesuaikan
dengan mesin yang menjalankannya. Hal ini berbeda dengan bahasa mesin yang
hanya dapat digunakan untuk mesin tersebut. Dengan berbagai kelebihan ini, maka
banyak aplikasi ditulis menggunakan bahasa tingkat tinggi. Proses mengubah dad
40
bentuk bahasa tingkat tinggi ke tingkat rendah datam bahasa pemrograman ada dua
tipe, yakni interpreter dan compiler (Utami, 2004).
2.1.18 OSEMN Framework

OSEMN Framework adalah model penelitan yang terstandarisasi dan diterima secara
luas dalam bidang data science. OSEMN dapat memecahkan masalah data science
dalam skala besar (Byrne et al., 2017).
OSEMN memiliki langkah-langkah yang mudah dipahami dan konsisten secara
logis dari alur kerja pemrosesan data, diperkaya dengan instruksi tambahan, catatan
dan dokumen sampel, memastikan kinerja kegiatan dan pencapaian hasil yang sama
dari aktifitas dan pengguna yang berbeda (Dineva & Atanasova, 2018).
Menurut (Kumari et al., 2020) terdapat 5 tahapan pada OSEMN yang juga
sesuai dengan namanya:
1. O(Obtain)/ Pengumpulan data
Mengumpulkan data dari sumber yang relevan. Pada tahap ini kita harus
mengetahui data apa saja yang diperlukan, darimana sumbernya, bagaimana
mengumpulkannya, dan bagaimana menyiapkan datanya agar memenuhi
hasil yang diinginkan.
2. S(Scrub)/ Data Preparation
Pada tahap ini, data yang sudah dikumpulkan akan di bersihkan dan di filter
menjadi format yang dapat dimengerti mesin. Biasanya tahap ini meliputi:
- Handling missing data

41
- Correcting invalid values
- Removing duplicates
- Structuring the data to be fed in algorithm
- Feature engineering
3. E(Explore)/ Ekplorasi data
Pada tahap ini, data akan di eksplorasi dan menentukan karateristik dari
data tersebut. Kemudian data akan di ekstrak atribut dan variabel ujinya
yang kemudian akan dimasukkan ke tahap pemodelan.
4. M(Model)/Tahap Pemodelan
Pada tahap ini, data yang sudah di ekstrak akan masuk ke tahap pemodelan.
Pemodelan dibuat untuk menghasilkan parameter dan fitur data yang akan
digunakan pada tahap prediksi sebagai output.
5. N(iNterpreting)/Menginterpretasikan hasil
Tahap ini adalah tahap mengintrepretasikan hasil prediksi dan memberikan
hasil sedemikian rupa berupa presentasi data.
2.2 Tinjuan Pustaka
Tinjauan Pustaka di ambil dari beberapa skripsi dan jurnal yang berhubungan dengan
penelitian. Setiap literatur akan dibahas satu persatu secara singkat tentang judul,
tools dan hasil dari setiap penelitian.
1. Pada penelitian yang berjudul “COVID-19 classification using chest X-
ray images: A framework of CNN-LSTM and improved max value moth
flame optimization” tahun 2022, yang ditulis oleh Ameer Hamza dkk
42
bertujuan untuk membuat usulan metode CNN-LSTM dan IMFO dalam
kalsifikasi COVID-19 melalui Chest X-ray Images. Hasil dari penelitian
tersebut adalah:
Gambar 2.13 Hasil Penelitian Literatur 1
Penelitian ini menyimpulkan bahwa penggunaan metode CNN-LSTM
dan optimasi usulan penelitian ini memiliki tingkat akurasi yang sangat
bagus dalam klasifikasi COVID-19.
2. Pada penelitian yang berjudul “Image classification using a hybrid lstm-
cnn deep neural network” tahun 2019, yang ditulis oleh Aditi, Mayank
Kumar Nagda dan Poovammal E bertujuan untuk mengetahui strategi
pembelajaran CNN-LSTM yang memiliki performa terbaik dengan
berbagai skenario dalam klasifikasi gambar. Penelitian ini
menyimpulkan bahwa metode CNN-LSTM memiliki nilai akurasi
99,29% pada klasifikasi MNIST handwritten digit dataset dan hasil
akurasi sebesar 85% pada klasifikasi IDC Breast cancer.
3. Pada penelitian yang berjudul “Malaria Parasite Detection from
Peripheral Blood Smear Images Using Deep Belief Networks” tahun

43
2017, yang ditulis oleh Dhanya Bibin, Madhu S. Nair dan P. Punitha
bertujuan untuk mengidentifikasi parasit malaria dalam sel darah
manusia menggunakan Deep Belief Networks (DBN). Penelitian ini
menggunakan model DBN dengan arsitektur 484-600-600-600-2.
Penelitian ini menghasilkan nilai akurasi 96,35%.
4. Pada penelitian yang berjudul “Detection Of Malaria Parasites In
Human Blood Cells Using Convolutional Neural Network” tahun 2023,
yang ditulis oleh Lusiana Efrizoni, Rais Amin dan Ahmad rizali
bertujuan untuk mendeteksi parasit malaria dalam sel darah manusia
menggunakan CNN dengan arsitektur ResNet. Penelitian ini
menghasilkan nilai akurasi seperti gambar dibawah:
Gambar 2.14 Hasil Penelitian Literatur 4
5. Pada penelitian yang berjudul “Data Science in biomedicine” tahun
2019, yang ditulis oleh Yovaninna Alarcon-Soto dkk bertujuan untuk
menunjukkan tugas Data Science dalam pengolahan data Biomedicine.
Pada penelitian ini menunjukkan bahwa Data Science dapat digunakan
dalam pengolahan data biologikal dan penelitian medis lainnya.

44
Tabel 2.3 Perbandingan Penelitian sejenis
No. Penulis Judul Dataset Metode Hasil

1. (Hamza et al., COVID-19 classification COVID-19 chest X- CNN-LSTM Arsitektur CNN-LSTM
2022) using chest X-ray images: ray images yang dikembangkan
A framework of CNN- memiliki tingkat akurasi
LSTM and improved max yang sangat bagus
value moth flame dalam klasifikasi
optimization COVID-19 melalui x-
ray images yaitu 98.5%.
2. (Aditi et al., Image classification Klasifikasi Gambar CNN-LSTM Penelitian ini
2019) using a hybrid lstm-cnn Multi-Kelas menelaborasi dua
deep neural network metode CNN dan
LSTM dan
menyimpulkan bahwa
penggabungan ini dapat
meningkatkan akurasi
dalam klasifikasi
gambar.
3. (Bibin et al., Malaria Parasite Parasit Malaria DBN Penelitian ini
2017) Detection from dalam sel darah menggunakan model
Peripheral Blood Smear manusia DBN dengan arsitektur
Images Using Deep Belief 484-600-600-600-2.
Networks Penelitian ini
menghasilkan nilai
akurasi 96,35%.
4. (Lusiana Efrizoni Detection Of Malaria Parasit Malaria CNN Penelitian ini
et al., 2023) Parasites In Human dalam sel darah menggunakan metode
Blood Cells Using manusia CNN dengan arsitektur
45
Convolutional Neural ResNet dan

Network mendapatkan hasil
akurasi sebesar 97%.
5. (Alarcón-Soto et Data Science in Biomedicine Data Science Data Science dapat
al., 2019) biomedicine digunakan dalam
pengolahan data
biologikal dan
penelitian medis
lainnya.
6. (Rais Amin, Pendeteksian Parasit Parasit Malaria CNN-LSTM Penelitian ini
2023) Malaria dalam Sel darah dalam sel darah menggunakan
Manusia Menggunakan manusia pembelajaran Deep
Deep Learning Learning dengan
metode CNN-LSTM
dan menghasilkan nilai
96,25% untuk training
accuracy dan 95,6%
untuk validation
accuracy
BAB III
METODOLOGI PENELITIAN
Pada proses perancangan sistem, dibuatlah kerangka kerja dalam bentuk skema.
Metodologi penelitian dijadikan panduan untuk menentukan tahap-tahap yang harus
dilakukan dalam penelitian. Tahap-tahap tersebut meliputi:
3.1 OSEMN Framework
Dalam penelitian ini, penulis menggunakan OSEMN Framework dalam pegolahan
Data Science. Berikut ini merupakan langkah-langkah pada OSEMN Framework:
Obtain Scrub Explore Model Interpret

• Menentutakan • Split dan • Membuat kategori • Membuat dan • Menampilkan hasil
Konsep penelitian penyamaan ukuran data melatih model uji validasi dan
• Mengumpulkan gambar pada • Ekstrak fitur dan klasifikasi parasit akurasi
dataset dataset augmentasi data malaria • Menampilkan hasil
prediksi sistem
Gambar 3.1 Alur Penelitian Menggunakan OSEMN Framework
3.1.1 Obtain(Pengumpulan data)
Pengumpulan data dan informasi yang penulis lakukan yaitu dengan menggunakan
studi pustaka dan mendapatkan hasil berupa dataset yang diambil dari National
46
47
Library of Medicine yang dikembangkan oleh Stefan Jaeger pada tahun 2018
https://data.lhncbc.nlm.nih.gov/public/Malaria/cell_images.zip yang dapat diakses
bebas untuk kepentingan pengembangan aplikasi dan pembelajaran. Dataset ini
nantinya akan digunakan sebagai data input sistem prediksi parasit malaria.
Dataset terdiri dari 27.558 gambar sel yang terbagi kedalam dua kategori yaitu
parasitized dan uninfected. Setiap kategori terdiri dari 13.779 gambar sel.
3.1.2 Scrub(Data Preparation)
Setelah seluruh data gambar berhasil dikumpulkan, data gambar tersebut nantinya
akan dibagi menjadi data training, data testing dan data validation. Selanjutnya
membuat konfigurasi untuk membaca path folder dataset dengan ratio data training
80%, validation data 20%. Pada penentuan rasio pembagian dataset ini, untuk rasio
pembagian data training dan data testing menggunakan metode Simple Hold-Out
Validation (Chollet, 2018), metode ini menjadi acuan standar dalam pembagian data
training dan validation dengan ratio 80:20 dan untuk ratio pembagian data training
dan data testing berdasarkan penelitian (Akromunnisa et al., 2019) yang
membandingkan antara nilai split 6:4, 7:3, 8:2 dan 9:1. Dari penelitian tersebut
disimpulkan bahwa ratio 9:1 menghasilkan nilai akurasi yang lebih besar dari ratio
yang lainnya.
Kemudian data dibagi menjadi 3 folder training, testing dan validation dan
semua gambar diberikan label sesuai dengan folder yang telah dibuat.
48
3.1.3 Explore(Eksplorasi data)
Pada tahap ini, semua data yang telah dikumpulkan dan dibagi menjadi folder
training, testing dan validation di samakan seluruh ukuran yaitu 64x64 piksel dan
kategori warnanya yaitu “rgb”(“red”,”green”,”blue”) kemudian diberikan label
kategori “categorial” yang dikarenakan setiap folder berisikan dua kelas kategori
yaitu “Parasitized” dan “Uninfected”. Kemudian untuk data pada folder training
akan di augmentasikan menggunakan modul Keras ImageDataGenerator. Data
training di augmentasi dengan mengubah skala gambar dengan skala 1/255, dan
gambar di rotasi dengan range=20, dan zoom range=0.05, width shift range=0.05,
height shift range=0.05, shear range=0.05 dan data gambar di flip secara horizontal.
Kemudian data pada folder validation akan di augmentasikan juga menggunakan
modul Keras ImageDataGenerator dengan mengubah skala gambar menjadi 1/255.
Data pada validation ini tidak dirotasi dan di flip dikarenakan nantinya akan
digunakan sebagai uji validasi model data training yang sudah diubah dengan data
validation yang skala gambarnya sama. Data pada folder testing tidak di
augmentasikan dikarenakan nantinya akan digunakan sebagai data uji tahap prediksi
model terhadap data yang asli.
3.1.4 Model(Perancangan Model)
Pada tahap ini penulis melakukan pembuatan model dari dataset yang ada untuk
mengenali gambar dan proses klasifikasi menggunakan algoritma atau metode
Convolutional Neural Network - Long Short Term Memory agar sistem dapat
mendeteksi parasit malaria.

49
Gambar 3.2 Arsitektur Model CNN-LSTM
Dalam proses ini model akan dilatih dengan mengoptimalkan multinomial
logistic regression menggunakan Stochastic Gradient Descent (SGD) (Lecun et al.,
2015) dan nilai momentum Nesterov (Botev et al., 2017). Model yang disesuaikan
dioptimalkan untuk hiper-parameter dengan metode pencarian grid search (Bergstra
& Bengio, 2012).
Pada proses pelatihan model ini akan digunakan arsitektur model yang telah
dibuat yang diberi nilai input_shape= 64x64 pixel, 3 channel gambar RGB
(“red”,”green”,”blue”), nilai kelas 2 dimana pada dataset memiliki 2 kelas,
kernel_size=(3 , 4 , 6) dan dengan nilai regression=0.0005. Penentuan nilai dari
epoch untuk pelatihan model adalah 50 yang dimana suatu perulangan dari proses
pelatihan pada satu kali sesi lewatan sebanyak 50 kali guna mendapatkan error
terkecil dan menghasilkan kinerja yang baik untuk model yang dibuat. Sedangkan
untuk kategori loss yang digunakan adalah 'binary_crossentropy', dan untuk

50
optimizer menggunakan 'SGD' dengan nilai learning rate = 1e-1 dan nilai
momentum= 0.9.
3.1.5 iNterpreting(Mengintrepretasikan hasil)
Pada tahap ini akan meninterpretasikan hasil pemodelan yang telah dilakukan yaitu
hasil akurasi pengujian model dan visualisasi hasil prediksi pendeteksi parasit
malaria.
Hasil akurasi ditentukan melalu hasil Precision, Recall, dan F1-score. Model
akan diuji tingkat akurasinya menggunakan confussion matrix dengan binary
classification untuk mengklasifikasi dan menentukan hasil akurasi model terhadap
prediksi kategori data yang Uninfected dan Parasitized. Nantinya semakin tinggi nilai
akurasi maka semakin bagus model yang telah dibuat.

BAB IV
HASIL DAN PEMBAHASAN
4.1 Obtain (Pengumpulan Data)

Pengumpulan data dan informasi yang penulis lakukan yaitu dengan
menggunakan studi pustaka dan mendapatkan hasil berupa dataset public yang
diambil dari National Library of Medicine yang telah dibuat dan dikembangkan oleh
Stefan Jaeger dan Feng Yang pada tahun 2018 yang didapat pada Gambar 4.1 dan
dapat diakses bebas untuk kepentingan pengembangan aplikasi dan pembelajaran.
Dataset ini nantinya akan digunakan sebagai data input sistem klasifikasi parasit
malaria.
Gambar 4.1 Sumber pengumpulan Dataset
51
52
Dataset pada Gambar 4.2 terdiri dari 27.558 gambar sel yang terbagi kedalam
dua kategori yaitu parasitized dan uninfected. Setiap kategori terdiri dari 13.779
gambar sel.
Gambar 4.2 Dataset Parasit Malaria
4.2 Scrub (Preparasi Data)

Dataset yang telah terkumpul akan melalui tahap preparasi data, selanjutnya dataset
dibagi menjadi 3 folder training, testing dan validation. Yang nantinya akan
digunakan dalam proses modeling, pengujian dan prediksi. Kemudian data tersebut
disamakan ukurannya dan diberikan label “1” untuk kategori parasitized dan label
“0” untuk kategori uninfected dengan source code pada Gambar 4.3 .
imagePaths = list(paths.list_images(DATASET))
random.seed(42)
random.shuffle(imagePaths)
i = int(len(imagePaths) * TRAIN_SPLIT)
trainPaths = imagePaths[:i]
testPaths = imagePaths[i:]
i = int(len(trainPaths) * VAL_SPLIT)
valPaths = trainPaths[:i]
trainPaths = trainPaths[i:]
53
datasets = [
("training", trainPaths, TRAIN_PATH),
("validation", valPaths, VAL_PATH),
("testing", testPaths, TEST_PATH)]
for (dType, imagePaths, baseOutput) in datasets:

print("[INFO] building '{}' split".format(dType))
if not os.path.exists(baseOutput):
print("[INFO] 'creating {}' directory".format(baseOutput))
os.makedirs(baseOutput)
for inputPath in imagePaths:
filename = inputPath.split(os.path.sep)[-1]
label = inputPath.split(os.path.sep)[-2]
labelPath = os.path.sep.join([baseOutput, label])
if not os.path.exists(labelPath):
print("[INFO] 'creating {}' directory".format(labelPath))
os.makedirs(labelPath)
p = os.path.sep.join([labelPath, filename])
shutil.copy2(inputPath, p)
Gambar 4.3 Source code Split Dataset.
Tabel 4.1 menunjukkan sebaran data yang terdapat pada folder training,
validation dan testing:
Tabel 4.1 Sebaran data hasil pembagian dataset
No. Nama folder Kategori Jumlah data

Parasitized Uninfected
1. cell_images(dataset) 13779 13779 27558
2. Training 9955 9887 19842
3. Validation 1098 1106 2204
4. Testing 2786 2726 5512
4.3 Explore (Eksplorasi data)

Semua data yang telah dikumpulkan dan dibagi menjadi folder training, testing dan
validation dan telah disamakan seluruh ukurannya yaitu 64x64 piksel kemudian
diberikan label kategori “categorial” yang dikarenakan setiap folder berisikan dua
54
kelas kategori yaitu “Parasitized” dan “Uninfected”. Kemudian untuk data pada
folder training akan di augmentasikan menggunakan modul Keras
ImageDataGenerator. Data training di augmentasi dengan mengubah skala gambar
dengan skala 1/255, dan gambar di rotasi dengan range=20, dan zoom range=0.05,
width shift range=0.05, height shift range=0.05, shear range=0.05 dan data gambar
di flip secara horizontal dan kategori warnanya yaitu “rgb”(“red”,”green”,”blue”).
Kemudian data pada folder validation akan di augmentasikan juga menggunakan
modul Keras ImageDataGenerator dengan mengubah skala gambar menjadi 1/255.
Data pada validation ini tidak dirotasi dan di flip dikarenakan nantinya akan
digunakan sebagai uji validasi model data training yang sudah diubah dengan data
validation yang skala gambarnya sama. Data pada folder testing tidak di
augmentasikan dikarenakan nantinya akan digunakan sebagai data uji tahap prediksi
model terhadap data yang asli. Gambar 4.4 adalah source code pada tahap eksplorasi
data ini:
NUM_EPOCHS = 25
BS = 32
trainAug = ImageDataGenerator(
rescale=1 / 255.0,
rotation_range=20,
zoom_range=0.05,
width_shift_range=0.05,
height_shift_range=0.05,
shear_range=0.05,
horizontal_flip=True,
fill_mode="nearest")
valAug = ImageDataGenerator(rescale=1 / 255.0)
trainGen = trainAug.flow_from_directory(
TRAIN_PATH,
class_mode="categorical",
target_size=(130, 130),
color_mode="rgb",
shuffle=True,
batch_size=32)
55
valGen = valAug.flow_from_directory(
VAL_PATH,
color_mode="rgb",
shuffle=False,
batch_size=BS)
testGen = valAug.flow_from_directory(
TEST_PATH,
color_mode="rgb",
shuffle=False,
batch_size=BS)
Gambar 4.4 Source Code Augmentasi data
4.4 Model(Perancangan Model)

Perancangan model pada proses klasifikasi parasit malaria ini menggunakan
algoritma atau metode Convolutional Neural Network - Long Short Term Memory.
Gambar 4.5 adalah source code arsitektur jaringan model yang dibentuk:
model = Sequential()
model.add(Conv2D(32, (3,3), activation = 'relu', input_shape = inputShape))
model.add(MaxPooling2D(2,2))
model.add(BatchNormalization(axis = -1))
model.add(Dropout(0.2))
model.add(Conv2D(32, (3,3), activation = 'relu'))
model.add(Conv2D(32, (3,3), activation = 'relu'))
model.add(TimeDistributed(Flatten()))
model.add(LSTM(512,return_sequences=False))
model.add(Dense(512, activation = 'relu'))
model.add(Dense(2, activation = 'softmax'))
model.compile(loss = 'categorical_crossentropy', optimizer = 'adam', metrics = ['accuracy'])
model.build(inputShape)
model.summary()
Gambar 4.5 Source Code arsitektur jaringan CNN-LSTM
Penelitian ini menggunakan input gambar dengan ukuran 64x64x3, tujuannya
adalah untuk membandingkan nilai akurasi berdasarkan ukuran gambar aslinya.
Arsitektur jaringan pada penelitian ini dijelaskan seperti penjelasan dibawah ini :
56
1. Proses Konvolusi pertama digunakan kernel berukuran 3x3 dan jumlah
filter sebanyak 64 filter , proses konvolusi ini adalah proses kombinasi
antara dua buah matriks yang berbeda untuk menghasilkan suatu nilai
matriks yang baru. Setelah proses konvolusi, maka ditambahkan sebuah
aktivasi fungsi yaitu RELU (Retrified Linear Unit). Fungsi aktivasi ini
bertujuan untuk mengubah nilai negative menjadi nol (menghilangkan
nilai negative dalam sebuah matriks hasil konvolusi). Hasil konvolusi
ini memiliki ukuran 64 x 64.
2. Proses pooling pertama. Penelitian ini menggunakan maxpooling untuk
mendapatkan nilai matriks yang baru hasil dari proses pooling.
Berdasarkan hasil pooling menghasilkan matriks baru berukuran 32x32
dari input hasil konvolusi pertama yang berukuran 64x64. Proses ini
menggunakan kernel pooling 3x3. Cara kerja maxpooling adalah
mengambil nilai paling maksimum berdasarkan pergeseran kernelnya
sebnayak nilai stridenya yaitu 2.
3. Proses Kovolusi kedua yaitu meneruskan hasil dari proses pooling
pertama yakni dengan input matriks gambar sebesar 32x32 pada 3
jumlah filter yaitu 32, 32 dan 128 filter dan dengan ukuran kernel 3x3.
Proses konvolsi kedua ini sama-sama menggunakan fungsi aktivasi
RELU. Proses ini menghasilkan gambar berukuran 32x32.
4. Proses Kovolusi ketiga yaitu meneruskan hasil dari proses konvolusi
kedua yakni dengan input matriks gambar sebesar 32x32 pada 3 jumlah
57
filter yaitu 64, 64 dan 256 filter dan dengan ukuran kernel 4x4. Proses
konvolsi ketiga ini sama-sama menggunakan fungsi aktivasi RELU.
Proses ini menghasilkan gambar berukuran 16x16.
5. Proses Kovolusi keempat yaitu meneruskan hasil dari proses konvolusi
ketiga yakni dengan input matriks gambar sebesar 16x16 pada 3 jumlah
filter yaitu 128, 128 dan 512 filter dan dengan ukuran kernel 6x6. Proses
konvolusi keempat ini sama-sama menggunakan fungsi aktivasi RELU.
Proses ini menghasilkan gambar berukuran 8x8.
6. Proses selanjutnya masuk ke proses pooling yang kedua, proses ini
hampir sama dengan proses pooling yang pertama, namun pada proses
ini menggunakan average pooling dengan ukuran kernel 8x8. Proses ini
menghasilkan nilai output akhir dari matriksnya yaitu gambar berukuran
1x1.
7. Selanjutnya Flatten. Pada tahap ini digunakan hanya satu hidden layer
pada jaringan MLP (Multi Layer Perceptron). Flatten disini mengubah
output pooling layer menjadi sebuah vector.
8. Layer LSTM. Pada tahap ini menggunakan 512 neuron hidden layer
dengan pengaturan “return_sequences=False”.
9. Proses terakhir adalah menggunakan aktivasi fungsi Softmax. Fungsi ini
secara spesifiknya biasa digunakan pada metode klasifikasi multinomial
logistic regression dan multiclass linear discriminant analisys.

58
Berdasarkan uraian penjelasan dari arsitektur jaringan diatas, dari proses
training didapatkan model dari arsitektur tersebut. Gambar 4.6 adalah model yang
terbentuk :
Model: "sequential"
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
conv2d (Conv2D) (None, 48, 48, 32) 896
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 24, 24, 32) 0
_________________________________________________________________
batch_normalization (BatchNo (None, 24, 24, 32) 128
_________________________________________________________________
dropout (Dropout) (None, 24, 24, 32) 0
_________________________________________________________________
conv2d_1 (Conv2D) (None, 22, 22, 32) 9248
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 11, 11, 32) 0
_________________________________________________________________
batch_normalization_1 (Batch (None, 11, 11, 32) 128
_________________________________________________________________
dropout_1 (Dropout) (None, 11, 11, 32) 0
_________________________________________________________________
conv2d_2 (Conv2D) (None, 9, 9, 32) 9248
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 4, 4, 32) 0
_________________________________________________________________
batch_normalization_2 (Batch (None, 4, 4, 32) 128
_________________________________________________________________
dropout_2 (Dropout) (None, 4, 4, 32) 0
_________________________________________________________________
flatten (Flatten) (None, 4, 128) 0
_________________________________________________________________
LSTM (LSTM) (None, 512) 1312768
_________________________________________________________________
dense (Dense) (None, 512) 262656
_________________________________________________________________
batch_normalization_3 (Batch (None, 512) 2048
_________________________________________________________________
dropout_3 (Dropout) (None, 512) 0
_________________________________________________________________
dense_1 (Dense) (None, 2) 1026
=================================================================
Total params: 1,598,274
Trainable params: 1,597,058
Non-trainable params: 1,216
Gambar 4.6 Hasil training model

Gambar 4.6 merupakan model yang terbentuk dari hasil training. Total
parameter yang terbentuk dari model sebanyak 1.598.274 neuron, dan parameter yang
59
akan di training sebanyak 1.597.058 neuron dan parameter yang tidak di training
sebanyak 1.216 neuron.
4.4.1 Convolution Layer

Konvolusi merupakan proses menggambungkan dua deret angka pada suatu gambar
sehingga menghasilkan deret angka yang baru, dengan kata lain gambar tersebut
dimanipulasi dengan menggunakan external mask / subwindows untuk menghasilkan
citra yang baru, angka konvolusi pada citra tersebut berbentuk matriks array. Pada
pemodelan ini digunakan input gambar dengan ukuran pixel 64x64x3, yang
menjelaskan ukuran tinggi dan lebar pixel gambar sebesar 64 pixel dan gambar input
tersebut memiliki 3 channel yaitu red, green, dan blue atau yang biasa disebut dengan
RGB.
Setiap channel piksel memiliki nilai matriks yang berbeda-beda. Input akan di
konvolusi dengan nilai filter yang sudah ditentukan. Filter merupakan blok lain atau
kubus dengan tinggi dan lebar yang lebih kecil namun kedalaman yang sama yang
tersapu di atas gambar dasar atau gambar asli. Filter digunakan untuk menentukan
pola apa yang akan dideteksi yang selanjutnya dikonvolusi atau dikalikan dengan nilai
pada matriks input, nilai pada masingmasing kolom dan baris pada matriks sangat
bergantung pada jenis pola yang akan dideteksi. Jumlah filter pada konvo ini
sebanyak 64 dengan ukuran kernel (3x3), ini artinya gambar yang dihasilkan dari
hasil konvolusi akan sebanyak 64 fitur map.
Berdasarkan arsitektur jaringan diatas digunakan aktivasi ReLU (Rectified
Linear Unit) setelah proses konvolusi. Fungsi dari aktivasi ini adalah melakukan
60
“treshold” dari 0 hingga infinity. Nilai yang ada pada hasil konvolusi yang bernilai
negatif akan diubah dengan aktivasi ini menjadi nol dan yang lainnya sampai infinity.
4.4.2 Proses Pooling

Pooling atau penggabungkan merupakan proses dari CNN dimana matriks input
disederhanakan menjadi matriks yang baru. Pada penelitian ini digunakan metode
max pooling dan average pooling pada proses poolingnya dimana diambil nilai
terbesar dari matriks input dan menghasilkan matriks baru sebagai outputnya.
4.4.3 LSTM Layer

LSTM merupakan varian dari unit Recurrent Neural Network (RNN). LSTM secara
umum terdiri dari cell, input gate, output gate, dan forget gate. LSTM neural network
sangat cocok untuk mengklasifikasi, memproses, dan membuat prediksi berdasarkan
data time series karena mungkin ada kelangkaan durasi yang tidak diketahui di antara
peristiwa penting dalam rangkaian waktu.
LSTM cell mengambil masukan dan menyimpannya untuk beberapa waktu.
Secara intuitif, input gate mengontrol sejauh mana nilai baru akan berjalan ke dalam
cell, forget gate mengontrol sejauh mana nilai tetap di dalam cell, dan output gate
mengontrol sejauh mana nilai dalam cell digunakan untuk menghitung aktivasi
keluaran dari unit LSTM. Pada penelitian ini menggunakan 512 hidden unit pada
layer LSTM ini.
4.4.4 Fully Connected Layer

Proses terakhir adalah fully-connected. Hasil dari proses terakhir dari model
yang ada pada feature extraction layer masih berbentuk multidimensional array,
61
sehingga harus dilakukan reshape feature map menjadi sebuah vector agar bisa
digunakan sebagai input dari fully-connected layer. Setelah itu diberi fungsi dense.
Dense adalah fungsi untuk menambahkan layer pada fully connected.
Pada arsitektur jaringan CNN-LSTM ini menggunakan dense sebanyak 512
unit. Unit tersebut artinya jumlah node yang harus ada di hidden layer, nilainya antara
jumlah input node dan output node. Fungsi dari fully connected layer ini adalah untuk
melakukan transformasi pada dimensi data agar data dapat diklasifikasikan secara
linear. Kemudian di inialisasi layer outputnya, yang berupa 2 node, karena dalam
klasifikasi ini terdapat 2 kelas yaitu Parasitized dan Uinfected.
4.5 iNterpreting
Interpretasi hasil pemodelan yang telah dilakukan yaitu hasil akurasi pengujian
model dan visualisasi hasil prediksi pendeteksi parasit malaria. Pada pengujian
akurasi prediksi ini model yang telah tersimpan dalam malaria_model.h5 akan di
evaluasi dengan cara pembuatan prediksi pada data yang terdapat pada folder testing
dan selanjutnya dapat menentukan label dengan probabilitas yang terbesar untuk
setiap gambar yang ada. Dan hasil prediksi model ini akan disimpan ke dalam
prediction_model.h5. Gambar 4.7 adalah source code yang dibuat untuk menguji
akurasi:
model.compile(loss = 'categorical_crossentropy', optimizer = 'adam', metrics = ['accuracy'])

model.fit(X_train, y_train, epochs = 5, batch_size = 32)
model.save(‘prediction_model.h5’)
Gambar 4.7 Source code Uji Akurasi Model
Dengan menggunakan iterasi epoch sebanyak 5 kali selanjutnya didapatkan
hasil akurasi training model pada Gambar 4.8.

62
Epoch 1/5
515/515 [==============================] - 166s 206ms/step - loss: 0.5092 - accuracy: 0.7889
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Gambar 4.8 Hasil akurasi training model
Uji validasi juga dibutuhkan untuk menentukan nilai loss dan tingkat akurasi
model terhadap data validation. Gambar 4.9 adalah source code untuk menentukan
hasil akurasi validasi model.
predict = model.evaluate(X_test, y_test)

print("Loss: ",predict[0])
print("Accuracy: ",predict[1]*100)
Gambar 4.9 Source code uji validasi model
Dari uji validasi pada Gambar 4.9 didapatkan hasil sebagai berikut:
129/129 [==============================] - 6s 40ms/step - loss:

0.1232 - accuracy: 0.9626
Loss: 0.12318982928991318
Accuracy: 96.25577330589294
Gambar 4.10 Hasil uji validasi model
Berdasarkan Gambar 4.10 menunjukan hasil akurasi training model, dapat
diketahui besar loss 14,1% dengan akurasi yang tinggi sebesar 95,6%. Sedangkan
untuk data validasi, nilai loss yaitu sebesar 12,3% dan akurasi sebesar 96,25%. Yang
berarti menunjukkan akurasi model sebesar 96,25%. Dengan hasil tersebut dapat
dibuktikan bahwa pemodelan berhasil dan sistem dapat dengan sangat baik
membedakan data gambar yang Parasitized dan Uninfected.

63
Setelah pemodelan telah selesai dan tahap finalisasi, kemudian model tersebut
dihubungkan pada program prediksi agar dapat dijalankan, digunakan, dan diuji
dengan data pada folder testing yang berisikan 5.512 data gambar yang terbagi
kedalam 2 folder parasitized dan uninfected yang berisikan 2.726 data gambar dan
uninfected yang berisikan 2.786 data gambar . Dalam tahap pengujian model terhadap
data pada gambar yang terdapat pada folder testing menghasilkan nilai akurasi yang
sangat bagus yaitu 96% yang dapat dilihat pada Gambar , dimana hasil ini sangat
bagus yang membuktikan bahwa sistem dapat megenali dan membedakan gambar
yang Parasitized dan Uininfected.
precision Recall F1-score Support

Parasitized 0.96 0.95 0.96 2726
Uninfected 0.95 0.96 0.96 2786
Accuracy 0.96 5512
Macro avg 0.96 0.96 0.96 5512
Weighted avg 0.96 0.96 0.96 5512
Gambar 4.11 Hasil uji akurasi pada data testing
Dari data pada Gambar 4.11 didapatkan hasil bahwa dalam pengenalan dalam
kelas Parasitized tingkat akurasi pegenalan adalah 96 % dari data gambar sebanyak
2.726, dan tingkat akurasi yang sama 96 % pada pengenalan kelas Uninfected. Dan
rata-rata hasil dari kedua kelas tersebut adalah 96%. Data ini membuktikan bahwa
dalam pengenalan kelas Parasitized data yang berhasil di prediksi dengan benar
adalah sebanyak 2.644 data gambar, dan yang gagal adalah 82 data gambar.
Sedangkan pada kelas Uninfected data yang berhasil diprediksi dengan benar adalah
sebanyak 2.702 data gambar dan yang gagal adalah sebanyak 84 data gambar.
64
Dari hasil tingkat akurasi pada penelitian ini, dapat dibandingkan dengan
beberapa literatur sejenis yang penelitiannya akan dijabarkan satu persatu berikut ini:
1. Pada penelitian yang berjudul “Malaria Parasite Detection From
Peripheral Blood Smear Images Using Deep Belief Networks” pada
tahun 2017 yang ditulis oleh Dhanya Bibin, Madhu S. Nair dan P.
Punitha. Penelitian ini bertujuan untuk mendeteksi parasit malaria
dalam sel darah manusia menggunakan Deep Belief Network (DBN).
Pada penelitian ini model DBN bertujuan untuk mengklasifikasikan
4.100 gambar sel darah manusia ke dalam kelas parasit dan non-parasit.
Arsitektur DBN pada penelitian ini menggunakan 484 nodes visible
layer dan memiliki 2 kelas output layer dengan 4 lapisan hidden layer
yang mengandung 600 nodes pada setiap layernya. Penelitian ini
menghasilkan nilai akurasi sebesar 96,3% dalam dalam proses deteksi
sel darah yang mengandung parasit malaria dan yang tidak dan memiliki
selisih lebih besar 0,3% dalam akurasi dibandingkan penelitian ini.
2. Pada penelitian yang berjudul “Machine learning approach for
automated screening of malaria parasite using light microscopic
images” pada tahun 2013 yang ditulis oleh Dev Kumar Das,
Madhumala Ghosh, Malika Pal, Asok K. Maiti dan Chandan
Chakraborty. Tujuan dari penelitian ini adalah untuk membahas
pengembangan karakterisasi dan klasifikasi parasit malaria berbantuan
komputer dengan menggunakan pendekatan machine learning

65
berdasarkan gambar mikroskopis cahaya dari sel darah manusia.
Penelitian ini menggunaka metode pembelajaran Bayessian dan Support
Machine Learning (SVM) dalam pengklasifikasian parasit malaria.
Hasil penelitian ini menunjukkan bahwa metode Bayessian memiliki
hasil akurasi tertinggi yaitu 84% sementara SVM memiliki hasil akurasi
83,5% dengan selisih lebih rendah 12,5% dari hasil akurasi penelitian
ini.
3. Pada penelitian yang berjudul “Klasifikasi Jenis dan Fase Parasit
Malaria Plasmodium Falciparum dan Plasmodium Vivax Dalam Sel
Darah Merah Menggunakan Support Vector Machine. Penelitian ini
menggunaka metode pembelajaran Support Machine Learning (SVM)
dalam pengklasifikasian parasit malaria. Dalam pengklasifikasian kelas
parasit malaria, penelitian ini menghasilkan nilai akurasi 81,35%
dengan selisih 13,65% lebih rendah dari hasil akurasi penelitian ini.
4. Pada penelitian yang berjudul “Automated image processing method for
the diagnosis and classification of malaria on thin blood smears” pada
tahun 2006 yang ditulis oleh Nicholas E. Ross, Charles J. Pritchard,
David M. Robin dan Adriano G. Duse. Penelitian ini bertujuan untuk
menerapkan algoritma imge processing dalam pengidentifikasian parasit
malaria dalam sel darah manusia. Dalam pengklasifikasianya penelitian
ini menggunakan metode backpropogation feedforward neural network.
Penelitian ini mendapatkan hasil akurasi 73% dalam klasifikasi parasit

66
malaria dengan selisih 23% lebih rendah dibandingkan hasil akurasi
penelitian ini.
Perbandingan nilai akurasi diatas dapat dilihat pada Tabel 4.2.
Tabel 4.2 Perbandingan nilai Akurasi dengan literatur sejenis
No. Penelitian Akurasi

1. (Rais Amin, 2023) 96%
2. (Bibin et al., 2017) 96,3%
3. (Das et al., 2013) 84%
4. (Permata et al., 2012) 81,35%
5. (Ross et al., 2006) 73%
Hasil model prediksi yang tersimpan dalam prediction_model.h5 selanjutnya
akan digunakan dalam visualisasi hasil prediksi sistem terhadap gambar sel yang ada
pada data testing. Gambar 4.12 adalah source code untuk menampilkan hasil
visualisasi prediksi gambar sel.
app = Flask(__name__)
MODEL_PATH = 'model/malariaModel.h5'
model = load_model(MODEL_PATH)
def model_predict(img_path, model):

img = image.load_img(img_path, target_size=(64, 64))
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
images = np.vstack([x])
preds = model.predict(images, batch_size=16)
print(preds)
return preds
@app.route('/', methods=['GET'])
def home():
return render_template('home.html')
@app.route('/index', methods=['GET', 'POST'])

def index():
return render_template('index.html')
@app.route('/predict', methods=['GET', 'POST'])

def upload():
if request.method == 'POST':
f = request.files['file']
67
basepath = os.path.dirname(__file__)
file_path = os.path.join(
basepath, 'uploads', secure_filename(f.filename))
f.save(file_path)
preds = model_predict(file_path, model)

result = str(preds[0])
if preds > 0:
return "Uninfected"
else:
return "Infected"
return None
if __name__ == '__main__':
app.run(debug=True)
Gambar 4.12 Source code visualisasi klasifikasi parasit malaria
Pada proses menampilkan visualisasi hasil prediksi ini, data input berupa data
gambar dari folder testing yang berisikan 5.512 gambar yang tergolong kedalam 2
kelas dengan masing-masing kelas terdapat 2.786 gambar Uninfected dan 2.726
gambar Parasitized. Data input dibaca menggunakan modul OpenCV dan di resize
menjadi 64x64 piksel. Kemudian data diubah kedalam bentuk array guna
memudahkan proses prediksi kedalam bentuk matriks. Data yang telah diubah
tersebut akan diberi label “Parasitized” jika nilai prediksi = 1 dan label “Uninfected”
jika nilai prediksi = 0. Berikut adalah hasil dari visualisasi klasifikasi parasit malaria:
Gambar 4.13 Halaman utama visualisasi klasifikasi

68
Gambar 4.13 merupakan halaman utama sederhana untuk menampilkan upload

file gambar yang akan diklasifikasi. Berikut adalah contoh dari hasil klasifikasi dari
gambar yang telah di upload:
Gambar 4.14 Hasil klasifikasi dari upload gambar uninfected
Gambar 4.14 menunjukkan bahwa sistem dapat mengklasifikasi gambar yang

telah diupload dan memberikan hasil bahwa gambar tersebut termasuk klasifikasi
gambar kategori uninfected.
69
Gambar 4.15 Hasil klasifikasi dari upload gambar infected
Gambar 4.15 menunjukkan bahwa sistem dapat mengklasifikasi gambar yang

telah diupload dan memberikan hasil bahwa gambar tersebut termasuk klasifikasi
gambar kategori infected.
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan pembahasan yang sudah diuraikan, maka dapat ditarik kesimpulan
sebagai berikut:
1. Metode Deep Learning yang diterapkan menggunakan arsitektur jaringan CNN-
LSTM pada penelitian ini menggunakan input shape berukuran 64x64x3, ukuran
filter 3x3, Jumlah Epoch sebanyak 50. Data yang digunakan untuk proses training
model sebanyak 19.842 pada folder training dan 2.204 data pada folder
validation. Menghasilkan tingkat akurasi training dan validation dalam
melakukan deteksi parasit malaria sebesar 96,25% untuk training accuracy dan
95,6% untuk validation accuracy. Dengan hasil tersebut dapat dibuktikan bahwa
pemodelan berhasil dan sistem dapat dengan sangat baik membedakan data
gambar yang Parasitized dan Uninfected.
2. Penelitian ini menggunakan data testing sebanyak 5.512 gambar dimana per
kategori terdapat 2.726 gambar pada kelas Parasitized dan 2.786 gambar pada
kelas Uninfected untuk diujikan kedalam model yang telah dibuat. Hasil testing
menghasilkan tingkat akurasi baru dalam melakukan pendeteksi parasit malaria
sebesar 96%. Dengan hasil tersebut dapat dibuktikan bahwa pemodelan berhasil
dan sistem menghasilkan tingkat akurasi yang sangat baik dalam pengkategorian
dan dapat dengan sangat baik membedakan dan memberikan label yang benar
70
71
pada data gambar yang Parasitized dan Uninfected, serta kombinasi fitur tata
letak CNN dan LSTM sangat meningkatkan klasifikasi.
5.2 Saran
Adapun saran yang diberikan pada penulisan ini sebagai berikut:
1. Penelitian selanjutnya diharapkan dapat meningkatkan nilai akurasi pada hasil
training model.
2. Diharapkan penelitian ini dapat dikembangkan dan diaplikasikan pada
pengembangan Medical Image Analysis yang lainnya.
3. Membandingkan model arsitektur jaringan Deep Learning lainnya untuk
mengetahui hasil maksimal dari sistem prediksi ini.
4. Penelitian ini dapat dikembangkan kedalam sebuah aplikasi berbasis web maupun
smartphone.
DAFTAR PUSTAKA
Aditi, Nagda, M. K., & Poovammal, E. (2019). Image classification using a hybrid
lstm-cnn deep neural network. International Journal of Engineering and
Advanced Technology, 8(6), 1342–1348.
https://doi.org/10.35940/ijeat.F8602.088619
Ahmad, A. (2017). Mengenal Artificial Intelligence, Machine Learning, Neural
Network, dan Deep Learning. June.
Akromunnisa, K., Hidayat, R., Informatika, J. T., & Adisucipto, J. L. (2019).
KLASIFIKASI DOKUMEN TUGAS AKHIR (SKRIPSI) MENGGUNAKAN K-
NEAREST NEIGHBOR. 4(1), 69–75.
Al-Waisy, A. S., Qahwaji, R., Ipson, S., & Al-Fahdawi, S. (2017). A multimodal
biometrie system for personal identification based on deep learning approaches.
Proceedings - 2017 7th International Conference on Emerging Security
Technologies, EST 2017, September, 163–168.
https://doi.org/10.1109/EST.2017.8090417
Alarcón-Soto, Y., Espasandín-Domínguez, J., Guler, I., Conde-Amboage, M., Gude-
Sampedro, F., Langohr, K., Cadarso-Suárez, C., & Gómez-Melis, G. (2019).
Data Science in Biomedicine. September. http://arxiv.org/abs/1909.04486
Bergstra, J., & Bengio, Y. (2012). Random search for hyper-parameter optimization.
Journal of Machine Learning Research, 13, 281–305.
Bibin, D., Nair, M. S., & Punitha, P. (2017). Malaria Parasite Detection from
Peripheral Blood Smear Images Using Deep Belief Networks. IEEE Access, 5,
9099–9108. https://doi.org/10.1109/ACCESS.2017.2705642
Botev, A., Lever, G., & Barber, D. (2017). Nesterov’s accelerated gradient and
momentum as approximations to regularised update descent. Proceedings of the
International Joint Conference on Neural Networks, 2017-May(2), 1899–1903.
https://doi.org/10.1109/IJCNN.2017.7966082
Byrne, C., Farnham, B., Tokyo, S., Boston, B., Sebastopol, F., & Beijing, T. (2017).
Development Workflows for Data Scientists. O’Reilly. http://oreilly.com/safari
Center for Disease Control and Prevention. (2018). CDC Parasites.
https://www.cdc.gov/parasites/malaria/index.html
Chollet, F. (2018). Deep Learning with Python. In 2018 21st International
Conference on Information Fusion, FUSION 2018.
https://doi.org/10.23919/ICIF.2018.8455530
Das, D. K., Ghosh, M., Pal, M., Maiti, A. K., & Chakraborty, C. (2013). Machine
72
73
learning approach for automated screening of malaria parasite using light

microscopic images. Micron, 45, 97–106.
https://doi.org/10.1016/j.micron.2012.11.002
Dineva, K., & Atanasova, T. (2018). Osemn Process for Working Over Data
Acquired By Iot. 7(13), 47–53.
Dinov, I. D. (2018). Data science and predictive analytics: Biomedical and health
applications using R. In Data Science and Predictive Analytics: Biomedical and
Health Applications using R. https://doi.org/10.1007/978-3-319-72347-1
Eka Putra, W. S. (2016). Klasifikasi Citra Menggunakan Convolutional Neural
Network (CNN) pada Caltech 101. Jurnal Teknik ITS, 5(1).
https://doi.org/10.12962/j23373539.v5i1.15696
Ezer, D., & Whitaker, K. (2019). Data science for the scientific life cycle. ELife, 8, 1–
10. https://doi.org/10.7554/eLife.43979
Hamza, A., Wang, S.-H., Alqahtani, A., Alsubai, S., Binbusayyis, A., Hussein, H. S.,
Markus Martinetz, T., & Alshazly, H. (2022). COVID-19 classification using
chest X-ray images: A framework of CNN-LSTM and improved max value
moth flame optimization. Frontiers in Public Health Frontiersin.Org.
Hendrian, S. (2018). Algoritma Klasifikasi Data Mining Untuk Memprediksi Siswa
Dalam Memperoleh Bantuan Dana Pendidikan. Faktor Exacta, 11(3), 266–274.
https://doi.org/10.30998/faktorexacta.v11i3.2777
Kartika, A., Irawan, B., & Triyanto, D. (2016). Prediksi Wilayah Rawan Kebakaran
Hutan dengan Metode Jaringan Syaraf Tiruan Propagasi Balik (Study Kasus :
Daerah Kabupaten Kuburaya). Coding Jurnal Komputer Dan Aplikasi Untan,
4(2), 66–75.
Kumari, K., Bhardwaj, M., & Sharma, S. (2020). OSEMN Approach for Real Time
Data Analysis. International Journal of Engineering and Management Research,
10(02), 107–110. https://doi.org/10.31033/ijemr.10.2.11
Lecun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521(7553), 436–
444. https://doi.org/10.1038/nature14539
lhncbc.nlm.nih.gov,. (n.d.). https://lhncbc.nlm.nih.gov/publication/pub9932
Lusiana Efrizoni, Rais Amin, & Ahmad Rizali. (2023). Detection Of Malaria
Parasites In Human Blood Cells Using Convolutional Neural Network. JAIA -
Journal of Artificial Intelligence and Applications, 2(2), 8–14.
https://doi.org/10.33372/jaia.v2i2.947
Millar, S. B., & Cox-Singh, J. (2015). Human infections with Plasmodium knowlesi-
zoonotic malaria. Clinical Microbiology and Infection, 21(7), 640–648.
https://doi.org/10.1016/j.cmi.2015.03.017
74
Nugroho, A., & Subanar, S. (2013). Klasifikasi Naïve Bayes untuk Prediksi
Kelahiran pada Data Ibu Hamil. Bimipa, 23(3), 297–308.
Nurhikmat, T. (2018). Implementasi Deep Learning Untuk Image Classification
Menggunakan Algoritma Convolutional Neural Network (CNN) Pada Citra
Wayang Golek. In Mathematics Education Journal (Vol. 1, Issue 1).
https://doi.org/10.29333/aje.2019.423a
Patterson, J., & Gibson, A. (2017). Deep learning A: PRACTITIONER’S
APPROACH. In O’Reilly (Vol. 29, Issue 7553).
Perez, L., & Wang, J. (2017). The Effectiveness of Data Augmentation in Image
Classification using Deep Learning. http://arxiv.org/abs/1712.04621
Permata, E., Purnama, I. K. E., & Purnomo, M. H. (2012). Klasifikasi Jenis Dan Fase
Parasit Malaria Plasmodium Falciparum Dan Plasmodium Vivax Dalam Sel
Darah Merah Menggunakan Support Vector Machine One Against One. Setrum,
1(2), 1–8.
Poostchi, M., Silamut, K., Maude, R. J., Jaeger, S., & Thoma, G. (2018). Image
analysis and machine learning for detecting malaria. Translational Research,
194(2018), 36–55. https://doi.org/10.1016/j.trsl.2017.12.004
PUSDATINKemenkesRI. (2016). InfoDatin-Malaria-2016.pdf.
Putri, R. K. S. C. (2018). Implementasi Deep Learning Menggunakan Metode
Convolutional Neural Network Untuk Klasifikasi Gambar. Mathematics
Education Journal, 1(1), 75. https://doi.org/10.29333/aje.2019.423a
Rajaraman, S., Antani, S. K., Poostchi, M., Silamut, K., Hossain, M. A., Maude, R.
J., Jaeger, S., & Thoma, G. R. (2018). Pre-trained convolutional neural networks
as feature extractors toward improved malaria parasite detection in thin blood
smear images. PeerJ, 2018(4), 1–17. https://doi.org/10.7717/peerj.4568
Ross, N. E., Pritchard, C. J., Rubin, D. M., & Dusé, A. G. (2006). Automated image
processing method for the diagnosis and classification of malaria on thin blood
smears. Medical and Biological Engineering and Computing, 44(5), 427–436.
https://doi.org/10.1007/s11517-006-0044-2
Saadah, S. (2018). Sistem Peredaran Darah Manusia. 8 Februari, 1–58.
https://idschool.net/smp/sistem-peredaran-darah-manusia/
Sang, D. V., Van Dat, N., & Thuan, D. P. (2017). Facial expression recognition using
deep convolutional neural networks. Proceedings - 2017 9th International
Conference on Knowledge and Systems Engineering, KSE 2017, 2017-
Janua(June), 130–135. https://doi.org/10.1109/KSE.2017.8119447
Schmidhuber, J. (2015). Deep Learning in neural networks: An overview. Neural
Networks, 61, 85–117. https://doi.org/10.1016/j.neunet.2014.09.003
75
Smith, L. N. (2017). Cyclical learning rates for training neural networks. Proceedings
- 2017 IEEE Winter Conference on Applications of Computer Vision, WACV
2017, April, 464–472. https://doi.org/10.1109/WACV.2017.58
Srivasta, N., Hinton, G., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R. (2014).
Dropout: A simple Way to Prevent Neural Networks from Overfitting. Physics
Letters B, 299(3–4), 345–350. https://doi.org/10.1016/0370-2693(93)90272-J
WHO. (2022). World malaria report 2022. In World Health Organization.
https://www.who.int/teams/global-malaria-programme/reports/world-malaria-
report-2021
Zufar, M., & Setiyono, B. (2016). Convolutional Neural Networks Untuk Pengenalan
Wajah Secara Real-time. Jurnal Sains Dan Seni ITS, 5(2), 128862.

Skripsi Rais

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Skripsi Rais

Diunggah oleh

Hak Cipta:

Format Tersedia

SKRIPSI

KLASIFIKASI PARASIT MALARIA DALAM SEL DARAH

Diajukan Sebagai Syarat Untuk Menyelesaikan

Program Studi Teknik Informatika

Kata Kunci : Malaria, Data Science, Deep Learning, Convolutional Neural

Assalamu’alaikum Wr. Wb.

melimpahkan karunia, nikmat dan anugerah-Nya sehingga penulis dapat

“Klasifikasi Parasit Malaria dalam Sel Darah Manusia menggunakan Deep

itu, penulis ingin mengucapkan terima kasih banyak kepada :

1. Bapak Dr. Harris Simaremare, MT., Ketua Yayasan Komputasi Riau

penguji dalam sidang komprehensif skripsi penulis.

3. Bapak Rahmaddeni, M.Kom., Wakil Ketua I bidang akademik.

5. Bapak Junadhi, M.kom., Wakil Ketua III bidang kemahasiswaan, sekaligus

sebagai Dosen Pembimbing penulis.

6. Bapak M. Khairul Anam, M.Kom., Ketua Program Studi Teknik Informatika

HALAMAN JUDUL ............................................................................................ 1

BAB I PENDAHULUAN ..................................................................................... 1

BAB II LANDASAN TEORI & TINJAUAN PUSTAKA ................................ 9

BAB III METODOLOGI PENELITIAN .......................................................... 46

BAB IV HASIL DAN PEMBAHASAN ............................................................. 51

BAB V PENUTUP ................................................................................................ 68

DAFTAR PUSTAKA ........................................................................................... 72

No. Tabel Halaman

2.1 Perbandingan ANN, CNN dan RNN 31

No. Gambar Halaman

2.1 Diagram Kecerdasan Buatan 17

1.1 Latar Belakang

Penyakit Malaria masih merupakan masalah kesehatan masyarakat yang

Wilayah Mediterania Timur dengan 2,1% (WHO, 2022).

Penemuan kasus malaria dilakukan berdasarkan gejala klinis, melalui

pemeriksaan sediaan darah yang dilakukan dengan konfirmasi laboratorium

menggunakan mikroskop maupun Rapid Diagnostik Test (RDT). Tingkat akurasi

malaria endemik (Rajaraman et al., 2018).

Beberapa dataset malaria telah dikembangkan guna membantu dalam hal

pemeriksaan dan diagnosis penyakit malaria. Penelitian ini meggunakan dataset

(Lhncbc.Nlm.Nih.Gov) yang berisikan repositori sel tersegmentasi dari aktivitas

Hill National Center for Biomedical Communications (LHNCBC), yang tergabung

dalam bagian National Library of Medicine (NLM). Dataset ini diambil

menggunakan aplikasi seluler yang telah dikembangkan yang berjalan pada

bangladesh. Kamera yang terpasang pada smartphone memperoleh gambar slide

untuk setiap bidang pandang mikroskopis. Gambar-gambar tersebut dianotasikan

Research Unit di Bangkok, Thailand. Peneliti NLM menerapkan algoritma berbasis

dan sel yang tidak terinfeksi (Uninfected)

Jumlah, kompleksitas, dan kecepatan agregasi biomedis dan data layanan

kesehatan akan meningkat dengan cepat selama beberapa dekade berikutnya.

yang dapat menggambarkan protokol analitik prediktif yang umum untuk

Prosesnya dimulai dengan mengidentifikasi masalah, diikuti dengan menentukan

sumber data dan meta-data, pembersihan, penyelarasan komponent data,

kesehatan, termasuk penyakit malaria.

Sistem diagnosis otomatis bertujuan untuk melakukan tugas pemeriksaan

obyektif, dapat diandalkan, dan efisien untuk melakukannya. Sistem diagnosis

otomatis dapat dirancang dengan memahami keahlian diagnostik dan

merepresentasikannya dengan algoritma pemrosesan gambar, analisis, dan

dirancang menggunakan proses penerapan metode Machine Learning (ML),

yang diinginkan. Mayoritas sistem diagnosis otomatis berbasis analisis gambar

menggunakan ML dengan representasi hand-engineered features dalam pengambilan

pada gambar. Untuk mengatasi tantangan dalam perancangan hand-engineered

dalam mencapai kesuksesan yang signifikan (Lecun et al., 2015).

Model DL menggunakan lapisan unit kaskade non-linier untuk menemukan

pembelaaran yang kompleks, fungsi pengambilan keputusan non-linier, yang

dihasilkan dalam ekstraksi dan klarifikasi end-to-end (Schmidhuber, 2015). Tidak

ML, model DL menunjukkan peningkatan kinerja dengan peningkatan ukuran data

(Srivasta et al., 2014).

Dalam penulisan ini, penulis akan menggunakan model DL dengan