Anda di halaman 1dari 87

SKRIPSI

HALAMAN JUDUL

KLASIFIKASI PARASIT MALARIA DALAM SEL DARAH


MANUSIA MENGGUNAKAN DEEP LEARNING

Diajukan Sebagai Syarat Untuk Menyelesaikan


Pendidikan Program Strata-1 Pada
Program Studi Teknik Informatika

Oleh :

RAIS AMIN
NIM : 20.10.031.802.119

Program Studi Teknik Informatika


Sekolah Tinggi Manajemen Informatika dan Komputer Amik Riau
2023
HALAMAN PENGESAHAN SKRIPSI

i
HALAMAN TANDA LULUS UJIAN SKRIPSI

ii
PENGAKUAN KEASLIAN KARYA

iii
ABSTRAK
Malaria adalah penyakit dalam darah yang disebabkan oleh parasit Plasmodium
yang ditularkan oleh gigitan nyamuk Anopheles betina. Ahli mikroskopis biasanya
memeriksa sel darah untuk mendiagnosis penyakit malaria ini. Namun, akurasi
mereka tergantung pada kualitas alat dan keahlian dalam mengklasifikasikan dan
menghitung sel parasit dan yang tidak terinfeksi. Pemeriksaan semacam itu akan
sangat sulit dalam proses diagnosis skala besar dan menghasilkan kualitas yang
buruk. Beberapa dataset malaria telah dikembangkan, diantaranya adalah dataset yang
dikembangkan oleh LHNVBC yang berisikan 27.558 data gambar sel. Proses
pengolahan data science adalah salah satu proses yang dapat menggambarkan
protokol analitik prediktif yang umum untuk diinterogasikan pada dataset biomedis
dan kesehatan yang besar dan kompleks. Dalam penelitian ini dataset malaria akan di
proses melalui pengolahan data science dengan pembelajaran Deep Learning
menggunakan model Convolutional Neural Network – Long Short-Term Memory
dimana sistem akan melalui pelatihan dan kemudian dapat mengklasifikasi parasit
malaria dalam sel darah manusia. Hasil akurasi menjadi tolak ukur seberapa akurat
pembelajaran yang diterima untuk mengenali data gambar sel yang menjadi input
pada sistem sebanyak 95,6 % dan 96% setelah diuji coba pada data testing.

Kata Kunci : Malaria, Data Science, Deep Learning, Convolutional Neural


Network, Long Short-Term Memory

iv
KATA PENGANTAR

Assalamu’alaikum Wr. Wb.

Puji syukur senantiasa penulis panjatkan atas kehadirat Allah SWT yang telah

melimpahkan karunia, nikmat dan anugerah-Nya sehingga penulis dapat

menyelesaikan penelitian sampai akhir proses penulisan skripsi ini dengan judul

“Klasifikasi Parasit Malaria dalam Sel Darah Manusia menggunakan Deep

Learning”. Tak lupa shalawat serta salam senantiasa dihaturkan kepada junjungan

kita baginda Nabi Muhammad SAW beserta keluarga dan para sahabatnya.

Dalam proses penulisan skripsi ini, tidak terlepas dari bimbingan, bantuan,

dukungan, saran, dan motivasi yang penulis terima dari berbagai pihak. Oleh karena

itu, penulis ingin mengucapkan terima kasih banyak kepada :

1. Bapak Dr. Harris Simaremare, MT., Ketua Yayasan Komputasi Riau

2. Ibu Dr. Lusiana, M.Kom., Ketua STMIK Amik Riau, sekaligus sebagai

penguji dalam sidang komprehensif skripsi penulis.

3. Bapak Rahmaddeni, M.Kom., Wakil Ketua I bidang akademik.

4. Bapak Unang Rio, M.kom., Wakil Ketua II bidang SDM Keuangan dan

Administrasi Umum.

5. Bapak Junadhi, M.kom., Wakil Ketua III bidang kemahasiswaan, sekaligus

sebagai Dosen Pembimbing penulis.

6. Bapak M. Khairul Anam, M.Kom., Ketua Program Studi Teknik Informatika

v
vi
DAFTAR ISI

Halaman

HALAMAN JUDUL ............................................................................................ 1


HALAMAN PENGESAHAN SKRIPSI ............................................................. i
HALAMAN TANDA LULUS UJIAN SKRIPSI ............................................... ii
PENGAKUAN KEASLIAN KARYA ................................................................ ii
ABSTRAK ............................................................................................................ iv
KATA PENGANTAR .......................................................................................... v
DAFTAR ISI ......................................................................................................... vii
DAFTAR TABEL ................................................................................................ ix
DAFTAR GAMBAR ............................................................................................ x

BAB I PENDAHULUAN ..................................................................................... 1


1.1 Latar Belakang .................................................................................. 1
1.2 Rumusan Masalah ............................................................................. 6
1.3 Batasan Masalah................................................................................ 6
1.4 Tujuan Penelitian .............................................................................. 6
1.5 Manfaat Penelitian ............................................................................ 7
1.6 Sistematika Penulisan ....................................................................... 7

BAB II LANDASAN TEORI & TINJAUAN PUSTAKA ................................ 9


2.1 Landasan Teori ............................................................................ 9
2.1.1 Klasifikasi ................................................................................... 9
2.1.2 Malaria ........................................................................................ 10
2.1.3 Sel Darah ..................................................................................... 13
2.1.4 Data Science ................................................................................ 14
2.1.5 Dataset ......................................................................................... 14
2.1.6 Klasifikasi Gambar...................................................................... 15
2.1.7 Artificial Intellegence (AI) .......................................................... 16
2.1.8 Machine Learning ....................................................................... 18
2.1.9 Deep Learning ............................................................................. 20
2.1.10 Jaringan Syaraf Tiruan / Artificial Neural Network (ANN) ....... 21
2.1.11 Data Augmentation/ Data Augmentasi ....................................... 22
2.1.12 Convolutional Neural Network (CNN) ....................................... 23

vii
2.1.13 Long Short-Term Memory .......................................................... 32
2.1.14 Precision dan Recall .................................................................... 37
2.1.15 Epoch........................................................................................... 37
2.1.16 Confusion Matrix ........................................................................ 38
2.1.17 Python ......................................................................................... 39
2.1.18 OSEMN Framework ................................................................... 40
2.2 Tinjuan Pustaka ........................................................................... 41

BAB III METODOLOGI PENELITIAN .......................................................... 46


3.1 OSEMN Framework ......................................................................... 46
3.1.1 Obtain(Pengumpulan data) ......................................................... 46
3.1.2 Scrub(Data Preparation) .............................................................. 47
3.1.3 Explore(Eksplorasi data) ............................................................. 48
3.1.4 Model(Perancangan Model) ........................................................ 48
3.1.5 iNterpreting(Mengintrepretasikan hasil) ..................................... 50

BAB IV HASIL DAN PEMBAHASAN ............................................................. 51


4.1 Obtain (Pengumpulan Data) ............................................................. 51
4.2 Scrub (Preparasi Data) ...................................................................... 52
4.3 Explore (eksplorasi data)................................................................... 53
4.4 Model(Perancangan Model) .............................................................. 55
4.4.1 Convolution Layer....................................................................... 59
4.4.2 Proses Pooling............................................................................. 60
4.4.3 LSTM Layer ................................................................................ 60
4.4.4 Fully Connected Layer ................................................................ 60
4.5 iNterpreting ....................................................................................... 61

BAB V PENUTUP ................................................................................................ 68


5.1 Kesimpulan ....................................................................................... 70
5.2 Saran .................................................................................................. 71

DAFTAR PUSTAKA ........................................................................................... 72

viii
DAFTAR TABEL

No. Tabel Halaman

2.1 Perbandingan ANN, CNN dan RNN 31


2.2. Confusion Matrix 38
2.3 Perbandingan Penelitian sejenis 44
4.1 Sebaran data hasil pembagian dataset 53
4.2 Perbandingan nilai Akurasi dengan literatur sejenis 66

ix
DAFTAR GAMBAR

No. Gambar Halaman

2.1 Diagram Kecerdasan Buatan 17


2.2 Perbandingan Pemrograman Tradisional dengan Machine Learning 18
2.3 Augmentasi dengan perputaran gambar maksimal 90 ° 23
2.4 Contoh Jaringan Convolutional Neural Network (CNN) 25
2.5 Ilustrasi Arsitektur CNN 26
2.6 Feature Map 27
2.7 Plot learning rate terhadap loss 30
2.8 Arstitektur Long Short Term Memory (LSTM) 33
2.9 Struktur sel pada LSTM 33
2.10 Input gate pada LSTM 34
2.11 Operasi pada hasil input gate dan perkalian C’t dan it pada sel LSTM 36
2.12 Output gate pada sel LSTM 36
2.13 Hasil Penelitian Literatur 1 42
2.14 Hasil Penelitian Literatur 4 43
3.1 Alur Penelitian Menggunakan OSEMN Framework 46
3.2 Arsitektur Model CNN-LSTM 49
4.1 Sumber pengumpulan Dataset 51
4.2 Dataset Parasit Malaria 52
4.3 Source code Split Dataset. 53
4.4 Source Code Augmentasi data 55
4.5 Source Code arsitektur jaringan CNN-LSTM 55
4.6 Hasil training model 58
4.7 Source code Uji Akurasi Model 61
4.8 Hasil akurasi training model 62
4.9 Source code uji validasi model 62
4.10 Hasil uji validasi model 62

x
4.11 Hasil uji akurasi pada data testing 63
4.12 Source code visualisasi klasifikasi parasit malaria 67
4.13 Halaman utama visualisasi klasifikasi 67
4.14 Hasil klasifikasi dari upload gambar uninfected 68
4.15 Hasil klasifikasi dari upload gambar infected 69

xi
BAB I
PENDAHULUAN

1.1 Latar Belakang

Penyakit Malaria masih merupakan masalah kesehatan masyarakat yang

menyebabkan kematian terutama pada kelompok resiko tinggi yaitu bayi, anak balita,

ibu hamil, selain itu malaria secara langsung menyebabkan anemia dan dapat

menurunkan produktivitas kerja. Pada tahun 2021, diperkirakan 247 juta kasus

malaria terjadi di seluruh dunia dengan jumlah total kematian 619 ribu jiwa. Sebagian

besar kasus malaria pada tahun 2021 berada di Wilayah Afrika ( 234 juta kasus atau

sekitar 94,7%), diikuti oleh Wilayah Asia Tenggara dengan 2% dari kasus dan

Wilayah Mediterania Timur dengan 2,1% (WHO, 2022).

Penemuan kasus malaria dilakukan berdasarkan gejala klinis, melalui

pemeriksaan sediaan darah yang dilakukan dengan konfirmasi laboratorium

menggunakan mikroskop maupun Rapid Diagnostik Test (RDT). Tingkat akurasi

pemeriksaan sediaan darah sangat tergantung kepada keahlian manusia dan dapat

dipengaruhi oleh variabilitas antar pengamat dan terbatasnya sumber daya daerah

dalam pemeriksaan skala besar pada wilayah dimana malaria endemik. Teknik

alternatif seperti Polymerase Chain Reaction (PCR) dan Rapid Diagnostic Test

(RDT) telah digunakan, namun analisis PCR terbatas dalam kinerjanya dan RDT

kurang efektif dalam hal biaya pada pemeriksaan skala besar di wilayah dimana

malaria endemik (Rajaraman et al., 2018).

1
2

Beberapa dataset malaria telah dikembangkan guna membantu dalam hal

pemeriksaan dan diagnosis penyakit malaria. Penelitian ini meggunakan dataset

(Lhncbc.Nlm.Nih.Gov) yang berisikan repositori sel tersegmentasi dari aktivitas

penelitian Malaria Screener. Dataset ini dikembangkan oleh para peneliti di Lister

Hill National Center for Biomedical Communications (LHNCBC), yang tergabung

dalam bagian National Library of Medicine (NLM). Dataset ini diambil

menggunakan aplikasi seluler yang telah dikembangkan yang berjalan pada

smartphone Android yang terpasang pada mikroskop cahaya konvensional. Sel darah

yang diwarnai cairan Giemsa dari 150 pasien yang terinfeksi parasit dan sel darah dai

50 pasien sehat dikumpulkan dan difoto di Rumah Sakit Chittagong Medical College,

bangladesh. Kamera yang terpasang pada smartphone memperoleh gambar slide

untuk setiap bidang pandang mikroskopis. Gambar-gambar tersebut dianotasikan

secara manual oleh pembaca slide yang ahli di Mahidol-Oxford Tropical Medicine

Research Unit di Bangkok, Thailand. Peneliti NLM menerapkan algoritma berbasis

level-set untuk mendeteksi dan mensegmentasi sel darah merah. Dataset ini dibuat

untuk mengurangi beban para mikroskopis di daerah yang sumber dayanya terbatas

dan juga untuk meningkatkan akurasi diagnostik malaria. Dataset berisi total 27.558

gambar sel dengan jumlah data yang sama pada sel yang terkena parasit (Parasitized)

dan sel yang tidak terinfeksi (Uninfected)

(Https://Lhncbc.Nlm.Nih.Gov/Publication/Pub9932, n.d. ).

Jumlah, kompleksitas, dan kecepatan agregasi biomedis dan data layanan

kesehatan akan meningkat dengan cepat selama beberapa dekade berikutnya.


3

Kemungkinan akan berlipat ganda setiap 1-2 tahun. Ini didorong oleh langkah besar

dalam teknologi digital dan komunikasi, perangkat IoT, dan layanan Cloud, serta

kemajuan algoritmik, komputasi, dan perangkat keras yang cepat. Permintaan publik

yang semakin meningkat untuk deteksi waktu-nyata, interpretasi yang tepat, dan

sistem diagnosis yang dapat diandalkan manusia dalam hal kesehatan dan penyakit

juga mempercepat tren itu. Proses pengolahan data science adalah salah satu proses

yang dapat menggambarkan protokol analitik prediktif yang umum untuk

diinterogasikan pada dataset biomedis dan kesehatan yang besar dan kompleks.

Prosesnya dimulai dengan mengidentifikasi masalah, diikuti dengan menentukan

sumber data dan meta-data, pembersihan, penyelarasan komponent data,

preprocessing data, inferensi ilmiah berbasis model, dan diakhiri dengan prediksi,

validasi dan penyebaran data, perangkat lunak, protokol dan temuan penelitian

(Dinov, 2018). Dari uraian tersebut, proses pengolahan data science dapat menjadi

jawaban untuk dapat membuat sistem diagnosis otomatis dari dataset biomedis dan

kesehatan, termasuk penyakit malaria.

Sistem diagnosis otomatis bertujuan untuk melakukan tugas pemeriksaan

sediaan darah ini tanpa campur tangan manusia dan untuk menyediakan alat yang

obyektif, dapat diandalkan, dan efisien untuk melakukannya. Sistem diagnosis

otomatis dapat dirancang dengan memahami keahlian diagnostik dan

merepresentasikannya dengan algoritma pemrosesan gambar, analisis, dan

pengenalan pola khusus yang disesuaikan. Sistem diagnosis otomatis ini dapat

dirancang menggunakan proses penerapan metode Machine Learning (ML),


4

representasi fitur yang akurat merupakan inti dari kesuksesan untuk mencapai hasil

yang diinginkan. Mayoritas sistem diagnosis otomatis berbasis analisis gambar

menggunakan ML dengan representasi hand-engineered features dalam pengambilan

keputusan (Poostchi et al., 2018). Namun proses ini menuntut keahlian khusus dalam

menganalisis variabilitas ukuran, latar belakang, sudut, dan Region Of Interest (ROI)

pada gambar. Untuk mengatasi tantangan dalam perancangan hand-engineered

features yang menangkap variasi dalam data dasar, digunakanlah model Deep

Learning (DL) yang dikenal sebagai hierarchical learning yang dapat digunakan

dalam mencapai kesuksesan yang signifikan (Lecun et al., 2015).

Model DL menggunakan lapisan unit kaskade non-linier untuk menemukan

reprentasi fitur hirarki pada data mentah. Fitur dengan tingkat yang lebih tinggi

diabstraksikan dari tingkat yang lebih rendah untuk membantu dalam proses

pembelaaran yang kompleks, fungsi pengambilan keputusan non-linier, yang

dihasilkan dalam ekstraksi dan klarifikasi end-to-end (Schmidhuber, 2015). Tidak

seperti algoritma berbasil kernel seperti Support Vector Machine (SVM) pada model

ML, model DL menunjukkan peningkatan kinerja dengan peningkatan ukuran data

dan sumber daya komputasi, dan membuatnya memiliki skala yang lebih tinggi

(Srivasta et al., 2014).

Dalam penulisan ini, penulis akan menggunakan model DL dengan

menggabungkan dua metode Convolutional Neural Network dan Long Short Term

Memory sebagai fitur ekstraktor dalam mengklasifikasi parasitized dan uninfected

cells untuk membantu dalam peningkatan sistem diagnosis penyakit malaria. Dalam
5

penggabungannya, CNN digunakan untuk ekstraksi fitur pada gambar dan LSTM

digunakan untuk mengklasifikasikan parasit malaria berdasarkan fitur yang telah

dihasilkan. Jaringan LSTM memiliki memori internal yang mampu belajar dari

pengalaman penting dengan keadaan jangka panjang. Dalam fully connected

networks, lapisan terhubung sepenuhnya dan node antar lapisan tidak terhubung dan

hanya memproses satu masukan. Dalam kasus LSTM, node dihubungkan dari graf

berarah sepanjang urutan temporal yang dianggap sebagai input dengan urutan

tertentu.
6

1.2 Rumusan Masalah

Berdasarkan latar belakang tersebut, penulis merumuskan masalah sebagai berikut :

“Bagaimana klasifikasi parasit penyebab malaria menggunakan metode

Convolutional Neural Network-Long Short Term Memory?”

1.3 Batasan Masalah

Adapun batasan masalah pada penulisan ini adalah:

1. Klasifikasi dilakukan pada gambar sel darah manusia.

2. Perancangan sistem menggunakan bahasa pemrograman python.

3. Dalam melakukan pengolahan data science, menggunakan OSEMN

Framework, dan metode Convolutional Neural Network - Long Short Term

Memory.

4. Dataset berdasarkan studi literatur (Lhncbc.Nlm.Nih.Gov) dengan jumlah

dataset 27.558 gambar sel yang terbagi kedalam dua kategori yaitu

parasitized dan uninfected. Setiap kategori terdiri dari 13.779 gambar sel.

5. Binary Croosentropy digunakan dalam perhitungan Loss Function dalam

pelatihan model.

6. Perhitungan akurasi model menggunakan Confusion Matrix.

1.4 Tujuan Penelitian

Klasifikasi parasit penyebab malaria menggunakan metode Convolutional Neural

Network-Long Short Term Memory?.


7

1.5 Manfaat Penelitian

Manfaat dari penulisan ini antara lain:

Bagi pengguna

1. Dapat mengetahui bentuk parasit penyebab malaria dalam sel darah manusia.

2. Memudahkan untuk mendapatkan informasi tentang parasit penyebab malaria

guna untuk memahami dan mengklasifikasi parasit malaria.

Bagi penulis

1. Mendapatkan ilmu pengetahuan mengenai parasit penyebab penyakit malaria.

2. Mendapatkan pemahaman tentang data science, image processing dan metode

Convolutional Neural Network-Long Short Term Memory.

1.6 Sistematika Penulisan

Untuk memudahkan dalam penulisan skripsi, penulis menyusunnya ke dalam lima

bab. Setiap bab-nya terdiri dari beberapa sub bab tersendiri. Bab tersebut secara

keseluruhan saling berkaitan satu sama lain, dimana diawali dengan bab pendahuluan

dan diakhiri bab penutup yang berisi kesimpulan dan saran. Secara singkat akan

diuraikan sebagai berikut:

BAB I PENDAHULUAN

Dalam bab ini akan dibahas mengenai latar belakang, batasan masalah,

tujuan, dan manfaat serta sistematika penulisan.


8

BAB II LANDASAN TEORI

Dalam bab ini akan dibahas mengenai berbagai teori yang mendasari

analisis permasalahan dan berhubungan dengan topik yang dibahas.

BAB III METODOLOGI PENELITIAN

Bab ini membahas mengenai metode penelitian yang akan digunakan

dalam pengolahan data science pada Klasifikasi Parasit Malaria.

BAB V HASIL DAN PEMBAHASAN

Bab ini membahas mengenai hasil dan pembahasan tentang klasifikasi

parasit malaria menggunakan Deep Learning dengan metode

Convolutional Neural Network – Long Short-Term Memory.

BAB VI PENUTUP

Bab ini berisi tentang kesimpulan dari penelitian yang telah dilakukan

dan saran yang diusulkan untuk pengembangan lebih lanjut agar

tercapai hasil yang lebih baik.


BAB II
LANDASAN TEORI & TINJAUAN PUSTAKA

2.1 Landasan Teori

Landasan teori berisikan tentang dasar-dasar teori dan konsep yang berkaitan dengan

masalah dalam penelitian yang akan dijadikan sebagai referensi yang diambil dari

jurnal, buku atau skripsi pendukung.

2.1.1 Klasifikasi
Klasifikasi adalah tipe analisis data yang dapat membantu orang menentukan kelas

label dari sampel yang ingin di klasifikasi. Klasifikasi merupakan Metode supervised

learning, metode yang mencoba menemukan hubungan antara atribut masukan dan

atribut target. Tujuan klasifikasi untuk meningkatkan kehandalan hasil yang diperoleh

dari data (Hendrian, 2018).

Klasifikasi merupakan penempatan objek-objek ke salah satu dari beberapa

kategori yang telah ditetapkan sebelumnya. Klasifikasi telah banyak ditemui dalam

berbagai aplikasi. Sebagai contoh, pendeteksian pesan email spam berdasarkan

header dan isi atau mengklasifikasikan galaksi berdasarkan bentukbentuknya. Dalam

bab ini akan dibahas mengenai konsep klasifikasi, beberapa isi penting dalam

klasifikasi dan menyatakan metode untuk mengevaluasi dan membandingkan kinerja

teknik klasifikasi (Nugroho & Subanar, 2013).

Pada dasarnya, data yang diperoleh dari pengukuran atau suatu pengamatan

merupakan data mentah (raw data) yang mana berisikan deretan-deretan angka yang

9
10

acak dan sulit dimengerti. Agar data mentah ini menghasilkan informasi yang mudah

untuk didaptkan, maka perlu dilakukan klasifikasi data. Klasifikasi data adalah

pengelompokan data sesuai karakteristik yang dimiliki dengan keperluan

pengelompokan data (www.depkop.go.id). Tujuan dari klasifikasi data adalah sebagai

berikut:

1. Mengelempokkan sifat-sifat yang sama ke dalam kelompok atau kelas yang sama.

2. Memudahkan perbandingan.

3. Mengelompokkan informasi penting dan menghilangkan hal-hal yang tidak perlu.

4. Menunjukkan sifat yang menonjol sehingga mudah dilihat sekilas.

5. Memudahkan perlakukan statistik selanjutnya atas data yang telah dikumpulkan,

misalnya untuk analisis, interpretasi, atau penyusunan laporan.

2.1.2 Malaria

Malaria adalah suatu penyakit yang disebabkan oleh parasit yang termasuk dalam

anggota spesies dari genus Plasmodium. Plasmodium falciparum, Plasmodium vivax,

Plasmodium ovale dan Plasmodium malariae hampir disemua kasus terjadi pada

manusia. Malaria ditransmisikan dari manusia ke manusia oleh nyamuk Anopheles

betina kemudian berkembang dan bereplikasi didalam eritrosit inang vertebrata

(Millar & Cox-Singh, 2015).

Malaria adalah penyakit menular yang disebabkan plasmodium, yaitu makhluk

hidup bersel satu yang termasuk ke dalam kelompok protozoa. Malaria ditularkan

melalui gigitan nyamuk Anopheles betina yang mengandung Plasmodium di


11

dalamnya. Plasmodium yang terbawa melalui gigitan nyamuk akan hidup dan

berkembang biak dalam sel darah merah manusia. Penyakit ini menyerang semua

kelompok umur baik laki-laki maupun perempuan. Orang yang terkena malaria akan

memiliki gejala: demam, menggigil, berkeringat, sakit kepala, mual atau muntah

(PUSDATINKemenkesRI, 2016).

Menurut (Center for Disease Control and Prevention, 2018) dikenal lima jenis

spesies plasmodium penyebab malaria pada manusia, yaitu:

1. Plasmodium falciparum, adalah parasit malaria yang ditemukan di daerah

tropis dan subtropis di dunia. Diperkirakan setiap tahunnya ada 1 juta orang

yang terbunuh akibat parasit ini, terutama di Afrika. Plasmodium falciparum

adalah penyebab malaria tropika yang sering menyebabkan malaria yang

berat, karena memiliki kemampuan melipat ganda secara cepat dalam darah

sehingga dapat menyebabkan anemia. Selain itu Plasmodium falciparum

dapat menyumbat pembuluh darah kecil. Ketika ini terjadi di otak

akanmenyebabkan malaria serebral dengankomplikasiyang dapat berakibat

fatal (kematian).

2. Plasmodium vivax, adalah parasit malaria penyebab malaria tertiana yang

kebanyakan ditemukan di Asia, Amerika Latin, dan beberapa bagian di

Afrika. Karena padatnya penduduk terutama di Asia menyebabkan

Plasmodium vivax merupakan parasit malaria yang paling umum ditemukan

pada manusia. Plasmodium vivax memiliki tahapan dormansi dalam hati


12

(hypnozoites) yang dapat aktif dan menyerang darah(relapse) dalam beberapa

bulan atau tahun setelah gigitan nyamuk yang terinfeksi.

3. Plasmodium malariae, adalah penyebab malaria quartana yang ditemukan di

seluruh dunia. Plasmodium malariae adalah satu-satunya spesies parasit

malaria pada manusia yang memiliki siklus quartan (siklus tiga hari),

sedangkan tiga spesies lainnya memiliki siklus tertiana (siklus dua hari).

Infeksi Plasmodium malariae mampu bertahan dalam waktu yang lama jika

tidak diobati. Dalam beberapa kasus, infeksi kronis dapat berlangsung seumur

hidup. Pada beberapa pasien kronis yang terinfeksi.

4. Plasmodium ovale dapat menyebabkan komplikasi yang serius seperti

sindrom nefrotik. Plasmodium ovale, adalah parasit malaria yang

menyebabkan malaria ovale tetapi jenis ini jarang dijumpai. Plasmodium

ovale banyak ditemukandi Afrika (terutama Afrika Barat) dan pulau-pulau di

Pasifik Barat. Plasmodium ovale secara biologis danmorfologis sangat mirip

dengan Plasmodium vivax. Plasmodium ovale dapat menginfeksi individu

yang negatif untuk golongan darah duffy (salah satu penggolongan darah

selain ABO dan Rh) sedangkan Plasmodium vivax tidak. Golongan darah

duffy banyak ditemukan pada penduduk Sub-Sahara Afrika. Hal ini

menjelaskan prevalensi infeksi Plasmodium ovale banyak terjadi di sebagian

besar Afrika.

5. Plasmodium knowlesi merupakan parasit malaria baru yang bisa menginfeksi

manusia. Plasmodium knowlesi ditemukandi seluruh Asia Tenggara sebagai

pathogen alami dari kera ekor panjang dan babi. Baru-baru ini Plasmodium
13

knowlesi terbukti menjadi penyebab signifikan malaria zoonosis, terutama di

Malaysia. Plasmodium knowlesi memiliki siklus replikasi 24 jam dan begitu

cepat dapat berkembang menjadi infeksi yang parah.

2.1.3 Sel Darah


Darah merupakan salah satu jaringan dalam tubuh yang berbentuk cair

berwarna merah. Karena sifat darah yang berbeda dengan jaringan lain,

mengakibatkan darah dapat bergerak dari satu tempat ketempat lain sehingga dapat

menyebar ke berbagai kompartemen tubuh. Penyebaran harus terkontrol dan harus

tetap berada pada satu ruangan agar darah benar-benar dapat menjangkau seluruh

jaringan didalam tubuh melalui sistem yang disebut sistem kardiovaskular, yang

meliputi jantung dan pembuluh darah. Dengan sistem tersebut darah dapat

diakomodasikan secara teratur dan diedarkan menuju organ dan jaringan yang

tersebar diseluruh tubuh. Darah didistribusikan melalui pembuluh darah dari jantung

keseluruh tubuh dan akan kembali lagi menuju jantung. Sistem ini berfungsi untuk

memenuhi kebutuhan sel atau jaringan akan nutriendanoksigen, serta mentrasnport

sisa metabolisme sel atau jaringan keluar dari tubuh (Saadah, 2018).

Darah adalah jaringan ikat atau konektif berbentuk cair; terdiri dari 4 unsur

seluler, yaitu: sel-sel darah merah (eritrosit), sel-sel darah putih (leukosit), sel-sel

darah pembeku atau keping darah (trombosit) dan cairandarah (plasma darah)

(D’Hiru, 2013).
14

2.1.4 Data Science

Data science adalah sebuah bidang baru yang muncul dan menjadi ilmu yang sangat

transdisipliner, yang menjembatani antara bidang teoritis, komputasi, eksperimental,

dan biososial. Data science juga berurusan dengan sejumlah besar data yang

kompleks, tidak selaras, dan dinamis yang berasal dari berbagai sumber. Data

Science bertujuan untuk mengembangkan algoritma, metode, alat, dan layanan yang

mampu mengolah dataset dan menghasilkan sistem penunjang keputusan semi-

otomatis (Dinov, 2018).

Data Science adalah interdisipliner ilmu yang inheren dengan pendekatan sains.

Teknik eksperimental baru telah merevolusi biologi selama bertahun - tahun dari

sekuensing DNA dan mikroarray di masa lalu ke CRISPR dan cryo-EM baru-baru

ini. Data Science berbeda karena itu bukan merupakan teknik tunggal, melainkan

kerangka kerja untuk menyelesaikan seluruh jajaran masalah. Potensi Data Science

untuk menjawab pertanyaan dalam berbagai disiplin ilmu yang berbeda sangat

menggairahkan banyak peneliti (Ezer & Whitaker, 2019).

2.1.5 Dataset
Dataset adalah suatu database didalam memori (in-memory). Dataset memiliki semua

karateristik, fitur dan fungsi dari database biasa. Dataset dapat memiliki banyak tabel,

dan tabel-tabel dapat memiliki hubungan (relationship). Tabel-tabel pada suatu

dataset dapat memiliki foreign key dan integritas referensial. Dataset adalah objek

yang merepresentasikan data dan relasinya di memory. Strukturnya mirip dengan data
15

yang ada di database. Dataset berisi koleksi dari data tabel dan data. Jenis dataset ada

dua macam yaitu :

1. Private Dataset

Private dataset yaitu dataset yang dapat diambil dari organisasi yang kita jadikan

tempat atau objek penelitian. Adapun contoh-contohnya seperti instansi, rumah sakit,

pabrik, perusahaan jasa, dan lain-lain.

2. Public Dataset

Public dataset yaitu dataset yang dapat diambil dari repository public yang telah

disepakati oleh para peneliti. Adapun contoh-contohnya seperti: UCI.

2.1.6 Klasifikasi Gambar

Klasifikasi gambar atau citra adalah sebuah pekerjaan untuk memasukkan citra dan

menempatkan ke dalam suatu kategori. Ini merupakan salah satu dari permasalahan

yang ada pada Computer Vision yang dapat disederhanakan dan memiliki berbagai

macam aplikasinya. Salah satu aplikasi dalam klasifikasi citra adalah

pengklasifikasian nama tempat pada suatu citra .

Setiap citra yang di input pada training set data diberikan label atau penamaan.

Saat klasifikasi, label atau penamaan tersebut akan menjadi perbandingan dengan

hasil hipotesis yang diberikan oleh model pembelajaran dan akan menghasilkan nilai

error. Klasifikasi yang terawasi ini bisa sangat efektif dan akurat dalam

mengklasifikasikan citra tempat maupun objek lainnya. Banyak metode dan algoritma
16

yang dapat mendukung proses klasifikasi yang terawasi terutama dengan teknik Deep

Learning (Putri, 2018).

2.1.7 Artificial Intellegence (AI)

Kecerdasan Buatan atau Artificial Intelligence (AI) adalah teknik yang digunakan

untuk meniru kecerdasan yang dimiliki oleh makhluk hidup maupun benda mati

untuk menyelesaikan sebuah persoalan. Untuk melakukan hal ini, setidaknya ada tiga

metode yang dikembangkan.

a. Fuzzy Logic(FL).

Teknik ini digunakan oleh mesin untuk mengadaptasi bagaimana makhluk

hidup menyesuaikan kondisi dengan memberikan keputusan yang tidak kaku 0 atau 1.

Sehingga dimunculkan sistem logika fuzzy yang tidak kaku. Penerapan logika fuzzy

ini salah satunya adalah untuk sistem pengereman kereta api di Jepang.

b. Evolutionary Computing(EC).

Pendekatan ini menggunakan skema evolusi yang menggunakan jumlah

individu yang banyak dan memberikan sebuah ujian untuk menyeleksi individu

terbaik untuk membangkitkan generasi selanjutnya. Seleksi tersebut digunakan untuk

mencari solusi dari suatu permasalahan. Contoh dari pendekatan ini adalah Algoritma

Genetika yang menggunakan ide mutasi dan kawin silang, Particle Swarm

Optimization (PSO) yang meniru kumpulan binatang seperti burung dan ikan dalam

mencari mangsa, Simulated Annealing yang menirukan bagaimana logam ditempa,

dan masih banyak lagi.


17

c. Machine Learning (ML)

Machine Learning atau pembelajaran mesin merupakan teknik yang paling

populer karena banyak digunakan untuk menggantikan atau menirukan perilaku

manusia untuk menyelesaikan masalah. Sesuai namanya ML mencoba menirukan

bagaimana proses manusia atau makhluk cerdas belajar dan mengeneralisasi (Ahmad,

2017).

Skema utama dari AI bisa dilihat pada Gambar 2.1.

Gambar 2.1 Diagram Kecerdasan Buatan


Sumber (Ahmad, 2017)
Berdasarkan diagram pada gambar 2.1. dapat dijelaskan bahwa AI dibagi

menjadi beberapa macam algortima seperti Machine Learning, Fuzzy Logic,

Evolutionary Computation, dan lain-lain. Fuzzy Logic adalah suatu cabang ilmu

Artificial Intellegence, yaitu suatu pengetahuan yang membuat komputer dapat

meniru kecerdasan manusia sehingga diharapkan komputer dapat melakukan hal- hal

yang apabila dikerjakan manusia memerlukan kecerdasan. Evolutionary Computation

adalah algoritma untuk optimisasi global yang terinspirasi oleh evolusi biologis, dan
18

subbidang kecerdasan buatan dan komputasi lunak mempelajari algoritma ini. Dalam

istilah teknis, mereka adalah keluarga pemecah masalah trial and error berbasis

populasi dengan karakter optimisasi metaheuristik atau stokastik.

Didalam ANN terdapat Deep Learning yang mana mesin dilatih lebih

mendalam. Deep Learning adalah salah satu cabang Machine Learning (ML) yang

menggunakan Deep Neural Network untuk menyelesaikan permasalahan pada

domain ML.

2.1.8 Machine Learning

Machine Learning adalah serangkaian teknik yang dapat membantu dalam menangani

dan memprediksi data yang sangat besar dengan cara merepresentasikan data-data

tersebut dengan algoritma pembelajaran. Machine Learning dapat membuat komputer

memprogram diri mereka sendiri. Jika pemrograman adalah pekerjaan untuk

membuat otomatis, maka Machine Learning mengotomatisasi proses otomatis.

Berikut gambaran umum Machine Learning dibandingkan dengan pemrograman

secara tradisional.

Gambar 2.2 Perbandingan Pemrograman Tradisional dengan Machine Learning


19

Dari Gambar 2.2 dapat dilihat bahwa pemrograman secara tradisional data dan

programan dijalankan di komputer untuk menghasilkan output. Sedangkan pada

Machine Learning data dan output dijalankan di komputer untuk membuat sebuah

program.

Ada banyak algoritma Machine Learning yang dikembangkan setiap tahunnya.

Setiap algoritma pembelajaran mesin memiliki tiga komponen penting antara lain:

a. Representasi: bagaimana merepresentasikan pengetahuan.

Contohnya termasuk Decision tree, Neural Network, Support

Vector Machine dan lain-lain.

b. Evaluasi: cara mengevaluasi prediksi dan hipotesis. Contohnya

meliputi Mean Squared Error, Cost function dan lain-lain.

c. Optimasi: cara program dari model dihasilkan dan proses

pencarian parameter terbaik. Misalnya Convex Optimization dan

Gradient Descent.

Selain dari algoritma pembelajaran ada empat jenis cara pembelajaran

pada Machine Learning, yakni:

a. Supervised Learning: Data pembelajaran mencangkup keluaran

yang yang sudah ditentukan.

b. Unsupervised Learning: Data pembelajaran tidak mencangkup

keluaran yang ditentukan.


20

c. Semi-supervised Learning: Data pembelajaran mencangkup

beberapa keluaran yang ditentukan.

d. Reinforcement Learning: Pemberian hadiah dari setiap serangkaian

tindakanyang dilakukan.

2.1.9 Deep Learning

Deep Learning merupakan salah satu bidang dari Machine Learning yang

memanfaatkan jaringan syaraf tiruan untuk implementasi permasalahan dengan

dataset yang besar. Teknik Deep Learning memberikan arsitektur yang sangat kuat

untuk Supervised Learning. Dengan menambahkan lebih banyak lapisan maka model

pembelajaran tersebut bisa mewakili data citra berlabel dengan lebih baik.

Pada Machine Learning terdapat teknik untuk menggunakan ekstrak fitur dari

data pelatihan dan algoritma pembelajaran khusus mengklasifikasi citra maupun

untuk mengenali suara. Namun, metode ini masih memiliki beberapa kekurangan

baik dalam hal kecepatan dan akurasi. Aplikasi konsep jaringan syaraf tiruan yang

dalam (banyak lapisan) dapat ditangguhkan pada algoritma Machine Learning yang

sudah ada sehingga komputer sekarng bisa belajar dengan kecepatan, akurasi, dan

skala yang besar. Prinsip ini terus berkembangkan hingga Deep Learning semakin

sering digunakan pada komunitas riset dan industri untuk membantu memecahkan

banyak masalah data besar seperti Computer vision, Speech recognition, dan Natural

Language Processing.

Feature Engineering adalah salah satu fitur dari Deep Learning untuk

mengekstrak pola yang berguna dari data akan memudahkan model untuk
21

membedakan kelas. Feature Engineering juga merupakan teknik yang paling penting

untuk mencapai hasil yang baik pada tugas prekdiksi. Namun, sulit untuk dipelajari

dan dikuasai karena kumpulan data dan jenis data yang berbeda memerlukan

pedekatan teknik yang berbeda juga. Algoritma yang digunakan pada Feature

Engineering dapat menemukan pola umum yang penting untuk membedakan antara

kelas.

Ekstraksi fitur otomatis merupakan keunggulan deep learning dibanding

dengan algoritma machine learning terdahulu . ekstrasi fitur mengutamakan

pemberian label pada dataset yang ada dalam proses jaringan.

Secara historis, pelatihan machine learning menghabiskan berbulan-bulan,

bertahun-tahun, bahkan puluhan tahun dalam pembuatan set fitur lengkap untuk

klasifikasi data secara manual. Deep learning merupakan algoritma paling akurat

sejauh ini (Patterson & Gibson, 2017).

2.1.10 Jaringan Syaraf Tiruan / Artificial Neural Network (ANN)

Jaringan Syaraf Tiruan / Artificial Neural Network (ANN) merupakan metode yang

biasanya digunakan dalam peramalan maupun pengenalan pola. Pada peramalan

jaringan syaraf tiruan biasa digunakan sebagai peramalan nilai tukar mata uang asing,

peramalan harga saham, peramalan cuaca dan lain sebagainya, sedangkan untuk

pengenalan pola biasanya jaringan syaraf tiruan digunakan untuk pengenalan pola

huruf, pola tanda tangan hingga pola suara serta wajah (Kartika et al., 2016).
22

Berdasarkan (Nurhikmat, 2018), ANN merupakan sistem adatif yang dapat

mengubah strukturnya untuk memecahkan suatu masalah berdasarkan informasi

internal maupun eksternal. Menurut Pham dalam jurnal Hermantoro (Pham, 1994)

mengatakan bahwa ANN bersifat fleksibel terhadap inputan data dan menghasilkan

output respon konsisten. ANN telah banyak digunakan dalam area yang luas.

Menurut Kumar & Haynes (Kumar, 2003) dalam jurnal Ulil Hamida (Hamida, 2014)

menjelaskan, penerapan ANN dapat mengidentifikasi beberapa aplikasi yaitu:

a. Estimasi/prediksi (aproksimasi fungsi, peramalah)

b. Pengenalan Pola (klasifikasi, diagnosis, dan analisis diskriminan)

c. Klustering (pengelompokan tanpa adanya pengetahuan sebelumnya)

2.1.11 Data Augmentation/ Data Augmentasi


Augmentasi data adalah suatu proses dalam pengolahan data gambar, augmentasi

merupakan proses mengubah atau memodifikasi gambar sedemikian rupa sehingga

komputer akan mendeteksi bahwa gambar yang diubah adalah gambar yang berbeda,

namun manusia masih dapat mengetahui bahwa gambar yang diubah tersebut adalah

gambar yang sama (Perez & Wang, 2017). Augmentasi dapat meningkatkan akurasi

dari model CNN yang dilatih karena dengan augmentasi model mendapatkan data-

data tambahan yang dapat berguna untuk membuat model yang dapat melakukan

generalisasi dengan lebih baik. Salah satu jenis augmentasi yang umum dilakukan

adalah dengan melakukan perputaran gambar dengan besar tertentu, contoh dari

penggunaan augmentasi ini dapat dilihat pada Gambar 2.7


23

Gambar 2.3 Augmentasi dengan perputaran gambar maksimal 90 °


Sumber :

2.1.12 Convolutional Neural Network (CNN)

Convolutional Neural Network (CNN) adalah arsitektur deep learning yang terkenal

yang terinspirasi oleh mekanisme persepsi visual makhluk hidup di alam. Pada tahun

1959, Hubel & Wiesel menemukan bahwa sel-sel pada hewan visual cortex

bertanggung jawab untuk mendeteksi cahaya pada bidang reseptif. Terinspirasi oleh

penemuan ini, Kunihiko Fukushima menguslkan teori neocognitron pada tahun 1980,

yang dainggap sebagai pendahulu CNN. Pada tahun 1990, LeCun dkk. menerbitkan

jurnal yang membentuk kerangka kerja modern dari CNN, dan kemudian

memperbaikinya lagi pada tahun 1998. Mereka mengembangkan jaringan saraf tiruan

multi-layer yang disebut LeNet-5 yang dapat mengklasifikasikan digit tulisan tangan.

Dimulai pada tahun 1990 sebuah studi paralel oleh Zhang dkk. menggunakan Shift-

Invariant Artificial Neural Network (SIANN) untuk mengenali karakter dari sebuah

gambar. Namun, karena kurangnya data training yang besar dan daya komputasi

pada waktu itu, jaringan mereka tidak dapat bekerja dengan baik pada masalah yang

lebih kompleks, mis., klasifikasi gambar dan video skala besar.


24

Sejak 2006, banyak metode telah dikembangkan untuk mengatasi kesulitan

yang dihadapi dalam pelatihan mendalam pada CNN. Paling menonjol pada tahun

2012, Krizhevsky dkk. Mengusulkan arsitektur CNN klasik dan menunjukkan

perbaikan yang signifikan dari metode sebelumnya pada pengklasifikasian gambar.

Keseluruhan arsitektur dari metode mereka dikenal dengan sebutan AlexNet, mirip

dengan LeNet-5 tetapi dengan struktur yang lebih dalam. Dengan keberhasilan

AlexNet, banyak karya telah diusulkan untuk meningkatkan kinerja CNN (J Gu et al,

2015).

CNN temasuk kedalam kategori metode neural network. CNN tidak hanya

dapat mempelajari representasi fitur gambar secara otomatis, tetapi CNN juga

mengungguli banyak teknik buatan konvensional lainnya (Sang et al., 2017).

Model neural network memiliki representasi data hirarkis dan bergantung pada

perhitungan layer yang memiliki implementasi berurutan, output layer sebelumnya

akan menjadi input layer berikutnya. Setiap layer memberikan satu level representasi.

Dan, ada satu set bobot yang mengukur parameter layer. Dan juga, unit input

terhubung ke unit output melalui bobot di samping sekelompok bias. Bobot dalam

CNN, dibagikan secara lokal, yang berarti bahwa setiap lokasi input memiliki bobot

yang sama. Bentuk filter berdasarkan bobot yang dikaitkan dengan output yang sama

(Romero et al, 2016).


25

Gambar 2.4 Contoh Jaringan Convolutional Neural Network (CNN)


Sumber: cs23ln.github.io
Pada Gambar 2.4 menunjukkan setiap lapisan input yang dimasukkan memiliki

volume yang berbeda dan mewakili dengan kedalaman, tinggi dan lebar. Setiap

besaran yang didapatkan tergantung dari hasil filtrasi dari lapisan sebelumnya dan

juga banyak filter yang digunakan. Model jaringan seperti ini sudah terbukti sangat

ampuh dalam menangani permasalahan klasifikasi citra.

A. Arsitektur Jaringan CNN


Pada neural network, neuron dikumpulkan dalam lapisan-lapisan (layers) yan disebut

denan lapisan neuron (neuron layers). Neuron-neuron pada satu lapisan dihubungkan

dengan lapisan sebelumnya dan sesudahnya, kecuali pada lapisan input dan output.

Lapisan diantara lapisan biasa disebut dengan lapisan tersembunyi atau hidden layer.

Perambatan juga bisa dilakukan pada arah sebaliknya tergantungg pada algoritma

pembelajaran yang dipakai.

Faktor terpenting dalam menentukan sifat suatu neuron adalah pola bobot

(weights) dan fungsi aktivitas dari neuron tersebut. Pada setiap lapisan yang sama,

neuron-neuron memiliki fungsi aktivitas yang sama.

Arsitektur neural network biasa dibagi berdasarkan jumlah lapisannya menjadi:

1. Jaringan dengan lapisan tunggal (Single layer network).


26

Jaringan dengan lapisan tunggal adalah sebuah jaringan dengan semua

input terhubung langsung pada output tanpa melewati lapisan

tersembunyi.

2. Jaringan dengan banyak lapisan (multi-layer networks)

Jaringan dengan lapis banyak memiliki satu atau lebih lapisan

tersembunyi di antara lapisan input dan output.

Convolutional Neural Network (CNN) merupakan multi-layer networks yang

terdiri dari alternating layer yang secara local terhubung pada convolutional layer

dimana setiap layer memiliki jumlah filter yang sama. Downsampling layer dan fully

connected layer berfungsi sebagai classifier (Al-Waisy et al., 2017).

Gambar 2.5 Ilustrasi Arsitektur CNN


Sumber: (Al-Waisy et al., 2017)

Arsitektur CNN memiliki tiga konsep yang membuatnya efektif: local receptive

fields, weights sharing, dan downsampling operations. Local receptive fields

berisikan setiap neuron yang menerima input berupa porsi kecil dari layer

sebelumnya dan juga memiliki ukuran yang sama dari convolution filter. Local

receptive fields digunakan pada convolutional dan downsampling layer. Weight

sharing diterapkan pada convolutional layer untuk mengontrol kapasitas dan


27

mengurangi kompleksitas model. Terakhir, nonlinear downsampling yang digunakan

pada downsampling layer berfungsi untuk mengurangi ukuran spasial gambar serta

mengurangi jumlah parameter bebas dari model. Konsep-konsep ini membantu CNN

menjadi kuat dan efektif dalam tugas-tugas pengenalan gambar (Al-Waisy et al.,

2017).

Berikut adalah penjelasan beberapa layer yang terdapat pada CNN:

1. Convolutional layer

Bobot pada layer ini terbuat dari satu set learnable filters yang

diproduksi secara acak dan dipelajari melalui algoritma back-

propagation. Feature map adalah hasil dari setiap filter yang

terhubung melalui sebuah gambar. Feature map juga memiliki

jumlah yang sama dari filter yang diterapkan pada layer tersebut.

(Al-Waisy et al., 2017)

Gambar 2.6 Feature Map


Sumber oreilly.com
28

Seperti yang telah diilustrasikan pada Gambar 2.6, convolutional

layer yang pertama berisikan 6 filter yang menghasilkan 6 feature

map yang disusun bersama. Setiap feature map mewakili fitur

spesifik dari gambar, misalnya represented points atau represented

vertical edges seperti yang diilustrasikan pada Gambar 2.3. Operasi

convolution dirumuskan sebagai berikut.

𝑥𝑗𝑙 = 𝑓 (∑𝑖∈𝑀𝑗 𝑥𝑗𝑙−1 ∗ 𝑘𝑖𝑗


𝑙
+ 𝑏𝑗𝑙 ) (2.1)

l = layer pada CNN

j = specific convolution feature map

f = fungsi aktivasi

𝑀𝑗 = selection of input maps

𝑘𝑖𝑗 = filter

𝑏𝑗 = feature map bias

2. Pooling layer

Layer ini mengimplementasikan operasi downsampling untuk

mengurangi ukuran spasial dari convolutional layer. Pertama,

ukuran pooling mask dan jenis operasi pooling harus ditentukan dan

setelah itu dapatditerapkan pada pooling layer.

Operasi pooling diimplementasikan pada nilai-nilai piksel yang

ditangkap oleh pooling mask, lalu dikalikan dengan trainable

coefficient, setelah itu ditambahkan ke trainable bias. Operasi

pooling dirumuskan sebagai berikut.


29

𝑥𝑗𝑙 = 𝑓(𝐵𝑗𝑙 𝑝𝑜𝑜𝑙(𝑥𝑗𝑙−𝑖 ) + 𝑏𝑗𝑙 ) (2.2)

3. Fully Connected layers

Layer ini digunakan untuk mengekstrak feature pada layer

sebelumnya untuk selanjutnya dilakunnya tugas klasifikasi. Hasil

dari convolutional atau pooling layer terakhir akan diberikan ke

fully connected layers seperti dalam jaringan sraf asli.

B. Fungsi Aktivasi

Fungsi aktivasi adalah fungsi non linear yang memungkinkan sebuah neural network

untuk dapat mentransformasikan data input menjadi dimensi yang lebih tinggi

sehingga dapat dilakukan hyperlane sederhana yang memungkinkannya dilakukan

klasifikasi (Eka Putra, 2016).

Setiap fungsi aktivasi mengambil sebuah nilai dan melakukan operasi

matematika. Pada arsitektur CNN, fungsi aktivasi terletak pada perhitungan akhir

output feature map atau sesudah proses operasi convolution atau pooling untuk

menghasilkan suatu pola fitur (Zufar & Setiyono, 2016).

Beberapa macam fungsi aktivasi yang sering digunakan dalam penelitian CNN

antara lain fungsi sigmoid, tanh, Rectified Liniear Unit (ReLU), Leaky ReLU

(LReLU), SGD dan SoftMax.

C. Learning Rate

Learning rate adalah salah satu hyper parameter yang sangat mempengaruhi

performa suatu model CNN. Dalam melakukan pencarian learning rate yang tepat,

digunakan suatu metode yang bernama cyclical learning rates (Smith, 2017), dalam
30

metode ini, akan dilakukan beberapa epochs training, dengan learning rate yang

dimulai dari nilai yang kecil, dan setiap iterasi akan diperbesar learning rate-nya,

setiap iterasi akan dilihat loss yang didapat, dan jika loss yang didapat meningkat

cukup drastis maka proses pencarian akan diberhentikan. Berdasarkan data loss yang

didapat, maka dipilih learning rate sesaat sebelum loss memiliki nilai terendah.

Gambar 2.7 Plot learning rate terhadap loss

Dapat dilihat pada Gambar 2.7 bahwa pada saat learning rate−berada pada titik

1e-02 titik ini memiliki nilai loss terkecil kedua, maka titik ini cocok untuk dipilih

untuk menjadi learning rate (Smith, 2017).

Dalam pembelajaran Deep Learning terdapat beberapa metode yaitu Artificial

Neural Network (ANN), Recurrent Neural Network (RNN) dan Convolutional

Neural Network (CNN). Berikut perbedaan antara beberapa metode tersebut:


31

Tabel 2.1 Perbandingan ANN, CNN dan RNN

Perbedaan ANN CNN RNN


Tipe data Tabular Data, Text Image Data Sequence Data
data
Parameter No Yes Yes
Sharing
Fixed Length Yes Yes No
input
Recurrent No No Yes
Connections
Vanishing dan Yes Yes Yes
Exploding
Gradient
Spatial No Yes No
Relationship
Performa ANN dianggap CNN dianggap RNN mencakup
kurang powerful lebih powerful lebih sedikit
dibandingkan dibandingkan kompabilitas fitur
CNN dan RNN. ANN dan RNN. dibandingkan
dengan CNN.
Pengaplikasian Facial Recognition Facial Text-to-Speech
dan Computer Recognition, Conversion.
Vision Image
Classification dan
Natural Language
Processing.
Keuntungan Memiliki Fault Memiliki akurasi Mampu mengingat
Tolerance, yan tinggi dalam setiap informasi,
kemampuan untuk pengenalan time series
bekerja denan gambar dan weight prediction.
pengetahuan yang sharing
tidak lengkap.
Kekurangan Bergantung Membutuhkan Gradient vanishing
kepada perangkat data pelatihan dan exploding
keras yang yang besar. gradient.
digunakan,
perilaku jaringan
tidak dapat
dijelaskan.
32

2.1.13 Long Short-Term Memory

Long Short-Term Memory merupakan salah satu pendekatan menggunakan arsitektur

Recurrent neural network (RNN) yang pertama kali dikenalkan oleh Sepp Hochreiter

and Jürgen Schmidhuber pada tahun 1997. LSTM dikenalkan untuk menyelesaikan

masalah vanishing gradient yang terjadi dalam arsitektur vanilla RNN pada saat

menyimpan memori dalam jangka panjang. Hal ini karena LSTM memiliki unit yang

unik yang dapat mempelajari kapan waktu untuk membuka dan menutup gerbang

dalam jaringan untuk mengatur pergerakan error yang konstan dalam jaringan

tersebut (Sagheer & Kotb, 2019).

LSTM memiliki tiga gates atau gerbang yang masing-masing memiliki peran

untuk melindungi dan mengontrol cell state. Cell state merupakan garis horizontal

(jika dilihat dalam penggambaran pada Gambar 2.8) yang melewati bagian atas

diagram sel LSTM yang memiliki kemampuan untuk menghapus atau menambahkan

informasi baru yang masuk dalam waktu t dengan memanfaatkan struktur cermat

yang disebut gerbang. Gates atau gerbang sendiri adalah sebuah cara yang digunakan

oleh LSTM untuk melakukan seleksi terhadap informasi yang masuk ke dalam sel.

Gerbang tersebut tersusun atas layer yang menggunakan operasi sigmoid dan

perkalian pointwise (Olah, 2015).


33

Gambar 2.8 Arstitektur Long Short Term Memory (LSTM)

Forget gate merupakan gerbang pertama yang dioperasikan dalam sel LSTM.

Forget gate ini menentukan informasi mana yang harus dipertahankan dan yang harus

dibuang dari cell state. Gerbang ini menerima dua input, masing-masing dari ht-1 dan xt

yang dimana ht-1 merupakan keluaran dari proses LSTM pada time step t-1 dan xt

merupakan input pada time step t. Output dari gerbang ini adalah angka dengan

rentang 0 hingga 1. Diagram kerja forget gate ditunjukkan pada gambar 2.9.

Gambar 2.9 Struktur sel pada LSTM


34

Rumus yang digunakan pada gerbang tersebut adalah:

𝑓𝑡 = σ(𝑊𝑓 ∙ [ℎ𝑡−1 , 𝑥𝑡] + 𝑏𝑓) (2.3)

Keterangan:

ft = forget gate

σ = sigmoid function

Wf = bobot pada forget gate

ht-1 = hasil output pada time step t-1

xt = input pada time step t

bf = bias pada forget gate

Setelah didapatkan nilai dengan rentang 0 hingga 1 pada forget gate, maka

operasi selanjutnya adalah pada input gate. Input gate terdiri dari dua bagian, bagian

pertama menggunakan fungsi sigmoid yang menentukan informasi mana yang ingin

di-update. Sedangkan bagian kedua menggunakan fungsi tanh yang berfungsi untuk

menentukan vektor yang akan ditambahkan pada nilai cell state (C’t). Kedua bagian

tersebut berfungsi untuk menentukan informasi baru apa saja yang ingin disimpan

pada cell state. Layer input gate ini dapat dilihat pada gambar 2.10.

Gambar 2.10 Input gate pada LSTM


35

Rumus yang digunakan pada gerbang tersebut adalah:

𝑖𝑡 = σ(𝑊𝑖 ∙ [ℎ𝑡−1 , 𝑥𝑡] + 𝑏𝑖) (2.4)

𝐶′𝑡 = tanh(𝑊𝐶 ∙ [ℎ𝑡−1 , 𝑥𝑡] + 𝑏𝐶) (2.5)

Keterangan:

it = input gate

Wi = bobot pada gerbang input bi = bias pada gerbang input

C’t = kandidat nilai cell state baru yang akan ditambahkan ke Ct-1

tanh = fungsi tanh

Wc = bobot pada operasi cell state baru

ht-1 = hasil output pada time step t-1

xt = input pada time step t

bc = bias pada operasi cell state baru

Hasil yang didapatkan dari operasi pada forget gate dan input gate selanjutnya

dioperasikan agar hasil dari operasi tersebut dapat digunakan untuk meng-update cell

state Ct-1 .Pada operasi ini dilakukan perkalian pada state sel Ct-1 dengan hasil dari

layer forget gate (ft). Lalu tambahkan hasil perkalian tersebut dengan it * Ct seperti

pada gambar 2.11. Setelah dua operasi tersebut (operasi perkalian Ct-1 dan ft lalu

penambahan dengan it * C’t ), langkah selanjutnya adalah dengan mengoperasikan

output gate. Pada output gate, layer sigmoid akan dioperasikan terlebih dahulu untuk

menentukan bagian dari cell state apa saja yang akan digunkan sebagai hasil keluaran.

Setelah operasi sigmoid dilakukan, selanjutnya operasi tanh dijalankan pada cell state
36

lalu dikalikan dengan keluaran dari layer sigmoid yang telah dihitung sebelumnya

(Olah, 2015). Operasi ini dapat dilihat pada gambar 2.12.

Gambar 2.11 Operasi pada hasil input gate dan perkalian C’t dan it pada sel

LSTM

Gambar 2.12 Output gate pada sel LSTM

Rumus yang digunakan pada gerbang tersebut adalah:

𝐶𝑡 = 𝑓𝑡 ∗ 𝐶𝑡−1 + 𝑖𝑡 ∗ 𝐶′𝑡 (2.6)

𝑜𝑡 = σ(𝑊𝑜 ∙ [ℎ𝑡−1 , 𝑥𝑡] + 𝑏𝑜) (2.7)

ℎ𝑡 = 𝑜𝑡 ∗ tanh(𝐶𝑡) (2.8)

Keterangan:

Ct = Cell state pada time step t

ft = forget gate
37

Ct-1 = Cell state pada time step t-1

C’t = Nilai cell state baru pada hasil perhitungan gerbang input

ot = fungsi gerbang output

σ = sigmoid function

Wo = bobot pada gerbang output

ht-1 = hasil output pada time step t-1

xt = input pada time step t

bo = bias pada gerbang output

ht = output pada time step ke t

tanh = fungsi tanh

2.1.14 Precision dan Recall

Precision adalah tingkat ketepatan antara informasi yang diminta oleh pengguna

dengan jawaban yang diberikan oleh sistem. Sedangkan recall adalah tingkat

keberhasilan sistem dalam menemukan kembali sebuah informasi. Gunanya fungsi ini

agar akurasi model tidak serta merta dipercaya namun cukup dapat dipertanggung

jawabkan kebenarannya karena melihat akurasi model dari sisi lain.

2.1.15 Epoch

Epoch adalah ketika seluruh dataset sudah melalui proses training pada Neural

Netwok sampai dikembalikan ke awal untuk sekali putaran, karena satu Epoch terlalu

besar untuk dimasukkan (feeding) kedalam komputer maka dari itu kita perlu

membaginya kedalam satuan kecil (batches). Didalam epoch inilah tiap bobot/ weight

ditambahkan.
38

2.1.16 Confusion Matrix


Confusion matrix merupakan suatu metode yang dapat digunakan untuk mengukur

kinerja suatu metode klasifikasi. Confusion matrix mengandung informasi yang

membandingkan hasil klasifikasi yang dilakukan oleh sistem untuk diukur

keakuratannya. Confusion matrix juga merupakan salah satu cara dalam melakukan

visualisasi terhadap hasil pembelajaran sistem, visualisasi yang ditampilkan memuat

dua kategori atau lebih (Rahman, dkk., 2017). Tabel 2.2 di bawah merupakan contoh

hasil confusion matrix prediksi dua kelas.

Tabel 2.2. Confusion Matrix

Kelas Sebenarnya
1 2
Kelas Prediksi 1 True Positive False Negative
2 False Positive True Negative

Keterangan:

a. True Positive (TP): merupakan jumlah data dengan kelas positif yang

diklasifikasikan positif.

b. True Negative (TN): merupakan jumlah data dengan kelas negative yang

diklasifikasikan negatif.

c. False Positive (FP): merupakan jumlah data dengan kelas positif yang

diklasifikasikan negatif.

d. False Negative (FN): merupakan jumlah data dengan kelas negatif yang

diklasifikasikan positif.
39

Perhitungan Akurasi yang dilakukan oleh confusion matrix berdasarkan Tabel

2.2 dapat menggunakan persamaan sebagai berikut:

𝑇𝑃+𝑇𝑁
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑇𝑃+𝐹𝑁+𝐹𝑃+𝑇𝑁 × 100% (2.9)

𝑇𝑁
𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦 = 𝑇𝑁+𝐹𝑃 (2.10)

𝑇𝑃
𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 = (2.11)
𝑇𝑃+𝐹𝑁

2.1.17 Python

Python merupakan salah satu contoh bahasa tingkat tinggi. Contoh lain bahasa tingkat

tinggi adalah Pascal, C++, Pert, Java, dan sebagainya. Sedangkan bahasa tingkat

rendah merupakan bahasa mesin atau bahasa assembly. Secara sederhana, sebuah

komputer hanya dapat mengeksekusi program yang ditulis dalam bentuk bahasa

mesin. Oleh karena itu, jika suatu program ditulis dalam bentuk bahasa tingkat tinggi,

maka program tersebut harus diproses dulu sebelum bisa dijalankan dalam komputer.

Hal ini merupakan salah satu kekurangan bahasa tingkat tinggi yang memerlukan

waktu untuk memproses suatu program sebelum program tersebut dijalankan. Akan

tetapi, bahasa tingkat tinggi mempunyai banyak sekali keuntungan. Bahasa tingkat

tinggi mudah dipelajari, mudah ditulis, mudah dibaca, dan tentu saja mudah dicari

kesalahannya. Bahasa tingkat tinggi juga mudah diubah portabel untuk disesuaikan

dengan mesin yang menjalankannya. Hal ini berbeda dengan bahasa mesin yang

hanya dapat digunakan untuk mesin tersebut. Dengan berbagai kelebihan ini, maka

banyak aplikasi ditulis menggunakan bahasa tingkat tinggi. Proses mengubah dad
40

bentuk bahasa tingkat tinggi ke tingkat rendah datam bahasa pemrograman ada dua

tipe, yakni interpreter dan compiler (Utami, 2004).

2.1.18 OSEMN Framework


OSEMN Framework adalah model penelitan yang terstandarisasi dan diterima secara

luas dalam bidang data science. OSEMN dapat memecahkan masalah data science

dalam skala besar (Byrne et al., 2017).

OSEMN memiliki langkah-langkah yang mudah dipahami dan konsisten secara

logis dari alur kerja pemrosesan data, diperkaya dengan instruksi tambahan, catatan

dan dokumen sampel, memastikan kinerja kegiatan dan pencapaian hasil yang sama

dari aktifitas dan pengguna yang berbeda (Dineva & Atanasova, 2018).

Menurut (Kumari et al., 2020) terdapat 5 tahapan pada OSEMN yang juga

sesuai dengan namanya:

1. O(Obtain)/ Pengumpulan data

Mengumpulkan data dari sumber yang relevan. Pada tahap ini kita harus

mengetahui data apa saja yang diperlukan, darimana sumbernya, bagaimana

mengumpulkannya, dan bagaimana menyiapkan datanya agar memenuhi

hasil yang diinginkan.

2. S(Scrub)/ Data Preparation

Pada tahap ini, data yang sudah dikumpulkan akan di bersihkan dan di filter

menjadi format yang dapat dimengerti mesin. Biasanya tahap ini meliputi:

- Handling missing data


41

- Correcting invalid values

- Removing duplicates

- Structuring the data to be fed in algorithm

- Feature engineering

3. E(Explore)/ Ekplorasi data

Pada tahap ini, data akan di eksplorasi dan menentukan karateristik dari

data tersebut. Kemudian data akan di ekstrak atribut dan variabel ujinya

yang kemudian akan dimasukkan ke tahap pemodelan.

4. M(Model)/Tahap Pemodelan

Pada tahap ini, data yang sudah di ekstrak akan masuk ke tahap pemodelan.

Pemodelan dibuat untuk menghasilkan parameter dan fitur data yang akan

digunakan pada tahap prediksi sebagai output.

5. N(iNterpreting)/Menginterpretasikan hasil

Tahap ini adalah tahap mengintrepretasikan hasil prediksi dan memberikan

hasil sedemikian rupa berupa presentasi data.

2.2 Tinjuan Pustaka

Tinjauan Pustaka di ambil dari beberapa skripsi dan jurnal yang berhubungan dengan

penelitian. Setiap literatur akan dibahas satu persatu secara singkat tentang judul,

tools dan hasil dari setiap penelitian.

1. Pada penelitian yang berjudul “COVID-19 classification using chest X-

ray images: A framework of CNN-LSTM and improved max value moth

flame optimization” tahun 2022, yang ditulis oleh Ameer Hamza dkk
42

bertujuan untuk membuat usulan metode CNN-LSTM dan IMFO dalam

kalsifikasi COVID-19 melalui Chest X-ray Images. Hasil dari penelitian

tersebut adalah:

Gambar 2.13 Hasil Penelitian Literatur 1

Penelitian ini menyimpulkan bahwa penggunaan metode CNN-LSTM

dan optimasi usulan penelitian ini memiliki tingkat akurasi yang sangat

bagus dalam klasifikasi COVID-19.

2. Pada penelitian yang berjudul “Image classification using a hybrid lstm-

cnn deep neural network” tahun 2019, yang ditulis oleh Aditi, Mayank

Kumar Nagda dan Poovammal E bertujuan untuk mengetahui strategi

pembelajaran CNN-LSTM yang memiliki performa terbaik dengan

berbagai skenario dalam klasifikasi gambar. Penelitian ini

menyimpulkan bahwa metode CNN-LSTM memiliki nilai akurasi

99,29% pada klasifikasi MNIST handwritten digit dataset dan hasil

akurasi sebesar 85% pada klasifikasi IDC Breast cancer.

3. Pada penelitian yang berjudul “Malaria Parasite Detection from

Peripheral Blood Smear Images Using Deep Belief Networks” tahun


43

2017, yang ditulis oleh Dhanya Bibin, Madhu S. Nair dan P. Punitha

bertujuan untuk mengidentifikasi parasit malaria dalam sel darah

manusia menggunakan Deep Belief Networks (DBN). Penelitian ini

menggunakan model DBN dengan arsitektur 484-600-600-600-2.

Penelitian ini menghasilkan nilai akurasi 96,35%.

4. Pada penelitian yang berjudul “Detection Of Malaria Parasites In

Human Blood Cells Using Convolutional Neural Network” tahun 2023,

yang ditulis oleh Lusiana Efrizoni, Rais Amin dan Ahmad rizali

bertujuan untuk mendeteksi parasit malaria dalam sel darah manusia

menggunakan CNN dengan arsitektur ResNet. Penelitian ini

menghasilkan nilai akurasi seperti gambar dibawah:

Gambar 2.14 Hasil Penelitian Literatur 4

5. Pada penelitian yang berjudul “Data Science in biomedicine” tahun

2019, yang ditulis oleh Yovaninna Alarcon-Soto dkk bertujuan untuk

menunjukkan tugas Data Science dalam pengolahan data Biomedicine.

Pada penelitian ini menunjukkan bahwa Data Science dapat digunakan

dalam pengolahan data biologikal dan penelitian medis lainnya.


44

Tabel 2.3 Perbandingan Penelitian sejenis

No. Penulis Judul Dataset Metode Hasil


1. (Hamza et al., COVID-19 classification COVID-19 chest X- CNN-LSTM Arsitektur CNN-LSTM
2022) using chest X-ray images: ray images yang dikembangkan
A framework of CNN- memiliki tingkat akurasi
LSTM and improved max yang sangat bagus
value moth flame dalam klasifikasi
optimization COVID-19 melalui x-
ray images yaitu 98.5%.
2. (Aditi et al., Image classification Klasifikasi Gambar CNN-LSTM Penelitian ini
2019) using a hybrid lstm-cnn Multi-Kelas menelaborasi dua
deep neural network metode CNN dan
LSTM dan
menyimpulkan bahwa
penggabungan ini dapat
meningkatkan akurasi
dalam klasifikasi
gambar.
3. (Bibin et al., Malaria Parasite Parasit Malaria DBN Penelitian ini
2017) Detection from dalam sel darah menggunakan model
Peripheral Blood Smear manusia DBN dengan arsitektur
Images Using Deep Belief 484-600-600-600-2.
Networks Penelitian ini
menghasilkan nilai
akurasi 96,35%.
4. (Lusiana Efrizoni Detection Of Malaria Parasit Malaria CNN Penelitian ini
et al., 2023) Parasites In Human dalam sel darah menggunakan metode
Blood Cells Using manusia CNN dengan arsitektur
45

Convolutional Neural ResNet dan


Network mendapatkan hasil
akurasi sebesar 97%.
5. (Alarcón-Soto et Data Science in Biomedicine Data Science Data Science dapat
al., 2019) biomedicine digunakan dalam
pengolahan data
biologikal dan
penelitian medis
lainnya.
6. (Rais Amin, Pendeteksian Parasit Parasit Malaria CNN-LSTM Penelitian ini
2023) Malaria dalam Sel darah dalam sel darah menggunakan
Manusia Menggunakan manusia pembelajaran Deep
Deep Learning Learning dengan
metode CNN-LSTM
dan menghasilkan nilai
96,25% untuk training
accuracy dan 95,6%
untuk validation
accuracy
BAB III
METODOLOGI PENELITIAN

Pada proses perancangan sistem, dibuatlah kerangka kerja dalam bentuk skema.

Metodologi penelitian dijadikan panduan untuk menentukan tahap-tahap yang harus

dilakukan dalam penelitian. Tahap-tahap tersebut meliputi:

3.1 OSEMN Framework

Dalam penelitian ini, penulis menggunakan OSEMN Framework dalam pegolahan

Data Science. Berikut ini merupakan langkah-langkah pada OSEMN Framework:

Obtain Scrub Explore Model Interpret


• Menentutakan • Split dan • Membuat kategori • Membuat dan • Menampilkan hasil
Konsep penelitian penyamaan ukuran data melatih model uji validasi dan
• Mengumpulkan gambar pada • Ekstrak fitur dan klasifikasi parasit akurasi
dataset dataset augmentasi data malaria • Menampilkan hasil
prediksi sistem

Gambar 3.1 Alur Penelitian Menggunakan OSEMN Framework

3.1.1 Obtain(Pengumpulan data)

Pengumpulan data dan informasi yang penulis lakukan yaitu dengan menggunakan

studi pustaka dan mendapatkan hasil berupa dataset yang diambil dari National

46
47

Library of Medicine yang dikembangkan oleh Stefan Jaeger pada tahun 2018

https://data.lhncbc.nlm.nih.gov/public/Malaria/cell_images.zip yang dapat diakses

bebas untuk kepentingan pengembangan aplikasi dan pembelajaran. Dataset ini

nantinya akan digunakan sebagai data input sistem prediksi parasit malaria.

Dataset terdiri dari 27.558 gambar sel yang terbagi kedalam dua kategori yaitu

parasitized dan uninfected. Setiap kategori terdiri dari 13.779 gambar sel.

3.1.2 Scrub(Data Preparation)

Setelah seluruh data gambar berhasil dikumpulkan, data gambar tersebut nantinya

akan dibagi menjadi data training, data testing dan data validation. Selanjutnya

membuat konfigurasi untuk membaca path folder dataset dengan ratio data training

80%, validation data 20%. Pada penentuan rasio pembagian dataset ini, untuk rasio

pembagian data training dan data testing menggunakan metode Simple Hold-Out

Validation (Chollet, 2018), metode ini menjadi acuan standar dalam pembagian data

training dan validation dengan ratio 80:20 dan untuk ratio pembagian data training

dan data testing berdasarkan penelitian (Akromunnisa et al., 2019) yang

membandingkan antara nilai split 6:4, 7:3, 8:2 dan 9:1. Dari penelitian tersebut

disimpulkan bahwa ratio 9:1 menghasilkan nilai akurasi yang lebih besar dari ratio

yang lainnya.

Kemudian data dibagi menjadi 3 folder training, testing dan validation dan

semua gambar diberikan label sesuai dengan folder yang telah dibuat.
48

3.1.3 Explore(Eksplorasi data)

Pada tahap ini, semua data yang telah dikumpulkan dan dibagi menjadi folder

training, testing dan validation di samakan seluruh ukuran yaitu 64x64 piksel dan

kategori warnanya yaitu “rgb”(“red”,”green”,”blue”) kemudian diberikan label

kategori “categorial” yang dikarenakan setiap folder berisikan dua kelas kategori

yaitu “Parasitized” dan “Uninfected”. Kemudian untuk data pada folder training

akan di augmentasikan menggunakan modul Keras ImageDataGenerator. Data

training di augmentasi dengan mengubah skala gambar dengan skala 1/255, dan

gambar di rotasi dengan range=20, dan zoom range=0.05, width shift range=0.05,

height shift range=0.05, shear range=0.05 dan data gambar di flip secara horizontal.

Kemudian data pada folder validation akan di augmentasikan juga menggunakan

modul Keras ImageDataGenerator dengan mengubah skala gambar menjadi 1/255.

Data pada validation ini tidak dirotasi dan di flip dikarenakan nantinya akan

digunakan sebagai uji validasi model data training yang sudah diubah dengan data

validation yang skala gambarnya sama. Data pada folder testing tidak di

augmentasikan dikarenakan nantinya akan digunakan sebagai data uji tahap prediksi

model terhadap data yang asli.

3.1.4 Model(Perancangan Model)

Pada tahap ini penulis melakukan pembuatan model dari dataset yang ada untuk

mengenali gambar dan proses klasifikasi menggunakan algoritma atau metode

Convolutional Neural Network - Long Short Term Memory agar sistem dapat

mendeteksi parasit malaria.


49

Gambar 3.2 Arsitektur Model CNN-LSTM

Dalam proses ini model akan dilatih dengan mengoptimalkan multinomial

logistic regression menggunakan Stochastic Gradient Descent (SGD) (Lecun et al.,

2015) dan nilai momentum Nesterov (Botev et al., 2017). Model yang disesuaikan

dioptimalkan untuk hiper-parameter dengan metode pencarian grid search (Bergstra

& Bengio, 2012).

Pada proses pelatihan model ini akan digunakan arsitektur model yang telah

dibuat yang diberi nilai input_shape= 64x64 pixel, 3 channel gambar RGB

(“red”,”green”,”blue”), nilai kelas 2 dimana pada dataset memiliki 2 kelas,

kernel_size=(3 , 4 , 6) dan dengan nilai regression=0.0005. Penentuan nilai dari

epoch untuk pelatihan model adalah 50 yang dimana suatu perulangan dari proses

pelatihan pada satu kali sesi lewatan sebanyak 50 kali guna mendapatkan error

terkecil dan menghasilkan kinerja yang baik untuk model yang dibuat. Sedangkan

untuk kategori loss yang digunakan adalah 'binary_crossentropy', dan untuk


50

optimizer menggunakan 'SGD' dengan nilai learning rate = 1e-1 dan nilai

momentum= 0.9.

3.1.5 iNterpreting(Mengintrepretasikan hasil)

Pada tahap ini akan meninterpretasikan hasil pemodelan yang telah dilakukan yaitu

hasil akurasi pengujian model dan visualisasi hasil prediksi pendeteksi parasit

malaria.

Hasil akurasi ditentukan melalu hasil Precision, Recall, dan F1-score. Model

akan diuji tingkat akurasinya menggunakan confussion matrix dengan binary

classification untuk mengklasifikasi dan menentukan hasil akurasi model terhadap

prediksi kategori data yang Uninfected dan Parasitized. Nantinya semakin tinggi nilai

akurasi maka semakin bagus model yang telah dibuat.


BAB IV
HASIL DAN PEMBAHASAN

4.1 Obtain (Pengumpulan Data)


Pengumpulan data dan informasi yang penulis lakukan yaitu dengan

menggunakan studi pustaka dan mendapatkan hasil berupa dataset public yang

diambil dari National Library of Medicine yang telah dibuat dan dikembangkan oleh

Stefan Jaeger dan Feng Yang pada tahun 2018 yang didapat pada Gambar 4.1 dan

dapat diakses bebas untuk kepentingan pengembangan aplikasi dan pembelajaran.

Dataset ini nantinya akan digunakan sebagai data input sistem klasifikasi parasit

malaria.

Gambar 4.1 Sumber pengumpulan Dataset

51
52

Dataset pada Gambar 4.2 terdiri dari 27.558 gambar sel yang terbagi kedalam

dua kategori yaitu parasitized dan uninfected. Setiap kategori terdiri dari 13.779

gambar sel.

Gambar 4.2 Dataset Parasit Malaria

4.2 Scrub (Preparasi Data)


Dataset yang telah terkumpul akan melalui tahap preparasi data, selanjutnya dataset

dibagi menjadi 3 folder training, testing dan validation. Yang nantinya akan

digunakan dalam proses modeling, pengujian dan prediksi. Kemudian data tersebut

disamakan ukurannya dan diberikan label “1” untuk kategori parasitized dan label

“0” untuk kategori uninfected dengan source code pada Gambar 4.3 .

imagePaths = list(paths.list_images(DATASET))
random.seed(42)
random.shuffle(imagePaths)

i = int(len(imagePaths) * TRAIN_SPLIT)
trainPaths = imagePaths[:i]
testPaths = imagePaths[i:]

i = int(len(trainPaths) * VAL_SPLIT)
valPaths = trainPaths[:i]
trainPaths = trainPaths[i:]
53

datasets = [
("training", trainPaths, TRAIN_PATH),
("validation", valPaths, VAL_PATH),
("testing", testPaths, TEST_PATH)]

for (dType, imagePaths, baseOutput) in datasets:


print("[INFO] building '{}' split".format(dType))

if not os.path.exists(baseOutput):
print("[INFO] 'creating {}' directory".format(baseOutput))
os.makedirs(baseOutput)
for inputPath in imagePaths:
filename = inputPath.split(os.path.sep)[-1]
label = inputPath.split(os.path.sep)[-2]
labelPath = os.path.sep.join([baseOutput, label])
if not os.path.exists(labelPath):
print("[INFO] 'creating {}' directory".format(labelPath))
os.makedirs(labelPath)
p = os.path.sep.join([labelPath, filename])
shutil.copy2(inputPath, p)
Gambar 4.3 Source code Split Dataset.

Tabel 4.1 menunjukkan sebaran data yang terdapat pada folder training,
validation dan testing:

Tabel 4.1 Sebaran data hasil pembagian dataset

No. Nama folder Kategori Jumlah data


Parasitized Uninfected
1. cell_images(dataset) 13779 13779 27558
2. Training 9955 9887 19842
3. Validation 1098 1106 2204
4. Testing 2786 2726 5512

4.3 Explore (Eksplorasi data)


Semua data yang telah dikumpulkan dan dibagi menjadi folder training, testing dan

validation dan telah disamakan seluruh ukurannya yaitu 64x64 piksel kemudian

diberikan label kategori “categorial” yang dikarenakan setiap folder berisikan dua
54

kelas kategori yaitu “Parasitized” dan “Uninfected”. Kemudian untuk data pada

folder training akan di augmentasikan menggunakan modul Keras

ImageDataGenerator. Data training di augmentasi dengan mengubah skala gambar

dengan skala 1/255, dan gambar di rotasi dengan range=20, dan zoom range=0.05,

width shift range=0.05, height shift range=0.05, shear range=0.05 dan data gambar

di flip secara horizontal dan kategori warnanya yaitu “rgb”(“red”,”green”,”blue”).

Kemudian data pada folder validation akan di augmentasikan juga menggunakan

modul Keras ImageDataGenerator dengan mengubah skala gambar menjadi 1/255.

Data pada validation ini tidak dirotasi dan di flip dikarenakan nantinya akan

digunakan sebagai uji validasi model data training yang sudah diubah dengan data

validation yang skala gambarnya sama. Data pada folder testing tidak di

augmentasikan dikarenakan nantinya akan digunakan sebagai data uji tahap prediksi

model terhadap data yang asli. Gambar 4.4 adalah source code pada tahap eksplorasi

data ini:

NUM_EPOCHS = 25
BS = 32
trainAug = ImageDataGenerator(
rescale=1 / 255.0,
rotation_range=20,
zoom_range=0.05,
width_shift_range=0.05,
height_shift_range=0.05,
shear_range=0.05,
horizontal_flip=True,
fill_mode="nearest")
valAug = ImageDataGenerator(rescale=1 / 255.0)
trainGen = trainAug.flow_from_directory(
TRAIN_PATH,
class_mode="categorical",
target_size=(130, 130),
color_mode="rgb",
shuffle=True,
batch_size=32)
55

valGen = valAug.flow_from_directory(
VAL_PATH,
class_mode="categorical",
target_size=(130, 130),
color_mode="rgb",
shuffle=False,
batch_size=BS)
testGen = valAug.flow_from_directory(
TEST_PATH,
class_mode="categorical",
target_size=(130, 130),
color_mode="rgb",
shuffle=False,
batch_size=BS)
Gambar 4.4 Source Code Augmentasi data

4.4 Model(Perancangan Model)


Perancangan model pada proses klasifikasi parasit malaria ini menggunakan

algoritma atau metode Convolutional Neural Network - Long Short Term Memory.

Gambar 4.5 adalah source code arsitektur jaringan model yang dibentuk:

model = Sequential()
model.add(Conv2D(32, (3,3), activation = 'relu', input_shape = inputShape))
model.add(MaxPooling2D(2,2))
model.add(BatchNormalization(axis = -1))
model.add(Dropout(0.2))
model.add(Conv2D(32, (3,3), activation = 'relu'))
model.add(MaxPooling2D(2,2))
model.add(BatchNormalization(axis = -1))
model.add(Dropout(0.2))
model.add(Conv2D(32, (3,3), activation = 'relu'))
model.add(MaxPooling2D(2,2))
model.add(BatchNormalization(axis = -1))
model.add(Dropout(0.2))
model.add(TimeDistributed(Flatten()))
model.add(LSTM(512,return_sequences=False))
model.add(Dense(512, activation = 'relu'))
model.add(BatchNormalization(axis = -1))
model.add(Dropout(0.5))
model.add(Dense(2, activation = 'softmax'))
model.compile(loss = 'categorical_crossentropy', optimizer = 'adam', metrics = ['accuracy'])
model.build(inputShape)
model.summary()
Gambar 4.5 Source Code arsitektur jaringan CNN-LSTM

Penelitian ini menggunakan input gambar dengan ukuran 64x64x3, tujuannya

adalah untuk membandingkan nilai akurasi berdasarkan ukuran gambar aslinya.

Arsitektur jaringan pada penelitian ini dijelaskan seperti penjelasan dibawah ini :
56

1. Proses Konvolusi pertama digunakan kernel berukuran 3x3 dan jumlah

filter sebanyak 64 filter , proses konvolusi ini adalah proses kombinasi

antara dua buah matriks yang berbeda untuk menghasilkan suatu nilai

matriks yang baru. Setelah proses konvolusi, maka ditambahkan sebuah

aktivasi fungsi yaitu RELU (Retrified Linear Unit). Fungsi aktivasi ini

bertujuan untuk mengubah nilai negative menjadi nol (menghilangkan

nilai negative dalam sebuah matriks hasil konvolusi). Hasil konvolusi

ini memiliki ukuran 64 x 64.

2. Proses pooling pertama. Penelitian ini menggunakan maxpooling untuk

mendapatkan nilai matriks yang baru hasil dari proses pooling.

Berdasarkan hasil pooling menghasilkan matriks baru berukuran 32x32

dari input hasil konvolusi pertama yang berukuran 64x64. Proses ini

menggunakan kernel pooling 3x3. Cara kerja maxpooling adalah

mengambil nilai paling maksimum berdasarkan pergeseran kernelnya

sebnayak nilai stridenya yaitu 2.

3. Proses Kovolusi kedua yaitu meneruskan hasil dari proses pooling

pertama yakni dengan input matriks gambar sebesar 32x32 pada 3

jumlah filter yaitu 32, 32 dan 128 filter dan dengan ukuran kernel 3x3.

Proses konvolsi kedua ini sama-sama menggunakan fungsi aktivasi

RELU. Proses ini menghasilkan gambar berukuran 32x32.

4. Proses Kovolusi ketiga yaitu meneruskan hasil dari proses konvolusi

kedua yakni dengan input matriks gambar sebesar 32x32 pada 3 jumlah
57

filter yaitu 64, 64 dan 256 filter dan dengan ukuran kernel 4x4. Proses

konvolsi ketiga ini sama-sama menggunakan fungsi aktivasi RELU.

Proses ini menghasilkan gambar berukuran 16x16.

5. Proses Kovolusi keempat yaitu meneruskan hasil dari proses konvolusi

ketiga yakni dengan input matriks gambar sebesar 16x16 pada 3 jumlah

filter yaitu 128, 128 dan 512 filter dan dengan ukuran kernel 6x6. Proses

konvolusi keempat ini sama-sama menggunakan fungsi aktivasi RELU.

Proses ini menghasilkan gambar berukuran 8x8.

6. Proses selanjutnya masuk ke proses pooling yang kedua, proses ini

hampir sama dengan proses pooling yang pertama, namun pada proses

ini menggunakan average pooling dengan ukuran kernel 8x8. Proses ini

menghasilkan nilai output akhir dari matriksnya yaitu gambar berukuran

1x1.

7. Selanjutnya Flatten. Pada tahap ini digunakan hanya satu hidden layer

pada jaringan MLP (Multi Layer Perceptron). Flatten disini mengubah

output pooling layer menjadi sebuah vector.

8. Layer LSTM. Pada tahap ini menggunakan 512 neuron hidden layer

dengan pengaturan “return_sequences=False”.

9. Proses terakhir adalah menggunakan aktivasi fungsi Softmax. Fungsi ini

secara spesifiknya biasa digunakan pada metode klasifikasi multinomial

logistic regression dan multiclass linear discriminant analisys.


58

Berdasarkan uraian penjelasan dari arsitektur jaringan diatas, dari proses

training didapatkan model dari arsitektur tersebut. Gambar 4.6 adalah model yang

terbentuk :

Model: "sequential"
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
conv2d (Conv2D) (None, 48, 48, 32) 896
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 24, 24, 32) 0
_________________________________________________________________
batch_normalization (BatchNo (None, 24, 24, 32) 128
_________________________________________________________________
dropout (Dropout) (None, 24, 24, 32) 0
_________________________________________________________________
conv2d_1 (Conv2D) (None, 22, 22, 32) 9248
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 11, 11, 32) 0
_________________________________________________________________
batch_normalization_1 (Batch (None, 11, 11, 32) 128
_________________________________________________________________
dropout_1 (Dropout) (None, 11, 11, 32) 0
_________________________________________________________________
conv2d_2 (Conv2D) (None, 9, 9, 32) 9248
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 4, 4, 32) 0
_________________________________________________________________
batch_normalization_2 (Batch (None, 4, 4, 32) 128
_________________________________________________________________
dropout_2 (Dropout) (None, 4, 4, 32) 0
_________________________________________________________________
flatten (Flatten) (None, 4, 128) 0
_________________________________________________________________
LSTM (LSTM) (None, 512) 1312768
_________________________________________________________________
dense (Dense) (None, 512) 262656
_________________________________________________________________
batch_normalization_3 (Batch (None, 512) 2048
_________________________________________________________________
dropout_3 (Dropout) (None, 512) 0
_________________________________________________________________
dense_1 (Dense) (None, 2) 1026
=================================================================
Total params: 1,598,274
Trainable params: 1,597,058
Non-trainable params: 1,216

Gambar 4.6 Hasil training model


Gambar 4.6 merupakan model yang terbentuk dari hasil training. Total

parameter yang terbentuk dari model sebanyak 1.598.274 neuron, dan parameter yang
59

akan di training sebanyak 1.597.058 neuron dan parameter yang tidak di training

sebanyak 1.216 neuron.

4.4.1 Convolution Layer


Konvolusi merupakan proses menggambungkan dua deret angka pada suatu gambar

sehingga menghasilkan deret angka yang baru, dengan kata lain gambar tersebut

dimanipulasi dengan menggunakan external mask / subwindows untuk menghasilkan

citra yang baru, angka konvolusi pada citra tersebut berbentuk matriks array. Pada

pemodelan ini digunakan input gambar dengan ukuran pixel 64x64x3, yang

menjelaskan ukuran tinggi dan lebar pixel gambar sebesar 64 pixel dan gambar input

tersebut memiliki 3 channel yaitu red, green, dan blue atau yang biasa disebut dengan

RGB.

Setiap channel piksel memiliki nilai matriks yang berbeda-beda. Input akan di

konvolusi dengan nilai filter yang sudah ditentukan. Filter merupakan blok lain atau

kubus dengan tinggi dan lebar yang lebih kecil namun kedalaman yang sama yang

tersapu di atas gambar dasar atau gambar asli. Filter digunakan untuk menentukan

pola apa yang akan dideteksi yang selanjutnya dikonvolusi atau dikalikan dengan nilai

pada matriks input, nilai pada masingmasing kolom dan baris pada matriks sangat

bergantung pada jenis pola yang akan dideteksi. Jumlah filter pada konvo ini

sebanyak 64 dengan ukuran kernel (3x3), ini artinya gambar yang dihasilkan dari

hasil konvolusi akan sebanyak 64 fitur map.

Berdasarkan arsitektur jaringan diatas digunakan aktivasi ReLU (Rectified

Linear Unit) setelah proses konvolusi. Fungsi dari aktivasi ini adalah melakukan
60

“treshold” dari 0 hingga infinity. Nilai yang ada pada hasil konvolusi yang bernilai

negatif akan diubah dengan aktivasi ini menjadi nol dan yang lainnya sampai infinity.

4.4.2 Proses Pooling


Pooling atau penggabungkan merupakan proses dari CNN dimana matriks input

disederhanakan menjadi matriks yang baru. Pada penelitian ini digunakan metode

max pooling dan average pooling pada proses poolingnya dimana diambil nilai

terbesar dari matriks input dan menghasilkan matriks baru sebagai outputnya.

4.4.3 LSTM Layer


LSTM merupakan varian dari unit Recurrent Neural Network (RNN). LSTM secara

umum terdiri dari cell, input gate, output gate, dan forget gate. LSTM neural network

sangat cocok untuk mengklasifikasi, memproses, dan membuat prediksi berdasarkan

data time series karena mungkin ada kelangkaan durasi yang tidak diketahui di antara

peristiwa penting dalam rangkaian waktu.

LSTM cell mengambil masukan dan menyimpannya untuk beberapa waktu.

Secara intuitif, input gate mengontrol sejauh mana nilai baru akan berjalan ke dalam

cell, forget gate mengontrol sejauh mana nilai tetap di dalam cell, dan output gate

mengontrol sejauh mana nilai dalam cell digunakan untuk menghitung aktivasi

keluaran dari unit LSTM. Pada penelitian ini menggunakan 512 hidden unit pada

layer LSTM ini.

4.4.4 Fully Connected Layer


Proses terakhir adalah fully-connected. Hasil dari proses terakhir dari model

yang ada pada feature extraction layer masih berbentuk multidimensional array,
61

sehingga harus dilakukan reshape feature map menjadi sebuah vector agar bisa

digunakan sebagai input dari fully-connected layer. Setelah itu diberi fungsi dense.

Dense adalah fungsi untuk menambahkan layer pada fully connected.

Pada arsitektur jaringan CNN-LSTM ini menggunakan dense sebanyak 512

unit. Unit tersebut artinya jumlah node yang harus ada di hidden layer, nilainya antara

jumlah input node dan output node. Fungsi dari fully connected layer ini adalah untuk

melakukan transformasi pada dimensi data agar data dapat diklasifikasikan secara

linear. Kemudian di inialisasi layer outputnya, yang berupa 2 node, karena dalam

klasifikasi ini terdapat 2 kelas yaitu Parasitized dan Uinfected.

4.5 iNterpreting
Interpretasi hasil pemodelan yang telah dilakukan yaitu hasil akurasi pengujian

model dan visualisasi hasil prediksi pendeteksi parasit malaria. Pada pengujian

akurasi prediksi ini model yang telah tersimpan dalam malaria_model.h5 akan di

evaluasi dengan cara pembuatan prediksi pada data yang terdapat pada folder testing

dan selanjutnya dapat menentukan label dengan probabilitas yang terbesar untuk

setiap gambar yang ada. Dan hasil prediksi model ini akan disimpan ke dalam

prediction_model.h5. Gambar 4.7 adalah source code yang dibuat untuk menguji

akurasi:

model.compile(loss = 'categorical_crossentropy', optimizer = 'adam', metrics = ['accuracy'])


model.fit(X_train, y_train, epochs = 5, batch_size = 32)
model.save(‘prediction_model.h5’)
Gambar 4.7 Source code Uji Akurasi Model
Dengan menggunakan iterasi epoch sebanyak 5 kali selanjutnya didapatkan

hasil akurasi training model pada Gambar 4.8.


62

Epoch 1/5
515/515 [==============================] - 166s 206ms/step - loss: 0.5092 - accuracy: 0.7889
Epoch 2/5
515/515 [==============================] - 106s 206ms/step - loss: 0.1996 - accuracy: 0.9348
Epoch 3/5
515/515 [==============================] - 107s 209ms/step - loss: 0.1570 - accuracy: 0.9521
Epoch 4/5
515/515 [==============================] - 105s 203ms/step - loss: 0.1477 - accuracy: 0.9553
Epoch 5/5
515/515 [==============================] - 106s 205ms/step - loss: 0.1410 - accuracy: 0.9565
Gambar 4.8 Hasil akurasi training model

Uji validasi juga dibutuhkan untuk menentukan nilai loss dan tingkat akurasi

model terhadap data validation. Gambar 4.9 adalah source code untuk menentukan

hasil akurasi validasi model.

predict = model.evaluate(X_test, y_test)


print("Loss: ",predict[0])
print("Accuracy: ",predict[1]*100)
Gambar 4.9 Source code uji validasi model

Dari uji validasi pada Gambar 4.9 didapatkan hasil sebagai berikut:

129/129 [==============================] - 6s 40ms/step - loss:


0.1232 - accuracy: 0.9626
Loss: 0.12318982928991318
Accuracy: 96.25577330589294
Gambar 4.10 Hasil uji validasi model

Berdasarkan Gambar 4.10 menunjukan hasil akurasi training model, dapat

diketahui besar loss 14,1% dengan akurasi yang tinggi sebesar 95,6%. Sedangkan

untuk data validasi, nilai loss yaitu sebesar 12,3% dan akurasi sebesar 96,25%. Yang

berarti menunjukkan akurasi model sebesar 96,25%. Dengan hasil tersebut dapat

dibuktikan bahwa pemodelan berhasil dan sistem dapat dengan sangat baik

membedakan data gambar yang Parasitized dan Uninfected.


63

Setelah pemodelan telah selesai dan tahap finalisasi, kemudian model tersebut

dihubungkan pada program prediksi agar dapat dijalankan, digunakan, dan diuji

dengan data pada folder testing yang berisikan 5.512 data gambar yang terbagi

kedalam 2 folder parasitized dan uninfected yang berisikan 2.726 data gambar dan

uninfected yang berisikan 2.786 data gambar . Dalam tahap pengujian model terhadap

data pada gambar yang terdapat pada folder testing menghasilkan nilai akurasi yang

sangat bagus yaitu 96% yang dapat dilihat pada Gambar , dimana hasil ini sangat

bagus yang membuktikan bahwa sistem dapat megenali dan membedakan gambar

yang Parasitized dan Uininfected.

precision Recall F1-score Support


Parasitized 0.96 0.95 0.96 2726
Uninfected 0.95 0.96 0.96 2786
Accuracy 0.96 5512
Macro avg 0.96 0.96 0.96 5512
Weighted avg 0.96 0.96 0.96 5512
Gambar 4.11 Hasil uji akurasi pada data testing

Dari data pada Gambar 4.11 didapatkan hasil bahwa dalam pengenalan dalam

kelas Parasitized tingkat akurasi pegenalan adalah 96 % dari data gambar sebanyak

2.726, dan tingkat akurasi yang sama 96 % pada pengenalan kelas Uninfected. Dan

rata-rata hasil dari kedua kelas tersebut adalah 96%. Data ini membuktikan bahwa

dalam pengenalan kelas Parasitized data yang berhasil di prediksi dengan benar

adalah sebanyak 2.644 data gambar, dan yang gagal adalah 82 data gambar.

Sedangkan pada kelas Uninfected data yang berhasil diprediksi dengan benar adalah

sebanyak 2.702 data gambar dan yang gagal adalah sebanyak 84 data gambar.
64

Dari hasil tingkat akurasi pada penelitian ini, dapat dibandingkan dengan

beberapa literatur sejenis yang penelitiannya akan dijabarkan satu persatu berikut ini:

1. Pada penelitian yang berjudul “Malaria Parasite Detection From

Peripheral Blood Smear Images Using Deep Belief Networks” pada

tahun 2017 yang ditulis oleh Dhanya Bibin, Madhu S. Nair dan P.

Punitha. Penelitian ini bertujuan untuk mendeteksi parasit malaria

dalam sel darah manusia menggunakan Deep Belief Network (DBN).

Pada penelitian ini model DBN bertujuan untuk mengklasifikasikan

4.100 gambar sel darah manusia ke dalam kelas parasit dan non-parasit.

Arsitektur DBN pada penelitian ini menggunakan 484 nodes visible

layer dan memiliki 2 kelas output layer dengan 4 lapisan hidden layer

yang mengandung 600 nodes pada setiap layernya. Penelitian ini

menghasilkan nilai akurasi sebesar 96,3% dalam dalam proses deteksi

sel darah yang mengandung parasit malaria dan yang tidak dan memiliki

selisih lebih besar 0,3% dalam akurasi dibandingkan penelitian ini.

2. Pada penelitian yang berjudul “Machine learning approach for

automated screening of malaria parasite using light microscopic

images” pada tahun 2013 yang ditulis oleh Dev Kumar Das,

Madhumala Ghosh, Malika Pal, Asok K. Maiti dan Chandan

Chakraborty. Tujuan dari penelitian ini adalah untuk membahas

pengembangan karakterisasi dan klasifikasi parasit malaria berbantuan

komputer dengan menggunakan pendekatan machine learning


65

berdasarkan gambar mikroskopis cahaya dari sel darah manusia.

Penelitian ini menggunaka metode pembelajaran Bayessian dan Support

Machine Learning (SVM) dalam pengklasifikasian parasit malaria.

Hasil penelitian ini menunjukkan bahwa metode Bayessian memiliki

hasil akurasi tertinggi yaitu 84% sementara SVM memiliki hasil akurasi

83,5% dengan selisih lebih rendah 12,5% dari hasil akurasi penelitian

ini.

3. Pada penelitian yang berjudul “Klasifikasi Jenis dan Fase Parasit

Malaria Plasmodium Falciparum dan Plasmodium Vivax Dalam Sel

Darah Merah Menggunakan Support Vector Machine. Penelitian ini

menggunaka metode pembelajaran Support Machine Learning (SVM)

dalam pengklasifikasian parasit malaria. Dalam pengklasifikasian kelas

parasit malaria, penelitian ini menghasilkan nilai akurasi 81,35%

dengan selisih 13,65% lebih rendah dari hasil akurasi penelitian ini.

4. Pada penelitian yang berjudul “Automated image processing method for

the diagnosis and classification of malaria on thin blood smears” pada

tahun 2006 yang ditulis oleh Nicholas E. Ross, Charles J. Pritchard,

David M. Robin dan Adriano G. Duse. Penelitian ini bertujuan untuk

menerapkan algoritma imge processing dalam pengidentifikasian parasit

malaria dalam sel darah manusia. Dalam pengklasifikasianya penelitian

ini menggunakan metode backpropogation feedforward neural network.

Penelitian ini mendapatkan hasil akurasi 73% dalam klasifikasi parasit


66

malaria dengan selisih 23% lebih rendah dibandingkan hasil akurasi

penelitian ini.

Perbandingan nilai akurasi diatas dapat dilihat pada Tabel 4.2.

Tabel 4.2 Perbandingan nilai Akurasi dengan literatur sejenis

No. Penelitian Akurasi


1. (Rais Amin, 2023) 96%
2. (Bibin et al., 2017) 96,3%
3. (Das et al., 2013) 84%
4. (Permata et al., 2012) 81,35%
5. (Ross et al., 2006) 73%

Hasil model prediksi yang tersimpan dalam prediction_model.h5 selanjutnya

akan digunakan dalam visualisasi hasil prediksi sistem terhadap gambar sel yang ada

pada data testing. Gambar 4.12 adalah source code untuk menampilkan hasil

visualisasi prediksi gambar sel.

app = Flask(__name__)
MODEL_PATH = 'model/malariaModel.h5'
model = load_model(MODEL_PATH)

def model_predict(img_path, model):


img = image.load_img(img_path, target_size=(64, 64))
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
images = np.vstack([x])
preds = model.predict(images, batch_size=16)
print(preds)
return preds

@app.route('/', methods=['GET'])
def home():
return render_template('home.html')

@app.route('/index', methods=['GET', 'POST'])


def index():
return render_template('index.html')

@app.route('/predict', methods=['GET', 'POST'])


def upload():
if request.method == 'POST':
f = request.files['file']
67

basepath = os.path.dirname(__file__)
file_path = os.path.join(
basepath, 'uploads', secure_filename(f.filename))
f.save(file_path)

preds = model_predict(file_path, model)


result = str(preds[0])
if preds > 0:
return "Uninfected"
else:
return "Infected"
return None

if __name__ == '__main__':
app.run(debug=True)
Gambar 4.12 Source code visualisasi klasifikasi parasit malaria

Pada proses menampilkan visualisasi hasil prediksi ini, data input berupa data

gambar dari folder testing yang berisikan 5.512 gambar yang tergolong kedalam 2

kelas dengan masing-masing kelas terdapat 2.786 gambar Uninfected dan 2.726

gambar Parasitized. Data input dibaca menggunakan modul OpenCV dan di resize

menjadi 64x64 piksel. Kemudian data diubah kedalam bentuk array guna

memudahkan proses prediksi kedalam bentuk matriks. Data yang telah diubah

tersebut akan diberi label “Parasitized” jika nilai prediksi = 1 dan label “Uninfected”

jika nilai prediksi = 0. Berikut adalah hasil dari visualisasi klasifikasi parasit malaria:

Gambar 4.13 Halaman utama visualisasi klasifikasi


68

Gambar 4.13 merupakan halaman utama sederhana untuk menampilkan upload


file gambar yang akan diklasifikasi. Berikut adalah contoh dari hasil klasifikasi dari
gambar yang telah di upload:

Gambar 4.14 Hasil klasifikasi dari upload gambar uninfected

Gambar 4.14 menunjukkan bahwa sistem dapat mengklasifikasi gambar yang


telah diupload dan memberikan hasil bahwa gambar tersebut termasuk klasifikasi
gambar kategori uninfected.
69

Gambar 4.15 Hasil klasifikasi dari upload gambar infected

Gambar 4.15 menunjukkan bahwa sistem dapat mengklasifikasi gambar yang


telah diupload dan memberikan hasil bahwa gambar tersebut termasuk klasifikasi
gambar kategori infected.
BAB V
PENUTUP

5.1 Kesimpulan
Berdasarkan pembahasan yang sudah diuraikan, maka dapat ditarik kesimpulan

sebagai berikut:

1. Metode Deep Learning yang diterapkan menggunakan arsitektur jaringan CNN-

LSTM pada penelitian ini menggunakan input shape berukuran 64x64x3, ukuran

filter 3x3, Jumlah Epoch sebanyak 50. Data yang digunakan untuk proses training

model sebanyak 19.842 pada folder training dan 2.204 data pada folder

validation. Menghasilkan tingkat akurasi training dan validation dalam

melakukan deteksi parasit malaria sebesar 96,25% untuk training accuracy dan

95,6% untuk validation accuracy. Dengan hasil tersebut dapat dibuktikan bahwa

pemodelan berhasil dan sistem dapat dengan sangat baik membedakan data

gambar yang Parasitized dan Uninfected.

2. Penelitian ini menggunakan data testing sebanyak 5.512 gambar dimana per

kategori terdapat 2.726 gambar pada kelas Parasitized dan 2.786 gambar pada

kelas Uninfected untuk diujikan kedalam model yang telah dibuat. Hasil testing

menghasilkan tingkat akurasi baru dalam melakukan pendeteksi parasit malaria

sebesar 96%. Dengan hasil tersebut dapat dibuktikan bahwa pemodelan berhasil

dan sistem menghasilkan tingkat akurasi yang sangat baik dalam pengkategorian

dan dapat dengan sangat baik membedakan dan memberikan label yang benar

70
71

pada data gambar yang Parasitized dan Uninfected, serta kombinasi fitur tata

letak CNN dan LSTM sangat meningkatkan klasifikasi.

5.2 Saran

Adapun saran yang diberikan pada penulisan ini sebagai berikut:

1. Penelitian selanjutnya diharapkan dapat meningkatkan nilai akurasi pada hasil

training model.

2. Diharapkan penelitian ini dapat dikembangkan dan diaplikasikan pada

pengembangan Medical Image Analysis yang lainnya.

3. Membandingkan model arsitektur jaringan Deep Learning lainnya untuk

mengetahui hasil maksimal dari sistem prediksi ini.

4. Penelitian ini dapat dikembangkan kedalam sebuah aplikasi berbasis web maupun

smartphone.
DAFTAR PUSTAKA

Aditi, Nagda, M. K., & Poovammal, E. (2019). Image classification using a hybrid
lstm-cnn deep neural network. International Journal of Engineering and
Advanced Technology, 8(6), 1342–1348.
https://doi.org/10.35940/ijeat.F8602.088619
Ahmad, A. (2017). Mengenal Artificial Intelligence, Machine Learning, Neural
Network, dan Deep Learning. June.
Akromunnisa, K., Hidayat, R., Informatika, J. T., & Adisucipto, J. L. (2019).
KLASIFIKASI DOKUMEN TUGAS AKHIR (SKRIPSI) MENGGUNAKAN K-
NEAREST NEIGHBOR. 4(1), 69–75.
Al-Waisy, A. S., Qahwaji, R., Ipson, S., & Al-Fahdawi, S. (2017). A multimodal
biometrie system for personal identification based on deep learning approaches.
Proceedings - 2017 7th International Conference on Emerging Security
Technologies, EST 2017, September, 163–168.
https://doi.org/10.1109/EST.2017.8090417
Alarcón-Soto, Y., Espasandín-Domínguez, J., Guler, I., Conde-Amboage, M., Gude-
Sampedro, F., Langohr, K., Cadarso-Suárez, C., & Gómez-Melis, G. (2019).
Data Science in Biomedicine. September. http://arxiv.org/abs/1909.04486
Bergstra, J., & Bengio, Y. (2012). Random search for hyper-parameter optimization.
Journal of Machine Learning Research, 13, 281–305.
Bibin, D., Nair, M. S., & Punitha, P. (2017). Malaria Parasite Detection from
Peripheral Blood Smear Images Using Deep Belief Networks. IEEE Access, 5,
9099–9108. https://doi.org/10.1109/ACCESS.2017.2705642
Botev, A., Lever, G., & Barber, D. (2017). Nesterov’s accelerated gradient and
momentum as approximations to regularised update descent. Proceedings of the
International Joint Conference on Neural Networks, 2017-May(2), 1899–1903.
https://doi.org/10.1109/IJCNN.2017.7966082
Byrne, C., Farnham, B., Tokyo, S., Boston, B., Sebastopol, F., & Beijing, T. (2017).
Development Workflows for Data Scientists. O’Reilly. http://oreilly.com/safari
Center for Disease Control and Prevention. (2018). CDC Parasites.
https://www.cdc.gov/parasites/malaria/index.html
Chollet, F. (2018). Deep Learning with Python. In 2018 21st International
Conference on Information Fusion, FUSION 2018.
https://doi.org/10.23919/ICIF.2018.8455530
Das, D. K., Ghosh, M., Pal, M., Maiti, A. K., & Chakraborty, C. (2013). Machine

72
73

learning approach for automated screening of malaria parasite using light


microscopic images. Micron, 45, 97–106.
https://doi.org/10.1016/j.micron.2012.11.002
Dineva, K., & Atanasova, T. (2018). Osemn Process for Working Over Data
Acquired By Iot. 7(13), 47–53.
Dinov, I. D. (2018). Data science and predictive analytics: Biomedical and health
applications using R. In Data Science and Predictive Analytics: Biomedical and
Health Applications using R. https://doi.org/10.1007/978-3-319-72347-1
Eka Putra, W. S. (2016). Klasifikasi Citra Menggunakan Convolutional Neural
Network (CNN) pada Caltech 101. Jurnal Teknik ITS, 5(1).
https://doi.org/10.12962/j23373539.v5i1.15696
Ezer, D., & Whitaker, K. (2019). Data science for the scientific life cycle. ELife, 8, 1–
10. https://doi.org/10.7554/eLife.43979
Hamza, A., Wang, S.-H., Alqahtani, A., Alsubai, S., Binbusayyis, A., Hussein, H. S.,
Markus Martinetz, T., & Alshazly, H. (2022). COVID-19 classification using
chest X-ray images: A framework of CNN-LSTM and improved max value
moth flame optimization. Frontiers in Public Health Frontiersin.Org.
Hendrian, S. (2018). Algoritma Klasifikasi Data Mining Untuk Memprediksi Siswa
Dalam Memperoleh Bantuan Dana Pendidikan. Faktor Exacta, 11(3), 266–274.
https://doi.org/10.30998/faktorexacta.v11i3.2777
Kartika, A., Irawan, B., & Triyanto, D. (2016). Prediksi Wilayah Rawan Kebakaran
Hutan dengan Metode Jaringan Syaraf Tiruan Propagasi Balik (Study Kasus :
Daerah Kabupaten Kuburaya). Coding Jurnal Komputer Dan Aplikasi Untan,
4(2), 66–75.
Kumari, K., Bhardwaj, M., & Sharma, S. (2020). OSEMN Approach for Real Time
Data Analysis. International Journal of Engineering and Management Research,
10(02), 107–110. https://doi.org/10.31033/ijemr.10.2.11
Lecun, Y., Bengio, Y., & Hinton, G. (2015). Deep learning. Nature, 521(7553), 436–
444. https://doi.org/10.1038/nature14539
lhncbc.nlm.nih.gov,. (n.d.). https://lhncbc.nlm.nih.gov/publication/pub9932
Lusiana Efrizoni, Rais Amin, & Ahmad Rizali. (2023). Detection Of Malaria
Parasites In Human Blood Cells Using Convolutional Neural Network. JAIA -
Journal of Artificial Intelligence and Applications, 2(2), 8–14.
https://doi.org/10.33372/jaia.v2i2.947
Millar, S. B., & Cox-Singh, J. (2015). Human infections with Plasmodium knowlesi-
zoonotic malaria. Clinical Microbiology and Infection, 21(7), 640–648.
https://doi.org/10.1016/j.cmi.2015.03.017
74

Nugroho, A., & Subanar, S. (2013). Klasifikasi Naïve Bayes untuk Prediksi
Kelahiran pada Data Ibu Hamil. Bimipa, 23(3), 297–308.
Nurhikmat, T. (2018). Implementasi Deep Learning Untuk Image Classification
Menggunakan Algoritma Convolutional Neural Network (CNN) Pada Citra
Wayang Golek. In Mathematics Education Journal (Vol. 1, Issue 1).
https://doi.org/10.29333/aje.2019.423a
Patterson, J., & Gibson, A. (2017). Deep learning A: PRACTITIONER’S
APPROACH. In O’Reilly (Vol. 29, Issue 7553).
Perez, L., & Wang, J. (2017). The Effectiveness of Data Augmentation in Image
Classification using Deep Learning. http://arxiv.org/abs/1712.04621
Permata, E., Purnama, I. K. E., & Purnomo, M. H. (2012). Klasifikasi Jenis Dan Fase
Parasit Malaria Plasmodium Falciparum Dan Plasmodium Vivax Dalam Sel
Darah Merah Menggunakan Support Vector Machine One Against One. Setrum,
1(2), 1–8.
Poostchi, M., Silamut, K., Maude, R. J., Jaeger, S., & Thoma, G. (2018). Image
analysis and machine learning for detecting malaria. Translational Research,
194(2018), 36–55. https://doi.org/10.1016/j.trsl.2017.12.004
PUSDATINKemenkesRI. (2016). InfoDatin-Malaria-2016.pdf.
Putri, R. K. S. C. (2018). Implementasi Deep Learning Menggunakan Metode
Convolutional Neural Network Untuk Klasifikasi Gambar. Mathematics
Education Journal, 1(1), 75. https://doi.org/10.29333/aje.2019.423a
Rajaraman, S., Antani, S. K., Poostchi, M., Silamut, K., Hossain, M. A., Maude, R.
J., Jaeger, S., & Thoma, G. R. (2018). Pre-trained convolutional neural networks
as feature extractors toward improved malaria parasite detection in thin blood
smear images. PeerJ, 2018(4), 1–17. https://doi.org/10.7717/peerj.4568
Ross, N. E., Pritchard, C. J., Rubin, D. M., & Dusé, A. G. (2006). Automated image
processing method for the diagnosis and classification of malaria on thin blood
smears. Medical and Biological Engineering and Computing, 44(5), 427–436.
https://doi.org/10.1007/s11517-006-0044-2
Saadah, S. (2018). Sistem Peredaran Darah Manusia. 8 Februari, 1–58.
https://idschool.net/smp/sistem-peredaran-darah-manusia/
Sang, D. V., Van Dat, N., & Thuan, D. P. (2017). Facial expression recognition using
deep convolutional neural networks. Proceedings - 2017 9th International
Conference on Knowledge and Systems Engineering, KSE 2017, 2017-
Janua(June), 130–135. https://doi.org/10.1109/KSE.2017.8119447
Schmidhuber, J. (2015). Deep Learning in neural networks: An overview. Neural
Networks, 61, 85–117. https://doi.org/10.1016/j.neunet.2014.09.003
75

Smith, L. N. (2017). Cyclical learning rates for training neural networks. Proceedings
- 2017 IEEE Winter Conference on Applications of Computer Vision, WACV
2017, April, 464–472. https://doi.org/10.1109/WACV.2017.58
Srivasta, N., Hinton, G., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R. (2014).
Dropout: A simple Way to Prevent Neural Networks from Overfitting. Physics
Letters B, 299(3–4), 345–350. https://doi.org/10.1016/0370-2693(93)90272-J
WHO. (2022). World malaria report 2022. In World Health Organization.
https://www.who.int/teams/global-malaria-programme/reports/world-malaria-
report-2021
Zufar, M., & Setiyono, B. (2016). Convolutional Neural Networks Untuk Pengenalan
Wajah Secara Real-time. Jurnal Sains Dan Seni ITS, 5(2), 128862.

Anda mungkin juga menyukai