Anda di halaman 1dari 59

DETEKSI PENYAKIT PADA BUAH APEL BERBASIS

PENGKLASIFIKASI RANDOM FOREST

TUGAS AKHIR
Diajukan Sebagai Salah Satu Syarat Untuk Memperoleh
Gelar Sarjana Komputer

Disusun Oleh:

KRISTIAN YUDISTIRA MONI


231 18 122

PROGRAM STUDI ILMU KOMPUTER

FAKULTAS TEKNIK

UNIVERSITAS KATOLIK WIDYA MANDIRA

KUPANG

2023
HALAMAN PERSETUJUAN

TUGAS AKHIR

DETEKSI PENYAKIT PADA BUAH APEL BERBASIS

PENGKLASIFIKASI RANDOM FOREST

Oleh:

KRISTIAN YUDISTIRA MONI

231 18 122

TELAH DIPERIKSA/DISETUJUI OLEH PENGUJI:

DI : KUPANG

PADA TANGGAL :

DOSEN PENGUJI I DOSEN PENGUJI II

Paskalis A. Nani, S.T., M.T Frengky Tedy, S.T., M.T

NIDN: 0831038602 NIDN: 0801118302

DOSEN PENGUJI III

D.r. Adri Gabriel Sooai, S.T., M.T

NIDN: 0723057201

KETUA PELAKSANA SEKRETARIS PELAKSANA

D.r. Adri Gabriel Sooai, S.T., M.T Emerensiana Ngaga, S.T., M.T
NIDN: 0723057201 NIDN: 0802038601

2
HALAMAN PENGESAHAN

TUGAS AKHIR

DETEKSI PENYAKIT PADA BUAH APEL BERBASIS

PENGKLASIFIKASI RANDOM FOREST

OLEH:

KRISTIAN YUDISTIRA MONI


231 18 122

TELAH DIPERTAHANKAN DEPAN PEMBIMBING

DOSEN PEMBIMBING I DOSEN PEMBIMBING II

Dr. Adri Gabriel Sooai, S.T., M.T Emerensiana Ngaga, S.T., M.T
NIDN: 0723057201 NIDN:0802038601

MENGETAHUI, MENGESAHKAN,
KETUA PROGRAM STUDI ILMU DEKAN FAKULTAS TEKNIK
KOMPUTER UNIKA WIDYA MANDIRA

Sisilia D. Bakka. Mau. S.Kom. M.T. Dr. Don G. N. Da Costa, S.T., M.T.
NIDN: 0807098502 NIDN: 0820036801

3
HALAMAN PERSEMBAHAN

Skripsi ini ku persembahkan khususnya kepada:

1. Tuhan Yesus dan Bunda Maria yang telah melindungi dan menuntun setiap

langkah perjuangan hidupku.

2. Keluarga tercinta, Bapak Rofinus Manis, Mama Waldetrudis Bai, Kaka

Yohanes Mior Rai, yang telah memberi semangat, nasehat serta motivasi demi

keberhasilanku dan mendoakan hingga saat ini.

3. Bapak Dr. Adri Gabriel Sooai, S.T., M.T dan ibu Emerensiana Ngaga, S.T.,

M.T selaku pembimbing saya. Terima kasih atas arahan dan kesabaranya

dalam membimbing saya sampai selesai menyelesaikan penelitian ini. Sehat

dan sukses selalu.

4. Almamaterku tercinta Universitas Katolik Widya Mandira Kupang dan

Program Studi Ilmu Komputer yang selalu saya banggakan.

4
MOTTO
“Percayalah sepenuhnya kepada Tuhan dan Jangan
berpegang pada diri sendiri“

(Amsal
3:5)

PERNYATAAN KEASLIAN HASIL KARYA

5
Yang bertanda tangan dibawah ini:

Nama : Kristian Yudistira Moni

Nim : 231 18 122

Fakultas : Teknik

Prodi : Ilmu Komputer

Dengan ini menyatakan bahwa Tugas Akhir dengan Judul “Deteksi

Penyakit Pada Buah Apel Berbasis Pengklasifikasi Random Forest”

adalah benar-benar karya saya sendiri. Apabila dikemudian hari ditemukan

bahwa saya melakukan tindakan plagiat, maka saya Akan menerima sanksi

yang telah ditetapkan.

Kupang, Januari 2023

Mahasiswa/Pemilik

Kristian Yudistira Moni

KATA PENGANTAR

6
Puji syukur penulis panjatkan kehadirat Tuhan Yang Maha Kuasa dan

Bunda Maria karena berkat bimbingan dan tuntunan tangan kasih-Nya penulis

dapat menyelesaikan penulisan skripsi yang berjudul “Deteksi Penyakit Pada

Buah Apel Berbasis Pengklasifikasi Random Forest” dengan baik. Penulis

menyadari bahwa tidak dapat menyelesaikan Tugas Akhir ini tanpa bantuan dan

motivasi dari berbagai pihak. Oleh karena itu, sepatutnya ucapan terima kasih

sedalam-dalamnya diucapkan kepada:

1. Pater Dr. Philipus Tule, SVD, selaku Rektor Universitas Katolik Widya

Mandira Kupang.

2. Dr. Don G. N. Da Costa, S.T., M.T., selaku Dekan Fakultas Teknik

Universitas Katolik Widya Mandira Kupang.

3. Ibu Sisilia D. Bakka. Mau. S.Kom. M.T., selaku Ketua Program Studi

Ilmu Komputer Universitas Katolik Widya Mandira Kupang.

4. Bapak Ign.Pricher A.N Samane, S.Si. M.Eng selaku dosen pembimbing

akademik. Terimakasih untuk motivasi dan dorongan serta kesabaran dan

waktu bagi saya dalam meyelesaikan tugas akhir dan perjalanan studi saya.

5. Dr. Adri Gabriel Sooai, S.T., M.T selaku Dosen Pembimbing I dan Ibu

Emerensiana Ngaga, S.T., M.T selaku pembimbing II. Terimakasih untuk

motivasi dan dorongan serta kesabaran dan waktu dalam membimbing

saya dalam meyelesaikan tugas akhir dan perjalanan studi saya.

6. Bapak Paskalis A. Nani, S.T., M.T selaku dosen penguji I dan Bapak

Frengky Tedy, S.T., M.T selaku dosen penguji II, yang telah meluangkan

7
waktu, tenaga dan pikiran dalam mengarahkan penulis untuk

menyelesaikan tugas akhir ini.

7. Seluruh Dosen dan staf karyawan pada Program Studi Ilmu Komputer

Universitas Katolik Widya Mandira Kupang.

8. Bapak Rofinus Manis dan Ibu Waldetrudis Bai, serta semua keluarga yang

selalu mendoakan, memberikan semangat dan dukungan.

9. Teman – Teman yang telah berjuang bersama di Jurusan Ilmu Komputer

UNWIRA angkatan 2018 khususnya INFO MABUK18.

10. Semua Pihak yang telah memberikan bantuan dalam penyelesaian Tugas

Akhir ini yang tidak dapat disebutkan namaya satu persatu, kiranya Tuhan

yang Maha Kuasa membalas budi baik saudara-saudari sekalian.

Penulis menyadari dalam penulisan Tugas Akhir ini, masih terdapat banyak

kekurangan Untuk itu penulis mengharapkan saran dan kritik dari berbagai pihak

yang bersifat membangun demi memperbaiki skripsi ini. Semoga Tugas Akhir ini

berguna bagi para pembaca

Kupang, Januari 2023

Penulis

DAFTAR ISI

JUDUL..............................................................................................................i

8
HALAMAN PERSETUJUAN.........................................................................ii

HALAMAN PENGESAHAN .........................................................................iii

HALAMAN PERSEMBAHAN.......................................................................iv

MOTTO............................................................................................................v

PERNYATAAN HASIL KARYA...................................................................vi

KATA PENGANTAR......................................................................................vii

DAFTAR ISI....................................................................................................ix

DAFTAR TABEL............................................................................................xii

DAFTAR GAMBAR........................................................................................xiii

ABSTRAK........................................................................................................xv

ABSTRACT.......................................................................................................xvi

BAB 1 PENDAHULUAN................................................................................1

1.1 Latar Belakang.....................................................................................1

1.2 Rumusan Masalah................................................................................2

1.3 Batasan Masalah..................................................................................2

1.4 Tujuan Penelitian.................................................................................3

1.5 Menfaat Penulisan...............................................................................3

1.6 Metedologi Penelitian..........................................................................3

1.7 Sistematika Penulisan..........................................................................4

BAB II TINJAUAN PUSTAKA......................................................................6

2.1 Tinjauan Penelitian Terdahulu.............................................................6

9
BAB III METODOLOGI PENELITIAN.........................................................13

3.1 Studi Literatur......................................................................................14

3.2 Pengumpulan Data...............................................................................14

3.3 Pemrosesan Awal................................................................................14

3.4 Klasifikasi Buah Apel Sehat dan Sakit................................................15

3.5 Images Embedding..............................................................................15

3.6 Test and Score.....................................................................................16

3.7 Perhitungan Performa..........................................................................16

3.8 Analisis Perangkat Keras dan Perangkat Lunak..................................18

BAB IV IMPLEMENTASI SISTEM...............................................................20

4.1 Dataset Buah Apel ..............................................................................20

4.2 Proses Import Images..........................................................................21

4.3 Prose Images embedding.....................................................................23

4.4 Pembangunan Model Klasifikasi Random Forest...............................24

4.5 Training dan Testing............................................................................24

4.6 Save Model..........................................................................................25

4.7 Load Model..........................................................................................26

4.8 Prediction.............................................................................................26

BAB V PENGUJIAN DAN ANALISIS HASIL..............................................27

5.1 Pengujian 5-fold cross validaion.........................................................27

10
5.2 Hasil Evaluasi Confussion Matrix.......................................................28

5.3 Pengujian Model.................................................................................35

5.4 Analisis Hasil.......................................................................................36

BAB VI PENUTUP..........................................................................................38

6.1 Kesimpulan..........................................................................................38

6.2 Saran....................................................................................................38

DAFTAR PUSTAKA

DAFTAR TABEL

Tabel 3.1 Confusion Matrix..............................................................................16

11
Tabel 4.1 Jumlah Dataset Setiap Kelas Penyakit Buah Apel...........................20

Tabel 5.1 Percobaan 5-fold cross validation....................................................27

DAFTAR GAMBAR

Gambar 3.1 Alur Metodologi Penelitian..........................................................13

12
Gambar 4.1 Citra Buah Apel Sehat..................................................................20

Gambar 4.2 Citra Buah Apel Sakit...................................................................21

Gambar 4.3 Tampilan Widget Import Images..................................................21

Gambar 4.4 Widget Images Viewer.................................................................22

Gambar 4.5 Kinerja Data Tabel Pada Images Viewer......................................22

Gambar 4.6 Tampilan Widget Images Embedding..........................................23

Gambar 4.7 Hasil Kinerja Embedder................................................................23

Gambar 4.8 Tampilan Widget model Random Forest......................................24

Gambar 4.9 Tampilan Widget Test dan score..................................................25

Gambar 4.10 Tampilan Widget Save Model....................................................25

Gambar 4.11 Tampilan Widget Load Model....................................................26

Gambar 4.12 Tampilan Widget Prediction.......................................................26

Gambar 5.1 Hasil Percobaan Pertama..............................................................28

Gambar 5.2 Hasil Percobaan Kedua.................................................................29

Gambar 5.3 Hasil Percobaan Ketiga.................................................................30

Gambar 5.4 Hasil Percobaan Keempat.............................................................30

Gambar 5.5 Hasil Percobaan Kelima................................................................31

Gambar 5.6 Hasil Percobaan keenam...............................................................32

Gambar 5.7 Hasil Percobaan Ketujuh..............................................................32

Gambar 5.8 Hasil Percobaan Kedelapan..........................................................33

Gambar 5.9 Hasil Percobaan Kesembilan........................................................34

13
Gambar 5.10 Hasil Percobaan Kesepuluh........................................................34

Gambar 5.11 Hasil Pengujian Model................................................................35

Abstraks
Buah Apel merupakan salah satu jenis buah yang ada di Indonesia dan
sangat digemari oleh masyarakat umum, baik muda sampai tua suka

14
mengkonsumsi buah ini. Hal ini menunjukan bahwa buah apel sudah sangat
banyak dikosnsumsi oleh masyarakat secara luas dan memiliki daya saing juga.
Namun produksi buah apel mulai menurun karena terserang hama dan penyakit.
Tingginya tingkat produksi dan distribusi buah apel yang sangat luas
mengharuskan para petani mampu mendeteksi penyakit yang ada pada buah apel
dalam menjaga mutu buah ini. Klasifikasi merupakan metode data mining yang
berfungsi untuk mengatur dan mengkategorikan data pada kelas yang berbeda-
beda. Penelitian ini bertujuan untuk mendeteksi penyakit pada buah apel berbasis
pengklasifikasi. Dalam proses pengklasifikasian penelitian ini menggunakan
algoritma Random Forest untuk mengklasifikasikan citra buah apel yang sehat
dan sakit. Penelitian ini menggunakan Orange Data Mining Tool sebagai alat
bantu untuk melakukan proses data mining. Hasil klasifikasi yang dilakukan
menggunakan algoritma Random Forest mendapatkan hasil yang baik dimana
model mendapatkan rata-rata akurasi sebesar 91.4%.

Kata kunci: Citra Buah Apel, Klasifikasi, Random Forest

Abstract

15
Apples are one of the types of fruit in Indonesia and are very popular with
the general public, both young and old, like to consume this fruit. However, the
production of apples began to decline due to pests and diseases. The high level of
production and the wide distribution of apples requires farmers to be able to
detect diseases that exist in apples in maintaining the quality of this fruit.
Classification is a data mining method that functions to organize and categorize
data in different classes. This study aims to detect diseases in apples based on
classifiers. In the classification process, this research uses the Random Forest
algorithm to classify images of healthy and sick apples. This study uses the
Orange Data Mining Tool as a tool to carry out the data mining process. the
classification results carried out using the Random Forest algorithm get good
results where the model get an average accuracy of 91.4%.

Keywords: Apple Image , Classification, Random Forest

BAB I

16
PENDAHULUAN

1.1 LATAR BELAKANG

Buah Apel pertama kali ditanam di Asia Tengah, kemudian berkembang

luas di wilayah yang lebih dingin. Apel yang dibudidayakan memiliki nama

Ilmiah Malus domestica yang menurut sejarahnya merupakan keturunan dari

Malus sieversii dengan sebagian genom dari Malus sylvestris (apel hutan/apel

liar) yang ditemui hidup secara liar di pegunungan Asia Tengah, di

Kazakhstan, Kirgiztan, Tajikistan, dan Xinjiang, Cina. Tanaman ini masuk ke

Indonesia sekitar tahun 1930-an dibawa oleh orang Belanda dari Australia

kemudian menanamnya di daerah Nongkojajar Kabupaten Pasuruan(Nooriza,

2016).

Buah Apel merupakan salah satu jenis buah yang ada di Indonesia dan

sangat digemari oleh masyarakat umum, baik muda sampai tua suka

mengkonsumsi buah ini. Buah apel banyak digemari masyarakat karena

rasanya yang bervariasi. Buah apel sendiri memiliki banyak nutrisi dan

berbagai macam vitamin diantaranya lemak baik serta karbohidrat, protein,

vitamin C, vitamin A, vitamin B1, Vitamin B2 dan masih banyak

lagi(Neighbors et al., 2019). Hal ini menunjukan bahwa buah apel sudah

sangat banyak dikosnsumsi oleh masyarakat secara luas dan memiliki daya

saing juga. Kota So’e yang terletak di Kabupaten Timur Tenggah Selatan

(TTS) provinsi Nusa Tenggara Timur (NTT) pada tahun 1950 hingga tahun

1970an dikenal sebagai salah satu kota penghasil buah Apel terbaik di NTT

17
yang mampu bersaing dengan apel dari wilayah lain di Indonesia . Namun

produksi buah apel asal kabupaten TTS ini mulai menurun karena terserang

hama dan penyakit. Tingginya tingkat produksi dan distribusi buah apel yang

sangat luas mengharuskan para petani mampu mendeteksi penyakit yang ada

pada buah apel dalam menjaga mutu buah ini. Mutu buah apel yang baik

sangat ditentukan oleh kematangan buah dan penampakanya, secara fisik

sebenarnya mudah dilihat karena tanda-tanda yang ada pada buah apel yang

segar dan rusak mudah diamati. Namun untuk mendapatkan hasil yang lebih

akurat perlu dilakukan penelitian yang lebih lanjut untuk meningkatkan

akurasi pengklasifikasi deteksi penyakit pada buah apel.

Oleh karena itu pada penelitian ini dengan pengklasifikasian citra penyakit

pada buah apel berbasis Random Forest diharapkan dapat membantu dan

mempermudah pekerjaan para petani dalam mendeteksi penyakit yang ada

pada buah apel secara akurat.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, maka rumusan masalah

dalam penelitian ini adalah seberapa besar keakuratan penerapan metode

Random Forest untuk pengklasifikasi deteksi penyakit pada buah apel?

1.3 Batasan Masalah

Untuk membatasi ruang lingkup pembahasan masalah, maka diberikan

batasan masalah sebagai berikut;

18
1. Pengklasifikasi ini menggunakan metode Random Forest

2. Aplikasi yang digunakan untuk menganalisis adalah Orange

3. Citra yang diambil menggunakan kamera smartphone 50 MP

4. Citra harus berekstensi jpg atau jpeg

5. Dataset yang digunakan berupa dataset citra buah apel sehat 160 dan

citra buah apel sakit 160.

1.4 Tujuan Penelitian

Tujuan penelitian ini adalah mendeteksi penyakit yang ada pada buah apel

dari citra menggunakan pengklasifikasi berbasis Random Forest.

1.5 Manfaat penelitian

Manfaat dari penelitian ini yaitu tersedianya sebuah model pendeteksian

penyakit pada buah apel berbasis pengklasifikasi Random Forest sehingga

mampu membantu pekerjaan para petani dalam mendeteksi penyakit yang ada

pada buah apel secara akurat.

1.6 Metodelogi Penelitian

1. Studi literatur

Pada tahap ini penulis, mepelajari dan membaca jurnal-jurnal dan referensi

lainnya yang berkaitan dengan permasalahan yang akan dibahas.

2. Pengumpulan Data

19
Pada tahap ini penulis mengumpulkan dataset berupa citra buah apel sehat

dan sakit menggunakan kamera digital yang akan digunakan dalam proses

klasifikasi.

3. Perancangan Widget Orange Data Mining

Pada tahap ini dilakukan perancangan widget-widget yang ada pada

aplikasi orange yang akan digunakan dalam proses pengklasifikasi

nantinya

4. Pengklasifikasian

Pada tahap ini dilakukan proses klasifikasi menggunakan algoritma

Random Forest berdasarkan perancangan widget-widget yang telah dibuat.

5. Pengujian dan Analisis

Pada tahap ini akan dilakukan pengujian terhadap pengklasifikasi yang

telah dikerjakan. Kemudian akan dilakukan analisis berdasarkan hasil

pengujian.

1.7 Sistematika Penulisan

Sistematika penulisan yang digunakan dalam menyusun tugas akhir ini adalah

sebagai berikut :

BAB I PENDAHULUAN

Terdiri dari dari latar belakang, rumusan masalah, batasan masalah, tujuan

penelitian, manfaat penelitian, meteodologi penelitian dan sistematika

penulisan.

BAB II TINJAUAN PUSTAKA

20
Bab ini membahas tentang penelitian terdahulu dan teori-teori dasar yang

berkaitan dengan penelitian.

BAB III METODOLOGI PENELITIAN

Bab ini berisi langkah-langkan dan kebutuhan penelitian dalam menyelesaikan

permasalahan pada penelitian ini.

BAB IV IMPLEMETASI SISTEM

Bab ini berisi tentang implementasi dari perancangan pengklasifikasi yang

dibuat sebelumnya, setiap tahapan Klasifikasi diberikan penjelasan lebih detail

pada bab ini.

BAB V PENGUJIAN DAN ANALISIS HASIL

Bab ini berisi tentang pengujian dan analisis hasil dari proses klasifikasi yang

dilakukan sesuai perancangan yang diterapkan.

BAB VI PENUTUP

Bab ini berisi kesimpulan dan saran perihal penelitian yang telah dilakukan

yang kiranya dapat diperhatikan dan dipertimbangkan untuk penelitian lebih

lanjut.

21
BAB II
TINJAUAN PUSTAKA

2.1 Tinjauan Penelitian Terdahulu

Beberapa penelitian telah dilakukan terkait dengan Deteksi Penyakit Pada

Buah Apel Berbasisi Pengklasifikasi Random Forest. Penelitian ini dilakukan

oleh Fani Nurona Cahya, Rangga Pebrianto, Tika Adila M pada tahun 2021

dengan judul “Klasifikasi Buah Segar dan Busuk Menggunakan Ekstraksi fitur

Hu-Moment Haralick dan Histogram” Dalam penelitian ini yaitu ekstraksi

fitur menggunakan Hu-moment, Haralick dan Histogram dan klasifikasi

menggunakan algoritma Random Forest. Penelitian ini mencoba

mengklasifikasi buah-buahan segar atau busuk, dengan algoritma yang

digunakan yaitu algoritma Random Forest. Penelitian ini mendapatkan akurasi

sebesar 99.6%(Cahya et al., 2021).

Penelitian ini dilakukan oleh Luthfiana Ratnawati dan Ratna

sulistyaningrum pada tahun 2019 dengan judul “Penerapan Random Forest

untuk Mengukur Tingkat Keparahan penyakit pada Daun Apel” penelitian ini

dilakukan dalam beberapa proses yaitu pra-pengolahan citra, ekstraksi fitur

ukuran, bentuk dan warna, segmentasi citra menggunakan K-means clustering

dan yang terakhir klasifikasi menggunakan metode Random Forest. Random

forest sendiri dalam penelitian ini merupakan metode klasifikasi yang

dilakukan dengan mengembangkan metode Decision Tree berdasarkan

pemilihan atribut acak pada setiap node untuk menentukan klasifikasi.

Random forest dibangun dengan menggunakan bagging serta pemilihan atribut

22
acak metode CART digunakan untuk membuat pohon keputusan. Pohon

keputusan nantinya tumbuh hingga ukuran maksimum dan tidak dipangkas.

Sehingga dihasilkanlah kumpulan pohon yang kemudian disebut hutan. Dari

hasil klasifikasai yang dilakukan menggunakan 467 citra daun apel ini

mendapatkan akurasi tertinggi pada proses pelatihan sebesar 100% dan ini

nilai akurasi tertinggi pada proses pengujian sebesar 75.3191%.(Luthfiana

Ratnawati & Dwi Ratna Sulistyaningrum, 2019).

Penelitian ini dilakukan oleh Kholiq Prajatama, Fajar Eko Nugroho, Andri

Faisal Sentosa, Syifa Fauziah dan Anggit Dwi Hartanto pada tahun 2019

dengan judul “Deteksi Kualitas Buah Apel Malang Manalagi Menggunakan

Algoritma Naive Bayes” Dengan adanya penelitian ini kiranya dapat

menambah pengetahuan tentang cara mengklasifikasi buah apel yang segar

dan kurang segar atau busuk. Dalam proses klasifikasi menggunakan

algoritma Naive Bayes ini citra buah apel dibagi menjadi dua kategori yaitu

kategori segar dan busuk. Lalu dilakukan ekstrasi fitur menggunakan

intensitas dan data yang digunakan 130 citra. Dengan hasil akurasi sebesar

63%(Prajatama et al., 2019).

Penelitian ini dilakukan oleh Sarifah Agustiani, Yoseph Tajul Arifin, Agus

Junaidi, Siti Khotimatul Wildah danAli Mustopa pada tahun 2022 dengan

judul “Klasifikasi Penyakit Pada Daun Padi Menggunakan Random Forest

dan Color Histogram” penelitian ini bertujuan untuk mengusulkan metode

dalam melakukan pengklasifikasian penyakit daun padi agar dapat

memberikan informasi kepada petani tentang penyakit daun padi. Pada

23
penelitian ini proses klasifikasi menggunakan citra hasil augmentasi lalu

menerapkan metode ekstraksi fitur Color Histogram, dan menggunakan

algoritma Random Forest. Selain itu, dalam penelitian ini juga dilakukan

beberapa perbandingan diantaranya perbandingan ekstraski fitur dan

perbandingan algoritma untuk mendapatkan hasil terbaik, dan hasil tertinggi

mencapai akurasi sebesar 99.65% dari metode yang diusulkan oleh(Agustiani

et al., 2022).

Penelitian mengenai citra digital telah dilakukan oleh Seno Hartono, Herry

Sujaini, dan Anggi Perwitasari pada tahun 2020 dengan judul “Komparasi

Algoritma Nonparametrik untuk Klasifikasi Citra Wajah Berdasarkan Suku di

Indonesia” penelitian ini menggunakan algoritma k-Nearest Neighbor (kNN),

Support Vector Machine (SVM), Decision Tree, dan AdaBoost dalam

mengklasifikasikan citra wajah penduduk Indonesia yang berasal dari suku

Batak, Jawa, Dayak, Melayu, dan Tionghoa. Dalam penelitian ini

menejelaskan citra merupakan sebuah gambar yang direpresentasikan secara

digital dalam bentuk fungsi 2 dimensi, f(x,y), yang terdiri dari x dan y sebagai

koordinat horizontal dan vertikal, dan f sebagai nilai intensitas atau derajat

keabuan dari x dan y, Setiap nilai dinyatakan dalam skala tertentu berdasarkan

citra yang ditampilkan. Citra merupakan fungsi dua dimensi yang

digambarkan oleh perangkat keras (komputer). Citra yang seharusnya

berwujud tiga dimensi kemudian digambarkan dalam bentuk dua dimensi

yang berupa titik diskrit data akibat ketidak mampuan komputer dalam

memproses gambar yang sebenarnya berwujud tiga dimensi. Titik yang

24
ditampilkan juga disebut dengan piksel. Tools data mining yang digunakan

untuk membantu dalam penelitian ini adalah Orange. Orange merupakan

sebuah tools opensource untuk pengolahan data mining. Orange memiliki

widget yang berfungsi sebagai unit pemrosesan untuk membaca, memproses,

melakukan visualisasi, melakukan analisis, menjelajahi data, dan lain-

lain.Data widget memungkinkan Orange untuk mengolah data teks atau

gambar. Orange mengubah data gambar menjadi representasi vektor

menggunakan deep neural network yang telah membahayakan banyak gambar

sehingga menghasilkan data yang dapat diproses dan memungkinkan machine

learning. Dari hasil klasifikasi menggunakan algoritma k-Nearest Neigbor,

Support Vector Machine, Decision Tree, dan AdaBoost, algoritma SVM

memberikan nilai akurasi paling bagus dibanding algoritma lainnya. Rata-rata

nilai presisi keempat algoritma tersebut berturut-turut adalah Support Vector

Machine 37.5%, diikuti oleh algoritma k- Nearest Neighbor 31.55%,

AdaBoost 30.25%, dan untuk Decision Tree 29.75% Tree 29.75% (Hartono et

al., 2020).

Penelitian mengenai Machine Learning telah dilakukan oleh Reza

Rabbani, Ida Wahidah, dan Iman Hedi Santoso pada tahun 2021 dengan judul

“Klasifikasi Data Deteksi Jatuh Menggunakan Machine Learning Dengan

Algoritma Adaboost” klasifikasi yang dilakukan terdiri dari 8 indikasi yaitu

berdiri normal, tidur normal, duduk normal, naik tangga, turun tangga, jatuh

kedepan, jatuh kesamping, dan jatuh kebelakang. Mikrokontroler berupa

Arduino serta sensor MPU-6050 sebagai accelerometer. Data yang didapat

25
diklasifikasikan menggunakan Orange Data Mining. Algoritma yang

digunakan dalam penelitian ini adalah Adaptive Boosting (AdaBoost). Dalam

penelitian ini Machine Learning merupakan metode perhitungan

menggunakan pengalaman untuk membuat prediksi yang akurat. Pengalaman

disini merujuk pada informasi yang biasanya dalam bentuk data elektronik

yang dikumpulkan untuk dianalisis. Machine Learning biasanya digunakan

untuk proses klasifikasi, regresi, peringkat, pengelompokan, dan

dimensionality reduction atau manifold learning. Klasifikasi merukapan

permasalahan penentuan kategori untuk suatu data. Misalnya klasifikasi

dokumen yang terdiri dari dokumen politik, bisnis, olahraga, dan lain-lain.

Hasil klasifikasi pada penelitian ini nantinya akan dibandingkan dengan 2

algoritma yaitu Random Forest dan Gradient Boosting. Hasil analisis

perbandingan menggunakan AdaBoost didapatkan akurasi terbaik sebesar

100% pada rasio 50%:50%. Hasil perbandingan 3 klasifikasi antara AdaBoost,

RF dan GB didapatkan hasil Adaboost sebagai model yang terbaik dengan

nilai akurasi tertinggi di 4 rasio yaitu 97.5% pada rasio 20%:80%, 98.7% pada

rasio 30%:70%, 99.3% pada rasio 40%:60% dan 100% pada rasio 50%:50%

(Rabbani et al., 2021).

Penelitian tentang Classification and Regression Trees (CART) telah

dilakukan oleh I Made Budi Adnyana pada tahun 2015 dengan judul “Prediksi

Lama Studi Mahasiswa Dengan Metode Random Forest” penelitian ini

menerapkan teknik data mining dalam melakukan prediksi dengan

menggunakan metode Random Forest. Random Forest merupakan kumpulan

26
dari beberapa tree, yang dimana masing-masing tree bergantung pada nilai

piksel pada tiap vektor yang daimbil secara acak. Random Forest adalah

pengembangan dari metode CART yang merupakan metode eksplorasi data

yang didasarkan pada teknik pohon keputusan. Pohon klasifikasi dihasilkan

saat respons berupa data kategorik, sedangkan pohon regresi dihasilkan saat

respons berupa data numerik. Pohon terbentuk dari pemilahan rekursif biner

pada suatu gugus data sehingga nilai peubah respons pada setiap gugus data

hasil pemilahan akan lebih. Data yang digunakan dalam penelitian ini adalah

data lulusan 2 tahun terakhir, meliputi IPK, SKS, jumlah cuti dan non-aktif,

nilai mahasiswa, dan lama studi mahasiswa. Keluaran dari sistem ini berupa

klasifikasi yang terdiri dari 2 kelas, yaitu lulus tepat waktu dan lulus lewat

batas waktu. Dari hasil eksperimen diperoleh nilai akurasi adalah 83.54%

(Adnyana, 2015).

Penelitian tentang klasifikasi menggunakan Random Forest juga dilakukan

oleh Sulthan Arief Ismail Sugiarto Putro, Dr. Ir. Jangkung Raharjo, M.T.,

Syamsul Rizal, S.T., M.Eng., Ph.D pada tahun 2021 dengan judul “Klasifikasi

Bobot Sapi Berdasarkan Citra Digital Dengna Metode Fraktal dan Random

Forest” Proses klasifikasi yang di lakukan yaitu dengan pembentukan tree,

algoritma random forest akan melakukan training terhadap sampel data.

Pengambilan sampel dilakukan dengan cara sampling with replacement.

sepertiga sampel nantinya digunakan untuk menentukan data out of bag, hal

ini untuk mengestimasi error dan menentukan variable importance. Variabel

yang akan digunakan untuk menentukan pemisahan terbaik ditentukan secara

27
acak. Saat tree telah terbentuk, maka klasifikasi akan berjalan. Untuk

memnentukan kelasnya dilakukan dengan cara voting dari masing-masing tree

yang ada, kelas dengan jumlah vote terbanyak akan menjadi pemenangnya.

Hasil dari sistem menggunakan metode fraktal dan random forest

menghasilkan akurasi estimasi bobot sapi sebesar 85,7% dengan waktu

komputasi rata - rata 0,336 detik. Penelitian ini menggunakan citra sapi yang

dibagi menjadi tiga kelas yang berbeda yaitu besar, sedang, dan kecil. Data

latih yang digunakan berupa 47 citra sapi dari tiga kelas dan data uji 21 citra

sapi dari tiga kelas. Hasil akurasi dari penelitian ini adalah 85.7% dengan nilai

toleransi sistem estimasi bobot adalah, 99,68 perhitungan Winter, 111,71

perhitungan Denmark, dan 108,16 untuk perhitungan Schoorl (Dan et al.,

2021).

Perbedaan penelitian ini dengan penelitian yang ada sebelumnya ialah,

data yang diambil dan digunakan dalam penelitian ini berbeda dengan

penelitian yang telah ada sebelumnya dan data diambil dengan pengambilan

sendiri. Penelitian tentang pendeteksian penyakit pada buah apel sudah pernah

dilakukan namun menggunakan metode yang berbeda. Maka dari itu pada

penelitian ini menggunakan metode Random Forest agar dapat membantu

dalam melakukan pendeteksian penyakit pada buah apel dan mendapatkan

hasil yang lebih akurat. Metode dan data yang berbeda tentunya akan

menghasilkan keakuratan dan hasil yang berbeda.

28
BAB III
METODOLOGI PENELITIAN

Metodologi penelitian adalah suatu kegiatan untuk merencanakan penelitian

yang akan dilakukan dengan cara sistematis dan ilmiah. Penelitian ini

menggunakan metode penelitian komparatif. Metode analisis yang akan dipakai

adalah metode data mining yaitu klasifikasi dengan menggunakan tools software

Orange. Penelitian ini dilakukan dengan beberapa tahapan yang diilustrasikan

pada Gambar 3.1

Gambar 3. 1 Alur Metodologi Penelitian

29
3.1 Studi Literatur

Langkah pertama yang dilakukan adalah studi literatur yaitu mencari

referensi dan pengetahuan dari berbagai sumber seperti buku, jurnal dan

artikel yang berhubungan dengan penelitian yang akan dilakukan. Tujuan

utama studi literatur dalam penelitian ini adalah untuk mempelajari sumber-

sumber terdahulu sebagai bahan panduan untuk mendukung penelitian ini.

Studi Literatur dimulai dengan mempelajari penelitian sebelumnya yang

terkait tentang data mining, pengklasifikasian, Algoritma Random Forest ,

Kemudian mempelajari cara evaluasi data menggunakan k-fold Cross

Validation dan confusion matrix.

3.2 Pengumpulan Data

Data yang digunakan dalam penelitian ini adalah data primer yang diambil

menggunakan kamera android 50 MP yang digunakan untuk memfoto buah

apel sehat dan sakit dengan jumlah data gambar sebanyak 320 gambar buah

apel yang sehat dan sakit.

3.3 Pemrosesan Awal

Data yang diperlukan dalam penelitian ini adalah data primer, dimana jika

diperlukan seperti membuang background atau latar belakang citra yang tidak

diperlukan.

30
3.4 Klasifikasi Buah Apel Sehat dan Sakit

Pada tahap ini setelah mendapatkan dataset gambar dengan jumlah 320

gambar buah apel sehat dan sakit, kemudian mengelompokan dataset buah

apel menjadi 2 kelas dengan membuat 2 folder yaitu apel sehat dan apel sakit.

Setelah membuat 2 folder seterusnya mengelompokan dengan memindahkan

gambar buah yang sehat ke folder apel sehat dan buah apel sakit ke folder apel

sakit. Setelah mengelompokan semua dataset gambar buah apel yang sehat

dan sakit, selanjutnya menggunakan widget import images untuk mengupload

dataset yang sudah dikelompokan tadi ke dalam aplikasi orange.

3.5 Image Embedding

Widget Image Emmbedding melakukan image embedding melalui deep

neural network dan nantinya akan menerjemahkan citra menjadi angka ,

untuk embedernya digunakan SqueezeNet sebagai emmbeder. SqueezeNet

adalah model mendalam untuk pengenalan gambar yang mencapai akurasi

tingkat Alexnet di ImageNet dengan parameter 50x lebih sedikit. SqueezeNet

merupakan salah satu embedder yang cepat dan tidak memerlukan koneksi

internet. Proses ini menerjemahkan citra yang akan digunakan dalam

mendeteksi penyakit yang ada pada buah apel berbasis pengklasifikasi

Random Forest. Image Embedding nantinya akan merubah citra menjadi

angka, dimana dalam penelitian ini komputer berhasil mengenerate dataset

buah apel yang sakit dan sehat sebanyak 1000 kolom dan 320 baris.

31
3.6 Test and Score

Widget test and score akan menguji model klasifikasi Random Forest yang

terpilih, pengujian widget test and score menggunakan cross validation. Cross

validation berfungi untuk membandingkan data secara acak sesuai dengan

angka yang ada di dalam number of fold yakni 2, 3, 5, 10 dan 20. Ada dua

hal yang dilakukan widget test and score. pertama akan menampilkan tabel

dengan ukuran kinerja klasifikasi yang berbeda, seperti hasil perhitungan

accuracy, precision, recall, f1-score, dan AUC. Dan kedua menampilkan hasil

output yang digunakan oleh widget lain untuk menganalisis kinerja confusion

matrix.

3.7 Perhitungan Performa

Pada tahap ini penulis menghitung performa dari algoritma Random

Forest menggunkan widget test and score dan menggunkan widget

confusion matrix untuk menampilkan hasil presentasi dari tiap-tiap kelas.

Performa yang dihitung adalah accuracy, precision, recall,dan f1-score.

Persamaan (3.1), (3.2), (3.3), (3.4) menunujukan rumus perhitungan

performa tersebut. TP adalah True Positive, TN adalah True Negative, FP

adalah False Positive, dan FN adalah False Negative.

Tabel 3. 1 Confusion Matrix

Class Predictive Predictive


Positive Negatif
Actual Positive TP FN

Actual Negative FP TN

32
1. Akurasi

Akurasi dapat diilustrasikan seberapa akurat model untuk

mengklasifikasikan dengan benar. Dengan demikian, akurasi prediksi

adalah perbandingan jumlah data positif benar dan negatif benar dengan

data keseluruhan. Dengan kata lain, akurasi merupakan tingkat kedekatan

nilai dari prediksi dengan nilai yang sebenarnya. Nilai dari akurasi dapat

dilihat pada persamaan (2.1)

TP+TN
Accuracy= (2.1)
TP+TN + FN + FP

2. Presisi

Presisi dapat digambarkan sebagai tingkat akurasi data yang diminta

dengan hasil prediksi yang diberikan oleh model. Maka dapat diartikan

bahwa presisi itu merupakan perbandingan dari prediksi benar positif

dibagi dengan keseluruhan hasil yang diprediksi positif. Dengan kata lain

dari semua kelas positif yang telah diprediksi dengan benar, berapa

banyak data yang benar-benar positif. Nilai dari presisi dapat dilihat pada

persamaan(2.2)

TP
Precision= (2.2)
TP+ FP

3. Recall

Recall atau sensitifitas dapat digambarkan sebagai keberhasilan model

dalam mendapatkan sebuah informasi. Maka dapat dikatakan bahwa

recall itu adalah rasio prediksi benar positif dibagi dengan keseluruhan

33
data yang benar positif. Nilai dari recall dapat dilihat pada

persamaan(2.3)

TP
Recall= (2.3)
TP+ FN

4. Skor F1

Skore F1 dapat dikatakan sebagai perbandingan rata-rata presisi dan

recall yang dibobotkan. Skor F1 dapat dikatakan terbaik jika ada

ssemacam keseimbangan antara presisi dan recall dalam sistem. Nilai dari

skor F1 dapat dilihat pada persamaan(2.4)

precision .recall
F 1−Score= (2.4)
precision+recall

3.8 Analisis Perangkat Keras dan Perangkat lunak

Adapun perangkat keras dan perangkat lunak yang dibutuhkan dalam

pembuatan sistem identifikasi.

A. Perangkat Keras

Perangkat keras yang digunakan pada sistem ini:

a. PC / Laptop

b. Procecor : Intel(R) Core(TM) i3-7020U CPU @ 2.30GHz

(4CPUs), ~2.3GHz

c. RAM : 4.00 GB

34
d. Kamera smartphone 50 MP.

B. Perankat Lunak

Perangkat lunak yang digunakan dalam membangun sistem ini:

a. Sistem Operasi Windows 10

b. Orange Data Mining

35
BAB IV

IMPLEMENTASI SISTEM

4.1 Dataset Buah Apel

Setelah mendapatkan dataset citra buah apel dengan jumlah 320 gambar

buah apel sehat dan sakit, kemudian di kelompokan menjadi 2 kelas dengan

membuat 2 folder yaitu apel sehat dan apel sakit. Berikut tabel jumlah data

dari setiap kelas.

Tabel 4.1 Jumlah dataset masing-masing kelas buah apel

Kelas Jumlah

Jumlah Sakit 160

Jumlah Sehat 160

Berikut contoh dataset citra buah apel sehat dan sakit berdasarkan

kelasnya masing-masing dapat dilihat pada Gambar 4.1 dan 4.2

Gambar 4. 1 Citra Buah Apel Sehat

36
Gambar 4. 2 Citra Buah Apel Sakit

4.2 Proses Import Images

Setelah Mendapatkan dataset dan mengelompokannya ke dalam kelas

masing-masing. Tahap selanjutnya mengimport dataset buah apel yang sehat

dan sakit ke dalam apklikasi Orange dengan menggunkan widget import

images. Tampilan widget import images pada aplikasi Orange dapat dilihat

pada Gambar 4.3

Gambar 4. 3 Tampilan Widget Import Images

37
Pada gambar diatas dapat dilihat bahwa dataset buah apel sehat dan sakit

yang berjumlah 320 gambar dengan 2 kelas berhasil di import. Untuk

menampilkan dan memastikan bahwa dataset terdebut telah berhasil

dimasukan ke dalam aplikasi orange maka dibutuhkan widget images viewer.

Tampilan widget images viewer dapat dilihat pada Gambar 4.4

Gambar 4. 4 Widget Image Viewer

Setelah menampilkan dataset gambar, dapat pula ditampilkan data atribut

seperti ukuran, lebar, dan tinggi gambar dengan menggunkan widget data

table. Tampilan dari widget data table dapat dilihat pada Gambar 4.5

38
Gambar 4. 5 Kinerja Data Tabel Pada Image Viewer
4.3 Proses Images

Embedding

Setelah menginput gambar menggunkan widget import images, tahap

selanjutnya adalah melakukan embedder dengan SqueezeNet menggunakan

Images Embedding. Tampilan widget images embedding dapat dilihat pada

Gambar 4.6

Gambar 4. 6 Tampilan Widget Images Embedding

39
Setelah menggunakan SqueezeNet sebagai embedder, tahap selanjutnya

menggunakan widget data table untuk menampilkan hasil kinerja embedder.

Tampilan hasil dari kinerja embedder dapat dilihat pada Gambar 4.7

40
Gambar 4. 7 Hasil Kinerja Embedder

Pada gambar diatas, proses images embedding berhasil membaca dataset

citra buah apel sehat dan buah apel sakit, dan berhasil mengeluarkan serta

meningkatkan data tabel dengan tambahan kolom sebanyak 1000 kolom.

4.4 Pembangunan Klasifikasi Random Forest

Pada tahap pembangunan klasifikasi, percobaan klasifikasi menggunkan

Random Forest digunakan number of trees=10 dan growth control

menggunakan pengaturan tidak mensplit subsets yang kurang dari 5. Tampilan

dari model klasifikasi Random Forest dapat dilihat pada Gambar 4.8

41
Gambar 4. 8 Tampilan Widget Model Random Forest

4.5 Training dan Testing

Pada proses training dan testing menggunakan widget test and score untuk

membangun model klasifkasi yang telah dibuat sebelumnya dengan mencoba

5-fold cross validation yang ada pada widget test and score dan juga data

training sebesar 66% dan data testing sebesar 34%. Tampilan widget test and

score dapat dilihat pada Gambar 4.9

Gambar 4. 9 Tampilan Widget Test and Score

42
4.6 Save Model

Widget save model akan menyimpan model random forest yang dipakai

sebelumnya ke file keluaran, lalu beri nama modelnya untuk nanti memuat ke

dalam alur kerja dengan Load Model. Tampilan Save Model dapat dilihat pada

gambar 4.10

Gambar 4. 10 Tampilan Widget Save Model


4.7 Load Model

Saat ingin menggunkan model Random Forest yang telah disimpan

sebelumnya, buka widget Load Model dan pilih file model tersebut sesuai

dengan nama yang disimpan. Widget ini memuat model yang ada ke widget

Prediction. Tampilan Load Model dapat dilihat pada gambar 4.11

Gambar 4. 11 Tampilan Widget Load Model

43
4.8 Prediction

Widget Prediction ini menampilkan hasil prediksi model pada data yang

uji. Outputnya biasa data dengan prediksi tambahan ataupun hasil pengujian

algoritma klasifikasi. Tampilan prediction dapat dilihat pada gambar

Gambar 4. 12 Tampilan Widget Prediction


BAB V

PENGUJIAN DAN ANALISIS HASIL

5.1 Pengujian 5-fold cross validation

Dalam penelitian ini pengujian dilakukan sebagai tahap perhitungan

tingkat keakuratan algoritma yang diuji. Adapun pengujian dalam penelitian

ini adalah dengan melakukan perhitungan precision, recall, dan accuracy.

Metode uji coba yang diterapkan dalam penelitian ini adalah 5-fold cross

validation dengan melakukan percobaan sebanyak 10 kali percobaan.

Tabel 5.1 Percobaan 5-fold cross validation

44
Jumlah Percobaan AUC CA F1 Precision Recall
1 0.970 0.912 0.912 0.913 0.912
2 0.974 0.916 0.916 0.916 0.916
3 0.979 0.925 0.925 0.927 0.925
4 0.977 0.922 0.922 0.923 0.922
5 0.970 0.919 0.919 0.920 0.919
6 0.969 0.909 0.909 0.913 0.909
7 0.971 0.906 0.906 0.908 0.906
8 0.977 0.900 0.900 0.901 0.900
9 0.981 0.931 0.931 0.934 0.931
10 0.969 0.903 0.903 0.904 0.903

Rata-rata Akurasi 91.4%

Dari Tabel 5.1 diperoleh hasil perhitungan Precision, recall, accuracy dari

10 kali percobaan menggunakan 5-fold cross validation dengan model

Random Forest. Terlihat bahwa dalam percobaan ini mendapatkan hasil yang

baik dengan rata-rata akurasi sebesar 91.4%.

5.2 Hasil Evaluasi Confusion Matrix

Confusion Matrix merupakan pengukuran performa buat permasalahan

klasifikasi machine learning dimana keluaran bisa berbentuk 2 kelas ataupun

lebih. Confusion Matrix merupakan tabel dengan 4 campuran berbeda dari

nilai prediksi serta nilai aktual. Dengan menggunkan confussion matrix kita

dapat mengamati performa algoritma pada model klasifikasi yang dibuat

45
berdasarkan jumlah data yang diprediksi dengan benar dan salah. Berikut

gambar hasil evaluasi dari 10 kali percobaan dengan model Random Forest

menggunakan 5 fold cross validation.

Gambar 5. 1 Hasil Percobaan Pertama


Berdasarkan gambar 5.1 dijelaskan bahwa dari total 160 data buah apel

yang sehat hanya terdeteksi 144 buah apel yang sehat sedangkan 16

diantaranya salah dideteksi menjadi apel yang sakit, kemudian dari 160 data

buah apel yang sakit hanya 148 yang terdeteksi sebagai apel yang sakit

sedangkan 12 dianggap sebagai apel yang sehat. Maka nilai dari True Positive

(TP) adalah 148, True Negative (TN) adalah 144, False Positive (FP) adalah

16, dan False Negative (FN) adalah 12. Maka nilai akurasi dari percobaan

pertama adalah sebagai berikut:

148+144
Accuracy= x 100 % maka nilai Accuracy=91.2%
148+144+12+16

46
Gambar 5. 2 Hasil Percobaan Kedua
Berdasarkan gambar 5.2 dijelaskan bahwa dari total 160 data buah apel

yang sehat hanya terdeteksi 143 buah apel yang sehat sedangkan 17

diantaranya salah dideteksi menjadi apel yang sakit, kemudian dari 160 data

buah apel yang sakit hanya 150 yang terdeteksi sebagai apel yang sakit

sedangkan 10 dianggap sebagai apel yang sehat. Maka nilai dari True Positive

(TP) adalah 150, True Negative (TN) adalah 143, False Positive (FP) adalah

17, dan False Negative (FN) adalah 10. Maka nilai akurasi dari percobaan

kedua adalah sebagai berikut:

150+143
Accuracy= x 100 % maka nilai Accuracy=91.6 %
150+143+10+17

Gambar 5. 3 Hasil Percobaan Ketiga


Berdasarkan gambar 5.3 dijelaskan bahwa dari total 160 data buah apel

yang sehat hanya terdeteksi 142 buah apel yang sehat sedangkan 18

diantaranya salah dideteksi menjadi apel yang sakit, kemudian dari 160 data

buah apel yang sakit hanya 154 yang terdeteksi sebagai apel yang sakit

sedangkan 6 dianggap sebagai apel yang sehat. Maka nilai dari True Positive

(TP) adalah 154, True Negative (TN) adalah 142, False Positive (FP) adalah

47
18, dan False Negative (FN) adalah 6. Maka nilai akurasi dari percobaan

ketiga adalah sebagai berikut:

154+142
Accuracy= x 100 % makanilai Accuracy=92.5 %
154+142+6+18

Gambar 5. 4 Hasil Percobaan Keempat


Berdasarkan gambar 5.4 dijelaskan bahwa dari total 160 data buah apel

yang sehat hanya terdeteksi 144 buah apel yang sehat sedangkan 16

diantaranya salah dideteksi menjadi apel yang sakit, kemudian dari 160 data

buah apel yang sakit hanya 151 yang terdeteksi sebagai apel yang sakit

sedangkan 9 dianggap sebagai apel yang sehat. Maka nilai dari True Positive

(TP) adalah 151, True Negative (TN) adalah 144, False Positive (FP) adalah

16, dan False Negative (FN) adalah 9. Maka nilai akurasi dari percobaan

keempat adalah sebagai berikut:

151+144
Accuracy= x 100 % makanilai Accuracy=92.2 %
151+ 144+9+16

48
Gambar 5. 5 Hasil Percobaan Kelima
Berdasarkan gambar 5.5 dijelaskan bahwa dari total 160 data buah apel

yang sehat hanya terdeteksi 142 buah apel yang sehat sedangkan 18

diantaranya salah dideteksi menjadi apel yang sakit, kemudian dari 160 data

buah apel yang sakit hanya 152 yang terdeteksi sebagai apel yang sakit

sedangkan 8 dianggap sebagai apel yang sehat. Maka nilai dari True Positive

(TP) adalah 152, True Negative (TN) adalah 142, False Positive (FP) adalah

18, dan False Negative (FN) adalah 8. Maka nilai akurasi dari percobaan

kelima adalah sebagai berikut:

152+142
Accuracy= x 100 % makanilai Accuracy =91.9 %
152+ 142+ 8+18

Gambar 5. 6 Hasil Percobaan Keenam


Berdasarkan gambar 5.6 dijelaskan bahwa dari total 160 data buah apel

yang sehat hanya terdeteksi 138 buah apel yang sehat sedangkan 22

diantaranya salah dideteksi menjadi apel yang sakit, kemudian dari 160 data

49
buah apel yang sakit hanya 153 yang terdeteksi sebagai apel yang sakit

sedangkan 7 dianggap sebagai apel yang sehat. Maka nilai dari True Positive

(TP) adalah 153, True Negative (TN) adalah 138, False Positive (FP) adalah

22, dan False Negative (FN) adalah 7. Maka nilai akurasi dari percobaan

keenam adalah sebagai berikut:

153+138
Accuracy= x 100 % maka nilai Accuracy=90.9 %
153+138+7+22

Gambar 5. 7 Hasil Percobaan Ketujuh


Berdasarkan gambar 5.7 dijelaskan bahwa dari total 160 data buah apel

yang sehat hanya terdeteksi 140 buah apel yang sehat sedangkan 20

diantaranya salah dideteksi menjadi apel yang sakit, kemudian dari 160 data

buah apel yang sakit hanya 150 yang terdeteksi sebagai apel yang sakit

sedangkan 10 dianggap sebagai apel yang sehat. Maka nilai dari True Positive

(TP) adalah 150, True Negative (TN) adalah 140, False Positive (FP) adalah

20, dan False Negative (FN) adalah 10. Maka nilai akurasi dari percobaan

ketujuh adalah sebagai berikut:

150+140
Accuracy= x 100 % maka nilai Accuracy=90.6 %
150+140+10+20

50
Gambar 5. 8 Hasil Percobaan Kedelapan
Berdasarkan gambar 5.8 dijelaskan bahwa dari total 160 data buah apel

yang sehat hanya terdeteksi 141 buah apel yang sehat sedangkan 19

diantaranya salah dideteksi menjadi apel yang sakit, kemudian dari 160 data

buah apel yang sakit hanya 147 yang terdeteksi sebagai apel yang sakit

sedangkan 13 dianggap sebagai apel yang sehat. Maka nilai dari True Positive

(TP) adalah 147, True Negative (TN) adalah 141, False Positive (FP) adalah

19, dan False Negative (FN) adalah 13. Maka nilai akurasi dari percobaan

kedelapan adalah sebagai berikut:

147+141
Accuracy= x 100 % maka nilai Accuracy =90.0 %
147+141+13+19

Gambar 5. 9 Hasil Percobaan Kesembilan


Berdasarkan gambar 5.9 dijelaskan bahwa dari total 160 data buah apel

yang sehat hanya terdeteksi 141 buah apel yang sehat sedangkan 19

diantaranya salah dideteksi menjadi apel yang sakit, kemudian dari 160 data

51
buah apel yang sakit hanya 148 yang terdeteksi sebagai apel yang sakit

sedangkan 12 dianggap sebagai apel yang sehat. Maka nilai dari True Positive

(TP) adalah 148, True Negative (TN) adalah 141, False Positive (FP) adalah

19, dan False Negative (FN) adalah 12. Maka nilai akurasi dari percobaan

kesembilan adalah sebagai berikut:

148+141
Accuracy= x 100 % makanilai Accuracy=90.3 %
148+141+ 12+ 19

Gambar 5. 10 Hasil Percobaan Kesepuluh

Berdasarkan gambar 5.10 dijelaskan bahwa dari total 160 data buah apel

yang sehat hanya terdeteksi 143 buah apel yang sehat sedangkan 17

diantaranya salah dideteksi menjadi apel yang sakit, kemudian dari 160 data

buah apel yang sakit hanya 155 yang terdeteksi sebagai apel yang sakit

sedangkan 5 dianggap sebagai apel yang sehat. Maka nilai dari True Positive

(TP) adalah 155, True Negative (TN) adalah 143, False Positive (FP) adalah

17, dan False Negative (FN) adalah 5. Maka nilai akurasi dari percobaan

kesepuluh adalah sebagai berikut:

155+143
Accuracy= x 100 % maka nilai Accuracy=93.1 %
155+143+5+17

52
5.3 Pengujian Model

Pengujian Model Random Forest dilakukan agar dapat melihat kinerja

model dalam mendeteksi citra buah apel yang sehat dan sakit. pengujian ini

menggunakan 5 citra buah apel yang diberi label nama ujino1 dan ujino4

sebagai apel sakit serta ujino2, ujino3, dan ujino5 sebagai apel sehat. 5 citra

ini diambil dengan cara berbeda-beda dimana citra ujino1 dan ujino2 dari data

sekumder yang diambil dari internet, lalu ujino4 dan ujino5 dari data primer

yang diambil sendiri dan ujino3 gambar apel yang dibuat sendiri

menggunakan tools paint. Hasil pengujian model dapat dilihat pada gambar

5.11

Berdasarkan hasil pengujian model diatas citra ujino1 dan ujino3 salah
Gambar 5. 11 Hasil Pengujian Model
dideteksi sedangkan

citra ujino2, ujino4, dan ujino5 benar dideteksi.

5.4 Analisis Hasil

Berdasarkan hasil pengujian dan evaluasi confusion matrix dari model

Random Forest menggunakan metode 5-fold cross validation dengan

melakukan percobaan sebanyak 10 kali percobaan mendapatkan hasil yang

berbeda-beda. Hasil yang berbeda-beda ini di karenakan dataset yang kecil,

53
sedikit dan jarang dipakai sehingga hasil tidak terlalu maksimal. Dimana pada

percobaan pertama mendapatkan akurasi sebesar 91.2%, percobaan kedua

mendapatkan 91.6%, ketiga mendapatkan 92.5%, keempat mendapatkan

92.2%, kelima mendapatkan 91.9%, keenam mendapatkan 90.9%, ketujuh

mendapatkan 90.6%, kedelapan mendapatkan 90%, kesembilan mendapatkan

90.3%, dan percobaan kesepuluh mendapatkan 93.1%. Terlihat dari percobaan

yang dilakukan ini mendapatkan hasil yang baik dengan rata-rata akurasi

sebesar 91.4%. Dilakukan juga percobaan lebih dari 10 kali percobaan dan

hasil yang akurasi didapatkan tetap sama dimana range akurasi berkisar dari

89.1% hingga 93.1%.

Berdasarkan hasil pengujian model Random Forest menggunkan 5 citra

buah apel model hanya berhasil mendeteksi citra ujino2, ujino4, dan ujino5

sedangkan citra ujino1 dan ujino3 salah dideteksi hal ini dikarenakan

kurangnya variansi dalam training set sehinnga saat diberikan citra yang yang

bebeda dan belum pernah ditraining oleh model, maka hasil deteksinya akan

kurang maksimal. Hal ini juga bisa terjadi karena datanya overfitting yaitu saat

model terlalu sering mendeteksi citra buah apel yang sehat, lalu saat diberikan

citra buah apel sakit untuk dideteksi model akan salah mendeteksi menjadi

citra buah apel sehat.

54
BAB VI
PENUTUP

6.1 Kesimpulan

Kesimpulan yang dapat diambil dalam penelitian ini adalah proses

pengklasifikasi berbasis Random Forest dengan 10 kali percobaan

menggunakan 5-fold cross validation mampu mengklasifikasi citra dengan

akurasi yang baik. Rata-rata akurasi yang didapatkan dari proses testing

55
menggunakan 160 citra buah apel sehat dan 160 citra buah apel sakit ini

mendapatkan akurasi sebesar 91.4%.

6.2 Saran

Berdasarkan hasil analisa dan kesimpulan pada penelitian ini, berikut

merupakan saran untuk mengembangkan penelitian ini:

1. Penelitian lebih lanjut diharapkan mampu mengembangkan dengan

metode yang berbeda dan dapat menghasilkan tingkat

pengklasifikasian yang lebih baik sebagai bahan perbandingan hasil

yang tepat dan juga menggunakan aplikasi yang berbeda selain

menggunakan Orange.

2. Penelitian selanjutnya diharapkan menerapkan metode ekstrasi fitur

dan klasifikasi lainnya untuk mendapatkan kombinasi lebih baik

dengan mendekati 100%, meskipun penelitian ini mendapatkan

akurasi yang sudah termasuk tinggi yakni 91.4%.

DAFTAR PUSTAKA

Adnyana, I. M. B. (2015). PREDIKSI LAMA STUDI MAHASISWA DENGAN

METODE RANDOM FOREST ( STUDI KASUS : STIKOM BALI ).

CSRID Journal, 8(3), 201–208.

Agustiani, S., Tajul Arifin, Y., Junaidi, A., Khotimatul Wildah, S., & Mustopa, A.

(2022). Klasifikasi Penyakit Daun Padi menggunakan Random Forest dan

Color Histogram 1,*). Jurnal Komputasi, 10(1), 2022.

56
https://www.kaggle.com/vbookshelf/rice-leaf-

Alim, S. (2021). IMPLEMENTASI ORANGE DATA MINING UNTUK

KLASIFIKASI KELULUSAN MAHASISWA DENGAN MODEL K-

NEAREST NEIGHBOR , DECISION TREE SERTA NAIVE BAYES

ORANGE DATA MINING IMPLEMENTATION FOR STUDENT

GRADUATION CLASSIFICATION USING K-NEAREST NEIGHBOR ,.

Jurnal Ilmiah NERO, 6(2), 133–144.

Arief, M. (2019). Klasifikasi Kematangan Buah Jeruk Berdasarkan Fitur Warna

Menggunakan Metode SVM. Jurnal Ilmu Komputer Dan Desain Komunikasi

Visual, 4(1), 9–16.

Cahya, F. N., Pebrianto, R., & M, T. A. (2021). Klasifikasi Buah Segar dan Busuk

Menggunakan Ekstraksi Fitur Hu-Moment , Haralick dan Histogram. IJCIT

(Indonesian Journal on Computer and Information Technology), 6(1), 57–

62. https://doi.org/10.31294/ijcit.v6i1.10052

Dan, F., Forest, R., & Method, R. F. (2021). ( COW WEIGHT

CLASSIFICATION BASED ON DIGITAL IMAGE USING FRACTAL

AND. E-Proceeding of Engineering, 8(2), 1472–1480.

Hartono, S., Perwitasari, A., & Sujaini, H. (2020). Komparasi Algoritma

Nonparametrik untuk Klasifikasi Citra Wajah Berdasarkan Suku di

Indonesia. Jurnal Edukasi Dan Penelitian Informatika (JEPIN), 6(3), 337–

343. https://doi.org/10.26418/jp.v6i3.43268

57
Luthfiana Ratnawati, & Dwi Ratna Sulistyaningrum. (2019). Penerapan Random

Forest untuk Mengukur Tingkat Keparahan Penyakit pada Daun Apel. Jurnal

Sains Dan Seni Its, 8(2), 71–77.

Maulana, F. F., & Rochmawati, N. (2019). Klasifikasi Citra Buah Menggunakan

Convolutional Neural Network. Journal of Informatics and Computer

Science, 01(02), 104–108.

Neighbors, M. K., Wijaya, N., & Ridwan, A. (2019). Klasifikasi Jenis Buah Apel

Dengan. Jurnal SISFOKOM, 08(01), 74–78.

Nooriza, R. (2016). PENGEMBANGAN TINGKAT KEMATANGAN BUAH

APEL MANALAGI ( Malus sylvestris ) BERDASARKAN CITRA RED-

GREEN- BLUE MENGGUNAKAN PENDEKATAN EUCLIDEAN

DISTANCE. Jurnal Seminar Informatika Aplikatif Polinema.

Paraijun, F., Aziza, R. N., & Kuswardani, D. (2022). Implementasi Algoritma

Convolutional Neural Network Dalam Mengklasifikasi Kesegaran Buah

Berdasarkan Citra Buah. JURNAL KILAT, 11(1), 1–9.

https://doi.org/https://doi.org/10.33322/kilat.v11i1.1458

Prajatama, K., Nugroho, F. E., Sentosa, A. F., & Fauziah, S. (2019). Deteksi

Kualitas Buah Apel Malang Manalagi Menggunakan Algoritma Naive Bayes

Quality Detection Of Malang Manalagi Apple Fruit Using The Algorithm

Naive Bayes Program Studi S1 Jurusan Informatika Fakultas Ilmu Komputer

Universitas Pengambilan Data Ekstraks. JURNAL SISTEM INFORMASI

DAN TEKNOLOGI INFORMASI, 8(1), 32–38.

58
Rabbani, R., Wahidah, I., & Santoso, I. H. (2021). Klasifikasi Data Deteksi Jatuh

Menggunakan Machine Learning Dengan Algoritma Adaptive Boosting

( Adaboost ) ( Fall Detection Data Classification Using Machine Learning

With Adaptive Boosting ( Adaboost ) Algorithm ). E-Proceeding of

Engineering, 8(5), 5053–5063.

Sujaini, H. (2019). Sistem Analisis Citra Alat Musik Tradisional dengan Metode

k-Nearest Neighbor , Random Forest , dan Support Vector Machine. Jurnal

Sistem Informasi Bisnis, 02, 185–191.

https://doi.org/10.21456/vol9iss2pp185-191

Yogiswara, G. H., Magdalena, R., P, H. F. T. S., Elektro, F. T., & Telkom, U.

(2016). IDENTIFIKASI JENIS PENYAKIT PADA KAKAO DENGAN

PENGOLAHAN CITRA DIGITAL DAN K-NEAREST NEIGHBOR

CACAO DISEASE IDENTIFICATION USING DIGITAL IMAGE

PROCESSING AND. E-Proceeding of Engineering, 3(1), 371–377.

59

Anda mungkin juga menyukai