Anda di halaman 1dari 2

Algoritma Genetika untuk Optimasi Klasifikasi

Data Diabetes
Tugas Kecerdasan Komputasional dan Pembelajaran Mesin Kelas B
Dosen Pengampu: Wahyono, P.hd

Abdurraghib Segaf Suweleh NIM 20/466388/PPA/05954


Harun NIM 20/466388/PPA/05954
Laura Haryo NIM 20/466420/PPA/05986
Putra Yudha Pranata NIM 20/466428/PPA/05994

Abstract— Diabetes Mellitus adalah penyakit berbahaya exp ⁡( g ( x ))


yang ditandai dengan peningkatan kadar glukosa dalam π (x )=
darah, yang disebut sebagai kondisi hiperglikemia. Penyakit ini 1+exp ⁡( g ( x ) )
banyak dijumpai di berbagai macam negara, salah satunya
Keterangan:
adalah Indonesia. Penelitian intensif sedang dilakukan untuk
menghasilkan model pembelajaran mesin yang dapat belajar π ( x ) = Proposi terjadinya sebuah kejadian
dari catatan pasien sebelumnya untuk memberikan diagnosis
yang cerdas. Tugas ini bertujuan untuk meningkatkan g ( x ) = β 0 + β 1 x 1+ …+ β p x p
keakuratan metode diagnostik yang ada untuk klasifikasi
Diabetes dengan algoritma pembelajaran mesin. Algoritma Regresi logistika digunakan di berbagai bidang termasuk
yang digunakan untuk klasifikasi pada tugas ini adalah regresi pembelajaran mesin yang sebagian besar diaplikasikan pada
logistik sedangkan algoritma optimasi yang digunakan untuk bidang medis seperti untuk mengklasifikasi suatu penyakit.
meningkatkan akurasi dari model adalah algoritma genetika.
Datasets yang digunakan dibagi menjadi 90% data training dan B. Algoritma Genetika
10% data testing. Dari hasil prediksi, akurasi yang didapatkan GA terinspirasi dari genetika populasi seperti hereditas
adalah 75.32%. Namun setelah menerapkan algoritma dan frekuensi gene, dan evolusi tingkat populasi berdasarkan
genetika pada model ini, akurasi yang didapat naik menjadi paham Mendelian terkait struktur (seperti kromosom dan
84.4%. Ada penambahan 9.08% pada akurasi setelah gen) dan proses (seperti rekombinasi dan mutasi). Secara
dioptimasi menggunakan algoritma genetika. Hal ini umum GA salah satu pengomptimalan dengan cara
menunjukkan bahwa algoritma genetika berhasil
mensimulasikan proses evolusi alam [2]. Berikut beberapa
mengoptimasi klasifikasi diabetes.
tahan dari GA :
Keywords—Algoritma Genetika, Optimasi. 1) Pembentukan Kromosom dan Populasi
I. PENDAHULUAN 2) Fungsi Fitnes
Penderita diabetes di Indonesia setiap tahunnya semakin 3) Proses seleksi Parents
meningkat. World Health Organization memperkirakan
jumlah pasien diabetes di Indonesia khususnya tipe 2 akan 4) Proses Crossover dan mutasi
meningkat signifikan hingga 16,7 juta pada tahun 2045. Hal 5) Proses seleksi Atau Replacement
ini bisa terjadi bila masyarakat Indonesia masih kurang sadar
akan penyakit ini dan kerap menyepelekannya. Dari
permasalahan di atas, sudah banyak dilakukan pendekatan
untuk menekan angka tersebut. Salah satunya menggunakan
teknik algoritma komputer sebagai prediksi angka kasus
diabetes.
Ada pun salah satu cara yang sudah dilakukan ialah
menggunakan metode regresi logistik, namun akurasi yang
dihasilkan masih belum maksimal. Dalam makalah ini, akan
dijelaskan pengoptimalan klasifikasi kasus diabetes
menggunakan algoritma genetika dengan mengkombinasikan
metode regresi logistik, tujuan dari kedua metode di atas
ialah untuk mendapatkan hasil prediksi yang lebih baik.
II. METODE Gambar 1. Skema dari GA
A. Regresi Logistik III. DATASET
Secara umum, regresi logistik sangat cocok untuk Dataset didapat dari www.kaggle.com/datasets. Dataset
mendeskripsikan dan menguji hipotesis tentang hubungan
merupakan Pima Indian Dataset yang terdiri dari 768 record
antar variable [1]. Dalam model ini, probabilitas yang data dan 8 atribut yaitu Pregnancies, Glucose, Blood
menggambarkan kemungkinan hasil dari satu percobaan
Pressure, Skin Thickness, Insulin, BMI (Body Mass Index),
dimodelkan menggunakan fungsi logistik. Regresi Logistik Diabetes Pedigree Function, Age, dan Outcome sebagai
dapat dimodelkan dalam persamaan berikut,
kelas label. Seluruh data sudah dikonversi dalam bentuk
numerik. Berikut beberapa sampel dari dataset (Gambar 2).

XXX-X-XXXX-XXXX-X/XX/$XX.00 ©20XX IEEE


selection hingga mutasi dan proses penggantian parent
dilakukan secara berulang-ulang hingga pada generasi
tertentu atau telah mendapatkan hasil yang konvergen yang
ditandai dengan perubahan fitness value yang tidak
signifikan.
Setelah meng-implementasi genetic algorithm, akurasi
yang dihasilkan meningkat menjadi 84.4%. Ada peningkatan
akurasi sebesar 9.08%. Ini menandakan bahwa oprimasi
menggunakan genetic algorithm berhasil meningkatkan
akurasi dari klasifikasi data diabetes menggunakan logistic
Gambar 1. Sampel Data Dataset regression.
.
TABEL 1. HASIL PENELITIAN
IV. HASIL Metode Akurasi yang dihasilkan
Berikut adalah flowchart cara kerja program yang akan Logistic
75.32%
dibuat. Regression
Logistic
Regression
84.40%
dengan Optimasi
GA

.
KESIMPULAN
Dari hasil prediksi, akurasi yang didapatkan adalah 75.32%.
Setelah menerapkan algoritma genetika pada model ini, akurasi
yang didapat naik menjadi 84.4%. Ada penambahan 9.08% pada
akurasi setelah dioptimasi menggunakan algoritma genetika. Hal
ini menunjukkan bahwa algoritma genetika berhasil mengoptimasi
klasifikasi diabetes.

REFERENSI
[1] C. Y. J. Peng, K. L. Lee, and G. M. Ingersoll, “An
introduction to logistic regression analysis and
reporting,” J. Educ. Res., vol. 96, no. 1, pp. 3–14,
2002, doi: 10.1080/00220670209598786.
[2] Pyrih, Y., Kaidan, M., Tchaikovskyi, I., &
Pleskanka, M. (2019, July). Research of Genetic
Gambar 3. Skema program Algorithms for Increasing the Efficiency of Data
Routing. In 2019 3rd International Conference on
Advanced Information and Communications
Klasifikasi dilakukan dengan menggunakan metode Technologies (AICT) (pp. 157-160). IEEE.
logistic regression dengan membagi dataset menjadi 90%
data training dan 10% data testing. Akurasi yang didapat
adalah 75.32%. Langkah selanjutnya adalah mengoptimasi
klasifikasi tersebut menggunakan algoritma genetika.
Langkah pertama yang dilakukan adalah menginisialisasi
populasi nya. Pada langkah ini, dibuat beberapa parent
chromosome. Langkah berikutnya adalah menghitung
fitness score/value dari chromose – chromose yang sudah
dibuat pada langkah pertama. Fitness value yang dihasilkan
berdasarkan akurasi dari training oleh logistic regression.
Kemudian fitness value diurutkan dari dari terbesar ke
terkecil untuk mengambil dua chromosome dengan nilai
fitness value terbaik
Langkah selanjutnya adalah melakukan crossover.
Crossover dilakukan untuk menghasilkan individu-individu
baru dari hasil persilangan parent. Individu-individu yang
dihasilkan dari crossover kemudian dimutasikan. Mutasi
dilakukan untuk menghasilkan individu unik yang berbeda
dari parent-parent sebelumnya Setelah dilakukan mutasi,
generasi yang dihasilkan akan dibandingkan dengan parent-
parent sebelumnya. Jika generasi tersebut memiliki fitness
value lebih baik maka generasi tersebut akan menggantikan
parent dengan fitness value yang buruk. Proses dari

Anda mungkin juga menyukai