Dina - Oktavia,+##default - Groups.name - Manager##,+6686 99Z - Artikel 46748 1 2 20200121
Dina - Oktavia,+##default - Groups.name - Manager##,+6686 99Z - Artikel 46748 1 2 20200121
Abstrak
Attention Deficit Hyperactivity Disorder merupakan salah satu gangguan yang biasa terjadi pada
anak usia dini yang ditandai dengan berbagai macam perilaku seperti tidak bisa tenang, kurang bisa
memberi perhatian, dan keinginan tiba-tiba untuk melakukan hal-hal yang berlebihan. Secara umum ada
tiga jenis ADHD, antara lain: inattentive, impulsive, dan hyperactive. Namun banyak masyarakat yang
belum sadar akan bahayanya kelainan ini jika tidak ditangani sejak dini. Oleh karena itu, dibutuhkan
sebuah sistem untuk mengidentifikasi jenis ADHD pada seorang anak. Penelitian ini menggunakan
Learning Vector Quantization sebagai algoritme untuk mengklasifikasi jenis ADHD dan algoritme
genetika sebagai penyeleksi fitur-fitur yang relevan. Pada penelitian ini terdapat 45 buah fitur yang
merupakan gejala-gejala dari ADHD yang akan diseleksi terlebih dahulu oleh algoritme genetika fitur-
fitur mana saja yang akan digunakan untuk proses LVQ untuk ditentukan nilai akurasinya. Pengujian
dilakukan dengan mencari angka-angka dari variabel yang memberikan pengaruh terhadap hasil dan
dapat menghasilkan angka akurasi paling tinggi. Parameter terbaik dengan hasil akurasi tertinggi antara
lain ukuran populasi 15, crossover rate 0,9, mutation rate 0,1, banyak generasi 7, dan nilai learning rate
0.5 di mana nilai rata-rata akurasinya mencapai 96%.
Kata kunci: ADHD, attention deficit hyperactivity disorder, algoritme genetika, Learning Vector Quantization,
LVQ, identifikasi, seleksi fitur.
Abstract
Attention Deficit Hyperactivity Disorder is one of the common disorders that may occur early
childhood which is indicated by certain kinds of behaviors such as the inability to calm down, not being
able to pay much attention, and sudden desire to do excessive things. There are three types of ADHD in
general: inattentive, impulsive, and hyperactive. But a lot of people are not aware of the dangers of this
disorder if not treated from an early stage. Thus, a system to identify the type of ADHD in a child is
needed. This study implements Learning Vector Quantization as the algorithm to classify types of ADHD
and genetic algorithm as the selector of relevant features. In this study, there are 45 features which are
the symptoms of ADHD that will be selected in advance by the genetic algorithm to determine which
features are going to be used in the LVQ process to determine its accuracy value. The testing includes
finding the numbers of variables that may have impacts to the results and can result the highest accuracy
numbers. The best parameters with the highest accuracy results are the population size of 15, crossover
rate of 0.9, mutation rate of 0.1, number of generations of 7, and the learning rate of 0.5.
Keywords: ADHD, attention deficit hyperactivity disorder, genetic algorithm, Learning Vector Quantization,
LVQ, identification, feature selection.
4.1 Learning Vector Quantization (LVQ) dengan kelas target. Jika sama, maka persamaan
yang digunakan untuk memperbaharui bobot
Learning Vector Quantization (LVQ) adalah
adalah persamaan (2). Jika berbeda, maka
metode untuk melakukan pembelajaran pada
persamaan yang digunakan adalah persamaan (3).
lapisan kompetitif yang terbimbing. Learning
Vector Quantization (LVQ) merupakan suatu
wj(baru) = wj(lama) + α||x-wj|| (2)
metode klasifikasi pola yang setiap hasilnya
wj(baru) = wj(lama - α||x-wj|| (3)
mewakili sebuah kategori atau suatu kelas
tertentu. LVQ mengklasifikasikan vektor input 4.1.3 Testing
dalam kelas yang sama dengan unit output yang
memiliki vektor bobot yang paling dekat dengan Testing adalah proses yang dilakukan kepada
vektor input (Widodo, 2005). data uji setelah data latih melalui seluruh proses
Berikut adalah langkah-langkah dari proses LVQ data training. Proses ini berfungsi untuk
(Fausett, 1994): mengukur seberapa akurat hasil dari perhitungan
1. Inisialisasi. LVQ setelah beberapa iterasi. Testing dimulai
a. Inisialisasi vektor referensi. dengan proses perhitungan jarak Euclidean.
b. Inisialisasi laju pelatihan (α) = 0. Setelah didapatkan masing-masing kelas dari data
2. Selama kondisi stop salah, kerjakan tersebut, kelas tersebut akan dicocokkan ke kelas
langkah 2-6. pada data uji, kemudian dihitung berapa banyak
3. Untuk setiap vektor, masukkan pelatihan kelas yang sesuai yang ditandakan dengan
x, kerjakan langkah 3-4. variabel “akurat”. Pada langkah terakhir, program
4. Cari nilai J sehingga ||x-wj|| bernilai akan menghitung presentase dari banyaknya data
minimum. yang akurat terhadap keseluruhan data. Rumus
5. Perbaharui nilai wj dengan ketentuan: akurasi dapat dilihat pada persamaan (4).
a. Jika T=Cj maka wj (baru) = wj(lama)
∑ 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑐𝑜𝑐𝑜𝑘
+ α||x-wj|| Akurasi (%) = ∑ 𝑑𝑎𝑡𝑎 𝑘𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛×100% (4)
b. Jika T≠Cj maka wj(baru) = wj(lama -
α||x-wj|| 5. METODE
6. Kurangi laju pelatihan (α = α - Decα ; α =
α*Decα). Langkah-Langkah yang dilakukan pada
7. Uji kondisi stop (cacah iterasi atau laju penelitian ini ditunjukkan Diagram Alir pada
pelatihan). Gambar 1.
Berikut adalah penjelasan tentang diagram alir Proses dimulai dari menginput data set
pada Gambar 1: sebanyak 100 buah dengan 45 fitur pada masing-
• Studi literatur adalah pengumpulan teori- masing data dan jenis kelas dari setiap data
teori yang merupakan rujukan terhadap tersebut. Kemudian algoritme genetika
penelitian ini. Teori dapat berasal dari jurnal, membangkitkan sejumlah individu berdasarkan
buku, atau laporan penelitian. banyak ukuran popoulasi dengan memilih secara
acak fitur-fitur mana saja di antara 45 fitur tersebut
• Pengumpulan data adalah mengumpulkan yang akan diproses pada perhitungan LVQ. LVQ
data yang dipakai pada sistem penelitian. akan memberikan nilai akurasi dari masing-
• Algoritme, yaitu tahap perancangan serta masing individu yang akan dijadikan acuan untuk
penerapan algoritme yang akan digunakan nilai fitness. Setelah itu, algoritme genetika
pada penelitian. menyeleksi individu atau kombinasi fitur dengan
mengurutkan dari nilai fitness tertinggi sampai
• Pengujian dan Analisis sistem, yaitu terendah. Individu-individu dengan nilai fitness
melakukan sejumlah pengujian terhadap tertinggi akan melanjutkan siklus algoritme
sistem yang telah dibuat serta menganalisis genetika ke generasi selanjutnya.
hasilnya.
• Penarikan kesimpulan, yaitu melakukan 6. PENGUJIAN DAN ANALISIS
perangkuman terhadap hasil dari penelitian Pengujian dan analisis dilakukan dalam dua
yang telah dilakukan. tahap, yang pertama adalah pengujian untuk
Algoritme pada sistem Identifikasi Jenis mengetahui pengaruh dari nilai-nilai variabel pada
Attention Deficit Hyperactivity Disorder pada algoritme genetika dan LVQ, antara lain popsize,
Anak Menggunakan Learning Vector cr, mr, generasi, dan learning rate. Yang kedua
Quantization dengan Seleksi Fitur Menggunakan adalah pengujian untuk membandingkan nilai
Algoritme Genetika ditunjukkan oleh diagram alir akurasi jika sistem hanya menggunakan LVQ
pada Gambar 2. tanpa seleksi fitur dan jika sistem menggunakan
LVQ-AG.
8 80,0 53,3 80,0 100 46,7 72,00 untuk kasus ini tidak berpengaruh secara
9 100 73,3 73,3 100 80,0 85,33 signifikan terhadap hasil akhir dikarenakan nilai-
10 93,3 86,7 66,7 60,0 93,3 80,00
nilai yang dipindah silang dan dimutasi pada
11 100 73,3 73,3 93,3 73,3 82,67
12 60,0 100 73,3 100 100 86,67 siklus algoritme genetika berupa biner sehingga
13 86,7 100 100 100 66,7 90,67 tidak terlalu memberi perbedaan yang berarti pada
14 100 100 86,7 100 100 97,33 proses perhitungan akurasi pada LVQ.
15 100 93,3 100 100 100 98,67
6.3 Hasil Pengujian dan Analisis Banyak
Pada tabel 6.1, dapat dilihat bahwa Generasi
semakin bertambahnya ukuran populasi, Pengujian selanjutnya dilakukan terhadap
semakin tinggi nilai akurasi yang mungkin variabel generasi atau banyaknya iterasi yang
didapatkan. Rata-rata nilai akurasi tertinggi dilakukan pada proses seleksi fitur algoritme
didapatkan pada ukuran populasi 15 yaitu genetika. Pengujian tersebut dilakukan untuk
98,67%. Nilai popsize hanya diuji sampai 15 menentukan banyaknya iterasi yang dianggap
karena mulai dari popsize 12 sudah banyak paling optimal. Percobaan dimulai dari banyak
didapatkan hasil akurasi 100, sehingga jika generasi 1 sampai 10, kemudian dilakukan
ditambahkan terus-menerus, hasil percobaan percobaan dengan banyak generasi 15 dan 20.
akan selalu mengalami konvergensi. Pengujian ini dilakukan dengan menggunakan
hasil dari ukuran popsize, cr, dan mr pada
6.2 Pengujian dan Analisis Kombinasi Variabel percobaan sebelumnya. Hasil pengujian variabel
CR dan MR generasi dapat dilihat pada Tabel 6.3.
Pengujian ini dilakukan untuk mencari Tabel 6.3 Hasil pengujian variabel generasi
kombinasi nilai yang sesuai dan dapat Cr=0,9; Mr=0,1; Popsize=15 Rata-
menghasilkan nilai akurasi yang tinggi. Pada Gen Percobaan ke-i rata nilai
erasi 1 2 3 4 5 akurasi
pengujian kombinasi nilai Cr dan Mr, parameter-
1 86,7 66,7 73,3 73,3 80 76
parameter algoritme genetika untuk popsize 2 86,7 53,3 93,3 60 80 74,67
menggunakan 15 ukuran populasi, yang diperoleh 3 80 86,7 60 46,7 53,3 65,33
dari pengujian popsize pada subbab 6.1 dan 4 93,3 46,7 40 93,3 66,7 68
banyaknya generasi sebanyak 2. Setiap kombinasi 5 80 80 66,7 60 73,3 72
nilai Cr dan Mr dilakukan pengujian sebanyak 6 100 73,3 86,7 73,3 100 86,67
7 86,7 100 100 100 80 93,33
lima kali. Hasil pengujian kombinasi variabel Cr
8 86,7 66,7 93,3 100 60 81,33
dan Mr yang telah dilakukan dapat dilihat pada 9 100 86,7 80 100 100 93,33
Tabel 6.2. 10 86,7 93,3 80 100 93,3 90,67
15 80 100 73,3 93,3 100 89,33
Tabel 6.2 Hasil pengujian kombinasi variabel 20 93,3 93,3 73,3 100 73,3 89,33
Cr dan Mr
Popsize = 15; Generasi = 2; Rata- Hasil pegujian generasi pada tabel 6.3
Cr & Percobaan ke - i rata
Mr nilai menunjukkan bahwa nilai rata-rata akurasi
1 2 3 4 5 tertinggi didapatkan pada percobaan banyak
akurasi
0,9;0,1 93,3 93,3 100 93,3 100 96 generasi 7 dan 9 yaitu 93,33%. Dari generasi 1
0,8;0,2 73,3 93,3 93,3 100 80,0 88 sampai 9 seperti terbentuk sebuah pola bahwa
0,7;0,3 100 80 80 53,3 100 82,67 semakin banyak generasi atau semakin banyak
0,6;0,4 86,7 100 66,7 66,7 100 84
siklus algoritme genetika yang dilalui, maka
0,5;0,5 100 100 86,7 86,7 86,7 92
0,4;0,6 73,3 80 93,3 100 100 89,33 semakin tinggi kemungkinan untuk mendapatkan
0,3;0,7 86,7 100 86,7 86,7 80 88 akurasi tinggi. Namun setelah percobaan
0,2;0,8 100 100 93,3 100 66,7 92 menggunakan banyak generasi 9, pola tersebut
0,1;0,9 100 80 86,7 100 100 93,33 berhenti dan akurasi menjadi tidak menentu
namun tetap bernilai relatif tinggi. Sehingga dapat
Dari hasil pengujian kombinasi variabel Cr disimpulkan banyak generasi yang paling optimal
dan Mr pada tabel 6.2, rata-rata nilai akurasi untuk kasus ini adalah 7.
tertinggi yang didapatkan adalah saat nilai Cr =
0,9 dan nilai Mr = 0,1 yaitu 96%. Nilai Cr dan Mr
6.4 Pengujian dan Analisis Learning Rate Tabel 6.5 Hasil pengujian akurasi metode LVQ
tanpa seleksi fitur
Pengujian learning rate dilakukan untuk Learning rate Akurasi
mengetahui pengaruh nilai learning rate terhadap 0,1 0
hasil nilai akurasi sistem. Pengujian ini dilakukan 0,2 20
dengan mengganti nilai learning rate dengan 0,3 8
0,001, 0,005, 0,01, 0,05, kemudian dari 0,1, terus 0,4 80
0,5 88,89
bertambah 0,1 sampai dengan 0,5 dengan 0,6 0
menggunakan variabel dari ukuran popsize, cr, 0,7 0
mr, dan generasi pada percobaan-percobaan 0,8 0
sebelumnya. Hasil skenario pengujian learning 0,9 0
rate ditunjukkan pada Tabel 6.4.
Hasil pengujian sistem dengan hanya
menggunakan metode LVQ menghasilkan nilai
akurasi tertinggi 88,89% pada nilai learning rate
Tabel 6.4 Hasil pengujian learning rate 0,5. Hal ini menunjukkan bahwa seleksi fitur
Popsize = 15 ; Cr = 0,9 ; Mr = 0,1 ; Rata-rata algoritme genetika mempunyai perngaruh dalam
Learning Generasi = 7 nilai meningkatkan akurasi sistem seperti yang sudah
Rate Percobaan ke - i akurasi
1 2 3 4 5
ditunjukkan pada sub bab sebelumnya di mana
0.001 0 6,7 26,7 20 20 14,67 hasil akhir dari LVQ-AG memiliki rata-rata nilai
0.005 26,7 26,7 26,7 26,7 20 25,33 akurasi paling tinggi mencapai 96%.
0.01 20 26,7 20 20 13,3 20,00
0.05 60 86,7 60 60 53,3 64,00 7. KESIMPULAN
0.1 80 86,7 80 86,7 93,3 85,33
0.5 100 80 100 100 100 96,00 Sesuai dengan hasil penelitian tentang seleksi
fitur menggunakan Algoritme Genetika pada
Hasil pengujian learning rate pada tabel 6.4 identifikasi jenis Attention Deficit Hyperactivity
menunjukkan bahwa rata-rata nilai akurasi Disorder dengan Learning Vector Quantization
tertinggi didapatkan pada percobaan nilai learning (LVQ) yang telah dilakukan, dapat ditarik
rate 0,5 yaitu 96%. Dapat disimpulkan bahwa kesimpulan sebagai berikut:
semakin tinggi nilai learning rate, maka semakin 1. Penerapan algoritme genetika untuk
cepat sistem akan memberikan hasil dengan nilai menyeleksi fitur untuk proses LVQ pada
akurasi tinggi. penelitian ini menggunakan representasi
kromosom pengodean bilangan biner.
6.5 Pengujian dan Analisis Akurasi Metode Individu dibangkitkan sebanyak ukuran
LVQ Tanpa Seleksi Fitur Algoritme populasi (popsize) di mana masing-masing
Genetika individu memiliki 45 buah kromosom. Satu
individu merepresentasikan fitur-fitur mana
Pengujian akurasi hanya menggunakan
saja yang terpilih untuk digunakan pada
metode LVQ dilakukan untuk mengetahui
proses klasifikasi LVQ. Pada masing-masing
seberapa besar pengaruh seleksi fitur algoritme
iterasi algoritme genetika, dilakukan proses
genetika terhadap hasil akhir yang diberikan oleh
crossover, mutation, evaluasi, dan seleksi.
program. Pengujian dilakukan dengan mengubah
Seluruh individu mulai dari parent hingga
nilai-nilai gen pada inisialisasi popsize menjadi 1
offspring hasil reproduksi dilakukan evaluasi
semua yang berarti seluruh fitur pada data latih
dengan mengurutkan nilai fitness masing-
dan data uji dimasukkan ke perhitungan tanpa
masing individu. Nilai fitness didapatkan dari
terseleksi terlebih dahulu. Vektor bobot yang
nilai akurasi hasil proses klasifikasi LVQ.
digunakan masih vektor bobot yang sama dengan
Sejumlah individu dengan nilai fitness
yang digunakan pada pengujian menggunakan
terbaik akan melalui siklus algoritme
seleksi fitur algoritme genetika. Kemudian nilai
genetika pada iterasi selanjutnya. Proses
variabel popsize, cr, mr, dan banyak generasi
tersebut akan terus berulang sebanyak
diabaikan. Hasil skenario pengujian akurasi
generasi yang diinginkan.
metode LVQ tanpa seleksi fitur ditunjukkan pada
Tabel 6.5. 2. Hasil akurasi terbaik yang didapatkan dari
pengujian terhadap variabel-variabel adalah
sebagai berikut: popsize = 15 dengan nilai Informasi dan Ilmu Komputer, II(3),
akurasi 98,67%, kombinasi nilai Cr = 0,9 dan 1170-1178.
Mr = 0,1 dengan nilai akurasi 96%, banyak Cahyani, F. P., Furqon, M. T., & Rahayudi, B.
generasi 7 dengan nilai akurasi 93,33%, dan (2018). Identifikasi Penyimpangan
nilai learning rate 0.5 dengan nilai akurasi Tumbuh Kembang Anak Dengan
96%. Algoritme Backpropagation. Jurnal
Pengembangan Teknologi Informasi dan
3. Seleksi fitur algoritme genetika terbukti
Ilmu Komputer, 1778-1786.
memberi pengaruh terhadap akurasi di mana
Fausett, L. (1994). Fundamentals of Neural
hasil akurasi yang hanya menggunakan LVQ
Network: Architectures, Algorithms, and
adalah 88,89%, sementara rata-rata nilai
Applications. New Jersey: Prentice-Hall
akurasi dengan menggunakan LVQ-AG
Inc.
mencapai 96%.
Han, J., Kamber, M., & Pei, J. (2012). Data
Karena penelitian ini masih memiliki banyak Mining Concepts and Techniques.
kekurangan, berikut beberapa saran yang dapat Waltham: Elsevier Inc.
diberikan dari penelitian ini yang dapat berguna Pahlevi, M. K., Setiawan, B. D., & Afirianto, T.
untuk penelitian selanjutnya, antara lain: (2018). Identifikasi Gangguan
1. Menggunakan sebaran data yang lebih Kepribadian Dramatis Menggunakan
variatif dan memiliki total data yang lebih Metode Learning Vector Quantization
banyak, serta menggunakan populasi dan (LVQ) . Jurnal Pengembangan
generasi yang lebih besar. Sehingga Teknologi Informasi dan Ilmu Komputer,
diharapkan mendapat hasil akurasi yang lebih 3103-3111.
tinggi lagi. Setyowati, W. A., & Mahmudy, W. F. (2018).
2. Mengembangkan penelitian ini dengan Optimasi Vektor Bobot Pada Learning
menggunakan metode seleksi fitur lain Vector Quantization Menggunakan
dan/atau menggunakan metode klasifikasi Particle Swarm Optimization Untuk
Klasifikasi Jenis Attention Deficit
lain.
Hyperactivity Disorder (ADHD) Pada
8. DAFTAR PUSTAKA Anak Usia Dini. Jurnal Pengembangan
Teknologi Informasi dan Ilmu Komputer,
Arniantya, R., Setiawan, B. D., & Adikara, P. P. 4428-4437.
(2018). Optimasi Vektor Bobot pada Utami, L. D. (2015). Integrasi Metode
Learning Vektor Menggunakan Information Gain Untuk Seleksi Fitur
Algoritme Genetika untuk Indentisifikasi dan Adaboost Untuk Mengurangi Bias
Jenis Attention Deficit Hyperactivity Pada Analisis Sentimen Review Restoran
Disorder pada Anak. Jurnal Menggunakan Algoritma Naive Bayes.
Pengembangan Teknologi Informasi dan Journal of Intellegent System, 1(2).
Ilmu Komputer, 2(2), 679-687. Wafiyah, F., Hidayat, N., & Perdana, R. S.
Association, A. P. (2013). Diagnostic and (2017). Implementasi Algoritma
Statistical Manual of Mental Disorders Modified K-Nearest Neighbor (MKNN)
(5th ed.). Arlington: American untuk Klasifikasi Penyakit Demam.
Psychiatric Association. Jurnal Pengembangan Teknologi
Beniwal, S., & Arora, J. (2012). Classification Informasi dan Ilmu Komputer, 1(10),
and Feature Selection Techniques in Data 1210-1219.
Mining. International Journal of Widodo, T. (2005). Sistem Neuro Fuzzy.
Engineering Research and Technology Yogyakarta: Graha Ilmu.
(IJERT), 1(6).
Cahya, R. A., Dewi, C., & Rahayudi, B. (2018).
Klasifikasi Aritmia dari Hasil
Elektrokardiogram Menggunakan
Support Vector Machine dengan Seleksi
Fitur Menggunakan Algoritma Genetika.
Jurnal Pengembangan Teknologi