Anda di halaman 1dari 3

Outline

Pendekatan baru menggunakan ensembla bagging pada


Judul
klasifikasi data penyakit depresi

Data depresi dari kaggle (1429 data, 22 fitur + target (binary


Dataset
class))
 Data tersebut menyajikan depresi pada masyarakat desa
yang di lihat dari faktor demografi
 Depresi yang di maksud adalah depresi situasional
 Beberapa fitur : umur, jumlah tanggungan keluarga,
tingkat pendidikan, pendapatan (gaji, pertanian, bisnis),
pengeluaran (investasi) dll

Penanganan terkait depresi pada masyarakat desa jarang/kurang


Masalah
dilakukan oleh pihak-pihak terkait. Padahal masyarakat desa
rentan terkena depresi, karena pada umumnya masyarakat desa
tingkat pedidikan rendah, jumlah anak dan tanggungan keluarga
banyak sedangkan pendapatan yang di hasilkan sedikit

Perlu adanya sistem untuk mendeteksi secara cepat dan tepat,


Pemecahan masalah
deteksi penyakit depresi pada masyarakat pedesaan.
 Pendeteksian penyakit di lakukan dengan cara klasifikasi

Metode klasifikasi yang digunakan adalah pohon keputusan


Metode
algoritma C4.5 dengan pendekatan teknik bagging / ensemble
bagging pada data penyakit depresi

0 = class no depressed, 1 = class depressed


Output
 Dari data yang di deteksi akan terklasifikasi 0/1 yaitu
berstatus tidak depresi /depresi
 Hasil di dapat dari model yang telah terbangun

Keterangan Metode
Pohon keputusan Pengertian :
Algoritma C4.5  Salah satu teknik klasifikasi machine learning yang di gunakan pada
proses data mining dengan membentuk sebuah pohon keputusan
 Algoritma C4.5 pengembangan dari algoritma ID3

Kelebihan :
 Pohon keputusan adalah salah satu metode klasifikasi yang paling
populer karena mudah untuk diinterpretasi oleh manusia.
 Pohon keputusan berkemampuan untuk mem-break down proses
pengambilan keputusan yang kompleks menjadi lebih simpel sehingga
pengambil keputusan akan lebih menginterpretasikan solusi dari
permasalahan
 Pohon Keputusan berguna untuk mengeksplorasi data, menemukan
hubungan tersembunyi antara sejumlah calon variabel input dengan
sebuah variabel target.
 Eliminasi perhitungan-perhitungan yang tidak diperlukan, karena
ketika menggunakan metode pohon keputusan maka sample diuji
hanya berdasarkan kriteria atau kelas tertentu.

 Algoritma C4.5 dapat menangani atribut kontinue dan diskrit


 Pemilihan atribut menggunakan gain ratio

Kekurangan :
 Terjadi overlap terutama ketika kelas-kelas dan criteria yang
digunakan jumlahnya sangat banyak. Hal tersebut juga dapat
menyebabkan meningkatnya waktu pengambilan keputusan dan
jumlah memori yang diperlukan.
 Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon
keputusan yang besar.
 Kesulitan dalam mendesain pohon keputusan yang optimal.
 Hasil kualitas keputusan yang didapatkan dari metode pohon
keputusan sangat tergantung pada bagaimana pohon tersebut didesain.
Ensemble bagging Pengertian :
 singkatan dari bootstrap aggregating
 salah satu teknik dari ensemble learning/ensemble method
 bagging menggunakan resampling acak dengan pengembalian dataset
awal sehingga diperoleh dataset baru
 teknik bagging digunakan untuk melatih algoritma yang sama berkali-
kali dengan menggunakan subset berbeda

Kelebihan :
 meningkatkan akurasi dengan mengurangi varian kesalahan dari
klasifikasi
 memperbaiki hasil dari algoritma klasifikasi dengan menggabungkan
klasifikasi prediksi dari beberapa model majority voting.

Kekurangan :
 bagging paling cocok untuk masalah dengan dataset yang relatif kecil
Flowchart

Anda mungkin juga menyukai