Anda di halaman 1dari 15

PENGANTAR DATA

MINING

Abraham Simatupang
Departemen Farmakologi & Terapi
Fakultas Kedokteran Universitas Kristen Indonesia
Abraham.Simatupang@uki.ac.id
Tujuan Pembelajaran
Setelah mengikuti Kuliah ini diharapkan mahasiswa:
• Memahami pengertian tentang data mining
• Memahami kegunaan Data mining dalam dunia kedokteran dan
kesehatan
Mengapa data mining?
• Data tersedia sangat besar (big data): Terabytes!
• Data tersimpan dalam cloud
• Data tersambung oleh Internet of things (IoT) Machine
• Banyak data yang tidak dapat dianalisis dengan teknik Statistics/AI learning/Pattern
konvensional recognition

DATA MINING

Database
system
Data Pyramid

Knowledge + experience
Wisdom
Knowledge Information + rules

Information Data + context

Data
Apa itu data? Atribut/variable/karakteristik

• Koleksi kumpulan (data) objek


dan atributnya
Jenis Status
No. Umur Bekerja
• Atribut adalah milik atau Kelamin Perkawinan
karakteristik objek (jenis 1 Pria Menikah 34 Ya
kelamin: laki/perempuan, 2 Pria Duda 57 Tidak

Objek
warna kulit, suhu, kadar gula 3 Wanita Menikah 28 Ya
darah, dll.) 4 Pria Belum menikah 25 Ya
• Atribut dikenal juga sebagai 5 Wanita Menikah 30 Tidak
variable, karakteristik, fitur, field 6 Wanita Belum menikah 23 Bekerja
• Koleksi atau kumpulan atribut
menjelaskan tentang objek
• Objek dikenal juga sebagai: Size/Ukuran: jumlah objek
catatan, point, kasus, sample, Dimensi: jumlah atribut/variable
entitas.
Definisi dan Kegunaan Data mining
• Prosedur penggalian informasi dari set data yang sangat besar.
• Analisis kumpulan data pengamatan (seringkali besar) untuk
menemukan hubungan yang tidak terduga dan untuk meringkas data
dengan cara baru yang dapat dimengerti dan berguna bagi pemilik data.
• Paling efektif bila digunakan secara strategis untuk melayani tujuan
bisnis, menjawab pertanyaan bisnis atau penelitian, atau menjadi
bagian dari solusi untuk suatu masalah.
• Penambangan data membantu membuat prediksi yang akurat,
mengenali pola dan pencilan, dan sering menginformasikan peramalan.
• Data mining membantu organisasi mengidentifikasi kesenjangan dan
kesalahan dalam proses, seperti kemacetan dalam rantai pasokan atau
entri data yang tidak tepat.
Kegunaan Data mining dalam dunia
kesehatan
• Tujuan data mining dalam kedokteran klinis adalah untuk mendapatkan
model yang dapat menggunakan informasi spesifik pasien untuk
memprediksi hasil yang menarik dan dengan demikian mendukung
pengambilan keputusan klinis
• Memprediksi penipuan asuransi kesehatan, pasien yang kurang
terdiagnosis, biaya perawatan kesehatan, prognosis penyakit, diagnosis
penyakit, dan lama tinggal (Length of Stay/LOS) di rumah sakit.
• Memperoleh pola yang sering dari database biomedis dan perawatan
kesehatan, seperti hubungan antara kondisi kesehatan dan penyakit,
hubungan antara penyakit, dan hubungan antara obat-obatan.
Langkah-langkah data
mining menggunakan
database kesehatan
publik
Dataset dalam proses datamining
Modeling in Data mining
• Data-mining has two kinds of models
• Descriptive: to find patterns that describe data that can be
interpreted by humans
• Predictive: Predictive models are used to predict unknown or future
values of other variables of interest.
Klasifikasi dan Asosiasi
• Klasifikasi adalah metode inti data mining inti yang digunakan dalam
bioinformatika dan biomedis.
• Contoh: peneliti dapat dengan benar membedakan antara penyakit
serupa jika mereka dapat memiliki data microarray ekspresi DNA dari
sel sampel atau jaringan yang terinfeksi penyakit serupa dan dapat
dengan benar mengklasifikasikan data microarray. Golub dan rekan
dengan benar membedakan leukemia myeloid akut (AML) dan
leukemia limfoblastik akut (ALL) menggunakan data ekspresi gen dan
algoritma klasifikasi. Membedakan antara ALL dan AML sangat
penting untuk pengobatan leukemia akut yang sukses.
Data mining: Asosiasi
• Asosiasi digunakan untuk menggali hubungan tersembunyi di antara
atribut.
• Sejak algoritma Apriori diperkenalkan pada awal 1990-an,
penambangan asosiasi telah diterapkan pada kumpulan data yang
sangat besar (seperti data asuransi kesehatan nasional, misalnya),
untuk mengidentifikasi hubungan antara obat tertentu dan obat lain,
atau hubungan penyakit tertentu dan penyakit lainnya.
Korea Medical Insurance Corporation (KMIC)
• Database Korea Medical Insurance Corporation (KMIC) untuk
membantu merumuskan kebijakan pemerintah tentang manajemen
hipertensi.
• Secara acak dipilih 18.277 subjek dari populasi 127.886 penerima
manfaat dari program pemeriksaan kesehatan dua tahunan di tahun
1998. Kemudian dilakukan data mining asosiasi dengan rumus:
• How Data Mining Works: A Guide | Tableau
• What Are the 7 Best Data Mining Tools of 2023? (careerfoundry.com)
• 9 of the Best Free Data Mining Tools (springboard.com)

Anda mungkin juga menyukai