DATASET DIABETES
DISUSUN OLEH
Irsal Fathi Farhat / (0110221146)
Muhammad Fahriza / (0110221147)
Muhammad Salsabil / (0110221178)
Muhammad Farhan Abdillah / (0110221175)
Ridho Fauzi Grafika / (0110221142)
i
DAFTAR GAMBAR
ii
ANGGOTA KELOMPOK
No NIM Nama Peran
1 0110221146 Irsal Fathi Farhat
2 0110221147 Muhammad Fahriza
3 0110221178 Muhammad Salsabil
4 0110221175 Muhammad Farhan Abdillah
5 0110221142 Ridho Fauzi Grafika
iii
1. LATAR BELAKANG
Diabetes merupakan sekelompok penyakit metabolik yang ditandai dengan hiperglikemia
akibat gangguan sekresi insulin, kerja insulin, atau keduanya. Kumpulan data ini berasal dari
National Institute of Diabetes and Digestive and Kidney Diseases.
2. TUJUAN
Tujuan dari kumpulan data ini adalah untuk memprediksi secara diagnostik apakah seorang
pasien menderita diabetes, berdasarkan pengukuran diagnostik tertentu yang termasuk dalam
kumpulan data. Beberapa batasan ditempatkan pada pemilihan instance ini dari database yang
lebih besar. Secara khusus, semua pasien di sini adalah perempuan berusia minimal 21 tahun
keturunan India Pima.
3. SPESIFIKASI APLIKASI
Tools atau Software yang digunakan pada projek kali ini adalah sebagai berikut:
1. Orange Data Mining
2. Komputer
3. Microsoft Word
4. TIMELINE PROJEK
2 minggu
5. DESAIN PROJEK
Info desain projek misalnya desain database (jika ada), desain antar muka, desain sistem jika
menggunakan software, dll
6. HASIL PENGUJIAN
Aplikasi Orange merupakan aplikasi data mining yang dapat menghitung secara otomatis
sesuai dengan widget yang kita pilih.
Classification
Disini kami ingin melakukan klasifikasi dengan menggunakan metode Naive Bayes
berikut adalah langkah-langkahnya.
1. Persiapan Dataset
Dataset yang digunakan yaitu diabetes yang kami download dari website
https://www.kaggle.com/datasets/akshaydattatraykhare/diabetes-dataset
2. Select columns
Select columns akan mendapatkan masukan dari data dan features. Dan dapat
menghasilkan keluaran berupa data dan features. Data akan didapat setelah
menghubungkan widget file dengan select columns seperti berikut.
Setelah itu klik dua select columns dan akan menampilkan features dan target variable.
3. Naïve Bayes
Masukkan data dan proprosessor dan menghasilkan model dan learner. Seperti
berikut
4. Test dan Score
Masukkan data, test data, preprosessor dan learner. Menghasilkan prediksi dan
evaluasi hasil seperti berikut.
Clustering
Disini kami ingin melakukan clustering dan berikut adalah langkah-langkahnya.
1. Persiapan Dataset
Dataset yang digunakan yaitu diabetes yang kami download dari website
https://www.kaggle.com/datasets/akshaydattatraykhare/diabetes-dataset
5. Widget Distribusions
Widget Distributions menampilkan distribusi nilai atribut diskrit atau kontinu.
Jika data berisi variabel class, distribusi dapat dikondisikan di class.
Berikut adalah hasil dari distribusions data pregnancies
7. K-Mens
K-mens merupakan salah satu metode clustering yang paling populer dimana
algoritmanya menunjukkan prosedur pengelompokkan K-means.
8. Widget Scatter plot
Penggunaan titik-titik untuk mewakili nilai untuk dua variabel numerik yang
berbeda.
9. KESIMPULAN
10.REFERENSI