Project Big Data

IMPLEMENTASI ORANGE DATA MINING UNTUK
DATASET DIABETES
DISUSUN OLEH
Irsal Fathi Farhat / (0110221146)
Muhammad Fahriza / (0110221147)
Muhammad Salsabil / (0110221178)
Muhammad Farhan Abdillah / (0110221175)
Ridho Fauzi Grafika / (0110221142)
STT TERPADU NURUL FIKRI

PROGRAM STUDI TEKNIK INFORMATIKA
DEPOK, JAWA BARAT
2022
DAFTAR ISI
DAFTAR ISI...............................................................................................................................i
DAFTAR GAMBAR.................................................................................................................ii
ANGGOTA KELOMPOK.......................................................................................................iii
1 BAB I System Request – Course Online Project................................................................4
1.1 Project Sponsor............................................................................................................4
1.2 Business Needs............................................................................................................4
1.3 Business Requirements................................................................................................4
1.4 Business Value............................................................................................................5
1.5 Special Issues or Constraints.......................................................................................5
2 BAB II System Modeling...................................................................................................6
2.1 Use Case Diagram.......................................................................................................6
2.2 Activity Diagram.........................................................................................................7
2.3 Class Diagram.............................................................................................................8
2.4 Squence Diagram.........................................................................................................8
3 BAB III Penutup.................................................................................................................9
DAFTAR PUSTAKA..............................................................................................................10
i
DAFTAR GAMBAR
ii
ANGGOTA KELOMPOK
No NIM Nama Peran
1 0110221146 Irsal Fathi Farhat
2 0110221147 Muhammad Fahriza
3 0110221178 Muhammad Salsabil
4 0110221175 Muhammad Farhan Abdillah
5 0110221142 Ridho Fauzi Grafika
iii
1. LATAR BELAKANG
Diabetes merupakan sekelompok penyakit metabolik yang ditandai dengan hiperglikemia
akibat gangguan sekresi insulin, kerja insulin, atau keduanya. Kumpulan data ini berasal dari
National Institute of Diabetes and Digestive and Kidney Diseases.
2. TUJUAN
Tujuan dari kumpulan data ini adalah untuk memprediksi secara diagnostik apakah seorang
pasien menderita diabetes, berdasarkan pengukuran diagnostik tertentu yang termasuk dalam
kumpulan data. Beberapa batasan ditempatkan pada pemilihan instance ini dari database yang
lebih besar. Secara khusus, semua pasien di sini adalah perempuan berusia minimal 21 tahun
keturunan India Pima.
3. SPESIFIKASI APLIKASI
Tools atau Software yang digunakan pada projek kali ini adalah sebagai berikut:
1. Orange Data Mining
2. Komputer
3. Microsoft Word
4. TIMELINE PROJEK
2 minggu
5. DESAIN PROJEK
Info desain projek misalnya desain database (jika ada), desain antar muka, desain sistem jika
menggunakan software, dll
6. HASIL PENGUJIAN
Aplikasi Orange merupakan aplikasi data mining yang dapat menghitung secara otomatis
sesuai dengan widget yang kita pilih.
 Classification
Disini kami ingin melakukan klasifikasi dengan menggunakan metode Naive Bayes
berikut adalah langkah-langkahnya.
1. Persiapan Dataset
Dataset yang digunakan yaitu diabetes yang kami download dari website
https://www.kaggle.com/datasets/akshaydattatraykhare/diabetes-dataset
2. Select columns
Select columns akan mendapatkan masukan dari data dan features. Dan dapat
menghasilkan keluaran berupa data dan features. Data akan didapat setelah
menghubungkan widget file dengan select columns seperti berikut.
Setelah itu klik dua select columns dan akan menampilkan features dan target variable.
3. Naïve Bayes
Masukkan data dan proprosessor dan menghasilkan model dan learner. Seperti
berikut
4. Test dan Score
Masukkan data, test data, preprosessor dan learner. Menghasilkan prediksi dan
evaluasi hasil seperti berikut.
Dan berikut adalah hasilnya berdasarkan perhitungan yang telah didapatkan.

5. ROC Analysis
ROC Analysis akan didapat dari hasil evaluasi, menggambarkan hubungan
sensifitas dengan spesifikasi terhadap model naïve bayes berupa grafik garis.
 Clustering
Disini kami ingin melakukan clustering dan berikut adalah langkah-langkahnya.
1. Persiapan Dataset
https://www.kaggle.com/datasets/akshaydattatraykhare/diabetes-dataset
2. Widget Data Table

Widget Data Table menerima satu atau beberapa dataset melalui inputnya dan
menyajikannya sebagai spreadsheet. Instance data dapat diurutkan berdasarkan
nilai atribut.
3. Widget select columns

Widget select columns digunakan untuk menyusun sebuah domain data secara
manual.
4. Widget data table

Widget Data Table menerima satu atau beberapa dataset melalui inputnya dan
menyajikannya sebagai spreadsheet. Instance data dapat diurutkan berdasarkan
nilai atribut.
5. Widget Distribusions
Widget Distributions menampilkan distribusi nilai atribut diskrit atau kontinu.
Jika data berisi variabel class, distribusi dapat dikondisikan di class.
Berikut adalah hasil dari distribusions data pregnancies
6. Widget Box Plot

Widget Box Plot menunjukkan distribusi nilai atribut. Merupakan praktik yang
baik untuk memeriksa data baru apa pun dengan widget ini untuk menemukan
anomali dengan cepat, seperti nilai duplikat (mis. gray atau grey), outliers, dan
sejenisnya.
Berikut adalah hasil dari box plot dari pregnancies
7. K-Mens
K-mens merupakan salah satu metode clustering yang paling populer dimana
algoritmanya menunjukkan prosedur pengelompokkan K-means.
8. Widget Scatter plot
Penggunaan titik-titik untuk mewakili nilai untuk dua variabel numerik yang
berbeda.
Dan berikut adalah hasil dari scatter plot.

 Regression
1. Widget file dan data table
https://www.kaggle.com/datasets/akshaydattatraykhare/diabetes-dataset ,Widget Data
Table menerima satu atau beberapa dataset melalui inputnya dan menyajikannya
sebagai spreadsheet. Instance data dapat diurutkan berdasarkan nilai atribut.
2. Linear regression
Dan berikut adalah hasilnya setelah menggunakan widget linear regression
7. EVALUASI SISTEM PROJEK

Info evaluasi hasil
8. KENDALA YANG DIHADAPI
9. KESIMPULAN
10.REFERENSI

Project Big Data

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Project Big Data

Diunggah oleh

Hak Cipta:

Format Tersedia

IMPLEMENTASI ORANGE DATA MINING UNTUK

STT TERPADU NURUL FIKRI

Dan berikut adalah hasilnya berdasarkan perhitungan yang telah didapatkan.

2. Widget Data Table

3. Widget select columns

4. Widget data table

6. Widget Box Plot

Dan berikut adalah hasil dari scatter plot.

Dan berikut adalah hasilnya setelah menggunakan widget linear regression

7. EVALUASI SISTEM PROJEK

Anda mungkin juga menyukai