Perbaikan Nilai DataMining

Dokumen ini menjelaskan tugas analisis data menggunakan metode K-Means dan Naive Bayes pada data riil dari Kaggle terkait industri perbankan. Hasil analisis menunjukkan bahwa model K-Means memiliki presisi dan recall yang tinggi untuk kelas TRUE, tetapi kinerjanya pada kelas FALSE perlu ditingkatkan, sedangkan model Naive Bayes menunjukkan kinerja sempurna dengan presisi dan recall 100% untuk kedua kelas. Kesimpulannya, model Naive Bayes lebih akurat dibandingkan K-Means dalam memprediksi kelas data.

Diunggah oleh

ardy andhika haydar

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

0% menganggap dokumen ini bermanfaat (0 suara)

20 tayangan6 halaman

Perbaikan Nilai DataMining

Diunggah oleh

ardy andhika haydar

Hak Cipta

Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.

Format Tersedia

Unduh sebagai PDF, TXT atau baca online di Scribd

Nama : Ardy Andhika Haydar

Nim : 20210801084
Prodi : Teknik Informatika
Matkul : Data Mining
Tugas
1. Data yang saya gunakan adalah data riil dari web resmi Kaggle yang berhubungan dengan
industry perbankan, https://www.kaggle.com/datasets/brmil07/bank-stock-price Berikut
adalah link resmi dari data yang saya gunakan
2. Saya tidak melakukan “cleansing” dikarenakan data yang saya gunakan ternyata sudah
bersih atau sudah siap untuk digunakan, jadi setelah saya memasukan file ke aplikasi
RapidMiner saya langsung melakukan proses Algoritma dengan metode K-Means dan
Naive Bayes
3. K-Means

- Langkah pertama saya memasukan operator berupa Read CSV yang saya gunakan
untuk memasukan data yang ingin saya gunakan,
- Langkah kedua saya menggunakan Set Role untuk menentukan bagian mana yang ingin
di jadikan Label,
- Langkah ketiga kita masukan operator KNNnya,
- Langkah keempat karna ini sifatnya pengujian maka saya memasukan operator Apply
Model,
- Langkah kelima saya memasukan operator Performance, saya menggunakan
Performance karena KNN merupakan bagian dari klasifikasi,
- Langkah keenam lalu saya menambahkan lagi operator Read CSV dan Set Role karena
ini bersifat Pengujian
- Langkah ketujuh saya menjalankan Process dengan melakukan Run,
- Dibawah ini adalah Hasil dari Run Process tersebut
Dari hasil Run bisa kita simpulkan Bahwa :
- Prediksi TRUE : data true TRUE memiliki 2408 data, dan true FALSE memiliki 43
data,
- Prediksi FALSE : data true TRUE memiliki 4 data, dan true FALSE memiliki 28 data,
- Class Precision : Prediksi TRUE = 98.25% dan Prediksi FALSE = 87.50%
- Class Recall : true TRUE = 99.83% dan true FALSE = 39.44%
4. Naive Bayes

- Langkah pertama saya memasukan operator Read CSV ke dalam Process untuk
memasukan data yang ingin kita analisis,
- Langkah kedua saya memasukan operator Naive Bayes untuk jalur analisisnya,
- Langkah Ketiga saya memasukan operator Validation
- Langkah Kempat kita masuk ke Validation untuk memasukan beberapa operator lagi

- Langkah kelima saya memasukan operator Naive Bayes di dalam validation di kotak
Training,
- Langkah keenam saya memasukan operator Apply Model dan Performance di dalam
validation di kotak Testing
- Langkah ketujuh saya menyambungkan semua operator agar terhubung di dalam
process untuk saya Run
- Dibawah ini adalah hasil Runnya
- Prediksi TRUE : Data true TRUE memiliki 724 data, dan true FALSE 0 data
- Prediksi FALSE : Data true TRUE memiliki 0 data, dan true FALSE 21 data
- Class Precision : Prediksi TRUE = 100.00% dan Prediksi FALSE = 100.00%
- Class Recall : true TRUE = 100.00% dan true FALSE = 100.00%

5. A.) Hasil Interpretasi dari analisa hasil K-Means

- Prediksi TRUE: Model memprediksi kelas TRUE sebanyak 2451 kali. Dari prediksi
tersebut, 2408 di antaranya benar-benar merupakan data yang memiliki label TRUE,
sementara 43 lainnya adalah data yang seharusnya memiliki label FALSE tetapi salah
diprediksi sebagai TRUE oleh model.
- Prediksi FALSE: Model memprediksi kelas FALSE sebanyak 32 kali. Dari prediksi
tersebut, hanya 4 data yang sebenarnya adalah data TRUE yang salah diprediksi
sebagai FALSE, sedangkan 28 data lainnya adalah data yang benar-benar memiliki
label FALSE.
- Precision: Presisi mengukur seberapa akurat model dalam memprediksi suatu kelas.
Presisi untuk kelas TRUE adalah 98.25%, yang berarti dari semua prediksi yang
dilakukan oleh model sebagai TRUE, 98.25% di antaranya benar-benar benar.
Sedangkan presisi untuk kelas FALSE adalah 87.50%, yang berarti dari semua prediksi
yang dilakukan oleh model sebagai FALSE, 87.50% di antaranya benar-benar benar.
- Recall: Recall mengukur seberapa baik model dalam menemukan semua contoh kelas
yang benar. Recall untuk kelas TRUE adalah 99.83%, yang berarti model berhasil
menemukan 99.83% dari semua contoh yang sebenarnya TRUE. Namun, recall untuk
kelas FALSE adalah 39.44%, yang berarti model hanya berhasil menemukan 39.44%
dari semua contoh yang sebenarnya FALSE.
Dengan demikian, model tampaknya memiliki kinerja yang baik dalam memprediksi
kelas TRUE, terlihat dari presisi yang tinggi dan recall yang sangat tinggi. Namun, kinerja
model dalam memprediksi kelas FALSE dapat ditingkatkan karena presisi dan recallnya
lebih rendah dibandingkan dengan kelas TRUE.
B.) Hasil Interpretasi dari analisa hasil Naive Bayers
- Prediksi TRUE: Model memprediksi kelas TRUE sebanyak 724 kali. Dari prediksi
tersebut, semua data (100%) yang sebenarnya memiliki label TRUE berhasil diprediksi
dengan benar. Tidak ada satupun dari data yang seharusnya memiliki label FALSE
yang salah diprediksi sebagai TRUE oleh model.
- Prediksi FALSE: Model memprediksi kelas FALSE sebanyak 21 kali. Dari prediksi
tersebut, semua data (100%) yang sebenarnya memiliki label FALSE berhasil
diprediksi dengan benar. Tidak ada satupun dari data yang seharusnya memiliki label
TRUE yang salah diprediksi sebagai FALSE oleh model.
- Precision: Presisi untuk kedua kelas, baik TRUE maupun FALSE, adalah 100%. Ini
berarti bahwa dari semua prediksi yang dilakukan oleh model sebagai TRUE atau
FALSE, tidak ada yang salah.
- Recall: Recall untuk kedua kelas, TRUE dan FALSE, juga adalah 100%. Ini berarti
model berhasil menemukan semua contoh yang sebenarnya merupakan TRUE dan
FALSE.

Dari hasil ini, dapat disimpulkan bahwa model memiliki kinerja yang sangat baik dalam
memprediksi kelas baik TRUE maupun FALSE. Dengan presisi dan recall mencapai 100%
untuk kedua kelas, model ini tampaknya sangat akurat dalam mengidentifikasi data sesuai
dengan kelasnya.

Anda mungkin juga menyukai

Klasifikasi Data Spotify dengan Naive Bayes
Belum ada peringkat
Klasifikasi Data Spotify dengan Naive Bayes
11 halaman
Penggunaan Rapid Miner
Belum ada peringkat
Penggunaan Rapid Miner
11 halaman
Analisis Pemilu dan Model Prediksi
Belum ada peringkat
Analisis Pemilu dan Model Prediksi
26 halaman
Algoritma Data Mining: Naïve Bayes, SMO, IBK, J48
Belum ada peringkat
Algoritma Data Mining: Naïve Bayes, SMO, IBK, J48
22 halaman
Model Klasifikasi Data Science
Belum ada peringkat
Model Klasifikasi Data Science
51 halaman
Prediksi Karyawan dengan Decision Tree
Belum ada peringkat
Prediksi Karyawan dengan Decision Tree
5 halaman
Klasifikasi Banjir dengan K-Means dan RapidMiner
Belum ada peringkat
Klasifikasi Banjir dengan K-Means dan RapidMiner
11 halaman
Prediksi Kelulusan Mahasiswa Naïve Bayes
Belum ada peringkat
Prediksi Kelulusan Mahasiswa Naïve Bayes
12 halaman
Uts Penambangan Data
Belum ada peringkat
Uts Penambangan Data
10 halaman
c4.5 KNN
Belum ada peringkat
c4.5 KNN
26 halaman
Klasifikasi Naive Bayes dalam Data Mining
Belum ada peringkat
Klasifikasi Naive Bayes dalam Data Mining
31 halaman
Analisis K-NN vs Naïve Bayes Mobil
Belum ada peringkat
Analisis K-NN vs Naïve Bayes Mobil
6 halaman
Model Prediktif Titanic dengan RapidMiner
Belum ada peringkat
Model Prediktif Titanic dengan RapidMiner
22 halaman
Tutorial Rapidminer 2
Belum ada peringkat
Tutorial Rapidminer 2
51 halaman
SOAL UTS ML INF - AhmadTH+Farida
Belum ada peringkat
SOAL UTS ML INF - AhmadTH+Farida
8 halaman
Laporan Klasifikasi Data Science 2023
Belum ada peringkat
Laporan Klasifikasi Data Science 2023
12 halaman
Naive Bayes: Klasifikasi dan Aplikasi
Belum ada peringkat
Naive Bayes: Klasifikasi dan Aplikasi
47 halaman
Pemodelan Data Mining dengan Naive Bayes
Belum ada peringkat
Pemodelan Data Mining dengan Naive Bayes
9 halaman
Prediksi Kelulusan Mahasiswa Naive Bayes
Belum ada peringkat
Prediksi Kelulusan Mahasiswa Naive Bayes
8 halaman
Analisis Model Gaussian Naive Bayes
Belum ada peringkat
Analisis Model Gaussian Naive Bayes
4 halaman
Analisis Sentimen dan Klasifikasi Data
Belum ada peringkat
Analisis Sentimen dan Klasifikasi Data
34 halaman
Naive Bayes: Klasifikasi dan Penerapan
Belum ada peringkat
Naive Bayes: Klasifikasi dan Penerapan
31 halaman
Klasifikasi dan Aturan Asosiasi Data Housing
Belum ada peringkat
Klasifikasi dan Aturan Asosiasi Data Housing
4 halaman
Uts Data Minig
Belum ada peringkat
Uts Data Minig
5 halaman
Proses Bisnis Pemesanan Online dan Data Mining
Belum ada peringkat
Proses Bisnis Pemesanan Online dan Data Mining
10 halaman
Memahami Siklus ML dan Evaluasi Model
Belum ada peringkat
Memahami Siklus ML dan Evaluasi Model
32 halaman
K-Nearest Neighbors: Konsep dan Praktik
Belum ada peringkat
K-Nearest Neighbors: Konsep dan Praktik
14 halaman
Klasifikasi Kelayakan Kredit dengan Data Mining
Belum ada peringkat
Klasifikasi Kelayakan Kredit dengan Data Mining
10 halaman
Panduan Praktikum Klasifikasi Data Mining
Belum ada peringkat
Panduan Praktikum Klasifikasi Data Mining
10 halaman
Klasifikasi Keaslian Uang Kertas dengan k-NN
Belum ada peringkat
Klasifikasi Keaslian Uang Kertas dengan k-NN
3 halaman
DMDW#9
Belum ada peringkat
DMDW#9
15 halaman
Contoh Isi Dari Bab 2 Algoritma Naïve Bayes
Belum ada peringkat
Contoh Isi Dari Bab 2 Algoritma Naïve Bayes
4 halaman
Jawaban Uts Data Mining
Belum ada peringkat
Jawaban Uts Data Mining
4 halaman
Data Mining 044368236pdf
Belum ada peringkat
Data Mining 044368236pdf
3 halaman
Data Mining
Belum ada peringkat
Data Mining
8 halaman
4.33.22.0.12 - Laksamana Dzikri Al Jauzi - 2 Split Dataset
Belum ada peringkat
4.33.22.0.12 - Laksamana Dzikri Al Jauzi - 2 Split Dataset
12 halaman
Klasifikasi Naive Bayes dalam Machine Learning
Belum ada peringkat
Klasifikasi Naive Bayes dalam Machine Learning
31 halaman
Panduan Lengkap Analisis Sentimen Teks
Belum ada peringkat
Panduan Lengkap Analisis Sentimen Teks
4 halaman
Akbar - UTS-Data Mining.
Belum ada peringkat
Akbar - UTS-Data Mining.
4 halaman
Simulasi Naive Bayes di RapidMiner
Belum ada peringkat
Simulasi Naive Bayes di RapidMiner
7 halaman
Prediksi Naïve Bayes dalam Data Mining
Belum ada peringkat
Prediksi Naïve Bayes dalam Data Mining
11 halaman
Klasifikasi dan Prediksi dalam Data Mining
Belum ada peringkat
Klasifikasi dan Prediksi dalam Data Mining
9 halaman
Maetri Rapid Miner
Belum ada peringkat
Maetri Rapid Miner
4 halaman
Naqa Arva Derina 231011400221 Uts Data Mining
Belum ada peringkat
Naqa Arva Derina 231011400221 Uts Data Mining
12 halaman
UAS Data Mining - Akbar - 12110001
Belum ada peringkat
UAS Data Mining - Akbar - 12110001
7 halaman
Evaluasi Algoritma Klasifikasi
Belum ada peringkat
Evaluasi Algoritma Klasifikasi
9 halaman
Analisis Pemasaran Data Klien Bank
Belum ada peringkat
Analisis Pemasaran Data Klien Bank
17 halaman
Naive Bayes & K-Means: Panduan Lengkap
Belum ada peringkat
Naive Bayes & K-Means: Panduan Lengkap
7 halaman
Navy Bayes Pert
Belum ada peringkat
Navy Bayes Pert
6 halaman
Metode Naive Bayes Dengan Pendekatan Distribusi Gauss Untuk Klasifikasi Peminatan Peserta Didik
Belum ada peringkat
Metode Naive Bayes Dengan Pendekatan Distribusi Gauss Untuk Klasifikasi Peminatan Peserta Didik
7 halaman
JURNAL
Belum ada peringkat
JURNAL
9 halaman
Analisis Prediktif dalam Manajemen Keuangan
Belum ada peringkat
Analisis Prediktif dalam Manajemen Keuangan
12 halaman
Pemodelan Data dengan Naive Bayes
Belum ada peringkat
Pemodelan Data dengan Naive Bayes
2 halaman
Penerapan Supervised dan Unsupervised di Orange
100% (1)
Penerapan Supervised dan Unsupervised di Orange
4 halaman
Muhammad Hanif SYa'Bani - 09011282227049 - UTS ML
Belum ada peringkat
Muhammad Hanif SYa'Bani - 09011282227049 - UTS ML
18 halaman
UAS - Raodotul Irfan 11230067
Belum ada peringkat
UAS - Raodotul Irfan 11230067
4 halaman
Klasifikasi Data Bidikmisi dengan Naive Bayes dan Decision Tree
Belum ada peringkat
Klasifikasi Data Bidikmisi dengan Naive Bayes dan Decision Tree
5 halaman