3 Komparasi Metode Data Mining K- Bagian pembahasan permasalahan dalam Bagian pembahasan metode Berdasarkan hasil pengujian dan analisis,
Nearest Neighbor Dengan Naïve penelitian ini adalah perbandingan penelitian ini mencakup metode K-Nearest Neighbor (K-NN)
Bayes Untuk Klasifikasi Kualitas Air antara metode K-Nearest Neighbor (K- perbandingan antara memberikan akurasi yang lebih tinggi
Bersih (Studi Kasus PDAM Tirta NN) dan Naïve Bayes dalam klasifikasi metode K-Nearest dibandingkan dengan metode Naïve
Kencana Kabupaten Jombang) kualitas air bersih. Kedua metode ini Neighbor (K-NN) dan Bayes dalam klasifikasi kualitas air
(Rahman et al., 2018) digunakan untuk mengklasifikasikan Naïve Bayes dalam bersih. Pada pengujian dengan variasi
data kualitas air bersih berdasarkan klasifikasi kualitas air nilai k, ditemukan bahwa nilai k=3
atribut-atribut seperti Coliform, bersih. Dalam penelitian memberikan akurasi tertinggi sebesar
Escherichia Coli, Mangan, TDS, dan ini, kedua metode tersebut 90.73%. Sedangkan pada pengujian
Khlorida. digunakan untuk berdasarkan percentage split, metode K-
mengklasifikasikan data NN memiliki akurasi rata-rata sebesar
Metode K-NN adalah metode klasifikasi kualitas air bersih 82.45%, sedangkan metode Naïve Bayes
yang berdasarkan pada jarak antara data berdasarkan atribut-atribut memiliki akurasi rata-rata sebesar
yang akan diklasifikasikan dengan data seperti Coliform, 72.52%. Begitu juga pada pengujian
training. Metode ini mencari k-nearest Escherichia Coli, berdasarkan jumlah data training,
neighbors terdekat dari data yang akan Mangan, TDS, dan metode K-NN memiliki akurasi rata-rata
diklasifikasikan dan Khlorida. sebesar 83.32%, sedangkan metode
mengklasifikasikannya berdasarkan Naïve Bayes memiliki akurasi rata-rata
mayoritas kelas dari tetangga Metode K-NN adalah metode sebesar 70.91%.
terdekatnya. klasifikasi yang
berdasarkan pada jarak Berdasarkan hasil akurasi yang didapatkan
Sementara itu, metode Naïve Bayes adalah antara data yang akan dari seluruh pengujian, dapat
metode klasifikasi yang berdasarkan diklasifikasikan dengan disimpulkan bahwa metode K-NN
pada teorema Bayes. Metode ini data training. Metode ini merupakan metode yang lebih baik
mengasumsikan bahwa setiap atribut mencari k-nearest dalam membantu melakukan klasifikasi
dalam data independen satu sama lain, neighbors terdekat dari terhadap kualitas air bersih dalam
sehingga dapat menghitung probabilitas data yang akan penelitian ini. Metode K-NN
kelas berdasarkan probabilitas atribut- diklasifikasikan dan memberikan akurasi rata-rata sebesar
atribut yang ada. mengklasifikasikannya 82.89%, sedangkan metode Naïve Bayes
berdasarkan mayoritas memberikan akurasi rata-rata sebesar
Dalam penelitian ini, dilakukan perbandingan kelas dari tetangga 72.52%. Oleh karena itu, metode K-NN
antara kedua metode tersebut dalam hal terdekatnya. Dalam dapat digunakan sebagai metode yang
akurasi klasifikasi kualitas air bersih. penelitian ini, dilakukan lebih efektif dan efisien dalam
Hasil pengujian dan analisis pengujian dengan variasi klasifikasi kualitas air bersih
menunjukkan bahwa kedua metode nilai k untuk menentukan menggunakan data mining.
memiliki akurasi yang cukup tinggi, nilai k yang memberikan
namun terdapat perbedaan dalam akurasi akurasi terbaik. Referensi: Gambar 1. Diagram Metode
yang dihasilkan. Oleh karena itu, Tahapan Penelitian 2.1. Pengumpulan
penelitian ini bertujuan untuk Sementara itu, metode Naïve Data Data yang digunakan dalam
menentukan metode mana yang lebih Bayes adalah metode penelitian merupakan data kualitas air
baik dalam membantu melakukan klasifikasi yang bersih yang diperoleh dari Kantor
klasifikasi terhadap kualitas air bersih. berdasarkan pada teorema PDAM Tirta Kencana Kabupaten
Bayes. Metode ini Jombang dalam jangka waktu tahun
Referensi: Gambar 1. Diagram Metode mengasumsikan bahwa 2016 hingga tahun 2017. Contoh data
Tahapan Penelitian 2.1. Pengumpulan setiap atribut dalam data klasifikasi kualitas air bersih akan
Data Data yang digunakan dalam independen satu sama ditunjukan pada Tabel 1. Tabel 1.
penelitian merupakan data kualitas air lain, sehingga dapat Contoh Data Klasifikasi Air Bersih No.
bersih yang diperoleh dari Kantor menghitung probabilitas Coliform E. Coli Mangan TDS Khlorida
PDAM Tirta Kencana Kabupaten kelas berdasarkan Kelas
Jombang dalam jangka waktu tahun probabilitas atribut-atribut
2016 hingga tahun 2017. Contoh data yang ada. Dalam
klasifikasi kualitas air bersih akan penelitian ini, dilakukan
ditunjukan pada Tabel 1. Tabel 1. pengujian dengan
Contoh Data Klasifikasi Air Bersih No. menggunakan metode 10-
Coliform E fold cross validation
untuk mengukur akurasi
dari metode Naïve Bayes.
4 Penerapan Clustering Pada Penduduk Bagian pembahasan permasalahan dalam Bagian pembahasan metode Hasil penelitian menunjukkan bahwa analisis
Yang Mempunyai Keluhan penelitian ini adalah keluhan kesehatan penelitian ini clustering menggunakan algoritma K-
Kesehatan Dengan Datamining K- di antara penduduk di Indonesia. menggunakan data means berhasil membagi penduduk
Means(Rofiqo et al., 2018) Penelitian ini bertujuan untuk mining, khususnya dengan keluhan kesehatan di Indonesia
menggunakan algoritma clustering, algoritma clustering K- menjadi tiga kelompok: keluhan
khususnya algoritma K-means, untuk means. Data mining kesehatan tinggi, keluhan kesehatan
mengelompokkan jumlah orang dengan adalah metode sedang, dan keluhan kesehatan rendah.
keluhan kesehatan di Indonesia. Data pengolahan data untuk Data centroid untuk setiap kelompok
yang digunakan dalam penelitian ini menemukan pola dihitung, dengan data centroid untuk
dikumpulkan dari dokumen populasi tersembunyi dan membuat keluhan kesehatan tinggi adalah 37,48,
provinsi dengan keluhan kesehatan yang keputusan di masa depan untuk keluhan kesehatan sedang adalah
diproduksi oleh Badan Pusat Statistik berdasarkan hasilnya. 27,08, dan untuk keluhan kesehatan
Nasional. Data tersebut mencakup Algoritma K-means rendah adalah 14,89.
informasi dari tahun 2013-2017 dan adalah algoritma partisi
mencakup semua 34 provinsi di yang memisahkan data ke Berdasarkan analisis clustering ini, penelitian
Indonesia. dalam kelompok- mengidentifikasi 7 provinsi dengan
kelompok yang berbeda. keluhan kesehatan tinggi, 18 provinsi
Proses clustering membagi data menjadi tiga dengan keluhan kesehatan sedang, dan 9
kelompok: keluhan kesehatan tinggi, Data yang digunakan dalam provinsi dengan keluhan kesehatan
keluhan kesehatan sedang, dan keluhan penelitian ini rendah. Informasi ini dapat digunakan
kesehatan rendah. Data centroid untuk dikumpulkan dari oleh pemerintah untuk memprioritaskan
setiap kelompok dihitung, dengan data dokumen populasi dengan dan meningkatkan layanan kesehatan
centroid untuk keluhan kesehatan tinggi keluhan kesehatan di masyarakat di daerah dengan keluhan
adalah 37,48, untuk keluhan kesehatan setiap provinsi, yang kesehatan tinggi. Dengan mengatasi
sedang adalah 27,08, dan untuk keluhan diproduksi oleh Badan keluhan kesehatan dan meningkatkan
kesehatan rendah adalah 14,89. Pusat Statistik Nasional. layanan kesehatan, pemerintah dapat
Berdasarkan analisis clustering ini, Data tersebut diproses dan bekerja menuju pencapaian hak atas
penelitian mengidentifikasi 7 provinsi dikelompokkan lingkungan yang sehat dan akses ke
dengan keluhan kesehatan tinggi, 18 menggunakan algoritma layanan kesehatan berkualitas bagi
provinsi dengan keluhan kesehatan K-means. Proses semua individu, seperti yang dinyatakan
sedang, dan 9 provinsi dengan keluhan clustering membagi data dalam Undang-Undang Kesehatan
kesehatan rendah. menjadi tiga kelompok: Indonesia.
keluhan kesehatan tinggi,
Informasi ini dapat digunakan sebagai keluhan kesehatan sedang, Temuan dari penelitian ini memberikan
masukan bagi pemerintah untuk dan keluhan kesehatan wawasan berharga tentang distribusi
memprioritaskan dan meningkatkan rendah. keluhan kesehatan di berbagai provinsi
layanan kesehatan masyarakat di daerah di Indonesia. Informasi ini dapat
dengan keluhan kesehatan tinggi, Analisis dari kelompok- membimbing para pembuat kebijakan
dengan tujuan akhir membuat penduduk kelompok tersebut dan penyedia layanan kesehatan dalam
Indonesia lebih sehat dan mengurangi membantu mengimplementasikan intervensi yang
keluhan kesehatan. Dengan mengatasi mengidentifikasi provinsi- ditargetkan dan perbaikan dalam layanan
keluhan kesehatan dan meningkatkan provinsi dengan tingkat kesehatan untuk mengatasi kebutuhan
layanan kesehatan masyarakat, keluhan kesehatan yang khusus setiap wilayah.
pemerintah dapat bekerja menuju berbeda. Informasi ini Undang-Undang Kesehatan Indonesia, Pasal
pencapaian hak atas lingkungan yang dapat digunakan oleh 1, 6, 7, 8 Komik, Volume 2, Nomor 1,
sehat dan akses ke layanan kesehatan pemerintah untuk Oktober 2018
berkualitas bagi semua individu, seperti memprioritaskan dan
yang dinyatakan dalam Undang-Undang meningkatkan layanan
Kesehatan Indonesia. kesehatan masyarakat di
daerah dengan keluhan
Secara keseluruhan, penelitian ini kesehatan tinggi. Dengan
menekankan pentingnya data mining dan mengatasi keluhan
algoritma clustering dalam menganalisis kesehatan dan
keluhan kesehatan dan meningkatkan layanan
kesehatan, pemerintah
dapat bekerja menuju
pencapaian hak atas
lingkungan yang sehat
dan akses ke layanan
kesehatan berkualitas bagi
semua individu, seperti
yang dinyatakan dalam
Undang-Undang
Kesehatan Indonesia.
Secara keseluruhan,
penggunaan data mining
dan algoritma K-means
dalam penelitian ini
memberikan wawasan
berharga tentang
distribusi keluhan
kesehatan di berbagai
provinsi di Indonesia.
Informasi ini dapat
membimbing para
pembuat kebijakan dan
penyedia layanan
kesehatan dalam
mengimplementasikan
intervensi yang
ditargetkan dan perbaikan
dalam layanan kesehatan
untuk mengatasi
kebutuhan khusus setiap
wilayah.
Hibah Pemasangan Air
Minum, vol. 1, no. 3
5 PENERAPAN DATA MINING UNTUK Pada penelitian ini, permasalahan yang ingin Pada penelitian ini, metode Hasil penelitian ini menunjukkan bahwa
PENGELOLAAN DATA REKAM dipecahkan adalah efisiensi dan penelitian yang digunakan penerapan metode data mining dengan
MEDIS MENGGUNAKAN efektivitas pengelolaan data rekam adalah kombinasi antara menggunakan metode k-means
METODE K-MEANS medis pasien di Rumah Sakit Royal library research dan field clustering dapat membantu dalam
CLUSTERING PADA RUMAH Prima Medan. Data rekam medis yang research. Library research pengelolaan data rekam medis pasien di
SAKIT ROYAL PRIMA sangat besar dan kompleks tersebut dilakukan untuk Rumah Sakit Royal Prima Medan.
MEDAN(Purba et al., 2023) mencakup informasi tentang pasien, mengumpulkan informasi Dalam penelitian ini, data rekam medis
diagnosis, pengobatan, dan riwayat dan data yang berkaitan pasien berhasil dikelompokkan menjadi
medis lainnya. Pengelolaan data rekam dengan permasalahan 4 cluster berdasarkan jenis kelamin dan
medis yang efisien dan efektif sangat yang akan dipecahkan. jenis perawatan yang sedang dirawat.
penting untuk meningkatkan kualitas Sementara itu, field
layanan kesehatan, pengambilan research dilakukan Cluster 1 terdiri dari 18217 pasien yang
keputusan yang tepat, dan penelitian dengan pendekatan menderita penyakit seperti Pelayanan
medis. kualitatif, yaitu dengan Gawat Darurat, Orthopedi, Obgyn,
melakukan pengamatan Penyakit Dalam, Paru-Paru,
langsung di Rumah Sakit NICU/PISU, Penyakit Jantung,
Royal Prima Medan. Perinatologi, Neonatal dan Tumbuh
Kembang, Onkologi Kebidanan. Cluster
Data yang digunakan dalam 2 terdiri dari 1016 pasien dengan
penelitian ini berasal dari karakteristik yang berbeda dari cluster 1.
data rekam medis pasien Cluster 3 terdiri dari 396 pasien dengan
yang terkumpul di Rumah jenis perawatan yang berbeda seperti
Sakit Royal Prima Medan. Bedah Onkologi, Bedah Digestif, Bedah
Dataset ini terdiri dari 5 Saraf, Bedah Umum, Bedah Plastik,
kolom dan 19936 baris, Bedah Syaraf, Endokrin, Bedah, dan
yang mencakup informasi Bedah Orthopedi. Cluster 4 terdiri dari
tentang pasien yang 307 pasien dengan jenis perawatan
sedang dirawat. seperti Urologi, THT, Umum, Saraf, dan
Reumatologi.
Selanjutnya, dalam penelitian
ini diterapkan metode data Dengan adanya pengelompokan ini, Rumah
mining dengan Sakit Royal Prima Medan dapat
menggunakan metode k- meningkatkan efisiensi dalam
means clustering. Metode pengelolaan data rekam medis pasien.
ini digunakan untuk Informasi yang diperoleh dari hasil
mengelompokkan data clustering ini dapat digunakan untuk
rekam medis pasien pengambilan keputusan yang lebih baik
berdasarkan karakteristik dalam pelayanan kesehatan, penelitian
yang sama, seperti jenis medis, dan penangkalan sumber
perawatan yang sedang penyakit.
dirawat.
6 Clustering Tenaga Kesehatan Pada bagian permasalahan, penelitian ini Pada bagian metode penelitian, Pada bagian pembahasan hasil, penelitian ini
Berdasarkan Kecamatan di mengidentifikasi masalah kesehatan penelitian ini menghasilkan tiga cluster berdasarkan
Kabupaten Karawang Menggunakan yang ada di Kabupaten Karawang, yaitu menggunakan metode jumlah tenaga kesehatan di Kabupaten
Algoritma K-Means(Sitinjak et al., minimnya tenaga kesehatan pada setiap Knowledge Discovery in Karawang. Cluster pertama terdiri dari
2022) wilayah. Masalah ini dapat Database (KDD) untuk 24 kecamatan dengan jumlah tenaga
menyebabkan kesulitan bagi masyarakat menganalisis data kesehatan rendah, seperti Pangkalan,
di kecamatan tersebut untuk hidup sehat kesehatan di Kabupaten Tegalwaru, Ciampel, dan lainnya.
dan mengobati penyakitnya. Oleh karena Karawang. Tahapan dari Cluster kedua terdiri dari empat
itu, penelitian ini bertujuan untuk metode KDD yang kecamatan dengan jumlah tenaga
melakukan pengelompokan terhadap digunakan meliputi: kesehatan sedang, seperti Klari,
kecamatan yang memiliki tenaga Cikampek, Jatisari, dan Karawang
kesehatan yang masih kurang sehingga 1. Data Selection: Data tenaga Timur. Sedangkan cluster ketiga terdiri
data tersebut dapat digunakan untuk kesehatan di Kabupaten dari dua kecamatan dengan jumlah
peningkatan kualitas kesehatan. Karawang yang diperoleh tenaga kesehatan terbanyak, yaitu
dari sumber yang Telukjambe Timur dan Karawang Barat.
Referensi: Pembangunan di sektor kesehatan terpercaya dipilih untuk
merupakan salah satu upaya pemenuhan digunakan dalam Hasil tersebut menunjukkan bahwa masih
hak dasar rakyat, yaitu hak untuk penelitian ini. terdapat beberapa kecamatan di
memperoleh pelayanan kesehatan. Hal Kabupaten Karawang yang memiliki
ini menjelaskan bahwa pemerintah 2. Pre-Processing: Tahap ini jumlah tenaga kesehatan yang rendah.
memiliki tugas dan tanggung jawab melibatkan pembersihan Hal ini dapat menjadi acuan bagi
untuk mencari dan melaksanakan upaya- data, seperti menghapus pemerintah untuk mengevaluasi dan
upaya pembangunan di sektor kesehatan duplikasi data, menangani meningkatkan jumlah tenaga kesehatan
sehingga tuntutan UUD 1945 dapat missing value, dan yang sesuai standar agar masyarakat
terpenuhi dan tujuan pembangunan memeriksa konsistensi dapat terjamin kesehatannya dan dapat
nasional di sektor kesehatan yaitu data. menjalani kehidupan yang sejahtera.
“meningkatkan derajat kesehatan
masyarakat yang setinggi-tingginya” 3. Data Transformation: Data Selain itu, penelitian ini juga menggunakan
dapat tercapai. Puskesmas merupakan akan mengalami parameter Davies Blouldin Index (DBI)
fasilitas pelayanan kesehatan yang transformasi sebelum dan Avg. within centroid distance untuk
menyelenggarakan upaya kesehatan dilakukan data mining, mengukur kinerja atau akurasi algoritma
masyarakat dan upaya perseorangan agar dapat sesuai dengan K-means. Nilai DBI yang rendah
tingkat pertama dengan mengutamakan algoritma dan tools yang menunjukkan bahwa cluster-cluster yang
upaya promotif dan preventif untuk digunakan dalam dihasilkan memiliki kemiripan antar data
mencapai derajat kesehatan masyarakat. pengolahan data. dalam satu cluster yang tinggi. Hal ini
Tenaga kesehatan yang tidak tercukupi menunjukkan bahwa algoritma K-means
di beberapa Kecamatan yang ada di 4. Data Mining: Pada tahap ini, yang digunakan dalam penelitian ini
Karawang akan membuat masyarakat di dilakukan proses dapat memberikan hasil cluster yang
Kecamatan tersebut kesulitan untuk pengolahan data baik.
hidup sehat dan mengobati penyakitnya. menggunakan algoritma
Seperti contoh di saat pandemi awal K-means clustering untuk Referensi: Gambar 4 Hasil DBI dan Avg.
jumlah pasien yang sakit lebih banyak mengelompokkan data ke Within Centroid Distance T ABEL 7 H
dari pada tenaga kesehatan yang dalam cluster-cluster yang ASIL C ENTROID A KHIR Atribut
menangani, dampaknya tenaga memiliki kesamaan. Cluster 0 Cluster 1 Cluster 2 Total
kesehatan lelah dan angka covidnya naik 51.625 619.1667 5057 Jumlah 999 394
kembali. Jumlah e-ISSN: 2548-6861 5. Knowledge 15 IV. KESIMPULAN Penerapan
hakekatnya adalah penyelenggaraan Interpretation/Evaluation: algoritma K-Means Clustering
upaya kesehatan untuk mencapai Tahap ini melibatkan menggunakan tools Rapidminer,
kemampuan interpretasi dan evaluasi menghasilkan 3 cluster dengan nilai DBI
hasil dari data mining, sebesar -0.370, yaitu dengan cluster 1
sehingga hasil yang dengan jumlah tenaga kesehatan rendah
didapatkan dapat sebanyak 24 yaitu
dijadikan informasi yang
berguna.
1 Analisis Komparasi Metode Klasifikasi Pada penelitian ini, permasalahan yang Metode penelitian yang Dalam penelitian ini, dilakukan reduksi
Data Mining dan Reduksi Atribut dihadapi adalah proses diagnosa digunakan dalam dimensi menggunakan metode Principal
Pada Data Set Penyakit penyakit jantung yang kompleks karena penelitian ini adalah Component Analysis (PCA) untuk
Jantung(Utomo & Mesran, 2020) keterkaitan yang kompleks antara metode Principal mengatasi kompleksitas dataset penyakit
atribut-atribut penyakit jantung. Oleh Component Analysis jantung yang memiliki 57 jenis atribut.
karena itu, perlu diketahui atribut utama (PCA) untuk mereduksi Metode PCA digunakan untuk
yang digunakan sebagai proses dimensi data clustering. mereduksi dimensi data clustering tanpa
pengambilan keputusan atau proses PCA merupakan pengawasan teknik. Setelah dilakukan
klasifikasi pada penyakit jantung. pendekatan seleksi fitur reduksi dimensi, dilakukan
untuk pengurangan perbandingan tingkat akurasi
Selain itu, dataset yang digunakan dalam dimensi tanpa menggunakan algoritma C5.0 dan Naïve
penelitian ini memiliki 57 jenis atribut, pengawasan teknik. Bayes Classifier (NBC).
sehingga perlu dilakukan reduksi untuk Metode ini digunakan
mempersingkat proses diagnosa. untuk mengurangi Hasil penelitian menunjukkan bahwa
Reduksi dilakukan menggunakan kompleksitas dataset penggunaan metode PCA dalam
metode Principal Component Analysis penyakit jantung yang mereduksi dimensi dataset penyakit
(PCA). memiliki 57 jenis atribut. jantung dapat mempermudah proses
diagnosa. Selain itu, hasil perbandingan
Namun, metode PCA memerlukan masukan Selain itu, dalam penelitian ini tingkat akurasi menunjukkan bahwa
data yang mempunyai sifat zero-mean juga dilakukan algoritma C5.0 memiliki tingkat akurasi
pada setiap fiturnya. Sifat zero-mean perbandingan tingkat yang lebih baik dibandingkan dengan
pada setiap fitur data bisa didapatkan akurasi menggunakan Naïve Bayes Classifier (NBC).
dengan mengurangkan semua nilai algoritma C5.0 dan
dengan rata-ratanya. algoritma Naïve Bayes Dengan demikian, penelitian ini memberikan
Classifier (NBC). pemahaman yang lebih baik tentang
Dengan adanya permasalahan tersebut, Algoritma C5.0 proses diagnosa penyakit jantung dan
penelitian ini melakukan perbandingan merupakan salah satu memberikan hasil yang lebih akurat
tingkat akurasi menggunakan algoritma teknik klasifikasi dalam klasifikasi penyakit jantung
C5.0 dan algoritma Naïve Bayes datamining yang menggunakan metode PCA dan
Classifier (NBC). digunakan untuk algoritma C5.0.
membangun model
berdasarkan data latih dan
mengklasifikasikan data
baru. Sedangkan
algoritma Naïve Bayes
Classifier (NBC) adalah
algoritma klasifikasi
probabilistik yang
berdasarkan pada teorema
Bayes.
1 Hybrid Deep Learning and Optimization The problem addressed in this journal is the The methodology used in this The proposed hybrid algorithm for breast
Algorithm for Breast Cancer prediction of breast cancer using data journal article involves a cancer prediction achieved impressive
Prediction Using Data mining techniques. The authors hybrid algorithm results compared to prior methods. The
Mining(Rajasekaran & highlight the need for intelligent early approach for breast cancer performance metrics of the proposed
Shanmugapriya, 2023) prediction methods to increase the prediction. The algorithm method include a precision of 98.51%,
survival rate of patients. They also includes the following recall of 98.65%, accuracy of 97.88%,
mention that the accuracy of prediction steps: and F1 score of 98.32%. Additionally,
is reduced due to the imbalanced nature the error evaluation metrics of RMSE
of the data with unequal distribution of Dataset Description: The and MAE were 1.006 and 1.986,
positive and negative classes. To dataset used for breast respectively. These results demonstrate
overcome this issue, the authors propose cancer prediction is the effectiveness of the optimized
a hybrid algorithm that combines Linear obtained from the Breast AERNN model in breast cancer
Discriminant Analysis (LDA), Wild Cancer UCI repository, prediction.
Horse Optimization (WHO), and specifically the Wisconsin
Advanced Elman Recurrent Neural Data set for Diagnostic
Network (AERNN) methods Breast Cancer (WDBC).
.. A. T., .. H., .. A. A., .. E.-S. M., & Eid, M. M. (2023). A Comparative Analysis of Methods for Detecting and Diagnosing Breast Cancer Based on Data Mining. Journal of
Artificial Intelligence and Metaheuristics, 4(2), 08–17. https://doi.org/10.54216/jaim.040201
Amriana, A., Joefrie, Y. Y., & Meidji, F. N. (2019). Penerapan Data Mining Untuk Pengelompokan Hasil Diagnosa Penyakit Pasien Pengguna BPJS Kesehatan (Studi Kasus Pada
Rsud Undata Palu). ScientiCO : Computer Science and Informatics Journal, 1(1), 51. https://doi.org/10.22487/j26204118.2018.v1.i1.11901
Cahyana, N., & Aribowo, A. (2018). Metode Data Mining K-Means Untuk Klasterisasi Data Penanganan Dan Pelayanan Kesehatan Masyarakat. Seminar Nasional Informatika
Medis, 5, 24–31.
dos Santos, B. S., Steiner, M. T. A., Fenerich, A. T., & Lima, R. H. P. (2019). Data mining and machine learning techniques applied to public health problems: A bibliometric
analysis from 2009 to 2018. Computers and Industrial Engineering, 138, 106120. https://doi.org/10.1016/j.cie.2019.106120
Ghorbian, M. (2023). Analyzing the Impact of Epidermoid and Adeno Tissue on Cancer Incidence Whit a Data Mining Approach. International Journal of Clinical and Medical
Education Research, 2(5). https://doi.org/10.33140/ijcmer.02.05.05
Guo, A., Jiang, A., Lin, J., & Li, X. (2020). Data mining algorithms for bridge health monitoring: Kohonen clustering and LSTM prediction approaches. Journal of
Supercomputing, 76(2), 932–947. https://doi.org/10.1007/s11227-019-03045-8
Haditsah, A. (2018). Klasifikasi Masyarakat Miskin menggunakan Metode Naïve Bayes. ILKOM Jurnal Ilmiah, 10(2), 160–165.
M. Gharib, S., Makram Labib, N., & A. Hodhod, R. (2023). Breast Cancer Detection by Using Data Mining, a Review Study. (30 ,مجلة الجمعیة المصریة لنظم المعلومات وتکنولوجیا الحاسبات
109–104 ,)30. https://doi.org/10.21608/jstc.2023.291254
Nassar, H. B. (2023). Classification for Imbalanced Breast Cancer Dataset Using Resampling Methods. Ijcsns, February. https://doi.org/10.22937/IJCSNS.2023.23.1.12
Oluwaseun, A., & Chaubey, M. S. (2019). Data Mining Classification Techniques on the analysis of student performance. Global Scientific Journal, 7(April), 79–95.
https://doi.org/10.11216/gsj.2019.04.19671
Purba, W., Sembiring, G. A., Saputra, A., Turnip, M. T., Jua, B., Manihuruk, I., Sains, F., Teknologi, D., & Indonesia, U. P. (2023). PENERAPAN DATA MINING UNTUK
PENGELOLAAN DATA REKAM MEDIS MENGGUNAKAN METODE K-MEANS CLUSTERING PADA RUMAH SAKIT ROYAL PRIMA MEDAN (Vol. 6).
https://doi.org/10.37600/tekinkom.v6i1.857
Rahman, M. A., Hidayat, N., & Afif Supianto, A. (2018). Komparasi Metode Data Mining K-Nearest Neighbor Dengan Naïve Bayes Untuk Klasifikasi Kualitas Air Bersih (Studi
Kasus PDAM Tirta Kencana Kabupaten Jombang). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer Vol. 2, No. 12, Desember 2018, Hlm. 6346-6353 e-ISSN:,
2(12), 925–928. http://j-ptiik.ub.ac.id
Rajasekaran, G., & Shanmugapriya, P. (2023). Hybrid Deep Learning and Optimization Algorithm for Breast Cancer Prediction Using Data Mining. International Journal of
Intelligent Systems and Applications in Engineering, 11(1s), 14–22.
Rofiqo, N., Windarto, A. P., & Hartama, D. (2018). Penerapan Clustering Pada Penduduk Yang Mempunyai Keluhan Kesehatan Dengan Datamining K-Means. KOMIK
(Konferensi Nasional Teknologi Informasi Dan Komputer), 2(1), 216–223. https://doi.org/10.30865/komik.v2i1.929
Sitinjak, D. K., Pangestu, B. A., & Sari, B. N. (2022). Clustering Tenaga Kesehatan Berdasarkan Kecamatan di Kabupaten Karawang Menggunakan Algoritma K-Means. Journal
of Applied Informatics and Computing, 6(1), 47–54. https://doi.org/10.30871/jaic.v6i1.3855
Sukmandhani, A. A., Lukas, Heryadi, Y., Suparta, W., & Wibowo, A. (2023). Classification Algorithm Analysis for Breast Cancer. E3S Web of Conferences, 388, 1–8.
https://doi.org/10.1051/e3sconf/202338802012
Utomo, D. P., & Mesran, M. (2020). Analisis Komparasi Metode Klasifikasi Data Mining dan Reduksi Atribut Pada Data Set Penyakit Jantung. Jurnal Media Informatika
Budidarma, 4(2), 437. https://doi.org/10.30865/mib.v4i2.2080
Yanto, R. (2018). Implementasi Data Mining Estimasi Ketersediaan Lahan Pembuangan Sampah menggunakan Algoritma Simple Linear Regression. Jurnal RESTI (Rekayasa
Sistem Dan Teknologi Informasi), 2(1), 361–366. https://doi.org/10.29207/resti.v2i1.282
Yanto, R., & Khoiriah, R. (2019). Implementasi Data Mining dengan Metode Algoritma Apriori dalam Menentukan Pola Pembelian Obat. Creative Information Technology
Journal, 2(2), 102. https://doi.org/10.24076/citec.2015v2i2.41
Yoo, I., Alafaireet, P., Marinov, M., Pena-Hernandez, K., Gopidi, R., Chang, J. F., & Hua, L. (2012). Data mining in healthcare and biomedicine: A survey of the literature.
Journal of Medical Systems, 36(4), 2431–2448. https://doi.org/10.1007/s10916-011-9710-5