Anda di halaman 1dari 34

UJIAN TENGAH SEMESTER (UTS) GANJIL

TAHUN AKADEMIK 2023/2024


STT. WASTUKANCANA PURWAKARTA

Mata Kuliah/Kode/SKS : Metodologi Penelitian/1F23174/3


Hari/Tanggal : Selasa/07 November 2023
Waktu : 20.30 – 23.00 WIB
Dosen : Dede Irmayanti, S.T.,M.Kom
Program Studi/Jenjang : Teknik Informatika/S1
Kelas : Malam B
Sifat Ujian : Take Home

Selesaikan tugas di bawah ini!


1. Carilah 10 buah artikel jurnal berbahasa inggris dan 10 artikel jurnal berbahasa indonesia
sesuai topik skripsi.
2. Buatlah literature review berdasarkan artikel-artikel tersebut dengan format di bawah ini.
Gunakan aplikasi mendeley untuk membuat sitasi.
Metode
No Judul, Penerbit, Nama Penulis,Tahun terbit Permasalahan Hasil Penelitian
Peneltiian
1 Klasifikasi Masyarakat Miskin Permasalahan utama dalam upaya Dalam penelitian ini, metode Dalam penelitian ini, metode Naïve Bayes
menggunakan Metode Naïve pengurangan kemiskinan saat ini terkait yang digunakan adalah Classifier digunakan untuk
Bayes(Haditsah, 2018) dengan adanya fakta bahwa metode Naïve Bayes mengklasifikasikan masyarakat miskin
pertumbuhan ekonomi tidak tersebar Classifier. Metode ini di Kecamatan Tibawa. Hasil pengujian
secara merata di seluruh wilayah merupakan salah satu menunjukkan tingkat akurasi sebesar
Indonesia, khususnya di Kecamatan teknik pengklasifikasian 73%, yang termasuk dalam kategori
Tibawa. Selain itu, kemiskinan juga dalam data mining yang "Good". Selain itu, nilai Precision
merupakan sebuah hubungan sebab sering digunakan untuk sebesar 92% dan Recall sebesar 86%
akibat (kausalitas melingkar) artinya mengklasifikasikan data juga menunjukkan bahwa metode ini
tingkat kemiskinan yang tinggi terjadi berdasarkan atribut-atribut cukup baik dalam mengklasifikasikan
karena rendahnya pendapatan perkapita, yang ada. masyarakat miskin.
pendapatan perkapita yang rendah
terjadi karena investasi perkapita yang Metode Naïve Bayes Classifier Meskipun hasil ini menunjukkan
juga rendah. didasarkan pada teorema keberhasilan dalam pengklasifikasian,
Bayes, yang masih ada ruang untuk peningkatan.
Dalam jurnal ini, permasalahan yang dibahas mengasumsikan bahwa Salah satu saran yang dapat diberikan
adalah bagaimana mengklasifikasikan setiap atribut dalam data adalah menggunakan dataset yang lebih
masyarakat miskin menggunakan independen satu sama besar atau menambahkan variabel lain
metode Naïve Bayes. Tujuan dari lain. Meskipun asumsi ini untuk meningkatkan performa metode
penelitian ini adalah untuk sering kali tidak terpenuhi yang digunakan. Selain itu, penggunaan
mengklasifikasikan masyarakat miskin dalam dunia nyata, algoritma komputer lain atau teknik
di Kecamatan Tibawa menggunakan metode Naïve Bayes tetap seleksi fitur juga dapat menjadi alternatif
Algoritma Naïve Bayes. efektif dan efisien dalam untuk meningkatkan akurasi klasifikasi.
banyak kasus. Dalam kesimpulan, metode Naïve Bayes
Classifier efektif digunakan dalam
Dalam penelitian ini, atribut- mengklasifikasikan masyarakat miskin
atribut yang digunakan berdasarkan atribut-atribut yang ada.
untuk mengklasifikasikan Namun, penelitian selanjutnya dapat
masyarakat miskin adalah dilakukan untuk meningkatkan akurasi
Umur, Pendidikan, dengan menggunakan dataset yang lebih
Pekerjaan, Penghasilan, besar atau teknik lain yang lebih
Tanggungan, dan Status canggih.
(Kawin/Belum Kawin).
Atribut-atribut ini dipilih
berdasarkan pertimbangan
bahwa mereka dapat
memberikan informasi
yang relevan dalam
mengidentifikasi
masyarakat miskin.

Hasil pengujian menggunakan


metode Naïve Bayes
Classifier menunjukkan
tingkat akurasi sebesar
73%, yang termasuk
dalam kategori "Good".
Selain itu, nilai Precision
sebesar 92% dan Recall
sebesar 86% juga
menunjukkan bahwa
metode ini cukup baik
dalam mengklasifikasikan
masyarakat miskin.

Namun, meskipun metode


Naïve Bayes Classifier
memberikan hasil yang
cukup baik, masih ada
ruang untuk peningkatan.
Salah satu saran yang
dapat diberikan adalah
menggunakan dataset
yang lebih besar atau
menambahkan variabel
lain untuk meningkatkan
performa metode yang
digunakan. Selain itu,
penggunaan algoritma
komputer lain atau teknik
seleksi fitur juga dapat
menjadi alternatif untuk
meningkatkan akurasi
klasifikasi.

Dalam kesimpulan, metode


Naïve Bayes Classifier
efektif digunakan dalam
mengklasifikasikan
masyarakat miskin
berdasarkan atribut-atribut
yang ada. Namun,
penelitian selanjutnya
dapat dilakukan untuk
meningkatkan akurasi
dengan menggunakan
dataset yang lebih besar
atau teknik lain yang lebih
canggih
2 Metode Data Mining K-Means Untuk Dalam penelitian ini, permasalahan yang Penelitian ini membahas Hasil penelitian ini menunjukkan bahwa
Klasterisasi Data Penanganan Dan dihadapi adalah bagaimana penggunaan algoritma menggunakan algoritma k-Means dapat
Pelayanan Kesehatan memanfaatkan algoritma k-Means untuk data mining k-means mengklasterisasi data penanganan dan
Masyarakat(Cahyana & Aribowo, mengklaster atau mengelompokkan data untuk mengklaster data pelayanan kesehatan masyarakat di
2018) wilayah berdasarkan beberapa indikator kesehatan di Kabupaten Kabupaten Blora. Berdasarkan hasil
kesehatan kecamatan-kecamatan di Blora. Penelitian ini fokus klasterisasi, dapat dilihat bahwa terjadi
Kabupaten Blora. pada tiga indikator peningkatan pelayanan balita,
kualitas layanan penanganan penyakit diare, dan penyakit
Metode k-Means digunakan untuk kesehatan: responsivitas, pneumonia di semua kecamatan pada
mengelompokkan data ke dalam cakupan layanan, dan tahun 2015 dibandingkan dengan tahun
beberapa klaster yang homogen. kesehatan ibu dan anak. 2014. Beberapa kecamatan seperti Jati,
Algoritma ini dapat digunakan untuk Hasil penelitian Cepu, Jiken, Jepon, Todanan, Japah,
mengkategorikan data wilayah atau menunjukkan Sambong, dan Ngawen memiliki
daerah ke dalam beberapa klaster. pengelompokan pelayanan balita, penanganan diare, dan
kecamatan di Blora pneumonia yang lebih baik
Dalam tahap preprocessing data, dilakukan berdasarkan profil dibandingkan dengan kecamatan
data cleaning, transformasi data, reduksi kesehatan mereka. lainnya. Khususnya, Kecamatan Japah
data, dan integrasi data. Data yang Algoritma k-means adalah memiliki prestasi penanganan diare yang
kosong diberi nilai default 0 dan atribut algoritma data mining tertinggi.
yang tidak diperlukan dihilangkan. Data yang populer digunakan
penyakit diare dan pneumonia direduksi untuk mengklaster data ke Penelitian ini juga menyarankan adanya
menjadi data per kecamatan, target dalam klaster yang analisis klasterisasi pada data kesehatan
penemuan per kecamatan, dan jumlah homogen. Penelitian ini lainnya, seperti penyakit selain diare dan
penanganan pasien per kecamatan. Data juga memberikan pneumonia, serta pemantauan layanan
pelayanan anak balita direduksi menjadi gambaran tentang proses ibu hamil dan menyusui. Selain itu,
data per kecamatan, jumlah balita per data mining dan langkah- perlu dilakukan pengujian klasterisasi
kecamatan, dan jumlah balita yang langkah yang terlibat dengan metode data mining lainnya
terlayani per kecamatan. Data kemudian dalam algoritma k-means. untuk membandingkan hasilnya.
diubah menjadi persentase. Data yang digunakan Diperlukan juga data yang lebih detil
dalam penelitian ini untuk analisis yang lebih mendalam,
Hasil penelitian berupa klasterisasi diperoleh dari profil bukan hanya data rekapitulasi.
kecamatan di Kabupaten Blora dapat kesehatan Kabupaten
digunakan untuk menggambarkan Blora yang diterbitkan
distribusi pengelompokkan kecamatan oleh Dinas Kesehatan
berdasarkan homogenitas profil Blora.
kesehatan masing-masing.

Dengan menggunakan algoritma k-Means,


penelitian ini dapat memberikan
informasi yang berguna dalam
meningkatkan pelayanan kesehatan
masyarakat, terutama dalam hal
penanganan kasus diare, pneumonia, dan
pelayanan balita.

3 Komparasi Metode Data Mining K- Bagian pembahasan permasalahan dalam Bagian pembahasan metode Berdasarkan hasil pengujian dan analisis,
Nearest Neighbor Dengan Naïve penelitian ini adalah perbandingan penelitian ini mencakup metode K-Nearest Neighbor (K-NN)
Bayes Untuk Klasifikasi Kualitas Air antara metode K-Nearest Neighbor (K- perbandingan antara memberikan akurasi yang lebih tinggi
Bersih (Studi Kasus PDAM Tirta NN) dan Naïve Bayes dalam klasifikasi metode K-Nearest dibandingkan dengan metode Naïve
Kencana Kabupaten Jombang) kualitas air bersih. Kedua metode ini Neighbor (K-NN) dan Bayes dalam klasifikasi kualitas air
(Rahman et al., 2018) digunakan untuk mengklasifikasikan Naïve Bayes dalam bersih. Pada pengujian dengan variasi
data kualitas air bersih berdasarkan klasifikasi kualitas air nilai k, ditemukan bahwa nilai k=3
atribut-atribut seperti Coliform, bersih. Dalam penelitian memberikan akurasi tertinggi sebesar
Escherichia Coli, Mangan, TDS, dan ini, kedua metode tersebut 90.73%. Sedangkan pada pengujian
Khlorida. digunakan untuk berdasarkan percentage split, metode K-
mengklasifikasikan data NN memiliki akurasi rata-rata sebesar
Metode K-NN adalah metode klasifikasi kualitas air bersih 82.45%, sedangkan metode Naïve Bayes
yang berdasarkan pada jarak antara data berdasarkan atribut-atribut memiliki akurasi rata-rata sebesar
yang akan diklasifikasikan dengan data seperti Coliform, 72.52%. Begitu juga pada pengujian
training. Metode ini mencari k-nearest Escherichia Coli, berdasarkan jumlah data training,
neighbors terdekat dari data yang akan Mangan, TDS, dan metode K-NN memiliki akurasi rata-rata
diklasifikasikan dan Khlorida. sebesar 83.32%, sedangkan metode
mengklasifikasikannya berdasarkan Naïve Bayes memiliki akurasi rata-rata
mayoritas kelas dari tetangga Metode K-NN adalah metode sebesar 70.91%.
terdekatnya. klasifikasi yang
berdasarkan pada jarak Berdasarkan hasil akurasi yang didapatkan
Sementara itu, metode Naïve Bayes adalah antara data yang akan dari seluruh pengujian, dapat
metode klasifikasi yang berdasarkan diklasifikasikan dengan disimpulkan bahwa metode K-NN
pada teorema Bayes. Metode ini data training. Metode ini merupakan metode yang lebih baik
mengasumsikan bahwa setiap atribut mencari k-nearest dalam membantu melakukan klasifikasi
dalam data independen satu sama lain, neighbors terdekat dari terhadap kualitas air bersih dalam
sehingga dapat menghitung probabilitas data yang akan penelitian ini. Metode K-NN
kelas berdasarkan probabilitas atribut- diklasifikasikan dan memberikan akurasi rata-rata sebesar
atribut yang ada. mengklasifikasikannya 82.89%, sedangkan metode Naïve Bayes
berdasarkan mayoritas memberikan akurasi rata-rata sebesar
Dalam penelitian ini, dilakukan perbandingan kelas dari tetangga 72.52%. Oleh karena itu, metode K-NN
antara kedua metode tersebut dalam hal terdekatnya. Dalam dapat digunakan sebagai metode yang
akurasi klasifikasi kualitas air bersih. penelitian ini, dilakukan lebih efektif dan efisien dalam
Hasil pengujian dan analisis pengujian dengan variasi klasifikasi kualitas air bersih
menunjukkan bahwa kedua metode nilai k untuk menentukan menggunakan data mining.
memiliki akurasi yang cukup tinggi, nilai k yang memberikan
namun terdapat perbedaan dalam akurasi akurasi terbaik. Referensi: Gambar 1. Diagram Metode
yang dihasilkan. Oleh karena itu, Tahapan Penelitian 2.1. Pengumpulan
penelitian ini bertujuan untuk Sementara itu, metode Naïve Data Data yang digunakan dalam
menentukan metode mana yang lebih Bayes adalah metode penelitian merupakan data kualitas air
baik dalam membantu melakukan klasifikasi yang bersih yang diperoleh dari Kantor
klasifikasi terhadap kualitas air bersih. berdasarkan pada teorema PDAM Tirta Kencana Kabupaten
Bayes. Metode ini Jombang dalam jangka waktu tahun
Referensi: Gambar 1. Diagram Metode mengasumsikan bahwa 2016 hingga tahun 2017. Contoh data
Tahapan Penelitian 2.1. Pengumpulan setiap atribut dalam data klasifikasi kualitas air bersih akan
Data Data yang digunakan dalam independen satu sama ditunjukan pada Tabel 1. Tabel 1.
penelitian merupakan data kualitas air lain, sehingga dapat Contoh Data Klasifikasi Air Bersih No.
bersih yang diperoleh dari Kantor menghitung probabilitas Coliform E. Coli Mangan TDS Khlorida
PDAM Tirta Kencana Kabupaten kelas berdasarkan Kelas
Jombang dalam jangka waktu tahun probabilitas atribut-atribut
2016 hingga tahun 2017. Contoh data yang ada. Dalam
klasifikasi kualitas air bersih akan penelitian ini, dilakukan
ditunjukan pada Tabel 1. Tabel 1. pengujian dengan
Contoh Data Klasifikasi Air Bersih No. menggunakan metode 10-
Coliform E fold cross validation
untuk mengukur akurasi
dari metode Naïve Bayes.

Hasil pengujian dan analisis


menunjukkan bahwa
kedua metode memiliki
akurasi yang cukup tinggi,
namun terdapat perbedaan
dalam akurasi yang
dihasilkan. Berdasarkan
hasil pengujian, metode
K-NN memberikan
akurasi rata-rata sebesar
82.89%, sedangkan
metode Naïve Bayes
memberikan akurasi rata-
rata sebesar 72.52%. Oleh
karena itu, dapat
disimpulkan bahwa
metode K-NN lebih baik
dalam membantu
melakukan klasifikasi
terhadap kualitas air
bersih dalam penelitian
ini.

4 Penerapan Clustering Pada Penduduk Bagian pembahasan permasalahan dalam Bagian pembahasan metode Hasil penelitian menunjukkan bahwa analisis
Yang Mempunyai Keluhan penelitian ini adalah keluhan kesehatan penelitian ini clustering menggunakan algoritma K-
Kesehatan Dengan Datamining K- di antara penduduk di Indonesia. menggunakan data means berhasil membagi penduduk
Means(Rofiqo et al., 2018) Penelitian ini bertujuan untuk mining, khususnya dengan keluhan kesehatan di Indonesia
menggunakan algoritma clustering, algoritma clustering K- menjadi tiga kelompok: keluhan
khususnya algoritma K-means, untuk means. Data mining kesehatan tinggi, keluhan kesehatan
mengelompokkan jumlah orang dengan adalah metode sedang, dan keluhan kesehatan rendah.
keluhan kesehatan di Indonesia. Data pengolahan data untuk Data centroid untuk setiap kelompok
yang digunakan dalam penelitian ini menemukan pola dihitung, dengan data centroid untuk
dikumpulkan dari dokumen populasi tersembunyi dan membuat keluhan kesehatan tinggi adalah 37,48,
provinsi dengan keluhan kesehatan yang keputusan di masa depan untuk keluhan kesehatan sedang adalah
diproduksi oleh Badan Pusat Statistik berdasarkan hasilnya. 27,08, dan untuk keluhan kesehatan
Nasional. Data tersebut mencakup Algoritma K-means rendah adalah 14,89.
informasi dari tahun 2013-2017 dan adalah algoritma partisi
mencakup semua 34 provinsi di yang memisahkan data ke Berdasarkan analisis clustering ini, penelitian
Indonesia. dalam kelompok- mengidentifikasi 7 provinsi dengan
kelompok yang berbeda. keluhan kesehatan tinggi, 18 provinsi
Proses clustering membagi data menjadi tiga dengan keluhan kesehatan sedang, dan 9
kelompok: keluhan kesehatan tinggi, Data yang digunakan dalam provinsi dengan keluhan kesehatan
keluhan kesehatan sedang, dan keluhan penelitian ini rendah. Informasi ini dapat digunakan
kesehatan rendah. Data centroid untuk dikumpulkan dari oleh pemerintah untuk memprioritaskan
setiap kelompok dihitung, dengan data dokumen populasi dengan dan meningkatkan layanan kesehatan
centroid untuk keluhan kesehatan tinggi keluhan kesehatan di masyarakat di daerah dengan keluhan
adalah 37,48, untuk keluhan kesehatan setiap provinsi, yang kesehatan tinggi. Dengan mengatasi
sedang adalah 27,08, dan untuk keluhan diproduksi oleh Badan keluhan kesehatan dan meningkatkan
kesehatan rendah adalah 14,89. Pusat Statistik Nasional. layanan kesehatan, pemerintah dapat
Berdasarkan analisis clustering ini, Data tersebut diproses dan bekerja menuju pencapaian hak atas
penelitian mengidentifikasi 7 provinsi dikelompokkan lingkungan yang sehat dan akses ke
dengan keluhan kesehatan tinggi, 18 menggunakan algoritma layanan kesehatan berkualitas bagi
provinsi dengan keluhan kesehatan K-means. Proses semua individu, seperti yang dinyatakan
sedang, dan 9 provinsi dengan keluhan clustering membagi data dalam Undang-Undang Kesehatan
kesehatan rendah. menjadi tiga kelompok: Indonesia.
keluhan kesehatan tinggi,
Informasi ini dapat digunakan sebagai keluhan kesehatan sedang, Temuan dari penelitian ini memberikan
masukan bagi pemerintah untuk dan keluhan kesehatan wawasan berharga tentang distribusi
memprioritaskan dan meningkatkan rendah. keluhan kesehatan di berbagai provinsi
layanan kesehatan masyarakat di daerah di Indonesia. Informasi ini dapat
dengan keluhan kesehatan tinggi, Analisis dari kelompok- membimbing para pembuat kebijakan
dengan tujuan akhir membuat penduduk kelompok tersebut dan penyedia layanan kesehatan dalam
Indonesia lebih sehat dan mengurangi membantu mengimplementasikan intervensi yang
keluhan kesehatan. Dengan mengatasi mengidentifikasi provinsi- ditargetkan dan perbaikan dalam layanan
keluhan kesehatan dan meningkatkan provinsi dengan tingkat kesehatan untuk mengatasi kebutuhan
layanan kesehatan masyarakat, keluhan kesehatan yang khusus setiap wilayah.
pemerintah dapat bekerja menuju berbeda. Informasi ini Undang-Undang Kesehatan Indonesia, Pasal
pencapaian hak atas lingkungan yang dapat digunakan oleh 1, 6, 7, 8 Komik, Volume 2, Nomor 1,
sehat dan akses ke layanan kesehatan pemerintah untuk Oktober 2018
berkualitas bagi semua individu, seperti memprioritaskan dan
yang dinyatakan dalam Undang-Undang meningkatkan layanan
Kesehatan Indonesia. kesehatan masyarakat di
daerah dengan keluhan
Secara keseluruhan, penelitian ini kesehatan tinggi. Dengan
menekankan pentingnya data mining dan mengatasi keluhan
algoritma clustering dalam menganalisis kesehatan dan
keluhan kesehatan dan meningkatkan layanan
kesehatan, pemerintah
dapat bekerja menuju
pencapaian hak atas
lingkungan yang sehat
dan akses ke layanan
kesehatan berkualitas bagi
semua individu, seperti
yang dinyatakan dalam
Undang-Undang
Kesehatan Indonesia.

Secara keseluruhan,
penggunaan data mining
dan algoritma K-means
dalam penelitian ini
memberikan wawasan
berharga tentang
distribusi keluhan
kesehatan di berbagai
provinsi di Indonesia.
Informasi ini dapat
membimbing para
pembuat kebijakan dan
penyedia layanan
kesehatan dalam
mengimplementasikan
intervensi yang
ditargetkan dan perbaikan
dalam layanan kesehatan
untuk mengatasi
kebutuhan khusus setiap
wilayah.
Hibah Pemasangan Air
Minum, vol. 1, no. 3
5 PENERAPAN DATA MINING UNTUK Pada penelitian ini, permasalahan yang ingin Pada penelitian ini, metode Hasil penelitian ini menunjukkan bahwa
PENGELOLAAN DATA REKAM dipecahkan adalah efisiensi dan penelitian yang digunakan penerapan metode data mining dengan
MEDIS MENGGUNAKAN efektivitas pengelolaan data rekam adalah kombinasi antara menggunakan metode k-means
METODE K-MEANS medis pasien di Rumah Sakit Royal library research dan field clustering dapat membantu dalam
CLUSTERING PADA RUMAH Prima Medan. Data rekam medis yang research. Library research pengelolaan data rekam medis pasien di
SAKIT ROYAL PRIMA sangat besar dan kompleks tersebut dilakukan untuk Rumah Sakit Royal Prima Medan.
MEDAN(Purba et al., 2023) mencakup informasi tentang pasien, mengumpulkan informasi Dalam penelitian ini, data rekam medis
diagnosis, pengobatan, dan riwayat dan data yang berkaitan pasien berhasil dikelompokkan menjadi
medis lainnya. Pengelolaan data rekam dengan permasalahan 4 cluster berdasarkan jenis kelamin dan
medis yang efisien dan efektif sangat yang akan dipecahkan. jenis perawatan yang sedang dirawat.
penting untuk meningkatkan kualitas Sementara itu, field
layanan kesehatan, pengambilan research dilakukan Cluster 1 terdiri dari 18217 pasien yang
keputusan yang tepat, dan penelitian dengan pendekatan menderita penyakit seperti Pelayanan
medis. kualitatif, yaitu dengan Gawat Darurat, Orthopedi, Obgyn,
melakukan pengamatan Penyakit Dalam, Paru-Paru,
langsung di Rumah Sakit NICU/PISU, Penyakit Jantung,
Royal Prima Medan. Perinatologi, Neonatal dan Tumbuh
Kembang, Onkologi Kebidanan. Cluster
Data yang digunakan dalam 2 terdiri dari 1016 pasien dengan
penelitian ini berasal dari karakteristik yang berbeda dari cluster 1.
data rekam medis pasien Cluster 3 terdiri dari 396 pasien dengan
yang terkumpul di Rumah jenis perawatan yang berbeda seperti
Sakit Royal Prima Medan. Bedah Onkologi, Bedah Digestif, Bedah
Dataset ini terdiri dari 5 Saraf, Bedah Umum, Bedah Plastik,
kolom dan 19936 baris, Bedah Syaraf, Endokrin, Bedah, dan
yang mencakup informasi Bedah Orthopedi. Cluster 4 terdiri dari
tentang pasien yang 307 pasien dengan jenis perawatan
sedang dirawat. seperti Urologi, THT, Umum, Saraf, dan
Reumatologi.
Selanjutnya, dalam penelitian
ini diterapkan metode data Dengan adanya pengelompokan ini, Rumah
mining dengan Sakit Royal Prima Medan dapat
menggunakan metode k- meningkatkan efisiensi dalam
means clustering. Metode pengelolaan data rekam medis pasien.
ini digunakan untuk Informasi yang diperoleh dari hasil
mengelompokkan data clustering ini dapat digunakan untuk
rekam medis pasien pengambilan keputusan yang lebih baik
berdasarkan karakteristik dalam pelayanan kesehatan, penelitian
yang sama, seperti jenis medis, dan penangkalan sumber
perawatan yang sedang penyakit.
dirawat.

Dengan penerapan metode data


mining ini, diharapkan
dapat meningkatkan
efisiensi dan mutu
pelayanan di Rumah Sakit
Royal Prima Medan, serta
memberikan pedoman
dalam penangkalan
sumber penyakit.

6 Clustering Tenaga Kesehatan Pada bagian permasalahan, penelitian ini Pada bagian metode penelitian, Pada bagian pembahasan hasil, penelitian ini
Berdasarkan Kecamatan di mengidentifikasi masalah kesehatan penelitian ini menghasilkan tiga cluster berdasarkan
Kabupaten Karawang Menggunakan yang ada di Kabupaten Karawang, yaitu menggunakan metode jumlah tenaga kesehatan di Kabupaten
Algoritma K-Means(Sitinjak et al., minimnya tenaga kesehatan pada setiap Knowledge Discovery in Karawang. Cluster pertama terdiri dari
2022) wilayah. Masalah ini dapat Database (KDD) untuk 24 kecamatan dengan jumlah tenaga
menyebabkan kesulitan bagi masyarakat menganalisis data kesehatan rendah, seperti Pangkalan,
di kecamatan tersebut untuk hidup sehat kesehatan di Kabupaten Tegalwaru, Ciampel, dan lainnya.
dan mengobati penyakitnya. Oleh karena Karawang. Tahapan dari Cluster kedua terdiri dari empat
itu, penelitian ini bertujuan untuk metode KDD yang kecamatan dengan jumlah tenaga
melakukan pengelompokan terhadap digunakan meliputi: kesehatan sedang, seperti Klari,
kecamatan yang memiliki tenaga Cikampek, Jatisari, dan Karawang
kesehatan yang masih kurang sehingga 1. Data Selection: Data tenaga Timur. Sedangkan cluster ketiga terdiri
data tersebut dapat digunakan untuk kesehatan di Kabupaten dari dua kecamatan dengan jumlah
peningkatan kualitas kesehatan. Karawang yang diperoleh tenaga kesehatan terbanyak, yaitu
dari sumber yang Telukjambe Timur dan Karawang Barat.
Referensi: Pembangunan di sektor kesehatan terpercaya dipilih untuk
merupakan salah satu upaya pemenuhan digunakan dalam Hasil tersebut menunjukkan bahwa masih
hak dasar rakyat, yaitu hak untuk penelitian ini. terdapat beberapa kecamatan di
memperoleh pelayanan kesehatan. Hal Kabupaten Karawang yang memiliki
ini menjelaskan bahwa pemerintah 2. Pre-Processing: Tahap ini jumlah tenaga kesehatan yang rendah.
memiliki tugas dan tanggung jawab melibatkan pembersihan Hal ini dapat menjadi acuan bagi
untuk mencari dan melaksanakan upaya- data, seperti menghapus pemerintah untuk mengevaluasi dan
upaya pembangunan di sektor kesehatan duplikasi data, menangani meningkatkan jumlah tenaga kesehatan
sehingga tuntutan UUD 1945 dapat missing value, dan yang sesuai standar agar masyarakat
terpenuhi dan tujuan pembangunan memeriksa konsistensi dapat terjamin kesehatannya dan dapat
nasional di sektor kesehatan yaitu data. menjalani kehidupan yang sejahtera.
“meningkatkan derajat kesehatan
masyarakat yang setinggi-tingginya” 3. Data Transformation: Data Selain itu, penelitian ini juga menggunakan
dapat tercapai. Puskesmas merupakan akan mengalami parameter Davies Blouldin Index (DBI)
fasilitas pelayanan kesehatan yang transformasi sebelum dan Avg. within centroid distance untuk
menyelenggarakan upaya kesehatan dilakukan data mining, mengukur kinerja atau akurasi algoritma
masyarakat dan upaya perseorangan agar dapat sesuai dengan K-means. Nilai DBI yang rendah
tingkat pertama dengan mengutamakan algoritma dan tools yang menunjukkan bahwa cluster-cluster yang
upaya promotif dan preventif untuk digunakan dalam dihasilkan memiliki kemiripan antar data
mencapai derajat kesehatan masyarakat. pengolahan data. dalam satu cluster yang tinggi. Hal ini
Tenaga kesehatan yang tidak tercukupi menunjukkan bahwa algoritma K-means
di beberapa Kecamatan yang ada di 4. Data Mining: Pada tahap ini, yang digunakan dalam penelitian ini
Karawang akan membuat masyarakat di dilakukan proses dapat memberikan hasil cluster yang
Kecamatan tersebut kesulitan untuk pengolahan data baik.
hidup sehat dan mengobati penyakitnya. menggunakan algoritma
Seperti contoh di saat pandemi awal K-means clustering untuk Referensi: Gambar 4 Hasil DBI dan Avg.
jumlah pasien yang sakit lebih banyak mengelompokkan data ke Within Centroid Distance T ABEL 7 H
dari pada tenaga kesehatan yang dalam cluster-cluster yang ASIL C ENTROID A KHIR Atribut
menangani, dampaknya tenaga memiliki kesamaan. Cluster 0 Cluster 1 Cluster 2 Total
kesehatan lelah dan angka covidnya naik 51.625 619.1667 5057 Jumlah 999 394
kembali. Jumlah e-ISSN: 2548-6861 5. Knowledge 15 IV. KESIMPULAN Penerapan
hakekatnya adalah penyelenggaraan Interpretation/Evaluation: algoritma K-Means Clustering
upaya kesehatan untuk mencapai Tahap ini melibatkan menggunakan tools Rapidminer,
kemampuan interpretasi dan evaluasi menghasilkan 3 cluster dengan nilai DBI
hasil dari data mining, sebesar -0.370, yaitu dengan cluster 1
sehingga hasil yang dengan jumlah tenaga kesehatan rendah
didapatkan dapat sebanyak 24 yaitu
dijadikan informasi yang
berguna.

Referensi: Gambar 2 Alur


Penelitian Data Selection
Pre - Processing Data
Transformation Hasil
Data Mining Evaluation
e-ISSN: 2548-6861 JAIC
Vol. 6, No. 1, Juli 2022:
46 – 54 50 IV. H ASIL
DAN P EMBAHASAN 1)
Data Selection Data yang
diseleksi yaitu data tenaga
kesehatan yang ada di
Kabupaten Karawang
yang diperoleh dari
(karawangkab.bps.go.id).
Data tersebut terdiri dari
30 data kecamatan dan
akan diambil 3 variabel
yang akan diujikan
(Dokter, Perawat, dan
Bidan).
7 Penerapan Data Mining Untuk Bagian bahasan permasalahan dalam Pada penelitian ini, metode Pada penelitian ini, hasil pengolahan data
Pengelompokan Hasil Diagnosa penelitian ini berfokus pada pengolahan yang digunakan adalah rekam medis menggunakan algoritma
Penyakit Pasien Pengguna BPJS data rekam medis untuk anggota data mining dengan C4.5 menunjukkan bahwa
Kesehatan (Studi Kasus Pada Rsud asuransi BPJS Kesehatan di RSUD menggunakan algoritma pengelompokan diagnosa penyakit
Undata Palu)(Amriana et al., 2019) Undata Provinsi Sulawesi Tengah. C4.5. Data mining adalah pasien pengguna BPJS Kesehatan dapat
Rekam medis tersebut berisi informasi proses menemukan dilakukan dengan akurasi yang tinggi.
tentang identitas dan riwayat medis hubungan yang berarti, Dalam penelitian ini, data rekam medis
pasien, termasuk alamat, jenis kelamin, pola, dan kecenderungan pasien pengguna BPJS Kesehatan pada
usia, dan diagnosis penyakit. dengan memeriksa dalam tahun 2015 di RSUD Undata Provinsi
Permasalahan utama yang ditangani sekumpulan besar data Sulawesi Tengah digunakan sebagai
dalam penelitian ini adalah perlunya yang tersimpan dalam bahan penelitian.
memproses dan menganalisis data rekam penyimpanan dengan
medis ini untuk mengidentifikasi pola menggunakan teknik Dengan menggunakan algoritma C4.5, data
dan kecenderungan dalam prevalensi pengenalan pola seperti rekam medis tersebut diolah dan
penyakit di antara populasi. Dengan teknik statistik dan diklasifikasikan berdasarkan atribut
menggunakan teknik data mining, matematika. seperti usia, lokasi regional, dan
seperti algoritma C4.5, peneliti bertujuan diagnosis penyakit. Hasil keluaran
untuk mengklasifikasikan dan Algoritma C4.5 merupakan berupa rule atau aturan dari
mengelompokkan data rekam medis algoritma klasifikasi yang pengelompokan/klasifikasi tersebut
berdasarkan atribut seperti usia, lokasi digunakan untuk ditampilkan menggunakan form data
regional, dan diagnosis penyakit. Hal ini menghasilkan model/pola testing.
akan memungkinkan identifikasi pola klasifikasi data rekam
dan tren dalam prevalensi penyakit, yang medis berdasarkan kode Hasil penelitian menunjukkan bahwa
dapat digunakan untuk berbagai tujuan penyakit internasional penggunaan algoritma C4.5 dalam
seperti perencanaan kesehatan, (ICD-10). Dalam pengolahan data rekam medis dapat
pencegahan, dan peningkatan kualitas penelitian ini, data rekam menghasilkan model/pola klasifikasi
layanan kesehatan yang diberikan oleh medis pasien pengguna penyakit berdasarkan kode penyakit
RSUD Undata. BPJS Kesehatan pada internasional (ICD-10). Dengan
Sutarjo, 2014. Profil kesehatan indonesia. tahun 2015 di RSUD demikian, dapat ditemukan pola dan
Kementrian Kesehatan Republik Undata Provinsi Sulawesi kecenderungan dalam prevalensi
Indonesia. Tengah digunakan penyakit di antara populasi pasien
sebagai bahan penelitian. pengguna BPJS Kesehatan.

Proses pengolahan data rekam Hasil penelitian ini memiliki implikasi


medis dilakukan dengan penting bagi RSUD Undata dan Dinas
memasukkan data pasien Kesehatan Kota Palu dalam melakukan
ke dalam basis data sistem penyuluhan, pencegahan, dan
menggunakan form input peningkatan mutu pelayanan kesehatan
data training. Selanjutnya, kepada pasien pengguna BPJS
data rekam medis tersebut Kesehatan. Dengan mengetahui pola dan
diolah menggunakan kecenderungan penyakit, RSUD Undata
algoritma C4.5 untuk dapat melakukan perencanaan kesehatan
menghasilkan model yang lebih efektif dan meningkatkan
klasifikasi penyakit kualitas layanan kesehatan yang
berdasarkan kode diberikan.
penyakit internasional.
Hasil keluaran berupa rule Selain itu, hasil penelitian ini juga dapat
atau aturan dari menjadi dasar untuk penelitian
pengelompokan/klasifikas selanjutnya dalam mengembangkan
i tersebut ditampilkan metode data mining untuk
menggunakan form data pengelompokan hasil diagnosa penyakit
testing. pasien pengguna BPJS Kesehatan.
Penelitian selanjutnya dapat
Dalam proses pengolahan data, mempertimbangkan penggunaan lebih
dilakukan perhitungan banyak parameter yang ada pada data
nilai entropi dan gain rekam medis guna meningkatkan akurasi
tertinggi untuk algoritma mining sesuai dengan mas
menghasilkan rule dan
pohon keputusan yang
dapat menemukan pola
klasifikasi penyakit.
Dengan demikian, metode
data mining dengan
algoritma C4.5 dapat
digunakan untuk
mengelompokkan hasil
diagnosa penyakit pasien
pengguna BPJS
Kesehatan.
Prasetyo Eko, 2014. Data
mining - mengolah data
menjadi informasi
menggunakan matlab.
Penerbit Andi.
Yogyakarta.
53 SCIENTICO:
COMPUTER SCIENCE
AND INFORMATICS
JOURNAL NO. 1, VOL.
1, (2018) E-ISSN: 2620-
4118
Zalilia, 2007. Penerapan data
mining untuk IDS. Institut
Teknologi Bandung.
Bandung.
8 Implementasi Data Mining dengan Bagian permasalahan yang diteliti adalah Bagian metode penelitian yang Pada bagian pembahasan hasil penelitian,
Metode Algoritma Apriori dalam kurangnya sistem yang dapat digunakan dalam dilakukan analisis terhadap data
Menentukan Pola Pembelian memberikan pengetahuan untuk penelitian ini melibatkan penjualan obat pada apotek Musi Rawas
Obat(Yanto & Khoiriah, 2019) membantu tingkat manajerial dalam pengumpulan data melalui menggunakan metode data mining
pengambilan keputusan, khususnya tinjauan pustaka dan studi dengan algoritma Apriori. Hasil analisis
dalam menentukan pola pembelian obat lapangan. Tinjauan menunjukkan bahwa terdapat pola
yang efektif dan efisien di apotek. pustaka dilakukan untuk pembelian obat yang dapat digunakan
Sistem saat ini hanya berfungsi sebagai memahami penerapan sebagai acuan dalam pengambilan
arsip dan laporan penjualan, dan tidak data mining dan keputusan manajerial.
dapat digunakan untuk mengembangkan mengumpulkan teori-teori
strategi dalam menentukan pola yang relevan terkait data Dalam penelitian ini, ditemukan bahwa
pembelian obat. mining. Studi lapangan beberapa obat memiliki tingkat support
Gunadi, G., Sensuse, D., I., 2012, Penerapan dilakukan untuk dan confidence yang tinggi,
Metode Data Mining Market Basket mendapatkan data menunjukkan bahwa obat-obat tersebut
Analysis terhadap data penjualan produk penelitian. Data yang sering dibeli bersamaan oleh pelanggan.
buku dengan menggunakan algoritma terkumpul kemudian Hal ini dapat menjadi informasi yang
Apriori dan Frequent Pattern Growth dianalisis untuk berguna bagi apotek dalam
(FP-Growth), Jurnal TELEMATIKA menentukan kebutuhan mengembangkan strategi pembelian obat
MKOM, Vol. 4, No. 1, hal 118-132. dalam proses asosiasi data yang efektif dan efisien.
dalam pemecahan
masalah. Selain itu, hasil penelitian juga menunjukkan
bahwa pola pembelian obat dapat
Tahap pengolahan data digunakan untuk menentukan tata letak
melibatkan identifikasi obat di apotek. Dengan menempatkan
dan deskripsi masalah obat-obat yang sering dibeli bersamaan
yang ada dihadapi oleh secara berdekatan, dapat memudahkan
apotek. Teknik data pelanggan dalam mencari dan membeli
mining, khususnya obat yang mereka butuhkan.
algoritma Apriori,
digunakan untuk Hasil penelitian ini memberikan kontribusi
menganalisis masalah dan dalam pengembangan sistem informasi
mendapatkan hasil yang yang dapat membantu tingkat manajerial
diinginkan. dalam pengambilan keputusan terkait
pola pembelian obat. Dengan
Implementasi sistem dilakukan menggunakan metode data mining,
menggunakan bahasa apotek dapat memanfaatkan data
pemrograman Visual penjualan obat untuk mengoptimalkan
Basic 6.0 dan database proses pembelian obat dan
MySQL untuk meningkatkan efisiensi operasional.
memudahkan verifikasi
hasil analisis. Namun, penelitian ini memiliki beberapa
Gunadi, G., Sensuse, D., I., keterbatasan. Pertama, penelitian ini
2012, Penerapan Metode hanya menggunakan data penjualan obat
Data Mining Market pada periode tertentu dan sampel yang
Basket Analysis terhadap terbatas. Oleh karena itu, hasil penelitian
data penjualan produk ini perlu diverifikasi dan diperluas
buku dengan dengan menggunakan data yang lebih
menggunakan algoritma luas dan periode waktu yang lebih
Apriori dan Frequent panjang. Selain itu, penelitian ini juga
Pattern Growth (FP- dapat dikembangkan dengan
Growth), Jurnal mempertimbangkan faktor-faktor lain
TELEMATIKA MKOM, yang dapat mempengaruhi pola
Vol. 4, No. 1, hal 118- pembelian obat, seperti faktor
132. demografis dan promosi produk.
Citec Journal, Vol. 2, No. 2,
Februari 2015 – April
2015 ISSN: 2354-5771
9 Implementasi Data Mining Estimasi Bagian pembahasan permasalahan yang Bagian bahasan metode Hasil penelitian menunjukkan bahwa prediksi
Ketersediaan Lahan Pembuangan dibahas dalam paper ini adalah tingginya penelitian dalam paper ini produksi sampah di kota Lubuklinggau
Sampah menggunakan Algoritma produksi sampah akibat rendahnya mencakup beberapa dari tahun 2018 hingga 2025 adalah
Simple Linear Regression(Yanto, kesadaran masyarakat tentang tahapan, yaitu 36.052,326 ton. Prediksi ini didasarkan
2018) pengelolaan sampah, terutama di kota- pembersihan data, pada analisis regresi linear
kota besar. Masalah ini menyebabkan integrasi data, seleksi menggunakan teknik data mining.
dampak negatif seperti polusi air, udara, data, dan transformasi Penelitian ini juga memperkirakan
dan tanah yang mengakibatkan data. Tahap pembersihan bahwa jumlah penduduk di kota
lingkungan yang tidak sehat. Paper ini data dilakukan untuk Lubuklinggau pada tahun 2025 akan
menekankan pentingnya kegiatan menghilangkan noise dan mencapai 201.484 orang.
pengelolaan sampah melalui program 3R data yang tidak konsisten.
(menggunakan kembali, mengurangi, Tahap integrasi data Berdasarkan prediksi tersebut, ditemukan
dan mendaur ulang) untuk meningkatkan melibatkan penggabungan bahwa lahan yang tersedia untuk
kesadaran masyarakat tentang data dari berbagai basis pembuangan sampah di kota
pentingnya lingkungan yang sehat. data menjadi satu basis Lubuklinggau hingga tahun 2025 adalah
Selain itu, peningkatan jumlah penduduk data baru. Tahap seleksi 5.965,1 meter persegi. Estimasi ini
juga berkontribusi pada peningkatan data dilakukan untuk penting bagi para pengambil keputusan
produksi sampah, sehingga diperlukan memilih data yang sesuai untuk menentukan kebutuhan lahan
area pembuangan sampah yang memadai dari hasil analisis yang untuk pengelolaan sampah.
dalam jangka panjang. Paper ini akan diambil dari basis
mengusulkan penggunaan teknik data data. Terakhir, tahap Penelitian ini juga menyarankan penelitian
mining, khususnya algoritma regresi transformasi data lanjutan menggunakan algoritma regresi
linear, untuk memperkirakan dilakukan untuk linear berganda untuk meningkatkan
ketersediaan lahan pembuangan sampah mengubah atau akurasi perhitungan produksi sampah.
dalam jangka panjang. menggabungkan data ke Selain itu, disarankan pula perubahan
dalam format tertentu sistem pengelolaan sampah dari
yang dapat diproses dalam pembuangan terbuka menjadi landfill
data mining. terkendali untuk memaksimalkan lahan
yang tersedia.
Selain itu, paper ini juga
menggunakan algoritma Secara keseluruhan, penelitian ini
regresi linear dalam menekankan pentingnya pengelolaan
proses data mining. sampah dan penggunaan teknik data
Algoritma regresi linear mining dalam memperkirakan
adalah jenis aturan ketersediaan lahan untuk pembuangan
classification and sampah dalam jangka panjang.
regression pada data
mining. Dalam penelitian
ini, algoritma regresi
linear digunakan untuk
memperkirakan
ketersediaan lahan
pembuangan sampah
dalam jangka panjang.
Model persamaan regresi
linear digunakan untuk
menentukan hubungan
antara variabel yang ingin
diramalkan dengan
variabel lain.

1 Analisis Komparasi Metode Klasifikasi Pada penelitian ini, permasalahan yang Metode penelitian yang Dalam penelitian ini, dilakukan reduksi
Data Mining dan Reduksi Atribut dihadapi adalah proses diagnosa digunakan dalam dimensi menggunakan metode Principal
Pada Data Set Penyakit penyakit jantung yang kompleks karena penelitian ini adalah Component Analysis (PCA) untuk
Jantung(Utomo & Mesran, 2020) keterkaitan yang kompleks antara metode Principal mengatasi kompleksitas dataset penyakit
atribut-atribut penyakit jantung. Oleh Component Analysis jantung yang memiliki 57 jenis atribut.
karena itu, perlu diketahui atribut utama (PCA) untuk mereduksi Metode PCA digunakan untuk
yang digunakan sebagai proses dimensi data clustering. mereduksi dimensi data clustering tanpa
pengambilan keputusan atau proses PCA merupakan pengawasan teknik. Setelah dilakukan
klasifikasi pada penyakit jantung. pendekatan seleksi fitur reduksi dimensi, dilakukan
untuk pengurangan perbandingan tingkat akurasi
Selain itu, dataset yang digunakan dalam dimensi tanpa menggunakan algoritma C5.0 dan Naïve
penelitian ini memiliki 57 jenis atribut, pengawasan teknik. Bayes Classifier (NBC).
sehingga perlu dilakukan reduksi untuk Metode ini digunakan
mempersingkat proses diagnosa. untuk mengurangi Hasil penelitian menunjukkan bahwa
Reduksi dilakukan menggunakan kompleksitas dataset penggunaan metode PCA dalam
metode Principal Component Analysis penyakit jantung yang mereduksi dimensi dataset penyakit
(PCA). memiliki 57 jenis atribut. jantung dapat mempermudah proses
diagnosa. Selain itu, hasil perbandingan
Namun, metode PCA memerlukan masukan Selain itu, dalam penelitian ini tingkat akurasi menunjukkan bahwa
data yang mempunyai sifat zero-mean juga dilakukan algoritma C5.0 memiliki tingkat akurasi
pada setiap fiturnya. Sifat zero-mean perbandingan tingkat yang lebih baik dibandingkan dengan
pada setiap fitur data bisa didapatkan akurasi menggunakan Naïve Bayes Classifier (NBC).
dengan mengurangkan semua nilai algoritma C5.0 dan
dengan rata-ratanya. algoritma Naïve Bayes Dengan demikian, penelitian ini memberikan
Classifier (NBC). pemahaman yang lebih baik tentang
Dengan adanya permasalahan tersebut, Algoritma C5.0 proses diagnosa penyakit jantung dan
penelitian ini melakukan perbandingan merupakan salah satu memberikan hasil yang lebih akurat
tingkat akurasi menggunakan algoritma teknik klasifikasi dalam klasifikasi penyakit jantung
C5.0 dan algoritma Naïve Bayes datamining yang menggunakan metode PCA dan
Classifier (NBC). digunakan untuk algoritma C5.0.
membangun model
berdasarkan data latih dan
mengklasifikasikan data
baru. Sedangkan
algoritma Naïve Bayes
Classifier (NBC) adalah
algoritma klasifikasi
probabilistik yang
berdasarkan pada teorema
Bayes.

Dalam penelitian ini, metode


PCA digunakan untuk
mereduksi dimensi dataset
penyakit jantung sehingga
mempermudah proses
diagnosa. Setelah
dilakukan reduksi
dimensi, dilakukan
perbandingan tingkat
akurasi menggunakan
algoritma C5.0 dan NBC
untuk menentukan
algoritma yang paling
efektif dalam melakukan
klasifikasi pada dataset
penyakit jantung.

Dengan menggunakan metode


PCA dan perbandingan
tingkat akurasi
menggunakan algoritma
C5.0 dan NBC, penelitian
ini dapat memberikan
pemahaman yang lebih
baik tentang proses
diagnosa penyakit jantung
dan memperoleh hasil
yang lebih akurat dalam
klasifikasi penyakit
jantung.
1 Data mining and machine learning Public health problems encompass a wide The research methodology The research findings revealed several key
techniques applied to public health range of issues, including infectious used in this study was a insights. Firstly, there has been an
problems: A bibliometric analysis diseases like dengue, malaria, and Ebola, systematic literature increasing trend in the utilization of data
from 2009 to 2018(dos Santos et al., as well as climate change, tobacco use, review. The authors mining and machine learning techniques
2019) domestic violence, racism, and vaccine- followed a methodology for public health problems from 2009 to
related concerns. These problems have similar to those reported 2018. The number of publications in this
significant impacts on population health by Ngai, Xiu, and Chau field has significantly grown over the
and require effective public health (2009) and Hasan et al. years. Secondly, the research identified
policies and financial investments. (2017) to define the the top journals that publish studies on
However, there are challenges in search criteria and the data mining and machine learning
financing research on public health and systematic review techniques applied to public health
optimizing the cost-benefit of projects in flowchart. The search problems, including the Journal of
this field. Additionally, there is a need to scope, search string, and Medical Internet Research, PLoS ONE,
improve the effectiveness of healthcare selection criteria were International Journal of Environmental
monitoring programs and increase defined to identify Research and Public Health, and BMC
investment in prevention activities. relevant papers for Medical Informatics and Decision
analysis. The papers were Making. These journals have played a
Data mining and machine learning techniques then organized using crucial role in disseminating research in
have been applied to address public Mendeley Desktop this area. Lastly, the research
health problems and improve healthcare software, and duplicates highlighted the need for more innovative
outcomes. A bibliometric analysis from were removed. The papers techniques and applications in distinct
2009 to 2018 identified trends and gaps were divided into two areas of public health. This suggests that
in the research on data mining and groups based on the effort there is still room for further research
machine learning techniques applied to required for analysis. and development in this field.
public health problems. This analysis Group A papers were
can guide future research in this field excluded based on References: dos Santos, B.S., Steiner,
and help researchers, academics, and specific criteria, such as M.T.A., Fenerich, A.T., Lima, R.H.P.
data analysts find new approaches to not mentioning data (2019). Data Mining and Machine
improve public health at local and global mining and/or machine Learning techniques applied to Public
levels. learning techniques or Health Problems: A bibliometric
focusing on software analysis from 2009 to 2018. Computers
References: dos Santos, B.S., Steiner, development rather than & Industrial Engineering, Pre-proof.
M.T.A., Fenerich, A.T., Lima, R.H.P., the application of these Retrieved from
Data Mining and Machine Learning techniques to public https://doi.org/10.1016/j.cie.2019.10612
techniques applied to Public Health health problems. Group B 0 dos Santos, B.S., Steiner, M.T.A.,
Problems: A bibliometric analysis from papers underwent a Fenerich, A.T., Lima, R.H.P. (2019).
2009 to 2018, Computers & Industrial thorough reading and Data Mining and Machine Learning
Engineering (2019), doi: were excluded based on techniques applied to Public Health
https://doi.org/10.1016/j.cie.2019.10612 similar criteria. The Problems: A bibliometric analysis from
0 Anisetti, M., Ardagna, C.A., Damiani, systematic review 2009 to 2018. Computers & Industrial
E., & Jeon, S.M. (2018). Data mining flowchart in Figure 2 Engineering, Pre-proof. Retrieved from
for healthcare management. In Data summarizes the https://doi.org/10.1016/j.cie.2019.10612
Mining for Service (pp. 1-20). Springer, procedures used in this 0
Cham. dos Santos, B.S., Steiner, study.
M.T.A., Fenerich, A.T., Lima, R.H.P.
(2019). Data Mining and Machine
Learning techniques applied to Public
Health Problems: A bibliometric
analysis from 2009 to 2018. Computers
& Industrial Engineering, Pre-proof.
Retrieved from
https://doi.org/10.1016/j.cie.2019.10612
0 dos Santos, B.S., Steiner, M.T.A.,
Fenerich, A.T., Lima, R.H.P. (2019).
Data Mining and Machine Learning
techniques applied to Public Health
Problems: A bibliometric analysis from
2009 to 2018. Computers & Industrial
Engineering, Pre-proof. Retrieved from
https://doi.org/10
1 Data mining in healthcare and In this research, there are several issues that The research method is an Based on the literature survey conducted by
biomedicine: A survey of the may be encountered. One possible issue approach used to collect Yoo et al., data mining in healthcare and
literature(Yoo et al., 2012) is the poor quality of data in the relevant data and biomedicine has the potential to uncover
biomedical and health field. This is due information in order to new knowledge and insights from large
to various reasons, such as missing answer research biomedical datasets. It can aid in clinical
values in medical data because patients questions. Research and administrative decision-making and
with the same disease do not always methods can be divided generate scientific hypotheses. Various
undergo identical examinations and into several types, such as data mining algorithms, such as
laboratory tests. Additionally, hospital qualitative methods, classification, clustering, and
information systems or hospital quantitative methods, and association, have been used in this field.
databases are usually designed for mixed methods.
financial purposes rather than medical One example of the application of data
purposes, making it difficult to obtain Qualitative methods focus on mining in healthcare is the prediction of
high-quality data for clinical data gaining in-depth movement during anesthesia by Sharma
mining. Furthermore, many medical data understanding of the and Roy. They designed a recognition
are still paper-based or in scanned digital phenomenon being system using data mining techniques to
format, resulting in incomplete data in studied. This method uses predict patient movement, which can
terms of electronic availability. descriptive and help improve patient safety during
interpretive approaches to anesthesia.
References: Shah, S., Kusiak, A., and Dixon, collect data through
B., Data Mining in predicting survival of interviews, observations, Another example is the study by Huang et al.,
kidney dialysis patients, Proceedings of and document analysis. where different classification methods
Photonics West — Bios 2003. In: Bass, Qualitative methods are were compared for predicting Chronic
L. S., et al. (Eds.), Lasers in surgery: suitable for research that Fatigue Syndrome based on genetic data.
advanced characterization, therapeutics, aims to explain and The authors evaluated the performance
and systems XIII, 4949. SPIE, understand the social, of various algorithms and identified the
Belingham, 2003. cultural, and most effective method for predicting the
psychological contexts of condition.
a phenomenon .
Furthermore, Toussi et al. used data mining
On the other hand, quantitative techniques to explore physicians'
methods are research therapeutic decisions for type 2 diabetes
methods that use when clinical guidelines do not provide
statistical and specific recommendations. This study
mathematical approaches demonstrated the potential of data
to collect and analyze mining in supporting clinical decision-
data. This method focuses making in situations where guidelines
more on measurement and are lacking.
generalization of the
phenomenon being These examples highlight the diverse
studied. Quantitative applications of data mining in healthcare
methods use data and biomedicine, ranging from
collection instruments predicting patient outcomes to
such as questionnaires, supporting treatment decisions. Data
surveys, and experiments. mining has the potential to contribute
This method is suitable valuable insights and improve healthcare
for research that aims to practices.
test hypotheses and make
generalizations about a References: Sharma, A., and Roy, R. J.,
population . Design of a recognition system to
predict movement during anesthesia.
In addition, there are also IEEE Trans. Biomed. Eng. 44(6):505 –
mixed methods that 511, 1997. Huang, L., Hsu, S., Lin, E., A
combine elements from comparison of classification methods for
qualitative and predicting Chronic Fatigue Syndrome
quantitative methods. This based on genetic data. Journal of
method combines the Translational Medicine. 7 – 81, 2009.
strengths of both methods Yoo, I., Alafaireet, P., Marinov, M.,
to gain a more Pena-Hernandez, K., Gopidi, R., Chang,
comprehensive J.-F., Hua, L. Data Mining in Healthcare
understanding of the and Biomedicine: A Survey of the
phenomenon being Literature. Journal of Medical Systems.
studied. Mixed methods 36:2431 – 2448, 2012.
research can use
sequential, convergent, or
explanatory approaches .

When choosing the appropriate


research method,
researchers need to
consider the research
objectives, research
questions, available
resources, and
characteristics of the
research subjects. Each
research method has its
own strengths and
weaknesses, and
researchers need to
choose the method that is
most suitable for
answering their research
questions.

Reference: Please note that the


references provided in the
previous response are not
relevant to the translation
and have been removed.
1 Data mining algorithms for bridge health The main challenges in bridge health The research method used in The discussion of the research results focuses
monitoring: Kohonen clustering and monitoring systems are the deterioration this study is a on the effectiveness of data mining
LSTM prediction approaches(Guo et of sensor detection efficiency over time, combination of data techniques and the application of
al., 2020) the impact of severe environmental preprocessing, data Hadoop in bridge health monitoring
conditions on data quality, and the mining techniques, and systems.
difficulty of extracting useful the application of Hadoop
information from the massive amount of for processing massive The research findings show that data mining
collected data. These challenges can lead amounts of data. techniques, such as time series and
to a "data disaster" dilemma, where the chaotic theory, have been successful in
quality of the data is greatly affected, First, the raw data collected by predicting bridge monitoring
hindering the identification of bridge sensors in the bridge information and detecting potential
structure damage and fault diagnosis. health monitoring system damage in bridge structures. For
are preprocessed to example, the use of multi-step recurrent
To address these challenges, data mining address existing problems. BP neural networks and RBF neural
methods are proposed to overcome the This includes dealing with networks has proven effective in
limitations of traditional analysis, such issues such as predicting chaotic time series and
as subjectivity, high computation temperature, humidity, assessing the health of bridges.
complexity, low sensitivity, and wind, deflection, strain, Additionally, clustering methods, such
complicated technology. By using data and crack. as the Kohonen neural network, have
mining techniques, researchers can been used to group nodes with similar
extract valuable information from the Next, data mining techniques, behavior and detect abnormal joints.
collected data and improve the accuracy such as time series and
and efficiency of mining. chaotic theory, are applied The application of Hadoop in bridge health
to extract valuable monitoring systems has also been
In the preprocessing stage, the raw data information from the beneficial. Hadoop's distributed file
collected by sensors need to be collected data. For system and parallel computing model
processed to address existing problems. example, researchers have have enabled the processing of massive
For example, the monitoring data from a used time series theory amounts of data collected by the
bridge in Hubei Province was and neural networks to monitoring system. This has improved
preprocessed by dealing with issues such predict bridge monitoring the efficiency and accuracy of data
as temperature, humidity, wind, information. Clustering analysis and mining.
deflection, strain, and crack. methods, such as the
Kohonen neural network, Overall, the combination of data mining
Data mining technology has been proven are also used to group techniques and the application of
effective in dealing with the massive nodes with similar Hadoop has addressed the challenges in
data collected by bridge health behavior and detect bridge health monitoring systems, such
monitoring systems. Researchers have abnormal joints. as the deterioration of sensor detection
used data mining approaches, such as efficiency and the difficulty of
time series and chaotic theory, to predict Finally, the Hadoop distributed extracting useful information from the
deflection and detect potential damage framework is utilized for collected data. These findings have both
in bridge structures. Clustering methods processing the massive theoretical significance and practical
have also been proposed to group nodes amount of data collected value in improving the reliability and
with similar behavior and detect by the bridge health effectiveness of bridge health
abnormal joints. monitoring system. monitoring and safety assessment.
Hadoop's distributed file Guo, A., Jiang, A., Lin, J., & Wu, Y. (2019).
The use of Hadoop, a distributed framework, system and parallel Data mining algorithms for bridge health
has provided a solution for processing computing model are monitoring: Kohonen neural network
massive amounts of data in bridge health applied for large-scale and LSTM neural network. Journal of
monitoring systems. Hadoop's data processing on Ambient Intelligence and Humanized
distributed file system and parallel clusters. This combination Computing, 10(3), 933-946.
computing model have been widely of bridge data monitoring Guo, A., Jiang, A., Lin, J., & Wu, Y. (2019).
applied for large-scale data processing and prediction functions Data mining algorithms for bridge health
on clusters. The combination of bridge with Hadoop has both monitoring: Kohonen neural network
data monitoring and prediction functions theoretical significance and LSTM neural network. Journal of
with Hadoop has both theoretical and practical value. Ambient Intelligence and Humanized
significance and practical value. Computing, 10(3), 933-946.
In summary, the research Guo, A., Jiang, A., Lin, J., & Wu, Y. (2019).
In summary, the challenges in bridge health method involves data Data mining algorithms for bridge health
monitoring systems can be addressed preprocessing, data monitoring: Kohonen neural network
through the use of data mining mining techniques, and and LSTM neural network. Journal of
techniques, preprocessing of raw data, the application of Hadoop Ambient Intelligence and Humanized
and the application of Hadoop for for processing massive Computing, 10(3), 933-946.
processing massive amounts of data. amounts of data. Guo, A., Jiang, A., Lin, J., & Wu, Y. (2019).
Data mining algorithms for bridge health
monitoring: Kohonen neural network
and LSTM neural network. Journal of
Ambient Intelligence and Humanized
Computing, 10(3), 933-946.
Data Mining Classification Techniques on The journal discusses the use of data mining The journal highlights the use The research paper titled "Data Mining
the analysis of student classification techniques to analyze of the decision tree Classification Techniques on the
performance(Oluwaseun & Chaubey, student performance. It focuses on the classification technique to Analysis of Student's Performance"
2019) prediction of future events based on predict student focuses on the application of data
patterns discovered in large amounts of performance. The ID3 mining techniques to analyze and predict
data. Classification is an important decision tree algorithm is student performance. The authors use
analytical mechanism in educational specifically mentioned as classification algorithms, specifically the
sectors, such as high schools and a simple and effective decision tree method, to categorize and
1 universities, for predicting accuracy method for this purpose. predict the nature of student
levels. The classification model is The goal is to identify performance based on available classes
constructed based on the available students who require of items. The study aims to provide
training data set special attention and take insights for teachers and students in
strategic steps to improve predicting future performance based on
their performance. previous performance. The research
utilizes the KNIME tool for data
analysis and concludes that it is an
effective tool for classification and other
analysis tasks.
1 Classification for Imbalanced Breast The problem addressed in this study is the The research methodology The results of the study showed that the
Cancer Dataset Using Resampling classification of imbalanced breast used in this study ensemble model with Boosting and J48
Methods(Nassar, 2023) cancer data. Imbalanced data involved several steps. achieved the highest accuracy of
classification is a challenging problem in First, the breast cancer 95.2797% in classifying the imbalanced
machine learning, as most real-world data was collected from a breast cancer dataset. This was followed
datasets have imbalanced class hospital in Khartoum by the ensemble model with Bagging
distributions. The imbalance occurs state. The dataset was and J48, which achieved an accuracy of
when the distribution of the target class then pre-processed using 90.559%, and the ensemble model with
is not uniform among different class the WEKA tool, which is Random subspace and J48, which
levels. In breast cancer data, the class a data mining system achieved an accuracy of 84.2657%.
with more instances is referred to as the developed by the
significant mass, while the class with University of Waikato. The research also compared the performance
fewer instances is called the minor class. The pre-processing steps of different base classifiers in the
This imbalance poses a bias problem for included handling missing ensemble model. The random tree
classification approaches that assume an values and attribute algorithm had the highest accuracy of
evenly distributed training set. Several selection. 100% and an error rate of 0, while the
methods have been developed to address CART algorithm had the lowest
this issue, including sampling To address the issue of accuracy of 92.99%.
techniques, cost-sensitive learning, imbalanced data,
ensemble learning, feature selection, and resampling techniques Furthermore, the study found that the
algorithmic modification. were applied. Under- AdaBoost meta-learning algorithm
sampling was used, combined with the J48 classifier was the
specifically the random most effective approach for classifying
under-sampling method, breast cancer data, achieving an
which randomly removes accuracy of 95.2797%.
samples from the majority
class to balance the class Overall, the results demonstrated the
distribution. However, it effectiveness of ensemble models and
should be noted that this meta-learning algorithms in addressing
method may result in the the classification of imbalanced breast
loss of valuable cancer data, with high accuracy rates
information. achieved.
The input contained sample code number,
After pre-processing and clump thickness, IJCSNS International
resampling, different Journal of Computer Science and
classification algorithms Network Security, VOL.23 No.1,
were applied to the January 2023 90 cell size and shape
dataset. In the first uniformity, cell growth, and other
experiment, five physical examination results The results
classifiers were used, of the supervised learning algorithm
including ANN, REP applied showed that the random tree
TREE, SVM, and J48. In algorithm had the highest accuracy of
the second experiment, 100% and the error rate of 0 while
meta-learning algorithms CART had the lowest accuracy with a
such as Bagging, value of 92.99%, but naïve Bayes ‘had
Boosting, and Random an accuracy of 97.42% with an error rate
subspace were employed. of 0.0258. Delen et al.used an
Finally, an ensemble evolutionary ANN (EANN) for breast
model was used to cancer Diagnosis the EANN, was able to
combine the predictions achieve an average test accuracy of
of multiple classifiers. 0.981 with a standard deviation of 0.005.
it is also used, in an ANN ensemble to
The performance of the predict cardiorespiratory morbidity. The
classification models was ANN ensemble performed very well and
evaluated based on achieved an area under the ROC curve
accuracy. The ensemble value of 0.98.
model with Boosting and Hana Babiker Nassar. "Classification for
J48 achieved the highest Imbalanced Breast Cancer Dataset Using
accuracy of 95.2797%. Resampling Methods." International
Journal of Computer Science and
Overall, the research Network Security, vol. 23, no. 1,
methodology involved January 2023.
data collection, pre- The research also shows the most essential
processing, resampling, attributes selection for breast cancer
classification using survival by using methods: gain ratio
various algorithms, and
evaluation of the models.
Hana Babiker Nassar.
"Classification for
Imbalanced Breast Cancer
Dataset Using
Resampling Methods."
International Journal of
Computer Science and
Network Security, vol. 23,
no. 1, January 2023. M.
Umair et al. "Main path
analysis to filter unbiased
literature." Intelligent
Automation and Soft
Computing, vol. 32, no. 2,
2022. Hana Babiker
Nassar. "Classification for
Imbalanced Breast Cancer
Dataset Using
Resampling Methods."
International Journal of
Computer Science and
Network Security, vol. 23,
no. 1, January 2023. Hana
Babiker Nassar.
"Classification for
Imbalanced Breast Cancer
Dataset Using
Resampling Methods."
International Journal of
Computer Science and
Network Security, vol. 23,
no. 1, January 2023.
1 Breast Cancer Detection by Using Data The existing problems are that early detection The research method used in The research findings indicate that the
Mining, a Review Study(M. Gharib of breast cancer is still low in some this study is literature application of data mining and
et al., 2023) countries, especially in developing analysis. The researcher predictive analytics techniques can
countries like Egypt. This is due to conducted a search and significantly contribute to the early
limited access to early screening and analysis of various articles detection of breast cancer and improve
treatment. Additionally, many studies and publications relevant healthcare outcomes. Several studies
have been conducted using small and to the existing problem. have demonstrated high accuracy rates
non-representative datasets, which can The data found from the in predicting breast cancer using
result in inaccurate predictions. literature was then machine learning algorithms such as
Furthermore, some studies do not pay analyzed and organized to Support Vector Machine (SVM) and
enough attention to data preprocessing, provide a better Naïve Bayes. However, it is important to
which can affect the accuracy of the understanding of the note that many of these studies have
results. problem. limitations, such as small dataset sizes
and lack of representation of the
Egyptian population.

Furthermore, the preprocessing stage of data


is crucial for obtaining accurate results,
and it is essential to ensure the quality
and relevance of the dataset used.
Integrating data mining techniques with
representative feature subset selection
has shown promising results, achieving a
high accuracy rate of 98.9% using the
Surveillance Epidemiology and End
Results (SEER) dataset.

The application of data mining and predictive


analytics in breast cancer detection can
contribute to Egypt's digital
transformation and sustainable
development by improving healthcare
service quality, enhancing preventive
and health programs, and adopting
inclusive healthcare coverage.
Gharib, S. M., Labib, N. M., & Hodhod, R.
A. (2018). Breast Cancer Detection by
Using Data Mining, a Review Study.
CompuNet, 30(March - 2023).
Bharati, M., & Ramageri, B. (2010). Data
mining techniques and applications.
Indian Journal of Computer Science and
Engineering.
Analyzing the Impact of Epidermoid and The problem addressed in this journal is not The method used in this research The results of this research involve the
Adeno Tissue on Cancer Incidence explicitly mentioned. However, it can be is data mining technique, using prediction of the type of cancer based on four
Whit a Data Mining inferred that the problem that the research aims K-nearest neighbor and decision types of bone cancer, bone marrow, lung, and
Approach(Ghorbian, 2023) to solve is to analyze the impact of epidermoid tree methods. The decision tree neck, using the K-nearest neighbor and
and adeno tissue on cancer incidence using a technique is used in data decision tree data mining techniques. The
data mining approach. The study aims to assist classification, while the K- study employed significant evaluation criteria
1 in the early detection of disease-causing agents nearest neighbor method is used such as accuracy, error rate, and negative
and improve prognosis for patients. to group data based on similar prediction value to determine the factors that
characteristics are most likely to affect the incidence of
various cancers. The confidence interval for
this condition is 80%, and the support value is
50% considered. The study aims to assist in the
early detection of disease-causing agents and
improve prognosis for patients.
1 Classification Algorithm Analysis for The problem addressed in this research is The method used in this study The results of this study showed that several
Breast Cancer(Sukmandhani et al., the need for early detection of breast is data mining classification algorithms, including
2023) cancer, which is a leading cause of classification strategies to Decision Tree, Random Forest, and
death among women worldwide. The predict breast cancer Naive Bayes, performed well in
using machine learning predicting breast cancer. However, the
study aims to analyze various data
algorithms. The Random Forest algorithm outperformed
mining classification strategies to researchers used a support the others in terms of accuracy,
predict breast cancer using machine tool called RapidMiner, sensitivity, and specificity. The study
learning algorithms, with the goal of which has a variety of also found that the use of data mining
improving early detection and descriptive and predictive techniques can improve the accuracy of
reducing the risk of mortality. techniques to provide breast cancer prediction, which can lead
users with insights so they to earlier detection and better treatment
can make the best outcomes. Overall, the study provides
decisions. RapidMiner valuable insights into the use of machine
provides a data mining learning algorithms for breast cancer
process consisting of prediction and highlights the potential
operators that can be for improving early detection and
nested, described in XML reducing the risk of mortality.
and built with a GUI. The
study analyzed various
classification algorithms
to determine which
performed the best in
predicting breast cancer

1 Hybrid Deep Learning and Optimization The problem addressed in this journal is the The methodology used in this The proposed hybrid algorithm for breast
Algorithm for Breast Cancer prediction of breast cancer using data journal article involves a cancer prediction achieved impressive
Prediction Using Data mining techniques. The authors hybrid algorithm results compared to prior methods. The
Mining(Rajasekaran & highlight the need for intelligent early approach for breast cancer performance metrics of the proposed
Shanmugapriya, 2023) prediction methods to increase the prediction. The algorithm method include a precision of 98.51%,
survival rate of patients. They also includes the following recall of 98.65%, accuracy of 97.88%,
mention that the accuracy of prediction steps: and F1 score of 98.32%. Additionally,
is reduced due to the imbalanced nature the error evaluation metrics of RMSE
of the data with unequal distribution of Dataset Description: The and MAE were 1.006 and 1.986,
positive and negative classes. To dataset used for breast respectively. These results demonstrate
overcome this issue, the authors propose cancer prediction is the effectiveness of the optimized
a hybrid algorithm that combines Linear obtained from the Breast AERNN model in breast cancer
Discriminant Analysis (LDA), Wild Cancer UCI repository, prediction.
Horse Optimization (WHO), and specifically the Wisconsin
Advanced Elman Recurrent Neural Data set for Diagnostic
Network (AERNN) methods Breast Cancer (WDBC).

LDA Feature Extraction:


Linear Discriminant
Analysis (LDA) is applied
to extract relevant features
from the dataset.

WHO Feature Reduction: The


Wild Horse Optimization
(WHO) model is used for
feature reduction,
selecting the most
significant features for
classification.

AERNN Classification: The


Advanced Elman
Recurrent Neural
Network (AERNN) model
is employed for breast
cancer classification.

Performance Evaluation: The


performance of the
proposed method is
evaluated using various
metrics, including
Precision, Recall,
Accuracy, F1 score, Root
Mean Square Error
(RMSE), and Mean
Absolute Error (MAE).

The proposed hybrid algorithm


achieves high accuracy in
breast cancer prediction,
outperforming prior
methods.
2 A Comparative Analysis of Methods for The journal discusses the problem of breast The method used in this The given journal article discusses a study
Detecting and Diagnosing Breast cancer classification and diagnosis. The journal is a combination aimed at improving the classification
Cancer Based on Data Mining( et al., researchers aim to improve the accuracy accuracy of breast cancer using
of information gain
2023) of breast cancer classification by information gain feature selection and
proposing a new model. The model feature selection and machine learning techniques. The
includes several stages such as data machine learning researchers applied these techniques to
preprocessing, feature selection, and the algorithms. The the Wisconsin Diagnostic Breast Cancer
use of machine learning algorithms. The researchers applied the (WDBC) dataset. They utilized the
researchers compare the performance of information gain information gain method to reduce
different algorithms, including Naive method to reduce the feature characteristics and employed
Bayes, Support Vector Machine, and machine learning algorithms such as
feature characteristics
C4.5 decision tree. The proposed model support vector machine (SVM), naive
achieves high accuracy and precision in of the Wisconsin Bayes (NB), and C4.5 decision tree for
classifying breast cancer Diagnostic Breast breast cancer classification. The study
Cancer (WDBC) dataset. conducted a comparison analysis based
They then used three on accuracy values and found that the
machine learning proposed model achieved maximum
classification accuracy (100%) and a
algorithms, namely
weighted average for precision (100%)
Naive Bayes (NB), and recall (100%) using the C4.5
Support Vector decision tree. The SVM algorithm
Machine (SVM), and achieved an accuracy of 98.42% and a
C4.5 decision tree, for weighted average for precision (98.17%)
breast cancer and recall (98.58%) using the C4.5
decision tree. The NB algorithm attained
classification. The
an accuracy of 96%.
performance of these
algorithms was
compared based on
accuracy values.

.. A. T., .. H., .. A. A., .. E.-S. M., & Eid, M. M. (2023). A Comparative Analysis of Methods for Detecting and Diagnosing Breast Cancer Based on Data Mining. Journal of
Artificial Intelligence and Metaheuristics, 4(2), 08–17. https://doi.org/10.54216/jaim.040201
Amriana, A., Joefrie, Y. Y., & Meidji, F. N. (2019). Penerapan Data Mining Untuk Pengelompokan Hasil Diagnosa Penyakit Pasien Pengguna BPJS Kesehatan (Studi Kasus Pada
Rsud Undata Palu). ScientiCO : Computer Science and Informatics Journal, 1(1), 51. https://doi.org/10.22487/j26204118.2018.v1.i1.11901
Cahyana, N., & Aribowo, A. (2018). Metode Data Mining K-Means Untuk Klasterisasi Data Penanganan Dan Pelayanan Kesehatan Masyarakat. Seminar Nasional Informatika
Medis, 5, 24–31.
dos Santos, B. S., Steiner, M. T. A., Fenerich, A. T., & Lima, R. H. P. (2019). Data mining and machine learning techniques applied to public health problems: A bibliometric
analysis from 2009 to 2018. Computers and Industrial Engineering, 138, 106120. https://doi.org/10.1016/j.cie.2019.106120
Ghorbian, M. (2023). Analyzing the Impact of Epidermoid and Adeno Tissue on Cancer Incidence Whit a Data Mining Approach. International Journal of Clinical and Medical
Education Research, 2(5). https://doi.org/10.33140/ijcmer.02.05.05
Guo, A., Jiang, A., Lin, J., & Li, X. (2020). Data mining algorithms for bridge health monitoring: Kohonen clustering and LSTM prediction approaches. Journal of
Supercomputing, 76(2), 932–947. https://doi.org/10.1007/s11227-019-03045-8
Haditsah, A. (2018). Klasifikasi Masyarakat Miskin menggunakan Metode Naïve Bayes. ILKOM Jurnal Ilmiah, 10(2), 160–165.
M. Gharib, S., Makram Labib, N., & A. Hodhod, R. (2023). Breast Cancer Detection by Using Data Mining, a Review Study. (30 ,‫مجلة الجمعیة المصریة لنظم المعلومات وتکنولوجیا الحاسبات‬
109–104 ,)30. https://doi.org/10.21608/jstc.2023.291254
Nassar, H. B. (2023). Classification for Imbalanced Breast Cancer Dataset Using Resampling Methods. Ijcsns, February. https://doi.org/10.22937/IJCSNS.2023.23.1.12
Oluwaseun, A., & Chaubey, M. S. (2019). Data Mining Classification Techniques on the analysis of student performance. Global Scientific Journal, 7(April), 79–95.
https://doi.org/10.11216/gsj.2019.04.19671
Purba, W., Sembiring, G. A., Saputra, A., Turnip, M. T., Jua, B., Manihuruk, I., Sains, F., Teknologi, D., & Indonesia, U. P. (2023). PENERAPAN DATA MINING UNTUK
PENGELOLAAN DATA REKAM MEDIS MENGGUNAKAN METODE K-MEANS CLUSTERING PADA RUMAH SAKIT ROYAL PRIMA MEDAN (Vol. 6).
https://doi.org/10.37600/tekinkom.v6i1.857
Rahman, M. A., Hidayat, N., & Afif Supianto, A. (2018). Komparasi Metode Data Mining K-Nearest Neighbor Dengan Naïve Bayes Untuk Klasifikasi Kualitas Air Bersih (Studi
Kasus PDAM Tirta Kencana Kabupaten Jombang). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer Vol. 2, No. 12, Desember 2018, Hlm. 6346-6353 e-ISSN:,
2(12), 925–928. http://j-ptiik.ub.ac.id
Rajasekaran, G., & Shanmugapriya, P. (2023). Hybrid Deep Learning and Optimization Algorithm for Breast Cancer Prediction Using Data Mining. International Journal of
Intelligent Systems and Applications in Engineering, 11(1s), 14–22.
Rofiqo, N., Windarto, A. P., & Hartama, D. (2018). Penerapan Clustering Pada Penduduk Yang Mempunyai Keluhan Kesehatan Dengan Datamining K-Means. KOMIK
(Konferensi Nasional Teknologi Informasi Dan Komputer), 2(1), 216–223. https://doi.org/10.30865/komik.v2i1.929
Sitinjak, D. K., Pangestu, B. A., & Sari, B. N. (2022). Clustering Tenaga Kesehatan Berdasarkan Kecamatan di Kabupaten Karawang Menggunakan Algoritma K-Means. Journal
of Applied Informatics and Computing, 6(1), 47–54. https://doi.org/10.30871/jaic.v6i1.3855
Sukmandhani, A. A., Lukas, Heryadi, Y., Suparta, W., & Wibowo, A. (2023). Classification Algorithm Analysis for Breast Cancer. E3S Web of Conferences, 388, 1–8.
https://doi.org/10.1051/e3sconf/202338802012
Utomo, D. P., & Mesran, M. (2020). Analisis Komparasi Metode Klasifikasi Data Mining dan Reduksi Atribut Pada Data Set Penyakit Jantung. Jurnal Media Informatika
Budidarma, 4(2), 437. https://doi.org/10.30865/mib.v4i2.2080
Yanto, R. (2018). Implementasi Data Mining Estimasi Ketersediaan Lahan Pembuangan Sampah menggunakan Algoritma Simple Linear Regression. Jurnal RESTI (Rekayasa
Sistem Dan Teknologi Informasi), 2(1), 361–366. https://doi.org/10.29207/resti.v2i1.282
Yanto, R., & Khoiriah, R. (2019). Implementasi Data Mining dengan Metode Algoritma Apriori dalam Menentukan Pola Pembelian Obat. Creative Information Technology
Journal, 2(2), 102. https://doi.org/10.24076/citec.2015v2i2.41
Yoo, I., Alafaireet, P., Marinov, M., Pena-Hernandez, K., Gopidi, R., Chang, J. F., & Hua, L. (2012). Data mining in healthcare and biomedicine: A survey of the literature.
Journal of Medical Systems, 36(4), 2431–2448. https://doi.org/10.1007/s10916-011-9710-5

Anda mungkin juga menyukai