Anda di halaman 1dari 11

Subscribe to DeepL Pro to edit this document.

Visit www.DeepL.com/profor more information.

Jurnal Fisika: Seri Konferensi

MAKALAH - AKSES TERBUKA Anda mungkin juga menyukai

Pengelompokan Opini Publik tentang Bencana Alam


- Mempelajari representasi berkorelasi
dangkal menggunakan strategi pemetaan
lokal untuk penilaian degradasi kinerja
di Indonesia Menggunakan Algoritma DBSCAN dan bantalan
Jiachen Kuang, Guanghua Xu, Sicong

K-Medoids Zhang et al.

- Optimalisasi Algoritma K-medoids untuk


Pusat Pengelompokan Awal
Untuk mengutip artikel ini: Mustakim et al 2021 J. Phys: Conf. Ser. 1783 012016 Wang Yan E, An Jian, Liang Yan et al.

- Penerapan algoritma clustering pada


perusahaan industri kecil dan mikro untuk
pemetaan wilayah dengan k-medoids Hendra
Jatnika, Haris Jamaludin, Auliya Rahman et
Lihat artikel online untuk mengetahui pembaruan dan penyempurnaan. al.
Konten ini diunduh dari alamat IP 180.248.18.152 pada 12/12/2022 pukul 08:11
Konferensi Tahunan Penelitian Ilmu Pengetahuan dan Teknologi Penerbitan IOP
(ACOSTER)
Jurnal Fisika: 2020
Seri Konferensi 1783 (2021) 012016 doi:10.1088/1742-6596/1783/1/012016

Pengelompokan Opini Publik tentang Bencana Alam di Indonesia


Menggunakan Algoritma DBSCAN dan K-Medoids

Mustakim1* , Muhammad Zakiy Fauzi2 , Mustafa3 , Assyari Abdullah4 , Rohayati5


1,2
Program Studi Sistem Informasi, Fakultas Sains dan Teknologi, Universitas Islam
Negeri Sultan Syarif Kasim Riau, Pekanbaru, Indonesia
3,4,5
Jurusan Komunikasi, Fakultas Dakwah dan Komunikasi, Universitas Islam Negeri
Sultan Syarif Kasim Riau, Pekanbaru, Indonesia
1,2
Puzzle Research Data Technology, Fakultas Sains dan Teknologi, Universitas Islam
Negeri Sultan Syarif Kasim Riau, Pekanbaru, Indonesia

*mustakim@uin-suska.ac.id

Abstrak. Bencana alam adalah bencana yang diakibatkan oleh peristiwa atau serangkaian
peristiwa yang disebabkan oleh alam seperti gempa bumi, tsunami, letusan gunung berapi,
banjir, angin puting beliung, dan tanah longsor. Beberapa bencana alam tersebut telah menyita
banyak perhatian publik, mulai dari empati, kesedihan dan kritik yang membentuk opini di
media sosial. Salah satu media sosial yang paling populer digunakan oleh masyarakat adalah
Twitter. Opini yang ditulis oleh pengguna Twitter disebut tweet. Kumpulan tweet dapat diolah
untuk mendapatkan informasi dengan menggunakan teknik data mining yaitu Text Mining.
Dalam penelitian ini digunakan algoritma Density-Based Spatial Clustering of Application
with Noise (DBSCAN) dan K-Medoids. Hasil dari penelitian ini menunjukkan bahwa
DBSCAN merupakan algoritma terbaik karena memiliki validitas Silhouette Index (SI) sebesar
0.9140 dan rata-rata waktu eksekusi di RapidMiner Studio adalah 83.40 detik. Sementara itu,
algoritma K-Medoids memiliki validitas Silhouette Index (SI) sebesar 0.2259 dan rata-rata
waktu eksekusi di RapidMiner Studio 849.93 detik. Frekuensi kata "gempa bumi"
mendominasi untuk kategori positif, kata "bencana" mendominasi kategori negatif, dan kata
"banjir dan gempa bumi" mendominasi kategori negatif.

1. Pendahuluan
Penggunaan aplikasi media sosial di kalangan masyarakat menunjukkan bahwa teknologi telah
berkembang sangat pesat dan telah memberikan pengaruh yang besar dalam hal interaksi sosial.
Dengan penggunaan media sosial, interaksi yang terjadi seolah-olah telah dipindahkan ke dalam
platform virtual [1]. Beberapa aplikasi media sosial yang banyak digunakan oleh masyarakat Indonesia
berdasarkan survei dari Kementerian Komunikasi dan Informatika, yaitu Facebook dengan 65 juta
pengguna, Twitter dengan 19,5 juta pengguna, Google+ dengan 3,4 juta pengguna, LinkedIn dengan 1
juta pengguna, dan Path dengan 700 ribu pengguna [2].
Salah satu media sosial yang menyediakan akses API gratis adalah Twitter. Twitter adalah aplikasi
media sosial yang dibuat pada Maret 2006 oleh Jack Dorsey yang memberikan akses informasi secara
real-time kepada pengguna [3]. Pengguna aktif Twitter saat ini mencapai 22% pengguna internet di
dunia dengan 500 juta tweet per hari yang didominasi oleh 80% perangkat mobile [4].
Dengan tersedianya akses informasi secara real-time, pengguna Twitter dapat berbagi informasi
mengenai suatu peristiwa atau kejadian tertentu dengan cepat, termasuk peristiwa bencana alam [5].
Bencana alam adalah peristiwa

Konten dari karya ini dapat digunakan di bawah ketentuan lisensi Creative Commons Attribution 3.0. Setiap distribusi lebih lanjut
dari karya ini harus mempertahankan atribusi kepada penulis dan judul karya, kutipan jurnal dan DOI.
Konferensi Tahunan Penelitian Ilmu Pengetahuan dan Teknologi Penerbitan IOP
(ACOSTER)
Jurnal Fisika: 2020
Seri Konferensi 1783 (2021) 012016 doi:10.1088/1742-6596/1783/1/012016
Diterbitkan di bawah lisensi oleh IOP Publishing Ltd1
Konferensi Tahunan Penelitian Ilmu Pengetahuan dan Teknologi Penerbitan IOP
(ACOSTER)
Jurnal Fisika: 2020
Seri Konferensi 1783 (2021) 012016 doi:10.1088/1742-6596/1783/1/012016

yang disebabkan oleh alam dan bersifat merusak seperti banjir, gempa bumi, tsunami, tanah longsor,
kebakaran, dan angin puyuh [6]. Indonesia merupakan negara dengan intensitas bencana alam yang
tinggi, hal ini disebabkan oleh letak geografis Indonesia yang berada pada pertemuan tiga lempeng
utama dunia yaitu lempeng Eurasia, Pasifik dan Indo Australia [7]. Bencana alam memicu masyarakat
untuk memberikan informasi dan opini dalam bentuk tweet. Tweet tersebut dapat berupa empati atau
keluhan. Kumpulan data tweet dapat diolah dengan menggunakan salah satu teknik data mining yaitu
text mining [8][9].
Text Mining adalah disiplin ilmu yang mempelajari tentang pengolahan data teks seperti
information retrieval, analisis teks dokumen, ekstraksi data, dan visualisasi data [10]. Text Mining
memiliki kecenderungan dalam bidang penelitian data mining, sehingga terdapat kesamaan dalam
aspek arsitektur [11]. Salah satu teknik data mining yang umum digunakan dalam penelitian text
mining adalah clustering. Clustering adalah teknik yang digunakan untuk mengelompokkan data
dalam suatu cluster (kelompok) dengan menggunakan parameter tertentu sehingga objek dalam satu
cluster memiliki tingkat kemiripan yang sama [12]. Algoritma Density Based Spatial Clustering of
Application with Noise (DBSCAN) dan K-Medoid digunakan dalam penelitian ini.
Penelitian sebelumnya tentang Analisis dan Implementasi Pendeteksian Komunitas Menggunakan
Algoritma DBSCAN pada Twitter menemukan bahwa kelebihan algoritma DBSCAN adalah
menghasilkan cluster yang mampu menangani noise/outlier, hasil cluster yang lebih akurat, dan baik
untuk data dalam jumlah besar [13]. Penelitian lain tentang algoritma K-Medoids adalah Perbandingan
Cluster K-Means dan K-Medoid pada Data Outlier, dengan hasil bahwa algoritma K-Medoids lebih
baik dari K-Means dalam melakukan clustering data dengan 5% outlier.

2. Bahan dan Metode

Gambar 1. Metode
Penelitian
Tahap perencanaan merupakan tahapan-tahapan yang harus dilakukan oleh peneliti dalam
melakukan sebuah penelitian yang terdiri dari menentukan tujuan penelitian, mengidentifikasi
masalah, menentukan batasan penelitian, mengkaji literatur, dan menentukan data. Tahap selanjutnya
adalah mengumpulkan data dengan melakukan crawling dari Twitter dan mengkaji literatur. Pada

2
Konferensi Tahunan Penelitian Ilmu Pengetahuan dan Teknologi Penerbitan IOP
(ACOSTER)
Jurnal Fisika: 2020
Seri Konferensi 1783 (2021) 012016 doi:10.1088/1742-6596/1783/1/012016
tahap preprocessing teks, dimulai dari pembersihan, penyaringan,

3
Konferensi Tahunan Penelitian Ilmu Pengetahuan dan Teknologi Penerbitan IOP
(ACOSTER)
Jurnal Fisika: 2020
Seri Konferensi 1783 (2021) 012016 doi:10.1088/1742-6596/1783/1/012016

tokenizing, dan stemming. Tahap hasil dan analisis terdiri dari pembobotan TF-IDF, pengolahan
menggunakan kedua algoritma untuk mencari validitas cluster terbaik, visualisasi kata dan analisis,
serta melakukan dokumentasi.
Preprocessing memiliki peran yang sangat penting dalam teknik text mining [14]. Tahapan
preprocessing meliputi persiapan data, integrasi, proses pembersihan, normalisasi, transformasi,
pengurangan kompleksitas, dan penghilangan hal-hal yang tidak relevan [15]. TF-IDF adalah metode
untuk mengevaluasi pentingnya kata dalam dokumen. Penting tidaknya kata tersebut, tergantung dari
berapa kali kata tersebut muncul dalam sebuah dokumen [16].

2.1. Pengelompokan Spasial Berbasis Kepadatan Aplikasi dengan Noise (DBSCAN)


DBSCAN adalah algoritma yang dirancang untuk menemukan cluster dan noise dalam ruang basis
data [17]. Konsep dasar dari algoritma ini adalah bahwa untuk setiap titik data dalam sebuah cluster,
sebuah lingkungan dengan radius yang diberikan (Eps) harus mengandung setidaknya sejumlah titik
minimum (Minpts) yaitu intensitas lingkungan harus melebihi beberapa ambang batas [18]. Algoritma
DBSCAN dimulai dengan menghitung jarak titik pusat (p) ke titik lain dengan menggunakan jarak
Euclidean dan dinyatakan dalam persamaan 1 [19].

D(xl , pi ) = √∑q (xlj - (1)


pij )2
j=i
2.2. K-Medoids
Algoritma K-Medoids digunakan untuk menemukan medoids dalam sebuah cluster. K-Medoids
lebih kuat dari K-Means dalam menemukan k sebagai objek yang mewakili untuk meminimalkan
jumlah ketidaksamaan objek data, mengurangi noise dan outlier [20]. Strategi dasar dari algoritma ini
adalah menemukan k cluster dalam n objek terlebih dahulu secara acak. Setiap objek yang tersisa
dikelompokkan dengan Medoid yang paling mirip. Algoritma K-Medoids menggunakan objek-objek
yang representatif sebagai titik-titik perwakilan dalam pengambilan nilai rata-rata objek dalam setiap
cluster [21]. Jarak antara objek i dan j dihitung dengan menggunakan fungsi pengukuran dissimilarity,
dimana salah satunya adalah Fungsi Jarak Euclidean yang ditunjukkan pada persamaan 2 [22]:

dii = √ ∑ p (xiu - xiu )2, i = 1, ... ... . n; j = 1, ... . n (2)


a=1

Dari persamaan di atas, Xia adalah variabel ke-a dari objek i (i = 1, ..., n; a = 1, ..., p) dan dij adalah
nilai Euclidean Distance. Algoritma ini juga menghitung probabilitas pertukaran setiap objek dengan
pusat klaster lain menggunakan fungsi kriteria seperti persamaan 3:
E = ∑ k ∑n |p - 0j| ... ... ... ... ... ...
(3)
j=1 p𝖾cj

Persamaan 3 di atas mengimplikasikan bahwa E adalah jumlah kesalahan absolut untuk semua
objek dalam dataset; p adalah titik dalam ruang yang merepresentasikan objek dalam cluster Cj, dan oj
adalah objek dalam cluster Cj.

3. Hasil Dan Analisis


Pada tahap analisis, data bencana alam di Indonesia pada tahun 2018 dan 2019 dianalisis dengan
menggunakan algoritma Density-Based Spatial Clustering of Applications with Noise (DBSCAN) dan
K-Medoids digunakan untuk mengelompokkan data ke dalam cluster. Data yang digunakan dalam
penelitian ini diperoleh dari data Twitter dengan menggunakan teknik crawling. Crawling dilakukan
dengan menggunakan bahasa pemrograman Python dengan kata kunci bencana alam, gempa bumi,
gempa bumi, tsunami, banjir, tanah longsor, kebakaran, letusan gunung berapi, dan tornado. Data
diambil dalam rentang waktu 1 Januari 2018 - 30 September 2019.

4
Konferensi Tahunan Penelitian Ilmu Pengetahuan dan Teknologi Penerbitan IOP
(ACOSTER)
Jurnal Fisika: 2020
Seri Konferensi 1783 (2021) 012016 doi:10.1088/1742-6596/1783/1/012016
Text Preprocessing bertujuan untuk mempersiapkan data mentah sebelum dilakukan proses
selanjutnya. Secara umum Text Preprocessing adalah proses menghilangkan data yang tidak sesuai
atau mengubah data ke bentuk yang lebih sesuai sehingga mudah untuk diproses. Tahapan Text
Preprocessing dalam text mining terdiri dari Tokenizing, Filtering, Stemming, Tagging dan Analyzing
[23] kemudian proses pelabelan. Data yang telah dilabeli adalah

5
Konferensi Tahunan Penelitian Ilmu Pengetahuan dan Teknologi Penerbitan IOP
(ACOSTER)
Jurnal Fisika: 2020
Seri Konferensi 1783 (2021) 012016 doi:10.1088/1742-6596/1783/1/012016

dihitung untuk mendapatkan bobot TF-IDF dengan menggunakan bahasa pemrograman Python. TF-
IDF dihitung dengan cara menghilangkan term dengan proporsi dokumen frekuensi maksimum
melebihi 90% dan dokumen frekuensi minimum kurang dari 2% sehingga menghasilkan setiap term
dari query "bencana alam, gempa bumi, gempa bumi dan tsunami, banjir, tanah longsor, kebakaran,
dan gunung meletus".

3.1. Pengelompokan Data Menggunakan Algoritma DBSCAN


Dokumen teks Twitter yang telah dibobot menggunakan TF-IDF dikelompokkan dengan
menggunakan algoritma DBSCAN dengan parameter epsilon (Eps) dan minpoints (MinPts) yang
berbeda.

3.2. Label Positif Data Bencana Alam


Tabel 1 adalah hasil jumlah cluster dari percobaan clustering dengan DBSCAN menggunakan
beberapa parameter Eps dan MinPts yang berbeda.
Tabel 1. Hasil Klaster Data Bencana Alam Label Positif
Siluet
No Eps MinPts JumlahKebisinganEksekusi
Indeks Kelomp Waktu (Detik)
ok
1 0.3 5 0.9371 26 898 20
2 0.3 6 0.9265 22 918 16
3 0.3 7 0.9182 19 936 15
4 0.3 8 0.9182 19 936 12
5 0.3 9 0.9137 18 944 16
6 0.3 10 0.9153 17 953 18
7 0.4 5 0.8547 28 851 12
8 0.4 6 0.8491 26 866 13
9 0.4 7 0.8593 19 905 14
10 0.4 8 0.8593 19 905 12
11 0.4 9 0.8517 18 913 16
12 0.4 10 0.8517 18 913 14
13 0.5 5 0.7613 31 797 13
14 0.5 6 0.7697 26 825 18
15 0.5 7 0.7647 22 850 16
16 0.5 8 0.7760 21 861 13
17 0.5 9 0.7829 19 877 18
18 0.5 10 0.8004 18 886 11
Rata-rata eksekusiwaktu (detik) 14.83
Semakin rendah nilai epsilon, maka semakin tinggi nilai Silhouette Index, begitu juga label
netral dan negatif. Label netral dan negatif tidak ditampilkan dalam tulisan ini.

3.3. Pengelompokan Data Menggunakan Algoritma K-Medoids


Dokumen teks Twitter yang telah dibobot menggunakan TF-IDF dikelompokkan dengan
menggunakan algoritma K-Medoids dengan parameter k yang berbeda.

3.4. Label Positif Data Bencana Alam


Hasil cluster K-Medoids untuk data bencana alam dengan label positif ditunjukkan pada Tabel 2.
Tabel 2. Hasil Klaster Data Bencana Alam Label Positif
Siluet
No. K Jumlah Eksekusi
Indeks Kelomp Waktu (Detik)
ok
1 2 0.0530 2 169
2 3 0.0380 3 142
3 4 0.0842 4 228
4 5 0.0805 5 220
6
5 6 0.0687 6 171
Konferensi Tahunan Penelitian Ilmu Pengetahuan dan Teknologi Penerbitan IOP
(ACOSTER)
Jurnal Fisika: 2020
Seri Konferensi 1783 (2021) 012016 doi:10.1088/1742-6596/1783/1/012016

Siluet Jumlah Eksekusi


No. K Indeks Kelompok Waktu (Detik)
6 7 0.0836 7 235
7 8 0.1048 8 207
8 9 0.1208 9 256
9 10 0.0925 10 236
Waktu eksekusi rata-rata(detik) 207.11

3.5. Validitas Klaster


Validitas cluster bertujuan untuk mendapatkan cluster terbaik dari beberapa percobaan yang telah
dilakukan dengan menggunakan Silhouette Index (SI). Nilai SI terbaik adalah yang paling besar atau
mendekati 1. Perbandingan nilai SI terbaik dari data bencana alam label positif, negatif dan netral dari
algoritma DBSCAN dan K-Medoids dapat dilihat pada Gambar 2.

Perbandingan nilai SI terbaik


1 0.9371 0.9244 0.8807

0.8

0.6
0.4079
0.4

0.1208 0.1489
0.2

0
Positif Netral Negatif

DBSCANK-Medoids

Gambar 2. Perbandingan nilai SI terbaik

4. Kesimpulan
Algoritma DBSCAN memiliki validitas klaster Silhouette Index (SI) tertinggi dengan rata-rata 0.9140
dan waktu eksekusi rata-rata 83.40 detik. Sedangkan algoritma K-Medoids memiliki nilai SI sebesar
0.2258 dengan rata-rata waktu eksekusi 849.93 detik. Frekuensi kata "gempa bumi" mendominasi
untuk kategori positif, kata "bencana" mendominasi kategori negatif, dan kata "banjir dan gempa
bumi" mendominasi kategori netral. Pada tabel kategori positif, untuk analisis lebih lanjut, berisi
ungkapan empati atau kepedulian masyarakat terhadap peristiwa gempa bumi yang terjadi di
Indonesia. Sedangkan pada tabel kategori netral, berisi informasi tentang peristiwa bencana alam
seperti banjir dan gempa bumi, dan pada tabel kategori negatif, berisi kritikan kepada pemerintah
terkait penanggulangan bencana alam.

Referensi
[1] A. A. Alalwan, N. P. Rana, Y. K. Dwivedi, and R. Algharabat, "Media sosial dalam
pemasaran: Sebuah tinjauan dan analisis literatur yang ada," Telemat. Informatika, vol. 34, no.
7, pp. 1177- 1190, 2017.
[2] F. Anwar, "Perubahan dan Permasalahan Media Sosial," J. Muara Ilmu Sos. Humaniora, dan
Seni, vol. 1, no. 1, p. 137, 2017.
[3] A. Rossi, T. Lestari, R. Setya Perdana, and M. A. Fauzi, "Analisis Sentimen Tentang Opini
Pilkada DKI 2017 Pada Dokumen Twitter Berbahasa Indonesia Menggunakan Näive Bayes
dan Pembobotan Emoji," J. Pengemb. Teknol. Inf. dan Ilmu Komput. , vol. 1, no. 12, pp. 1718-
1724, 2017.
[4] N. Öztürk dan S. Ayvaz, "Analisis sentimen di Twitter: Sebuah pendekatan penambangan teks
untuk kasus Suriah

7
Konferensi Tahunan Penelitian Ilmu Pengetahuan dan Teknologi Penerbitan IOP
(ACOSTER)
Jurnal Fisika: 2020
Seri Konferensi 1783 (2021) 012016 doi:10.1088/1742-6596/1783/1/012016

krisis pengungsi," Telemat. Informatika, vol. 35, no. 1, hlm. 136-147, 2018.
[5] R. Fattah, "Twitter Text Mining Untuk Informasi Gempa Bumi Menggunakan Tf-Idf Di
Indonesia," Universitas Islam Negeri Maulana Malik Ibrahim, 2016.
[6] Fatimahsyam, "Pengintegrasian Pengurangan Risiko Bencana Dengan Pendekatan Mazhab
Antroposentris," Subtantia, vol. 20, no. Maret, pp. 49-65, 2018.
[7] Ramadhan and M. Iqbal, "Penerapan Data Mining Untuk Analisis Data Bencana Milik BNPB
Menggunakan Algoritma K-Means Dan Linear Regression," J. Inform. dan Komput. , vol. 22,
no. 1, pp. 567-65, 2017.
[8] N. G. I. Reza, "Penerapan Algoritma Dbscan Untuk Pencarian Trend Topik Pilkada Pekanbaru
2017 Pada Twitter," 2018.
[9] R. N. G. Indah, R. Novita, O. B. Kharisma, R. Vebrianto, S. Sanjaya, T. Andriani, W. P. Sari,
Y. Novita, and R. Rahim, "Algoritma DBSCAN: pengelompokan teks twitter topik tren pilkada
pekanbaru," in Journal of Physics: Conference Series, 2019, vol. 1363, no. 1, p. 12001.
[10] S. Dang dan P. H. Ahmad, "Penambangan Teks : Teknik dan Aplikasinya," Int. J. Eng.
Technol. Innov. , vol. 1, no. 4, pp. 22-25, 2014.
[11] R. Feldman dan J. Sanger, Buku Pegangan Penambangan Teks. Cambridge University Press,
2006.
[12] Z. Ramadhan, Aditya, Mustakim, Efendi, "Perbandingan K-Means dan Fuzzy C-Means untuk
Pengelompokan Data User Knowledge Modeling," Semin. Nas. Teknol. Informasi, Komun. dan
Ind. 9, pp. 18-19, 2017.
[13] L. Alfi, I. Atastina, and A. Herdiani, "Analisis Dan Implementasi Community Detection
Menggunakan Algoritma Dbscan Pada Twitter," e-Proceeding Eng. , vol. 5, no. 1, pp. 1469-
1476, 2018.
[14] S. Vijayarani, M. J. Ilamathi, M. Nithya, A. Profesor, dan M. P. Research Scholar,
"Preprocessing Techniques for Text Mining -An Overview," Int. J. Comput. Sci. komun.
Networks, vol. 5, no. 1, pp. 7-16.
[15] S. García, J. Luengo, and F. Herrera, "Tutorial tentang tips praktis algoritma prapemrosesan
data yang paling berpengaruh dalam penambangan data," Knowledge-Based Syst. , vol. 98,
hlm. 1-29, 2016.
[16] U. Erra, S. Senatore, F. Minnella, and G. Caggianese, "Perkiraan TF-IDF Berdasarkan
Ekstraksi Topik dari Aliran Pesan Masif Menggunakan GPU," Inf. Sci (Ny). , vol. 292, pp. 143-
161, 2015.
[17] X. Ester, Martin, Krigel, Hans-Peter, Sander, Jorg, Xu, "Density-Based Clustering Methods,"
Compr. Chemom. , vol. 2, pp. 635-654, 1996.
[18] M. Patwary, D. Palsetia, A. Agrawal, W. K. Liao, F. Manne, and A. Choudhary, "A new
Scalable Parallel DBSCAN Algorithm Using the Disjoint-Set Data Structure," Int. Conf. High
Perform. Comput. Networking, Storage Anal. SC, 2012.
[19] S. A. D. Budiman, D. Safitri, and I. Dwi, "Perbandingan Metode K-Means dan Metode Dbscan
pada Pengelompokan Rumah Kost Mahasiswa di Kelurahan Tembalang Semarang," J.
Gaussian, vol. 5, no. 4, pp. 757-762, 2016.
[20] P. Arora, Deepali, and S. Varshney, "Analisis Algoritma K-Means dan K-Medoids untuk Big
Data," Phys. Procedia, vol. 78, no. Desember 2015, pp. 507-512, 2016.
[21] T. Santhanam and T. Velmurugan, "Kompleksitas Komputasi antara Algoritma K-Means dan
K-Medoids Clustering untuk Distribusi Normal dan Seragam Titik Data," J. Comput. Sci. , vol.
6, no. 3, pp. 363-368, 2010.
[22] Z. Mustofa and I. S. Suasana, "Algoritma Clustering K-Medoids pada E-Goverment Bidang
Informasi dan Komunikasi," J. Teknol. Inf. dan Komun. , vol. 9, no. 1, pp. 1-10, 2018.
[23] W. Gata, "Akurasi Text Mining Menggunakan Algoritma K-Nearest Neighbour pada Data
Content Berita SMS," J. Format, vol. 6, pp. 1-13, 2017.

Anda mungkin juga menyukai