Skripsi Tugas Akhir Selesai Revisi
Skripsi Tugas Akhir Selesai Revisi
TUGAS AKHIR
Diajukan sebagai usulan pembuatan tugas akhir
pada Program Studi Teknik Informatika
oleh :
MUHAMAD IRFAN FADILLAH
NIM : 18416255201213
NIM : 18416255201213
i
LEMBAR PENGESAHAN
PENGELOMPOKAN DATA KUNJUNGAN WISATAWAN ASING KE
INDONESIA DI MASA PANDEMI COVID-19 DENGAN
MENGGUNAKAN ALGORITMA K-MEANS
DATA CLASIFICATION OF FOREIGN TOURIST TO INDONESIA
DURING THE COVID-19 PANDEMIC USING K-MEANS ALGORITHM
NIM : 18416255201213
MUHAMAD IRFAN FADILLAH
Tugas akhir ini telah diterima dan disahkan untuk memenuhi
sebagian syarat memperoleh gelar sarjana
pada Program Studi Teknik Informatika
Fakultas Teknik dan Ilmu Komputer
Universitas Buana Perjuangan Karawang
Karawang, 13 Agustus 2022
ii
KATA PENGANTAR
Segala puji bagi Allah yang maha kuasa berkat limpahan karunianya saya
dapat menyelesaikan Tugas Akhir yang berjudul “Pengelompokan Data
Kunjungan Wisatawan Asing Ke Indonesia Di Masa Pandemi Covid-19
Dengan Menggunakan Algoritma K-Means” dengan lancar. Dalam proses
penulisan ini tak lepas dari bantuan, arahan dan masukan dari berbagai pihak.
Penulis mengucapkan terima kasih kepada:
1. Prof. H. Dedi Mulyadi, S.E., MM., Selaku Rektor Universitas Buana
Perjuangan Karawang;
2. Dr. Ahmad Fauzi, M.Kom., Selaku Dekan Fakultas Ilmu Komputer
Universitas Buana Perjuangan Karawang
3. Jamaludin Indra, M.Kom., Selaku Koordinator Program Studi Teknik
Informatika Universitas Buana Perjuangan Karawang, yang menerima penulis
dengan baik untuk berkonsultasi
4. Tatang Rohana, M.Kom., Selaku Koordinator Tugas Akhir Program Studi
Teknik Informatika Universitas Buana Perjuangan Karawang;
5. Ayu Ratna Juwita, M.Kom., Selaku Pembimbing I yang telah memberikan
bimbingan pembuatan tugas akhir
6. Cici Emilia Sukmawati, M.Kom., Selaku Pembimbing II yang telah
memberikan bimbingan tata cara menulis karya ilmiah dengan benar,
7. Segenap Dosen Fakultas Ilmu Komputer yang telah mendidik dan
memberikan ilmu selama perkuliahan beserta seluruh Staff yang telah melayani
administrasi selama proses penelitian ini
8. Orang Tua saya yang telah mendukung berjalannya proses penelitian ini
9. Kepada teman-teman kuliah saya yang telah mendukung dan membantu
saya dalam penelitian ini
Karawang, 06 Agustus 2022
Penulis,
iii
LEMBAR PERNYATAAN
Yang Menyatakan,
iv
ABSTRAK
Pariwisata adalah salah satu sektor yang terdampak paling awal oleh
pandemi Covid-19, mengingat salah satu cara menekan kenaikan jumlah kasus
adalah dengan membatasi mobilitas manusia. Secara global, sektor pariwisata
diprediksi merugi 4.700 triliun rupiah per Juni 2020. Data yang kini disajikan
Badan Pusat Statistik hanya berisi data yang masih mentah dan belum diolah
lebih jauh lagi, misalnya saja belum dikelompokan menggunakan tools dengan
berbagai cara kajian ilmiah, hanya berisi himpunan data saja, diperlukan
pengolahan data lebih jauh lagi, dan urgensi permasalahan data ini penulis
ambil untuk mengklasifikasikan dataset wisatawan asing yang berkunjung ke
Indonesia menggunakan Algoritma K-Means dengan memisahkan datanya
menjadi 3 jenis cluster, dan menggunakan 3 cara perhitungan yaitu
menggunakan Microsoft Excel atau perhitungan manual, Rapid Miner, dan juga
Python. Berdasarkan hasil penelitian dengan excel, rapid miner dan python
pada kunjungan wisata ke Indonesia tahun 2020, perhitungan dengan excel
menunjukan cluster pertama yaitu terdapat 49 negara, untuk cluster kedua
tidak ada, dan untuk cluster ketiga terdapat 2 negara, sedangkan hasil
clustering dengan rapid miner menunjukan ada 49 negara berada cluster
pertama, untuk cluster ke dua terdapat satu negara, lalu untuk cluster ketiga
terdapat satu negara, untuk hasil clustering dengan python menunjukan ada 46
negara berada cluster pertama, cluster ke dua terdapat 2 negara, dan cluster
ketiga terdapat 3 negara. ke dua terdapat 1 negara, dan untuk cluster ketiga
terdapat 1 negara.
Kata Kunci: Pandemi, clustering, covid-19, wisatawan asing.
v
ABSTRACT
Tourism is one of the sectors that was most affected by the Covid-19
pandemic, considering that one way to suppress the increase in the number of
cases is to limit human mobility. Globally, the tourism sector is predicted to
lose 4,700 trillion rupiah as of June 2020. The data that is now presented by the
Central Statistics Agency only contains data that is still raw and has not been
processed further, for example, it has not been grouped using tools in various
ways of scientific studies, it only contains datasets, further data processing is
needed, and the urgency of this data problem, the author took to classify the
dataset of foreign tourists visiting Indonesia using the K-Means Algorithm by
separating the data into 3 types of clusters, and using 3 calculation methods,
namely using Microsoft Excel or manual calculations, Rapid Miner, and also
Python, based on the results of research with excel, rapid miner and python on
a tourist visit to Indonesia in 2020, calculations with excel show that the first
cluster is 49 countries, for the second cluster there are none, and for the third
cluster there are 2 countries, while the results of clustering with rapid miner
show that there are 49 countries in the first cluster, for the second cluster there
is one country, then for the third cluster there is one country, for the results of
clustering with python, there are 46 countries in the first cluster, the second
cluster there are 2 countries, and the third cluster there are 3 countries. to the
second there is 1 country, and for the third cluster there is 1 country.
vi
DAFTAR ISI
LEMBAR PERSETUJUANi
LEMBAR PENGESAHANii
LEMBAR PERNYATAANiii
DAFTAR TABELiv
DAFTAR GAMBARvi
DAFTAR LAMPIRANvii
KATA PENGANTAR..........................................................................................iii
ABSTRAK..............................................................................................................v
ABSTRACT...........................................................................................................vi
BAB I PENDAHULUAN.......................................................................................1
1.4 Manfaat..........................................................................................................3
2.2 Algoritma.......................................................................................................4
2.4 Clustering.......................................................................................................7
2.5 Covid-19.........................................................................................................7
2.6 Pandemi..........................................................................................................8
2.7 Wisatawan......................................................................................................8
vii
2.9 Python............................................................................................................9
5.1 Kesimpulan...................................................................................................48
5.2 Saran..............................................................................................................49
DAFTAR PUSTAKA...........................................................................................50
LAMPIRAN..........................................................................................................53
viii
Lampiran 1.1 Lembar Bimbingan Proposal T.A....................................................53
Lampiran 1.4 Dataset Kunjungan Wisatawan Asing Ke Indonesia Tahun 2020. .56
Lampiran 1.5 Dataset Kunjungan Wisatawan Asing Ke Indonesia Tahun 2021. .58
RIWAYAT PENULIS..........................................................................................62
DAFTAR TABEL
DAFTAR GAMBAR
Gambar 2.1. Tahapan Data Mining.........................................................................4
Gambar 3.1. Alur Penelitian..................................................................................14
Gambar 3.2. Tahapan Algoritma K-Means............................................................16
Gambar 4.1. Proses Seleksi Data...........................................................................19
Gambar 4.2. Proses Pembersihan Data..................................................................19
Gambar 4.3. Tampilan Awal Rapid Miner............................................................37
Gambar 4.4. Menambahkan Data..........................................................................37
ix
Gambar 4.5. Pilih My Computer............................................................................38
Gambar 4.6. Pilih File Excel Yang Akan Digunakan............................................38
Gambar 4.7. Memilih Atribut Yang Ingin Di Proses.............................................39
Gambar 4.8. Koneksikan Database Ke Dalam Proses K-Means...........................39
Gambar 4.9. Parameter Clustering K-Means.........................................................40
Gambar 4.10. Hasil Cendroid Akhir......................................................................40
Gambar 4.11. Source Code Library Dan Hasil Menyisipkan Data.......................41
Gambar 4.12. Source Code Dan Hasil Grafik Data...............................................42
Gambar 4.13. Source Code K-Means Dan Hasil Clustering..................................42
Gambar 4.14. Hasil Evaluasi .................................................................................43
DAFTAR LAMPIRAN
Lampiran 1.1 Form Bimbingan Proposal T.A.......................................................53
Lampiran 1.2 Lembar Perbaikan Penguji Seminar Proposal.................................54
Lampiran 1.3 Lembar Bimbingan T.A...................................................................55
Lampiran 1.4 Dataset Kunjungan Wisatawan Asing Ke Indonesia Tahun 2020...56
Lampiran 1.5 Dataset Kunjungan Wisatawan Asing Ke Indonesia Tahun 2021...58
x
BAB I
PENDAHULUAN
1.1 Latar Belakang
Pariwisata menjadi salah satu hal yang paling terdampak dari pandemi
COVID-19, mengingat salah satu cara untuk menahan peningkatan jumlah
orang yang terinfeksi adalah dengan membatasi pergerakan manusia. Secara
global, sektor pariwisata diperkirakan merugi Rp4.700 triliun pada Juni 2020.
Jumlah pengangguran yang diciptakan oleh sektor industri ini di seluruh dunia
diperkirakan 108 juta. Selain itu, kedatangan wisatawan pada paruh pertama
tahun 2020 diperkirakan akan turun drastis menjadi 65% di seluruh dunia. Di
Indonesia, pandemi COVID-19 juga memukul sektor pariwisata. Jumlah
wisatawan asing turun 68,17 persen dari Januari hingga Agustus 2020
dibandingkan tahun 2019 (Kementerian Kesehatan Republik Indonesia,
2020). Banyak pekerja pariwisata harus diberhentikan dan banyak perusahaan
di sektor jasa pariwisata bangkrut.
Penelitian ini dilakukan oleh (Maulida, 2018) dan penelitian
menunjukkan bahwa 5 tempat wisata teratas di cluster terendah adalah catatan
pemerintah provinsi DKI Jakarta. Perbaikan infrastruktur objek wisata utama
dapat meningkatkan jumlah kunjungan wisatawan, yang akan berdampak pada
pengenalan objek wisata dan peningkatan transaksi devisa dalam negeri.
1
2
2.2 Algoritma
Menurut Munir (2012) Algoritma adalah urutan logis langkah-langkah
penyelesaian masalah yang disusun secara sistematis. Metode pengurutan
digambarkan dalam sejumlah langkah terbatas yang mengarah pada solusi
permasalahan.
4
5
1. Jumlah Cluster K
2. Cluster Awal
3. Ukuran Jarak
6
Untuk mengukur jarak antar data dengan pusat dengan cluster digunakan
euclidian distance, Algoritma perhitungan jarak data dengan pusat cluster:
√
n
d ( x j , c j )= ∑ (x j−c j )2
j=1
d = Jarak
j = banyaknya data
c = centroid
x = data
3. Pengelompokan data
Untuk mendapatkan pusat cluster baru bisa dihitung dari rata-rata nilai
anggota cluster dan pusat cluster. Pusat cluster yang baru digunakan untuk
melakukan iterasi selanjutnya, jika hasil yang didapatkan belum konvergen.
Proses iterasi akan berhenti jika telah memenuhi maksimum iterasi yang
dimasukkan oleh user atau hasil yang dicapai sudah konvergen (pusat cluster
baru sama dengan pusat cluster lama).
2.4 Clustering
Clustering merupakan proses pengelompokan suatu objek ke dalam
kelompok-kelompok yang berbeda atau tepatnya memgelompokan suatu
dataset menjadi subsets berdasarkan kemiripan datanya (Primartha, 2018).
2.5 Covid-19
Menurut (Kementerian Kesehatan Republik Indonesia, 2020),
Coronavirus (CoV) adalah keluarga besar dari virus yang dapat menyebabkan
penyakit dengan gejala ringan, sedang hingga berat. Coronavirus bersifat
zoonosis (menular antara hewan dan manusia). Studi menunjukkan bahwa
SARS-CoV ditularkan dari kucing luwak ke manusia, dan MERS-CoV
ditularkan dari unta ke manusia. Di penghujung tahun 2019, muncul varian
baru dari coronavirus, yaitu coronavirus disease 2019 (COVID-19).
2.6 Pandemi
Dilansir oleh Wikipedia Pandemi adalah epidemi penyakit yang
menyebar di wilayah yang luas, seperti beberapa benua, atau di seluruh dunia.
Penyakit yang menyebar luas dengan jumlah kasus yang stabil bukan
merupakan pandemi. Peristiwa pandemi influenza biasanya mengecualikan
kasus influenza musiman. Banyak pandemi penyakit terjadi. Salah satu
pandemi yang paling mematikan adalah Black Death, menewaskan sekitar 75-
200 juta orang di abad ke-14.
Pandemi adalah epidemi yang terjadi dalam skala besar melintasi batas
negara dan biasanya mempengaruhi sejumlah besar orang. Suatu penyakit atau
kondisi bukanlah pandemi hanya karena menyebar luas atau membunuh
banyak orang. penyakit atau kondisi harus menular. (Porta, 2019)
2.7 Wisatawan
Seseorang bisa disebut turis ketika dia bepergian untuk mengunjungi
tempat tertentu untuk liburan, bisnis, olahraga, terapi atau bahkan studi.
(Suryadana, 2015). Berbanding lurus dengan pernyataan sebelumnya, (Oka A.
Yoeti, 2006) Wisatawan adalah orang yang karena alasan apa pun melakukan
perjalanan ke suatu tempat tujuan selain tempat tinggalnya dan tidak bekerja
atau bekerja di sana.
2.9 Python
Python adalah bahasa pemrograman komputer yang dirancang khusus
untuk membuat kode sumber yang dapat dibaca. Bahasa pemrograman Python
memiliki library lengkap yang memudahkan programmer untuk membuat
aplikasi yang diinginkan dengan kode sumber yang terlihat sederhana.
(Anggraeni, 2019).
Python hadir dengan pustaka standar yang dapat diperluas yang dapat
dipelajari hanya dalam beberapa hari. Python bertujuan untuk menjadi bahasa
yang menggabungkan keterampilan dan kemampuan dengan sintaks kode
yang sangat jelas, dan perpustakaan fitur standar yang besar dan komprehensif.
(Nugroho, P. A., Fenriana, I., & Arijanto, 2020).
10
JADWAL PENELITIAN
KETERANGAN
Studi Literatur
Identifikasi Masalah
Pengumpulan Data
Pembuatan Proposal
Beserta Bimbingan
Implementasi dan
Evaluasi
13
14
Pada tahap ini dataset akan di cek dan diperbaiki lagi untuk
memastikan data tersebut siap untuk diolah misalnya saja seperti menghapus
data yang kosong ataupun merapikan dataset ataupun menambahkan titik
sebelum di olah menggunakan Algoritma K-Means
1. Menentukan K cluster
19
20
√∑
n
d ( x j , c j )= (x j−c j )2
j=1
Dimana: d = Jarak
22
j = banyaknya data
c = centroid
x = data
Jarak centroid data ke-1 pada cluster 1 adalah:
SQRT((C15-$C$9)^2)+((D15-$D$9)^2)+((E15-$E$9)^2)+((F15-$F$9)^2)+
((G15-$G$9)^2)+((H15-$H$9)^2)+((I15-$I$9)^2)+((J15-$J$9)^2)+((K15-
$K$9)^2)+((L15-$L$9)^2)=1531
Jarak centroid data ke-1 pada cluster 2 adalah:
=SQRT((C15-$C$8)^2)+((C15-$C$8)^2)+((D15-$D$8)^2)+((E15-$E$8)^2)+
((F15-$F$8)^2)+((G15-$G$8)^2)+((H15-$H$8)^2)+((I15-$I$8)^2)+((J15-
$J$8)^2)+((K15-$K$8)^2)+((L15-$L$8)^2)=1486703
Jarak centroid data ke-1 pada cluster 3 adalah:
=SQRT((C15-$C$7)^2)+((C15-$C$7)^2)+((D15-$D$7)^2)+((E15-$E$7)^2)+
((F15-$F$7)^2)+((G15-$G$7)^2)+((H15-$H$7)^2)+((I15-$I$7)^2)+((J15-
$J$7)^2)+((K15-$K$7)^2)+((L15-$L$7)^2)=72293204336
JARAK
CLUST
KEBANGSAAN C1 C2 C3 TERPEND
ER
EK
72293204
Brunei Darussalam 1531 1486703 1531 1
336
27671709 40303153 65698447
Malaysia 6569844744 3
488 825 44
69139485
Philippines 14869758 39813686 14869758 1
985
15589337 62430556
Singapore 24612172 24612172 1
38 887
71251398
Thailand 1207078 2002300 1207078 1
115
71741332
Vietnam 395478 137408 137408 2
339
23
71257168
Myanmar/Burma 3117657 2239172 2239172 2
517
69070713 65640371
Indonesia 7296648 7296648 1
5 554
72204216
Hong Kong 108320 2052154 108320 1
707
11901239 68795071
India 4479269 4479269 1
2 175
14094329 68979013
Japan 1746586 1746586 1
5 756
70192009
South Korea 4363441 23033532 4363441 1
325
72176931
Pakistan 30047 784564 30047 1
917
71989442
Bangladesh 89824 141991 89824 1
768
72212810
Srilanka 17915 1120215 17915 1
766
71725126
Taiwan 184870 317526 184870 1
061
21920534 22118144 65207860
China 219205343 1
3 2 799
59307294 66322788 79368975
Timor Leste 793689756 3
324 555 6
72113924
Turki 58099 689348 58099 1
867
71781292
Saudi Arabia 103307 268739 103307 1
386
72211213
Egypt 20967 1026275 20967 1
336
72348551
Uni Emirat Arab 5844 2375206 5844 1
335
72371017
Iran 2214 2503085 2214 1
210
72365202
Israel 7194 2664610 7194 1
301
72147457
Austria 40868 602701 40868 1
872
71965614
Denmark 11609 91596 11609 1
035
70328204
France 858555 42512119 858555 1
998
69744124
Germany 650512 90448934 650512 1
119
71824797
Italy 282528 48073 48073 2
628
67993642
Netherlands 39789062 79713201 39789062 1
364
71710743
Spain 200692 372209 200692 1
844
72120246
Portugal 5022 302632 5022 1
083
24
71216334
Sweden 1255482 2295863 1255482 1
500
71977728
Switzerland 48654 35519 35519 2
886
17953425 68808634
United Kingdom 1044501 1044501 1
3 656
72162910
Irlandia (Ireland) 4129 477860 4129 1
447
13746810 68676959
Rusia 19267545 19267545 1
2 045
71974084
Polandia 39563 36475 36475 2
776
72217762
Romania 13993 1080530 13993 1
459
71455270
Ukraine 1213463 1477616 1213463 1
459
72301514
Yunani (Greece) 12003 1949828 12003 1
013
United States of 17381355 66977743
30960397 30960397 1
America 8 235
71418067
Canada 102799 4768469 102799 1
736
72253753
Argentina 715 1031050 715 1
597
72066455
Brazilia 45194 302587 45194 1
570
72287897
Mexiko 724 1367580 724 1
457
17737443 63949958
Australia 767880 767880 1
34 399
71506401
New Zealand 13587 4877614 13587 1
041
70432325
Papua New Guinea 12864960 10807052 10807052 2
615
72047422
South Africa 15808 103411 15808 1
270
72328098
Maroko 393 1769720 393 1
767
Sumber: Pengolahaan Data, 2022
Iterasi 2
25
18872283,7 4179656552
Srilanka
3 - 3 18872283,73 1
16639937,7 4169082701
Taiwan
5 - 0 16639937,75 1
122151617, 3689303909
China
2 - 0 122151617,2 1
5715576435
Timor Leste
9 - 1642475272 1642475272 3
17997128,5 4175547767
Turki
9 - 1 17997128,59 1
17408920,8 4172536107
Saudi Arabia
3 - 4 17408920,83 1
19027919,5 4180554512
Egypt
7 - 0 19027919,57 1
19341241,1 4181821949
Uni Emirat Arab
8 - 6 19341241,18 1
19601973,2 4183021557
Iran
2 - 9 19601973,22 1
19271533,3 4181412718
Israel
4 - 1 19271533,34 1
4179857689
Austria
18856093,1 - 4 18856093,1 1
19350612,7 4182007798
Denmark
5 - 5 19350612,75 1
15329850,8 4161667765
France
3 - 1 15329850,83 1
15977837,9 4165375073
Germany
6 - 9 15977837,96 1
15939016,5 4165644623
Italy
7 - 1 15939016,57 1
10691607,6 3973176852
Netherlands
7 - 7 10691607,67 1
16568815,7 4168819025
Spain
9 - 1 16568815,79 1
19501218,8 4182602044
Portugal
1 - 0 19501218,81 1
11334853,4 4139504316
Sweden
3 - 7 11334853,43 1
18722053,4 4179239089
Switzerland
3 - 1 18722053,43 1
13668009,0 4153063681
United Kingdom
4 - 5 13668009,04 1
19642031,4 4183297095
Irlandia (Ireland)
9 - 4 19642031,49 1
19169539,1 4104808965
Rusia
2 - 4 19169539,12 1
18789550,1 4179535141
Polandia
8 - 6 18789550,18 1
19046310,2 4180527473
Romania
2 - 9 19046310,22 1
4153167942
Ukraine
13831167,2 - 1 13831167,2 1
29
19071342,5 4180612607
Yunani (Greece)
9 - 1 19071342,59 1
United States of 4930611,73 3981372417
America 1 - 4 4930611,731 1
17582810,0 4173772035
Canada
6 - 9 17582810,06 1
19932743,2 4184530035
Argentina
8 - 8 19932743,28 1
18350413,0 4177233522
Brazilia
6 - 3 18350413,06 1
19880109,6 4184284945
Mexiko
3 - 5 19880109,63 1
14046958,7 4155368811
Australia
3 - 7 14046958,73 1
19218442,4 4181336443
New Zealand
7 - 5 19218442,47 1
1382104,24 4043400364
Papua New Guinea
2 - 0 1382104,242 1
19200055,2 4181347353
South Africa
2 - 6 19200055,22 1
19926267,8 4184490170
Maroko
9 - 0 19926267,89 1
Sumber: Pengolahaan Data, 2022
Karena tidak ada data yang berpindah cluster, maka proses perhitungan
centroid yang baru dihentikan dan berakhir pada iterasi ke-3.
Tabel 4.7 Centroid Data Kunjungan Wisatawan Asing 2021
√∑
n
d ( x j , c j )= (x j−c j )2
j=1
Dimana: d = Jarak
j = banyaknya data
c = centroid
x = data
Jarak centroid data ke-1 pada cluster 1 adalah:
=SQRT((C10-$C$4)^2)+((D10-$D$4)^2)+((E10-$E$4)^2)+((F10-$F$4)^2)+
((G10-$G$4)^2)+((H10-$H$4)^2)+((I10-$I$4)^2)+((J10-$J$4)^2)+((K10-
$K$4)^2)+((L10-$L$4)++((M10-$M$4)+((N10-$N$4)^2)))=15202859
Jarak centroid data ke-1 pada cluster 2 adalah:
=SQRT((O10-$N$3)^2)+((D10-$C$3)^2)+((E10-$D$3)^2)+((F10-$E$3)^2)+
((G10-$F$3)^2)+((H10-$G$3)^2)+((I10-$H$3)^2)+((J10-$I$3)^2)+((K10-
$J$3)^2)+((L10-$K$3)^2)+((M10-$L$3)^2)+((N10-$M$3)^2)=52878291294
Jarak centroid data ke-1 pada cluster 3 adalah:
=SQRT((C10-$C$2)^2)+((D10-$D$2)^2)+((E10-$E$2)^2)+((F10-$F$2)^2)+
((G10-$G$2)^2)+((H10-$H$2)^2)+((I10-$I$2)^2)+((J10-$J$2)^2)+((K10-
$K$2)^2)+((L10-$L$2)^2)+((M10-$M$2)^2)+((N10-$N$2)^2)=52426203892
JARAK
CLUST
Kebangsaan C1 C2 C3 TERPEND
ER
EK
16517360 52878291 52426203 16517360 1
Brunei Darussalam
294 892
14107285 24304319 96457717 96457717 3
Malaysia
052 844 55 55
6981256 51679325 51277069 6981256 1
Philippines
974 499
11338266 50670978 50292940 11338266 1
Singapore
880 056
11972874 52097540 51674157 11972874 1
Thailand
867 634
13414509 52626659 52186066 13414509 1
Vietnam
064 438
16258254 52864753 52413144 16258254 1
Kamboja
516 702
31
638 417
15319512 52783650 52335031 15319512 1
Belgium
102 246
15692900 52817531 52368460 15692900 1
Denmark
613 083
10700876 52350537 51917979 10700876 1
France
330 676
11104559 52403055 51969384 11104559 1
Germany
047 965
13167714 52570879 52130862 13167714 1
Italy
980 301
3326782 51239068 50862029 3326782 1
Netherlands
923 451
10605606 52431595 51999637 10605606 1
Spain
375 063
15602926 52824713 52375088 15602926 1
Portugal
934 148
10897172 52425695 51997875 10897172 1
Sweden
923 760
15296779 52784668 52336071 15296779 1
Switzerland
705 582
8851257 52151436 51728257 8851257 1
United Kingdom
986 227
16109239 52848034 52396845 16109239 1
Norway
524 716
16200007 52856001 52404642 16200007 1
Irlandia (Ireland)
685 543
10143793 51655553 51237246 10143793 1
Rusia
098 136
8844063 51757326 51339998 8844063 1
Other East Europe
187 629
16378387 52868405 52416301 16378387 1
Bulgaria
964 259
15863737 52826008 52375452 15863737 1
Ceko
891 610
16014485 52842422 52391688 16014485 1
Croasia
895 526
16369672 52867843 52416025 16369672 1
Estonia
896 644
16562071 52882138 52429602 16562071 1
Georgia
105 427
16338249 52866795 52414718 16338249 1
Hongaria 260 088
16160208 52849524 52398036 16160208 1
Latvia 314 743
16363348 52867392 52415408 16363348 1
Lithuania 825 128
33
564 338
Sumber: Pengolahaan Data, 2022
,25
32583464068
Maladewa 745414,84 0 745414,8392 1
,25
39861629308 2411449051,
Timor Leste 0 2411449051 3
,00 25
32469427074
Turki 401950,47 0 401950,4707 1
,25
32380221410
Saudi Arabia 435097,60 0 435097,6023 1
,25
32588061690
Bahrain 764857,94 0 764857,9444 1
,25
32525971405
Egypt 536343,63 0 536343,6286 1
,25
32552707231
Uni Emirat Arab 615168,87 0 615168,8655 1
,25
32558943718
Iran 660002,52 0 660002,5234 1
,25
32544074114
Israel 574090,68 0 574090,6813 1
,25
32573051086
Jordan 698570,97 0 698570,9707 1
,25
32571471760
Syiria 680366,76 0 680366,7602 1
,25
32371697285
Austria 203609,08 0 203609,076 1
,25
32505560158
Belgium 446775,31 0 446775,3128 1
,25
32532106259
Denmark 554397,97 0 554397,9707 1
,25
32177997627
France 81858,81 0 81858,81285 1
,25
32217966457
Germany 51357,15 0 51357,15495 1
,25
32345093267
Italy 114319,26 0 114319,2602 1
,25
31350709124
Netherlands 4235616,44 0 4235616,444 1
,25
32243198811
Spain 126793,37 0 126793,3655 1
,25
32537616885
Portugal 604972,81 0 604972,8128 1
,25
32239747454
Sweden 59530,55 0 59530,54969 1
,25
32506104994
Switzerland 451167,89 0 451167,8918 1
,25
32028976720
United Kingdom 207358,02 0 207358,0234 1
,25
32554711252
Norway 656425,39 0 656425,3918 1
,25
32560432669
Irlandia (Ireland) 653057,87 0 653057,8655 1
,25
Rusia 4206250,34 0 31645546094 4206250,339 1
36
,25
31720858994
Other East Europe 2292056,52 0 2292056,523 1
,25
32569548915
Bulgaria 684027,42 0 684027,4181 1
,25
32537474028
Ceko 555128,87 0 555128,8655 1
,25
32550222731
Croasia 608903,68 0 608903,6813 1
,25
32569500943
Estonia 692595,97 0 692595,9707 1
,25
32580121365
Georgia 721865,18 0 721865,1813 1
,25
32568496696
687178,23 0 687178,2339 1
Hongaria ,25
32555288084
623353,37 0 623353,3655 1
Latvia ,25
32569086671
695689,05 0 695689,0497 1
Lithuania ,25
32510529690
454621,60 0 454621,6023 1
Polandia ,25
32536410556
551361,55 0 551361,5497 1
Romania ,25
32262941070
100419,29 0 100419,2865 1
Ukraine ,25
32551385605
619649,52 0 619649,5234 1
Yunani (Greece) ,25
United States of 30387695903
22066225,02 0 22066225,02 1
America ,25
32455708749
336855,73 0 336855,7339 1
Canada ,25
32583011431
735631,10 0 735631,1023 1
Central America ,25
32440603781
256380,58 0 256380,576 1
South America ,25
32579403721
726251,81 0 726251,8128 1
Argentina ,25
32493839805
398789,50 0 398789,4971 1
Brazilia ,25
32581391484
735604,52 0 735604,5234 1
Kolombia ,25
32585926506
752498,76 0 752498,7602 1
Venezuela ,25
32579399213
738574,63 0 738574,6286 1
UNO ,25
32253581105
58976,63 0 58976,62864 1
Australia ,25
32539626209
563562,73 0 563562,7339 1
New Zealand ,25
29510287886
48719985,31 0 48719985,31 1
Papua New Guinea ,25
South Africa 552421,55 0 32531598556 552421,5497 1
37
,25
32581955450
737939,89 0 737939,8918 1
Aljazair / Algeria ,25
32587151626
759106,76 0 759106,7602 1
Ethiopia ,25
32572230804
700579,89 0 700579,8918 1
Maroko ,25
32586440730
759235,71 0 759235,7076 1
Mozambik ,25
32540798185
601163,63 0 601163,6286 1
Nigeria ,25
32580272501
731490,29 0 731490,2865 1
Sudan ,25
32581065690
736158,29 0 736158,2865 1
Tanzania ,25
Sumber: Pengolahaan Data, 2022
Karena tidak ada data yang berpindah cluster, maka proses perhitungan
centroid yang baru dihentikan dan berakhir pada iterasi ke-2.
Pada Gambar 4.6 pilih sebuah file Excel yang ingin ditambahkan ke
Rapidminer, lalu dilanjutkan dengan mengklik Next.
40
Ketika di klik pada tampilan centroid table seperti pada Gambar 4.10
maka akan muncul jumlah nilai centroid akhir pada setiap cluster.
4.4.3 Perhitungan Menggunakan Anaconda/Python
Perhitungan K-Means menggunakan python bertujuan untuk
memastikan kebenaran dalam perhitungan manual dan perhitungan rapid
miner yang telah dilakukan sebelumnya. berikut penerapan Algoritma K-
Means menggunakan python:
Pada gambar 4.11 menampilkan hasil dari running dari script untuk
import data dan menyisipkan data, dengan memanggil data yang sudah di
import sebelumnya.
43
Rapid Pytho
Excel Miner n
No Kebangsaan
Cluste Cluste
Cluster
r r
1 Brunei Darussalam 1 1 3
2 Malaysia 3 3 3
3 Philippines 1 1 1
4 Singapore 1 1 1
5 Thailand 1 1 1
6 Vietnam 1 1 2
7 Myanmar/Burma 1 1 1
8 Indonesia 1 1 1
9 Hong Kong 1 1 1
10 India 1 1 1
11 Japan 1 1 1
12 South Korea 1 1 1
13 Pakistan 1 1 1
14 Bangladesh 1 1 1
15 Srilanka 1 1 1
16 Taiwan 1 1 1
17 China 1 1 1
18 Timor Leste 3 2 3
19 Turki 1 1 1
20 Saudi Arabia 1 1 1
21 Egypt 1 1 1
22 Uni Emirat Arab 1 1 1
23 Iran 1 1 1
24 Israel 1 1 1
25 Austria 1 1 1
26 Denmark 1 1 1
27 France 1 1 1
28 Germany 1 1 1
29 Italy 1 1 1
30 Netherlands 1 1 1
31 Spain 1 1 1
32 Portugal 1 1 1
33 Sweden 1 1 1
34 Switzerland 1 1 1
35 United Kingdom 1 1 1
36 Irlandia (Ireland) 1 1 1
37 Rusia 1 1 1
38 Polandia 1 1 1
39 Romania 1 1 1
40 Ukraine 1 1 1
41 Yunani (Greece) 1 1 1
United States of
42 America 1 1 1
43 Canada 1 1 1
44 Argentina 1 1 1
45 Brazilia 1 1 1
46 Mexiko 1 1 1
47 Australia 1 1 2
48 New Zealand 1 1 1
49 Papua New Guinea 1 1 1
50 South Africa 1 1 1
51 Maroko 1 1 1
47
27 Iran 1 1 1
28 Israel 1 1 1
29 Jordan 1 1 1
30 Syiria 1 1 1
31 Austria 1 1 1
32 Belgium 1 1 1
33 Denmark 1 1 1
34 France 1 1 1
35 Germany 1 1 1
36 Italy 1 1 1
37 Netherlands 1 1 1
38 Spain 1 1 1
39 Portugal 1 1 1
40 Sweden 1 1 1
41 Switzerland 1 1 1
42 United Kingdom 1 1 1
43 Norway 1 1 1
44 Irlandia (Ireland) 1 1 1
45 Rusia 1 1 1
46 Other East Europe 1 1 1
47 Bulgaria 1 1 1
48 Ceko 1 1 1
49 Croasia 1 1 1
50 Estonia 1 1 1
51 Georgia 1 1 1
52 Hongaria 1 1 1
53 Latvia 1 1 1
54 Lithuania 1 1 1
55 Polandia 1 1 1
56 Romania 1 1 1
57 Ukraine 1 1 1
58 Yunani (Greece) 1 1 1
United States of
1
59 America 1 1
60 Canada 1 1 1
61 Central America 1 1 1
62 South America 1 1 1
63 Argentina 1 1 1
64 Brazilia 1 1 1
65 Kolombia 1 1 1
66 Venezuela 1 1 1
67 UNO 1 1 1
68 Australia 1 1 1
69 New Zealand 1 1 1
70 Papua New Guinea 1 1 1
71 South Africa 1 1 1
72 Aljazair / Algeria 1 1 1
73 Ethiopia 1 1 1
74 Maroko 1 1 1
49
75 Mozambik 1 1 1
76 Nigeria 1 1 1
77 Sudan 1 1 1
78 Tanzania 1 1 1
Sumber: Pengolahaan Data, 2022
Berdasarkan hasil penelitian dengan excel dan rapid miner, hasil
clustering dengan Microsoft Excel menunjukan ada 78 negara berada cluster.
Untuk cluster ke dua tidak ada. Untuk cluster ketiga terdapat 2 negara.
Berdasarkan hasil penelitian dengan rapid miner, hasil clustering dengan
RapidMiner menunjukan ada 78 negara berada cluster pertama. Untuk cluster
ke dua terdapat 1 negara. Untuk cluster ketiga terdapat 1 negara.
Berdasarkan hasil penelitian dengan python, hasil clustering dengan
python menunjukan ada 76 negara berada cluster pertama. Untuk cluster ke
dua terdapat 1 negara. Untuk cluster ketiga terdapat 1 negara.
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Berdasarkan hasil penelitian dapat disimpulkan dalam penelitian ini
adalah :
1. Berdasarkan yang sudah dilakukan dalam penelitian ini menerapkan
Algoritma K-Means Clustering memerlukan berbagai tahap untuk
memproses data kunjungan wisatawan asing yaitu melalui tahap
pengumpulan data, seleksi data, pembersihan data setelah itu baru
mengimplementasikan Algoritma K-Means dengan menggunakan 3 tools
& 3 cara perhitungan yaitu menggunakan Microsoft Excel, Rapid Miner,
dan juga Python dan setelah mendapatkan hasil dilakukan evaluasi data
dengan Silhouette Coefficient.
2. Berdasarkan hasil penelitian dengan excel, rapid miner dan python
pada kunjungan wisata ke Indonesia tahun 2020, perhitungan dengan
excel menunjukan cluster pertama yaitu terdapat 49 negara, untuk cluster
kedua tidak ada, dan untuk cluster ketiga terdapat 2 negara. Sedangkan
hasil clustering dengan rapid miner menunjukan ada 49 negara berada
cluster pertama, untuk cluster ke dua terdapat satu negara, lalu untuk
cluster ketiga terdapat satu negara, untuk hasil clustering dengan python
menunjukan ada 46 negara berada cluster pertama, cluster ke dua
terdapat 2 negara, dan cluster ketiga terdapat 3 negara. Kemudian untuk
dataset tahun 2021 berdasarkan hasil penelitian dengan excel, rapid
miner, dan python. Hasil clustering dengan excel menunjukan ada 78
negara berada cluster satu, cluster ke dua tidak ada, dan cluster ketiga
terdapat 2 negara. Hasil penelitian dengan rapid miner, hasil clustering
dengan rapid miner menunjukan ada 78 negara berada cluster pertama,
cluster ke dua terdapat 1 negara, cluster ketiga terdapat 1 negara. Hasil
perhitungan menggunakan dengan python menunjukan ada 76 negara
berada cluster pertama, untuk cluster ke dua terdapat 1 negara, dan untuk
cluster ketiga terdapat 1 negara.
50
51
5.2 Saran
Ada beberapa saran yang harus diterapkan guna pengembangan lebih
lanjut sebagai berikut:
1. Menggunakan data yang tidak memiliki nilai nol lebih disarankan.
Sehingga perhitungan Algoritma K-Means akan lebih optimal.
2. Diharapkan kepada para peneliti yang lain mengkombinasikan atau
mengkomparasi metode untuk menaikan nilai akurasi dari hasil
pengelompokan.
DAFTAR PUSTAKA
52
53
from https://doi.org/10.14421/jiska.2018.23-06
Nugroho, P. A., Fenriana, I., & Arijanto, R. (2020). Implementasi Depp Learning
menggunakan Convolutional Neural Network (CNN) pada Ekspresi
Manusia. Jurnal Algor.
Sari, R. W., & Hartama, D. (2018). Data Mining : Algoritma K-Means Pada
Pengelompokkan Wisata Asing ke Indonesia Menurut Provinsi. Seminar
Nasional Sains & Teknologi Informasi (SENSASI), 322–326.
Sun, L., Tang, Y., & Zuo, W. (2020). No Title. Oronavirus Pushes Education
Online. Nature Materials, 19(6), 687-687.
54
Witten, I. H., Frank, E., & Hall, M. A. (2011). (2011). Data Mining: Practical
Machine Learning Tools and Techniques Third Edition (3rd Edition ed.). (M.
Kaufmann, Ed.) USA: Elsevier Inc. All rights reserved. Encyclopedia of
Ecology, Five-Volume Set. Retrieved from https://doi.org/10.1016/B978-
008045405-4.00153-1
LAMPIRAN
55
56
58
59
Israel 12 15 39 46 38 30 23 30 22 31
Austria 871 11 3 7 13 17 21 74 111 164
Denmark 1.795 6 5 6 14 19 13 41 68 76
France 8.108 7 9 23 89 124 128 300 425 752
Germany 11.116 24 24 29 54 72 91 226 373 673
Italy 1.541 112 94 103 108 134 142 204 287 301
Netherlands 8.247 518 848 1.055 1.089 1.348 2.297 2.903 3.095 3.402
Spain 2.219 74 84 104 97 104 108 166 235 271
Portugal 1.146 26 5 11 11 18 16 22 43 44
Sweden 2.893 465 457 376 311 362 329 337 404 314
Switzerland 1.587 4 9 10 18 20 34 90 100 182
United Kingdom 15.002 89 122 112 152 134 252 417 576 643
Irlandia (Ireland) 993 2 2 2 8 6 14 26 38 50
Rusia 12.581 137 159 85 111 107 178 467 971 4.253
Polandia 1.622 10 24 11 11 21 40 72 80 170
Romania 607 33 37 30 22 22 18 53 58 77
Ukraine 2.507 186 275 193 68 131 98 175 359 949
Yunani (Greece) 245 19 37 38 22 28 32 55 46 65
United States of
13.719 1.118 1.022 1.070 1.363 1.740 1.464 3.054 2.401 2.354
America
Canada 3.804 53 82 86 53 57 54 105 187 190
Argentina 661 2 1 1 4 4 2 8 13 15
Brazilia 1.095 28 31 35 47 69 89 127 99 78
Mexiko 498 2 3 5 5 4 4 18 10 17
Australia 43.734 140 102 138 202 159 244 379 377 537
New Zealand 3.817 8 9 15 24 34 36 52 58 58
Papua New Guinea 1.248 1.021 1.266 1.263 1.261 987 742 991 1.514 1.525
South Africa 1.397 7 15 7 15 16 21 49 76 93
60
Maroko 333 1 1 3 7 5 5 6 8 16
Estonia 26 25 21 17 18 15 14 9 10 16 38 21
Georgia 8 11 18 15 10 21 7 4 2 8 9 6
Hongaria 5 11 8 36 18 34 13 2 2 26 43 20
Latvia 3 19 19 51 17 32 15 8 6 25 55 79
Lithuania 2 23 15 14 22 12 11 1 6 17 50 31
Polandia 10 43 48 105 80 113 49 6 19 66 108 105
Romania 8 37 35 57 87 56 22 4 19 58 61 66
Ukraine 69 229 215 356 302 412 118 40 67 257 354 625
Yunani (Greece) 18 19 37 39 44 35 27 17 14 30 65 40
United States of
America 1.369 1.607 1.224 1.804 2.159 2.131 2.508 1.735 1.337 2.116 2.306 1.666
Canada 14 76 76 127 127 137 71 21 64 166 210 153
Central America 8 3 8 8 9 13 4 6 5 3 6 14
South America 54 79 113 172 169 219 107 36 68 117 185 131
Argentina 2 4 7 17 11 14 9 2 5 6 23 14
Brazilia 45 56 84 117 111 136 60 24 41 79 114 85
Kolombia 1 9 3 7 15 19 5 3 8 6 15 5
Venezuela 2 2 2 11 7 8 4 2 3 5 7 3
UNO 17 10 7 5 7 2 8 4 20 21 13 13
Australia 154 220 204 300 284 302 181 71 190 261 456 573
New Zealand 9 34 21 63 56 62 24 7 21 59 53 73
Papua New Guinea 3.212 2.364 2.328 2.313 1.913 1.682 2.096 2.318 2.107 3.168 3.322 4.880
South Africa 17 35 28 55 109 104 31 8 27 72 70 16
Aljazair / Algeria 1 2 4 4 10 25 5 1 9 9 11 8
Ethiopia 2 3 4 1 8 6 1 3 3 1 7 4
Maroko 5 4 5 24 27 30 8 5 9 26 25 14
Mozambik 4 6 4 3 5 1 2 1 3 5 10 7
Nigeria 2 10 6 13 76 121 71 2 27 83 30 19
63
Sudan 2 3 4 3 7 17 5 4 8 8 15 25
Tanzania 13 13 6 5 18 8 3 3 10 13 10 8
RIWAYAT PENULIS
64