Anda di halaman 1dari 27

Sidang Tugas Akhir

“PENERAPAN ALGORITMA K-MEANS UNTUK MENGELOMPOKAN


DATA KUNJUNGAN WISATAWAN ASING BERDASARKAN JALUR
MASUK KE INDONESIA”

Rizky Alfian Nugraha


18416255201212

Ketua Sidang
Ayu Ratna Juwita, M.Kom

Penguji 1 Penguji 2
Dr. Ahmad Fauzi, M.Kom Amril Mutoi Siregar, M.Kom
Latar Belakang
Indonesia adalah negara arkeologi dengan sumber daya alam pariwisata yang menarik karena keindahan alam
dan keanekaragaman budaya, sehingga wisatawan asing sering berkunjung melalui transportasi udara, darat dan laut.
Pariwisata juga merupakan sektor ekonomi penting yang diharapkan dapat meningkatkan pendapatan Indonesia seiring
dengan meningkatnya wisatawan asing ke Indonesia. Sektor pariwisata memegang peranan penting dalam
pembangunan Indonesia sebagai sumber devisa negara. Mengetahui dari BPS mengenai dataset kunjungan wisatawan
asing berdasarkan jalur masuk ke Indonesia, sempat mengalami ketidakstabilan dan pasang surut pengunjung setiap
tahun. Jumlah kunjungan wisatawan asing menjadi salah satu indikator penting untuk melihat perkembangan
pariwisata, kurangnya informasi serta pengelompokan data menyangkut ketertarikan dan tingkat kunjungan wisatawan
asing ke Indonesia berdasarkan jalur masuk juga menjadi hal yang mengakitbatkan adanya kesulitan bagi pemerintah
dalam melakukan kebijakan dan perencanaan strategi pemasaran untuk menarik minat wisatawan asing, sehingga
menjadi tidak tepat sasaran dan menyebabkan wisata-wisata di Indonesia yang kurang dikenal jarang dikunjungi oleh
wisatawan asing. Pada penelitian ini, pengelompokan data kunjungan menggunakan perhitungan manual excel,
aplikasi RapidMiner dan JupyterLab dengan bahasa pemrograman Python untuk mendapatkan hasil dari
pengelompokan pada dataset penelitian ini. diharapkan bisa dijadikan sumber informasi bagi pemerintahan agar
mendapatkan rancangan strategis dalam pengembangan destinasi pariwisata untuk menarik minat wisatawan asing dan
menjadikan pariwisata sebagai sektor unggulan.
PROGRAM STUDI TEKNIK INFORMATIKA
UNIVERSITAS BUANA PERJUANGAN KARAWANG
Rumusan Masalah

Berdasarkan latar belakang diatas, maka rumusan masalah yang dapat diidentifikasi adalah
sebagai berikut:
• Bagaimana menerapkan algoritma K-Means untuk mengelompokan data kunjungan wisatawan
asing berdasarkan jalur masuk udara, darat, laut ke Indonesia.
• Bagaimana hasil pengujian algoritma K-Means pada pengelompokan data kunjungan
wisatawan asing berdasarkan jalur masuk udara, darat, laut ke Indonesia.

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Tujuan Dan Manfaat
TUJUAN MANFAAT

• • Bagi Dunia Akademik, Bisa dijadikan referensi dan


Menerapkan algoritma K-Means untuk
memberikan inspirasi yang bermanfaat bagi akademik
mengelompokan data kunjungan wisatawan asing dalam pengembangan penelitian yang dapat dilakukan oleh
berdasarkan jalur masuk udara, darat, laut ke peneliti selanjutnya.

Indonesia. • Bagi pemerintah dan masyarakat umum, Bisa menjadi suatu


pertimbangan dan referensi dalam menentukan suatu
• Mengetahui hasil dari pengujian algoritma K-Means kebijakan dan perubahan khususnya pada pengembangan
pada pengelompokan data kunjungan wisatawan destinasi pariwisata oleh pemerintah yang bisa bermanfaat
serta berguna bagi kepentingan masyarakat umum
asing berdasarkan jalur masuk udara, darat, laut ke
Indonesia. • Bagi Penulis, Memperluas wawasan penulis untuk
mengetahui perkembangan teknologi informasi yang terus
berkembang sampai saat ini. Serta untuk memenuhi syarat
kelulusan proposal Tugas Akhir Program Sarjana Teknik
Informatika Universitas Buana Perjuangan Karawang

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Objek Penelitian

Objek penelitian ini yaitu dataset kunjungan wisatawan asing berdasarkan jalur masuk
udara, darat, laut ke Indonesia pada tahun 2017 sampai 2021 yang diperoleh dari website
Badan Pusat Statistik. Kemudian data tersebut akan diproses menggunakan excel, aplikasi
RapidMiner dan bahasa pemrograman Python dengan menerapkan algoritma K-Means
clustering.

Badan Pusat Statistik (BPS) merupakan lembaga non-kementerian yang bertanggung


jawab langsung kepada Presiden. BPS merupakan Badan Pusat Statistik yang dibuat
berdasarkan Undang-Undang Sensus Nomor 6 Tahun 1960 dan Undang-Undang Statistik
Nomor 7 Tahun 1960.

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Prosedur Penelitian

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Pengumpulan Data

Dalam proses ini maka dibutuhkan data yang sumbernya valid dan relevan. Maka untuk
memperoleh data tersebut, telah dilakukan pencarian data melalui situs resmi pemerintah,
Badan Pusat Statistik (BPS) di www.bps.go.id. Data yang diperoleh merupakan data
kunjungan wisatawan asing berdasarkan jalur masuk udara, darat, laut ke Indonesia
perbulannya pada tahun 2017 sampai 2021. Data yang disajikan berdasarkan laporan bulanan
melalui jendral imigrasi dan data berbentuk file excel.

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Pembersihan Data

Pada tahap pembersihan data, dilakukan proses seleksi data untuk memisahkan antara data yang
digunakan dan data yang tidak digunakan, disebut sebagai pembersihan data. Kemudian data yang tidak
digunakan akan dihapus atau dibersihkan agar data menjadi efektif saat melakukan proses perhitungan.
Variabel yang diperlukan dalam penelitian ini yaitu jalur masuk, jumlah data dan kunjungan perbulan.
Oleh karena itu data mentah yang didapatkan dari badan pusat statistik perlu dibersihkan dari variabel-
variabel yang tidak diperlukan. Adapun variabel yang dibersihkan seperti data kosong, jumlah total dan
keterangan yang tidak diperlukan dalam perhitungan sehingga dapat dihapus.

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Pembersihan Data

Berikut contoh data sebelum dibersihkan dan sesudah dibersihkan:

Data sesudah dibersihkan


Data sebelum dibersihkan
PROGRAM STUDI TEKNIK INFORMATIKA
UNIVERSITAS BUANA PERJUANGAN KARAWANG
Penerapan Algoritma K-Means

Berikut adalah tahap penerapan Algoritma K-Means Clustering:


1. Menentukan jumlah K Cluster.
2. Memilih sejumlah K objek secara acak untuk dijadikan titik
Centroid.
3. Menentukan titik pusat K Centroid.
4. Menghitung jarak objek ke titik Centroid.
5. Mengelompokkan objek ke dalam Centroid cluster terdekat
sesuai dengan jarak objek dari Centroid (jarak Euclidean).
6. Hitung ulang semua nilai di Centroid.
7. Ulangi langkah 3-5 sampai nilai pusat gravitasi tidak
berubah.
PROGRAM STUDI TEKNIK INFORMATIKA
UNIVERSITAS BUANA PERJUANGAN KARAWANG
Perhitungan Manual

Tahap pertama, dalam perhitungan manual menggunakan excel adalah menentukan jumlah klaster dan
nilai awal centroid dengan mengambil data ke 1 dan seterusnya yang dihitung dengan rumus max,
average, min. Berikut hasil centroid awal:

Tahap kedua, menghitung jarak centroid awal dengan data ke 1 perbulan. Perhitungan manual
menghitung jarak pada Microsoft excel dengan rumus Euclidien Distance yaitu =SQRT((data-centroid)^2

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Perhitungan Manual
Berikut perhitungan dari tahap kedua pada data penelitian ini:

Centroid 1 : =SQRT((B7-$B$4)^2+(C7-$C$4)^2+(D7-$D$4)^2+(E7-$E$4)^2+(F7-$F$4)^2+(G7-
$G$4)^2+(H7-$H$4)^2+(I7-$I$4)^2+(J7-$J$4)^2+(K7-$K$4)^2+(L7-$L$4)^2+(M7-$M$4)^2)

Centroid 2 : =SQRT((B7-$B$3)^2+(C7-$C$3)^2+(D7-$D$3)^2+(E7-$E$3)^2+(F7-$F$3)^2+(G7-
$G$3)^2+(H7-$H$3)^2+(I7-$I$3)^2+(J7-$J$3)^2+(K7-$K$3)^2+(L7-$L$3)^2+(M7-$M$3)^2)

Centroid 3 : =SQRT((B7-$B$2)^2+(C7-$C$2)^2+(D7-$D$2)^2+(E7-$E$2)^2+(F7-$F$2)^2+(G7-
$G$2)^2+(H7-$H$2)^2+(I7-$I$2)^2+(J7-$J$2)^2+(K7-$K$2)^2+(L7-$L$2)^2+(M7-$M$2)^2)

rumus masing-masing centroid yang telah dihitung dapat ditarik kebawah untuk melihat hasil data
berikutnya. Selanjutnya jika sudah diketahui nilai centroid setiap data maka selanjutnya mencari cluster
dengan menghitung jarak terdekat pada baris data setiap centroid menggunakan rumus excel sebagai
berikut: =MIN(N7:P7) PROGRAM STUDI TEKNIK INFORMATIKA
UNIVERSITAS BUANA PERJUANGAN KARAWANG
Perhitungan Manual
Perhitungan pada tahap kedua merupakan iterasi pertama, karena hasil
cluster nya berubah maka terus dilakukan perhitungan ke iterasi
berikutnya sampai nilai centroid nya tidak berubah dan berhenti diiterasi
keempat. Hasil dari iterasi ketiga dapat dilihat pada gambar berikut:

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Perhitungan Manual
Tahap ketiga, menentukan dan mengupdate centroid yang biasa nya dilakukan berulang kali
hingga menghasilkan cluster yang sama atau tidak berubah. Perhitungan nilai centroid baru
yaitu dengan perhitungan nilai rata-rata centroid yang dihasilkan dari iterasi ketiga, berikut
adalah centroid yang sudah diupdate.

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Perhitungan Manual
Tahap keempat, mengulang kembali tahapan sebelumnya untuk mendapatkan hasil iterasi hingga hasil
cluster tidak berubah. Kemudian perhitungan mencari jarak antar data dengan centroid masih sama,
berikut perhitungannya:

Centroid 1 : =SQRT((B115-$B$110)^2+(C115-$C$110)^2+(D115-$D$110)^2+(E115-$E$110)^2+(F115-
$F$110)^2+(G115-$G$110)^2+(H115-$H$110)^2+(I115-$I$110)^2+(J115-$J$110)^2+(K115-
$K$110)^2+(L115-$L$110)^2+(M115-$M$110)^2)

Centroid 2 : =SQRT((B115-$B$112)^2+(C115-$C$112)^2+(D115-$D$112)^2+(E115-$E$112)^2+(F115-
$F$112)^2+(G115-$G$112)^2+(H115-$H$112)^2+(I115-$I$112)^2+(J115-$J$112)^2+(K115-
$K$112)^2+(L115-$L$112)^2+(M115-$M$112)^2)

Centroid 3 : =SQRT((B115-$B$111)^2+(C115-$C$111)^2+(D115-$D$111)^2+(E115-$E$111)^2+(F115-
$F$111)^2+(G115-$G$111)^2+(H115-$H$111)^2+(I115-$I$111)^2+(J115-$J$111)^2+(K115-
PROGRAM STUDI TEKNIK INFORMATIKA
$K$111)^2+(L115-$L$111)^2+(M115-$M$111)^2) UNIVERSITAS BUANA PERJUANGAN KARAWANG
Perhitungan Manual
Perhitungan ini berhenti pada iterasi keempat dikarenakan pada
perhitungan iterasi keempat ini hasil cluster nya tidak berubah atau
sama dengan hasil cluster iterasi sebelumnya, hasil cluster yang
didapat yaitu C1 = 24, C2 = 1, dan C3 = 4, dapat dilihat pada
gambar berikut:

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
PERHITUNGAN RAPID MINER

berikut langkah-langkah penerapan algoritma k-means menggunakan rapid miner:

1. Import data yang akan dilakukan perhitungan k-means pada menu repository.

2. Tarik data yang sudah di import ke dalam halaman proses, kemudian pada menu operator dapat dicari
“K-Means” untuk mendapatkan data yang akan ditarik ke halaman proses bersama dengan dataset
penelitian, tampilannya seperti berikut:

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
PERHITUNGAN RAPID MINER

Selanjutnya koneksikan antara dataset dengan metode k-means yang kemudian di koneksikan kembali
dengan proses result. Ubah jumlah cluster yang di inginkan pada bar parameter, kemudian di jalankan
dan ketika proses clustering berhasil maka akan muncul tanda centang di data dan algoritma k-means,
dengan tampilan sebagai berikut:

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
PERHITUNGAN RAPID MINER

Hasil dari clustering dapat dilihat pada menu Result, perhitungan ini menghasilkan cluster dengan jumlah
C1 = 24, C2 = 1 dan C3 = 4, hasil tersebut sama dengan perhitungan manual yang sudah dilakukan
sebelumnya. Berikut hasil clustering yang berupa deskripsi dan visualisasi dari tools rapid miner

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
PERHITUNGAN PYTHON

berikut perhitungan algoritma k-means menggunakan python:

1. Upload dataset penelitian dengan format .csv pada tools jupyterlab dengan menu upload files.

2. Mengimport library yang dibutuhkan dalam perhitungan K-means dan memasukan source code untuk
menyisipkan dan menampilkan data, dengan memanggil data yang sudah di upload sebelumnya. Berikut
tampilan source code nya:

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
PERHITUNGAN PYTHON

3. Menampilkan dalam bentuk grafik kunjungan wisatawan asing berdasarkan jalur masuk tahun 2019

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
PERHITUNGAN PYTHON

4. Perhitungan algoritma K-means untuk menampilkan nilai centroid yang di dapat dan hasil clustering.
Serta hasil clustering berupa format teks keterangan berapa jumlah data di setiap cluster nya

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Evaluasi Data

Untuk menentukan tingkat akurasi dilakukan evaluasi hasil dengan perhitungan Silhouette yang bernilai
0,8463 yang dimana nilai Silhouette algoritma k-means lebih mendekati nilai 1. Perhitungan metode
evaluasi ini menggunakan bahasa pemrograman python pada tools JupyterLab, tampilannya dapat
diketahui pada gambar 4.12 berikut:

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Hasil

Setelah melakukan beberapa proses tahapan seperti pengumpulan data, pembersihan data,
penerapan algoritma K-Means clustering dan evaluasi data. Hasil dari penerapan algoritma k-
means dengan menggunakan perhitungan manual excel, perhitungan rapid miner dan bahasa
pemrograman phyton, didapatkan hasil clustering yaitu C1 = 24, C2 = 1 dan C3 = 4 yang
dimana semua hasil perhitungannya memiliki cluster yang sama.

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
Kesimpulan
Kesimpulan yang bisa diberikan sesuai dengan rumusan masalah dalam penelitian ini adalah:

1. Untuk menerapkan algoritma k-means clustering pada data penelitian ini menggunakan
rumus eucliedan distance dan memakai 3 cara perhitungan yaitu perhitungan manual
menggunakan excel, perhitungan rapid miner dan perhitungan python.
2. Hasil dari penerapan algoritma k-means pada data penelitian ini cocok untuk
pengelompokan karena dibuktikan dengan hasil evaluasi menggunakan Silhouette
coefficient, bahwa nilai akurasi perhitungan algoritma k-means lebih mendekati nilai 1.
Kemudian setiap cluster yang dihitung secara manual menggunakan excel, menggunakan
rapid miner dan python terbagi menjadi 3 cluster dengan hasil yang sama yaitu C1
sebanyak 24, C2 sebanyak 1, dan C3 sebanyak 4.
PROGRAM STUDI TEKNIK INFORMATIKA
UNIVERSITAS BUANA PERJUANGAN KARAWANG
Saran
Berikut saran-saran yang bisa diberikan pada penelitian ini:

1. Untuk pihak pengelola sektor pariwisata, diperlukan kerjasama dengan pihak lainnya untuk
melakukan lebih banyak promosi melalui media sosial dan pada jalur masuk yang sering
dikunjungi untuk memberikan informasi terkait destinasi wisata, sehingga para wisatawan
asing dapat tertarik untuk berkunjung ke tempat wisata-wisata yang lainnya.
2. Untuk pengembangan penelitian, peneliti selanjutnya dapat melakukan perbandingan
menggunakan algoritma lain.

PROGRAM STUDI TEKNIK INFORMATIKA


UNIVERSITAS BUANA PERJUANGAN KARAWANG
PROGRAM STUDI TEKNIK INFORMATIKA
UNIVERSITAS BUANA PERJUANGAN KARAWANG

TERIMA KASIH

Anda mungkin juga menyukai