Sidang Proposal TA - Rizky
Sidang Proposal TA - Rizky
Ketua Sidang
Ayu Ratna Juwita, M.Kom
Penguji 1 Penguji 2
Dr. Ahmad Fauzi, M.Kom Amril Mutoi Siregar, M.Kom
Latar Belakang
Indonesia adalah negara arkeologi dengan sumber daya alam pariwisata yang menarik karena keindahan alam
dan keanekaragaman budaya, sehingga wisatawan asing sering berkunjung melalui transportasi udara, darat dan laut.
Pariwisata juga merupakan sektor ekonomi penting yang diharapkan dapat meningkatkan pendapatan Indonesia seiring
dengan meningkatnya wisatawan asing ke Indonesia. Sektor pariwisata memegang peranan penting dalam
pembangunan Indonesia sebagai sumber devisa negara. Mengetahui dari BPS mengenai dataset kunjungan wisatawan
asing berdasarkan jalur masuk ke Indonesia, sempat mengalami ketidakstabilan dan pasang surut pengunjung setiap
tahun. Jumlah kunjungan wisatawan asing menjadi salah satu indikator penting untuk melihat perkembangan
pariwisata, kurangnya informasi serta pengelompokan data menyangkut ketertarikan dan tingkat kunjungan wisatawan
asing ke Indonesia berdasarkan jalur masuk juga menjadi hal yang mengakitbatkan adanya kesulitan bagi pemerintah
dalam melakukan kebijakan dan perencanaan strategi pemasaran untuk menarik minat wisatawan asing, sehingga
menjadi tidak tepat sasaran dan menyebabkan wisata-wisata di Indonesia yang kurang dikenal jarang dikunjungi oleh
wisatawan asing. Pada penelitian ini, pengelompokan data kunjungan menggunakan perhitungan manual excel,
aplikasi RapidMiner dan JupyterLab dengan bahasa pemrograman Python untuk mendapatkan hasil dari
pengelompokan pada dataset penelitian ini. diharapkan bisa dijadikan sumber informasi bagi pemerintahan agar
mendapatkan rancangan strategis dalam pengembangan destinasi pariwisata untuk menarik minat wisatawan asing dan
menjadikan pariwisata sebagai sektor unggulan.
PROGRAM STUDI TEKNIK INFORMATIKA
UNIVERSITAS BUANA PERJUANGAN KARAWANG
Rumusan Masalah
Berdasarkan latar belakang diatas, maka rumusan masalah yang dapat diidentifikasi adalah
sebagai berikut:
• Bagaimana menerapkan algoritma K-Means untuk mengelompokan data kunjungan wisatawan
asing berdasarkan jalur masuk udara, darat, laut ke Indonesia.
• Bagaimana hasil pengujian algoritma K-Means pada pengelompokan data kunjungan
wisatawan asing berdasarkan jalur masuk udara, darat, laut ke Indonesia.
Objek penelitian ini yaitu dataset kunjungan wisatawan asing berdasarkan jalur masuk
udara, darat, laut ke Indonesia pada tahun 2017 sampai 2021 yang diperoleh dari website
Badan Pusat Statistik. Kemudian data tersebut akan diproses menggunakan excel, aplikasi
RapidMiner dan bahasa pemrograman Python dengan menerapkan algoritma K-Means
clustering.
Dalam proses ini maka dibutuhkan data yang sumbernya valid dan relevan. Maka untuk
memperoleh data tersebut, telah dilakukan pencarian data melalui situs resmi pemerintah,
Badan Pusat Statistik (BPS) di www.bps.go.id. Data yang diperoleh merupakan data
kunjungan wisatawan asing berdasarkan jalur masuk udara, darat, laut ke Indonesia
perbulannya pada tahun 2017 sampai 2021. Data yang disajikan berdasarkan laporan bulanan
melalui jendral imigrasi dan data berbentuk file excel.
Pada tahap pembersihan data, dilakukan proses seleksi data untuk memisahkan antara data yang
digunakan dan data yang tidak digunakan, disebut sebagai pembersihan data. Kemudian data yang tidak
digunakan akan dihapus atau dibersihkan agar data menjadi efektif saat melakukan proses perhitungan.
Variabel yang diperlukan dalam penelitian ini yaitu jalur masuk, jumlah data dan kunjungan perbulan.
Oleh karena itu data mentah yang didapatkan dari badan pusat statistik perlu dibersihkan dari variabel-
variabel yang tidak diperlukan. Adapun variabel yang dibersihkan seperti data kosong, jumlah total dan
keterangan yang tidak diperlukan dalam perhitungan sehingga dapat dihapus.
Tahap pertama, dalam perhitungan manual menggunakan excel adalah menentukan jumlah klaster dan
nilai awal centroid dengan mengambil data ke 1 dan seterusnya yang dihitung dengan rumus max,
average, min. Berikut hasil centroid awal:
Tahap kedua, menghitung jarak centroid awal dengan data ke 1 perbulan. Perhitungan manual
menghitung jarak pada Microsoft excel dengan rumus Euclidien Distance yaitu =SQRT((data-centroid)^2
Centroid 1 : =SQRT((B7-$B$4)^2+(C7-$C$4)^2+(D7-$D$4)^2+(E7-$E$4)^2+(F7-$F$4)^2+(G7-
$G$4)^2+(H7-$H$4)^2+(I7-$I$4)^2+(J7-$J$4)^2+(K7-$K$4)^2+(L7-$L$4)^2+(M7-$M$4)^2)
Centroid 2 : =SQRT((B7-$B$3)^2+(C7-$C$3)^2+(D7-$D$3)^2+(E7-$E$3)^2+(F7-$F$3)^2+(G7-
$G$3)^2+(H7-$H$3)^2+(I7-$I$3)^2+(J7-$J$3)^2+(K7-$K$3)^2+(L7-$L$3)^2+(M7-$M$3)^2)
Centroid 3 : =SQRT((B7-$B$2)^2+(C7-$C$2)^2+(D7-$D$2)^2+(E7-$E$2)^2+(F7-$F$2)^2+(G7-
$G$2)^2+(H7-$H$2)^2+(I7-$I$2)^2+(J7-$J$2)^2+(K7-$K$2)^2+(L7-$L$2)^2+(M7-$M$2)^2)
rumus masing-masing centroid yang telah dihitung dapat ditarik kebawah untuk melihat hasil data
berikutnya. Selanjutnya jika sudah diketahui nilai centroid setiap data maka selanjutnya mencari cluster
dengan menghitung jarak terdekat pada baris data setiap centroid menggunakan rumus excel sebagai
berikut: =MIN(N7:P7) PROGRAM STUDI TEKNIK INFORMATIKA
UNIVERSITAS BUANA PERJUANGAN KARAWANG
Perhitungan Manual
Perhitungan pada tahap kedua merupakan iterasi pertama, karena hasil
cluster nya berubah maka terus dilakukan perhitungan ke iterasi
berikutnya sampai nilai centroid nya tidak berubah dan berhenti diiterasi
keempat. Hasil dari iterasi ketiga dapat dilihat pada gambar berikut:
Centroid 1 : =SQRT((B115-$B$110)^2+(C115-$C$110)^2+(D115-$D$110)^2+(E115-$E$110)^2+(F115-
$F$110)^2+(G115-$G$110)^2+(H115-$H$110)^2+(I115-$I$110)^2+(J115-$J$110)^2+(K115-
$K$110)^2+(L115-$L$110)^2+(M115-$M$110)^2)
Centroid 2 : =SQRT((B115-$B$112)^2+(C115-$C$112)^2+(D115-$D$112)^2+(E115-$E$112)^2+(F115-
$F$112)^2+(G115-$G$112)^2+(H115-$H$112)^2+(I115-$I$112)^2+(J115-$J$112)^2+(K115-
$K$112)^2+(L115-$L$112)^2+(M115-$M$112)^2)
Centroid 3 : =SQRT((B115-$B$111)^2+(C115-$C$111)^2+(D115-$D$111)^2+(E115-$E$111)^2+(F115-
$F$111)^2+(G115-$G$111)^2+(H115-$H$111)^2+(I115-$I$111)^2+(J115-$J$111)^2+(K115-
PROGRAM STUDI TEKNIK INFORMATIKA
$K$111)^2+(L115-$L$111)^2+(M115-$M$111)^2) UNIVERSITAS BUANA PERJUANGAN KARAWANG
Perhitungan Manual
Perhitungan ini berhenti pada iterasi keempat dikarenakan pada
perhitungan iterasi keempat ini hasil cluster nya tidak berubah atau
sama dengan hasil cluster iterasi sebelumnya, hasil cluster yang
didapat yaitu C1 = 24, C2 = 1, dan C3 = 4, dapat dilihat pada
gambar berikut:
1. Import data yang akan dilakukan perhitungan k-means pada menu repository.
2. Tarik data yang sudah di import ke dalam halaman proses, kemudian pada menu operator dapat dicari
“K-Means” untuk mendapatkan data yang akan ditarik ke halaman proses bersama dengan dataset
penelitian, tampilannya seperti berikut:
Selanjutnya koneksikan antara dataset dengan metode k-means yang kemudian di koneksikan kembali
dengan proses result. Ubah jumlah cluster yang di inginkan pada bar parameter, kemudian di jalankan
dan ketika proses clustering berhasil maka akan muncul tanda centang di data dan algoritma k-means,
dengan tampilan sebagai berikut:
Hasil dari clustering dapat dilihat pada menu Result, perhitungan ini menghasilkan cluster dengan jumlah
C1 = 24, C2 = 1 dan C3 = 4, hasil tersebut sama dengan perhitungan manual yang sudah dilakukan
sebelumnya. Berikut hasil clustering yang berupa deskripsi dan visualisasi dari tools rapid miner
1. Upload dataset penelitian dengan format .csv pada tools jupyterlab dengan menu upload files.
2. Mengimport library yang dibutuhkan dalam perhitungan K-means dan memasukan source code untuk
menyisipkan dan menampilkan data, dengan memanggil data yang sudah di upload sebelumnya. Berikut
tampilan source code nya:
3. Menampilkan dalam bentuk grafik kunjungan wisatawan asing berdasarkan jalur masuk tahun 2019
4. Perhitungan algoritma K-means untuk menampilkan nilai centroid yang di dapat dan hasil clustering.
Serta hasil clustering berupa format teks keterangan berapa jumlah data di setiap cluster nya
Untuk menentukan tingkat akurasi dilakukan evaluasi hasil dengan perhitungan Silhouette yang bernilai
0,8463 yang dimana nilai Silhouette algoritma k-means lebih mendekati nilai 1. Perhitungan metode
evaluasi ini menggunakan bahasa pemrograman python pada tools JupyterLab, tampilannya dapat
diketahui pada gambar 4.12 berikut:
Setelah melakukan beberapa proses tahapan seperti pengumpulan data, pembersihan data,
penerapan algoritma K-Means clustering dan evaluasi data. Hasil dari penerapan algoritma k-
means dengan menggunakan perhitungan manual excel, perhitungan rapid miner dan bahasa
pemrograman phyton, didapatkan hasil clustering yaitu C1 = 24, C2 = 1 dan C3 = 4 yang
dimana semua hasil perhitungannya memiliki cluster yang sama.
1. Untuk menerapkan algoritma k-means clustering pada data penelitian ini menggunakan
rumus eucliedan distance dan memakai 3 cara perhitungan yaitu perhitungan manual
menggunakan excel, perhitungan rapid miner dan perhitungan python.
2. Hasil dari penerapan algoritma k-means pada data penelitian ini cocok untuk
pengelompokan karena dibuktikan dengan hasil evaluasi menggunakan Silhouette
coefficient, bahwa nilai akurasi perhitungan algoritma k-means lebih mendekati nilai 1.
Kemudian setiap cluster yang dihitung secara manual menggunakan excel, menggunakan
rapid miner dan python terbagi menjadi 3 cluster dengan hasil yang sama yaitu C1
sebanyak 24, C2 sebanyak 1, dan C3 sebanyak 4.
PROGRAM STUDI TEKNIK INFORMATIKA
UNIVERSITAS BUANA PERJUANGAN KARAWANG
Saran
Berikut saran-saran yang bisa diberikan pada penelitian ini:
1. Untuk pihak pengelola sektor pariwisata, diperlukan kerjasama dengan pihak lainnya untuk
melakukan lebih banyak promosi melalui media sosial dan pada jalur masuk yang sering
dikunjungi untuk memberikan informasi terkait destinasi wisata, sehingga para wisatawan
asing dapat tertarik untuk berkunjung ke tempat wisata-wisata yang lainnya.
2. Untuk pengembangan penelitian, peneliti selanjutnya dapat melakukan perbandingan
menggunakan algoritma lain.
TERIMA KASIH