Anda di halaman 1dari 40

ANALISIS SENTIMEN WISATAWAN MELALUI DATA ULASAN JADDIH

LIMESTONE HILL DI TRIPADVISOR MENGGUNAKAN METODE DECISION


TREE BERBASIS SMOTE

Oleh :
AHMAT JAILANI
210441100118
SYAHRUL MAULANA
210441100111

PROGRAM STUDI SISTEM INFORMASI


FAKULTAS TEKNIK
UNIVERSITAS TRUNOJOYO MADURA
BANGKALAN
2023
ABSTRAK
Bukit Jaddih, dengan gua-gua alamnya yang memukau, telah menjadi magnet bagi para
wisatawan yang mencari petualangan alam yang menakjubkan. Dalam era digital yang terus
berkembang, ulasan dan opini wisatawan di platform seperti TripAdvisor telah menjadi salah
satu faktor yang sangat penting dalam menentukan citra dan popularitas destinasi wisata.
Oleh karena itu, penelitian ini dilakukan dengan tujuan utama untuk melakukan analisis
sentimen terhadap ulasan para wisatawan yang telah berkunjung ke Jaddih Limestone Hill di
TripAdvisor, dengan harapan dapat memberikan wawasan yang berharga bagi pengelola
destinasi ini. Metode yang digunakan dalam penelitian ini adalah Decision Tree berbasis
SMOTE, sebuah pendekatan yang dapat mengatasi ketidakseimbangan data dalam analisis
sentimen. Dengan menerapkan metode ini, diharapkan dapat menghasilkan model klasifikasi
sentimen yang akurat, sehingga pengelola destinasi dapat lebih memahami preferensi dan
pengalaman para pengunjung. Hasil dari penelitian ini memiliki potensi besar untuk
meningkatkan layanan yang diberikan oleh Bukit Jaddih. Dengan memahami sentimen positif
dan negatif dari ulasan pengunjung, pengelola destinasi dapat melakukan perbaikan yang
diperlukan, meningkatkan pengalaman pengunjung, dan dengan lebih efektif
mempromosikan destinasi ini kepada calon wisatawan. Penelitian ini juga menekankan
pentingnya data ulasan teks dalam analisis sentimen. Dengan menggunakan alat dan teknik
analisis teks yang canggih seperti yang disediakan oleh Python dengan dukungan library
seperti nltk dan sastrawi, penelitian ini akan memberikan kontribusi berharga dalam
pengembangan metode analisis sentimen wisatawan, terutama dalam konteks destinasi unik
seperti Jaddih Limestone Hill. Sebagai kesimpulan, penelitian ini memiliki potensi besar
untuk memberikan manfaat yang signifikan bagi pengelola destinasi Bukit Jaddih. Dengan
pemahaman yang lebih baik tentang opini pengunjung, destinasi ini dapat terus berkembang
dan menjadi tujuan wisata yang lebih menarik bagi semua orang.
Kata Kunci : Analisis Sentimen, Jaddih Limestone Hill, Decision Tree

i
DAFTAR ISI
ABSTRAK..................................................................................................................................i

DAFTAR ISI..............................................................................................................................ii

DAFTAR GAMBAR................................................................................................................iv

DAFTAR TABEL.......................................................................................................................v

BAB 1 PENDAHULUAN.........................................................................................................1

1.1 Latar Belakang.............................................................................................................1

1.2 Rumusan Masalah.......................................................................................................4

1.2.1 Permasalahan........................................................................................................4

1.2.2 Metode Usulan.....................................................................................................4

1.2.3 Pertanyaan Penelitian...........................................................................................4

1.3 Tujuan..........................................................................................................................4

1.4 Manfaat........................................................................................................................5

1.5 Batasan Masalah..........................................................................................................5

1.6 Sistematika Penulisan..................................................................................................5

BAB II........................................................................................................................................7

KAJIAN PUSTAKA..................................................................................................................7

2.1 Landasan Teori............................................................................................................7

2.1.1 Analisis Sentimen.................................................................................................7

2.1.2 Objek Wisata........................................................................................................9

2.1.3 TripAdvisor........................................................................................................10

2.1.4 Machine Learning..............................................................................................12

2.1.5 Decision Tree.....................................................................................................15

2.1.6 Synthetic Minority Over-sampling Technique (SMOTE)..................................16

2.1.7 Decision Tree berbasis SMOTE.........................................................................19

2.2 Landasan Teori..........................................................................................................19

BAB 3 PENDAHULUAN.......................................................................................................23

ii
3.1 Langkah-Langkah Penelitian / Arsitektur Sistem..........................................................23

3.2 Analisa Kebutuhan dan Perancangan Sistem.................................................................24

3.2.1 Analisa Kebutuhan Sistem......................................................................................24

3.2.2 Perancangan Sistem................................................................................................25

3.3 Perhitungan Manual.......................................................................................................27

DAFTAR PUSTAKA...............................................................................................................30

iii
DAFTAR GAMBAR
Gambar 3.1. Rancangan Arsitektur Penelitian.........................................................................23
Gambar 3.2. Flowchart Data Preprocessing.............................................................................25
Gambar 3.3. Flowchart Analisis SMOTE................................................................................26

iv
DAFTAR TABEL
Tabel 2.1. Penelitian Terdahulu................................................................................................20

v
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Jaddih Limestone Hill merupakan sebuah bukit tambang kapur yang menjadi sorotan di
kalangan para wisatawan. Daerah ini terkenal karena potensi wisatanya yang menawarkan
beragam objek menarik untuk dikunjungi. Salah satu daya tarik utama Bukit Jaddih adalah
keberadaan gua-gua alam yang dapat dieksplorasi oleh pengunjung. Kombinasi antara
keindahan alam, eksplorasi gua, dan aktivitas penambangan membuat Bukit Jaddih menjadi
tujuan yang menarik bagi mereka yang mencari pengalaman wisata yang unik [1]. Pariwisata
adalah suatu perjalanan yang terencana, yang dilakukan secara individu maupun dalam
kelompok, dari satu tempat ke tempat lain dengan tujuan utama untuk mendapatkan berbagai
bentuk kepuasan dan kesenangan semata. Aktivitas pariwisata dapat mencakup berbagai
aspek seperti eksplorasi alam, budaya, sejarah, rekreasi, dan relaksasi [2]. Masyarakat adalah
sekelompok individu atau manusia yang telah cukup lama hidup atau bekerja sama dalam
suatu wilayah tertentu. Setiap masyarakat memiliki karakteristik dan budaya uniknya sendiri
yang memengaruhi bagaimana individu berinteraksi dan bekerja sama di dalamnya [3].
Analisis sentimen adalah sebuah pendekatan yang digunakan untuk mengidentifikasi
pendapat dan kecenderungan opini seseorang terhadap suatu masalah atau objek. Tujuannya
adalah untuk menentukan apakah pendapat atau opini tersebut cenderung positif, negatif, atau
netral [4]. Analisis sentimen terhadap produk dan jasa di destinasi wisata Jaddih Limestone
Hill adalah langkah yang sangat penting dalam upaya meningkatkan pengelolaan dan
promosi destinasi ini. Destinasi wisata seperti Jaddih Limestone Hill adalah aset berharga
bagi pariwisata Indonesia, dan memahami sentimen pengunjung terhadap produk dan jasa
yang ditawarkan adalah kunci untuk meningkatkan citra pariwisata negara.
Wisatawan saat ini dengan mudah dapat mencari referensi mengenai obyek wisata
melalui berbagai platform, salah satunya TripAdvisor. Para calon wisatawan dapat dengan
cepat dan mudah mencari tahu referensi obyek wisata berdasarkan pengalaman wisatawan
yang telah mengunjungi tempat-tempat tersebut. Ulasan dan peringkat yang diberikan oleh
para wisatawan menjadi sumber informasi yang sangat berharga dalam membuat keputusan
perjalanan. Dengan demikian, TripAdvisor dan platform serupa telah menjadi alat penting
bagi mereka yang ingin menjelajahi dunia dengan lebih baik dan cerdas, mengandalkan
ulasan dari rekan-rekan pelancong sebelumnya untuk memastikan pengalaman yang
memuaskan [5]. Di era digital saat ini, ulasan dan opini wisatawan di platform seperti

1
TripAdvisor memiliki dampak signifikan terhadap citra dan popularitas destinasi wisata [6].
Oleh karena itu, kami memilih untuk melakukan analisis sentimen terhadap ulasan Jaddih
Limestone Hill untuk memahami bagaimana wisatawan merasakan dan menilai pengalaman
mereka di sana. Dengan informasi ini, pemilik dan pengelola situs wisata dapat mengambil
tindakan yang lebih efektif untuk meningkatkan layanan, memperbaiki kekurangan, dan
mempromosikan destinasi dengan lebih baik. Analisis sentimen ini juga dapat membantu
mengidentifikasi tren positif dan negatif yang mungkin berkembang di antara wisatawan
yang berbeda, membantu pemangku kepentingan untuk merencanakan tindakan yang lebih
terarah. Selain itu, penggunaan metode Decision Tree berbasis SMOTE memiliki keunggulan
dalam mengatasi ketidakseimbangan kelas dalam data ulasan, yang sering kali terjadi dalam
dataset ulasan wisatawan. Dengan demikian, penelitian ini akan membantu mengisi
kesenjangan dalam literatur dengan fokus pada metode yang lebih canggih untuk analisis
sentimen dalam konteks wisata, memberikan wawasan berharga kepada pihak-pihak yang
terlibat dalam pengelolaan dan promosi Jaddih Limestone Hill serta destinasi serupa.
Hasil penelitian mengungkapkan bahwa penggunaan metode deep learning, khususnya
Convolutional Neural Network (CNN), dalam analisis sentimen dan klasifikasi aspek pada
ulasan tempat wisata di negara-negara Asia telah menghasilkan hasil yang sangat
memuaskan. Hasil akurasi yang mencapai 98.299% dalam klasifikasi aspek (seperti mosque,
halal food, dan toilet) serta akurasi sebesar 93.96% dalam klasifikasi sentimen menunjukkan
kemampuan metode CNN dalam mengenali dan menginterpretasi ulasan dengan presisi yang
tinggi [7]. Keberhasilan ini berpotensi menjadi alat yang kuat bagi industri wisata halal,
terutama dalam pengembangan strategi dan perbaikan fasilitas yang sesuai dengan preferensi
wisatawan Muslim. Hasil penelitian ini juga menegaskan pentingnya pemahaman terhadap
kebutuhan wisatawan Muslim dalam hal fasilitas toilet yang bersih, tempat ibadah yang
tersedia, dan makanan halal. Diharapkan temuan ini akan memberikan landasan yang lebih
kuat dalam memajukan dan memperbaiki layanan wisata halal, serta mempromosikan
pengalaman wisata yang lebih memuaskan bagi para wisatawan Muslim di negara-negara
Asia.
Perbandingan metode Decision Tree, KNN dan Naïve Bayes melibatkan analisis emosi
pengguna layanan BPJS. Data yang diperoleh untuk penelitian ini adalah data dari Twitter.
Hasil pencarian menggunakan KNN mempunyai akurasi sebesar 95,58%. Kemudian dengan
menggunakan metode pohon keputusan diperoleh nilai eksak sebesar 96,13%. Dan terakhir
menggunakan Naïve Bayes dengan akurasi 89,14%. Dari hasil akurasi yang diperoleh dari

2
ketiga metode tersebut, dapat disimpulkan bahwa metode pohon keputusan merupakan
metode terbaik dengan akurasi tertinggi dibandingkan kedua metode lainnya [8].
Dalam konteks analisis sentimen ulasan wisatawan, berbagai metode telah digunakan
untuk mengidentifikasi sentimen dalam ulasan dan mengklasifikasikannya ke dalam kategori
seperti positif, negatif, atau netral. Beberapa metode yang umum digunakan meliputi metode
berbasis aturan, metode berbasis statistik seperti Naïve Bayes, dan metode berbasis machine
learning seperti Decision Tree dan K-Nearest Neighbors (KNN). Namun, metode-metode ini
sering kali memiliki beberapa kekurangan. Metode berbasis aturan mungkin kurang efektif
dalam menangani data ulasan yang kompleks dan memiliki banyak variasi. Sementara itu,
metode statistik seperti Naïve Bayes mungkin tidak selalu mampu mengatasi
ketidakseimbangan antara kelas dalam dataset ulasan. Metode machine learning seperti
Decision Tree dan KNN, sementara bisa cukup kuat, sering kali memerlukan pengolahan data
yang cermat dan parameter yang sesuai untuk menghasilkan hasil yang memuaskan. Oleh
karena itu, ada kebutuhan untuk mengembangkan metode yang lebih canggih dan sesuai
dengan konteks tertentu, seperti penggunaan Convolutional Neural Network (CNN) dalam
analisis sentimen berbasis aspek pada ulasan wisatawan di penelitian sebelumnya.
Penggunaan metode Decision Tree berbasis SMOTE dalam penelitian ini dipilih dengan
pertimbangan yang matang. Decision Tree merupakan salah satu metode yang sangat
berharga dalam bidang data mining. Metode ini memungkinkan kita untuk mengubah dataset
yang mungkin sangat besar dan kompleks menjadi sebuah pohon keputusan yang sederhana
dan mudah dimengerti dan salah satu metode yang cukup populer dalam analisis sentimen
karena sifatnya yang mudah diinterpretasi [9]. Keberhasilannya dalam memecah masalah
klasifikasi membuatnya menjadi pilihan yang kuat. Namun, dalam konteks analisis sentimen
ulasan wisatawan, sering kali terdapat masalah ketidakseimbangan antara sentimen positif
dan negatif, dengan sentimen positif cenderung lebih dominan. Inilah alasan penggunaan
metode SMOTE (Synthetic Minority Over-sampling Technique), yang digunakan untuk
mengatasi ketidakseimbangan kelas dengan menciptakan sampel sintetis dari kelas minoritas
(misalnya, sentimen negatif) [10]. Kombinasi antara Decision Tree dan SMOTE dapat
membantu meningkatkan akurasi dalam mengklasifikasikan ulasan sentimen wisatawan
secara keseluruhan.
Selain itu, penggunaan metode ini dalam konteks ulasan Jaddih Limestone Hill di
TripAdvisor memiliki relevansi yang kuat karena ulasan wisatawan cenderung menjadi faktor
penting dalam mempromosikan dan mengelola destinasi wisata. Dengan pemahaman
sentimen yang akurat dari ulasan, pemilik dan pengelola destinasi dapat mengambil tindakan
3
yang lebih efektif untuk memperbaiki layanan, memahami preferensi wisatawan, dan
meningkatkan citra destinasi. Dengan demikian, metode Decision Tree berbasis SMOTE
menjadi alat yang berharga dalam mendukung pengembangan dan peningkatan destinasi
wisata seperti Jaddih Limestone Hill di era digital saat ini.
1.2 Rumusan Masalah
1.2.1 Permasalahan
Bagaimana melakukan analisis sentimen terhadap ulasan wisatawan yang berkunjung
ke Jaddih Limestone Hill di TripAdvisor dengan menggunakan metode Decision Tree
berbasis SMOTE.

1.2.2 Metode Usulan


Permasalahan analisis sentimen ulasan wisatawan di Jaddih Limestone Hill di
TripAdvisor diselesaikan dengan menggunakan metode Decision Tree berbasis SMOTE.
Metode Decision Tree digunakan untuk mengklasifikasikan ulasan wisatawan ke dalam
kategori sentimen positif, negatif, atau netral. SMOTE (Synthetic Minority Over-sampling
Technique) digunakan sebagai pendekatan untuk mengatasi masalah ketidakseimbangan kelas
dalam dataset ulasan, khususnya untuk menghasilkan sampel sintetis dari kelas minoritas,
seperti sentimen negatif.

1.2.3 Pertanyaan Penelitian


1. Bagaimana penggunaan metode Decision Tree berbasis SMOTE dapat membantu dalam
melakukan analisis sentimen terhadap ulasan wisatawan yang berkunjung ke Jaddih
Limestone Hill di TripAdvisor?
2. Bagaimana hasil analisis sentimen dapat digunakan oleh pengelola Jaddih Limestone Hill
untuk meningkatkan layanan, memahami preferensi pengunjung, dan mempromosikan
destinasi wisata dengan lebih efektif?

1.3 Tujuan
1. Menerapkan metode Decision Tree berbasis SMOTE untuk melakukan analisis sentimen
terhadap ulasan wisatawan yang berkunjung ke Jaddih Limestone Hill di TripAdvisor.
2. Menghasilkan model klasifikasi sentimen yang akurat untuk mengklasifikasikan ulasan
wisatawan ke dalam kategori positif, negatif, atau netral.
3. Memberikan wawasan yang berguna bagi pengelola Jaddih Limestone Hill dalam
meningkatkan layanan, memahami preferensi pengunjung, dan mempromosikan destinasi
wisata dengan lebih efektif.

4
1.4 Manfaat
1. Metode Decision Tree berbasis SMOTE dapat meningkatkan akurasi dan keandalan
analisis sentimen terhadap ulasan wisatawan, sehingga hasilnya lebih dapat diandalkan
dalam memahami sentimen pengunjung terhadap Jaddih Limestone Hill.
2. Penggunaan metode ini memungkinkan pengelola destinasi untuk mengelola data ulasan
wisatawan dengan lebih efektif dan mendapatkan pemahaman yang lebih mendalam
tentang preferensi dan pandangan pengunjung.
3. Pengunjung yang datang ke Jaddih Limestone Hill dapat diuntungkan dari peningkatan
layanan dan fasilitas berdasarkan ulasan dan preferensi mereka sendiri yang tercermin
dalam analisis sentimen. Hal ini dapat meningkatkan kepuasan mereka selama
berkunjung.
4. Informasi dari analisis sentimen dapat membantu pihak berwenang dan pemerintah dalam
mengambil kebijakan yang lebih baik terkait pengembangan pariwisata dan destinasi
seperti Jaddih Limestone Hill.

1.5 Batasan Masalah


1. Dataset yang digunakan dalam penelitian ini adalah data ulasan wisatawan yang
berkunjung ke Jaddih Limestone Hill di TripAdvisor. Data tersebut mencakup ulasan
tekstual yang diberikan oleh wisatawan beserta peringkat atau rating yang diberikan oleh
wisatawan.
2. Penelitian ini akan fokus pada analisis sentimen terhadap ulasan wisatawan dalam bentuk
teks. Dalam proses analisis teks, penelitian ini akan menggunakan metode Decision Tree
berbasis SMOTE untuk mengatasi ketidakseimbangan kelas dalam data ulasan.
3. Perancangan sistem analisis sentimen akan dilakukan menggunakan bahasa pemrograman
Python dengan dukungan library yang sesuai, untuk implementasi metode Decision Tree
dan SMOTE.
4. Penelitian ini akan membatasi analisis sentimen hanya pada ulasan yang berkaitan dengan
Jaddih Limestone Hill di TripAdvisor. Ulasan mengenai destinasi lain tidak akan menjadi
bagian dari analisis ini.

1.6 Sistematika Penulisan


Adapun sistematika penulisan dari penelitian ini yaitu:

1. Bab I Pendahuluan

5
Pada bab I berisi tentang latar belakang, rumusan masalah, batasan masalah, tujuan
penelitian, manfaat penelitian dan sistematika proposal.
2. Bab II Kajian Pustaka
Pada bab II berisi tentang penelitian yang sudah mengimplementasikan metode Decision
Tree dalam penelitiannya dan terdapat pembahasan teori-teori yang dapat membantu
untuk menyelesaikan penelitian ini.
3. Bab III Metode Penelitian
Bab III berisi tentang kebutuhan sistem, tahapan penelitian, algoritma dari metode
Decision Tree berbasis SMOTE.

6
BAB II
KAJIAN PUSTAKA
2.1 Landasan Teori
2.1.1 Analisis Sentimen
Analisis sentimen adalah proses pengumpulan, pemrosesan, dan evaluasi data
teks atau konten untuk menentukan dan memahami sentimen atau perasaan yang
terkandung dalamnya. Tujuan utama dari analisis sentimen adalah untuk
mengidentifikasi apakah suatu teks atau konten mengandung sentimen positif, negatif,
atau netral, serta untuk mengukur sejauh mana sentimen tersebut [4]. Penggunaan
analisis sentimen telah digunakan dalam berbagai sektor, seperti acara sosial, produk,
layanan konsumen, dan sebagainya. Perusahaan raksasa dunia, seperti Google,
Microsoft, SAP, dan SAS, telah merancang suatu sistem yang membantu konsumen
dalam menentukan keputusannya dalam memilih suatu produk hingga mengembangkan
aplikasi bisnis yang lebih baik dengan cara melacak dan memprediksi tren pasar [11].

Analisis sentimen memiliki peran yang sangat penting dalam industri pariwisata.
Dalam era digital ini, wisatawan secara aktif berbagi pengalaman mereka melalui ulasan
online, media sosial, dan platform lainnya. Dengan memahami sentimen yang
terkandung dalam ulasan dan komentar ini, pelaku industri pariwisata dapat mengambil
langkah-langkah yang lebih bijaksana dan proaktif. Analisis sentimen memungkinkan
mereka untuk memahami keinginan, kepuasan, atau ketidakpuasan wisatawan, yang pada
gilirannya dapat digunakan untuk meningkatkan kualitas layanan, merancang paket
liburan yang lebih menarik, dan mengidentifikasi tren wisatawan yang baru. Selain itu,
analisis sentimen membantu dalam merespons dengan cepat terhadap masalah yang
mungkin muncul, menjaga reputasi destinasi atau merek, dan mengarahkan upaya
pemasaran dengan lebih efisien [12]. Dengan demikian, analisis sentimen bukan hanya
alat untuk memahami, tetapi juga untuk memajukan industri pariwisata, memenuhi
kebutuhan wisatawan, dan meningkatkan pengalaman mereka saat berlibur.

Faktor-faktor yang memengaruhi sentimen wisatawan adalah elemen-elemen


yang beragam dan seringkali sangat subjektif, yang secara kolektif membentuk
pandangan dan perasaan wisatawan tentang suatu perjalanan atau destinasi. Pengalaman
pribadi selama perjalanan menjadi salah satu faktor utama yang memengaruhi sentimen
wisatawan, di mana pengalaman yang positif seperti pelayanan yang baik, akomodasi
yang nyaman, dan destinasi yang menarik cenderung menghasilkan sentimen positif.

7
Selain itu, kualitas layanan yang diberikan oleh penyedia layanan pariwisata, interaksi
dengan penduduk lokal, harga yang ditawarkan, serta kondisi cuaca selama perjalanan
juga memainkan peran penting dalam membentuk sentimen wisatawan [13]. Ulasan
online dan media sosial juga memengaruhi sentimen dengan ulasan positif yang
mendorong minat dan ulasan negatif yang dapat membuat wisatawan ragu. Faktor lain
seperti persepsi keamanan, rekomendasi dari teman dan keluarga, serta faktor-faktor
eksternal seperti kebijakan perjalanan juga dapat berdampak pada sentimen. Pemahaman
yang baik terhadap faktor-faktor ini membantu industri pariwisata untuk meningkatkan
layanan, mengidentifikasi masalah yang perlu diperbaiki, dan menjaga reputasi positif
destinasi atau merek pariwisata [12].

Dalam melakukan analisis sentimen terhadap wisatawan, digunakan tiga keriteria


yang diantaranya adalah informativitas, keterbacaan, dan subjektivitas. Kriteria
informativitas merujuk kepada sejauh mana teks atau konten mengandung informasi
yang berguna atau relevan. Teks yang informatif diketahui dapat memberikan informasi
atau pemahaman yang lebih baik dan mendalam terkait subjek tertentu. Selain itu,
kriteria keterbacaan mengacu pada tingkat keterbacaan atau kesulitan dalam memahami
teks. Teori-teori seperti indeks keterbacaan digunakan untuk mengukur keberbacaan.
Teks dengan keberbacaan yang baik cenderung lebih mudah dipahami. Terakhir, kriteria
subjektivitas merupakan kriteria yang merujuk kepada sejauh mana teks atau konten
bersifat subjektif atau objektif. Teks subjektif cenderung berisi pendapat pribadi atau
perasaan, sementara teks objektif berfokus pada fakta dan informasi tanpa penilaian
pribadi [14].

Metode pengumpulan data sentimen adalah langkah kunci dalam analisis


sentimen yang memungkinkan peneliti atau pemangku kepentingan untuk mengakses
ulasan, komentar, atau pendapat dari berbagai sumber. Ada beberapa metode yang
umumnya digunakan untuk mengumpulkan data sentimen. Salah satu metode yang
sering digunakan adalah "pengumpulan data online," di mana ulasan dan komentar dari
situs web, platform media sosial, forum diskusi, dan situs berbagi video dianalisis.
Metode ini memberikan akses ke data yang sangat beragam dan real-time. Selain itu,
survei dan kuesioner juga sering digunakan sebagai metode pengumpulan data sentimen
[15]. Dalam survei ini, responden diundang untuk memberikan pendapat mereka tentang
suatu topik atau produk dengan menggunakan skala penilaian atau pertanyaan terbuka.
Data dari survei ini dapat memberikan wawasan yang berharga tentang sentimen dan

8
preferensi mereka. Selanjutnya, colata historis atau arsip juga bisa menjadi metode
pengumpulan data sentimen. Ini mencakup menganalisis dokumen-dokumen tertulis
seperti artikel berita, laporan, atau catatan sejarah untuk memahami sentimen yang
terkandung dalam teks tersebut.

Selain dari metode pengumpulan data, proses analisis sentimen juga menjadi
salah satu kunci dalam melakukan analisis. Komputer atau algoritma pemrosesan bahasa
alami sering digunakan untuk mengotomatisasi proses analisis sentimen. Alat analisis
sentimen ini dapat mengekstrak informasi tentang sentimen dari sejumlah besar data teks
dengan cepat dan efisien [16]. Analisis sentimen memiliki banyak aplikasi yang
bermanfaat, seperti dalam survei opini publik, manajemen merek, penelitian pasar, dan
analisis sosial media. Misalnya, perusahaan dapat menggunakan analisis sentimen untuk
melacak bagaimana konsumen merespons produk atau layanan mereka berdasarkan
ulasan online [17]. Dengan demikian, analisis sentimen membantu organisasi dalam
mengambil keputusan yang lebih baik dan merespons dengan lebih efektif terhadap
perasaan dan pandangan konsumen serta pemangku kepentingan lainnya.

2.1.2 Objek Wisata


Objek wisata merujuk pada tempat, situs, atau atraksi yang menarik perhatian
pengunjung atau wisatawan. Ini bisa berupa destinasi alam seperti pantai, gunung, taman
nasional, atau danau yang menawarkan keindahan alam yang memesona. Objek wisata
juga dapat berupa situs sejarah, seperti kuil kuno, kastil, atau situs arkeologi yang
memiliki nilai budaya dan sejarah yang tinggi [18]. Selain itu, atraksi modern seperti
taman hiburan, museum seni, restoran terkenal, dan acara budaya juga dianggap sebagai
objek wisata. Objek wisata biasanya memiliki daya tarik yang unik dan sering kali
menjadi tujuan utama bagi mereka yang ingin menjelajahi, belajar, bersantai, atau
mengejar hiburan. Dalam konteks pariwisata, objek wisata berperan penting dalam
menarik wisatawan, menciptakan pengalaman berharga, dan memberikan dampak
ekonomi positif pada daerah atau komunitas yang mengelolanya.

Objek wisata memiliki peran penting dalam aspek ekonomi, yang mencakup
manfaat besar bagi perekonomian lokal, regional, dan nasional. Secara ekonomi, objek
wisata membawa dampak positif melalui beberapa cara yang signifikan, salah satunya
adalah dengan menciptakan lapangan kerja bagi penduduk lokal. Mereka membuka
peluang pekerjaan dalam berbagai sektor, seperti perhotelan, restoran, transportasi, dan

9
kerajinan tangan lokal. Hal ini membantu mengurangi tingkat pengangguran dan
meningkatkan taraf hidup masyarakat setempat. Lalu, objek wisata mendorong
pertumbuhan bisnis lokal. Peningkatan jumlah wisatawan membawa peluang bagi
pengusaha lokal untuk membuka usaha baru atau memperluas yang sudah ada. Ini
mencakup pembukaan toko suvenir, restoran, tur panduan, dan usaha kecil lainnya yang
mendukung pariwisata [19].

Pendapatan yang dihasilkan dari wisatawan juga berdampak positif pada


pendapatan daerah dan pajak lokal. Pajak yang diterima dari wisatawan dapat digunakan
untuk membiayai proyek-proyek infrastruktur, pendidikan, dan layanan publik lainnya
yang memberikan manfaat kepada komunitas setempat. Selain itu, objek wisata dapat
meningkatkan investasi dalam pariwisata, yang berpotensi memberikan pengembalian
jangka panjang yang substansial. Pengembangan infrastruktur pariwisata yang baik,
seperti jalan raya, bandara, dan fasilitas umum lainnya, juga dapat menarik investasi
swasta yang lebih besar ke daerah tersebut [20]. Oleh karena itu, upaya untuk
memelihara dan mengembangkan objek wisata menjadi sangat penting untuk mendukung
pertumbuhan ekonomi yang berkelanjutan.

Indonesia, dengan keindahan alamnya yang memukau dan keragaman budayanya


yang kaya, telah menjadi salah satu destinasi wisata yang paling diminati di dunia.
Negeri kepulauan ini menawarkan pesona alam yang diakui oleh wisatawan lokal hingga
mancanegara. Salah satu destinasi wisata yang ada di Indonesia adalah Jaddih Limestone
Hill yang terletak di Desa Jaddih, Kecamatan Trowulan, Kabupaten Mojokerto, Jawa
Timur. Bukit ini terdiri dari formasi batu kapur yang menjulang tinggi dan menciptakan
lanskap yang memiliki daya tarik bagi wisatawan. Hal yang membuat Jaddih Limestone
Hill begitu menarik adalah struktur batu kapurnya yang berlapis-lapis dan berkontur
tajam. Selain itu, Jaddih Limestone Hill juga memiliki potensi sebagai lokasi hiking dan
rock climbing bagi para wisatawan. Terlebih lagi, Jaddih Limestone Hill terletak dekat
dengan situs bersejarah Trowulan, yang merupakan bekas ibu kota kerajaan Majapahit
pada masa lampau. Maka dari itu, Jaddih Limestone Hill menjadi daya tarik bagi para
wisatawan dan pencinta alam yang ingin mengeksplorasi kekayaan alam dan budaya
Indonesia [1], [3].

10
2.1.3 TripAdvisor
Platform daring dalam industri pariwisata adalah sarana digital yang telah
mengubah cara kita merencanakan, memesan, dan menjalani perjalanan. Platform ini
mencakup berbagai situs web dan aplikasi yang memungkinkan wisatawan untuk
mencari destinasi, akomodasi, transportasi, dan aktivitas wisata dengan mudah.
TripAdvisor juga memberikan akses kepada ulasan dan rekomendasi dari pengguna
sebelumnya, memberikan wawasan berharga tentang pengalaman wisatawan lainnya.
Dari memesan tiket pesawat hingga mengelola jadwal perjalanan, platform ini
memberikan kemudahan dan kenyamanan dalam perjalanan. TripAdvisor juga
memfasilitasi pembayaran online, menyediakan informasi keamanan, dan seringkali
menggunakan teknologi kecerdasan buatan untuk memberikan rekomendasi yang
disesuaikan. Dengan adanya platform daring dalam industri pariwisata, perencanaan
perjalanan dan pengalaman wisata telah menjadi lebih terorganisir, efisien, dan personal
[18].

TripAdvisor adalah sebuah platform daring yang telah menjadi tonggak penting
dalam industri pariwisata. Sebagai salah satu sumber utama ulasan dan rekomendasi
perjalanan, TripAdvisor memungkinkan jutaan wisatawan dari seluruh dunia untuk
berbagi pengalaman mereka tentang destinasi, akomodasi, restoran, dan aktivitas
perjalanan. Pengguna platform ini dapat memberikan ulasan, memberikan peringkat, dan
mengunggah foto serta video terkait pengalaman mereka, memberikan pandangan yang
komprehensif tentang berbagai destinasi dan layanan [21].

TripAdvisor juga memainkan peran kunci dalam analisis sentimen wisatawan,


dengan kemampuannya untuk mengumpulkan dan menganalisis data ulasan dari
berbagai sumber. Ini memberikan wawasan berharga kepada pemangku kepentingan
industri pariwisata tentang preferensi dan opini wisatawan, memungkinkan mereka untuk
meningkatkan layanan dan memahami tren pasar dengan lebih baik. Dengan demikian,
TripAdvisor telah membuka jendela besar bagi pemahaman dan pengambilan keputusan
yang lebih baik dalam industri pariwisata [22].

TripAdvisor menyediakan alat yang intuitif dan terstruktur untuk membantu


pengguna menyusun ulasan mereka. Pengguna dapat memberikan peringkat dengan
menggunakan sistem bintang, menulis ulasan dengan kata-kata mereka sendiri, dan
bahkan mengunggah foto atau video yang memperkaya ulasan. Fitur ini memungkinkan

11
wisatawan untuk berbagi pengalaman mereka secara komprehensif dan memberikan
pandangan yang lebih jelas kepada calon wisatawan lainnya [23]. Pentingnya
TripAdvisor dalam mengumpulkan ulasan dari seluruh dunia terletak pada partisipasi
aktif komunitas wisatawan yang besar. Sebagai platform yang sangat dikenal dan
digunakan secara luas, TripAdvisor telah berhasil menciptakan ekosistem di mana
pengguna merasa didorong untuk berbagi informasi tentang perjalanan mereka. Data
ulasan yang terkumpul dari berbagai sumber ini memberikan gambaran yang lebih
lengkap tentang berbagai destinasi dan layanan, memungkinkan calon wisatawan untuk
membuat keputusan yang lebih baik tentang perjalanan mereka[18].

2.1.4 Machine Learning


Analisis sentimen adalah konsep penting dalam pemahaman opini dan pandangan
wisatawan dalam industri pariwisata. Dalam era digital yang kita alami saat ini, di mana
ulasan dan umpan balik online menjadi semakin berlimpah, pemahaman terhadap
sentimen yang terkandung dalam ulasan-ulasan tersebut memiliki nilai strategis yang
besar. Kebutuhan akan alat yang efisien dan efektif dalam menganalisis sentimen
semakin mendesak, dan inilah di mana teknik machine learning muncul sebagai solusi
yang sangat berguna. Dengan kemampuan untuk secara otomatis mengklasifikasikan
ulasan-ulasan ini menjadi positif, negatif, atau netral, machine learning memberikan alat
yang kuat untuk mengurai pandangan dan opini wisatawan dengan cepat dan skalabel
[24]. Hal ini, pada gilirannya, memungkinkan pemangku kepentingan dalam industri
pariwisata untuk merespons dengan lebih cepat dan akurat terhadap umpan balik
wisatawan, meningkatkan kualitas layanan, dan membangun pengalaman yang lebih
memuaskan bagi para wisatawan.

Machine learning adalah subdisiplin dalam bidang kecerdasan buatan (Artificial


Intelligence) yang fokus pada pengembangan algoritma dan model komputer yang
memungkinkan sistem untuk belajar dan memperbaiki kinerjanya dari data, tanpa perlu
pemrograman ekspisit. Dalam konteks machine learning, komputer digunakan untuk
menganalisis dan mengidentifikasi pola-pola dalam data, mengambil keputusan, atau
memprediksi hasil berdasarkan pengalaman sebelumnya [25]. Kemampuan utama dari
machine learning adalah adaptasinya terhadap data baru dan perubahan dalam data input,
sehingga membuatnya relevan dalam berbagai aplikasi, mulai dari analisis sentimen
hingga mobil otonom dan diagnosis medis. Dengan menerapkan konsep pembelajaran

12
melalui data, machine learning telah mengubah cara untuk memproses dan memahami
informasi, membuka pintu untuk berbagai inovasi di berbagai sektor.

Pengumpulan data ulasan dan komentar wisatawan dari platform seperti


TripAdvisor merupakan tahap awal yang penting dalam menganalisis sentimen dengan
menggunakan teknik machine learning. Data ini diperoleh melalui akses ke platform
tersebut, di mana ulasan-ulasan wisatawan tentang berbagai destinasi dan layanan
dikumpulkan secara massal. Volume data yang besar adalah kunci dalam tahap ini,
karena semakin banyak data yang tersedia, semakin baik model machine learning dapat
dilatih untuk mengenali pola dan tren dalam ulasan tersebut. Data yang beragam dan
melimpah memberikan model pelatihan lebih banyak variasi dan konteks, yang
meningkatkan kemampuannya dalam mengklasifikasikan sentimen [26].

Setelah data terkumpul, langkah berikutnya adalah pemrosesan data. Data ulasan
perlu diolah untuk menghilangkan noise atau gangguan yang tidak relevan. Proses ini
mencakup penghapusan tanda baca, karakter khusus, atau informasi yang tidak perlu.
Selanjutnya, teks ulasan diidentifikasi untuk kata-kata kunci yang relevan, seperti kata
sifat yang menggambarkan perasaan, seperti "baik", "buruk", "menyenangkan", atau
"frustrasi" [27]. Natural Language Processing (NLP) adalah cabang dari kecerdasan
buatan yang berfokus pada interaksi antara komputer dan bahasa manusia alami. NLP
bertujuan untuk memungkinkan komputer untuk memahami, memproses, dan
menghasilkan teks atau ucapan dalam bahasa manusia dengan cara yang bermakna. Ini
melibatkan berbagai tugas, termasuk pemrosesan teks, analisis sentimen, penerjemahan
mesin, pemahaman bahasa alami, serta generasi bahasa alami [28].

Dalam konteks NLP, komputer menggunakan algoritma dan model statistik untuk
mengurai, mengidentifikasi, dan menginterpretasikan struktur bahasa manusia, seperti
tata bahasa, makna kata, dan konteks dalam kalimat. NLP memungkinkan komputer
untuk melakukan tugas-tugas seperti pengenalan entitas dalam teks (seperti nama orang
atau tempat), ekstraksi informasi, dan merespons pertanyaan dalam bahasa alami [29].
NLP membantu dalam memahami konteks kalimat, mengenali entitas seperti nama
tempat atau merek, dan mengidentifikasi kata-kata kunci yang mengindikasikan
sentimen. Dengan mengaplikasikan teknik-teknik NLP ini, data ulasan diubah menjadi
format yang dapat dimengerti oleh model machine learning, yang kemudian digunakan

13
untuk menganalisis dan mengklasifikasikan sentimen wisatawan dengan akurasi yang
tinggi [30].

Dalam konteks analisis sentimen, model machine learning dilatih dengan


menggunakan data yang telah dilabeli dengan sentimen tertentu, yang biasanya diberi
label sebagai positif, negatif, atau netral. Proses pelatihan ini bertujuan untuk
mengajarkan model bagaimana mengenali pola dan karakteristik dalam teks yang
mengindikasikan sentimen tertentu. Dengan kata lain, model belajar untuk memahami
hubungan antara kata-kata, frasa, atau fitur-fitur lain dalam teks dengan sentimen yang
ada. Terdapat beberapa jenis algoritma yang umum digunakan dalam klasifikasi sentimen
[29]:

1. Naive Bayes; adalah pendekatan berbasis probabilitas yang menghitung


probabilitas bahwa sebuah dokumen tertentu memiliki sentimen positif,
negatif, atau netral. Ini bekerja dengan mengasumsikan independensi antara
fitur-fitur (kata-kata atau frasa) dalam teks, meskipun asumsi ini sering kali
sangat sederhana dalam konteks analisis sentimen.
2. Support Vector Machines (SVM); adalah algoritma yang digunakan dalam
klasifikasi sentimen dengan mencari pemisah linier yang terbaik antara data
yang memiliki sentimen yang berbeda. SVM mencoba menemukan hyperplane
yang memaksimalkan margin antara kelas-kelas sentimen, sehingga
memungkinkan pengklasifikasi yang akurat.
3. Deep Learning; khususnya dengan menggunakan arsitektur jaringan saraf
tiruan yang dalam (deep neural networks), telah menjadi populer dalam
analisis sentimen. Ini melibatkan pembuatan model jaringan saraf yang
kompleks dengan banyak lapisan (neuron) yang dapat memahami hierarki fitur
dalam teks. Deep Learning sering memberikan kinerja yang baik dalam tugas
analisis sentimen yang rumit.

Selain algoritma-algoritma tersebut, ada juga teknik-teknik lain seperti Random


Forests, Logistic Regression, dan lebih banyak lagi yang digunakan dalam klasifikasi
sentimen. Pemilihan algoritma tergantung pada jenis data, kompleksitas tugas, dan tujuan
analisis sentimen yang sedang dilakukan [31]. Penggunaan model-machine learning
dalam klasifikasi sentimen telah menjadi alat yang kuat dalam memahami pandangan

14
dan perasaan manusia dalam ulasan, dan terus berkontribusi dalam berbagai aplikasi,
termasuk analisis opini online, pemantauan merek, dan banyak lagi.

Penggunaan machine learning dalam analisis sentimen memiliki sejumlah


kelebihan yang signifikan, tetapi juga dibarengi dengan beberapa batasan yang perlu
diperhatikan. Salah satu keunggulan utama adalah kemampuan model-machine learning
untuk mengklasifikasikan sentimen secara otomatis dan skalabel pada volume besar
ulasan, yang memungkinkan pemrosesan data yang cepat dan efisien. Selain itu, model-
machine learning dapat mencapai tingkat akurasi yang tinggi dalam mengidentifikasi
sentimen, memberikan wawasan yang berharga bagi organisasi dan bisnis untuk
mengambil tindakan yang lebih baik berdasarkan ulasan dan opini pelanggan [29].

Namun, batasan penting termasuk keterbatasan dalam memahami konteks dan


nuansa dalam bahasa manusia, sehingga tidak selalu dapat mengidentifikasi makna yang
lebih dalam atau perasaan yang rumit. Selain itu, model-machine learning sangat
bergantung pada kualitas data pelatihan, sehingga jika data tersebut bias atau tidak
representatif, hasil analisis sentimen dapat menjadi kurang akurat. Akurasi model-
machine learning juga terbatas pada sejauh mana data pelatihan mencakup variasi yang
mencukupi dari jenis ulasan dan sentimen [26]. Oleh karena itu, penggunaan machine
learning dalam analisis sentimen memerlukan pemantauan yang cermat dan pemahaman
yang baik tentang kelebihan dan batasan teknologi ini.

2.1.5 Decision Tree


Decision tree adalah salah satu metode yang populer dalam machine learning
yang mana dalam konteks analisis sentimen adalah pendekatan yang mengandalkan
struktur seperti pohon untuk menggambarkan aliran pengambilan keputusan berdasarkan
atribut-atribut yang terdapat dalam data [32]. Konsep dasar decision tree memungkinkan
pengklasifikasian data ke dalam kelompok atau kategori berdasarkan serangkaian
keputusan yang diambil secara berurutan. Dalam hal analisis sentimen, atribut-atribut
seperti kata-kata kunci dalam ulasan atau fitur-fitur lainnya dapat menjadi kriteria
keputusan yang membantu membedakan sentimen positif, negatif, atau netral dalam teks
[33].

Decision tree memecah data menjadi kelompok-kelompok yang semakin kecil


hingga mencapai simpul daun (leaf node) yang mewakili kategori sentimen. Dengan
demikian, metode ini memberikan kerangka kerja yang intuitif dan mudah dimengerti

15
untuk memahami bagaimana atribut-atribut dalam data berkontribusi terhadap klasifikasi
sentimen, yang berguna dalam menganalisis ulasan atau komentar dari wisatawan atau
pengguna lainnya [34]. Penggunaan decision tree dalam analisis sentimen wisatawan
sangat relevan karena metode ini memiliki kemampuan yang penting dalam memahami
pola dan karakteristik dalam ulasan atau komentar wisatawan yang mencerminkan
sentimen mereka terhadap pengalaman perjalanan. Decision tree adalah alat yang intuitif
dan transparan yang dapat membantu dalam mengurai data ulasan wisatawan dengan
cara yang mudah dimengerti [26]. Dalam konteks ini, decision tree dapat
mengidentifikasi atribut-atribut kunci dalam ulasan, seperti kata-kata kunci yang
berkaitan dengan pengalaman positif atau negatif, dan memutuskan bagaimana atribut-
atribut ini berkorelasi dengan sentimen keseluruhan ulasan .

Misalnya, decision tree dapat dengan cepat mengidentifikasi bahwa kata-kata


seperti "indah," "mengesankan," atau "menyenangkan" cenderung mengindikasikan
sentimen positif, sementara kata-kata seperti "buruk," "tidak puas," atau "kecewa"
cenderung mengindikasikan sentimen negatif. Dengan menggabungkan berbagai atribut
dan pertanyaan, decision tree dapat mengklasifikasikan ulasan-ulasan ini secara otomatis
ke dalam kategori sentimen yang sesuai, seperti "Positif," "Negatif," atau "Netral."
Dengan cara ini, decision tree membantu dalam memahami dan menganalisis sentimen
wisatawan dengan cara yang dapat digunakan oleh industri pariwisata untuk
meningkatkan layanan, merancang pengalaman yang lebih memuaskan, atau merespons
masukan pelanggan secara lebih efektif [34]. Kemampuan decision tree untuk
mengidentifikasi pola dalam data ulasan secara cepat dan mudah dimengerti
menjadikannya alat yang berharga dalam mengurai informasi penting dari pandangan
dan pengalaman para wisatawan.

2.1.6 Synthetic Minority Over-sampling Technique (SMOTE)


Konsep SMOTE, singkatan dari "Synthetic Minority Over-sampling Technique,"
merupakan sebuah teknik oversampling yang sangat relevan dalam konteks analisis
sentimen. Teknik ini dirancang khusus untuk menangani masalah ketidakseimbangan
kelas dalam dataset sentimen, di mana kelas mayoritas (contohnya, sentimen positif atau
netral dalam analisis sentimen wisatawan) memiliki jumlah sampel yang jauh lebih
banyak daripada kelas minoritas (misalnya, sentimen negatif) [35]. Keberadaan
ketidakseimbangan ini dapat menghasilkan model analisis sentimen yang bias dan

16
kurang akurat, karena model akan cenderung memprediksi mayoritas kelas tanpa
memperhatikan kelas minoritas yang mungkin memiliki informasi penting [36].

SMOTE bekerja dengan cara menghasilkan data sintetis untuk kelas minoritas
dengan cara mengambil sampel dari kelas minoritas yang ada dan menciptakan sampel-
sampel baru yang serupa dengan sampel-sampel tersebut. Proses ini melibatkan
pemilihan titik acak dari kelas minoritas, penentuan tetangga terdekat dari titik tersebut,
dan kemudian menciptakan sampel sintetis di antara titik acak dan tetangga terdekat
dengan menggabungkan atribut-atribut dari keduanya [35]. Hasilnya adalah dataset yang
seimbang dengan jumlah sampel yang lebih setara antara kelas mayoritas dan kelas
minoritas, memungkinkan model analisis sentimen untuk mempelajari dan memahami
sentimen yang lebih baik di kedua kelas.

Pentingnya penanganan ketidakseimbangan kelas dalam analisis sentimen,


terutama dalam konteks ulasan wisatawan, tidak dapat diabaikan. Ketidakseimbangan
kelas terjadi ketika jumlah ulasan dengan sentimen positif atau netral jauh lebih banyak
daripada ulasan dengan sentimen negatif. Masalah ini menciptakan ketidaksetaraan
dalam dataset dan memiliki konsekuensi yang signifikan dalam pembangunan model
analisis sentimen. Dalam analisis sentimen, model berusaha untuk memahami dan
mengklasifikasikan sentimen yang tercermin dalam teks ulasan. Namun, ketika jumlah
ulasan positif atau netral mendominasi, model cenderung memprioritaskan klasifikasi
yang lebih banyak daripada yang lebih sedikit [37]. Dalam konteks wisatawan, ini berarti
bahwa sentimen negatif yang mungkin mengandung masukan yang berharga untuk
perbaikan layanan atau pengalaman wisatawan bisa terabaikan.

Ketidakseimbangan kelas juga dapat menghasilkan model yang bias. Model yang
tidak seimbang dapat menghasilkan kinerja yang sangat baik dalam mengklasifikasikan
mayoritas sentimen, tetapi kinerja yang buruk dalam mengenali sentimen minoritas,
seperti sentimen negatif. Hal ini dapat mengakibatkan penilaian yang tidak akurat
tentang pengalaman wisatawan dan kebijakan yang diambil berdasarkan analisis
sentimen yang tidak seimbang. Oleh karena itu, penanganan ketidakseimbangan kelas
dalam analisis sentimen, seperti penggunaan teknik oversampling seperti SMOTE,
sangat penting. Ini membantu menciptakan dataset yang lebih seimbang, memastikan
bahwa model dapat memahami dan mengklasifikasikan sentimen dari semua kelas

17
dengan adil [38]. Ketika menganalisis sentimen wisatawan, SMOTE bekerja dengan
cara berikut [35]:

1. Pemilihan Titik Acak: SMOTE pertama-tama memilih titik acak dari kelas
minoritas sebagai titik referensi untuk pembuatan sampel sintetis.
2. Penentuan Tetangga Terdekat: Setelah titik acak dipilih, SMOTE
mengidentifikasi tetangga terdekat dari titik tersebut. Ini dilakukan dengan
mengukur jarak antara titik acak dan semua titik lain dalam kelas minoritas.
3. Pembuatan Sampel Sintetis: Selanjutnya, SMOTE menciptakan sampel
sintetis dengan mengambil perbedaan antara atribut-atribut dari titik acak dan
salah satu tetangga terdekat yang juga dipilih secara acak. Faktor acak
digunakan untuk mengendalikan sejauh mana perbedaan atribut ini akan
diterapkan dalam pembuatan sampel sintetis. Berikut merupakan rumus yang
dapat digunakan untuk menghasilkan sintetis baru:
S= A +random(B− A)
Dengan A merupakan instance dari kelas minoritas, B adalah tetangga yang
dipilih, dan random menghasilkan angka acak antara 0 dan 1.
4. Replikasi Proses: Langkah-langkah ini diulangi sejumlah kali untuk
menciptakan sejumlah sampel sintetis yang dibutuhkan hingga mencapai
tingkat oversampling yang diinginkan.

Hasil akhir dari proses SMOTE adalah dataset yang telah diperkaya dengan
sampel-sampel sintetis, sehingga jumlah sampel dalam kelas minoritas sekarang setara
dengan kelas mayoritas. Dengan demikian, ketidakseimbangan kelas dalam dataset
berhasil diatasi, memungkinkan model analisis sentimen untuk mempelajari dan
mengklasifikasikan sentimen dari semua kelas dengan lebih baik. Ini membantu
mencegah bias dan meningkatkan akurasi analisis sentimen, terutama dalam kasus di
mana sentimen negatif dalam ulasan wisatawan cenderung menjadi minoritas dalam
dataset [36].

Ketika pengaplikasian SMOTE, diketahui terdapat beberapa kekurangan, yang


diantaranya adalah bahwa dalam beberapa kasus, penciptaan sampel sintetis dapat
menghasilkan overfitting. Sampel sintetis mungkin menjadi terlalu mirip dengan data
pelatihan yang ada, dan ini dapat mengakibatkan model menjadi terlalu spesifik terhadap
data pelatihan tersebut dan tidak dapat menggeneralisasi dengan baik pada data baru.

18
Selain itu, SMOTE mungkin tidak selalu cocok untuk semua jenis data atau kasus [38].
Misalnya, dalam beberapa situasi, SMOTE dapat menyebabkan pembuatan sampel
sintetis yang tidak realistis.Lalu, SMOTE juga memerlukan pemahaman yang cermat
tentang data dan pemilihan parameter yang tepat. Hal ini dapat menjadi tugas yang rumit
dan memakan waktu, terutama dalam dataset yang besar atau kompleks.

Dalam rangka mengatasi kelemahan SMOTE, penting untuk mempertimbangkan


alternatif lain seperti penggunaan algoritma ensemble, undersampling, atau teknik
sampling yang lain sesuai dengan karakteristik dataset dan tujuan analisis sentimen yang
diinginkan [6]. Dengan memahami baik kelebihan dan kekurangan SMOTE, dapat
dipilih teknik oversampling yang paling sesuai untuk kasus tertentu dalam analisis
sentimen wisatawan.

2.1.7 Decision Tree berbasis SMOTE


Decision tree berbasis SMOTE adalah sebuah metode yang digunakan dalam
analisis sentimen dan klasifikasi data untuk mengatasi masalah ketidakseimbangan kelas
dalam dataset. Dalam konteks analisis sentimen wisatawan, seringkali jumlah ulasan
dengan sentimen positif atau netral jauh lebih banyak daripada ulasan dengan sentimen
negatif, yang dapat mengarah pada bias dalam model analisis sentimen. Decision tree
berbasis SMOTE mengatasi masalah ini dengan menggabungkan dua teknik: decision
tree dan SMOTE (Synthetic Minority Over-sampling Technique) [39].

Decision tree adalah model yang menggambarkan aliran pengambilan keputusan


berdasarkan atribut-atribut dalam data, mirip dengan struktur pohon. Dalam konteks
analisis sentimen, atribut-atribut ini dapat mencakup kata-kata kunci dalam ulasan,
karakteristik produk atau layanan, dan informasi pengguna. Decision tree berusaha untuk
memahami hubungan antara atribut-atribut ini dan sentimen keseluruhan ulasan [40].
Dalam penggunaan decision tree berbasis SMOTE, SMOTE diterapkan terlebih dahulu
untuk mengatasi ketidakseimbangan kelas dalam dataset. Kemudian, decision tree dilatih
menggunakan dataset yang telah diperkaya dengan sampel-sampel sintetis dari kelas
minoritas. Hasilnya adalah model decision tree yang memiliki kemampuan untuk
mengklasifikasikan sentimen dengan mempertimbangkan keseimbangan kelas yang
ditingkatkan oleh SMOTE [10].

Metode ini membantu dalam menghasilkan hasil analisis sentimen yang lebih
akurat dan seimbang, memungkinkan identifikasi sentimen negatif yang mungkin

19
mengandung masukan berharga untuk perbaikan layanan atau pengalaman wisatawan
[41]. Dengan demikian, decision tree berbasis SMOTE menjadi alat yang efektif dalam
mengatasi ketidakseimbangan kelas dalam analisis sentimen wisatawan.

2.2 Landasan Teori


Penelitian terdahulu, juga dikenal sebagai studi literatur atau tinjauan pustaka,
mengacu pada kajian yang dilakukan oleh peneliti untuk memahami penelitian yang telah
dilakukan sebelumnya dalam bidang yang relevan dengan topik yang sedang diteliti.
Penelitian terdahulu dapat digunakan sebagai acuan dan rujukan ketika sedang
melangsungkan suatu penelitian.

Tabel 2.1. Penelitian Terdahulu

No Judul Penulis Tahun Metode Hasil

1. Analisis Sentimen Arifiyanti, 2022 Algoritma tingkat akurasi tertinggi


Ulasan dkk. Decision Tree, model klasifikasi
Pengunjung Naïve Bayes, dan dihasilkan oleh algoritma
Objek Wisata Logistic Decision Tree sebesar 91%
Gunung Bromo Regression dan diikuti oleh Naïve
pada Situs Bayes dan Logistic
Tripadvisor Regression yang masing-
masingnya 88%. Tingkat
precision, recall, dan f1-
measure untuk Decision
Tree masing-masingnya
sebesar 0,95 , 0,62 , dan
0,68. Dari hasil yang
didapatkan, model
klasifikasi perlu
ditingkatkan performanya
karena model klasifikasi
memiliki kecenderungan
prediksi ke kelas sentimen
positif.

20
2. Analisis Sentimen Cahyaningtyas 2021 Decision Tree Dari hasil evaluasi yang
Pada Rating , dkk dengan SMOTE ada dapat ditarik
Aplikasi Shopee kesimpulan SMOTE
Menggunakan dapat berpengaruh
Metode Decision terhadap nilai accuracy
Tree Berbasis dan AUC (Area Under
SMOTE Curve), serta untuk nilai
recall dan precision tidak
berpengaruh atau hasilnya
tetap sama walau
menggunakan SMOTE
atau tanpa SMOTE.
3. Analisis Sentimen Singgalen 2023 K - Nearest Setelah membandingkan
Pengunjung Pulau Neighbor (k-NN), performa SVM sebelum
Komodo dan Naïve Bayes dan setelah menggunakan
Pulau Rinca di Classifier (NBC), Synthetic Minority
Website Support Vector Oversampling Technique
Tripadvisor Machine (SVM), (SMOTE), dapat
Berbasis CRISP- dan Decision Tree diketahui bahwa peforma
DM (DT). algoritma menjadi lebih
optimal apabila
menggunakan operator
SMOTE. Dengan
demikian,SVM merupakan
algoritma yang relevan
digunakan sebagai model
analisis sentimen
wisatawan di Pulau
Komodo dan Pulau Rinca
berdasarkan CRISP-DM.
4. Analisis Sentimen Ginantra, dkk. 2022 Naïve Bayes, Penggunaan SMOTE up-
Ulasan Villa di Decision Tree, dan sampling digunakan untuk
Ubud k-NN menyamakan jumlah data

21
Menggunakan yang tidak seimbang. Hasil
Metode Naive analisa menunjukkan
Bayes, Decision bahwa metode k-NN lebih
Tree, dan K-NN unggul dalam menganalisis
sentimen dengan prediksi
sentimen 526 positif, 233
netral, 72 negatif.
Performance confusion
matrix menunjukkan
bahwa metode k-NN
unggul dengan akurasi
91.26%, precision 92.97%,
recall 91.26%, dan overall
performance 91.83%.
5. Analisis Perilaku Singgalen 2023 Cross Industry algoritma SVM
Wisatawan Standard Process menunjukkan performa
Berdasarkan Data for Data Mining yang lebih baik dengan
Ulasan di Website (CRISP-DM) nilai akurasi 97,67%,
Tripadvisor dengan algoritma presisi 100%, recall 95,34
Menggunakan Decision Tree dan dan f-measure 97,61%
CRISP-DM: Support Vector dalam klasifikasi 1075 data
Wisata Minat Machine dengan teks Gunung Bromo dan
Khusus Operator SMOTE 326 data ulasan Gunung
PendakianGunun Rinjani. Selain itu, dalam
g Rinjani dan konteks gunung Rinjani,
Gunung Bromo lima kata teratas yang
sering muncul dalam data
ulasan wisatawan di
gunung Rinjani ialah
sebagai berikut : summit
(272), rinjani (259), trek
(201), hike (170), mountain
(159). Disisi lain,lima kata

22
teratas yang sering muncul
dalam data ulasan
wisatawan di gunung
Bromo ialah sebagai
berikut :bromo (1864),
sunrise (1124), view (854),
crater (758), mount (577).

23
BAB 3
PENDAHULUAN
3.1 Langkah-Langkah Penelitian / Arsitektur Sistem
Rancangan arsitektur penelitian ini dilakukan dengan metode yang sistematis, yang dapat
berfungsi sebagai panduan saat melakukan penelitian, sehingga hasil yang diperoleh tetap
konsisten dan tujuan penelitian dapat tercapai secara efektif. Dalam penelitian ini, sistem
yang akan dikembangkan bertujuan untuk memahami sentimen positif dan negatif pada
ulasan pengunjung dengan menggunakan metode decision tree besbasis SMOTE. Berikut
merupakan bagan yang menjelaskan rancangan arsitektur penelitian ini:

Gambar 3.1. Rancangan Arsitektur Penelitian


Diagram tersebut mewakili langkah-langkah yang akan dijalani. Penelitian ini terbagi
menjadi beberapa tahap yang mencakup:

1. Input Data

24
Dataset yang digunakan berasal dari website TripAdvisor berupa data ulasan dari
pengunjung Jaddih Limestone Hill.
2. Proses
Setelah data mengenai ulasan pengunjung selesai dikumpulkan dari website
TripAdvisor, data ulasan diolah dengan NLP melalui beberapa tahapan yang
dimulai dari text preprocessing, tokenisasi, penghapusan stop words, serta
melakukan representasi teks secara numerik. Setelah itu dataset diolah dengan
SMOTE untuk menyeimbangkan kelas dataset. Terakhir dataset diolah dengan
decision tree untuk menghasilkan suatu model klasifikasi sentimen. Model
tersebut kemudian dievaluasi supaya dapat menghasilkan akurasi, presisi, dan
recall untuk hasil analisis sentimen yang akurat.
3. Output
Output yang dihasilkan pada penelitian ini adalah model klasifikas sentimen yang
akurat untuk mengklasifikasikan ulasan wisatawan ke dalam kategori positif,
negatif, atau netral.

3.2 Analisa Kebutuhan dan Perancangan Sistem


3.2.1 Analisa Kebutuhan Sistem
Analisis kebutuhan sistem adalah proses yang diperlukan untuk mengidentifikasi
persyaratan sistem. Ini juga mencakup komponen atau unsur apa yang diperlukan untuk
sistem yang akan dibuat hingga sistem tersebut dijalankan. Selain itu, analisis kebutuhan
ini juga menentukan spesifikasi input yang diperlukan oleh sistem, output yang akan
dihasilkan oleh sistem, dan proses yang diperlukan untuk memproses input sehingga
menghasilkan output yang diinginkan.

1. Kebutuhan Perangkat Keras

Perangkat keras atau hardware yang digunakan untuk menunjang penelitian ini
diantaranya adalah PC (personal computer), Processor 2.0 Ghz, dan RAM minimal 2
Gb, keyboard, mouse, serta monitor.

2. Kebutuhan Prerangkat Lunak

Kebutuhan perangkat lunak dalam menunjang penelitian ini diantaranya


adalah sistem operasi Windows, Python, serta library seperti NLTK dan sastrawi.

25
3.2.2 Perancangan Sistem
Perancangan sistem adalah langkah pertama dalam merancang aplikasi, yang
mencakup pembuatan desain proses yang dijelaskan melalui diagram alur atau flowchart.
Perancangan ini dilakukan untuk mengetahui kondisi sistem model secara umum.
Perancangan model akan melewati beberapa tahapan, yang diantaranya adalah tahapan
preprocessing, analisis SMOTE, dan dataset diklasifikasi dan dibuat pemodelannya
dengan decision tree, lalu terakhir model dievaluasi. Berikut merupakan rincian
perancangan sistem dari penelitian ini:

1. Data preprocessing

Data preprocessing dalam konteks Natural Language Processing (NLP) adalah


serangkaian langkah atau proses untuk membersihkan, mengorganisir, dan mengubah
data teks mentah menjadi format yang dapat digunakan untuk analisis NLP. Proses ini
bertujuan untuk meningkatkan kualitas data teks, menghilangkan noise, dan membuat
data lebih cocok untuk pemrosesan oleh model NLP. Data preprocessing dilakukan
dengan bantuan python dan library seperti nltk, dengan diagram alur sebagai berikut:

Gambar 3.2. Flowchart Data Preprocessing


Langkah pertama adalah membersihkan teks dengan mengubahnya menjadi
huruf kecil dan menghapus karakter khusus serta tanda baca yang tidak relevan.
Selanjutnya, teks dibagi menjadi token-token atau kata-kata dalam proses yang
disebut tokenisasi. Kata-kata umum yang tidak informatif, seperti kata penghubung,
dihilangkan dalam langkah penghapusan stop words.

Setelah itu, teks yang telah dibersihkan dan di-filter diubah menjadi vektor
TF-IDF. TF-IDF memberikan bobot numerik untuk setiap kata dalam dokumen
berdasarkan seberapa sering kata tersebut muncul dalam dokumen tertentu dan

26
seberapa uniknya kata tersebut dalam seluruh korpus dokumen. Kata-kata yang lebih
sering muncul dalam satu dokumen tetapi jarang dalam dokumen lain akan memiliki
bobot TF-IDF yang lebih tinggi.

Hasil akhir dari data preprocessing ini adalah representasi numerik dari teks
yang dapat digunakan dalam analisis NLP. Vektor TF-IDF ini memungkinkan model
NLP untuk memahami struktur teks dan mengidentifikasi pola yang relevan dalam
data, seperti kata-kata kunci atau topik penting. Dengan langkah-langkah ini, data teks
menjadi lebih siap untuk analisis seperti klasifikasi, pengelompokan, atau pemodelan
topik.

2. SMOTE

SMOTE (Synthetic Minority Over-sampling Technique) adalah teknik


oversampling yang digunakan dalam pemrosesan data yang tidak seimbang, terutama
dalam konteks klasifikasi di mana kelas minoritas memiliki jumlah sampel yang jauh
lebih sedikit dibandingkan dengan kelas mayoritas. SMOTE bekerja dengan cara
membuat sampel sintetis baru untuk kelas minoritas dengan cara interpolasi antara
sampel-sampel minoritas yang ada. Berikut merupakan diagram alur yang digunakan
dalam analisis SMOTE:

Gambar 3.3. Flowchart Analisis SMOTE


Langkah pertama adalah memahami dataset dengan baik. Ini mencakup
mengidentifikasi kelas mayoritas (kelas dengan jumlah sampel yang lebih banyak)
dan kelas minoritas (kelas dengan jumlah sampel yang lebih sedikit). Lalu, langkah
berikutnya adalah mengimport pustaka atau library yang diperlukan, seperti scikit-
learn dalam bahasa pemrograman Python, dan memuat dataset Anda ke dalam format
yang sesuai.

27
Kemudian load dataset yang sudah dibuat dalam format numerik dan terapkan
SMOTE pada data kelas minoritas untuk membuat sampel sintesis baru. Setelah
menentukan jumlah sampel sintesis yang diinginkan, kemudian tentukan rasio
yangdiinginkan antara kelas mayoritas dan minoritas. Setelah dilakukan analisis
SMOTE, apabila dataset masih dinilai masih kurang sesuai, maka lakukan ulang
analisis SMOTE. Dataset yang sudah seimbang rasionya kemudian dihilangkan
noisenya dengan ENN (Edited Nearest Neighbors), dengan mengurangi jumlah
sampel dari kelas mayoritas untuk membuat distribusi kelas lebih seimbang. ENN
bekerja dengan menghapus beberapa sampel dari kelas mayoritas yang dianggap
"berisiko" atau "mengganggu" dalam pengambilan keputusan oleh model klasifikasi.

3. Decision Tree

Dalam pembuatan model Decision Tree untuk klasifikasi dataset, dataset yang
sudah dibuat dalam bentuk numerik dan dibuat seimbang kemudian dibuat pemodelan
decision tree nya. Pertama, dataset akan dibagi menjadi dua bagian: data pelatihan
untuk melatih model dan data pengujian untuk menguji kinerja model. Pemilihan fitur
dapat dilakukan jika ada fitur-fitur yang tidak relevan atau berisikan noise dalam
dataset. Pembuatan model Decision Tree adalah tahap kunci dalam proses ini. Dalam
pembuatan model ini, kita menggunakan algoritma Decision Tree dengan memilih
metrik yang sesuai untuk pemilihan atribut yang optimal pada setiap node dalam
pohon. Ini bisa berupa Information Gain, Gini Impurity, atau metrik lainnya. Selain
itu, parameter seperti kedalaman pohon juga perlu diperhatikan. Setelah model
Decision Tree dibuat, langkah selanjutnya adalah melatih model menggunakan data
pelatihan. Model akan mempelajari pola dan hubungan antara fitur-fitur dalam dataset
untuk memprediksi kelas target. Setelah pelatihan selesai, model tersebut

3.3 Perhitungan Manual


1. Decision Tree algoritma C4.5
Decision Tree merupakan pohon yang terstruktur dari kumpulan atribut
untuk dapat diuji dengan mempunyai tujuan memprediksi output-nya. Dimana
setiap simpul internal menunjukan tes pada atribut, hasil dari tesnya diwakili oleh
masing - masing cabang, dan label kelas dipegang oleh setiap node-nya. Di dalam
pohon keputusan node paling atas merupakan simpul akar. Menentukan akar pohon

28
menggunakan gaintertinggi dari masing - masing atribut atau dengan menurut nilai
indexentrophy terendah. Dengan terlebih dahulu mencari nilai entrophy dengan
menggunakan rumus pada persamaan berikut:

n
Gain ( S , A )=Entropy ( S )−∑ ¿ Si∨ ¿ ¿¿
i=1 ¿ S∨¿ × Entropy ( Si ) (1)

Keterangan:
S = Himpunan kasus
A = Atribut
n = Jumlah partisi atribut A
|Si| = Jumlah kasus pada partisi ke-i
|S| = Jumlah kasus dalam S

Berikut merupakan rumus dalam menghitung nilai entropi:


n
Entropy ( S )=∑ pi× log 2 pi
i=1

Keterangan:
S = Himpunan kasus
A = Atribut
n = Jumlah partisi S
pi = Proporsi dari Si terhadap S

2. SMOTE

Analisis SMOTE dilakukan untuk menyeimbangkan dataset dengan cara


menghasilkan sampel sintetis dari kelas minoritas dalam masalah ketidakseimbangan
dataset. Pada dasarnya, SMOTE bekerja dengan cara mengambil sampel dari kelas
minoritas yang ada dan menciptakan sampel-sampel sintetis baru dengan
menggabungkannya dengan tetangga-tetangga terdekat dalam ruang fitur. Berikut
merupakan rumus yang digunakan untuk mensintesis data:

x new =x i +( x^i−x i )× δ

Keterangan:
x new = Sintesis sampel data

29
xi = Contoh dari kelas minoritas yang digunakan sebagai dasar untuk sampel
sintetis
^
xi = Satu tetangga terdekat dari x i dalam ruang fitur
pi = Bilangan riil antara 0 dan 1 yang digunakan untuk mengontrol sejauh mana
perbedaan antara x i dan ^
x i akan diterapkan pada x i untuk
membuat sampel sintetis

3. Evaluasi model klasifikasi

Dilakukan evaluasi pada tahap akhir dengan menguji akurasi, presisi, dan
recall dari data yang telah diekstrak dan diolah oleh decision tree berbasis SMOTE.
Berikut merupakan ketiga rumus yang dapat digunakan:

1) Akurasi
Akurasi mengukur sejauh mana model mampu mengklasifikasikan data
dengan benar, baik untuk kelas positif maupun negatif. Berikut merupakan
rumus yang digunakan:
Jumlah Prediksi Benar
Akurasi=
Total Data
2) Presisi
Presisi mengukur sejauh mana prediksi positif yang dilakukan oleh model
benar. Berikut merupakan rumus yang digunakan:
True Positive
Presisi=
True Positive+ False Positive
3) Recall
Recall mengukur sejauh mana model mampu mendeteksi semua instance
positif yang sebenarnya. Berikut merupakan rumus yang digunakan:

30
True Positive
Presisi= DAFTAR PUSTAKA
True Positive+ False Negatives
[1] A. C. Michael Wahyudi dan Angela Tampubolon and P. Selatan bangunan Fasilitas
Edukasi Bukit Jaddih di Bangkalan, “Fasilitas Edukasi Bukit Jaddih di Bangkalan,
Madura,” 2023.
[2] “MANAJEMEN STRATEGI DALAM PENGEMBANGAN OBYEK WISATA
BUKIT KAPUR JEDDIH MADURA (Studi pada Dinas Pariwisata dan Kebudayaan
Kabupaten Bangkalan).” [Online]. Available: https://ksmtour.com
[3] T. Minat Berkunjung Kembali Melalui Kepuasan Wisatawan Pada Objek Bukit
Jaddih, “Pengaruh Citra Destinasi, Fasilitas Wisata Dan Pemanfaatan Elektronik.”
[4] W. Khofifah, D. N. Rahayu, and A. M. Yusuf, “Analisis Sentimen Menggunakan
Naive Bayes Untuk Melihat Review Masyarakat Terhadap Tempat Wisata Pantai Di
Kabupaten Karawang Pada Ulasan Google Maps,” Jurnal Interkom: Jurnal Publikasi
Ilmiah Bidang Teknologi Informasi dan Komunikasi, vol. 16, no. 4, pp. 28–38, Jan.
2022, doi: 10.35969/interkom.v16i4.192.
[5] A. A. Arifiyanti, M. F. Pandji, and B. Utomo, “Analisis Sentimen Ulasan Pengunjung
Objek Wisata Gunung Bromo pada Situs Tripadvisor,” Explore: Jurnal Sistem
Informasi dan Telematika, vol. 13, no. 1, p. 32, Jun. 2022, doi:
10.36448/jsit.v13i1.2539.
[6] Y. A. Singgalen, “Analisis Sentimen Wisatawan Melalui Data Ulasan Candi
Borobudur di Tripadvisor Menggunakan Algoritma Naïve Bayes Classifier,” Building
of Informatics, Technology and Science (BITS), vol. 4, no. 3, Dec. 2022, doi:
10.47065/bits.v4i3.2486.
[7] R. Naquitasia, D. Hatta Fudholi, and L. Iswari, “ANALISIS SENTIMEN BERBASIS
ASPEK PADA WISATA HALAL DENGAN METODE DEEP LEARNING,” 2022.
[Online]. Available: https://ejurnal.teknokrat.ac.id/index.php/teknoinfo/index
[8] R. Puspita and A. Widodo, “Perbandingan Metode KNN, Decision Tree, dan Naïve
Bayes Terhadap Analisis Sentimen Pengguna Layanan BPJS,” Jurnal Informatika
Universitas Pamulang, vol. 5, no. 4, p. 646, Dec. 2021, doi:
10.32493/informatika.v5i4.7622.
[9] Aditya Quantano Surbakti, Regiolina Hayami, and Januar Al Amien, “Analisa
Tanggapan Terhadap Psbb Di Indonesia Dengan Algoritma Decision Tree Pada
Twitter,” Jurnal CoSciTech (Computer Science and Information Technology), vol. 2,
no. 2, pp. 91–97, Dec. 2021, doi: 10.37859/coscitech.v2i2.2851.

31
[10] Y. A. Singgalen, “Analisis Sentimen Pengunjung Pulau Komodo dan Pulau Rinca di
Website Tripadvisor Berbasis CRISP-DM,” Journal of Information System Research
(JOSH), vol. 4, no. 2, pp. 614–625, Jan. 2023, doi: 10.47065/josh.v4i2.2999.

[1] A. M. Wahyudi, “Fasilitas Edukasi Bukit Jaddih di Bangkalan, Madura,” eDimensi


Arsitektur Petra, vol. 11, no. 1, pp. 257–264, 2023.
[2] R. A. A. Febryandani, “Manajemen Strategi Dalam Pengembangan Obyek Wisata Bukit
Kapur Jeddih Madura (Studi pada Dinas Pariwisata dan Kebudayaan Kabupaten
Bangkalan),” Publika, vol. 8, no. 2, 2020.
[3] L. Armindya, “TA: Pengaruh Citra Destinasi, Fasilitas Wisata, dan Pemanfaatan
Elektronik terhadap Minat Berkunjung Kembali melalui Kepuasan Wisatawan pada
Objek Bukit Jaddih,” Universitas Dinamika, 2022.
[4] W. Khofifah, D. N. Rahayu, and A. M. Yusuf, “Analisis Sentimen Menggunakan Naive
Bayes Untuk Melihat Review Masyarakat Terhadap Tempat Wisata Pantai Di Kabupaten
Karawang Pada Ulasan Google Maps,” Jurnal Interkom: Jurnal Publikasi Ilmiah Bidang
Teknologi Informasi dan Komunikasi, vol. 16, no. 4, pp. 171–180, 2022.
[5] A. A. Arifiyanti, M. F. Pandji, and B. Utomo, “Analisis Sentimen Ulasan Pengunjung
Objek Wisata Gunung Bromo pada Situs Tripadvisor,” Explore: Jurnal Sistem Informasi
dan Telematika (Telekomunikasi, Multimedia dan Informatika), vol. 13, no. 1, pp. 32–37,
2022.
[6] Y. A. Singgalen, “Analisis Sentimen Wisatawan Melalui Data Ulasan Candi Borobudur di
Tripadvisor Menggunakan Algoritma Naïve Bayes Classifier,” Building of Informatics,
Technology and Science (BITS), vol. 4, no. 3, p. 1343− 1352-1343− 1352, 2022.
[7] R. Naquitasia, D. H. Fudholi, and L. Iswari, “Analisis Sentimen Berbasis Aspek pada
Wisata Halal dengan Metode Deep Learning,” Jurnal Teknoinfo, vol. 16, no. 2, pp. 156–
164, 2022.
[8] R. Puspita and A. Widodo, “Perbandingan Metode KNN, Decision Tree, dan Naïve Bayes
Terhadap Analisis Sentimen Pengguna Layanan BPJS,” J. Inform. Univ. Pamulang, vol.
5, no. 4, p. 646, 2021.
[9] A. Q. Surbakti, R. Hayami, and J. Al Amien, “Analisa Tanggapan Terhadap Psbb Di
Indonesia Dengan Algoritma Decision Tree Pada Twitter,” Jurnal CoSciTech (Computer
Science and Information Technology), vol. 2, no. 2, pp. 91–97, 2021.
[10] Y. A. Singgalen, “Analisis Sentimen Pengunjung Pulau Komodo dan Pulau Rinca di
Website Tripadvisor Berbasis CRISP-DM,” Journal of Information System Research
(JOSH), vol. 4, no. 2, pp. 614–625, 2023.
[11] A. Nazir, Y. Rao, L. Wu, and L. Sun, “Issues and Challenges of Aspect-based
Sentiment Analysis: A Comprehensive Survey,” IEEE Transactions on Affective
Computing, vol. 13, no. 2, pp. 845–863, Apr. 2022, doi: 10.1109/TAFFC.2020.2970399.
[12] G. Roy, “Travelers’ online review on hotel performance – Analyzing facts with the
Theory of Lodging and sentiment analysis,” International Journal of Hospitality
Management, vol. 111, p. 103459, May 2023, doi: 10.1016/j.ijhm.2023.103459.
[13] I. Paul and G. Roy, “Tourist’s engagement in eco-tourism: A review and research
agenda,” Journal of Hospitality and Tourism Management, vol. 54, pp. 316–328, 2023.
[14] N. C. Dang, M. N. Moreno-García, and F. De la Prieta, “Sentiment Analysis Based on
Deep Learning: A Comparative Study,” Electronics, vol. 9, no. 3, 2020, doi:
10.3390/electronics9030483.
[15] M. Nayak and K. A. Narayan, “Strengths and weaknesses of online surveys,”
technology, vol. 6, no. 7, pp. 0837–2405053138, 2019.

32
[16] M. Wankhade, A. C. S. Rao, and C. Kulkarni, “A survey on sentiment analysis
methods, applications, and challenges,” Artificial Intelligence Review, vol. 55, no. 7, pp.
5731–5780, 2022.
[17] M. Birjali, M. Kasri, and A. Beni-Hssane, “A comprehensive survey on sentiment
analysis: Approaches, challenges and trends,” Knowledge-Based Systems, vol. 226, p.
107134, 2021.
[18] V. Taecharungroj and B. Mathayomchan, “Analysing TripAdvisor reviews of tourist
attractions in Phuket, Thailand,” Tourism Management, vol. 75, pp. 550–568, 2019.
[19] H. Hermawan, A. Wijayanti, and D. S. Nugroho, “Loyalty on Ecotourism analysed
using the factors of tourist attraction, safety, and amenities, with satisfaction as an
intervening variable,” African Journal of Hospitality, Tourism and Leisure, vol. 8, no. 5,
pp. 1–19, 2019.
[20] J.-J. Yang, H.-W. Lo, C.-S. Chao, C.-C. Shen, and C.-C. Yang, “Establishing a
sustainable sports tourism evaluation framework with a hybrid multi-criteria decision-
making model to explore potential sports tourism attractions in Taiwan,” Sustainability,
vol. 12, no. 4, p. 1673, 2020.
[21] P. Rita, R. Ramos, M. T. Borges-Tiago, and D. Rodrigues, “Impact of the rating
system on sentiment and tone of voice: A Booking. com and TripAdvisor comparison
study,” International Journal of Hospitality Management, vol. 104, p. 103245, 2022.
[22] R. Catelli et al., “Cross lingual transfer learning for sentiment analysis of Italian
TripAdvisor reviews,” Expert Systems with Applications, p. 118246, 2022.
[23] K. H. Abaalzamat, K. I. Al-Sulaiti, N. M. Alzboun, and H. A. Khawaldah, “The role
of Katara cultural village in enhancing and marketing the image of Qatar: Evidence from
TripAdvisor,” Sage Open, vol. 11, no. 2, p. 21582440211022737, 2021.
[24] A. P. Pandian, “Performance evaluation and comparison using deep learning
techniques in sentiment analysis,” Journal of Soft Computing Paradigm, vol. 3, no. 2, pp.
123–134, 2021.
[25] H. Liu, I. Chatterjee, M. Zhou, X. S. Lu, and A. Abusorrah, “Aspect-based sentiment
analysis: A survey of deep learning methods,” IEEE Transactions on Computational
Social Systems, vol. 7, no. 6, pp. 1358–1375, 2020.
[26] P. K. Jain, R. Pamula, and G. Srivastava, “A systematic literature review on machine
learning applications for consumer sentiment analysis using online reviews,” Computer
science review, vol. 41, p. 100413, 2021.
[27] G. P. Wiratama and A. Rusli, “Sentiment analysis of application user feedback in
Bahasa Indonesia using multinomial naive bayes,” in 2019 5th International Conference
on New Media Studies (CONMEDIA), IEEE, 2019, pp. 223–227.
[28] M. T. H. K. Tusar and M. T. Islam, “A comparative study of sentiment analysis using
NLP and different machine learning techniques on US airline Twitter data,” in 2021
International Conference on Electronics, Communications and Information Technology
(ICECIT), IEEE, 2021, pp. 1–4.
[29] T. Abdullah and A. Ahmet, “Deep learning in sentiment analysis: Recent
architectures,” ACM Computing Surveys, vol. 55, no. 8, pp. 1–37, 2022.
[30] R. Olusegun, T. Oladunni, H. Audu, Y. Houkpati, and S. Bengesi, “Text Mining and
Emotion Classification on Monkeypox Twitter Dataset: A Deep Learning-Natural
Language Processing (NLP) Approach,” IEEE Access, 2023.
[31] M. Guia, R. R. Silva, and J. Bernardino, “Comparison of Naïve Bayes, Support Vector
Machine, Decision Trees and Random Forest on Sentiment Analysis.,” KDIR, vol. 1, pp.
525–531, 2019.

33
[32] J. Guerreiro and P. Rita, “How to predict explicit recommendations in online reviews
using text mining and sentiment analysis,” Journal of Hospitality and Tourism
Management, vol. 43, pp. 269–272, 2020.
[33] M. Aufar, R. Andreswari, and D. Pramesti, “Sentiment analysis on youtube social
media using decision tree and random forest algorithm: A case study,” in 2020
International Conference on Data Science and Its Applications (ICoDSA), IEEE, 2020,
pp. 1–7.
[34] N. Z. Dina, “Tourist sentiment analysis on TripAdvisor using text mining: A case
study using hotels in Ubud, Bali,” African Journal of Hospitality, Tourism and Leisure,
vol. 9, no. 2, pp. 1–10, 2020.
[35] W. Jiang, K. Zhou, C. Xiong, G. Du, C. Ou, and J. Zhang, “KSCB: A novel
unsupervised method for text sentiment analysis,” Applied Intelligence, vol. 53, no. 1, pp.
301–311, 2023.
[36] S. Kedas, A. Kumar, and P. K. Jain, “Dealing with Class Imbalance in Sentiment
Analysis Using Deep Learning and SMOTE,” in Advances in Data Computing,
Communication and Security: Proceedings of I3CS2021, Springer, 2022, pp. 407–416.
[37] R. Obiedat et al., “Sentiment analysis of customers’ reviews using a hybrid
evolutionary svm-based approach in an imbalanced data distribution,” IEEE Access, vol.
10, pp. 22260–22273, 2022.
[38] M. Umer et al., “Scientific papers citation analysis using textual features and SMOTE
resampling techniques,” Pattern Recognition Letters, vol. 150, pp. 250–257, 2021.
[39] C. Azad, B. Bhushan, R. Sharma, A. Shankar, K. K. Singh, and A. Khamparia,
“Prediction model using SMOTE, genetic algorithm and decision tree (PMSGD) for
classification of diabetes mellitus,” Multimedia Systems, pp. 1–19, 2021.
[40] C. Cahyaningtyas, Y. Nataliani, and I. R. Widiasari, “Analisis Sentimen Pada Rating
Aplikasi Shopee Menggunakan Metode Decision Tree Berbasis SMOTE,” AITI, vol. 18,
no. 2, Art. no. 2, Nov. 2021, doi: 10.24246/aiti.v18i2.173-184.
[41] Y. A. Singgalen, “Analisis Sentimen Top 10 Traveler Ranked Hotel di Kota Makassar
Menggunakan Algoritma Decision Tree dan Support Vector Machine,” KLIK: Kajian
Ilmiah Informatika dan Komputer, vol. 4, no. 1, pp. 323–332, 2023.

34

Anda mungkin juga menyukai