Journal of Information Science, 2019, pp. 1–17. Mehdi Emadi and Maseud Rahgozar, ISSN:
01655515, 17416485, DOI: 10.1177/0165551519828627, Publisher: SAGE Publications Ltd
United States, Quartiles: Q1 terindeks Scopus.
Penelitian ini menggunakan metode studi literature terkait penelitian sebelumnya yang
relevan dengan topik penelitian diantaranya: metode berbasis grafik untuk mendeteksi
subyektifitas tweet, klasifikasi SVM yang berfungsi membuat grafik untuk polaritas, serta
metode fusi untuk meningkatkan akurasi analisis sentimen. Metode fusi menggabungkan
pendekatan pembelajaran mesin dan orientasi sentimen untuk meningkatkan kinerjanya.
Metode analisis sentimen berbasis data mining konvensional menggunakan proses bertahap
untuk mempelajari dan mengekstrak polaritas pesan pada microblog. Umumnya, kumpulan
data sentimen Twitter berlabel digunakan dalam langkah supervised learning. Dalam
penelitian ini menyarankan pendekatan hibrida yang menggunakan pendekatan supervised dan
unsupervised.
Berikut metode klasifikasi teks popular pada poin (a) dan metode klasifikasi teks yang
diusulkan pada poin (b) dapat dilihat pada gambar di bawah ini:
Gambar 1. Metode Klasifikasi Teks Popular Dan Metode Klasifikasi Teks Yang
Diusulkan
Berikut ini metode yang diusulkan untuk analisis sentimen, diantaranya:
Dataset
Definisi 1
Sebagai contoh (diskrit) ukuran fuzzy, μ, adalah fungsi himpunan dari himpunan X ke
bilangan real dalam domain [0, 1] (μ: P (X)! [0, 1]). P (X) adalah kumpulan daya X, dan X
adalah kumpulan fitur [11]. μ sebagian besar memenuhi dua kendala:
1. μ (0) = 0, μ (X) = 1
2. A5B) μ (A) ≤ μ (B)
Peneliti memberikan ukuran fuzzy yang dihitung ke operator integral Choquet integral.
Choquet Integral membuat keputusan menggunakan ukuran ini.
Fusion + Fusion
Dataset MaxEnt NB SVM SCNLP - NLP
NLP
SemEval- 0.6558
0.6472 0.6258 0.5031 0.5225 0.6664
2016
Movie 0.7680 0.7398 0.7672 0.5966 0.8379 0.8162
Gambar grafik hasil penelitian berupa nilai akurasi dari semua metode untuk setiap dataset,
dapat dilihat pada gambar berikut:
Gambar 3. Hasil Penelitian Berupa Nilai Akurasi dari Semua Metode untuk Setiap
Dataset