Anda di halaman 1dari 27

Perbandingan Metode Naïve Bayes Classifier Dan Holistic

Lexicon Based Dalam Analisis Sentimen Angket Mahasiswa

Karya : Suprianto, dkk.


Instansi : STMIK PPKIA Tarakanita
Rahmawati
Tahun Penerbitan : 2019

Review By : Erik Rizki Firdaus


Perbandingan Akurasi Metode Lexicon Based Dan Naive Bayes
Classifier Pada Analisis Sentimen Pendapat Masyarakat Terhadap
Aplikasi Investasi Pada Media Twitter

Karya : Fitrah Amaliah, dkk.


Instansi : Universitas Negeri Surabaya
Tahun Penerbitan : 2022

Review By : Erik Rizki Firdaus


Analisis Sentimen Opini Film Menggunakan Metode Naïve
Bayes dan Lexicon Based Features

Karya : Arifin Kurniawan, dkk.


Instansi : Universitas Brawijaya
Tahun Penerbitan : 2019

Review By : Erik Rizki Firdaus


Analisis Sentimen Terhadap Rating dan Ulasan Film dengan
menggunakan Metode Klasifikasi Naïve Bayes dengan Fitur
Lexicon-Based

Karya : Nadhif Sanggara Fathullah, dkk.


Instansi : Universitas Brawijaya
Tahun Penerbitan : 2020

Review By : Erik Rizki Firdaus


Analisis Sentimen Pengaruh Kombinasi Ekstraksi Fitur
TF-IDF dan Lexicon Pada
Ulasan Film Menggunakan Metode KNN

Karya : Setyo Adji Pratomo dkk.


Instansi : Universitas Telkom, Bandung
Tahun Penerbitan : 2021

Review By : Erik Rizki Firdaus


Analisis Sentimen Review Film Menggunakan TF-IDF
dan Support Vector Machine

Karya : Okta Ihza Gafari, dkk.


Instansi : Universitas Amikom Yogyakarta
Tahun Penerbitan : 2022

Review By : Erik Rizki Firdaus


PEMBAHASAN

Point I Point III


1 Latar Belakang 3 Solusi

Point II BAB IV
2 Metode Machine Learning 4 Metode Penelitian

BAB V BAB VI
5 Hasil Pengujian 6 Kesimpulan & Saran
1
Point I
LATAR BELAKANG
Banyaknya film yang ada dan beredar namun sulit untuk menemukan film yang
memiliki konten edukasi didalamnya, oleh karena itu maka review atau ulasan dalam
film merupakan salah satu pihak penentu untuk menentukan konten edukasi yang
terdapat dalam film.
2
Point II
Metode Machine Learning
 KNN (K-Neirest Neighbor)

 SVM (Support Vector machine)

 (NB) Naïve Bayes

 Random Forest

 Maximum Entrophy

 Lexicon Based
3
Point III
Metode Penelitian
Proses Klasifikasi

 Sentimen Positif

 Sentimen Netral

 Sentimen Negatif
TF-IDF
 Term Frequency – Inverse Document Frequency

 Dengan cara menghitung bobot setiap kata yang umum digunakan, metode ini akan
menghitung kemunculan sebuah kata dalam dokumen.

 Merupakan metode yang populer (mudah dalam segi penggunaan, dan memiliki korelasi atau
pengaruh yang besar terhadap metode klasifikasi yang digunakan.
Penggunaan TF-IDF :

 Semakin banyak jumlah dataset maka akan semakin baik dalam proses klasifikasi

 Jumlah dataset sentiment positif, negative dan netral harus setara

 Menemukan kata kunci dari masing-masing sentimen menggunakan metode TF-IDF


Lexicon Based Learning

 Lexicon menggunakan SentiWordNet

 Digunakan untuk menentukan sentiment kata opini (pelabelan kata). Metode ini digunakan
oleh penulis dikarenakan memiliki tingkat akurasi yang cukup bagus pada penelitian
sebelumnya “Cara kerja Algoritma K-Neirest Neighbor” A. M. Ismail - 2018

 Nilai sentiment akan diberi bobot 1 apabila mengandung opini positif, -1 jika mengandung
sentiment negatif yang berdasarkan pada kamus SentiWordNet. Jika tidak terdapat pada
kamus tersebut maka diberi bobot 0.
Lexicon Based Learning

Input Data Latih Normalisasi Nilai


dari
Senti-WordNet positif

Output : Hasil
Nilai pembobotan
lexicon based

Menentukan nilai
max (positif) dan Normalisasi Nilai
nilai min (negative) negatif
Gambaran

 Pada penelitian ini penulis mencoba menggabungkan ekstraksi fitur TF-IDF dengan lexicon
SentiWordNet dengan cara mengalikan bobot fitur pada setiap data.
Alur Diagram Model
4
Point IV
Metode Penelitian
KNN
(K-Neirest Neighbor)

 KNN merupakan sebuah algoritma supervised learning dimana hasil instance yang baru
diklasifikasikan berdasarkan mayoritas dari k-tetangga terdekat.

 Akan sangat akurat ketika memiliki banyak data set (K = banyaknya dataset atau tetangga
terdekat maka akan semakin baik proses klasifikasi yang dilakukan.
5
Point V
Hasil Pengujian
Skenario 1 :

 Untuk mengetahui pengaruh penggunaan fitur ekstraksi lexicon SentiWordNet untuk data
ulasan film berbahasa inggris.

 Menggunakan 3 proses pengujian yaitu :


 1. Kombinasi antara TF-IDF dengan Lexicon berdasar SentiWordNet
 2. Hanya menggunakan TF-IDF
 3. Hanya menggunakan Lexicon
Skenario 2 :

 Penggunaan Information Gain (IG) karena dapat mengoptimalkan akurasi terhadap proses
klasifikasi untuk ulasan berbahasa inggris.

 Namun dengan nilai presisi yang rendah, yang diakibatkan oleh banyaknya label :
 False Positif
 False Negatif

 Optimal karena dapat menghilangkan fitur yang tidak diperlukan.


Skenario 3 :

 Penggunaan Information Gain (IG) karena dapat mengoptimalkan akurasi terhadap proses
klasifikasi untuk ulasan berbahasa inggris.

 Namun dengan nilai presisi yang rendah, yang diakibatkan oleh banyaknya label :
 False Positif
 False Negatif

 Nilai akurasi dan presisi menurun dikarenakan terdapat beberapa fitur yang mengurangi hasil
klasifikasi dan beberapa kata berpengaruh namun harus tereliminasi.
KESIMPULAN
Penulis :

 Skenario 1: Penggunaan lexicon terhadap fitur ekstraksi tidak memberikan hasil yang baik,
dikarenakan scenario sistem yang dibangun paper rujukan melakukan split data (tidak runtut)
pada saat sebelum melakukan klasifikasi.
 Skenario 2: Semakin tinggi nilai threshold maka akan sangat berpengaruh pada tahap
klasifikasi
 Skenario 3: mencoba menggabungkan metode fitur ekstraksi TF-IDF dengan menggunakan
metode lexicon tanpa senti WordNet.
THANKS!
CREDITS: This presentation template was created by Slidesgo, including
icons by Flaticon, infographics & images by Freepik

Anda mungkin juga menyukai