Diskusi 6 Bahasa Indonesia

 Diskusi 6
Bacalah artikel jurnal melalui laman https://scholar.google.co.id/. Kemudian ketiklahkata kun
ci yang akan dicari lalu unduhlah artikel tersebut.
1. Silakan lihat pada bagian abstrak lalu analislah (lihat modul 7 halaman 7.4) dengan membuat
catatan Jika tidak ada salah satu dari 6 subtansi di atas, silakan diberikan masukan
Abstrak
YouTube merupakan media sosial yang paling banyak digunakan di Indonesia, mencapai 88
% dari seluruh pengguna internet di Indonesia. Komentar dalam bahasa Indonesia yang
dihasilkan dari pengguna YouTube bertambah masif setiap hari, hal ini dapat digunakan untuk
mengelaborasi polarisasi opini masyarakat terhadap kebijakan pemerintah. Tantangan utama
dalam analisis opini adalah memproses noise terutama mengolah stop words dan bahasa
slang. Penelitian ini bertujuan menerapkan berbagai model preprocessing pada analisis
sentimen dari teks komentar YouTube, kemudian melihat pengaruhnya pada akurasi model
classifier. Jenis-jenis preprocessing yang digunakan antara lain standar pemrosesan teks
bahasa Indonesia, penghapusan stop words dan kata yang menyatakan subyek atau obyek, dan
mengganti bahasa slang sesuai kosakata KBBI. Skenario pengujian dirancang untuk melihat
pengaruh setiap jenis preprocessing pada akurasi model. Fitur yang digunakan adalah unigram
dan kombinasi unigram-bigram. Ekstraksi fitur yang digunakan yaitu Count-Vectorizer dan
TF-IDF-Vectorizer. Validasi menunjukkan penggunaan fitur unigram lebih baik akurasinya
daripada kombinasi fitur unigram dan bigram. Sedangkan konversi kosakata slang mampu
menaikkan akurasi. Penghapusan stop words juga menyumbang kenaikan akurasi.
Kesimpulannya, kombinasi preprocessing yang terdiri preprocessing standar, penghapusan
stop words, konversi kosakata slang menjadi kosakata standar KKBI menaikkan akurasi
sekitar 3,5 % pada fitur term tunggal (unigram).
Kata kunci: komentar YouTube, sentiment analysis, text preprocessing, bahasa slang, N-Gram
1) apa tujuan penelitian,
Tujuan penelitian adalah menerapkan berbagai model preprocessing pada analisis
sentimen dari teks komentar YouTube, lalu melihat bagaimana pengaruhnya pada akurasi
model classifier
2) apakah ada latar belakang di sana
YouTube merupakan media sosial yang paling banyak digunakan di Indonesia, mencapai
88 % dari seluruh pengguna internet di Indonesia. Komentar dalam bahasa Indonesia
yang dihasilkan dari pengguna YouTube bertambah masif setiap hari, hal ini dapat
digunakan untuk mengelaborasi polarisasi opini masyarakat terhadap kebijakan
pemerintah. Tantangan utama dalam analisis opini adalah memproses noise terutama
mengolah stop words dan bahasa slang
3) bagaimana metode penelitian
Jenis-jenis preprocessing yang digunakan antara lain standar pemrosesan teks bahasa
Indonesia, penghapusan stop words dan kata yang menyatakan subyek atau obyek, dan
mengganti bahasa slang sesuai kosakata KBBI. Skenario pengujian dirancang untuk
melihat pengaruh setiap jenis preprocessing pada akurasi model. Fitur yang digunakan
adalah unigram dan kombinasi unigram-bigram. Ekstraksi fitur yang digunakan yaitu
Count-Vectorizer dan TF-IDF-Vectorizer
4) bagaimana hasil penelitian
Validasi menunjukkan penggunaan fitur unigram lebih baik akurasinya daripada
kombinasi fitur unigram dan bigram. Sedangkan konversi kosakata slang mampu
menaikkan akurasi. Penghapusan stop words juga menyumbang kenaikan akurasi.
5) bagaimana simpulan
Kesimpulannya, kombinasi preprocessing yang terdiri preprocessing standar,
penghapusan stop words, konversi kosakata slang menjadi kosakata standar KKBI
menaikkan akurasi sekitar 3,5 % pada fitur term tunggal (unigram).
6) bagaimana kata kunci.
komentar YouTube, sentiment analysis, text preprocessing, bahasa slang, N-Gram
1. Silakan ubah abstrak yang sudah dianalisis ke dalam abstrak berbahasa Inggis.
ABSTRACT
YouTube is the most widely used social media in Indonesia, accounting for 88% of all
internet users in Indonesia. Comments in Indonesian generated from YouTube users grow
massively every day, which can be used to elaborate on the polarisation of public opinion
towards government policies. The main challenge in opinion analysis is processing noise,
especially processing stop words and slang. This research aims to apply various
preprocessing models to the sentiment analysis of YouTube comment texts, then see the
effect on the accuracy of the classifier model. The types of preprocessing used include
standard Indonesian text processing, removal of stop words and words that express subjects
or objects, and replacing slang language according to KBBI vocabulary. Test scenarios were
designed to see the effect of each type of preprocessing on model accuracy. The features
used are unigram and unigram-bigram combination. The feature extraction used is Count-
Vectorizer and TF-IDF-Vectorizer. Validation shows that the use of unigram features is
better in accuracy than the combination of unigram and bigram features. While the
conversion of slang vocabulary is able to increase accuracy. Removal of stop words also
contributes to the increase in accuracy. In conclusion, a combination of preprocessing
consisting of standard preprocessing, removal of stop words, conversion of slang vocabulary
into standard KKBI vocabulary increases accuracy by about 3.5% on single term features
(unigram).
Keywords: YouTube comments, sentiment analysis, text preprocessing, slang, N-Gram

Diskusi 6 Bahasa Indonesia

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Diskusi 6 Bahasa Indonesia

Diunggah oleh

Hak Cipta:

Format Tersedia

 Diskusi 6

Anda mungkin juga menyukai