Oleh :
Fitri Febriyani S
1103144063
i
LEMBAR PERSETUJUAN
IN INDONESIA
Fitri Febriyani S
NIM : 1103144063
Disusun dalam rangka memenuhi persyaratan dalam mengajukan Tugas Akhir
pada Program Studi Sarjana Sistem Komputer
Fakultas Teknik Elektro
Universitas Telkom
i
ABSTRAK
Pada saat ini, yang paling populer adalah media sosial seperti Twitter,
Instagram, Facebook, Path dan lain-lain. Media sosial dapat dimanfaatkan sebagai
sumber informasi untuk sebuah perusahaan atau organisasi untuk melihat pendapat
kosumen atau masyarakat terhadap kualitas layanan terhadap suatu produk.
ii
ABSTRACT
Currently, the most popular are social media like Twitter, Instagram,
Facebook, Path and others. Social media can be used as a source of information
for companies or organizations to view the opinions of consumers or the public on
the quality of service to a product.
iii
KATA PENGANTAR
Puji syukur atas kehadirat Alloh SWT karena berkat rahmat dan karunia-
Nya penulis dapat meyelesaikan proposal ini. Penulis juga mengucapan terimakasih
kepada pihak yang telah memberikan dukungan serta membantu dalam pembuatan
proposal ini.
Penulis
iv
DAFTAR ISI
LEMBAR PERSETUJUAN..................................................................................... i
ABSTRAK .............................................................................................................. ii
1.3 Tujuan.......................................................................................................... 2
3.2.1 Tokenization...................................................................................... 5
v
2.7 Naive Bayes Classifier ................................................................................ 7
vi
DAFTAR GAMBAR
vii
DAFTAR TABEL
viii
BAB I
PENDAHULUAN
Pada saat ini merupakan masa modern dengan adanya teknologi yang
berkembang dengan pesat. Salah satu yang paling populer pada saat ini di
Indonesia adalah pengguna internet yang semakin meningkat pada beberapa
tahun terakhir. Melalui hasil survei APJII (Asosiasi Penyelenggara Jasa Internet
Indonesia) statistik pengguna internet tahun 2015 jumlah pengguna internet di
Indonesia sebesar 139 juta [1]. Perilaku pengguna media sosial pada tahun 2015
sebesar 87,4% dari total responden [1]. Sedangkan pada tahun 2016 pengguna
internet di Indonesia mencapai 132,7 juta dan pengguna aktif media sosial
mencapai 129,2 juta sekitar 97,4% dari jumlah penduduk di Indonesia [2].
Media sosial menghasilkan data yang bervolume besar atau kaya akan
sentimen dalam bentuk tweets, update status, posting blog, komentar dan lain-
lain [3]. Masyarakat banyak menggunakan media sosial untuk mengekspresikan
opini, pengalaman maupun hal lain yang menjadi perhatian mereka [1]. Hal ini
dapat dimanfaatkan sebagai sumber informasi untuk sebuah perusahaan atau
organisasi untuk melihat opini konsumen atau masyarakat terhadap kualitas
layanan, prediksi penjualan, sosial, politik, strategi perusahaan dan pemantauan
terhadap sebuah produk [4].
1
Adapun proses yang akan dilakukan pada penelitian ini adalah
preprocessing dimana data yang sudah disiapkan menjadi data yang siap untuk
dianalisis [1]. Terdapat beberapa metode Machine Learning yang dapat
dilakukan untuk menganalisis sentimen. Namun pada penelitian ini akan
dilakukan dengan metode Naive Bayes Classifier (NBS). Metode Naive Bayes
Classifier merupakan teknik pembelajaran mesin yang berbasis probablistik [5].
1.3 Tujuan
Adapun tujuan yang ingin dicapai pada penelitian ini adalah dapat
memberikan informasi kepada masyarakat tentang kepuasan masyarakat
diseluruh Indonesia dalam menggunakan operator seluler sehingga masyarakat
dapat memilih operator seluler yang baik digunakan sesuai kebutuhannya
masing-masing.
2
1.4 Batasan Masalah
1.5 Hipotesa
3
BAB II
TINJAUAN PUSTAKA
4
2.3 Pengumpulan dan Pelabelan Sentimen
Data yang akan diambil berupa kalimat opini melalui Twitter dan
komentar Instagram dalam berbahasa Indonesia. Data yang diambil secara acak
melalui Twitter dan komentar Instagram dengan beberapa kata kunci yang
berhubungan dengan layanan data operator telekomunikasi. Layanan data
perator yang akan menjadi objek pada penelitian ini adalah SimPATI, Tri, XL
Axiata dan Indosat Ooredoo. Pengumpulan data dilakukan dengan
memanfaatkan Twitter API dan Instagram API.
2.4 Preprocessing
3.2.1 Tokenization
3.2.2 Cleansing
5
3.2.3 Filtering
2.5 TF-IDF
POS tagging adalah sebuah proses untuk memberikan kelas pada sebuah
kata dan dilakukan dengan cara parsing, kemudian ditentukan kelas untuk
setiap kata dengan bantuan kamus yang dibuat sendiri berdasarkan KBBI
(Kamus Besar Bahasa Indonesia) [10]. POS tagging merupakan hal yang
mendasar dalam melakukan pengolahan bahasa alami seperti kata
disambiguasi, penguraian, penjawab pertanyaan dan terjemahan mesin. Hal
utama dalam penggunaan POS tagging pada analisis ini adalah untuk mengatasi
kata-kata yang bersifat ambiguitas [12].
6
2.7 Naive Bayes Classifier
7
BAB III
METODOLOGI PENELITIAN
3.2 Perancangan
8
3.2.1 Dataset Opini
3.2.2 Pre-processing
9
a. Tokenization
Proses tokenization dilakukan untuk memotong kalimat
menjadi beberapa bagian atau kata-kata. Hasil dari pemotongan ini
disebut dengan token.
b. Cleansing
c. Filtering
d. Convert Negation
10
3.2.4 Penentuan Kelas Atribut
11
3.2.7 Kesimpulan
3.3 Pengujian
12
BAB IV
JADWAL KEGIATAN
Agar dalam pembuatan tugas akhir ini berjalan dengan baik, selesai tepat waktu
dan memperoleh hasil yang diharapkan, maka pentingnya jadwal kegiatan
pengerjaan tugas akhir. Berikut jadwal kegiatan yang direncanakan adalah:
13
kesalahan
aplikasi.
Perbaikan
aplikasi
Analisis berdasarkan
6. dan hasil
Evaluasi pengujian
dan hasil
evaluasi.
Buku TA
Pembuatan selesai tanpa
7.
Buku TA banyak
revisi.
14
DAFTAR PUSTAKA
[2] APJII, Survei Internet APJII 2016, November 2016. [Online]. Available:
http://www.apjii.or.id/survei. [Diakses 8 September 2017].
15
SUPPORT VECTOR MACHINE, Jurnal Dinamika Informatika, vol. 5,
2016.
[14] A. Goel, J. Gautam dan S. Kumar, Real Time Sentiment Analysis of Tweets
Using Naive Bayes, 2016 2nd International Conference on Next Generation
Computing Technologies (NGCT-2016), pp. 257-261, 2016.
16