Oleh :
Fitri Febriyani S
1103144063
Fitri Febriyani S
NIM : 1103144063
ii
ABSTRACT
iii
KATA PENGANTAR
Puji syukur atas kehadirat Alloh SWT karena berkat rahmat dan karunia-
Nya penulis dapat meyelesaikan proposal ini. Penulis juga mengucapan terimakasih
kepada pihak yang telah memberikan dukungan serta membantu dalam pembuatan
proposal ini.
Penulis
iv
DAFTAR ISI
LEMBAR PERSETUJUAN..................................................................................... i
ABSTRAK .............................................................................................................. ii
1.3 Tujuan.......................................................................................................... 2
2.4.1 Tokenization...................................................................................... 5
2.4.3 Filtering................................................................................................. 6
v
2.7 Naive Bayes Classifier ................................................................................ 7
vi
DAFTAR GAMBAR
vii
DAFTAR TABEL
viii
BAB I
PENDAHULUAN
Pada saat ini merupakan masa modern dengan adanya teknologi yang
berkembang dengan pesat. Salah satu yang paling populer pada saat ini di
Indonesia adalah pengguna internet yang semakin meningkat pada beberapa
tahun terakhir. Melalui hasil survei APJII (Asosiasi Penyelenggara Jasa
Internet Indonesia) statistik pengguna internet tahun 2015 jumlah pengguna
internet di Indonesia sebesar 139 juta [1]. Sedangkan pada tahun 2016
pengguna internet di Indonesia mencapai 132,7 juta [2]. Terdapat beberapa
produk operator selular yang memberikan layanan data operator
telekomunikasi untuk akses internet sesuai dengan pilihan tarif dan
keunggulanya masing-masing. Hal ini membuat penulis melakukan analisis
sentimen pada media sosial terhadap beberapa produk layanan data operator
untuk melihat kepuasan masyarakat dalam menggunakan layanan data operator
telekomunikasi di Indonesia. Adapun produk layanan data operator yang akan
menjadi objek dalam analisis sentimen ini adalah SimPATI, Tri, XL Axiata
dan Indosat Ooredoo.
Media sosial menghasilkan data yang bervolume besar atau kaya akan
sentimen dalam bentuk tweets, update status, posting blog, komentar dan lain-
lain [3]. Masyarakat banyak menggunakan media sosial untuk
mengekspresikan opini, pengalaman maupun hal lain yang menjadi perhatian
mereka [1]. Maka dari itu, penulis memanfaatkan media sosial sebagai sumber
informasi dalam melakukan analisis sentimen terhadap produk-produk yang
sudah dipilih sebelumnya. Hasil dari penelitian ini diharapkan dapat
memberikan informasi kepada masyarakat terhadap kualitas produk operator
selular dalam memberikan layanan akses internet serta memberikan informasi
kepada sebuah perusahaan atau organisasi untuk melihat opini konsumen atau
masyarakat terhadap kualitas layanan, prediksi penjualan serta pemantauan
terhadap sebuah produk.
Data yang akan dikumpulkan pada penelitian ini merupakan berbentuk
teks berbahasa Indonesia melalui Twitter dan komentar pada Instagram dengan
memanfaatkan Twitter API dan Instagram API. Dalam analisis sentimen hal
mendasar yang dilakukan adalah pengelompokan polaritas kata yang berasal
dari setiap kalimat atau pendapat pada tiga sifat, yaitu positf, netral dan negatif.
Selanjutnya dilakukan preprocessing dimana data yang sudah disiapkan
menjadi data yang siap untuk dianalisis [1]. Pada penelitian ini akan digunakan
metode Naive Bayes Classifier (NBS) yang merupakan teknik pembelajaran
mesin yang berbasis probablistik [4].
1.3 Tujuan
Adapun tujuan yang ingin dicapai pada penelitian ini adalah dapat
memberikan informasi kepada masyarakat tentang kepuasan masyarakat
diseluruh Indonesia dalam menggunakan operator seluler sehingga masyarakat
dapat memilih operator seluler yang baik digunakan sesuai kebutuhannya
masing-masing.
2
1.4 Batasan Masalah
1.5 Hipotesa
3
BAB II
TINJAUAN PUSTAKA
4
2.3 Pengumpulan dan Pelabelan Sentimen
Data yang akan diambil berupa kalimat opini melalui Twitter dan
komentar Instagram dalam berbahasa Indonesia. Data yang diambil secara acak
melalui Twitter dan komentar Instagram dengan beberapa kata kunci yang
berhubungan dengan layanan data operator telekomunikasi. Layanan data
perator yang akan menjadi objek pada penelitian ini adalah SimPATI, Tri, XL
Axiata dan Indosat Ooredoo. Pengumpulan data dilakukan dengan
memanfaatkan Twitter API dan Instagram API.
2.4 Preprocessing
2.4.1 Tokenization
2.4.2 Cleansing
5
2.4.3 Filtering
2.5 TF-IDF
POS tagging adalah sebuah proses untuk memberikan kelas pada sebuah
kata dan dilakukan dengan cara parsing, kemudian ditentukan kelas untuk
setiap kata dengan bantuan kamus yang dibuat sendiri berdasarkan KBBI
(Kamus Besar Bahasa Indonesia) [9]. POS tagging merupakan hal yang
mendasar dalam melakukan pengolahan bahasa alami seperti kata
disambiguasi, penguraian, penjawab pertanyaan dan terjemahan mesin. Hal
utama dalam penggunaan POS tagging pada analisis ini adalah untuk mengatasi
kata-kata yang bersifat ambiguitas [11].
6
2.7 Naive Bayes Classifier
7
BAB III
METODOLOGI PENELITIAN
3.2 Perancangan
8
3.2.1 Dataset Opini
3.2.2 Pre-processing
9
a. Tokenization
Proses tokenization dilakukan untuk memotong kalimat
menjadi beberapa bagian atau kata-kata. Hasil dari pemotongan ini
disebut dengan token.
b. Cleansing
c. Filtering
d. Convert Negation
10
3.2.4 Penentuan Kelas Atribut
3.2.7 Kesimpulan
11
3.3 Pengujian
12
BAB IV
JADWAL KEGIATAN
Agar dalam pembuatan tugas akhir ini berjalan dengan baik, selesai
tepat waktu dan memperoleh hasil yang diharapkan, maka pentingnya jadwal
kegiatan pengerjaan tugas akhir. Berikut jadwal kegiatan yang direncanakan
adalah:
13
mengetahui
kesalahan
aplikasi.
Perbaikan
aplikasi
Analisis berdasarkan
6. dan hasil
Evaluasi pengujian
dan hasil
evaluasi.
Buku TA
Pembuatan selesai tanpa
7.
Buku TA banyak
revisi.
14
DAFTAR PUSTAKA
[2] APJII, Survei Internet APJII 2016, November 2016. [Online]. Available:
http://www.apjii.or.id/survei. [Diakses 8 September 2017].
15
[8] A. Fathan Hidayatullah dan A. SN, ANALISIS SENTIMEN DAN
KLASIFIKASI KATEGORI TERHADAP TOKOH PUBLIK PADA
TWITTER, Seminar Nasional Informatika, pp. 115-122, 2014.
[13] A. Goel, J. Gautam dan S. Kumar, Real Time Sentiment Analysis of Tweets
Using Naive Bayes, 2016 2nd International Conference on Next Generation
Computing Technologies (NGCT-2016), pp. 257-261, 2016.
16