JOM FAUZAN ARISMA (REVISI3) - Compressed

ANALISIS SENTIMEN PADA KOMENTAR INSTAGRAM
DPR RI MENGGUNAKAN METODE

SUPPORT VECTOR MACHINE
Fauzan Arisma, Fatayat
Mahasiswa Program Studi S1 Sistem Informasi

Jurusan Ilmu Komputer
Fakultas Matematika dan Ilmu Pengetahuan Alam
Kampus Bina Widya Pekanbaru, 28293, Indonesia
fauzan.arisma5458@student.unri.ac.id
ABSTRACT
Instagram is one of the most used social media in Indonesia. Instagram is often used
by young people and government agencies to upload their activities. One feature on
Instagram for uploading is posting. In the posting feature, Instagram users can write
their opinions on the post, including the DPR RI Instagram. Instagram users can give
both positive and negative opinions on posts made by the DPR RI Instagram account
so that it is easy to give aspirations. One way to get information through Instagram is
to do sentiment analysis. The algorithm that will be used in this research is Support
Vector Machine (SVM). The results of this study found that the average negative
opinion each month was greater that is equal to 58.69% compared to positive
opinions which only amounted to 41.31%. From the SVM classification results
obtained the highest average accuracy obtained by using the Rational Basic Function
(RBF) kernel which is equal to 65.87%, and the lowest average accuracy value
obtained using the Polynomial kernel which is equal to 57.44%.
Keywords: DPR RI, RBF, Sentiment Analysis, Support Vector Machine, Polynomial
ABSTRAK
Instagram merupakan salah satu media sosial yang paling sering digunakan di
Indonesia. Instagram sering dipakai oleh kalangan anak muda dan lembaga
pemerintahan untuk mengunggah kegiatan mereka. Salah satu fitur di Instagram
untuk mengunggah adalah postingan. Di fitur postingan para pengguna Instagram
dapat menuliskan opininya terhadap postingan tersebut termasuk pada Instagram
DPR RI. Para pengguna Instagram dapat memberi opini positif maupun negatif
terhadap postingan yang dibuat akun Instagram DPR RI sehingga memudahkan
untuk memberikan aspirasi. Salah satu cara untuk mendapatkan informasi melalui
Instagram adalah dengan melakukan analisis sentimen. Algoritma yang akan
digunakan dalam penelitian ini adalah Support Vector Machine (SVM). Hasil dari
1
penelitian ini didapatkan bahwa opini negatif rata-rata setiap bulan lebih besar yakni
sebesar 58.69% dibandingkan dengan opini positif yang hanya berjumlah 41.31%.
Dari hasil klasifikasi SVM didapat nilai rata-rata akurasi tertinggi didapat dengan
menggunakan kernel Rasional Basic Function (RBF) yakni sebesar 65.87%, dan nilai
akurasi rata-rata terendah didapat dengan menggunakan kernel Polynomial yakni
sebesar 57.44%.
Kata Kunci : Analisis Sentimen, DPR RI, RBF, Support Vector Machine,
Polynomial
PENDAHULUAN
Salah Satu keunggulan Instagram adalah dapat mengunggah langsung

foto/video dari smartphone yang memudahkan pemakai untuk menampilkan kegiatan
mereka. Instagram dapat juga digunakan untuk memberi opini bagi pemakainya
melalui kolom komentar yang telah di sediakan Instagram. Komentar tersebut dapat
mengandung opini positif dan negatif tergantung unggahan yang ditampilkan.
Oleh karena itu penulis akan melakukan penelitian dengan menggunakan komentar
Instagram pada akun DPR RI guna untuk mengetahui seberapa tingkat kepuasan
masyarakat terhadap kinerja DPR RI. Akun Instagram DPR RI memiliki 3.812
unggahan yang kurang lebih memiliki 100 komentar tiap unggahnya sampai saat ini.
Komentar tersebut berisi komentar positif atau negatif dari pemakai Instagram yang
melihat unggahan DPR RI. Komentar itu dapat digunakan sebagai patokan tingkat
kepuasan masyarakat atas kinerja DPR RI. Kemudian metode yang dipakai akan
membantu untuk mengelompokan data komentar agar dapat diklasifikasikan dengan
akurasi yang tinggi.
METODE PENELITIAN
a. Teknik Pengumpulan Data

Data yang digunakan pada penelitian ini adalah data yang diambil dari media
sosial Instagram dari tanggal 1 Januari 2019 sampai dengan tanggal 30 September
2019.. Teknik pengumpulan data yang digunakan pada penelitia ini yaitu studi
literatur. Studi literatur yaitu dilakukan dengan mengambil data-data sample yang
terdapat pada jurnal, buku ataupun media eletronik lainnya yang memiliki keterikatan
dengan materi penelitian.
b. Peralatan yang Digunakan

Adapun peralatan yang digunakan dalam penelitian ini terbagi menjadi 2
kategori, yaitu hardware dan software. Peralatan hardware dapat dilihat pada Tabel 1
dan software pada Tabel 2.
2
Tabel 1. Hardware yang digunakan
No Nama Alat dan Bahan Fungsi Keterangan

1 Laptop Pengolahan data HP-87UA0C5M
Tabel 2. Software yang digunakan

No Nama Alat dan Bahan Fungsi Keterangan
1 Windows Sistem operasi Windows 10
Home Single
Language 64 bit
2 Microsoft Office Penulisan dokumen teks Word 2010 dan
Excel 2010
3 Jupyter Notebook Platform Penghubung Anaconda3
Bahasa Program
4 Mozilla Firefox Penghubung dengan 4.6.4
internet
c. Text Mining
Menurut (Wijaya, 2017) text mining merupakan proses otomatis atau sebagian
proses otomatis untuk teks. Sedangkan definisi lain menyebutkan text mining adalah
bidang interdisipliner yang mengacu pada pencarian informasi, pertambangan data,
pembelajaran mesin, statistik, dan komputasi linguistik. Dikarenakan kebanyakan
informasi (perkiraan umum mengatakan lebih dari 80%) data ini disimpan sebagai
teks, text mining diyakini memiliki potensi nilai komersial tinggi.
d. Text Preprocessing
Tahap text preprocessing adalah tahap awal dari text mining. Tahap ini
mencakup semua rutinitas, dan proses untuk mempersiapkan data yang akan
digunakan pada operasi knowledge discovery sistem text mining(Wijaya, 2017).
Menurut (Nurrun dkk, 2016) Ada beberapa tahap dalam preprocessing ini, antara
lain tokenization, cleansing, filtering, steaming, dan normalisasi. Berikut ini adalah
penjelasan secara rinci tentang tahap preprocessing:
1. Tokenization adalah sebuah proses yang dilakukan untuk memotong atau
memecah kalimat menjadi beberapa bagian atau kata.
2. Cleansing adalah suatu tahap dimana karakter maupun tanda baca yang tidak
diperlukan dibuang dari teks. Contoh karakter yang dibuang adalah tanda seru,
tanda tanya, koma dan titik.
3. Filtering adalah tahap menghilangkan kata-kata yang muncul dalam jumlah
besar, namun dianggap tidak memiliki makna (stopwords).
3
4. Stemming merupakan suatu proses untuk menemukan kata dasar dari sebuah
kata dengan menghilangkan semua imbuhan (affixes) baik yang terdiri dari
awalan (prefixes), sisipan (infixes), akhiran (suffixes) dan confixes (kombinasi
dari awalan dan akhiran) pada kata turunan.
5. Normalisasi adalah tahap data yang sudah diakuisisi setelah melalui
preprocessing atau normalisasi data tersebut perlu dilakukan penskalaan untuk
sebelum dilakukan pelatihan terhadap data tersebut dinormalisasi dengan
mean=0 dan standard deviasi=1.
e. Metode Support Vector Machine

Menurut (M. Fachrurrozi and Novi Yusliani, 2015) SVM adalah sistem
pembelajaran mesin yang bekerja atas prinsip Structural Risk Minimization (SRM).
SRM bertujuan untuk menemukan hyperplane terbaik yang memisahkan dua buah
kelas pada input space. Hyperplane terbaik antara dua kelas dapat ditemukan dengan
mengukur margin hyperplane dan mencari titik maksimalnya. Margin adalah jarak
antara hyperplane dengan pattern terdekat dari masing-masing kelas. Pattern yang
paling dekat disebut sebagai support vector.
Tahapan pembelajaran dalam SVM adalah:

1. Mencari Lagrange Multipliers (αi)
L(a)= ∑ni=1 ai aj yi yj xTi xj ................................................................... (1)
Dikenakan (untuk setiap i=1…..n)
Keterangan:
αi : Lagrange multipliers yang bernilai nol atau positif
αj : Lagrange multipliers yang bernilai kurang dari nol atau negatif
yi: kelas data latih (+1/-1).
yj : kelas data latih (+1/-1).
xi : vektor bobot kalimat komentar.
xj : vektor bobot kalimat komentar.
2. Mencari Nilai Bobot (w)
W= ∑ni=1 ( ∝i yi xi ) ............................................................................ (2)
Keterangan :
w : vektor bobot.
αi : Lagrange multipliers yang bernilai nol atau positif
yi : kelas data latih(+1/-1).
xi : vektor bobot kalimat komentar yang menjadi vektor pendukung.
3. Mencari Nilai Bias
1
b= NSV ∑NSV
i=1 (w*xi -yi ) ...................................................................... (3)
Keterangan :
b : Nilai bias
NSV : jumlah vektor pendukung.
4
w :vektor bobot.
yi :kelas data latih (+1/-1).
xi :vektor bobot kalimat komentar yang menjadi vektor pendukung.
Proses pengklasifikasian (pengujian) dalam SVM menggunakan persamaan 4
f(t⃗)=sgn[∑ni=1,xi eSV ai yi <t⃗*x⃗⃗⃗>+b
j ] ..................................................... (4)
Keterangan :
t : vektor bobot data uji.
xi: vektor pendukung.
b : nilai bias.
yi: kelas atau label dari vektor pendukung (+1/-1).
f. Kernel Trick dan Non Linear Clasification pada SVM

Menurut (Chu, Liu and Gao, 2011) Pada umumnya masalah dalam domain
dunia nyata (real world problem ) jarang yang bersifat linear separable. Kebanyakan
bersifat non linear. Untuk menyelesaikan problem non linear, SVM dimodifikasi
dengan memasukan fungsi Kernel. Dalam non linear SVM, pertama–tama data 𝑥⃗
dipetakan oleh fungsi Φ(𝑥⃗) ke ruang vector yang baru ini, hyperplane yang
memisahkan kedua class tersebut dapat dikonstruksikan. Hal ini sejalan dengan teori
Cover yang menyatakan “Jika suatu transformasi bersifat non linear dan dimensi
dari feature space cukup tinggi, maka data pada input space dapat dipetakan ke
feature space yang baru, dimana pattern-pattern tersebut pada probabilitas tinggi
dapat dipisahkan secara linear”.
Tabel 1 Kernel yang umum dipakai dalam SVM

Jenis Kernel Definisi
Polynomial K(x⃗⃗⃗,x
i ⃗⃗⃗) xj p
⃗⃗⃗i ⃗⃗⃗+1)
j = (x
2
Gaussian ‖x⃗⃗⃗⃗-x
i ⃗⃗⃗⃗‖
j
⃗⃗⃗⃗,𝑖 ⃗⃗⃗⃗)
K(𝑥 𝑥𝑗 = exp(- )
2σ2
Sigmoid ⃗⃗⃗⃗,𝑖 ⃗⃗⃗⃗)

K(𝑥 𝑥𝑗 = tanh(𝑎𝑥
⃗⃗⃗⃗.𝑖 ⃗⃗⃗⃗
𝑥𝑗 + 𝛽)
HASIL DAN PEMBAHASAN
a. Data
Data yang akan digunakan dan diuji diambil dari media sosial Instagram dari
tanggal 1 Januari 2019 sampai dengan tanggal 30 September 2019. Dari hasil
pengumpulan data diperoleh sebanyak 1.169 postingan dimana pada bulan Mei
terdapat postingan paling banyak yaitu 172 postingan dan paling sedikit terdapat pada
bulan April yaitu 79 postingan.
5
b. Preprocessing Data
Pada tahap ini dilakukan pembersihan data pada setiap komentar yang diambil
dengan menggunakan tahap preprocessing agar dapat diproses ke tahap
selanjutnya.Tabel 1 dibawah ini akan menampilkan contoh data komentar yang belum
dilakukan tahap preprocessing dan hasil data yang telah melalui tahap cleansing, case
colding, tokenization, filtering, dan steaming.
Tabel 2 Contoh Tahap Preprocessing

Komentar Tahap Preprocessing
Sebagai wakil rakyat! Hapus THR pak! Klw ydk mau rakyat sengsara. THR yg Komentar sebelum di
dimbil langsung dr rakyat hanya bikin susah semua. THR tdk pernah bikin rakyat proses
senang menikmati perayaan agama. THR hny bikin senang org2 yg sudah
bekecukupan....
Sebagai wakil rakyat Hapus THR pak Klw ydk mau rakyat sengsara THR yg Cleansing
dimbil langsung dr rakyat hanya bikin susah semua THR tdk pernah bikin rakyat
senang menikmati perayaan agama THR hny bikin senang org yg sudah
bekecukupan
sebagai wakil rakyat hapus thr pak klw ydk mau rakyat sengsara thr yg dimbil Case Colding
langsung dr rakyat hanya bikin susah semua thr tdk pernah bikin rakyat senang
menikmati perayaan agama thr hny bikin senang org yg sudah bekecukupan
‘sebagai’,’wakil’,’rakyat’,’hapus,’thr’,’pak’,’klw’,’ydk’,’mau’,’rakyat’, Tokenization
’sengsara’,’thr’,’yg’,’dimbil’,’langsung’,’dr’,’rakyat’,’hanya’,’bikin’,’susah’,
’semua’,’thr’,’tdk’,’pernah’,’bikin’,’rakyat’,’senang’,’menikmati’,
’perayaan’,’agama’,’thr’,’hny’,’bikin’,’senang’,’org’,’yg’,’sudah’,’berkecukupan’
‘sebagai’,’wakil’,’rakyat’,’hapus,’thr’,’pak’,’ydk’,’mau’,’rakyat’, Filtering
’sengsara’,’thr’,’dimbil’,’langsung’,’rakyat’,’susah’,’semua’,’thr’,’tdk’,’pernah’,
’rakyat’,’senang’,’menikmati’,’perayaan’,’agama’,’thr’,’senang’,’org’,’sudah’,’ber
kecukupan’
‘sebagai’,’wakil’,’rakyat’,’hapus,’tunjangan’,’pak’,’tidak’,’mau’,’rakyat’, Steaming
’sengsara’,’tunjangan’,’ambil’,’langsung’,’rakyat’ ,’susah’,
’semua’,’tunjangan’,’tidak’, ’pernah , ’rakyat’,’senang’,’nikmat’,
’raya’,’agama’,’tunjangan’,’senang’,’orang’,’sudah’,’cukup’
c. Klasifikasi Metode Support Vector Machine
6
Untuk Mendapatkan Hasil Support Vector Machine terlebih dahulu hasil TF
IDF diubah ke dalam format SVM. Dalam Penelitian ini format SVM yang dipakai
berbentuk seperti format berikut
[-1 1:0.241908355065988]
Bobot Term
Urutan Bobot
Kelas
Variabel pertama yang dipakai adalah kelas yang telah diberikan label pada
komentar di instagram tersebut secara manual, dimana angka 1 menyatakan nilai
label positif pada komentar dan angka -1 menyatakan nilai label negatif pada
komentar.
Setelah kelas, Variabel urutan bobot menyatakan dimensi data abtraks yang ke-
n dalam vektor. Selanjutnya bobot angka 0.241908355065988 menyatakan nilai
bobot dari term tersebut.
Tahap selanjutnya menghitung nilai x, nilai x digunakan untuk perhitungan

kernel. Untuk nilai x1= {term1, term2, …. termi} merupakan nilai yang diambil dari
setiap term yang ada pada komentar dan di kelompokan sesuai komentar yang
diambil maka nilai x1= S1, x2=S2, x3=S3 ,x4=S4, dan x5=S5..
Selanjutnya melakukan kernelisasi menggunakan kernel linear yang umum

digunakan dalam perhitungan kernel yaitu K(xi,xj) = xixjT. maka dilakukan
perhitungan matriks yang dapat dilihat pada Tabel 3.
Tabel 3 Perhitungan Nilai x1 dengan Kernel
x1 x1T x1x1T= x1 * x1T
[0.241908355065988,0.24190836, [0.241908355065988,0.24190836, 1.00539503
0.23048779 0.23048779
0.13773895, 0.13427817, 0.13773895, 0.13427817,
0.07682926, 0.06713909 0.07682926, 0.06713909
0.07682926, 0.24190836, 0.07682926, 0.24190836,
0.24190836, 0.24190836 0.24190836, 0.24190836
0.13773895, 0.24190836, 0.13773895, 0.24190836,
0.24190836, 0.13773895 0.24190836, 0.13773895
0.24190836, 0.2754779, 0.24190836, 0.2754779,
0.24190836, 0.24190836 0.24190836, 0.24190836
0.24190836, 0.24190836, 0.24190836, 0.24190836,
0.13773895, 0.24190836 0.13773895, 0.24190836
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0 0, 0, 0, 0, 0, 0, 0
7
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0] 0, 0, 0, 0, 0, 0, 0, 0]
Setelah dilakukan perhitungan pada seluruh nilai x pada data abstrak, maka
matriks yang terbuat adalah sebagai berikut:
x1x1 x2x1 x3x1 x4x1 x5x1

xixjT= x1x2 x2x2 x3x2 x4x2 x5x2
1.00539503, 0.101058619, 0.010383151, 0.025683659, 0.0083688
0.10105862, 0.999999998, 0.068664847, 0, 0.008906146
xixjT= 0.01038315, 0.068664847, 1.000000003, 0, 0.001471867
0.02568366, 0. 0, 0.999999998, 0
0.0083688, 0.008906146, 0.001471867, 0, 0.999999995
Kemudian tahap selanjutnya adalah melakukan perhitungan terhadap nilai y,

Untuk nilai y didapat dari nilai label yang telah diberikan. Nilai y tersebut dapat
dilihat pada Tabel 4.
Tabel 4 Nilai Label Pada y
y1 y2 y3 y4 y5
-1 -1 1 -1 1
Sehingga matriks yang terbentuk dari hasil perhitungan yiyjT adalah hasilnya
sebagai berikut.
Tahap selanjutnya mengubah nilai abstrak menjadi nilai vektor (support vector
) = (𝑥𝑦) agar mendapatkan nilai ai, Nilai x didapatkan menggunakan
8
persamaan (7) kernel linear untuk x berikut.
L(a)= ∑ni=1 ai aj yi yj xTi xj ................................................................... (5)
Xs1= x1 x1T + x1x2T + x1 x3T + x1x4T + x1x5T

= 1.00539503 + 0.101058619 + 0.010383151, 0.025683659 + 0.0083688
= 1.150889257

= 0.10105862 + 0.999999998 + 0.068664847 + 0 + 0.008906146
= 1.17862961

= 0.01038315 + 0.068664847 + 1.000000003 + 0 + 0.001471867
= 1.080519868
= 0.02568366 + 0 + 0 + 0.999999998 + 0
= 1.025683657

= 0.0083688 + 0.008906146 + 0.001471867 + 0 + 0.999999995
= 1.018746808
Nilai y didapatkan menggunakan persamaan 5 kernel linear seperti nilai x

sehingga mendapatkan nilai sebagai berikut.
Ys1= y1 y1T + y1y2T + y1 y3T + y1y4T + y1 y5T

= 1 + 1 + (-1) + 1 + (-1)
=1

= 1 + 1 + (-1) + 1 + (-1)
=1

= (-1) +(-1) + 1 + (-1) + 1
= -1

= 1 + 1 + (-1) + 1 + (-1)
=1
9
= (-1) +(-1) + 1 + (-1) + 1
= -1
Setelah nilai x dan y didapatkan, maka akan disubsitusikan ke persamaan
berikut ini.
√𝑥𝑛 2 + 𝑦𝑛 2 − 𝑥 + |𝑥 − 𝑦|
√𝑥𝑛 2 + 𝑦𝑛 2 > 2 𝑚𝑎𝑘𝑎 [ ]
𝑥 √𝑥𝑛 2 + 𝑦𝑛 2 − 𝑦 + |𝑥 − 𝑦|
∅ [𝑦] = ........... (6)
𝑥
{ √𝑎2 + 𝑏2 ≤ 2 𝑚𝑎𝑘𝑎 [𝑦]
Nilai xn yang didapat dari xs3 dan yn dari ys3 yang disubsitusikan ke dalam
persamaan √𝑥𝑛 2 + 𝑦𝑛 2 = √1.0805198682 + (−1)2 = 1.47225106 ≤ 2. Karena
hasilnya menunjukan lebih dari lebih dari dua maka hasil seluruh perhitungannya
adalah seperti Tabel 5.
Tabel 5 Support Vector Bias

Abstra S1 S2 S3 S4 S5
k
1.17862961 1.018746808
Suppor [1.150889257] [ ] [1.080519868] [1.02568366] [ ]
t 1 1 −1 1 −1
Vector
.
Setelah mendapat nilai support vector. Kemudian tahap selanjutnya adalah
mencari nilai αi, didapatkan dengan mengalikan setiap data abstrak menggunakan
persamaan sebagai berikut.
∑𝑛𝑖=1,𝑗=1 𝛼𝑖 𝑆𝑖𝑇 𝑆𝑗 ...............................................................................(7)
Setelah dilakukan perhitungan pada seluruh abstrak Kemudian cari parameter
𝛼𝑖 menggunakan persamaan (8), dengan cara subsitusikan nilai hasil dari perhitungan
menggunakan persamaan (7), sehingga bentuknya dapat dilihat sebagai berikut.
∑𝑛𝑖=1,𝑗=1 𝛼𝑖 𝑆𝑖𝑇 𝑆𝑗 = 𝑦𝑖 ...................................................................... (8)
3,324546082𝛼1 + 3.3564722𝛼2+1.2435587𝛼3 +3,1804483𝛼4+1,1724648𝛼5 = 1
3,3564721561𝛼1+3,3891678𝛼2+1,2735327𝛼3+3,2089011𝛼4+1,2007252𝛼5 = 1
1,2435587𝛼1+1,2735327𝛼2+3,1675232𝛼3+1,1082716𝛼4+3,1724648𝛼5 = -1
3,2435587𝛼1+3,2735327𝛼2+1,1675232𝛼3+3,1082716𝛼4+1,1724648𝛼5 = 1
1,1724648𝛼1+1,2007252𝛼2+3,1007762𝛼3+1,044912𝛼4 +3,0378451𝛼5 = -1
10
Dari persamaan diatas, untuk mendapatkan nilai 𝛼1 , 𝛼2 , 𝛼3 , 𝛼4 , 𝛼5 maka
digunakan metode gauss jordan dan subsitusi. Sehingga didapatlah nilai 𝛼1 sampai
𝛼5 berikut.
𝛼1 = 6,76 𝛼2 = -5,08 𝛼3 = -0,53 𝛼4 = -1,19 𝛼5 = 0,02
Karena nilai 𝛼5 adalah bernilai nol dan positif, maka nilai 𝛼1 , 𝛼2 , 𝛼3 , dan 𝛼4
tidak dihitung ke tahap selanjutnya. Setelah didapatkan nilai 𝛼5 masukan ke dalam
persamaan berikut.
Ẃ = ∑𝑛𝑖=1, 𝛼𝑖 𝑆𝑖 .............................................................................. (9)
1,0187468 0,020374936
Ẃ = 0,02 [ −1 ] = [ −0,02 ]
1 0,02
Kemudian hasil yang didapatkan melalui perhitungan dengan menggunakan
persamaan 7, digunakan persamaan 8 dengan hasil yang didapatkan :
0,02374936
Ẃ= [ ], dan dengan b = 0,02
0,02
Sehingga didapatkanlah nilai hyperplane untuk mengklasifikasikan kedua
kelas, yaitu b=0,02.
d. Evaluasi Model
Nilai Rata-Rata (Mean Score)

70
60
50
Jumlah(%)
40
30
20
10
0
SVM RBF SVM POLYNOMIAL SVM SIGMOID
80%/20% 66.39 57.8 58.3
70%/30% 65.39 60.34 61.29
60%/40% 65.83 54.17 59.03
Gambar 1 Hasil Skor Rata – Rata Setiap Kernel SVM
11
Gambar 1 menunjukan hasil skor rata–rata yang didapat oleh kernel RBF,
Polynomial, dan Sigmoid menggunakan tiga split data. Dapat dilihat bahwa skor rata-
rata pada kernel SVM RBF terlihat lebih stabil akurasinya dibandingkan dengan
akurasi kernel lainnya dan terlihat nilai akurasi tertinggi pada kernel SVM RBF
terdapat pada split data 80% /20% yaitu sebesar 66,39% dan terkecil terdapat pada
split data 70%/30% yaitu sebesar 65,39%. Pada kernel SVM Polynomial terlihat
mengalami penurunan akurasi sebesar 5,05%-11,66% dari kernel SVM RBF dan
terlihat nilai akurasi tertinggi pada kernel Polynomial terdapat pada split data
70%/30% yaitu sebesar 60,34% dan terkecil pada split data 60%/40% yaitu sebesar
54.17%. Pada kernel SVM Sigmoid terlihat mengalami kenaikan 0.5%-4,86% dan
terlihat nilai akurasi tertinggi pada kernel Sigmoid terdapat pada split data 70%/30%
yaitu sebesar 61,29% dan terkecil terdapat pada split data 80%/20% yaitu sebesar
58,3%.
KESIMPULAN
Berdasarkan penelitian yang dilakukan oleh penulis dengan mengamati dan

menganalisa sistem pengolahan data yang digunakan serta didukung teori dan alat
yang berkaitan dengan penelitian, maka dapat diambil kesimpulan sebagai berikut:
1. Dari data komentar Instagram yang didapat dari tanggal 01 Januari s/d 30
September terlihat bahwa opini negatif rata-rata setiap bulan lebih besar yakni
sebesar 58.69% dibandingkan dengan opini positif yang hanya berjumlah
41.31% . Ini dapat diartikan bahwa masyarakat yang memiliki akun sosial
media Instagram belum merasa puas dengan kinerja DPR RI pada periode 2015
s/d 2019
2. Dari hasil klasifikasi SVM didapat nilai rata-rata akurasi tertinggi didapat
dengan menggunakan kernel Rasional Basic Function (RBF) yakni sebesar
65.87% ,dan nilai akurasi rata-rata terendah didapat dengan menggunakan
kernel Polynomial yakni sebesar 57.44%.
3. Klasifikasi dengan perbandingan data split yang berbeda memiliki pengaruh
yang cukup signifikan terhadap akurasi klasifikasi SVM.
12
DAFTAR PUSTAKA
Chu, Y. X., Liu, X. G. and Gao, C. H. (2011) ‘Multiscale models on time series of
silicon content in blast furnace hot metal based on Hilbert-Huang transform’,
Proceedings of the 2011 Chinese Control and Decision Conference, CCDC
2011, pp. 842–847. doi: 10.1109/CCDC.2011.5968300.
M. Fachrurrozi, M. T. and Novi Yusliani, M. T. (2015) Analisis Sentimen Pengguna

Jejaring Sosial. Available at:
https://www.researchgate.net/publication/303942719%0AANALISIS.
Nurrun Muchammad Shiddieqy Hadna, Paulus Insap Santosa, W. W. W. (2016) Studi

Literatur Tentang Perbandingan Metode Untuk Proses Analisis Sentimen di
Twitter. Yogyakarta.
Wijaya, D. (2017) Aplikasi Text Mining Untuk Pencarian Dokumen Tugas Akhir
Berdasarkan Semantic Relatedness Menggunakan Machine Readable
Dictionary. Universitas Muhammadiyah Malang.
13

JOM FAUZAN ARISMA (REVISI3) - Compressed

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

JOM FAUZAN ARISMA (REVISI3) - Compressed

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS SENTIMEN PADA KOMENTAR INSTAGRAM

DPR RI MENGGUNAKAN METODE

Fauzan Arisma, Fatayat

Mahasiswa Program Studi S1 Sistem Informasi

Salah Satu keunggulan Instagram adalah dapat mengunggah langsung

a. Teknik Pengumpulan Data

b. Peralatan yang Digunakan

No Nama Alat dan Bahan Fungsi Keterangan

Tabel 2. Software yang digunakan

e. Metode Support Vector Machine

Tahapan pembelajaran dalam SVM adalah:

f. Kernel Trick dan Non Linear Clasification pada SVM

Tabel 1 Kernel yang umum dipakai dalam SVM

Sigmoid ⃗⃗⃗⃗,𝑖 ⃗⃗⃗⃗)

HASIL DAN PEMBAHASAN

Tabel 2 Contoh Tahap Preprocessing

c. Klasifikasi Metode Support Vector Machine

Tahap selanjutnya menghitung nilai x, nilai x digunakan untuk perhitungan

Selanjutnya melakukan kernelisasi menggunakan kernel linear yang umum

x1x1 x2x1 x3x1 x4x1 x5x1

1.00539503, 0.101058619, 0.010383151, 0.025683659, 0.0083688

0.10105862, 0.999999998, 0.068664847, 0, 0.008906146

xixjT= 0.01038315, 0.068664847, 1.000000003, 0, 0.001471867

0.0083688, 0.008906146, 0.001471867, 0, 0.999999995

Kemudian tahap selanjutnya adalah melakukan perhitungan terhadap nilai y,

Tabel 4 Nilai Label Pada y

Xs1= x1 x1T + x1x2T + x1 x3T + x1x4T + x1x5T

Xs2= x2 x1T + x2x2T + x2 x3T + x2x4T + x2x5T

Xs3= x3 x1T + x3x2T + x3 x3T + x3x4T + x3x5T

Xs5= x5 x1T + x5x2T + x5 x3T + x5x4T + x5x5T

Nilai y didapatkan menggunakan persamaan 5 kernel linear seperti nilai x

Ys1= y1 y1T + y1y2T + y1 y3T + y1y4T + y1 y5T

Ys2= y2 y1T + y2y2T + y2 y3T + y2y4T + y2 y5T

Ys3= y3 y1T + y3y2T + y3 y3T + y3y4T + y3 y5T

Ys4= y4 y1T + y4y2T + y4 y3T + y4y4T + y4 y5T

Ys5= y5 y1T + y5y2T + y5 y3T + y5y4T + y5 y5T

Tabel 5 Support Vector Bias

3,324546082𝛼1 + 3.3564722𝛼2+1.2435587𝛼3 +3,1804483𝛼4+1,1724648𝛼5 = 1

Nilai Rata-Rata (Mean Score)

Gambar 1 Hasil Skor Rata – Rata Setiap Kernel SVM

Berdasarkan penelitian yang dilakukan oleh penulis dengan mengamati dan

M. Fachrurrozi, M. T. and Novi Yusliani, M. T. (2015) Analisis Sentimen Pengguna

Nurrun Muchammad Shiddieqy Hadna, Paulus Insap Santosa, W. W. W. (2016) Studi

Anda mungkin juga menyukai