Anda di halaman 1dari 15

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/320556313

Sentiment Analysis Dokumen E-Complaint Kampus Menggunakan Additive


Selected Kernel SVM

Conference Paper · September 2013

CITATIONS READS

0 259

2 authors:

Imam Cholissodin Budi Darma Darma Setiawan


Brawijaya University Brawijaya University
81 PUBLICATIONS   110 CITATIONS    25 PUBLICATIONS   32 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Automatic Essay Scoring View project

Deep Intelligent Agriculture View project

All content following this page was uploaded by Imam Cholissodin on 22 October 2017.

The user has requested enhancement of the downloaded file.


Cholissodin I., Setiawan B.D., 2013. Sentiment Analysis Dokumen E-Complaint Kampus Menggunakan
Additive Selected Kernel SVM. Seminar Nasional Teknologi Informasi Dan Aplikasinya (SNATIA).

SENTIMENT ANALYSIS DOKUMEN E-COMPLAINT


KAMPUS MENGGUNAKAN
ADDITIVE SELECTED KERNEL SVM
Imam Cholissodin1, Budi Darma Setiawan1
1
Teknik Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya
Jl. Veteran No.8 Malang, Informatika, Gedung A PTIIK – UB
Email : imamcs@ub.ac.id1, s.budidarma@ub.ac.id1

ABSTRAK
Teknologi merupakan salah satu kunci utama pelayanan prima pada lembaga manapun. E-Complaint
merupakan bagian dari lembaga pendidikan dalam kampus yang mengelola data keluhan sebagai tolak ukur
pelayanan prima dan deteksi dini kelemahan dari semua sistem pelayanan yang ada. Data keluhan yang
dikelolapun sangat beragam dan jumlahnya bertambah secara signifikan. Hal ini tidak sebanding dengan
jumlah sumber daya manusia yang ada dalam lembaga tersebut. Jika dokumen tersebut dikelola dengan cara
manual, maka akan membutuhkan usaha cukup besar dan waktu yang cukup lama. Selain itu, mayoritas data
keluhan selalu identik dengan kata-kata yang negatif. Namun tidak semua dokumen yang mengandung kata-kata
negatif termasuk dalam kelas sentiment negatif, karena bisa jadi ternyata dokumen komplain tersebut
mengandung kritik yang membangun. Hal inilah yang menjadi topik utama pada penelitian ini. Dari berbagai
permasalahan tersebut, maka sangat dibutuhkan proses pengelolahan dokumen komplain secara realtime, cepat
dan akurat dengan sistem yang mampu melakukan filterisasi secara otomatis untuk menyeleksi dokumen
komplain mana saja yang positif dan negatif sebelum dilakukan proses tindak lanjut untuk menyelesaikan
komplain tersebut. SVM merupakan salah satu metode yang sangat handal dalam melakukan proses klasifikasi
data yang memiliki tingkat kemiripan tinggi, karena mampu mengolah data baik linear maupun non-linear
dengan menggunakan kernel trik pada dimensi tinggi dan tidak tergantung pada banyaknya fitur yang
digunakan. Dalam penelitian ini, digunakan metode additive selected kernel SVM dengan menambahkan teknik
density of document (DoD) untuk membantu dalam mengoptimalkan hasil pencaran titik data dari dokumen.
Additive selected kernel bekerja dengan melakukan penambahan beberapa fungsi kernel untuk membuat fungsi
hyperplane dengan iterasi yang singkat dan optimal. Dari hasil pengujian semua skenario percobaan dengan
menggunakan metode tersebut didapatkan rata-rata akurasi sebesar 98.60%.

Kata Kunci: Sentiment Analysis, Support Vector Machine, Additive Selected Kernel, Information Retrieval,
Dokumen E-Complaint.

1 PENDAHULUAN tersebut berisi kata-kata yang dianggap negatif, tetapi


justru memuat kritik yang sangat membangun.
Dalam mengajukan sebuah komplain atau Additive kernel termasuk kernel yang
saran bagi civitas akademika kampus, seseorang banyak digunakan untuk proses klasifikasi gambar
diharapkan memberikan informasi dengan detail berdasarkan histogramnya [5]. Additive kernel SVM
terkait apa yang ingin disampaika. Sehingga lembaga menawarkan perbaikan yang signifikan dalam akurasi
E-Complaint dapat dengan mudah untuk membantu dibandingkan dengan kernel lainnya. Sehingga kernel
menanggapi dan menyampaikan kepada pihak-pihak ini sangat praktis untuk mengelola klasifikasi data
yang terkait. Namun selama ini proses pengelolaan pada skala besar maupun yang bersifat realtime.
dokumen E-Complaint tersebut masih dilakukan Penelitian tersebut menyajikan percobaan pada
secara manual, tanpa adanya sistem otomasi untuk berbagai dataset, termasuk INRIA person, Daimler-
melakukan pengelolaan lebih cepat menggunakan Chrysler pedestrians, UIUC Cars, Caltech-101,
sistem komputerisasi yang dapat bekerja mirip MNIST dan USPS digits, untuk menunjukkan
dengan manusia. Alasan dilakukan penelitian pada efektivitas dan efisiensi dari algoritma SVM dengan
topik ini karena memang kebanyakan persepsi additive kernel. Selain itu, additive kernel juga
seseorang dalam menilai dokumen E-Complaint mampu mempersingkat proses iterasi dari algoritma
selalu mengkategorikan sebagai dokumen yang pelatihan SVM.
negatif. Bagi kami, hal ini justru menarik untuk Sentiment analysis telah dikembangkan
dilakukan pengkajian sebagai objek penelitian, dengan banyak cara untuk mempersepsikan isi dari
karena bisa jadi bahwa ketika dokumen komplain suatu dokumen. Dokumen yang diambil dari forum
diskusi online memungkinkan pengguna internet

1
untuk mengekspresikan pendapat mereka tentang 2 MODEL, ANALISIS, DESAIN, DAN
berbagai macam topik melalui dokumen tersebut. IMPLEMENTASI
Karena jumlah dokumen topik di internet tumbuh
secara eksponensial, maka untuk membantu 2.1 E-Complaint
pengguna internet memahami dokumen topik yang Penjaminan mutu (quality assurance)
banyak dengan cepat dan mudah, diperlukan metode pendidikan tinggi sebagai proses penetapan dan
khusus sesuai dengan basis permasalahan yang pemenuhan standar mutu pendidikan secara konsisten
digunakan. Kemudian pada penelitian yang lain dan berkelanjutan dimaksudkan agar pelanggan
mengusulkan pendekatan berbasis ontologi untuk memperoleh kepuasan serta menghasilkan
meningkatkan hasil klasifikasi yang dikombinasi pengembangan berkelanjutan (continous
dengan metode SVM pada dokumen yang membahas improvement) di perguruan tinggi. Agar perbaikan
tentang review perangkat lunak [6]. Akan tetapi dan pengembangan dapat dilakukan dengan cepat dan
penelitian tersebut hanya sebatas melihat tingkat terus-menerus serta kepuasan pelanggan senantiasa
kedetailan dari deskripsi kelebihan dan kekurangan terpenuhi, keluhan yang disampaikan oleh pelanggan
suatu perangkat lunak, tanpa mempertimbangan sebenarnya merupakan masukan yang sangat
review sentiment negatif maupun positif dari berharga dan harus ditindaklanjuti secara tepat dan
pelanggan atau pihak terkait. Kemudian disusul terjamin. Keluhan pelanggan juga merupakan salah
penelitian tentang sentiment analysis pada teks satu instrumen untuk melakukan evaluasi dan deteksi
berbahasa Indonesia menggunakan maximum dini terhadap kelemahan sistem ataupun
entropy dan SVM [7]. Mereka mengidentifikasi penyimpangan terhadap pelaksanaan dokumen
bahwa seseorang cenderung untuk mengekspresikan manual mutu. Hal ini juga sangat diperlukan untuk
pendapat hanya dalam bentuk teks, sementara mencapai standar World Class University [1].
emoticon jarang digunakan dan kadang-kadang tidak Pada Gambar 1 merupakan data statistik
sesuai dengan apa yang dibicarakan. Mereka juga keluhan pelanggan dalam bentuk pie chart yang
mengidentifikasi bahwa tulisan di media sosial diambil pada pertengahan tahun 2013. Dari gambar
Indonesia dapat diklasifikasikan tidak hanya untuk tersebut terlihat bahwa urutan prosentase keluhan
pertanyaan positif, negatif, netral dan tetapi juga terbesar sampai yang terkecil adalah Visi, Misi,
untuk kasus khusus pada kata-kata yang sedikit alay Tujuan dan Sasaran, serta Strategi Pencapaian
dan sulit dimengerti oleh komputer. Penelitian sebesar 22.07%, Tata Pamong, Kepimpinan, Sistem
tersebut mendapatkan akurasi sebesar 83.5%. Pengelolaan dan Penjaminan Mutu sebesar 16.72%,
Pada penelitian ini kami mengusulkan teknik Mahasiswa dan Lulusan sebesar 4.35%, Sumberdaya
sentiment analysis dengan menggunakan metode Manusia sebesar 2.01%, Kurikulum, Pembelajaran,
additive selected kernel SVM dengan menambahkan dan Suasana Akademik sebesar 18.39%,
teknik density of document (DoD) pada saat Pembiayaan, Sarana dan Prasarana, Sistem Informasi
pengambilan fitur kata-kata positif dan negatif dari sebesar 24.75%, Penelitian, Pengabdian kepada
dokumen serta menyeleksi penggunaan fungsi kernel Masyarakat, Kerjasama sebesar 2.01%, serta Layanan
sebelum dilakukan proses additive. Hal ini untuk Teknologi Informasi sebesar 9.70%.
menjaga agar hasil mapping data dari dua fungsi
kernel yang berbeda tersebut dapat dihitung tanpa
menggunakan pendekatan, sehingga didapatkan
solusi yang menghasilkan nilai eksak untuk setiap
parameter pada fungsi hyperplane yang dibentuk.
Kemudian untuk melakukan proses seleksi fungsi
kernel tersebut, kami menggunakan identifikasi dari
kesamaan dimensi hasil mapping datanya. Jika
dimensi mapping datanya tidak sama dengan hasil
mapping data kernel lainnya, maka proses additive
tersebut tidak dapat dilakukan. Langkah pertama
dalam metode yang diusulkan ini, sistem melakukan
proses pelatihan setiap data dokumen E-Complaint
dengan menggunakan beberapa kombinasi jenis
kernel serta variasi besarnya rasio data training dan
testing yang telah ditentukan sebelumnya. Langkah
yang kedua yaitu menambahkan dua fungsi kernel
polynomial pada derajat dua dan konstanta yang
dinamis. Kemudian langkah yang terakhir adalah
melakukan proses pengujian terhadap semua data
dokumen pada setiap kombinasi skenario untuk
Gambar 1. Statistik E-Complaint
mendapatkan hasil klasifikasi yang optimal.

2
Cholissodin I., Setiawan B.D., 2013. Sentiment Analysis Dokumen E-Complaint Kampus Menggunakan
Additive Selected Kernel SVM. Seminar Nasional Teknologi Informasi Dan Aplikasinya (SNATIA).

2.2 Text Preprocessing 2.4 Sentiment Analysis


Text Preprocessing adalah suatu proses Sentiment Analysis secara umum bertujuan
pengubahan bentuk data belum terstruktur menjadi untuk mengekstrak sikap dan perasaan pelanggan,
data yang terstruktur sesuai kebutuhannya untuk darinya didapatkan ulasan terstruktur dengan
proses dalam data mining. Tujuan dilakukan pre- memisahkan informasi secara objektif dari informasi
processing adalah memilih setiap kata dari dokumen lainnya. Sentiment analysis merupakan sebuah
dan merubahnya menjadi kata dasar yang memiliki cabang penelitian di bidang Text Mining yang mulai
arti sempit dan proses teks mining akan memberikan naik daun pada awal tahun 2002. Riset tersebut mulai
hasil yang lebih memuaskan. Tahapan text marak setelah paper dari B. Pang dan L. Lee
preprocessing menurut Mooney terbagi menjadi dipublikasikan keseluruh dunia [9]. Secara umum,
lima tahap, yaitu tokenizing, filtering, stemming, sentiment analysis ini dibagi menjadi dua kategori
tagging, dan analyzing [8]. Dalam dokumen E- besar [10] :
Complaint berbahasa Indonesia, kami memodifikasi  Coarse-grained sentiment analysis.
tahapan text preprocessing menjadi seperti pada  Fined-grained sentiment analysis.
Gambar 2 dibawah ini. Coarse-grained sentiment analysis adalah
melakukan proses analisis pada level dokumen.
TOKENIZING Singkatnya adalah mencoba mengklasifikasikan
dan berorientasi pada sebuah dokumen secara
keseluruhan. Orientasi ini ada 3 jenis : Positif, Netral
FILTERING dan Negatif. Akan tetapi, ada juga yang menjadikan
nilai orientasi yang bersifat kontinu atau tidak diskrit.
Sedangkan Fined-grained sentiment analysis
STEMMING merupakan kategori yang sedang jadi trend sekarang.
Maksudnya adalah para peneliti sebagian besar
berfokus pada jenis ini. Obyek yang ingin
TERM WEIGHTING diklasifikasi bukan berada pada level dokumen
melainkan sebuah kalimat pada suatu dokumen,
Gambar 2. Tahap Preprocessing contoh :
 Saya tidak suka mendengar pendapat positif
dari orang lain. (negatif).
2.3 Density of Document  Saran dan kritik tersebut terbukti sangat
Kepadatan dokumen atau Density of membantu institusi kami. (positif).
Document (DoD) ini tanpa menggunakan konsep Secara garis besar, Sentiment analysis terdiri
peluang, artinya tidak ada pembagian banyaknya dari 3 subproses utama [11]. Masing-masing
kemungkinan semua kata yang ada pada semua subproses ini bisa dijadikan topik riset secara
dokumen, akan hanya tetapi menggunakan tingkat terpisah karena masing-masing subproses ini
banyaknya kata yang dituliskan oleh user akan membutuhkan teknik yang tidak mudah :
diberikan nilai 1 per 100 kata.  Subjectivity Classification (Menentukan kalimat
yang merupakan opini).
TotalwordDOC  Orientation Detection (Menentukan apakah
DoD  (1) opini tersebut positif, netral atau negatif).
100  Opinion Holder and Target Detection
(Menentukan bagian yang merupakan opini
Semakin banyak kata yang dituliskan, maka holder dan yang merupakan target utama opini).
semakin besar kemungkinan user tersebut mengeluh.
dan semakin besar kemungkinan dokumen tersebut 2.5 Additive Kernel SVM
masuk kelas negatif walaupun tidak bisa dipastikan Inisialisasi data pelatihan yang digunakan,
 yi , xi iN1 ,
secara langsung hanya menggunakan fitur kata positif
dan negatif. Oleh sebab itulah diperlukan faktor diberikan label dalam bentuk dengan
penambahan kepadatan dokumen sebagai buffer dan yi   1,1, xi  R n menggunakan formulasi C-
penyeimbang dokumen sekaligus untuk membuat
unik posisi dari titik data dokumen. Alasan lainnya SVM [12]. Untuk kasus linear, algoritma tersebut
adalah agar titik data satu dokumen dengan dokumen terbukti dapat menemukan hyperplane terbaik yang
yang lainnya saling berpencar dengan maksimal dan dapat memisahkan data dengan meminimalkan fungsi
tidak overlapping. Jika menggunakan nilai peluang, berikut :

 w,   
1 2
w  C i 1  i
maka nilai pencaran titik datanya menjadi kurang N
(2)
optimal. Rumus ini kami modifikasi dari penelitian 2
untuk yi w  xi  b   1   i dan  i  0 , dimana
sebelumnya, yang menggunakan pendekatan Density
Probabilistic Document Correlation (DPDC) [4].
C > 0 adalah trade off pada constraint. Fungsi kernel
3
pada titik data K(x,z) : Rn x Rn  R merupakan hasil  Kedua, set  i  0 , lalu menghitung matrik Dij
inner produk dari  x    z  . Fungsi mapping data (sebagai matrik Hessian).
 x  
dan  z tersebut sangat sulit sekali untuk  
Dij  yi y j K xi , x j   2 dan i,j=1,…,N.
ditemukan nilai-nilainya dari dimensi tinggi yang N adalah banyaknya data.
menghasilkan nilai inner produk sama dengan K(x,z).  Ketiga, lakukan (a), (b) dan (c) berikut dengan
Karena kesulitan tersebut, maka sistem i=1 sampai N.
mengendalikan secara langsung dari fungsi kernel
Ei   j 1 j Dij
N
yang digunakan. Kemudian untuk mendapatkan (a)

 i  minmax 1  Ei ,i , C  i 
persamaan hyperplane yang optimal, dapat
digunakan persamaan berikut : (b)
 i merupakan variabel tunggal dan bukan
W    i 1 i    i j yi y j K x, xi 
1
bentuk dari perkalian  dan  i .
N
(3)
2 ij
(c) i  i   i
0   i  C dan   i yi  0
N
untuk : (4)
i 1  Kembali ke langkah Ketiga, sampai pada
fungsi keputusannya adalah sign f x  , dimana : kondisi IterMax atau max   i    .
f x   i 1 i yi K x, xi   b SV   i  ThresholdSV 
m
(5)  Support vector,
nilai ThresholdSV ditentukan dari hasil
Perhatikan bahwa Persamaan 3 hanya beberapa kali percobaan. Nilai threshold
membutuhkan akses ke fungsi kernel saja, tanpa tersebut adalah ThresholdSV  0 .
harus melakukan mapping data dengan fungsi  . ,   Selesai.
m adalah banyaknya support vector. Sehingga hal ini
memungkinkan seseorang untuk memecahkan 3 SKENARIO UJI COBA
formulasi dalam ruang fitur yang berdimensi tinggi
dengan sangat efisien, langkah inilah yang disebut Dalam penelitian ini, kami menggunakan
sebagai kernel trik. Untuk kernel linear, kita dapat kernel linear, kernel polynomial degree dan degree

menggunakan fungsi kernel K x, z  x  z , dan  up. Skenario yang digunakan adalah dengan
melakukan proses training dan testing secara
fungsi hyperplane f x   w  x  b , dimana vektor berkesinambungan pada beberapa rasio atau
perbandingan data yang dipilih secara acak. Pada
w  i 1 i yi xi
m
w dapat dihitung dengan rumus kernel polynomial tersebut, kami melakukan ujicoba
dengan mengkombinasikan beberapa nilai konstanta
dan b
1
2
 
w.x   w.x  . Jika pada kasus non- pada kernel untuk dibandingkan hasil akurasinya.
Berikut detail dari skenario yang digunakan.
linear vektor w dapat dihitung dengan rumus  Menggunakan metode sequential SVM untuk
w  i 1 i yi xi  dan konstanta b dengan melakukan proses training pada titik-titik data
m
dokumen [3].

    
1  Kombinasi nilai konstanta yang dipilih yaitu
rumus b w. x   w   x  . Khusus [1,1], [1,2], [1,3], [1,4], [1,5], [2,1] dan [2,5].
2 Kombinasi ini digunakan untuk kernel additive
untuk additive selected kernel digunakan rumus yang telah diseleksi.
K x, z   i 1 K i ( x, z ) dan f x  dapat ditulis
n
 Rasio perbandingan data training dan testing
yang digunakan adalah [80:20], [70:30],
sebagai f x   w   x   b . [60:40], [50:50] dan [40:60] dalam satuan
persen (%).
2.6 Sequential Training SVM  Kemudian untuk visualisasi data, digunakan
Salah satu metode paling sederhana yang model dua dimensi dan tiga dimensi, hal ini
digunakan untuk mendapatkan garis atau bidang sangat berguna dalam menganalisis mapping
hyperplane yang optimal dalam SVM adalah metode data satu dengan data yang lainnya dalam kelas
sequential yang telah dikembangkan oleh yang sama maupun yang berbeda.
Vijayakumar [3], berikut langkah-langkahnya.  Menggunakan kernel polynomial tipe degree
 Pertama, inisialisasi nilai parameter yang dan up to degree untuk additive selected kernel,
digunakan. Misal set   5 ,   5 (learning karena setelah kami menguraikan beberapa
bentuk dari kernel tersebut, diketahui bahwa
rate), C=1 (variabel slack), IterMax=1000 dan
fungsi kernel polynomial ini masih relatif
  0.00000001 (epsilon). mudah untuk ditemukan hasil mapping data
4
Cholissodin I., Setiawan B.D., 2013. Sentiment Analysis Dokumen E-Complaint Kampus Menggunakan
Additive Selected Kernel SVM. Seminar Nasional Teknologi Informasi Dan Aplikasinya (SNATIA).

pada dimensi tinggi dari pada menggunakan keluhan diset ulang untuk kelas pelatihannya pun ini
kernel yang lain. Selain itu dari hasil percobaan sangat memungkinkan, karena ini hanya sebatas
kami pada proses testing menggunakan secara perbedaan persepsi saja dan semuanya memiliki
langsung hasil mapping data dan ternyata dapat argumentasi yang sama-sama benar. Dan justru
lebih mengoptimalkan hasil akurasi jika karena multi persepsi dan sangat sulitnya menyeleksi
dibandingkan dengan menggunakan pendekatan dokumen keluhan ini, apalagi membedakan mana
fungsi kernel secara langsung untuk saja dokumen keluhan yang mengandung kritik tajam
menggantikan hasil mapping data pada dimensi tapi membangun dan sebaliknya. Oleh karena itu,
tinggi yang sulit sekali untuk ditentukan pada permasalahan ini sangat rentan terjadi kesalahan
beberapa kernel lainnya. Artinya bahwa pengklasifikasian jika hanya mengandalkan metode
pendekatan di sini tidak selalu memberikan statistik biasa. Memang dikenyataanya, hasil
solusi eksak, akan tetapi dapat mendekati solusi mapping data keluhan pada koordinat titik data antara
sebenarnya dan memang banyak yang sudah kelas data yang berlabel positif dan negatif pun bisa
menggunakan karena alasan sulit mendapatkan saling overlapping. Untuk itulah algoritma SVM ini
mapping datanya. digunakan, karena memang didalam algoritma
Hasil mapping data dokumen E-Complaint tersebut terdapat kernel trik yang dapat bermanfaat
ini awalnya hanya memanfaatkan fitur frekuensi kata untuk mentransfomasi titik-titik data keluhan yang
yang negatif maupun yang positif, akibatnya banyak tidak dapat dipisahkan secara linear atau bersifat
dari beberapa dokumen tersebut memiliki nilai fitur non-linear dan saling overlapping berdasarkan
yang sama, sehingga hasil visualisasi mapping titik kelasnya masing-masing. Lalu proses
datanya terlihat saling overlap. Untuk mengatasi hal pengklasifikasiannya pun dilakukan pada dimensi
tersebut, kami mengambil langkah penambahan tinggi. Proses transformasi ini dapat memisahkan
faktor density of document (DoD). Asumsinya adalah semua titik koordinat data keluhan pada dimensi
semakin padat kata-kata yang diungkapkan oleh user, tinggi berdasarkan fungsi kernel yang digunakan. Hal
maka akan semakin memperkuat point kritikan yang inilah yang kemudian dapat mempermudah proses
disampaikan. Dan point kritikan ini biasanya klasifikasi dengan tujuan dapat meningkatkan hasil
mengarah kepada dokumen yang bermakna kepada akurasi data ujinya.
penekanan, baik itu kritik positif maupun negatif.
Setelah kami lakukan langkah tersebut, hasil akhir 4 HASIL UJI COBA
dari mapping dokumen menjadi titik data pada
bidang koordinat dua dimensi dapat terpisah dengan Pada uji coba yang pertama, yaitu dengan
jelas dan setiap dokumen memiliki tingkat faktor kombinasi kernel linear dan semua variasi rasio
kepadatan yang unik. Faktor kepadatan dokumen data perbandingan data training dan testing. Hal ini kami
ini kami tambahkan terhadap setiap nilai fitur lakukan untuk menguji apakah metode yang
frekuensi kata positif dan negataif, dengan analogi digunakan tersebut tetap bisa handal pada berbagai
bahwa banyaknya uraian kata-kata dalam dokumen situasi data keluhan. Berikut beberapa hasil proses
keluhan tersebut dapat mendukung secara langsung pelatihan yang didapatkan.
ke dua fitur, yaitu uraian panjang kritikan positif dan
negatif. Berikut rumus faktor kepadatan dokumen
yang digunakan :

TF _ Baru Positif  TF _ Awal Positif  DoD (6)


TF _ Baru Negatif  TF _ Awal Negatif  DoD (7)

TF menyatakan banyaknya kemunculan kata


positif dan negatif pada suatu dokumen yang diamati.
TF_Baru adalah hasil dari penambahan TF dengan
DoD. Langkah ini akan dilakukan pada semua
dokumen keluhan untuk dijadikan nilai fitur. Jadi
fitur yang terbentuk tersebut ada dua dimensi, yaitu
fitur kata positif (TF_BaruPositif) dan fitur kata negatif
(TF_BaruNegatif). Setiap keluhan memang dapat dinilai
berbeda, hal ini dapat disesuaikan dengan sudut
pandang seorang reviewer. Dalam menelaah data
keluhan ini, sistem tersebut sangat berguna dalam Gambar 3. Hasil Training Data Dokumen E-
membantu memberikan penilaian awal dan sekaligus Complaint Dengan SVM Kernel Linear Pada
sebagai salah satu bahan pertimbangan yang dapat Rasio [50:50]
bekerja dengan sangat cepat. Jika memang data
5
Pada Gambar 3 menunjukkan bahwa metode
SVM dengan kernel linear ini sangat handal dalam
memisahkan data antara dua kelas. Jika memang
diketahui bahwa secara kasat mata hasil mapping
titik-titik data dokumen tersebut dapat terpisah secara
linear. Hal ini bisa dilihat bahwa garis pemisah yang
terbentuk dari fungsi hyperplane f(x), secara
visualisasi dapat memisahkan dan sangat dekat
dengan persepsi kita. Akan tetapi hasil dari pelatihan
dari satu jenis rasio dan lainnya ternyata memberikan
hasil training yang berbeda. Kita melihat sekilas
sepertinya garis hyperplane yang terbentuk nampak
mirip letak dan kemiringannya, tetapi sebenarnya jika
dilihat lebih dekat memiliki nilai margin yang
berbeda. Otomatis nilai w sebagai vektor yang tegak
lurus dengan garis hyperplane dapat dipastikan
berbeda. Hal ini bisa dilihat pada hasil training
Gambar 4 dan Gambar 5.
Gambar 6. Hasil Testing Data Dokumen E-
Complaint Dengan SVM Kernel Linear Pada
Rasio [50:50]
Hasil testing pada uji coba pertama ini
menunjukkan bahwa ada yang semua data testing-nya
terklasifikasi dengan benar seperti pada Gambar 6,
dan ada pula yang beberapa datanya masih salah saat
diklassifikasi seperti pada Gambar 7. Bahkan ada
titik data yang tepat berada pada garis hyperplane.
Pada kasus ini, kami mengasumsikan bahwa data
tersebut tidak netral, akan tetapi kami memasukkan
dalam kelas positif seperti ditunjukkan pada Gambar
8. Alasan kami memasukkan dalam dokumen positif
adalah untuk memberikan tolerasi dan ruang tengah
yang bisa membantu untuk membedakan mana saja
dokumen yang benar-benar termasuk dokumen
negatif dan bukan negatif. Berikut ini adalah
Gambar 4. Hasil Training Data Dokumen E- beberapa tampilan hasil proses testing setiap titik data
Complaint Dengan SVM Kernel Linear Pada pada kernel linear.
Rasio [70:30]

Gambar 5. Hasil Training Data Dokumen E- Gambar 7. Hasil Testing Data Dokumen E-
Complaint Dengan SVM Kernel Linear Pada Complaint Dengan SVM Kernel Linear Pada
Rasio [80:20] Rasio [60:40]
6
Cholissodin I., Setiawan B.D., 2013. Sentiment Analysis Dokumen E-Complaint Kampus Menggunakan
Additive Selected Kernel SVM. Seminar Nasional Teknologi Informasi Dan Aplikasinya (SNATIA).

Pada kernel linear di atas, kami hanya dapat


melakukan proses visualisasi mapping titik-titik data
keluhan pada dimensi dua. Kemudian pada kernel
polynomial, kami dapat melakukan proses visualisasi
pada dua bidang yaitu dua dimensi maupun tiga
dimensi. Hal ini dikarenakan hasil mapping data dari
dimensi rendah ke dimensi tingginya menghasilkan
tiga dimensi yang masih memungkinkan untuk
dilakukan proses plotting. Berikut ini adalah ujicoba
yang kedua menggunakan kernel polynomial
sekaligus menunjukkan hasil proses visualisasinya
pada dua dimensi maupun tiga dimensi.

Gambar 8. Hasil Testing Data Dokumen E-


Complaint Dengan SVM Kernel Linear Pada
Rasio [60:40]
Hasil akurasi yang didapatkan pada ujicoba
pertama ini dapat dilihat pada Gambar 9. Pada rasio
[80:20] dan [70:30] menunjukkan bahwa hasil
akurasinya 100%, kemudian pada rasio [60:40],
[50:50] dan [40:60] mulai terlihat beberapa variasi
nilai akurasinya, yaitu kadang naik dan turun. Akan
tetapi hasil akurasi yang didapatkan masih relatif di
atas 90%. Salah satu faktor yang mempengaruhi
besar nilai akurasi adalah semakin banyaknya data
Gambar 10. Hasil Training 2D Data Dokumen E-
training yang digunakan dalam setiap kasus, dan
Complaint Dengan SVM Kernel Polynomial Pada
rasio yang terbaiknya adalah [80:20] dan [70:30].
Rasio [50:50]
Kemudian untuk rata-rata keseluruhan nilai
akurasinya adalah 99.21 %. Nilai rata-rata ini dapat
dikatakan sangat optimal dan layak untuk digunakan
sebagai rekomendasi bahwa sistem yang dibuat
tersebut memiliki tingkat persepsi yang hampir
mendekati dengan analisis persepsi manusia.

Gambar 11. Hasil Training 3D Data Dokumen E-


Complaint Dengan SVM Kernel Polynomial Pada
Rasio [50:50]
Pada Gambar 10 dan Gambar 12 tersebut
menunjukkan bahwa garis hyperplane yang terbentuk
ternyata memiliki sifat kuadratik. Artinya persamaan
Gambar 9. Hasil Akurasi Testing Data Dokumen f(x) yang membentuk garis hyperplane tersebut
E-Complaint Dengan SVM Kernel Linear Pada berupa persamaan kuadrat. Hal ini sangat berbeda
Semua Rasio dengan hasil persamaan garis pada kernel linear.

7
Kemudian hasil visualisasi tiga dimensi dapat dilihat
pada Gambar 11 dan Gambar 13. Dari gambar
tersebut dapat dinyatakan bahwa data pada dimensi
tinggi dapat dipisahkan secara linear oleh sebuah
bidang hyperplane yang dibentuk dari transformasi
titik data dari setiap dokumen dengan rumus
w   ( x)  b  0 yang kemudian kami uraikan
menjadi bentuk persamaan kuadrat jika
diimplementasikan pada bidang dua dimensi. Misal
diketahui vektor w =[w1 w2 w3]t , x=[x1 x2]t dan z=[z1
z2]t. Langkah awal yang perlu dilakukan adalah
mentransformasi data x  R 2  X  R3 menjadi
berikut :
 x12   z12 
   
X   2 x1 x2  dan Z   2 z1 z 2  (8)
 2   2  Gambar 12. Hasil Training 2D Data Dokumen E-
 x2   z2  Complaint Dengan SVM Kernel Polynomial Pada
Diketahui bahwa X   x  dan Z   z  , untuk Rasio [60:40]

mencari nilai K ( x, z ) pada kernel polynomial, kita


dapat secara langsung dengan menghitung
K ( x, z )  x  z  . Sedangkan jika menggunakan
2

teknik mapping data, maka kita dapat menghitung


dengan K ( x, z )   x    z  yang jika diuraikan
didapatkan hasil sebagai berikut :
K ( x, z )    x     z 
 x1 2   z1 2 
   
  2 x1 x2    2 z1 z 2  (9)
 2   2 
 x2   z 2 
 x1 z1   2 x1 x2 z1 z 2  x2 z 2 
2 2

Pembuktian untuk menyatakan bahwa nilai Gambar 13. Hasil Training 3D Data Dokumen E-

K ( x, z)  x  z    x    z  dapat diamati
2 Complaint Dengan SVM Kernel Polynomial Pada
Rasio [60:40]
pada penguraian berikut.
K ( x, z )   x  z 
2

2
 x   z 
   1    1  
  x2   z 2  
  x1 z1  x2 z 2 
2

  x1 z1   2 x1 z1 x2 z 2    x2 z 2 
2 2

  x1 z1   2 x1 x2 z1 z 2    x2 z 2 
2 2

 x12   z12 
   
  2 x1 x2    2 z1 z 2 
 2   2 
 x2   z 2 
  x    z  Gambar 14. Hasil Testing 2D Data Dokumen E-
Complaint Dengan SVM Kernel Polynomial Pada
(10)
Rasio [50:50]
8
Cholissodin I., Setiawan B.D., 2013. Sentiment Analysis Dokumen E-Complaint Kampus Menggunakan
Additive Selected Kernel SVM. Seminar Nasional Teknologi Informasi Dan Aplikasinya (SNATIA).

Analisis hasil testing pada ujicoba kedua ini pada tiga dimensi tersebut kita perlu untuk
tidak jauh berbeda dengan ujicoba pertama. Dari menguraikan rumus f x   w   ( x)  b dengan
hasil ujicoba kedua ini menunjukkan bahwa ada yang
pernyataan sesuai teori SVM bahwa hasil
penghitungan nilai data x pada persamaan f x   0
semua data testing-nya terklasifikasi dengan benar
seperti pada Gambar 14, Gambar 15 dan Gambar 16,
dan ada pula yang beberapa datanya masih salah saat jika data x tersebut tepat berada pada garis
diklasifikasi seperti pada Gambar 17 dan Gambar 18. hyperplane. Berikut ini adalah penjabarannya.
Bahkan ada titik data yang tepat berada pada garis  w1 
hyperplane. Pada kasus ini, kami mengasumsikan  
bahwa data tersebut tidak netral, akan tetapi kami f ( x)   w2    ( x)  b  0
memasukkan dalam kelas positif seperti ditunjukkan w 
pada Gambar 19 dan Gambar 20. Berikut ini adalah  3
 w1   x1 
beberapa tampilan lainnya hasil proses testing setiap 2
titik data pada kernel polynomial.  
 w2    2 x1 x2   b  0 (11)
 w   x 2 
 3  2 
w1 x1  2 w2 x1 x2  w3 x2  b  0
2 2

Hasil penguraian pada Persamaan 10


tersebut berupa persamaan kuadrat yang dapat
diselesaikan salah satunya menggunakan rumus abc.
Pada bidang dua dimensi ini, hasil penggambaran
persamaan kuadrat tersebut akan secara otomatis
muncul diantara kelas pada titik data. Sedangkan
pada bidang tiga dimensi, garis hyperplane tersebut
akan menjadi sebuah bidang linear. Misalkan kita set
a  w3 , b  2w2 x1 dan c  w1 x1  b maka
2

Gambar 15. Hasil Testing 3D Data Dokumen E- untuk mendapatkan nilai x2 adalah sebagai berikut.
Complaint Dengan SVM Kernel Polynomial Pada
Rasio [50:50]  b  b 2  4ac
x2 
2a


   
2 w2 x1  
2

2 w2 x1  4w3 w1 x1  b
2

2w3
(12)

Gambar 16. Hasil Testing 3D Data Dokumen E-


Complaint Dengan SVM Kernel Polynomial Pada
Rasio [60:40]
Penguraian di atas pada Persamaan 10 bisa
juga digunakan untuk menganalisis hasil bentuk
mapping data pada dimensi tinggi dari titik data
dokumen pada variasi bentuk kernel polynomial yang Gambar 17. Hasil Testing 2D Data Dokumen E-
lainnya, dan nanti akan dibahas pada bagian additive Complaint Dengan SVM Kernel Polynomial Pada
kernel. Untuk melakukan proses plotting hyperplane Rasio [40:60]
pada bidang dua dimensi dari persamaan mapping
9
Pada additive selected kernel dengan derajat
2 dan konstanta yang dinamis, yaitu misal pada c1 = 1
dan c2 = 2 didapatkan hasil mapping dimensi
tingginya adalah enam dimensi. Berikut ini adalah
proses perhitungan transformasi dari data dua
dimensi ke enam dimensi pada c1.
K ( x, z )   x  z  c1 
2

  x1 z1    x 2 z 2   c1 
2

  x1 z1    x 2 z 2  
2

2 x1 z1    x 2 z 2 c1  c1
2

  x1 z1   2 x1 z1  x 2 z 2    x 2 z 2  
2 2

2c1  x1 z1   2c1  x 2 z 2   c1
2
Gambar 18. Hasil Testing 3D Data Dokumen E-
Complaint Dengan SVM Kernel Polynomial Pada
 x1 2   z1
2

Rasio [40:60]    
Analisis hasil akurasi yang didapatkan pada  2 x1 x 2   2 z1 z 2 
skenario kedua ini dapat dilihat pada Gambar 19.  2   2 
 x2   z2 
Pada rasio [80:20] dan [70:30] menunjukkan bahwa  
hasil akurasinya 100%, kemudian pada rasio [60:40],  2c1 x1   2c1 z1 
[50:50] dan [40:60] mulai terlihat beberapa variasi    
nilai akurasinya, yaitu kadang naik dan turun. Akan  2c1 x 2   2c1 z 2 
 c   c1 
tetapi hasil akurasi yang didapatkan masih relatif  1  
≥ 90%. Salah satu faktor yang mempengaruhi besar
kecilnya nilai akurasi adalah semakin banyaknya data   x    z 
training yang digunakan dalam setiap proses (13)
pengujian. Dari pengujian tersebut didapatkan rasio sehingga didapatkan persamaan berikut,
terbaiknya adalah [80:20] dan [70:30]. Kemudian K additiveSELECTED ( x, z )  K c 1 ( x, z )  K c 2 ( x, z )
untuk rata-rata keseluruhan nilai akurasinya adalah
98.60 %. Nilai rata-rata ini dapat dikatakan masih  1 x   1 z    2 x    2 z 
sangat optimal dan layak untuk digunakan sebagai (14)
rekomendasi bahwa sistem yang dibuat tersebut
memiliki tingkat persepsi yang hampir mendekati atau sistem juga dapat menggunakan rumus kernel
dengan analisis persepsi manusia. asli tanpa melakukan proses penguraian mapping dari
titik data yang akan diproses seperti langkah berikut.

K additiveSELECTED ( x, z )  K c 1 ( x, z )  K c 2 ( x, z )
  
 x  z  c1   x  z  c 2 
2 2

(15)

Kemudian untuk mendapatkan hasil mapping titik-


titik data dengan additive selected kernel adalah
sebagai berikut.
 additiveSELECTED ( x)   c ( x)   c ( x)
1 2

 x1
2
  x1 
2
   
 2 x1 x2   2 x1 x2 
 2   2  (16)
x2   x2 
 
Gambar 19. Hasil Akurasi Testing Data Dokumen  2c1 x1   2c2 x1 
E-Complaint Dengan SVM Kernel Polynomial    
Pada Semua Rasio  2c1 x2   2c 2 x 2 
 c1   c2 

10
Cholissodin I., Setiawan B.D., 2013. Sentiment Analysis Dokumen E-Complaint Kampus Menggunakan
Additive Selected Kernel SVM. Seminar Nasional Teknologi Informasi Dan Aplikasinya (SNATIA).

Setelah itu, untuk membuat mapping titik data pada


additive selected kernel ini, kami menggunakan
persamaan berikut.
w  i1  i yi additiveSELECTED ( xi )
m
(17)
dimana m merupakan banyaknya support vector yang
didapatkan dari proses pelatihan yang kemudian
digunakan untuk menghitung vektor w. Setelah
mendapatkan vektor w, kami menghitung nilai b.

b
1
2
  

w. additiveSELECTED xi 
(18)
1
2
  
w. additiveSELECTED xi

Setelah terbentuk w dan b, kemudian dibentuk fungsi


klasifikasinya f x  . Gambar 21. Hasil Training 2D Data Dokumen E-
f x   w  additiveSELECTED ( x)  b (19) Complaint Dengan Additive Selected Kernel SVM
C1=1 C2=2 Pada Rasio [40:60]
Karena kami hanya mampu melakukan
proses plotting maksimal pada tiga dimensi, maka
plotting enam dimensi tersebut tidak kami lakukan
berdasarkan dimensi titik data hasil transformasi pada
Persamaan 13. Akan tetapi walaupun sistem tidak
mampu memvisualisikan enam dimensi, dengan
memanfaatkan sifat dari mapping data dimensi pada
kernel, dalam hal ini kami mengambil langkah untuk
mendapatkan hasil mapping data dari dua kernel atau
lebih yaitu dengan cara additive. Hasil dari
penambahan ini nanti dapat digunakan untuk
melakukan pembuatan visualisasi dalam dua dimensi.
Berikut ini adalah ujicoba yang ketiga yang
merupakan ujicoba terakhir menggunakan additive
selected kernel sekaligus menunjukkan hasil proses
visualisasinya pada dua dimensi. Pada ujicoba ini
nanti digunakan kombinasi nilai c1 dan c2 yaitu [1,1],
[1,2], [1,3], [1,4] dan [1,5] pada semua variasi rasio Gambar 22. Hasil Training 2D Data Dokumen E-
antara data training dan testing. Complaint Dengan Additive Selected Kernel SVM
C1=1 C2=3 Pada Rasio [60:40]

Gambar 20. Hasil Training 2D Data Dokumen E- Gambar 23. Hasil Training 2D Data Dokumen E-
Complaint Dengan Additive Selected Kernel SVM Complaint Dengan Additive Selected Kernel SVM
C1=1 C2=1 Pada Rasio [40:60] C1=1 C2=4 Pada Rasio [80:20]

11
Gambar 24. Hasil Training 2D Data Dokumen E- Gambar 26. Hasil Testing 2D Data Dokumen E-
Complaint Dengan Additive Selected Kernel SVM Complaint Dengan Additive Selected Kernel SVM
C1=1 C2=5 Pada Rasio [80:20] C1=1 C2=2 Pada Rasio [40:60]

Pada Gambar 20-24, merupakan hasil dari


proses pelatihan menggunakan metode SVM dengan
additive selected kernel. Dari keseluruhan hasil
pelatihan tersebut didapatkan bahwa secara kasat
mata hasil mapping titik-titik data dokumen tersebut
dapat dipisahkan secara non-linear menggunakan
persamaan hyperplane. Jika dilihat dari segi
kelengkungan garisnya, maka akan ada banyak sekali
variasi bentuknya. Kelengkungan garis hyperplane
ini sangat tergantung dari sebaran titik-titik data
diantara dua kelas dokumen yang divisualisasikan
dalam bidang koordinat tersebut. Kelengkungan garis
yang terbentuk dari fungsi persamaan untuk
hyperplane non-linier tersebut sebenarnya sangat
cocok untuk titik data yang memiliki sebaran yang
kemungkinan besar akan saling overlapping dengan
data kelas lainnya jika jumlah data tersebut dalam Gambar 27. Hasil Testing 2D Data Dokumen E-
skala yang cukup besar. Complaint Dengan Additive Selected Kernel SVM
C1=1 C2=3 Pada Rasio [60:40]

Gambar 25. Hasil Testing 2D Data Dokumen E- Gambar 28. Hasil Testing 2D Data Dokumen E-
Complaint Dengan Additive Selected Kernel SVM Complaint Dengan Additive Selected Kernel SVM
C1=1 C2=1 Pada Rasio [40:60] C1=1 C2=4 Pada Rasio [80:20]
12
Cholissodin I., Setiawan B.D., 2013. Sentiment Analysis Dokumen E-Complaint Kampus Menggunakan
Additive Selected Kernel SVM. Seminar Nasional Teknologi Informasi Dan Aplikasinya (SNATIA).

nilai akurasi yang didapatkan dari hasil pengujiannya


masih dibawah hasil dari pengujian kernel linear.
Nilai rata-rata akurasi pada kernel linear yaitu
99.21%, sedangkan untuk kernel polynomial dan
additive selected kernel secara kebetulan memiliki
nilai rata-rata akurasi yang sama yaitu sebesar
98.60%. Jika dihitung selisih nilai rata-rata
akurasinya didapatkan nilai sebesar 0.61%. Nilai
selisih rata-rata akurasi ini tidak masuk dalam
kategori signifikan. Artinya jika diberikan tolerasi
tingkat perbedaan ± 5%, maka nilai rata-rata akurasi
tersebut masih dalam satu kelas yang sama-sama
tinggi dan optimal, apalagi skenario uji coba yang
kami lakukan masih hanya sebatas pada proses
additive selected kernel polynomial.

Gambar 29. Hasil Testing 2D Data Dokumen E- 5 KESIMPULAN


Complaint Dengan Additive Selected Kernel SVM
C1=1 C2=5 Pada Rasio [80:20]
Pada beberapa kali percobaan, ternyata
hampir kebanyakan data kelas +1 dan kelas -1
Jika diamati pada semua hasil pengujian dari semuanya termasuk support vektor, hal ini
data testing dengan additive selected kernel SVM dikarenakan data yang kami gunakan jumlahnya
mulai dari Gambar 25-29, dapat ditarik kesimpulan hanya 148 dokumen E-Complaint yang bisa
bahwa sangat wajar sekali jika hasil akurasi additive dikatakan masih relatif kecil dalam skala populasi.
selected kernel ini masih dibawah kernel linear. Hal Dan pada beberapa kali pengujian dengan additive
ini dikarenakan garis hyperplane tersebut memiliki selected kernel didapatkan hasil akurasi di bawah
sifat kelengkungan yang justru dapat memotong atau kernel linear, akan tetapi hal ini belum bisa
meniadakan titik data yang seharusnya masuk kelas digunakan untuk mengeneralisir hasil keseluruhan
tertentu namun tidak masuk kelas tersebut. kombinasi additive selected kernel yang ada. Karena
dalam penelitian ini, kami hanya menggunakan
fungsi additive selected pada kernel polynomial.
Diharapkan untuk penelitian selanjutnya dapat
menambahkan data dokumen dalam jumlah yang
cukup besar. Karena memang kebanyakan hasil
plotting titik-titik data dokumen semestinya bersifat
non-liniear. Selain itu juga diharapkan menggunakan
kombinasi additive selected kernel-kernel yang lain,
misalnya polynomial dengan derajat > 2, rbf, sigmoid
maupun kernel invers multi kuadratik serta
menggunakan density of document (DoD) yang
sesuai untuk membentuk plotting titik-titik data
dokumen agar lebih representatif.

6 DAFTAR PUSTAKA

[1] Website Resmi Lembaga E-Complaint UB.,


Gambar 30. Hasil Akurasi Testing Data Dokumen
2013. E-Complaint UB | Beranda,
E-Complaint Dengan Additive Selected Kernel
<URL:http://e-complaint.ub.ac.id>.
SVM Pada Semua Rasio
[2] Rafael E. Banchs. 2012. Text Mining with
Teknik additive selected kernel ini ternyata MATLAB®. MATLAB® is a registered
memberikan proses iteratif hasil training data lebih trademark of The MathWorks, Inc.
cepat jika dibandingkan dengan menggunakan kernel [3] Sethu Vijayakumar and Si Wu. 1999
linear, yaitu 10 : 1000 iterasi. Hal ini sesuai dengan “Sequential Support Vector Classifiers and
pernyataan pada penelitian Maji [5]. Sehingga sangat Regression”. Proceeding International
menguntungkan jika data yang diolah tersebut Conference on Soft Computing (SOCO’99),
berjumlah sangat besar, dan tidak menutup Genoa, Italy, pp.610-619.
kemungkinan apalagi jika diimplementasikan pada [4] Uma, R. Muneeswaran, K. 2013. “Efficacious
jumlah data yang relatif kecil. Namun sayangnya Geospatial Information Retrieval Using Density
13
Probabilistic Document Correlation Approach”.
Journal of Computer Science, 9 (1): 83-93.
[5] Subhransu Maji, Alexander C. Berg, Jitendra
Malik. 2013. “Efficient Classification for
Additive Kernel SVMs”. IEEE, Transactions
On Pattern Analysis And Machine
Intelligence, Vol. 35, No. 1.
[6] Khin Phyu Phyu Shein, Thi Thi Soe Nyunt.
2010. “Sentiment Classification based on
Ontology and SVM Classifier”. Second
International Conference on Communication
Software and Networks.
[7] Aqsath Rasyid Naradhipa, Ayu Purwarianti.
2012. “Sentiment Classification for Indonesian
Message in Social Media”. IEEE.
[8] Mooney, Raymond J. 2006. “Mining Text
Mining with Information Extraction”. Austin :
University of Texas.
[9] B. Pang., L. Lee. 2008. “Opinion Mining and
Sentiment Analysis”. Foundations and
Trends® in Information Retrieval Vol. 2,
Nos. 1–2 1–135 DOI: 10.1561/1500000001.
[10] Clayton R. Fink, Danielle S. Chou, Jonathon J.
Kopecky, Ashley J. Llorens. 2011. “Coarse- and
Fine-Grained Sentiment Analysis of Social
Media Text”. Johns Hopkins Apl Technical
Digest, Volume 30, Number 1.
[11] Taras Zagibalov, John Carroll. 2008.
“Automatic Seed Word Selection for
Unsupervised Sentiment Classification of
Chinese Text”. Proceedings of the 22nd
International Conference on Computational
Linguistics pages 1073–1080 Manchester.
[12] C. Cortes., V. Vapnik, (1995), “Support-Vector
Networks,” Machine Learning, vol. 20, no. 3,
pp. 273-297.

14

View publication stats

Anda mungkin juga menyukai