1954 1 12154 1 10 20180102 PDF
1954 1 12154 1 10 20180102 PDF
net/publication/322959504
CITATIONS READS
5 2,045
3 authors, including:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Muhammad Ali Fauzi on 06 February 2018.
Abstrak
Kurikulum 2013 sempat menjadi topik yang sering diperbincangkan oleh masyarakat yang salah
satunya di Twitter. Twitter merupakan salah satu sosial media yang banyak digemari dan digunakan
masyarakat untuk beropini atau menyampaikan pendapat tentang bahasan tertentu. Dengan demikian
penelitian ini mencoba menganalisis tweets tentang Kurikulum 2013 dengan mengklasifikasikan
apakah termasuk opini positif atau opini negatif. Proses klasifikasi yang dilakukan menggunakan
metode K-Nearest Neighbor dan menggunakan metode Query Expansion Ranking untuk seleksi fitur.
Ada 4 proses utama pada sistem analisis sentimen ini yang pertama adalah text pre-processing, term
weighting (TF-IDF), seleksi fitur, dan klasifikasi. Berdasarkan pengujian yang telah dilakukan pada
penelitian ini terbukti bahwa seleksi fitur meningkatkan hasil akurasi sistem. Hasil akurasi yang
terbaik sebesar 96.36% diperoleh pada saat nilai k = 1 dan menggunakan rasio 50% seleksi fitur. Hasil
pengujian dengan menggunakan rasio 50% seleksi fitur akurasi sistemnya lebih tinggi dibandingkan
sistem yang tidak menggunakan seleksi fitur karena beberapa fitur noise dihilangkan.
Kata kunci: analisis sentimen, kurikulum 2013, k-nearest neighbor, opini, query expansion ranking, seleksi
fitur.
Abstract
Kurikulum 2013 has become a hot topic that is often discussed by society on Twitter. Twitter is one of
the social media that used by a society to talk about a particular subject. This study attempted to
analyze tweets about the Kurikulum 2013 by classifying whether it is a positive opinion or a negative
opinion. Classification process is done by K-Nearest Neighbor method by using Query Expansion
Ranking method for feature selection. There are 4 main processes in this analysis sentiment system
that first is text pre-processing, term weighting (TF-IDF), feature selection, and classification. Based
on the tests in this study proven that feature selection improve accuracy of system results. The
best acuracy results of 96.36% was obtained when k = 1 and using a feature selection of 50% ratio.
The test results by using selection feature of 50% ratio get higher accuracy than a system does not use
the selection feature because some noise features that have been removed.
Keywords: feature selection, kurikulum 2013, k-nearest neighbor, opinion, query expansion ranking, sentiment
analysis.
4. KESIMPULAN
Hasil penelitian, pengujian, dan analisis
pengujian yang telah dilakukan maka
kesimpulan yang diambil adalah:
Penelitian ini memiliki 4 proses utama yang
dilakukan sistem yaitu, text pre-processing,
Gambar 3. Grafik Pengujian rasio feature selection kemudian melakukan perhitungan term
weighting (TF-IDF) pada seluruh fitur yang ada
Pengujian feature selection ini pada data uji dan latih, melakukan feature
menggunakan metode Query Expansion selection dengan menggunakan metode Query
Ranking yang diterapkan pada metode K- Expansion Ranking, dan klasifikasi dengan K-
Nearest Neighbor untuk klasifikasi dengan nilai Nearest Neighbor pada setiap dokumen uji
k = 1. Gambar 3 menunjukkan grafik hasil apakah termasuk kelas “opini positif” atau
akurasi dari rasio feature selection Query “opini negatif”.
Expansion Ranking untuk pengklasifikasian Skenario pengujian pertama diperoleh nilai
data uji menggunakan K-Nearest Neighbor. k tetangga yang terbaik pada saat proses
Hasil akurasi saat menggunakan 100% rasio pengklasifikasian dokumen dengan
feature selection atau seluruh fitur digunakan menggunakan 100% fitur adalah k = 1. Hasil
untuk klasifikasi adalah 93.63%, kemudian akurasinya sebesar 93.63%, karena pada saat
rasio feature selection mulai diturunkan nilai adalah k = 1 data uji hanya
menjadi 75% dan hasil akurasinya mengalami memperhitungkan nilai kemiripan dari satu
kenaikan sebesar 95.45%. Rasio kembali tetangga terdekatnya, namun pada saat nilai k
diturunkan menjadi 50% hasil akurasinya naik ditambah maka akan ada lebih banyak tetangga
mencapai 96.36%, selanjutnya rasio pengujian yang diperhitungkan nilai kemiripannya dengan
terakhir feature selection yaitu 25% hasil data uji.
akurasinya turun menjadi 90.00%. Skenario pengujian kedua yang telah
Dari hasil penelitian bahwa saat 100% fitur dilakukan, dengan menggunakan nilai k = 1
yang digunakan tidak semua memiliki relevansi hasil akurasi tertinggi sebesar 96.36% pada
pada dokumen-dokumen yang diujikan. Namun rasio feature selection yang digunakan sebesar
pada saat fitur dikurangi menjadi 75% dan 50% 50%, karena pada saat feature selection 100%
fitur yang digunakan bukan merupakan fitur tidak semua fitur yang digunakan memiliki
noise dan cenderung memiliki relevansi pada relevansi pada dokumen-dokumen uji, dan
dokumen-dokumen yang diujikan sehingga pengurangan fitur yang terlalu banyak juga
hasil akurasi dari feature selection 75% dan akan menyebabkan fitur-fitur yang relevan juga
50% lebih tinggi dibandingkan 100%