Anda di halaman 1dari 6

Analisis Sentimen terhadap Radikalisme

berdasarkan Opini Masyarakat di media sosial


Twitter
Menggunakan programming python dan algoritma Naive Bayes

Fail Amir line 1: 2nd Given Name Surname


Universitas AMIKOM Yogyakarta line 2: dept. name of organization
line 1: 3rd Given Name Surname
(student) (of Affiliation)
line 2: dept. name of organization
Fakultas Informatika line 3: name of organization
(of Affiliation)
Yogyakarta, Indonesia (of Affiliation)
line 3: name of organization
fail.amir@students.amikom.ac.id line 4: City, Country
(of Affiliation)
line 5: email address or ORCID
line 4: City, Country
line 5: email address or ORCID
Bayu Pebrianto
Universitas AMIKOM Yogyakarta
(student)
Fakultas Informatika
Yogyakarta, Indonesia
bayu.pebrianto@students.amikom.ac.id

Abstract—Dalam perkembangan sosial masyarakat di dan indonesia merupakan masuk ke 10 besar pengguna di
Indonesia; ras,suku dan agama memiliki nilai tersendiri di hati dunia. simple, dan mudah digunakan merupakan alasan
masyarakat. Terlebih khusus pada permasalahan radikalisme terbesar twitter menjadi kegemaran masyarakat Indonesia
yang selalu saja tidak menemukan jalan keluar atas dalam media sosial. dan juga pengguna bebas
penyelesaian masalahnya. Di mulai dari kasus bom bali, mengungkapkan opini mereka dalam tweet.
jakarta, beberapa gereja, dan lainnya. Seolah mencerminkan
bahwa radikalisme adalah suatu anomali sosial yang wajar di tweet merupakan teks yang ditulis pengguna untuk
kehidupan bernegara rakyat Indonesia. Namun sebenarnya, memberikan informasi di twitter. didasar dari kutipan hasil
seberapa besarkah dampak radikalisme atas psikologi sosial di penelitian [2], tweet dapat digunakan user untuk memberi
opini masyarakat. Penelitian ini bertujuan untuk informasi tentang apa yang merka sedang lakukan, rasakan,
mengklasifikasi terhadap sentimen positif,negatif dan netral percakapan, berbagi pendapat, serta bisa juga pelaporan
dari media sosial yang twiter yang dijadikan tempat analisis, berita penting. pada dasarnya tweet berguna untuk mem-post
karena twiter menjadi media sosial yang populer di kalangan hal tentang pengguna serta info lainnya. dalam tweet bisa
pengguna internet. Symbols, Special Characters, Footnotes, or juga mengekspresikan mood atau perasaan user. contohnya
Math in Paper Title or Abstract. (Abstract) yaitu “Aku ingin bermain bola tetapi jakarta macet sekali
karena pemerintah yang tidak becus” itu contoh dari opini
Keywords—component, formatting, style, styling, insert (key
yang bersifat subjektif. dalam opini-opini masyarakat seperti
words)
ini, twitter dapat dijadikan untuk mendapatkan data dari
I. PENDAHULUAN setiap kumpulan opini dari masyarakat.
Negara kita Indonesia merukapan salah satu negara yang polaritas positif atau negatif opini dilakukan secara
memiliki agama, suku, serta budaya yang beragam. tentunya manual, tapi dengan berkembangnya sumber pendapat
dengan adanya perbedaan membuat masyarakat ada semakin banyak usaha untuk mengklasifikasi polaritas
perbedaan pendapat, dalam perbedaan ini ada yang memang pendapat tersebut akan semakin banyak dipakai. maka dari
tidak bermaksud untuk mengadu domba atau memecah belah, itu, penerapan metode pembelajaran mesin untuk membantu
pendapat yang hanya bertujuan untuk menegaskan saja tidak proses ini untuk melakukan hal itu kita bisa menggunakan
ada maksud untuk pertikaian. tetapi tidak sedikit pula ada fungsi text mining yaitu dalam proses klasifikasi dokumen.
beberapa kelompok yang memang sengaja mengadu domba
ada banyak sekali teknik klasifikasi dokumen itu sendiri,
dengan perbedaan ini. dahulu masyarakat menyatakan
antara lain yaitu Naïve Bayes classifier, Decision Trees, dan
mengungkapkan kritk, opini, dan saran melalui media cetak
Support Vector Machines. diantara satu metode yang cukup
sebelum era digital yang tidak semua masyarakat memiliki
populer uaitu Neive Bayes classifier karena memiliki
kemampuan menulis untuk menerbitkan tulisannya. tetapi,
kecepatan serta akurasi yang cukup tinggi ketika digunakan
perkembangan IT sekarang telah merubah kebiasaan
dalam data yang cukup besar dan beragam. selain itu Naive
masyarakat kita dalam mengemukakan opininya di sosial
Bayer Classifier memiliki kelebihan lainnya yaitu sederhana,
media, media sosial yang saat ini cukup populer yaitu
cepat dan akurasi tinggi.
Twitter.
Penelitian analisis sentimen memang sudah banyak
Perkembangan Twitter terbilang cukup cepat. ini
dibuat. diantaranya terhadap review film, teknik mesin yang
didasarkan dari survey ppada 30 november 2019. yang
digunakan yaitu Naive Bayer, Support Vector Machines dan
bersumber dari tekno.kompas.com[1] yaitu 145jt pengguna
juga Maximum Entropy, penelitian tentang analisis
aktif twitter di indonesia.
menggunakan data yang didapat dari media sosial

XXX-X-XXXX-XXXX-X/XX/$XX.00 ©20XX IEEE


twitter.sentimen dalam media sosial twitter menggunakan Account
beberapa teknik untuk mengklasifikasinya. pada penelitian
ini dliakukan menggunakan metode naive bayes dalam No Akun Kategori tweet
penentuan polaritas pada sntimennya. yang dimana hasil dari
polaritas tersebut memiliki akurasi yang tinggi ketika
menggunakan metode Naive Bayes.
1. @OktarinaM Negatif Menuju persatuan umat yg hakiki
II. ahard1 dengan khilafah..InsyaaAllah.
Allahu Akbar
III. EASE OF USE
A. Selecting a Template (Heading 2) 2. @muslimprib Positif Pendukung khilafah banyak yg
First, confirm that you have the correct template for your umi gak bisa ngaji. Itu fakta!!!!
paper size. This template has been tailored for output on the 3. @Dennysireg Negatif Saya sebenarnya jijik kalau tim
A4 paper size. If you are using US letter-sized paper, please ar7 @jokowi bawa2 narasi agama
close this file and download the Microsoft Word, Letter file. dalam kampanye. Tapi saya lebih
B. Maintaining the Integrity of the Specifications jijik kalau pendukung @prabowo…
The template is used to format your paper and style the
text. All margins, column widths, line spaces, and text fonts
are prescribed; please do not alter them. You may note 4. @Airin_NZ Positif Ingin mnerapkan Indonesia
peculiarities. For example, the head margin in this template Bersyariah. Tp menolak Baca
measures proportionately more than is customary. This Al-qur'an
measurement and others are deliberate, using specifications
that anticipate your paper as one part of the entire 5. @RokhmatLa Negatif Seorang kacung takan mungkin
proceedings, and not as an independent document. Please do bib menkritik majikannya. Sudah
not revise any of the current designations. khilafah saja...

IV. METODE PENELITIAN


3.1 Jenis Penelitian 3.3 Pengolahan Data
Penelitian ini melakukan penelitian kuantitatif yang Data yang sudah diperoleh selanjutnya disimpan dalam
sudah terencana secara sistematis agar mendapatkan solusi format .xls dan diubah menjadi .csv. Pegubahan format ini
terbaik dari permasalahan yang diteliti. Desain penelitian bertujuan agar lebih mudah dalam pengolahan di bahasa R
yang digunakan merupakan analisis sentimen dari ketika mengubah data word menjadi number. Data yang
permasalahan yang telah ditetapkan. Analisis dilakukan sudah terkumpul, diolah menggunakan metode text mining
setelah klasifikasi dan ketepatan pegujian model terbaik yang di dalamnya terdiri dari tahap pre-processing,
didapatkan. Penelitian ini merupakan penelitian yang bersifat pembobotan data, hingga mendapatkan data number dalam
analisis dari pengolahan data sekunder yang diperoleh tanpa bentuk matriks. Selanjutnya akan diteruskan pada tahap
eksperimen secara langsung dilapangan. klasifikasi menggunakan metode ANN.
3.2 Sumber Data 3.4 Rancangan Sistem
Data yang digunakan pada penelitian ini merupakan data
sekunder tentang opini atau postingan seseorang di twitter
mengenai radikalisme yang memprovokasi islam radikalis. Gambar 3.1 Flowchart Pengolahan Data
Data diambil secara daring dari situs resmi Pengolahan data berdasarkan Gambar 3.1 menjelaskan
www.api.twitter.com berdasarkan mention account dengan bahwa tahap-tahap yang dilalui oleh data diawali dengan
kata “khilafah” yang terdiri dari kalimat positif dan negatif. tahap pre-processing yang di dalamnya melakukan kegiatan
Data diperoleh dengan melakukan proses web crawling convert data dari data mentahan. Data difilter dengan
dengan menggunakan aplikasi Netbeans. menghilangkan tanda baca, angka, dan emoticon, agar dapat
diekstraksi fiturnya. Proses stemming pada tahap pre-
Crawling dilakukan dengan memilih kata kunci dari data processing tidak dilakukan karena peneliti menginginkan
yang ingin ditambang. Karena pada penelitian ini kata yang diperoleh dari tahap ini tidak berupa kata dasar,
menggunakan kata “khilafah”, maka crawling dilakukan melainkan cukup dengan pemisahan kata yang sebenarnya
dengan menyebutkan satu kata tersebut. Data yang didapat dari proses tokenisasi suatu dokumen. Hal ini bertujuan agar
merupakan data teks berupa kalimat dari postingan beberapa pada saat tahap pembobotan kata, antara term dan dokumen
akun twitter seperti pada Tabel 3.1. Banyaknya data yang sesuai. Proses pembobotan kata dilakukan dengan
ditambang yaitu sebanyak ribuan tweet. Sebagian data tweet perhitungan TF-IDF. TF-IDF bertujuan memberikan
digunakan untuk training dan sisanya digunakan sebagai pembobotan pada suatu dokumen untuk menentuan frekuensi
kata pada dokumen yang disesuaikan dengan term yang
data testing. Kategori nilai sentimen berupa kalimat positif
sudah terpilih hingga menghasilkan data vektor berupa
dan negatif, diambil dengan perbandingan 2:3. Data disusun
matriks.
secara acak tanpa memperhatikan keterurutan dari tanggal,
akun, retweet ataupun yang lainnya. Data dibagi menjadi dua bagian, kelompok pertama membagi
80% data training dan data 20% testing, sedangkan untuk
Tabel 3.1. Sampel data tweet Berdasarkan Mention kelompok kedua membagi 60% data training dan 40% data
testing. Model dari data training dibangun menggunakan Angka yang hilang
metode ANN dengan melalui empat tahapan dan
menghasilkan bobot JST, sedangkan data testing digunakan Tanda baca yang hilang
sebagai sentimen aktual sebagai acuan pengujian Emoticon yang hilang
pembangunan model.
Crawling Data Twitter
Case-Folding
Data yang dibutuhkan dalam penelitian ini merupakan data
sekunder berupa tweet di twitter yang diperoleh dengan cara
crawling data twitter API. Untuk melakukan crawling data, Setelah penghapusan karakter web, data yang sudah
dilakukan registrasi terlebih dahulu agar mendapat kode dikumpulkan dalam bentuk format .csv, selanjutnya
akses di twitter API melalui situs dilakukan proses case-folding yaitu merubah huruf (A-Z)
https://dev.twitter.com/apps/new. Setelah kode didapatkan, pada kalimat menjadi huruf kecil semua. Tahap ini bertujuan
crawling data dapat dilakukan dengan menggunakan agar setiap kata dari semua dokumen sama dan tidak terjadi
software Netbeans sesuai dengan kata kunci yang sudah multi term pada saat tahap tokenisasi dilakukan.
dijelaskan sebelumnya untuk mendapatkan data tweet yang
diinginkan. saat melakukan crawling, pastikan internet aktif
pada komputer yang melakukan crawling. Karena crawling Penghapusan Stopwords
yang dilakukan menggunakan software Netbeans harus
dalam keadaan online.
Pelabelan dan Penghapusan Data Penghapusan stopwords merupakan penghapusan kosakata
yang tidak memiliki makna penting dalam pengkategorian
Data tweet yang sudah diperoleh selanjutnya disimpan dalam dokumen dan sering muncul dalam suatu kalimat seperti pada
bentuk .csv. Kemudian dilakukan pelabelan secara manual Tabel 3.3 berikut.
yang sudah dikonsultasi terlebih dahulu kepada ahli bahasa
dengan menunjukkan beberapa sampel. Data tweet dibedakan
ke dalam empat kategori yaitu tweet yang mengandung Kata penghubung
sentimen positif, negatif, netral, dan yang tidak termasuk
pada ketiganya (outlier). Tweet yang sudah mendapatkan Kata tanya
label diperiksa kembali sentimennya kepada ahli dalam
Waktu
bidang keagamaan. Selanjutnya, dilakukan penghapusan data
yang termasuk pada kategori netral dan outlier. Penghapusan Dan
data yang dilakukan dikarenakan tidak sesuai pada klasifikasi
sentimen yang akan diteliti dan dapat mengganggu hasil Apa
klasifikasi. senin
Pre-Processing Daripada
Pre-processing merupakan proses awal yang dilakukan pada Bagaimana
text mining sebelum melakukan pembobotan terhadap data
teks. Adapun prosesnya terdiri dari beberapa tahap berikut: Selasa

Convert data Dengan

Data yang tersimpan dalam bentuk format .xls diubah Mengapa


menjadi format .csv agar lebih mudah di proses dalam tahap Rabu
selanjutnya pada text mining.
Disebut
Cleansing
Dimana
Cleansing merupakan proses penghapusan semua karakter
web seperti html, www, http, dan karakter lainnya yang Kamis
dianggap tidak memiliki makna Di
Kapan
dan tidak berguna jika diikutkan pada pengklasifikasian Jumat
dokumen. Proses cleansing ini dilakukan karena terkadang
pada suatu tweet di twitter menyertakan alamat webnya. Ke
Penghapusan dibutuhkan agar proses klasifikasi tidak Siapa
terganggu. Pada tahap ini juga dilakukan tahap filtrasi data
dengan menghilangkan komponen-komponen seperti tanda Sabtu
baca, angka, dan emoticon yang tidak dibutuhkan
Kepada
(Mujilahwati, 2016). Adapun komponen- komponen yang
dihilangkan seperti pada Tabel 3.2.
Tabel 3.2. Komponen yang Dihapus
Minggu
Jika Seleksi Fitur
Seleksi Fitur merupakan pemilihan kosakata dari hasil
tokenisasi yang akan digunakan pada tahap klasifikasi.
Kosakata dipilih secara manual dan diambil kosakata penting
Januari untuk dijadikan data training dan testing pada tahap
klasifikasi.
Bagi
Pembobotan TF-IDF
Kalimat yang sudah difilter akan dipisah menjadi kata-
perkata atau beberapa token. Kemudian pembobotan TF-IDF
Februari dilakukan sebanyak kosakata yang dipilih dan diproses,
hingga masing-masing kosakata mempunyai bobot sendiri-
Sebagai sendiri. Penentuan bobot yang dikenakan per kosakata
dihitung berdasarkan Persamaan (2.1) dan Persamaan (2.2).
Hasil dari pembobotan kosa kata ini akan membentuk suatu
matriks seperti Tabel 3.4.
Maret Tabel 3.4. Ilustrasi Hasil Pembobotan TF-IDF
Seperti
Term
D1
April D2
walaupun ....
Dm
Tweet-1
Mei ........
Yang ........
........
.......
Juni Tweet-2
Yaitu ........
........
........
Juli ........
Yakni .....
........
........
Agustus ........
........
Tweet-n
Tokenisasi ........
........
Tahap tokenisasi dilakukan untuk membagi dan memisahkan ........
dokumen teks menjadi perkata atau token-token tertentu.
Contohnya seperti salah satu dari sampel tweet pada Tabel ........
3.1 dokumen pertama, yaitu “menuju persatuan umat yg
hakiki dengan khilafah insyaa allah allahu akbar” menjadi 11
token yang terdiri dari “menuju-persatuan-umat-yg-hakiki-
dengan-khilafah- insyaa-allah-allahu-akbar”. Klasifikasi Artificial Neural Network (ANN)
Hasil pembobotan yang sudah dalam bentuk matriks from left to right and then moving down to the next line. This
selanjutnya dilakukan klasifikasi dengan algoritma sederhana is the author sequence that will be used in future citations and
dari ANN berikut: by indexing services. Names should not be listed in columns
nor group by affiliation. Please keep your affiliations as
Melakukan inisialisasi pembobotan secara random atau acak succinct as possible (for example, do not differentiate among
departments of the same organization).
Menetapkan inisialisasi bobot dan jumlah hidden layer untuk 1) For papers with more than six authors: Add author
semua percobaan pencarian model terbaik. names horizontally, moving to a third row if needed for more
than 8 authors.
Melakukan perhitungan keluaran neuron dengan metode
feedforward. 2) For papers with less than six authors: To change the
default, adjust the template as follows.
a) Selection: Highlight all author and affiliation lines.
Menghitung kesalahan proses feedforward dengan fungsi b) Change number of columns: Select the Columns
aktivasi. Pada penelitian ini menggunakan fungsi aktivasi icon from the MS Word Standard toolbar and then select the
sigmoid biner. correct number of columns from the selection palette.
Menghitung perubahan bobot dan bias dengan metode c) Deletion: Delete the author and affiliation lines for
backpropogation. the extra authors.

Perhitungan kembali dengan nilai bobot dan bias baru B. Identify the Headings
Headings, or heads, are organizational devices that guide
Ulangi langkah diatas hingga proses komputasi the reader through your paper. There are two types:
menghasilkan error dibawah batas minimum yang component heads and text heads.
ditentukan.
Component heads identify the different components of
Pengujian Model your paper and are not topically subordinate to each other.
Uji coba dilakukan untuk mendapatkan model terbaik untuk Examples include Acknowledgments and References and, for
klasifikasi. Pengujian model dilakukan dengan melakukan uji these, the correct style to use is “Heading 5”. Use “figure
coba jumlah node pada hidden, dua hidden layer, dan uji coba caption” for your Figure captions, and “table head” for your
learning rate (0,1 – 0,5). Selain itu, pengujian dilakukan table title. Run-in heads, such as “Abstract”, will require you
dengan membagi data pada saat melakukan proses training to apply a style (in this case, italic) in addition to the style
dan testing. grup pertama membagi data menjadi 80% untuk provided by the drop down menu to differentiate the head
training dan 20% untuk testing, sedangkan grup kedua from the text.
membagi data menjadi 60% training dan 40% testing. Pada Text heads organize the topics on a relational, hierarchical
masing-masing grup pembagian data tersebut dilakukan basis. For example, the paper title is the primary text head
ketiga uji coba untuk mendapatkan model yang terbaik. because all subsequent material relates and elaborates on this
Model yang dipilih adalah model yang memiliki nilai akurasi one topic. If there are two or more sub-topics, the next level
yang paling tinggi. head (uppercase Roman numerals) should be used and,
Analisis dan Visualisasi. conversely, if there are not at least two sub-topics, then no
subheads should be introduced. Styles named “Heading 1”,
Setelah hasil dari proses klasifikasi menggunakan ANN “Heading 2”, “Heading 3”, and “Heading 4” are prescribed.
didapatkan, selanjutnya melakukan analisis dan visualisasi
dengan melakukan pembuatan wordcloud untuk mengetahui C. Figures and Tables
kosakata yang berpengaruh dengan frekuensi sesuai a) Positioning Figures and Tables: Place figures and
keinginan yang mau ditampilkan. Selain itu, analisis dan tables at the top and bottom of columns. Avoid placing them
visualisasi juga dilakukan dengan melihat keterhubungan in the middle of columns. Large figures and tables may span
antar kata dari pembuatan graf jaringan dengan menggunakan across both columns. Figure captions should be below the
aplikasi VOSviewer. figures; table heads should appear above the tables. Insert
V. USING THE TEMPLATE figures and tables after they are cited in the text. Use the
abbreviation “Fig. 1”, even at the beginning of a sentence.
After the text edit has been completed, the paper is ready
for the template. Duplicate the template file by using the Save TABLE I. TABLE TYPE STYLES
As command, and use the naming convention prescribed by
your conference for the name of your paper. In this newly Table Table Column Head
created file, highlight all of the contents and import your Head Table column subhead Subhead Subhead
prepared text file. You are now ready to style your paper; use copy More table copy a

the scroll down window on the left of the MS Word a.


Sample of a Table footnote. (Table footnote)
Formatting toolbar.
Fig. 1. Example of a figure caption. (figure caption)
A. Authors and Affiliations
The template is designed for, but not limited to, six Figure Labels: Use 8 point Times New Roman for Figure
authors. A minimum of one author is required for all labels. Use words rather than symbols or abbreviations when
conference articles. Author names should be listed starting writing Figure axis labels to avoid confusing the reader. As
an example, write the quantity “Magnetization”, or Capitalize only the first word in a paper title, except for
“Magnetization, M”, not just “M”. If including units in the proper nouns and element symbols.
label, present them within parentheses. Do not label axes only
with units. In the example, write “Magnetization (A/m)” or For papers published in translation journals, please give
“Magnetization {A[m(1)]}”, not just “A/m”. Do not label the English citation first, followed by the original foreign-
axes with a ratio of quantities and units. For example, write language citation [6].
“Temperature (K)”, not “Temperature/K”.
[1] G. Eason, B. Noble, and I. N. Sneddon, “On certain integrals of
ACKNOWLEDGMENT (Heading 5) Lipschitz-Hankel type involving products of Bessel functions,” Phil.
Trans. Roy. Soc. London, vol. A247, pp. 529–551, April 1955.
The preferred spelling of the word “acknowledgment” in (references)
America is without an “e” after the “g”. Avoid the stilted
[2] J. Clerk Maxwell, A Treatise on Electricity and Magnetism, 3rd ed.,
expression “one of us (R. B. G.) thanks ...”. Instead, try “R. vol. 2. Oxford: Clarendon, 1892, pp.68–73.
B. G. thanks...”. Put sponsor acknowledgments in the [3] I. S. Jacobs and C. P. Bean, “Fine particles, thin films and exchange
unnumbered footnote on the first page. anisotropy,” in Magnetism, vol. III, G. T. Rado and H. Suhl, Eds. New
York: Academic, 1963, pp. 271–350.
REFERENCES [4] K. Elissa, “Title of paper if known,” unpublished.
The template will number citations consecutively within [5] R. Nicole, “Title of paper with only first word capitalized,” J. Name
brackets [1]. The sentence punctuation follows the bracket Stand. Abbrev., in press.
[2]. Refer simply to the reference number, as in [3]—do not [6] Y. Yorozu, M. Hirano, K. Oka, and Y. Tagawa, “Electron spectroscopy
use “Ref. [3]” or “reference [3]” except at the beginning of a studies on magneto-optical media and plastic substrate interface,” IEEE
sentence: “Reference [3] was the first ...” Transl. J. Magn. Japan, vol. 2, pp. 740–741, August 1987 [Digests 9th
Annual Conf. Magnetics Japan, p. 301, 1982].
Number footnotes separately in superscripts. Place the [7] M. Young, The Technical Writer’s Handbook. Mill Valley, CA:
actual footnote at the bottom of the column in which it was University Science, 1989.
cited. Do not put footnotes in the abstract or reference list.
Use letters for table footnotes. IEEE conference templates contain guidance text for
Unless there are six authors or more give all authors’ composing and formatting conference papers. Please
names; do not use “et al.”. Papers that have not been ensure that all template text is removed from your
published, even if they have been submitted for publication, conference paper prior to submission to the
should be cited as “unpublished” [4]. Papers that have been conference. Failure to remove template text from
accepted for publication should be cited as “in press” [5]. your paper may result in your paper not being
published.

We suggest that you use a text box


to insert a graphic (which is ideally a
300 dpi TIFF or EPS file, with all fonts
embedded) because, in an MSW
document, this method is somewhat
more stable than directly inserting a
picture.
To have non-visible rules on your
frame, use the MSWord “Format” pull-
down menu, select Text Box > Colors
and Lines to choose No Fill and No
Line.

Anda mungkin juga menyukai