Anda di halaman 1dari 8

JURNAL ILMIAH ILMU AGAMA DAN ILMU SOSIAL BUDAYA

Identifikasi Hoax pada Media Sosial dengan


Pendekatan Machine Learning
Putu Kussa Laksana Utamaa
Fakultas Dharma Duta, IHDN Denpasar

Abstract The Hoax propagation on social media is a problem that has to be solved.
The main problem with the propagation of hoaxes on social media is that
they can go viral very quickly. There have been various approaches
developed to identify Hoax in the earlier stage. This study is conducted in
order to analyze the various approaches that have been developed by
many researchers in Hoax's identification domain. The result of literature
study from various scientific papers shows that Hoax identification on
social media is better if performed automatically using Machine Learning.
On the several datasets, they have successfully obtain best-case accuracy
of 75% -96%.

Keywords Hoax Identification, Classification, Machine Learning, Social Media

PENDAHULUAN
Media sosial telah alasan untuk tetap menjalin hubungan
bertransformasi menjadi salah satu pertemanan dan mengetahui apa yang
sarana utama untuk saling bertukar mereka kerjakan. Gambar 1 berikut
informasi dan berkomunikasi di dunia menunjukan data yang menjelaskan
maya. Menurut data dari portal statistik motif pengguna media sosial.
statista.com, jumlah pengguna media Data yang diperoleh pada
sosial di Indonesia hingga kuartal ke 3 Gambar 1 tersebut berdasarkan hasil
tahun 2017 mencapai 49% dari total survey terhadap 77.814 pengguna
populasi penduduk di Indonesia. Hal ini internet di seluruh dunia yang berusia
membuktikan bahwa banyak masyarakat 16-64 tahun. Selain alasan menjalin
Indonesia yang telah memanfaatkan pertemanan di media sosial, alasan lain
media sosial. Berdasarkan data yang yang paling sering menjadi motif di balik
bersumber dari situs GlobalWebIndex, penggunaan media sosial adalah untuk
hingga kuartal ke 3 tahun 2017, 42% tetap mengetahui perkembangan berita
pengguna media sosial di seluruh dunia terkini dan peristiwa-peristiwa terkini.
memanfaatkan media sosial dengan

a
kussa_laksana@ihdn.ac.id

69
WIDYA DUTA | VOL. 13, NO. 1 |2018
Hal ini ditunjukan dengan persentasenya Penyebaran hoax secara massif lewat
yang mencapai 41%. media sosial akan memberikan pengaruh
Penggunaan media sosial tidak buruk bagi pihak yang dirugikan oleh
hanya berdampak positif bagi keberadaan Hoax tersebut.
penggunanya. Selain dampak positif, ada Ada banyak contoh berita Hoax

Motives behind using social media

Motives

0 5 10 15 20 25 30 35 40 45

To meet new peoples


To search/find products to buy
To share my opinion
To share photos or videos with others
Because a lot of my friends are on them
General networking with other people
To find funny or entertaining contents
To fill up spare time
To stay up-to-date with the current news and events
To stay in touch with what friends are doing

Gambar 1. Motif yang melatar belakangi aktivitas bermedia sosial (Sumber:


GlobalWebIndex)
juga dampak negatif yang disebabkan yang beredar di media sosial. Salah satu
oleh penggunaan media sosial salah Hoax yang menjadi viral adalah berita
satunya adalah sebagai tempat tentang penembakan terhadap
penyebaran kabar bohong atau Hoax. penonton konser di Las Vegas pada
Hoax adalah suatu kepalsuan yang tahun 2017. Setelah peristiwa tersebut,
disamarkan seolah-olah itu adalah muncul konten-konten media sosial yang
kebenaran (MacDougall, 1958). Hoax mengklaim bahwa pelaku penembakan
juga dapat didefinisikan sebagai isu-isu tersebut adalah seorang muslim yang
terkini yang digunakan sebagai senjata bernama Samir Al-Hajeed. Berita
politik, kebenaran yang tidak relevan, tersebut menyebar dengan cepat,
atau kabar bohong yang disebarkan menjadi viral dan membentuk opini yang
secara sengaja (Berghel, 2017). Kabar- beraneka ragam di media sosial. Fakta
kabar bohong tersebut apabila tersebar yang sebenarnya adalah, gambar pelaku
secara luas akan mempengaruhi banyak yang beredar di media sosial sebenarnya
orang dan dapat menodai suatu citra dan adalah seorang komedian yang bernama
kredibiltas (Chen, dkk, 2014). Sam Hyde. Contoh Hoax lain adalah

70
WIDYA DUTA | VOL. 13, NO. 1 | 2018
pemberitaan bohong yang tersebar di
media sosial Facebook pada tahun 2016 Metode Berpikir Kritis
terkait dengan kampanye pemilihan Djiwandono (2017) dalam
presiden Amerika. Facebook mendapat tulisannya mengajukan pendekatan
kritikan karena membiarkan peredaran berpikir kritis dalam menganalisa konten
konten-konten Hoax yang bersumber Hoax dengan memperkenalkan
dari website yang kurang kredibel seperangkat standar intelektual
(Figueira, dkk, 2017). universal. Aspek-aspek dari standar
Untuk mencegah penyebaran intelektual universal tersebut meliputi
konten Hoax perlu dikembangkan suatu Clarity, Accuracy, Relevancy, Depth,
metode yang berfungsi untuk Breadth, dan Logic.
mengidentifikasi konten Hoax sedini 1) Clarity adalah aspek yang
mungkin sebelum konten tersebut mengutamakan klarifikasi atau
menjadi viral. Dengan melakukan pemeriksaan secara esensial
pencegahan sesegera mungkin maka pada sebuah informasi yang
dampak negatif yang ditimbulkan oleh bertujuan untuk menghindari
penyebaran Hoax tersebut bisa ambiguitas.
diminimalisir. Selain itu, penanggulangan 2) Accuracy mengacu pada sebuah
konten Hoax juga dapat menjaga spesifikasi informasi dimana hal
kredibilitas media sosial tempat dimana ini penting guna menghindari
Hoax tersebut disebarluaskan. Kajian ini multiinterpretasi.
bertujuan untuk mengulas dan 3) Relevancy adalah keterkaitan
menganalisis berbagai metode antara satu pernyataan dengan
identifikasi Hoax yang telah ada di dunia pernyataan lain dalam sebuah
akademik. Metode-metode tersebut diskursus.
perlu dianalisis lebih dalam, sehingga 4) Depth adalah elaborasi lebih jauh
berbagai kelebihan dan kekurangan yang tentang sebuah isu yang sedang
dimiliki oleh tiap-tiap metode dapat didiskusikan
diketahui. Hal ini sangat penting 5) Breadth adalah keikutsertaan
dilakukan sebelum mengaplikasikan pendapat yang lain dalam
metode tersebut langsung pada kasus memberi bobot pada sebuah isu.
nyata. 6) Logic mengacu pada rangkaian
cara berpikir dari awal hingga
PEMBAHASAN berakhirnya sebuah
Ada banyak metode untuk pemberitaan. Secara esensial,
mengetahui apakah suatu konten pada sebuah isu haruslah terhubung
media sosial terindikasi Hoax atau antara satu bagian dengan bagian
bukan. Metode-metode tersebut dapat yang lain.
dikelompokan menjadi 2 bagian yaitu Dengan menggunakan pendekatan
metode manual (non-komputer) dan berpikir kritis, siswa atau pengguna
metode berbasis komputer. Metode media sosial dilatih untuk tidak mudah
yang tergolong manual adalah metode percaya dengan berbagai bentuk konten
berpikir kritis, sedangkan yang termasuk yang disebarluaskan melalui media
metode berbasis komputer adalah sosial.
metode Machine learning.

71
WIDYA DUTA | VOL. 13, NO. 1 |2018
Metode berpikir kritis yang yang muncul dalam format
diajukan oleh Djiwandono (2017), seperti ini.
memiliki keunggulan yaitu pendekatan
kritis yang didasari oleh aspek-aspek Metode Machine learning
standar intelektual universal membantu Kelemahan-kelemahan yang
melatih daya kritis tiap-tiap individu yang dimiliki oleh metode manual,
menggunakan media sosial, sehingga mendorong para peneliti untuk
mereka tidak begitu saja membantu mengembangkan suatu metode yang
membuat viral konten-konten yang tidak bergantung 100% pada manusia.
belum tentu benar dan sumbernya tidak Metode yang dikembangkan
kredibel. Adapun kelemahan dari memanfaatkan komputer sebagai alat
metode berpikir kritis adalah proses bantu untuk menganalisa konten media
analisis nya yang masih mengandalkan sosial. Hal ini merupakan sebuah
manusia sebagai instrument utama. tantangan karena komputer hanya
Menggunakan manusia sebagai mengenali bahasa mesin, sedangkan
instrument analisis memiliki berbagai konten yang beredar di dunia media
kelemahan seperti: sosial menggunakan bahasa yang
1) Keterbatasan secara prikis. dimengerti manusia. Permasalahan
Kemampuan manusia dalam tersebut dapat diatasi dengan
menganalisis konten-konten mengkuantifikasi data. Data yang telah
media sosial terbatas secara terkuantifikasi selanjutnya dipisahkan,
kuantitas. Mengamati dan dikelompokan, dengan pendekatan
menganalisis konten media sosial Machine learning.
dalam jumlah banyak akan sangat Machine learning merupakan
menguras konsentrasi dan metode berbasis komputer dimana
berpotensi menurunkan kualitas komputer diberikan kemampuan untuk
analisis itu sendiri. belajar dengan bantuan data tanpa harus
2) Post-event-analysis. Analisis yang terprogram terlebih dahulu (Arthur,
dilakukan oleh manusia 1959). Jenis-jenis permasalahan yang
cenderung bersifat post-event- umumnya diselesaikan dengan
analysis, artinya analisis bisa pendekatan Machine learning adalah
dilakukan setelah konten-konten klasterisasi dan klasifikasi. Klasterisasi
Hoax tersebut muncul dan adalah aktivitas yang bertujuan
bahkan menjadi viral. mengelompokan data berdasarkan
3) Keterbatasan secara fisik. kedekatan fitur yang dimilikinya,
Konten-konten yang terindikasi sedangkan klasifikasi bertujuan untuk
Hoax kemunculannya tidak hanya memisahkan data menjadi kelas-kelas
sekali, untuk mengetahui sebuah tertentu. Perbedaan yang mendasar
konten terindikasi Hoax atau antara 2 buah permasalahan ini adalah,
bukan harus memperhatikan pada proses klasterisasi, data-data
konteks, dan rangkaian konten- dikelompokan tanpa pelabelan,
konten yang muncul dalam sedangkan klasifikasi mengelompokan
selang waktu tertentu. Manusia data-data menjadi label tertentu.
memiliki keterbatasan dalam hal Proses identifikasi konten Hoax
mengamati konten-konten Hoax pada media sosial tergolong ke dalam

72
WIDYA DUTA | VOL. 13, NO. 1 | 2018
permasalahan klasifikasi. Hal ini karena Purwarinti (2015) mengasilkan akurasi
sekumpulan konten Hoax akan diberi identifikasi Hoax sebesar 91.36% dengan
label sebagai “Hoax” sedangkan yang menggunakan algoritma Naïve Bayes.
tidak terindikasi akan diberi label sebagai Rajdev (2015) dalam penelitiannya
“Non-Hoax”. Klasifikasi yang diterapkan berhasil mengembangkan metode
dalam kasus identifikasi Hoax secara klasifikasi berbasis fitur dengan akurasi
garis besar, berdasarkan perkembangan yang mencapai 96,43% dan nilai f-
terkini di bidang Machine learning, measure sebesar 0,961. Purnomo, dkk
dibedakan menjadi 2 pendekatan yaitu (2017) dalam penelitiannya
klasifikasi dengan pre-processing dan mengembangkan metode klasifikasi
tanpa pre-processing. Klasifikasi tanpa stance classifier berbasis fitur dan
pre-processing mengalami berhasil meraih akurasi terbaik sebesar
perkembangan pesat beberapa tahun 95,95% dan nilai f-measure terbaik
belakangan ini seiring dengan sebesar 89,66%.
perkembangan perangkat keras Penelitian-penelitian klasifikasi
(hardware) komputer. berbasis fitur yang telah diielaskan
terbukti sangggup mengidentifikasi
Klasifikasi dengan Pre-Processing konten Hoax dengan nilai akurasi di atas
Ada banyak penelitian klasifikasi 90%. Namun metode klasifikasi tersebut
konten Hoax yang telah dikembangkan memiliki kelemahan yaitu harus melalui
dengan menggunakan metode klasifikasi tahap Pra-processing, dimana proses
dengan pre-processing seperti penelitian klasifikasi harus melalui semi otomatis.
yang dilakukan oleh Rasywir, Purwarianti Konten media sosial pada tahap pre-
(2015), Rajdev (2015), Purnomo, dkk processing harus dipecah-pecah per kata
(2017). Sebagian besar diagram alur atau frasa terlebih dahulu (tokenisasi)
kerja penelitian klasifikasi dengan pre- kemudian kata-kata yang berjenis tanda
processing berbentuk seperti Gambar 2 baca, sambung dihilangkan karena
berikut. berpotensi mengganggu proses

Tokenisasi

Hoax
Stop Word Klasifikasi
Removal
Non-Hoax
Stemming

Ekstraksi Fitur
Pra-Prosesing

Gambar 2. Diagram alur klasifikasi berbasis fitur


identifikasi. Tahap-tahap pra-processing
Metode klasifikasi berbasis fitur yang menghabiskan banyak waktu apabila
dikembangkan dalam penelitian- jumlah data yang sangat banyak dan
penelitian tersebut menghasilkan dalam berbagai bahasa.
akurasi yang baik. Klasifikasi konten Hoax
yang dikerjakan oleh Rasywir, dan
73
WIDYA DUTA | VOL. 13, NO. 1 |2018
Klasifikasi tanpa Pre-Processing penelitiannya mengimplementasikan
Pendekatan klasifikasi berbasis algoritma Deep Convolutional Neural
fitur memakan waktu yang lama dalam Network untuk melakukan analisis
tahap pra-processing, dan tidak sentiment pada media sosial twitter.
sepenuhnya dikerjakan secara otomatis Hasil yang diperoleh dalam penelitian
oleh komputer. Untuk mengatasi yang dilakukan oleh Severyn dan
permasalahan tersebut maka perlu Moschitti cukup baik dimana tingkat
dikembangkan suatu metode klasifikasi akurasi yang diperoleh sebesar 90,10%.
tanpa melalui tahap pra-processing dan You, dkk (2015) dalam penelitiannya
bahkan ekstraksi fitur terlebih dahulu. yang mengembangkan algoritma CNN
Metode klasifikasi tanpa fitur dapat menjadi Progressive CNN (PCNN) untuk
dikerjakan dengan menggunakan mengklasifikasi konten gambar pada
algoritma Deep learning dan varian- media sosial Twitter. Hasil yang
variannya. ditunjukan cukup baik dimana metode
Algoritma Deep learning yang dikembangkan mencapai nilai
menerima input berupa kata dan frasa akurasi paling baik sebesar 78,3% setelah
yang terdapat pada media sosial dan diuji melalui 5-Fold Cross-Validation.
melakukan proses klasifikasi secara Metode klasifikasi tanpa fitur
unsupervised. Implementasi algoritma menunjukan performa akurasi yang baik
Deep learning pada proses klasifikasi dalam mengidentifikasi konten media
Hoax memangkas waktu yang diperlukan sosial. Namun algoritma Deep learning
pada tahap pra-processing. Apabila dan variannya tersebut memiliki
dibandingkan dengan klasifikasi berbasis kelemahan yaitu membutuhkan sumber
fitur, metode klasifikasi tanpa fitur selain daya hardware komputer yang reliable.
memilki tahapan proses lebih singkat, Hal ini disebabkan karena algoritma
juga semakin mendekati 100% otomatis. Deep learning memiliki kompleksitas
Hal ini disebabkan karena pada tahap perhitungan yang bisa diselesaikan
pra-processing membutuhkan dengan cepat apabila didukung oleh
pengawasan oleh manusia, sehingga perangkat keras komputer yang
peran manusia dalam proses klasifikasi memadai.
secara keseluruhan masih ada.
Ada beberapa penelitian terkini PENUTUP
yang telah dikerjakan terkait dengan Metode identifikasi Hoax
indentifikasi Hoax atau berita palsu otomatis dengan pendekatan Machine
dengan menggunakan algoritma Deep learning memiliki banyak keunggulan
learning. Dos Santos, dan Gatti (2014) apabila dibandingkan dengan metode
dalam penelitiannya mengembangkan klasik yang masih mengandalkan
metode klasifikasi teks pada media sosial kemampuan analisis manusia. Beberapa
Twitter dengan menggunakan algoritma keunggulannya adalah mampu bekerja
Deep Convolutional Neural Networks dalam waktu yang lama dan mampu
(CNN). Hasil yang diperoleh melalui melakukan identifikasi pada jumlah data
implementasi algoritma CNN yang yang banyak. Proses identifikasi Hoax
digunakan oleh Dos Santos dan Gatti dengan pendekatan Machine learning
memberikan nilai akurasi terbaik 86,4%. dapat dikelompokan menjadi 2 bagian
Severyn dan Moschitti (2015) dalam yaitu pendekatan yang didahului oleh

74
WIDYA DUTA | VOL. 13, NO. 1 | 2018
pre-processing dan tanpa pre- Top 10 Reasons for Using Social Media
processing. https://blog.globalwebindex.net/chart-
Dari beberapa penelitian ilmiah of-the-day/social-media/,
yang telah dikaji dapat diketahui bahwa diakses 23 Februari 2018
pendekatan dengan pre-processing lebih MacDougall, Curtis D. (1958). Hoaxes.
unggul dari segi akurasi, akan tetapi Dover. p. 6.
proses identifikasi tidak bisa dilakukan H.Berghel, “Alt-News and Post-Truths in
secara otomatis sepenuhnya. Hal ini the “Fake News” Era”, IEEE
berarti manusia harus tetap terlibat Computer, vol. April, pp. 110-
dalam tahap pre-processing data, 114, 2017
bahkan terlibat juga dalam tahap Chen, Y.Y., Yong, S.-P., & Ishak, A. (2014):
pemberian label data. Kondisi ini Email Hoax Detection System
berbeda dengan pendekatan tanpa pre- Using Levenshtein Distance
processing, dimana data/konten media Method, Journal of Computers,
sosial bisa langsung ditokenisasi dan Vol. 2, No. 2, academy publisher
diproses tanpa perlu campur tangan Meltzer, L, 2017, “Las Vegas Shooting:
manusia lebih jauh, namun hal ini Hoaxes Spread on Social Media,
membutuhkan sumber daya perangkat Amplified by Facebook,
keras komputer yang reliable. Dari fakta Google”,
tersebut dapat disimpulkan juga bahwa https://www.cbsnews.com/am
pendekatan Machine learning yang p/news/ las-vegas-shooting-
melibatkan pre-processing unggul dari hoaxes –spread-on-social-
segi akurasi sedangkan pendekatan media-amplified-by-facebook-
Machine learning tanpa pre-processing google/
unggul dari proses otomatisasi. Di masa Djiwandono, Patrisius, (2017), “Teaching
yang akan datang perlu dilakukan suatu Students to Filter Out Hoax
penelitian lanjut yang berupaya untuk News Through Critical Thinking
meningkatkan performa Machine in Reading Comprehension”
learning dalam mengidentifikasi konten Samuel, Arthur (1959). "Some Studies in
Hoax di media sosial. Solusi yang ideal Machine learning Using the
adalah dengan mengoptimalkan Game of Checkers". IBM Journal
pendekatan Machine learning dengan of Research and Development.
mengembangkan algoritma Deep 3 (3).
learning yang mampu memperoleh Quanzeng You, Jiebo Luo, Hailin Jin,
akurasi tinggi. Jianchao Yang, (2015), “Robust
Image Sentiment Analysis Using
DAFTAR PUSTAKA Progressively Trained and
Penetration of leading social networks in Domain Transferred Deep
Indonesia as of 3rd quarter Networks”, Proceedings of the
2017, Twenty-Ninth AAAI Conference
Statista.com, on Artificial Intelligence.
https://www.statista.com/stati Severyn, A, Moschitti, A, (2015), “Twitter
stics/284437/indonesia-social- Sentiment Analysis with Deep
network-penetration/ Convolutional Neural
Networks”, SIGIR '15

75
WIDYA DUTA | VOL. 13, NO. 1 |2018
Proceedings of the 38th
International ACM SIGIR
Conference on Research and
Development in Information
Retrieval,Pages 959-962.
Dos Santos, C,N, Gatti, M, (2014), “Deep
Convolutional Neural Networks
for Sentiment Analysis of Short
Texts”, Proceedings of COLING
2014, the 25th International
Conference on Computational
Linguistics: Technical
Papers,pages 69–78.
Rasywir, E, Purwarianti, A, (2015),
“Eksperimen pada Sistem
Klasifikasi Berita Hoax
Berbahasa Indonesia Berbasis
Pembelajaran Mesin”, Jurnal
Cybermatika, Vol. 3 No. 2.
Purnomo, M, H, Sumpeno, S, Setiawan,
E, I, Purwitasari, D, (2017),
“Biomedical Engineering
Research in the Social Network
Analysis Era: Stance
Classification for Analysis of
Hoax Medical News in Social
Media”, Procedia Computer
Science 116 (2017) 3–9.

76
WIDYA DUTA | VOL. 13, NO. 1 | 2018

Anda mungkin juga menyukai