Anda di halaman 1dari 7

Rumor Deteksi Dengan Pemanfaatan Informasi Kredibilitas Pengguna,

Perhatian dan Multi-tugas Pembelajaran

Quanzhi Li, Qiong Zhang, Luo Si

Alibaba Group, AS

Bellevue, WA, USA

{Quanzhi.li, qz.zhang, luo.si}@alibaba-inc.com


Abstrak definisi untuk deteksi rumor. Dalam beberapa penelitian, deteksi rumor
didefinisikan sebagai menentukan apakah sebuah cerita atau posting
Dalam studi ini, kami mengusulkan pendekatan
secara online adalah rumor atau non-rumor (yaitu kisah nyata, sebuah
pembelajaran multi-tugas baru untuk tugas-tugas deteksi
artikel berita), dan tugas menentukan kebenaran yang dari rumor ( benar
rumor dan klasifikasi sikap. model jaringan saraf ini
salah
memiliki lapisan bersama dan dua lapisan tugas tertentu.
atau tidak diverifikasi) didefinisikan sebagai verifikasi rumor ( Zubiaga
Kami menggabungkan informasi kredibilitas pengguna
ke dalam lapisan deteksi rumor, dan kami juga
et al., 2016 ; Kochkina et al., 2018 ). Namun dalam tulisan ini, serta

menerapkan mekanisme perhatian dalam deteksi rumor di banyak penelitian sebelumnya ( Ma et al., 2016 ; Shu et al, 2017 ),
deteksi rumor didefinisikan sebagai menentukan nilai kebenaran
proses. Itu dihadiri rumor. Ini berarti itu adalah sama dengan
Informasi meliputi tidak hanya negara-negara yang
tersembunyi di lapisan deteksi rumor, tetapi juga verifikasi rumor didefinisikan dalam beberapa penelitian lain.
negara-negara tersembunyi dari lapisan deteksi sikap.
deteksi rumor dan verifikasi rumor akan digunakan secara
Percobaan pada dua dataset menunjukkan bahwa
bergantian dalam makalah ini.
kami Model yang diusulkan
Zubiaga et al. ( 2018a ) Menganggap rumor
melebihi negara-of-the-art deteksi rumor pendekatan.
proses penyelesaian sebagai pipa yang melibatkan empat
sub-tugas: (1) identifikasi rumor, menentukan apakah klaim
bernilai memverifikasi daripada ekspresi pendapat, yaitu
1 pengantar
memeriksa klaim adalah rumor atau non-rumor; (2) pelacakan
platform media sosial, seperti Twitter, Reddit dan Facebook, tidak rumor, mengumpulkan opini yang objektif tentang rumor
selalu menimbulkan informasi yang otentik. Rumor kadang-kadang seperti yang diungkapkan; (3) klasifikasi sikap, menentukan
dapat menyebar dengan cepat di atas platform ini, dan mereka sikap pengguna terhadap kebenaran rumor, dan (4) verifikasi
biasanya menyebar rasa takut atau benci. Oleh karena itu, deteksi rumor, langkah utama dimana nilai kebenaran rumor tersebut
rumor dan verifikasi telah memperoleh besar diperkirakan. Penelitian ini melibatkan
bunga
baru saja. platform media sosial dan otoritas pemerintah juga yang terakhir dua tugas: sikap
mengambil upaya-upaya besar untuk mengalahkan dampak klasifikasi (deteksi) dan verifikasi rumor (yaitu deteksi
negatif dari rumor. rumor). Dan makalah ini terutama berfokus pada langkah
Rumor Deteksi: Definisi Rumor bervariasi dari publikasi yang terakhir, deteksi rumor.
berbeda. Kurangnya konsistensi membuat sulit untuk melakukan Pernyataan masalah: Sekarang kita secara formal mendefinisikan
perbandingan head-tohead antara metode yang ada. Dalam tulisan masalah deteksi rumor: Sebuah cerita x didefinisikan sebagai satu set n potongan
ini, desas-desus didefinisikan sebagai pernyataan yang pesan terkait
kebenarannya nilai adalah benar, belum diverifikasi atau M = {m 1, m 2, ..., m n}. m 1 adalah sumber pesan (posting) yang
Salah diprakarsai rantai pesan, yang bisa menjadi struktur pohon
memiliki beberapa cabang. Untuk setiap pesan m saya, memiliki
( Qazvinian et al., 2011 ). Ketika nilai kebenaran rumor adalah Salah, beberapa
penelitian menyebutnya “ desas-desus palsu” atau “Berita palsu”. Namun, atribut yang mewakili isinya, seperti teks dan gambar. Setiap
banyak studi sebelumnya memberikan “ berita palsu ”A ketat definisi: pesan juga berhubungan dengan pengguna yang diposting.
berita palsu adalah sebuah artikel berita yang diterbitkan oleh outlet Pengguna juga memiliki satu set atribut, termasuk nama,
berita deskripsi, gambar avatar, posting terakhir, dll Tugas deteksi
yang sengaja dan rumor tersebut kemudian didefinisikan sebagai berikut:
diverifikasi palsu ( Shu et al., 2017 ; Zubiaga et al., 2018 ). Fokus Mengingat cerita x dengan set pesannya M dan set pengguna U,
dari penelitian ini adalah rumor di media sosial, berita tidak rumor
palsu. Ada juga yang berbeda

1173

Prosiding Pertemuan Tahunan ke-57 Asosiasi untuk Komputasi Linguistik, halaman 1173-1179
Florence, Italia 28 Juli-Agustus 2 2019. c © 2019 Asosiasi untuk Komputasi Linguistik
deteksi tugas bertujuan untuk menentukan apakah cerita ini benar salah atau negara tersembunyi di lapisan deteksi rumor, tetapi juga
tidak diverifikasi ( atau hanya benar atau negara-negara yang tersembunyi dari lapisan deteksi sikap. Dalam
Salah untuk dataset memiliki hanya dua label). Definisi ini cabang percakapan, beberapa posting, terutama yang dengan sikap
merumuskan tugas deteksi rumor sebagai tugas klasifikasi yang kuat, akan lebih penting daripada yang lain dalam menentukan

kebenaran. Definisi ini sama dengan definisi yang digunakan kebenaran rumor. Tidak ada penelitian sebelumnya telah

dalam banyak penelitian sebelumnya ( Shu et al, 2017 ; Ma et dieksploitasi ini pada deteksi rumor.

al., 2016 ). Ada


Meskipun deteksi sikap termasuk dalam jaringan
empat kategori sikap:
pembelajaran multi-tugas, dalam penelitian ini, kita fokus
pendukung ( S), menyangkal ( D), query ( Q) dan
pada tugas utama, deteksi rumor, sehingga percobaan
komentar ( C), yaitu SDQC. Kebenaran rumor memiliki tiga
dilakukan untuk mengevaluasi kinerja
nilai: benar salah, atau tidak diverifikasi.
dari isu deteksi. Kami
Untuk kedua deteksi sikap dan deteksi rumor, pendekatan
Percobaan menunjukkan bahwa pendekatan kami melebihi
tradisional digunakan algoritma pembelajaran terawasi
negara-of-the-art metode.
menggabungkan berbagai fitur yang dihasilkan dari isi posting,
profil pengguna, dan pola difusi ( Castillo et al., 2011 ; Kwon et
al., 2013 ; Liu et al., 2015 ; Ma et al., 2015 ; Zhao et al., 2015 ). 2 Studi terkait
Studi terbaru menunjukkan bahwa berurutan pendekatan
Banyak algoritma yang ada ( Liu et al., 2015 ; Wu et al., 2015 ; Yang
sensitif terhadap waktu memiliki manfaat kedua tugas deteksi
et al., 2012 ) Untuk membongkar rumor mengikuti karya Castillo
dan deteksi sikap rumor ( Ma et al., 2016 ; Kwon et al., 2017 ; Ma
et al. ( 2011 ). Mereka mempelajari kredibilitas informasi dan
et al., 2017 ; Ma et al., 2018a ; Kochkina et al., 2018 ). Dalam
berbagai fitur. klasifikasi sikap juga merupakan daerah
studi ini, kami juga menggunakan pendekatan klasifikasi
penelitian aktif yang telah dipelajari dalam pekerjaan
berurutan pada dua tugas tersebut. Sebuah rumor terdiri dari
sebelumnya ( Ranade et al., 2013 ; Chuang dan Hsieh, 2015 ; Lukasik
pasca sumber yang membuat klaim, dan satu set balasan,
langsung atau tidak langsung terhadap sumber posting. set ini et al., 2016 ; Zubiaga et al., 2016 ;

posting mungkin memiliki beberapa cabang percakapan.


Model kami mengeksploitasi informasi struktural percakapan Kochkina et al., 2017 ).
ini. Beberapa Studi memiliki saraf dipekerjakan
jaringan verifikasi rumor ( Ma et al., 2016 ;
Kochkina et al., 2017 ; Ma et al., 2017 ), Dan mereka
terutama berfokus pada analisis struktur propagasi
Multi-tugas belajar ( Caruana, 1998 ; Liu et al., 2016 ) Telah informasi. pembelajaran multi-tugas telah digunakan dalam
diterapkan di banyak tugas NLP. Dalam studi ini, kita menggunakan berbagai tugas NLP, termasuk verifikasi rumor ( Collobert et
Panjang-Short Term Memory (LSTM) lapisan bersama untuk belajar al., 2011 ; Aguilar et al., 2017 ; Lan et al., 2017 ; Ma et al.,
satu set umum fitur yang relevan untuk kedua tugas, sementara tugas 2018a ;
masing-masing juga dapat mempelajari fitur-fitur spesifik tugas mereka Kochkina et al., 2018 ). Kochkina et al. ( 2018 )
melalui lapisan khusus mereka.
Mengusulkan metode multi-tugas tanpa tugas
Dibandingkan dengan sebelumnya
lapisan khusus untuk verifikasi rumor. MT-ES adalah pendekatan
studi ( Ma et al., 2018 ; Kochkina et al., 2018 ) Yang juga
multi-task menggunakan Gated berulang Unit (GRU) ( Cho et al., 2014 )
menggunakan pembelajaran multi-task untuk deteksi sikap
Dengan lapisan tugas tertentu untuk setiap tugas ( Ma et al., 2018a ).
dan verifikasi rumor, utama
MT-ES tidak memiliki mekanisme perhatian, dan tidak menggunakan
perbedaan antara kita dan mereka adalah: 1. Kami menggabungkan
informasi pengguna. Ma et al. ( 2018b ) Mengusulkan model
fitur yang menggambarkan pengguna informasi kredibilitas ke dalam
berdasarkan
lapisan deteksi rumor. Informasi kredibilitas pengguna, yang berasal
dari profil pengguna dalam penelitian ini, adalah penting dalam
Pohon-terstruktur saraf rekursif
tugas deteksi rumor, seperti yang sudah terbukti di Liu et al. ( 2015 )
jaringan.
Dan Castillo et al. ( 2011 ). Tapi studi terbaru menggunakan
klasifikasi berurutan belum membuat penggunaan itu. Untuk 3 Model yang Diusulkan
pengetahuan kita, ini adalah pertama
3.1 Multi-tugas Struktur Jaringan

belajar bahwa menggabungkan pemakai Gambar 1 menyajikan struktur tingkat tinggi dari pendekatan
Informasi kredibilitas / profil di jaringan saraf untuk pembelajaran multi-tugas kita yang diusulkan. Lapisan tengah adalah
klasifikasi berurutan. 2. Kami menerapkan lapisan bersama, bersama dengan dua tugas. lapisan ini
Mekanisme perhatian dalam proses deteksi rumor. Dan adalah untuk mengekstrak umum
perhatian tidak hanya mencakup pola antara dua tugas ini, melalui bersama

1174
parameter. Lapisan atas adalah untuk deteksi sikap, dan deteksi. Ini dua lapisan akan menangkap
lapisan bawah adalah untuk rumor tugas

Gambar 1. Struktur tingkat tinggi dari pendekatan kami yang diusulkan. Lapisan LSTM bersama adalah di tengah (dalam merah
dot-line persegi panjang). Lapisan atas adalah lapisan khusus deteksi sikap, dan lapisan bawah adalah untuk rumor
tugas verifikasi.

fitur khusus. Dalam gambar ini, kita asumsikan tulisan yang gabungan dari dua jenis fitur: tweet embedding (TE) dan fitur
tweets, dan akan menggunakan tweet sebagai contoh dalam menciak embedding (FE). FE yang dihasilkan menggunakan
bagian berikut. Input ke dua lapisan tugas tertentu adalah klaim daftar yang sama dari fitur yang dijelaskan dalam ( Kochkina
(rumor, benang) cabang. Ambil jalan propagasi rumor pada et al., 2017 ). Beberapa contoh fitur FE puas panjang,
Gambar 2 sebagai contoh, rumor ini memiliki empat cabang, dan kehadiran URL, dan jika itu adalah tweet sumber atau tidak.
setiap cabang memiliki urutan input [ x 1, x 2, ..., x n], dimasukkan ke
dalam dua lapisan tugas tertentu. x 1 adalah tweet sumber
(posting), dan x n adalah tweet terakhir di cabang.
Pada setiap langkah waktu saya, negara disembunyikan h si diumpankan

ke lapisan tersembunyi sepenuhnya terhubung, dan lapisan Softmax

digunakan untuk memprediksi jenis sikap (misalnya S,


Tweet Embedding (TE): Kita menghasilkan tweet
D, Q, C). Negara-negara yang tersembunyi juga digunakan dalam
embedding melalui jaringan LSTM berbasis perhatian-.
perhatian langkah tugas verifikasi rumor.
The embeddings kata dibangun
dari 200 juta tweet menggunakan model 3.3 The Rumor Verifikasi Lapisan
word2vec ( Mikolov et al., 2013 ; Li et al., 2017 ).
Semakin rendah lapisan Gambar 1 menunjukkan struktur dari
proses verifikasi rumor. Pada setiap langkah, input x saya diwakili
oleh dua vektor, menciak embedding
(TE) dan user informasi
embedding (UE). UE adalah untuk mewakili informasi
kredibilitas pengguna.

Kredibilitas pengguna Informasi: Banyak


penelitian sebelumnya telah menunjukkan bahwa informasi kredibilitas
pengguna sangat penting di rumor
Gambar 2: Contoh propagasi rumor. Ada
empat cabang di rumor ini.
verifikasi ( Li et al., 2016 ; Liu et al., 2015 ). Hal ini terutama
terjadi ketika rumor tersebut dibantah atau didukung oleh
3.2 The Sikap Deteksi Lapisan pengguna yang kredibel, seperti pengguna diverifikasi, agen
berita, agen pemerintah, atau profesional di bidang topik
Seperti ditunjukkan dalam Gambar 1, lapisan deteksi sikap
rumor. Tapi studi terbaru menggunakan klasifikasi berurutan
menggunakan model LSTM standar. input x saya adalah
dan

1175
jaringan saraf belum membuat penggunaan informasi ini. 1972 rumor. Tapi tweet-nya tidak memiliki label sikap. Untuk
Kita mengadakan hipotesa bahwa ini mendapatkan label sikap mereka untuk belajar multi-tugas,
Informasi akan meningkatkan kinerja verifikasi rumor. Dalam berikut ( Kochkina et al., 2018 ), Kami juga menggunakan sikap
studi ini, kita memperoleh informasi kredibilitas dari profil algoritma deteksi yang diuraikan dalam ( Kochkina et al., 2017 )
pengguna. Kami menggunakan fitur yang dijelaskan dalam ( Liu untuk

et al., 2015 ) Untuk memperoleh informasi ini. Beberapa otomatis keterangan ini tweet. Itu
contoh fitur yang: diverifikasi account, jika profil meliputi RumorEval dataset diberikan dengan pelatihan /
pengembangan / pengujian split. Untuk PHEME dataset, kita
lokasi, jika profil memiliki deskripsi, dll informasi ini diproses
menggunakan salib validasi, sama seperti ( Kochkina et al.,
dan digabungkan bersama-sama sebagai embedding UE, dan
2018 ). Akurasi dan Makro F1 digunakan sebagai metrik
kemudian UE concatenated dengan TE sebagai masukan.
evaluasi.
Mengenai penjelasan sikap dari kumpulan data
RumorEval ( Derczynski et al., 2017 ), Sebagai kertas tugas
berbasis perhatian LSTM: Dalam cabang percakapan, tulisan deskripsi sudah menunjukkan: keseluruhan antar-Annotator
yang berbeda akan memiliki dampak yang berbeda pada kebenaran tingkat kesepakatan
rumor. Misalnya, tweets dengan kuat dukung atau menyangkal sikap 63,7% menunjukkan tugas untuk menjadi menantang, dan lebih

harus memiliki dampak yang lebih untuk memprediksi rumor mudah untuk tweets sumber (81,1%) dibandingkan membalas tweet

kebenaran. Dalam rangka untuk lebih mengeksploitasi informasi (62,2%). Ini berarti bahwa ada banyak label sikap tidak konsisten
bertentangan atau. Ketika kami menganalisis data training set, kami
sikap, kita secara eksplisit termasuk negara-negara yang tersembunyi
menemukan banyak contoh seperti itu. Untuk membuat label lebih
dari lapisan sikap dalam perhitungan perhatian. Selain tweet dengan
konsisten, kami menjalankan analisis untuk mencari tulisan yang
sikap yang kuat, kita juga harus lebih memperhatikan para pengguna
pada dasarnya sama atau sangat mirip, tapi label mereka berbeda.
kredibel. Hal ini dapat dilakukan melalui perhatian pada lapisan
Kami kemudian menandai posting ini, dan menggunakan label yang
rumor-spesifik, karena telah dikodekan informasi kredibilitas
sama, yang diberi label pada sebagian besar posting ini, mereka
pengguna melalui UE embedding. Oleh karena itu, kami
selama pelatihan. Kesamaan antara dua posting dihitung dengan
menggunakan LSTM berbasis perhatian-untuk memberikan perhatian
cosinus ukuran kesamaan. Ambang kesamaan untuk
lebih pada tweet penting. Pada setiap langkah saya, negara
dipertimbangkan sebagai posting serupa secara empiris ditetapkan
tersembunyi dari lapisan atas dan negara dari lapisan bawah sebagai 0,75.
benar-benar concatenated dan dihadiri bersama-sama. Dengan kata
lain, mereka menggunakan berat perhatian yang sama, • saya.

Metode dibandingkan: Kami membandingkan model yang


diusulkan kami dengan pendekatan berikut, termasuk
negara-of-the-art algoritma:
Vektor dalam urutan h ri dan h si dimasukkan ke fungsi dipelajari ah ri, h
Mayoritas suara: ini adalah dasar yang kuat yang
Si) untuk menghasilkan vektor probabilitas Sebuah saya
menghasilkan akurasi tinggi karena ketidakseimbangan kelas
. vektor R kemudian
dalam tugas klasifikasi kebenaran.
dihitung sebagai rata-rata tertimbang ( h ri, h Si),
NileTMRG: ini adalah yang terbaik sistem prediksi kebenaran
dengan bobot yang diberikan oleh Sebuah saya:
dari SemEval-2017 Tugas 8 ( Enayet dan El-Beltagy, 2017 ). Hal ini

• (1) didasarkan pada SVM linear menggunakan kantong-of-kata


representasi dari tweet bersambung dengan fitur yang dipilih.
Negara disembunyikan R dimasukkan ke lapisan terhubung
sepenuhnya, dan Softmax digunakan untuk prediksi kebenaran. BranchLSTM: metode yang didasarkan pada lapisan LSTM
diikuti oleh beberapa lapisan padat ReLU dan lapisan Softmax ( Zubiaga
et al., 2018b ).
4 Percobaan dan Hasil MTL2: metode multi-tugas tanpa lapisan tugas tertentu ( Kochkina
et al., 2018 ).
dataset: Dua dataset rumor tersedia untuk umum
digunakan: RumorEval ( Derczynski et al., 2017 ) Dan
metode Akurasi F1 Makro
PHEME ( Zubiaga et al., 2016 ; Zubiaga et al., 2017 ).
Mayoritas (False) 0,438 0,304
RumorEval dirilis sebagai bagian dari SemEval-2017 Tugas
NileTMRG 0,57 0,539
8 kompetisi ( Derczynski et al., 2017 ). Ini berisi 325 rumor
(4017 cabang) dari Twitter. Setiap tweet yang juga diberi BranchLSTM 0,5 0,491

label dengan sikap. The PHEME dataset memiliki MTL2 0,571 0,558

Model yang diusulkan 0,638 0,606

1176
Tabel 1: hasil verifikasi Rumor tentang RumorEval tugas verifikasi, 2. menggunakan mekanisme perhatian lebih
memperhatikan tweets penting, dan 3. mengintegrasikan
Ma et al. ( 2018a ) Mengusulkan multi-task
informasi sikap ke dalam perhitungan perhatian.
pendekatan menggunakan GRU, dengan lapisan tugas tertentu untuk
setiap tugas. Ia tidak memiliki mekanisme perhatian, dan melakukan
tidak menggunakan
pemakai informasi. Kami
pelaksanaan pendekatan mereka tidak mencapai kinerja yang 5. Kesimpulan

dilaporkan dalam makalah mereka menggunakan set data yang


Kami mengusulkan pendekatan pembelajaran multi-tugas untuk
mereka gunakan, jadi kami tidak membandingkan metode kami
tugas-tugas deteksi dan klasifikasi sikap rumor. Model ini
dengan mereka di sini. Ma et al. ( 2018b ) Mengusulkan model
menggabungkan pengguna informasi kredibilitas ke dalam lapisan
berdasarkan jaringan saraf rekursif pohon-terstruktur. Kami tidak
deteksi rumor, dan menggunakan mekanisme perhatian dalam
menyertakan model ini dalam percobaan kami, karena
menggunakan jaringan rekursif dan ia melakukan tidak baik pada proses deteksi rumor. Percobaan pada dua dataset menunjukkan

dataset tanpa jalur propagasi panjang, yang merupakan kasus untuk bahwa melebihi model yang diusulkan kami deteksi

dataset kami. negara-ofthe-art rumor pendekatan.

Pengaturan eksperimental: Model kami dilatih untuk Referensi


meminimalkan kesalahan kuadrat antara distribusi probabilitas
Gustavo Aguilar, Suraj Maharjan, Pastor Adrian
dari prediksi dan kebenaran tanah, sama seperti ( Ma et al.,
L'opez Monroy, dan Thamar Solorio. 2017. Pendekatan
2018a ). Stochastic gradien keturunan, beringsut mini-batch,
multi-tugas bernama pengakuan entitas data media sosial. Dalam
pembaruan AdaDelta, back-propagasi dan putus sekolah yang Prosiding Lokakarya 3 pada Bising Text User-dihasilkan, halaman
digunakan dalam proses pelatihan. Ukuran TE adalah 148-153.

300. Selama pelatihan, untuk setiap cabang, tugas sikap pertama


Carlos Castillo, M. Mendoza, dan B. Poblete.
dijalankan, diikuti oleh tugas verifikasi rumor, agar tugas verifikasi kredibilitas informasi di twitter. WWW 2011.
untuk memanfaatkan negara tersembunyi dari lapisan deteksi sikap
Kaya Caruana. 1998. Multitask belajar. dalam Belajar
pada langkah perhatiannya. Zero-padding dan masker yang
untuk mempelajari. Springer, 95-133.
digunakan untuk menangani panjang yang bervariasi dari cabang
masukan; mereka juga digunakan di ( Kochkina et al., 2017 ; Ma et Kyunghyun Cho, Bart van Merriënboer, Dzmitry
Bahdanau, dan Yoshua Bengio. 2014. Pada sifat dari mesin
al., 2018a ). kebenaran akhir Sebuah rumor ini didasarkan pada hasil
terjemahan saraf: Encoderdecoder
voting dari semua cabang-cabangnya.
pendekatan. arXiv preprint
arXiv: 1409.1259 (2014).

Ronan Collobert, Jason Weston, Leon Bottou,


Michael Karlen, Koray Kavukcuoglu, dan Pavel Kuksa.
metode Akurasi F1 Makro
pemrosesan bahasa alami (hampir) dari awal. J. Mach. Belajar.
Mayoritas (True) 0,511 0,226
Res, 12:. 2493-2537, 2011. Ju-han Chuang dan Shukai Hsieh.
NileTMRG 0,438 0,339 Pendirian
BranchLSTM 0,454 0,336 klasifikasi pada komentar posting. Dalam Prosiding 29 th Pacific
MTL2 0,441 0,376 Asia Konferensi Bahasa, Informasi dan Komputasi. 2015
Model yang diusulkan 0,483 0,418

Tabel 2: hasil verifikasi Rumor tentang PHEME dataset Leon Derczynski, Kalina Bontcheva, Maria Liakata,
Rob Procter, Geraldine Wong Sak Hoi, dan Arkaitz Zubiaga.
hasil: Tabel 1 menunjukkan hasil pada RumorEval dataset, 2017. Semeval-2017 tugas 8: Rumoureval: Menentukan rumor
dan Tabel 2 adalah untuk dataset PHEME. Kita bisa melihat kebenaran dan dukungan untuk rumor. Dalam Prosiding
bahwa metode kami yang diusulkan melebihi pendekatan lain Lokakarya Internasional ke-11 di Semantic Evaluasi (SemEval-
pada kedua dataset.
2017), halaman 69-76.
Dalam kedua kasus, penampilan
peningkatan signifikan secara statistik pada tingkat p = 0,01 untuk Omar Enayet dan Samhaa R El-Beltagy. 2017.
akurasi dan F1, menggunakan Niletmrg di semeval-2017 tugas 8: Menentukan rumor dan
t-test ( Beras 2006 ). kebenaran dukungan untuk rumor di twitter. SemEval-2017.
Dibandingkan dengan model multi-tugas lain, model kami
memiliki tiga fitur utama: 1. menggabungkan informasi Genevieve Gorrell, Kalina Bontcheva, leon
kredibilitas pengguna dalam rumor Derczynski, Elena Kochkina, Maria Liakata, dan

1177
Arkaitz Zubiaga, RumourEval 2019: Menentukan Rumor kejujuran Cha. 2016. Mendeteksi desas-desus dari mikroblog dengan
dan Dukungan untuk Rumor. SemEval 2019 jaringan saraf berulang. Dalam Prosiding IJCAI.

Gupta, H. Lamba, P. Kumaraguru, dan A. Joshi. Jing Ma, Wei Gao, Kam-Fai Wong, 2017, Deteksi
Memalsukan berpasir: karakteristik dan mengidentifikasi gambar rumor di posting microblog menggunakan struktur propagasi melalui
palsu di twitter selama badai pasir. WWW 2013 pembelajaran kernel, ACL 2017

Jing Ma, Wei Gao, Kam-Fai Wong, Mendeteksi Rumor dan


Elena Kochkina, Maria Liakata, Isabelle Augenstein, Sikap Bersama dengan Neural Multi-tugas Learning, WWW 2018
2017, Turing di SemEval-2017 Tugas 8: Pendekatan Sequential
ke Rumor Stance Klasifikasi dengan Cabang-LSTM, SemEval
Jing Ma, Wei Gao, Kam-Fai Wong, Deteksi Rumor
2017
di Twitter dengan pohon-terstruktur Rekursif Neural Networks,
Elena Kochkina, Maria Liakata, Arkaitz Zubiaga, All ACL 2018
dalam-satu: Multi-tugas Pembelajaran untuk Rumor
M. Mendoza, B. Poblete, dan C. Castillo. Twitter di bawah krisis: Bisakah
Verifikasi, coling 2018
kita percaya apa yang kita rt? Dalam Proc. Lokakarya pertama di
Sejeong Kwon, Meeyoung Cha, Kyomin Jung, Wei Social Media Analytics 2010.
Chen, dan Yajun Wang. 2013. Tokoh fitur propagasi rumor di
Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg
media sosial secara online. ICDM.
Corrado, dan Jeffrey Dean. didistribusikan

Representasi Kata-kata dan Frase dan Compositionality mereka.


Man Lan, Jianxiang Wang, Yuanbin Wu, Zheng-Yu Dalam Prosiding NIPS, 2013.
Niu, dan Haifeng Wang. 2017. berbasis perhatian Multi-tugas
Saif M Mohammad, Svetlana Kiritchenko, Parinaz
jaringan saraf untuk implisit
Sobhani, Xiaodan Zhu, dan Colin Cherry. 2016. Semeval-2016
ceramah hubungan perwakilan dan
tugas 6: Mendeteksi sikap dalam tweets. SemEval 2016.
identifikasi. Dalam Prosiding 2017

Konferensi Metode Empiris di Alam


K. Popat, S. Mukherjee, A. Yates, G. Weikum: DECLARE:
Bahasa Pengolahan, halaman 1299-1308.
membongkar Palsu Berita dan Klaim Palsu menggunakan
Quanzhi Li, Xiaomo Liu, Rui Fang, Armineh Bukti-Aware Jauh Learning, di
Nourbakhsh, Sameena Shah, 2016, Perilaku Pengguna di Berita Prosiding EMNLP, 2018.
baik Rumor: Studi Kasus Twitter. The 10th International AAAI
V. Qazvinian, E. Rosengren, DR Radev, dan Q. Mei. Rumor
Konferensi Web dan Media Sosial (ICWSM 2016)
mengatakan: Mengidentifikasi informasi yang salah di mikroblog.
EMNLP 2011.
Quanzhi Li, Sameena Shah, Xiaomo Liu, Armineh
Sarvesh Ranade, Rajeev Sangal, dan Radhika
Nourbakhsh 2017, Data Set: Word Embeddings Belajar dari
Mamidi. 2013. Klasifikasi Sikap dalam perdebatan secara online
Tweet dan Data General, The 11th International AAAI Konferensi
dengan mengakui niat pengguna. SIGDIAL
Web dan Media Sosial (ICWSM 2017).
2013.

John A. Rice. 2006. Statistik Matematika dan Data


Pengfei Liu, Xipeng Qiu, dan Xuanjing Huang. 2016.
Analisis, Edisi Ketiga, Duxbury Lanjutan Kai Shu, Amy Sliva,
jaringan saraf berulang untuk klasifikasi teks dengan
pembelajaran multi-task. IJCAI 2016 Suhang Wang, Jiliang Tang, dan
Huan Liu. deteksi berita 2017. palsu di media sosial: Sebuah
Xiaomo Liu, Armineh Nourbakhsh, Quanzhi Li, Rui perspektif data mining. SIGKDD Explorations Terakhir
Fang, Sameena Shah, 2015, Real-time Rumor
Membongkar di Twitter, CIKM 2015. K. Wu, S. Yang, dan KQ Zhu. desas-desus palsu deteksi pada weibo
Michal Lukasik, PK Srijith, Duy Vu, Kalina Sina oleh struktur propagasi. IEEE ICDE 2015.
Bontcheva, Arkaitz Zubiaga, dan Trevor Cohn.
2016. Hawkes proses untuk waktu kontinu klasifikasi berurutan: Fan Yang, Yang Liu, Xiaohui Yu, dan Min Yang.
aplikasi untuk klasifikasi sikap rumor di twitter. ACL 2016 2012. Otomatis deteksi rumor di weibo Sina. Lokakarya SIGKDD
ACM pada Data Mining Semantik.
Jing Ma, Wei Gao, Zhongyu Wei, Yueming Lu, dan
Kam-Fai Wong. 2015. Deteksi Rumor Menggunakan Time Series Zhe Zhao, Paul Resnick, dan Qiaozhu Mei. 2015.
of Konteks Sosial informasi tentang Bertanya Minds: Deteksi Dini Rumor di Social Media dari Kirim
Microblogging Website. Dalam Prosiding CIKM. Tulisan. WWW 2015
Jing Ma, Wei Gao, Prasenjit Mitra, Sejeong Kwon, Arkaitz Zubiaga, Maria Liakata, Rob Procter,
Bernard J Jansen, Kam-Fai Wong, dan Meeyoung Geraldine Wong Sak Hoi, dan Peter Tolmie. 2016.

1178
Menganalisis bagaimana orang mengarahkan ke dan penyebaran rumor
di media sosial dengan melihat benang
percakapan. PloS satu 11 (3): e0150989. Arkaitz Zubiaga, Maria
Liakata, dan Rob Procter.
2017. Pemanfaatan konteks untuk deteksi rumor di media sosial.
Dalam Konferensi Internasional tentang Informatika Sosial,
halaman 109-123. Peloncat. Arkaitz Zubiaga, Ahmet Aker, Kalina
Bontcheva,
Maria Liakata, dan Rob Procter. 2018a. Deteksi dan resolusi
rumor di media sosial: Sebuah survei. ACM Comput. Survei.

Arkaitz Zubiaga, Elena Kochkina, Maria Liakata, Rob


Procter, Michal Lukasik, Kalina Bontcheva, Trevor Cohn, dan
Isabelle Augenstein. 2018b. klasifikasi sikap rumor
wacana-sadar di media sosial menggunakan pengklasifikasi
berurutan. IPM

1179

Anda mungkin juga menyukai