Alibaba Group, AS
menerapkan mekanisme perhatian dalam deteksi rumor di banyak penelitian sebelumnya ( Ma et al., 2016 ; Shu et al, 2017 ),
deteksi rumor didefinisikan sebagai menentukan nilai kebenaran
proses. Itu dihadiri rumor. Ini berarti itu adalah sama dengan
Informasi meliputi tidak hanya negara-negara yang
tersembunyi di lapisan deteksi rumor, tetapi juga verifikasi rumor didefinisikan dalam beberapa penelitian lain.
negara-negara tersembunyi dari lapisan deteksi sikap.
deteksi rumor dan verifikasi rumor akan digunakan secara
Percobaan pada dua dataset menunjukkan bahwa
bergantian dalam makalah ini.
kami Model yang diusulkan
Zubiaga et al. ( 2018a ) Menganggap rumor
melebihi negara-of-the-art deteksi rumor pendekatan.
proses penyelesaian sebagai pipa yang melibatkan empat
sub-tugas: (1) identifikasi rumor, menentukan apakah klaim
bernilai memverifikasi daripada ekspresi pendapat, yaitu
1 pengantar
memeriksa klaim adalah rumor atau non-rumor; (2) pelacakan
platform media sosial, seperti Twitter, Reddit dan Facebook, tidak rumor, mengumpulkan opini yang objektif tentang rumor
selalu menimbulkan informasi yang otentik. Rumor kadang-kadang seperti yang diungkapkan; (3) klasifikasi sikap, menentukan
dapat menyebar dengan cepat di atas platform ini, dan mereka sikap pengguna terhadap kebenaran rumor, dan (4) verifikasi
biasanya menyebar rasa takut atau benci. Oleh karena itu, deteksi rumor, langkah utama dimana nilai kebenaran rumor tersebut
rumor dan verifikasi telah memperoleh besar diperkirakan. Penelitian ini melibatkan
bunga
baru saja. platform media sosial dan otoritas pemerintah juga yang terakhir dua tugas: sikap
mengambil upaya-upaya besar untuk mengalahkan dampak klasifikasi (deteksi) dan verifikasi rumor (yaitu deteksi
negatif dari rumor. rumor). Dan makalah ini terutama berfokus pada langkah
Rumor Deteksi: Definisi Rumor bervariasi dari publikasi yang terakhir, deteksi rumor.
berbeda. Kurangnya konsistensi membuat sulit untuk melakukan Pernyataan masalah: Sekarang kita secara formal mendefinisikan
perbandingan head-tohead antara metode yang ada. Dalam tulisan masalah deteksi rumor: Sebuah cerita x didefinisikan sebagai satu set n potongan
ini, desas-desus didefinisikan sebagai pernyataan yang pesan terkait
kebenarannya nilai adalah benar, belum diverifikasi atau M = {m 1, m 2, ..., m n}. m 1 adalah sumber pesan (posting) yang
Salah diprakarsai rantai pesan, yang bisa menjadi struktur pohon
memiliki beberapa cabang. Untuk setiap pesan m saya, memiliki
( Qazvinian et al., 2011 ). Ketika nilai kebenaran rumor adalah Salah, beberapa
penelitian menyebutnya “ desas-desus palsu” atau “Berita palsu”. Namun, atribut yang mewakili isinya, seperti teks dan gambar. Setiap
banyak studi sebelumnya memberikan “ berita palsu ”A ketat definisi: pesan juga berhubungan dengan pengguna yang diposting.
berita palsu adalah sebuah artikel berita yang diterbitkan oleh outlet Pengguna juga memiliki satu set atribut, termasuk nama,
berita deskripsi, gambar avatar, posting terakhir, dll Tugas deteksi
yang sengaja dan rumor tersebut kemudian didefinisikan sebagai berikut:
diverifikasi palsu ( Shu et al., 2017 ; Zubiaga et al., 2018 ). Fokus Mengingat cerita x dengan set pesannya M dan set pengguna U,
dari penelitian ini adalah rumor di media sosial, berita tidak rumor
palsu. Ada juga yang berbeda
1173
Prosiding Pertemuan Tahunan ke-57 Asosiasi untuk Komputasi Linguistik, halaman 1173-1179
Florence, Italia 28 Juli-Agustus 2 2019. c © 2019 Asosiasi untuk Komputasi Linguistik
deteksi tugas bertujuan untuk menentukan apakah cerita ini benar salah atau negara tersembunyi di lapisan deteksi rumor, tetapi juga
tidak diverifikasi ( atau hanya benar atau negara-negara yang tersembunyi dari lapisan deteksi sikap. Dalam
Salah untuk dataset memiliki hanya dua label). Definisi ini cabang percakapan, beberapa posting, terutama yang dengan sikap
merumuskan tugas deteksi rumor sebagai tugas klasifikasi yang kuat, akan lebih penting daripada yang lain dalam menentukan
kebenaran. Definisi ini sama dengan definisi yang digunakan kebenaran rumor. Tidak ada penelitian sebelumnya telah
dalam banyak penelitian sebelumnya ( Shu et al, 2017 ; Ma et dieksploitasi ini pada deteksi rumor.
belajar bahwa menggabungkan pemakai Gambar 1 menyajikan struktur tingkat tinggi dari pendekatan
Informasi kredibilitas / profil di jaringan saraf untuk pembelajaran multi-tugas kita yang diusulkan. Lapisan tengah adalah
klasifikasi berurutan. 2. Kami menerapkan lapisan bersama, bersama dengan dua tugas. lapisan ini
Mekanisme perhatian dalam proses deteksi rumor. Dan adalah untuk mengekstrak umum
perhatian tidak hanya mencakup pola antara dua tugas ini, melalui bersama
1174
parameter. Lapisan atas adalah untuk deteksi sikap, dan deteksi. Ini dua lapisan akan menangkap
lapisan bawah adalah untuk rumor tugas
Gambar 1. Struktur tingkat tinggi dari pendekatan kami yang diusulkan. Lapisan LSTM bersama adalah di tengah (dalam merah
dot-line persegi panjang). Lapisan atas adalah lapisan khusus deteksi sikap, dan lapisan bawah adalah untuk rumor
tugas verifikasi.
fitur khusus. Dalam gambar ini, kita asumsikan tulisan yang gabungan dari dua jenis fitur: tweet embedding (TE) dan fitur
tweets, dan akan menggunakan tweet sebagai contoh dalam menciak embedding (FE). FE yang dihasilkan menggunakan
bagian berikut. Input ke dua lapisan tugas tertentu adalah klaim daftar yang sama dari fitur yang dijelaskan dalam ( Kochkina
(rumor, benang) cabang. Ambil jalan propagasi rumor pada et al., 2017 ). Beberapa contoh fitur FE puas panjang,
Gambar 2 sebagai contoh, rumor ini memiliki empat cabang, dan kehadiran URL, dan jika itu adalah tweet sumber atau tidak.
setiap cabang memiliki urutan input [ x 1, x 2, ..., x n], dimasukkan ke
dalam dua lapisan tugas tertentu. x 1 adalah tweet sumber
(posting), dan x n adalah tweet terakhir di cabang.
Pada setiap langkah waktu saya, negara disembunyikan h si diumpankan
1175
jaringan saraf belum membuat penggunaan informasi ini. 1972 rumor. Tapi tweet-nya tidak memiliki label sikap. Untuk
Kita mengadakan hipotesa bahwa ini mendapatkan label sikap mereka untuk belajar multi-tugas,
Informasi akan meningkatkan kinerja verifikasi rumor. Dalam berikut ( Kochkina et al., 2018 ), Kami juga menggunakan sikap
studi ini, kita memperoleh informasi kredibilitas dari profil algoritma deteksi yang diuraikan dalam ( Kochkina et al., 2017 )
pengguna. Kami menggunakan fitur yang dijelaskan dalam ( Liu untuk
et al., 2015 ) Untuk memperoleh informasi ini. Beberapa otomatis keterangan ini tweet. Itu
contoh fitur yang: diverifikasi account, jika profil meliputi RumorEval dataset diberikan dengan pelatihan /
pengembangan / pengujian split. Untuk PHEME dataset, kita
lokasi, jika profil memiliki deskripsi, dll informasi ini diproses
menggunakan salib validasi, sama seperti ( Kochkina et al.,
dan digabungkan bersama-sama sebagai embedding UE, dan
2018 ). Akurasi dan Makro F1 digunakan sebagai metrik
kemudian UE concatenated dengan TE sebagai masukan.
evaluasi.
Mengenai penjelasan sikap dari kumpulan data
RumorEval ( Derczynski et al., 2017 ), Sebagai kertas tugas
berbasis perhatian LSTM: Dalam cabang percakapan, tulisan deskripsi sudah menunjukkan: keseluruhan antar-Annotator
yang berbeda akan memiliki dampak yang berbeda pada kebenaran tingkat kesepakatan
rumor. Misalnya, tweets dengan kuat dukung atau menyangkal sikap 63,7% menunjukkan tugas untuk menjadi menantang, dan lebih
harus memiliki dampak yang lebih untuk memprediksi rumor mudah untuk tweets sumber (81,1%) dibandingkan membalas tweet
kebenaran. Dalam rangka untuk lebih mengeksploitasi informasi (62,2%). Ini berarti bahwa ada banyak label sikap tidak konsisten
bertentangan atau. Ketika kami menganalisis data training set, kami
sikap, kita secara eksplisit termasuk negara-negara yang tersembunyi
menemukan banyak contoh seperti itu. Untuk membuat label lebih
dari lapisan sikap dalam perhitungan perhatian. Selain tweet dengan
konsisten, kami menjalankan analisis untuk mencari tulisan yang
sikap yang kuat, kita juga harus lebih memperhatikan para pengguna
pada dasarnya sama atau sangat mirip, tapi label mereka berbeda.
kredibel. Hal ini dapat dilakukan melalui perhatian pada lapisan
Kami kemudian menandai posting ini, dan menggunakan label yang
rumor-spesifik, karena telah dikodekan informasi kredibilitas
sama, yang diberi label pada sebagian besar posting ini, mereka
pengguna melalui UE embedding. Oleh karena itu, kami
selama pelatihan. Kesamaan antara dua posting dihitung dengan
menggunakan LSTM berbasis perhatian-untuk memberikan perhatian
cosinus ukuran kesamaan. Ambang kesamaan untuk
lebih pada tweet penting. Pada setiap langkah saya, negara
dipertimbangkan sebagai posting serupa secara empiris ditetapkan
tersembunyi dari lapisan atas dan negara dari lapisan bawah sebagai 0,75.
benar-benar concatenated dan dihadiri bersama-sama. Dengan kata
lain, mereka menggunakan berat perhatian yang sama, • saya.
label dengan sikap. The PHEME dataset memiliki MTL2 0,571 0,558
1176
Tabel 1: hasil verifikasi Rumor tentang RumorEval tugas verifikasi, 2. menggunakan mekanisme perhatian lebih
memperhatikan tweets penting, dan 3. mengintegrasikan
Ma et al. ( 2018a ) Mengusulkan multi-task
informasi sikap ke dalam perhitungan perhatian.
pendekatan menggunakan GRU, dengan lapisan tugas tertentu untuk
setiap tugas. Ia tidak memiliki mekanisme perhatian, dan melakukan
tidak menggunakan
pemakai informasi. Kami
pelaksanaan pendekatan mereka tidak mencapai kinerja yang 5. Kesimpulan
dataset tanpa jalur propagasi panjang, yang merupakan kasus untuk bahwa melebihi model yang diusulkan kami deteksi
Tabel 2: hasil verifikasi Rumor tentang PHEME dataset Leon Derczynski, Kalina Bontcheva, Maria Liakata,
Rob Procter, Geraldine Wong Sak Hoi, dan Arkaitz Zubiaga.
hasil: Tabel 1 menunjukkan hasil pada RumorEval dataset, 2017. Semeval-2017 tugas 8: Rumoureval: Menentukan rumor
dan Tabel 2 adalah untuk dataset PHEME. Kita bisa melihat kebenaran dan dukungan untuk rumor. Dalam Prosiding
bahwa metode kami yang diusulkan melebihi pendekatan lain Lokakarya Internasional ke-11 di Semantic Evaluasi (SemEval-
pada kedua dataset.
2017), halaman 69-76.
Dalam kedua kasus, penampilan
peningkatan signifikan secara statistik pada tingkat p = 0,01 untuk Omar Enayet dan Samhaa R El-Beltagy. 2017.
akurasi dan F1, menggunakan Niletmrg di semeval-2017 tugas 8: Menentukan rumor dan
t-test ( Beras 2006 ). kebenaran dukungan untuk rumor di twitter. SemEval-2017.
Dibandingkan dengan model multi-tugas lain, model kami
memiliki tiga fitur utama: 1. menggabungkan informasi Genevieve Gorrell, Kalina Bontcheva, leon
kredibilitas pengguna dalam rumor Derczynski, Elena Kochkina, Maria Liakata, dan
1177
Arkaitz Zubiaga, RumourEval 2019: Menentukan Rumor kejujuran Cha. 2016. Mendeteksi desas-desus dari mikroblog dengan
dan Dukungan untuk Rumor. SemEval 2019 jaringan saraf berulang. Dalam Prosiding IJCAI.
Gupta, H. Lamba, P. Kumaraguru, dan A. Joshi. Jing Ma, Wei Gao, Kam-Fai Wong, 2017, Deteksi
Memalsukan berpasir: karakteristik dan mengidentifikasi gambar rumor di posting microblog menggunakan struktur propagasi melalui
palsu di twitter selama badai pasir. WWW 2013 pembelajaran kernel, ACL 2017
1178
Menganalisis bagaimana orang mengarahkan ke dan penyebaran rumor
di media sosial dengan melihat benang
percakapan. PloS satu 11 (3): e0150989. Arkaitz Zubiaga, Maria
Liakata, dan Rob Procter.
2017. Pemanfaatan konteks untuk deteksi rumor di media sosial.
Dalam Konferensi Internasional tentang Informatika Sosial,
halaman 109-123. Peloncat. Arkaitz Zubiaga, Ahmet Aker, Kalina
Bontcheva,
Maria Liakata, dan Rob Procter. 2018a. Deteksi dan resolusi
rumor di media sosial: Sebuah survei. ACM Comput. Survei.
1179