Tugas 3 - Mengidentifikasi Bagian-Bagian Penting Dari Artikel Ilmiah

Tugas 3 Penulisan Karya Ilmiah
Felix Ogustino 17/412636/PA/17955

Nathanael Gavin 17/412646/PA/17965
Prawiro Hadi T 17/412650/PA/17969
Judul : Learning Summary Prior Representation for Extractive Summarization

Abstraksi :
1. Latar belakang : Dalam abstrak paper tidak diidentifikasikan latar belakangnya
2. Tujuan : Menentukan seberapa sesuai suatu kalimat dapat terpilih menjadi ringkasan
tanpa memperhatikan konteks
3. Metode : Berbeda dari penelitian sebelumnya yang menggunakan kumpulan fitur

dokumen independen yang diekstrak secara manual, penulis mengembangkan sebuah
sistem ringkasan baru yang disebut dengan PriorSum. Sistem ini mengaplikasikan
convolutional neural network yang sudah ditingkatkan untuk menangkap summary prior
feature yang berasal dari frase yang panjangnya bermacam-macam. Di bawah regression
framework, fitur sebelumnya yang sudah dipelajari akan digabungkan dengan fitur
spesifik yang didapat dari suatu dokumen untuk sentence ranking.
4. Hasil : Hasil eksperimen pada DUC generic summarization benchmark menunjukkan

bahwa PriorSum dapat menemukan banyak aspek yang dapat mendukung ringkasan
sebelumnya dan mengungguli performa metode termutakhir.
Pendahuluan/ Latar belakang :

Sentence ranking adalah salah satu bagian terpenting dari rangkuman ekstraktif. Terlepas
dari model rankingnya, feature engineering merupakan bagian yang paling menentukan performa
dari rangkuman yang dihasilkan. Fitur biasanya dibedakan menjadi dua kategori: fitur yang
bergantung kepada dokumennya (contoh: frekuensi kata atau posisi) dan fitur yang tidak
tergantung terhadap dokumennya (contoh: rasio stopword atau polaritas kata).Penelitian terkini
untuk perangkuman mulai menggunakan fitur yang tidak tergantung terhadap dokumennya.
Akan tetapi, sistem perangkumannya memiliki kelemahan di mana aspek-aspek dari sifat
summary prior sulit untuk diambil. Selain itu, hal yang memiliki fitur yang sama, dapat
memiliki makna yang berbeda dalam rangkuman.
Penulis mengembangkan sebuah sistem ringkasan baru yang disebut dengan PriorSum.
Priorsum mengaplikasikan convolutional neural network dengan banyak filter untuk
mendapatkan satu set summary prior feature yang komprehensif yang didapatkan dari frase yang
panjangnya bermacam-macam. Sistem ini mengadopsi arsitektur dengan two-stage
max-over-time pooling operation untuk mengasosiasikan filter-filter tersebut dengan frasa yang
panjangnya berbeda-beda. PriorSum dapat menghasilkan fitur yang tidak bergantung dengan
dokumennya, lalu digabungkan dengan fitur yang bergantung dengan dokumennya untuk
diaplikasikan ke sentence regression.
Metode :
Pada paper ini metodologi yang digunakan terbagi atas dua langkah, yaitu Sentence Ranking dan
Sentence Selection. Pertama dilakukan ekstraksi fitur dari kalimat menggunakan CNN untuk
mendapatkan fitur independen dan fitur dependen. Dari fitur-fitur yang didapat akan
dikombinasikan untuk melakukan Sentence Ranking. Kemudian dilakukan Sentence Selection
yang mengambil konten yang informatif dan tidak redundan. Pertama dibuang kalimat yang
memiliki kurang dari 8 kata dan mengurutkan secara menurun sisanya berdasarkan nilai
kepentingan yang sudah diestimasi. Setelah itu diambil kalimat pertama dari urutan tersebut
untuk dimasukkan ke dalam ringkasan. Apabila kalimat yang diambil redundan terhadap
ringkasan maka tidak ditambahkan ke ringkasan dan dibuang. Sebuah kalimat dianggap
redundan jika memiliki kata baru lebih sedikit daripada ringkasan saat ini.
Hasil dan Pembahasan :

Untuk mengevaluasi metode yang diajukan, metode tersebut dibandingkan dengan
metode-metode mutakhir dan menggunakan metrik ROUGE 1 dan ROUGE 2 untuk
mengevaluasi performa metode secara otomatis. Setelah dibandingkan, didapat metode yang
diajukan memiliki performa yang sebanding dengan metode-metode mutakhir pada metrik
ROUGE 1 dan pada metrik ROUGE 2, metode yang diajukan memiliki performa yang lebih
baik.
Kesimpulan :
Penulis mengajukan sistem peringkasan terbaru yang bernama PriorSum yang dapat mempelajari
fitur dari summary prior s ecara otomatis untuk peringkasan yang ekstraktif. Eksperimen terhadap
dataset DUC generic multi document summarization task menunjukkan bahwa metode yang
diajukan mengungguli metode termutakhir saat ini. Sebagai tambahan, ditampilkan juga
kalimat-kalimat dominan yang ditemukan model PriorSum yang menjadi bukti bahwa model
tersebut dapat mempelajari aspek-aspek summary prior yang berbeda.

Tugas 3 - Mengidentifikasi Bagian-Bagian Penting Dari Artikel Ilmiah

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Tugas 3 - Mengidentifikasi Bagian-Bagian Penting Dari Artikel Ilmiah

Diunggah oleh

Hak Cipta:

Format Tersedia

Tugas 3 Penulisan Karya Ilmiah

Felix Ogustino 17/412636/PA/17955

Judul : Learning Summary Prior Representation for Extractive Summarization

3. Metode : Berbeda dari penelitian sebelumnya yang menggunakan kumpulan fitur

4. Hasil : Hasil eksperimen pada DUC generic summarization benchmark menunjukkan

Pendahuluan/ Latar belakang :

Hasil dan Pembahasan :

Anda mungkin juga menyukai