2. Tujuan : Menentukan seberapa sesuai suatu kalimat dapat terpilih menjadi ringkasan
tanpa memperhatikan konteks
Metode :
Pada paper ini metodologi yang digunakan terbagi atas dua langkah, yaitu Sentence Ranking dan
Sentence Selection. Pertama dilakukan ekstraksi fitur dari kalimat menggunakan CNN untuk
mendapatkan fitur independen dan fitur dependen. Dari fitur-fitur yang didapat akan
dikombinasikan untuk melakukan Sentence Ranking. Kemudian dilakukan Sentence Selection
yang mengambil konten yang informatif dan tidak redundan. Pertama dibuang kalimat yang
memiliki kurang dari 8 kata dan mengurutkan secara menurun sisanya berdasarkan nilai
kepentingan yang sudah diestimasi. Setelah itu diambil kalimat pertama dari urutan tersebut
untuk dimasukkan ke dalam ringkasan. Apabila kalimat yang diambil redundan terhadap
ringkasan maka tidak ditambahkan ke ringkasan dan dibuang. Sebuah kalimat dianggap
redundan jika memiliki kata baru lebih sedikit daripada ringkasan saat ini.
Kesimpulan :
Penulis mengajukan sistem peringkasan terbaru yang bernama PriorSum yang dapat mempelajari
fitur dari summary prior s ecara otomatis untuk peringkasan yang ekstraktif. Eksperimen terhadap
dataset DUC generic multi document summarization task menunjukkan bahwa metode yang
diajukan mengungguli metode termutakhir saat ini. Sebagai tambahan, ditampilkan juga
kalimat-kalimat dominan yang ditemukan model PriorSum yang menjadi bukti bahwa model
tersebut dapat mempelajari aspek-aspek summary prior yang berbeda.