Anda di halaman 1dari 10

AUTOMATED TEXT

SUMMARIZATION UNTUK
ARTIKEL/DOKUMEN
TUNGGAL
DENGAN MENGGUNAKAN
ALGORITMA HITS

ZHAIN_0614104004
Latar Belakang
Dengan mendapatkan sebuah informasi manusia akan memiliki wawasan yang
lebih luas, karena dari informasi manusia dapat membuat sebuah keputusan atau
mengetahui kejadian tentang sesuatu. Ada banyak cara manusia mendapat informasi
baik melalui media elektronik, media cetak maupun dari sebuah perbincangan.
Pentingnya sebuah informasi menjadikan informasi harus didapat dengan cara yang
cepat. Membaca dokumen teks atau artikel merupakan salah satu cara untuk
mendapatkan informasi. Tetapi panjangnya suatu dokumen ataupun artikel akan
memakan waktu yang lama untuk dibaca sehingga informasi akan didapat dengan
cara yang lama dan akan membuat pembaca menjadi cepat bosan dan malas untuk
membaca. Agar para pembaca dapat mendapatkan informasi dari suatu dokumen
ataupun artikel dengan cepat, maka perlu dilakukan peringkasan pada teks aslinya.

2
Tujuan
Membangun/merancang sistem peringkas teks otomatis
dengan menggunakan algoritma HITS.

Membuat ringkasan dari artikel/dokumen tunggal


menggunakan algoritma HITS.

Mengevaluasi hasil ringkasan yang dihasilkan oleh


sistem Automated Text Summarization yang dibangun dari
algoritma HITS.

3
Batasan Masalah
Dokumen yang digunakan adalah dokumen tunggal teks
atau artikel.

Peringkasan teks dilakukan secara offline.

Ringkasan berupa hasil ekstraksi kalimat-kalimat dari


dokumen asli.

4
Landasan Teori
GRAPH
Secara kasar graf (Graph) adalah suatu diagram yang memuat informasi tertentu
jika diintepretasikan secara tepat.Suatu graf adalah himpunan benda-benda yang
disebut simpul (vertex atau node) yang terhubung oleh sisi (edge) atau busur (arc).
Biasanya graf digambarkan sebagai kumpulan titik-titik (melambangkan simpul)
yang dihubungkan oleh garis-garis (melambangkan sisi) atau garis berpanah
(melambangkan busur). Suatu sisi dapat menghubungkan suatu simpul dengan
simpul yang sama. Sisi yang demikian dinamakan gelang (loop). Suatu graf yang
terdiri dari simpul dan sisi dapat dinyatakan dalam suatu persamaan seperti
terlihat pada Persamaan (1).
 
G = <V,E>, (1)
 
dimana G merupakan graph (graf), V merupakan verteks (simpul), dan E
merupakan edge (sisi).

5
Algoritma HITS
Algoritma Hyperlinked Induced Topic Search (HITS) yang merupakan
algoritma peringkasan berbasis graf. Pada dasarnya HITS melakukan
perangkingan kalimat dengan memperhitungkan keterhubungan antar kalimat.
Perangkingan dilakukan dengan cara memberi bobot kalimat dan diurutkan
berdasarkan tingkat kepentingannya. Algoritma HITS akan menghasilkan dua
buah nilai yaitu authority, jumlah link yang masuk dan hub, jumlah link yang
keluar. Dengan HITS, teks direpresentasikan dengan menggunakan graf, di mana
vertex mewakili kata-kata, kalimat-kalimat, maupun paragraph-paragraf.
Sedangkan untuk edge mewakili keterhubungan antar vertex. Dengan
merepresentasikan dokumen atau teks dalam bentuk graf diharapkan mampu
menghasilkan ringkasan yang mempresentasikan isi dokumen. Dokumen atau
teks yang digunakan sebagai masukan sistem dapat diperoleh dari internet karena
ketersediaan dokumen atau teks dalam bahasa Indonesia maupun bahasa Inggris
sudah banyak tersedia dan mudah dalam pencariaannya secara online.

6
Algoritma Perhitungan
Bobot Hub dan Bobot Authority
Mulailah dengan setiap simpul yang memiliki bobot hub dan bobot authority 1.

Jalankan Authority Update Rule.

Jalankan Hub Update Rule.

Menormalisasi nilai dengan membagi setiap bobot hub dengan akar kuadrat dari jumlah
kuadrat dari semua bobot hub, dan membagi setiap bobot authority dengan akar kuadrat dari
jumlah kuadrat dari semua bobot authority.

Ulangi dari langkah kedua seperlunya.

7
Java
Java menurut definisi dari Sun adalah nama untuk sekumpulan teknologi
untuk membuat dan menjalankan perangkat lunak pada komputer standalone
ataupun pada lingkungan jaringan. Java berdiri di atas sebuah mesin interpreter
yang diberi nama Java Virtual Machine (JVM). JVM inilah yang akan membaca
bytecode dalam file .class dari suatu program sebagai representasi langsung
program yang berisi bahasa mesin. Oleh karena itu, bahasa Java disebut sebagai
bahasa pemrograman yang portable karena dapat dijalankan pada berbagai
sistem operasi, asalkan pada sistem operasi tersebut terdapat JVM.

NetBeans
NetBeans merupakan IDE(Integrated Development Environment) untuk
membuat aplikasi dengan Java, PHP, C, C++, dan HTML5.

8
Kesimpulan
Dengan adanya sistem Automated Text Summarization Untuk Artikel/
Dokumen Tunggal Dengan Menggunakan Algoritma HITS ini diharapkan
informasi/ide pokok dari sebuah dokumen atau artikel dapat dengan mudah
didapat tanpa harus memakan waktu yang cukup lama untuk membacanya.

9
SEKIAN
&
TERIMA KASIH

Anda mungkin juga menyukai