Anda di halaman 1dari 1

PENGATEGORIAN ARTIKEL BERITA KAMPUS BERBAHASA INDONESIA

PADA PORTAL BERITA KAMPUS DENGAN MENGGUNAKAN


ALGORITMA BISECTING K-MEANS

(CATEGORIZATION OF CAMPUS NEWS ARTICLES IN INDONESIAN ON
CAMPUS NEWS PORTAL USING BISECTING K-MEANS ALGORITHM)

Oleh : Putu Bagus Susastra Wiguna
Program Studi : Teknik Elektro
Instansi Asal : -
Pembimbing I : Ir. P. Insap Santosa, M. Sc., Ph.D
Pembimbing II : Bimo Sunarfri Hantono, S.T., M. Eng.
Tanggal Wisuda : 23 Oktober 2013

INTISARI

Campbuzz merupakan portal berita kampus yang mendapatkan artikel berita melalui
RSS feed dari website universitas-universitas sehingga artikel berita yang dikelola sangat
besar dan artikel berita tersebut tidak memiliki kategori. Hal ini tentu akan menambah beban
kerja dari admin Campbuzz sehingga diperlukan sistem yang dapat mengelola artikel-artikel
yang ada pada database Campbuzz untuk meringankan beban kerja dari admin Campbuzz.
Clustering adalah suatu teknik unsupervised learning yang dapat membentuk
kelompok-kelompok (cluster) dari sekumpulan data dengan jumlah yang besar. Salah satu
algoritma yang digunakan pada proses clustering adalah bisecting K-means yang merupakan
pengembangan dari algoritma K-means. Text clustering berdasarkan isi dari artikel berita
dapat menjadi solusi untuk masalah yang dihadapi oleh admin Campbuzz dalam hal
melakukan pengelolaan artikel yang ada pada database Campbuzz.
Pengembangan sistem yang dapat melakukan text clustering diawali dengan melakukan
studi literatur yang berkaitan dengan preprocessing text, teknik representasi dokumen,
algoritma clustering dan tools yang digunakan untuk proses clustering.
Hasil dari penelitian ini adalah terbentuknya 20 kelompok berita dari 210 sampel artikel
berita kampus yang digunakan. Nilai rata-rata IST dari cluster yang terbentuk adalah
0.590013058. Setiap cluster yang terbentuk direpresentasikan oleh 3 kata.
Kata Kunciunsupervised learning, preprocessing, clustering, bisecting K-means

Anda mungkin juga menyukai