PENGATEGORIAN ARTIKEL BERITA KAMPUS BERBAHASA INDONESIA
PADA PORTAL BERITA KAMPUS DENGAN MENGGUNAKAN
ALGORITMA BISECTING K-MEANS
(CATEGORIZATION OF CAMPUS NEWS ARTICLES IN INDONESIAN ON CAMPUS NEWS PORTAL USING BISECTING K-MEANS ALGORITHM)
Oleh : Putu Bagus Susastra Wiguna Program Studi : Teknik Elektro Instansi Asal : - Pembimbing I : Ir. P. Insap Santosa, M. Sc., Ph.D Pembimbing II : Bimo Sunarfri Hantono, S.T., M. Eng. Tanggal Wisuda : 23 Oktober 2013
INTISARI
Campbuzz merupakan portal berita kampus yang mendapatkan artikel berita melalui RSS feed dari website universitas-universitas sehingga artikel berita yang dikelola sangat besar dan artikel berita tersebut tidak memiliki kategori. Hal ini tentu akan menambah beban kerja dari admin Campbuzz sehingga diperlukan sistem yang dapat mengelola artikel-artikel yang ada pada database Campbuzz untuk meringankan beban kerja dari admin Campbuzz. Clustering adalah suatu teknik unsupervised learning yang dapat membentuk kelompok-kelompok (cluster) dari sekumpulan data dengan jumlah yang besar. Salah satu algoritma yang digunakan pada proses clustering adalah bisecting K-means yang merupakan pengembangan dari algoritma K-means. Text clustering berdasarkan isi dari artikel berita dapat menjadi solusi untuk masalah yang dihadapi oleh admin Campbuzz dalam hal melakukan pengelolaan artikel yang ada pada database Campbuzz. Pengembangan sistem yang dapat melakukan text clustering diawali dengan melakukan studi literatur yang berkaitan dengan preprocessing text, teknik representasi dokumen, algoritma clustering dan tools yang digunakan untuk proses clustering. Hasil dari penelitian ini adalah terbentuknya 20 kelompok berita dari 210 sampel artikel berita kampus yang digunakan. Nilai rata-rata IST dari cluster yang terbentuk adalah 0.590013058. Setiap cluster yang terbentuk direpresentasikan oleh 3 kata. Kata Kunciunsupervised learning, preprocessing, clustering, bisecting K-means