Anda di halaman 1dari 1

KLASIFIKASI BERITA BERBAHASA INDONESIA DENGAN PENGKLASIFIKASI SVM (Support Vector Machine)

ABSTRAK Berita merupakan suatu hal yang penting bagi masyarakat dan tidak bisa dipisahkan dari masyarakat. Oleh karena itu kebutuhan akan proses pengklasifikasian berita kedalam kategori tertentu diperlukan untuk memperoleh informasi yang relevan dan cepat. Penelitian akan memperlihatkan sebuah sistem pengklasifikasian berita dengan Support Vector Machine (SVM), dimana dokumen yang digunakan berasal dari situs media surat kabar Kompas. Pada penelitian ada dua tahap yaitu preprocessing dan pengklasifikasian. Tahapan dari preprocessing yaitu tokenizing, stopword, stemming, menghitung kata, menghitung frekuensi kata lebih dari tiga, menghitung TF-IDF dan penormalan. Tahap pengklasifikasian menggunakan SVM. SVM merupakan salah satu metode pengklasifikasian yang cukup handal untuk digunakan dalam pengklasifikasian berita. Inti pemrosesan SVM berada pada pembentukan OSH (Optimum Separating Hyperplane) yang mengklasifikasikan kelas biner. Pada permasalahan multiclass digunakan salah satu mekanisme penggabungan klasifikasi biner yaitu one against one. Hasil dari penelitian ini didapatkan tingkat akurasi sekitar 85.00%. Dengan tingkat akurasi ini maka metode SVM cukup handal untuk diimplementasikan pada sistem klasifikasi berita berbahasa Indonesia.

Kata kunci : berita, pengklasifikasian, preprocessing, tokenizing, stopword, stemming, TF-IDF, SVM, OSH, one against one

iv

Anda mungkin juga menyukai