Anda di halaman 1dari 2

Contoh proposal: Klasifikasi Dokumen Teks dengan Metode Nave Bayes Latar belakang Internet adalah penyimpan segala

sumber informasi dari penyedia sumber informasi di seluruh dunia. Ragam dalam isi, tujuan dan format elektronik terkumpul menjadi satu. Kumpulan ini tidak tersebar di berbagai macam lokasi. Untuk mendapatkan sumber informasi di dalamnya, biasanya pengguna menggunakan mesin pencari, lalu menentukan sendiri sumber informasi yang sesuai dengan kebutuhan. Hasil pencarian yang dilakukan oleh mesin pencari didasarkan pada algoritma tertentu yang membaca isi atau deskripsi tentang sumber informasi. Hal ini dikarenakan sumber informasi yang tersedia di Internet tidak tersusun secara terstruktur, dan tidak selalu lengkap dengan atribut-atribut pengenal seperti pengarang, penerbit dan tahun terbit. Dengan demikian, penentuan keabsahan suatu sumber merupakan keahlian tersendiri yang harus dimiliki oleh pengguna. Di pihak lain, perpustakaan yang juga merupakan penyedia sumber informasi senantiasa mengelola sumber informasi dengan melakukan klasifikasi. Klasifikasi ini membantu pengguna untuk mengalokasi sumber informasi secara fisik dan mendapatkan informasi tentang sumber informasi tersebut secara sederhana. Belajar dari hal tersebut, jika sumber informasi di Internet diklasifikasikan berdasarkan atribut-atribut yang melekat pada sumber informasi tersebut, maka pencarian dan penentuan keabsahan sumber informasi di Internet akan lebih mudah. Klasifikasi memanfaatkan atribut pengarang, penerbit dan isi dari sumber informasi. Didasari alternatif di atas, maka dalam penelitian ini akan dibangun suatu aplikasi berbasis komputer yang berfungsi untuk melakukan klasifikasi terhadap sumber informasi elektronik di Internet secara selektif. Metode yang digunakan untuk mendukung proses klasifikasi ini adalah Nave-Bayes, dan TF-IDF. Klasifikasi yang dilakukan berdasarkan beberapa kelas yang ditentukan sebagai kasus penelitian yaitu ekonomi dan bisnis, teknologi informasi, kesehatan, pendidikan dan politik. Rumusan Masalah Penelitian ini akan menghasilkan program untuk melakukan klasifikasi sumber informasi elektronik di Internet dengan menerapkan metode Naive-Bayes dan metode TF-IDF. Metode NaiveBayes melakukan klasifikasi berdasarkan hasil pembobotan dengan metode TF-IDF. Hasil yang diharapkan adalah sumber informasi dapat terkelompok dalam 5 kelas yang ditentukan yaitu: kelas Ekonomi dan bisnis, teknologi informasi, kesehatan, pendidikan dan politik. Tujuan Penelitian Penelitian ini memiliki tujuan dalam pengembangan ilmu dan pemberian manfaat yaitu : 1. untuk mengembangkan bidang ilmu penambangan teks dengan menerapkan metode NaiveBayes dan TF-IDF 2. untuk memberikan hasil penelusuran sumber informasi yang sesuai dengan klasifikasi yang ditetapkan Landasan Teori [Berisi penjabaran tentang metode Naive-Bayes, TF-IDF, Tokenisasi, Stemming] Spesifikasi Sistem Sistem yang akan menjadi hasil dari penelitian ini memiliki kemampuan membaca setiap kata

dalam file teks, membangun kumpulan kata dasar, menghitung bobot kata berdasarkan TF-IDF dan mengklasifikasikan file teks ke klasifikasi yang sudah ditentukan. Untuk membangun program ini maka software dan hardware yang digunakan adalah sebagai berikut: 1. Software : bahasa pemrograman Visual Basic, .... ,...... 2. Hardware : komputer dengan prosesor ..., dengan RAM , ..... dan hardisk Tahap Pelaksanaan Penelitian Dwi-minggu 1 2 3 4 5 6 7 Observasi Pengumpulan Data Perancangan Implementasi Pengujian Analisis hasil Dokumentasi Daftar Pustaka Weiss, Sholom. (2005). Text Mining: Predictive Methods for Analyzing Unstructured Information.NY, New York: Springer. Baeza-Yates, Ricardo.(1999). Modern Information Retrieval. Harlow,Edinburgh: Pearson Education Limited.

Anda mungkin juga menyukai