JAKARTA PADA TWITTER BERBAHASA INDONESIA MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER.
Nama : Yuliana Fajarwati
NPM : 17115338 Jurusan : Sistem Informasi Pembimbing : Dr. Diana Ikasari, ST.MMSI LATAR BELAKANG • Kemacetan diakibatkan oleh banyaknya penggunaan kendaraan pribadi. Peningkatan penggunaan angkutan umum dapat menjadi solusi kunci permasalahan kemacetan. • masyarakat masih enggan untuk menggunakan transportasi umum dan lebih memilih menggunakan kendaraan pribadi. • Alasan masyarakat enggan menggunakan transportasi umum dikarenakan waktu perjalanan, ongkos, keselamatan dan keamanan, serta kesenangan dan kenyamanan pengguna transportasi umum. • Kini Indonesia khususnya Kota Jakarta memiliki transportasi umum yaitu MRT Jakarta • MRT Jakarta (Mass Rapid Transit Jakarta) merupakan angkutan cepat terpadu Jakarta. MRT Jakarta adalah sebuah sistem transportasi transit cepat menggunakan kereta rel listrik yang tidak memiliki jalur perlintasan sebidang karena semua jalur MRT Jakarta berada diatas atau dibawah. RUMUSAN MASALAH • Bagaimana merancang sistem yang dapat melakukan analisis sentimen terhadap tweet transportasi umum MRT Jakarta dalam Bahasa Indonesia menggunakan metode Naïve Bayes Classifier? • Bagaimana menganalisis tweet berbahasa Indonesia dengan metode klasifikasi Naïve Bayes Classifier? • Bagaimana membuat aplikasi analisis sentimen terhadap tweet transportasi umum MRT Jakarta dalam Bahasa Indonesia menggunakan metode Naïve Bayes Classifier? • Bagaimana cara melakukan visualisasi data terhadap hasil analisis? BATASAN MASALAH • Menggunakan metode Stemming Nazief dan Adriani. • Metode yang digunakan dalam klasifikasi tweets tentang transportasi umum MRT Jakarta adalah metode Naïve Bayes Classifier. Analisis tweets yang mengandung kalimat ‘MRT Jakarta’ dari akun twitter @mrtjakarta atau tweets yang memiliki hastag #MRTJakarta, #MRTJKT, atau #MRTJ. • Ulasan menggunakan twets berbahasa Indonesia, menggunakan data sebanyak 100 tweets • Data tweets diklasifikasikan oleh Naïve Bayes Classifier dalam dua bentuk, yaitu bentuk positif dan negatif. • Hasil dari analisis sentimen akan divisualisasikan dalam bentuk grafik histogram. TUJUAN PENELITIAN • Membangun sistem dengan melakukan analisis sentimen dari tweets yang dinyatakan dalam Bahasa Indonesia dan mengandung kata MRT Jakarta. • Melakukan analisis sentimen tweets menggunakan metode Naïve Bayes Classifier Serta memvisualisasikan hasil analisis dalam bentuk grafik histogram. • Dapat membantu masyarakat Indonesia agar lebih mudah menentukan pilihan transportasi umum yang nyaman dan aman. Berdasarkan hasil review dari twitter terhadap transportasi umum oleh pengguna MRT Jakarta. • Hasil penelitian dapat digunakan untuk membantu meningkatkan sistem pada MRT Jakarta dengan meningkatkan layanan dan fasilitas. METODE PENELITIAN SDLC (System Development Life Cycle) KERANGKA PENELITIAN
Training
Testing STRUKTUR NAVIGASI USE CASE DIAGARAM ACTIVITY DIAGRAM SEQUENCE DIAGARAM CLASS DIAGRAM TAMPILAN HALAMAN APLIKASI
TAMPILAN HALAMAN APLIKASI Tampilan Halaman Uji Akurasi Sistem
Tampilan Halaman Grafik Hasil Klasifikasi
KESIMPULAN • Telah berhasil dibuat sebuah aplikasi analisis sentimen tweet dari twitter akun Mrt Jakarta (@mrtjakarta) yang memiliki dua proses yaitu proses training dan proses testing. • Sistem analisis sentimen memiliki tahapan yaitu, melakukan crawling , kemudian di proses melalui tahap preprocessing (case folding, cleansing, stopword removal, stemming, convert emoticon, dan tokenisasi) selanjutnya data hasil preprocessing akan di proses ke dalam tahap klasifikasi untuk diklasifikasikan ke dalam sentimen positif atau negatif dengan menggunakan metode Naïve Bayes Classifier. Dan untuk mengukur akurasi dari sistem yang dibuat dapat dilakukan uji coba menggunakan confusion matrix. Kemudian hasil dari klasifikasi dibuat visualisasi data berupa grafik histogram. • Hasil implementasi dan pengujian pada analisis sentimen, dengan jumlah tweet data latih sebanyak 603 tweet dan data uji sebanyak 72 tweet, maka didapatkan akurasi sistem sebesar 95,13%. Dengan percobaan berskala dan diambil rata-rata dengan data training dan data testing sebanyak 10 tweet. SARAN • Dapat dilakukan pengembangan sistem lebih lanjut berupa, penambahan jumlah data latih untuk mendapatkan hasil yang lebih akurat, menambahkan fitur perbandingan persentase positif negatif • Dapat memperindah tampilan web agar lebih menarik. TERIMA KASIH