Analisis Twitter
Analisis Twitter
KELOMPOK [NOMOR]
Nama Kelompok :
165150218113xxx Muhammad Fahmi Wibawa
165150207113xxx Dewi Novita Sari
165150218113xxx Aulia Herdhyanti
Berdasarkan informasi – informasi yang telah di unggah oleh pengguna twitter, kita dapat
melakukan analisis untuk mendapatkan informasi yang sering dibicarakan atau isu yang sedang
terjadi pada waktu tertentu. Sehingga nantinya akan didapatkan suatu topik informasi atau isu
penting yang dapat didiskusikan bersama dalam suatu forum diskusi untuk mendapatkan informasi
yang benar atau mendapatkan solusi dari suatu isu, sehingga dapat menghindari berita bohong
(hoax) bagi masyarakat Indonesia.
RUMUSAN MASALAH
1. Bagaimana indexing text mining diterapkan untuk melakukan analisis survey?
a. Tujuan
Tujuan umum:
Melakukan analisis untuk mencari topik pembicaraan atau isu yang sedang terjadi di
Indonesia.
Tujuan khusus:
b. Manfaat
Dengan dilakukannya analisis survey ini, Kita dapat mengetahui informasi atau isu yang terjadi
pada waktu tertentu yang nantinya dapat didiskusikan bersama dalam suatu forum diskusi untuk
mendapatkan informasi yang benar atau mendapatkan solusi dari suatu isu, sehingga dapat
menghindari berita bohong (hoax) bagi masyarakat Indonesia.
BATASAN MASALAH
Keluaran yang di hasilkan berupa topik atau isu yang sedang terjhadi di Indonesia dengan
menggunakan indexing text mining dan metode term weighting TF – IDF untuk melakukan
pembobotan dari masing – masing text yang muncul pada sebuah unggahan.
TINJAUAN PUSTAKA
TEXT MINING
Text mining adalah suatu ilmu yang bertujuan untuk menambang data berupa teks dimana
yang sumber datanya didapatkan dari beberapa dokumen. Tujuan dari text mining biasanya untuk
mengetahui isi dari dokumen secara cepat dan tepat.
PEMBOBOTAN
Pembuat sebuah indeks, setiap kata / term memiliki bobot / nilai masing-masing. Ada banyak
metode untuk memberikan bobot pada masing-masing term pada indeks. Pada penelitian ini, term
yang telah dibentuk akan dihitung bobot kemunculannya dengan menggunakan Term Frequency-
Inverse Document Frequency (TF-IDF). Term-Frequency (TF) adalah banyaknya term yang
muncul pada dokumen, sedangkan Inverse Document Frequency (IDF) bertujuan untuk
menentukan apakah term yang sudah dicari cocok atau tidak dengan kata kunci yang sudah
ditentukan sejak awal pencarian.
Pada peneltian ini kami menggunakan indexing text mining dan metode term weighting
dengan TF-IDF. Pada data yang ada dilakukan pemrosesan text pengindeks-an untuk mendapatkan
set term indeks yang kemudian akan dijadikan sebagai perwakilan dokumen. Set term indeks yang
telah didapatkan kemudian dilakukan pembobotan per term indeks dengan menggunakan metode
TF-IDF. TF-IDF melakukan identifikasi terms penting dan kata kunci penting yang memiliki
relevansi tinggi untuk terms yang spesifik.
Kegiatan menambang data yang sumber datanya berupa text. Pada text mining terdapat
proses preprocesing dimana merubah text menjadi term indeks dengan melakukan langkah-
langkah tahapan tertentu.
TF-IDF :
SKENARIO PENGUJIAN
Step 7 : Term
Weighting :
Step 6 : TF-IDF
Analyzing
Step 5 :
Tagging
Step 4 :
Stemming
Step 3 :
Filtering
Step 2
:Tokenizing
Step 1:
Colecting
data 100
tweets
Data berupa 100 tweets dilakukan indexing text mining pada tiap tweet, sehingga didapatkan set
term indeks yang kemudian akan dijadikan sebagai perwakilan dokumen. Set term indeks yang
telah didapatkan kemudian dilakukan pembobotan per term indeks dengan menggunakan metode
TF-IDF.
JADWAL PELAKSANAAN
ANGGOTA KELOMPOK
BIOGRAFI KELOMPOK
PEMBAGIAN KERJA