Anda di halaman 1dari 2

Thailand-Tourism and Conflict.

Modelling Sentiment from Twitter Tweets using Naïve Bayes and


Unsupervised Artificial Neural Nets.

William B. Claster, Malcolm Cooper, dan Philip Saillis

School of Asia Pacific Management, Ritsumeikan Asia Pacific University Beppu, Japan.

1. Ringkasan (summary)

Dalam jurnal ini dibahas mengenai identifikasi sentiment dari twitter tentang pariwisata dan
Thailand selama awal 2010 dan analisa ini nantinya bisa menjelaskan lingkungan pariwisata di
Phuket.

Analisis ini dapat diukur melalui rangkuman, analisis kata kunci dan clustering. Metode
pengukuran sentiment dengan binary choice algorithm(algoritma pilihan biner). Berbagai
pendekatan berdasar pengetahuan digunakan yaitu Self-Organising Maps (SOM) selama
menentukan model kecendrungan sentiment. Dengan model pemvisualan untuk menunjukkan
konsep perbendaharaan kata kemudian dicari nilai maksimum dan minimum.

2. Apakah objective terjawab dikesimpulan?

Pada kesimpulan terjawab bahwa data mining dapat diaplikasikan secara angka dan visual untuk
menentukan kecendrungan sosial pada media sosial seperti twitter.

3. Metodelogi penelitian

Jurnal ini mengambil data dari Twitter’s API sebanyak 70.570.000 komentar tweets atau sekitar
20,42 GB dari 30 Oktober 2009 sampai 21 Mei 2010. Data yang diambil berupa waktu, tanggal,
nama pengguna, pengikut, siapa yang diikuti, lokasi, dan tulisan komentar dengan kata kunci
‘Phuket’ atau ‘Bangkok’.

A. Pemodelan kecendrungan sentiment positif atau negative.


Dengan algoritma naive bayes, ditemukan kecendrungan positif pada sentiment Bangkok.
Selanjutnya data twitter dipersiapkan untuk ANN SOM. ANN SOM terdiri dari dua tahap;
a. Pemodelan Vektor Ruang
langkah-langkah adopsi untuk menghasilkan model ruang vektor dimana matriks deskriptor
sentimen yang berarti beban yang ditentukan berdasarkan kehadiran mereka dalam
komentar twitter dan kehadiran secara keseluruhan dalam korpus tweets
1. mengkonsolidasikan seluruh tweets ke corpora tunggal dan melakukan langkah-langkah
berikut untuk setiap corpus
2. berhenti menghapus kata-kata
3. mengurangi verba untuk lemmas menggunakan algoritma stemming sederhana tidak
agresif
4. membuang kata-kata yang jarang dengan memberikan batas bawah dengan frekuensi
yang sama kata-kata yang diterima pada langkah 3
5. mengambil transpose dari matriks yang diperoleh pada langkah 4 untuk cluster kata-
kata bukan komentar
6. matriks yang diperoleh pada langkah 5 kemudian dipangkas dengan memasukkan hanya
atribut (baris) yang unsur leksikon sentimen dijelaskan di atas
b. Sentiment Lexicon
Mencari kombinasi prunning otomatis berdasarkan frekuensi kata dan penghapusan
manual. Manual penghapusan terdiri dari penghapusan paling kata-kata yang terkait waktu,
semua kata non-inggris, kata-kata yang berkaitan dengan ukuran, angka, dan token twitter
khusus
B. Setelah itu data siap dianalisis dengan ANN SOM untuk visulisasi sentiment berbagai ukuran
dengan software yang disebut Viscovery SOMiner. Dengan strategi memeriksa seluruh
himpunan tweets dan kemudian hanya tweets yang mencakup kata kunci 'Phucket'.
C. Melihat tampilan gabungan: penerapan analisis multi-dimensi pada model uni-dimensi

4. Kebutuhan software dan hardware

Dalam jurnal ini dipakai software Viscovery SOMiner. Viscovery SOMiner adalah aplikasi desktop
untuk mengekplorasi data mining, analisis visual cluster, profil statistic, segmentasi dan
klasifikasi berdasaarkan self-Orgnaizing maps(SOM) dan klasifikasi statistic dalam lingkungan
instuitive aliran kerja.

5. Apakah tinjauan pustaka sesuai dengan metodelogi penelitian?

Isi latar belakang sudah sesuai dengan metodelogi penelitian karena sudah membahas teori
binary choice algorithm dan self-organizing maps(SOM) dengan multi-dimensional.

Anda mungkin juga menyukai