Nim : E022010
Kelas : Statistika 20A
UAS/DATA MINING
3.Hotel yang direview tidak boleh sama antara mahasiswa satu dengan yang lainnya
JAWAB:
Hotel yang kita untuk review yaitu swiss belhotel makassar yang ada disulawesi selatan,
misal disini kita akan menganalisa komentar pengunjung Hotel swiss belhotel makassar, maka,
kita gunakan Selector Gadget untuk melihat posisi komentar tersebut, serta persiapkan terlebih
dahulu package di dalam R
Siapkan terlebih dahulu R nya serta install package yang diperlukan
kemudian kita ingin mengambil review dari Hotel swiss belhotel makassar
kita masukkan dalam R alamat website tersebut, misal hasil pembacaan halaman website tersebut
kita namakan “swiss belhotel makassar”
Selanjutnya anda install beberapa package tambahan yang diperlukan untuk analisa selanjutnya.
tm untuk operasi penambangan teks seperti menghapus angka, karakter khusus, tanda
baca, dan kata-kata berhenti (Kata-kata berhenti dalam bahasa apa pun adalah kata-kata
yang paling sering muncul yang memiliki nilai sangat kecil untuk NLP dan harus
disaring. Contoh kata-kata berhenti dalam bahasa Inggris adalah “the”, “adalah”,
“adalah”.)
snowballc untuk stemming, yaitu proses mereduksi kata menjadi bentuk dasar atau
akarnya. Misalnya, algoritma stemming akan mereduksi kata “fishing”, “fished” dan
“fisher” menjadi stem “fish”.
wordcloud untuk menghasilkan plot cloud kata.
RColorBrewer untuk palet warna yang digunakan di berbagai plot
syuzhet untuk skor sentimen dan klasifikasi emosi
ggplot2 untuk memplot grafik Gunakan kode berikut untuk menginstal dan memuat
paket-paket ini.
Membaca data file ke dalam R Fungsi dasar R read.table()umumnya digunakan untuk membaca file
dalam format tabel dan mengimpor data sebagai bingkai data. Beberapa varian dari fungsi ini
tersedia, untuk mengimpor format file yang berbeda;
read.csv() digunakan untuk membaca file nilai yang dipisahkan koma (csv), di mana koma “,”
digunakan sebagai pemisah bidang
output
Hasilkan Awan Kata Awan kata adalah salah satu cara paling populer untuk memvisualisasikan dan menganalisis
data kualitatif. Ini adalah gambar yang terdiri dari kata kunci yang ditemukan di dalam badan teks, di mana
ukuran setiap kata menunjukkan frekuensinya di badan teks tersebut. Gunakan bingkai data frekuensi kata (tabel)
yang dibuat sebelumnya untuk menghasilkan awan kata. Dalam skrip R Anda, tambahkan kode berikut dan
jalankan untuk menghasilkan kata cloud dan tampilkan di bagian Plot RStudio.
Di bawah ini adalah penjelasan singkat tentang argumen yang digunakan dalam kata cloud
function;
kata – kata yang akan diplot freq
- frekuensi kata-kata min.freq
– kata-kata yang frekuensinya berada pada atau di atas nilai ambang ini diplot (dalam hal ini,
saya telah menyetelnya ke 9) max.words
– jumlah maksimum kata yang akan ditampilkan pada plot (pada kode di atas, saya telah
mengaturnya menjadi 200) random.order
– Saya telah menyetelnya ke FALSE, sehingga kata-kata diplot dalam urutan penurunan