Anda di halaman 1dari 10

Nama : Wardiah

Nim : E022010
Kelas : Statistika 20A

UAS/DATA MINING

2.Mahasiswa melakukan text mining pada web, www.tripadvisor.co.id

3.Hotel yang direview tidak boleh sama antara mahasiswa satu dengan yang lainnya

4.Silahkan mengulas hotel yang ada dimakassar dengan link ini


https://www.tripadvisor.co.id/Hotels- g297720-Makassar_South_Sulawesi_Sulawesi Hotels.html

JAWAB:

Hotel yang kita untuk review yaitu swiss belhotel makassar yang ada disulawesi selatan,

misal disini kita akan menganalisa komentar pengunjung Hotel swiss belhotel makassar, maka,
kita gunakan Selector Gadget untuk melihat posisi komentar tersebut, serta persiapkan terlebih
dahulu package di dalam R
Siapkan terlebih dahulu R nya serta install package yang diperlukan
kemudian kita ingin mengambil review dari Hotel swiss belhotel makassar

kita masukkan dalam R alamat website tersebut, misal hasil pembacaan halaman website tersebut
kita namakan “swiss belhotel makassar”

kemudian, kita gunakan SelectorGadget untuk melihat posisi review pelanggan


Selanjut ketika kita buka melalui microsoft excel,hasilnya seperti berikut:
kemudian bisa juga kita bersihkan terlebih dahulu data tersebut, (misalkan ketika terdapat baris
yang kosong yang tidak memuat komentar apapun bisa kita delete baris) kemudian kita Save
kembali.

Selanjutnya anda install beberapa package tambahan yang diperlukan untuk analisa selanjutnya.
tm untuk operasi penambangan teks seperti menghapus angka, karakter khusus, tanda
baca, dan kata-kata berhenti (Kata-kata berhenti dalam bahasa apa pun adalah kata-kata
yang paling sering muncul yang memiliki nilai sangat kecil untuk NLP dan harus
disaring. Contoh kata-kata berhenti dalam bahasa Inggris adalah “the”, “adalah”,
“adalah”.)
snowballc untuk stemming, yaitu proses mereduksi kata menjadi bentuk dasar atau
akarnya. Misalnya, algoritma stemming akan mereduksi kata “fishing”, “fished” dan
“fisher” menjadi stem “fish”.
wordcloud untuk menghasilkan plot cloud kata.
RColorBrewer untuk palet warna yang digunakan di berbagai plot
syuzhet untuk skor sentimen dan klasifikasi emosi
ggplot2 untuk memplot grafik Gunakan kode berikut untuk menginstal dan memuat
paket-paket ini.
Membaca data file ke dalam R Fungsi dasar R read.table()umumnya digunakan untuk membaca file
dalam format tabel dan mengimpor data sebagai bingkai data. Beberapa varian dari fungsi ini
tersedia, untuk mengimpor format file yang berbeda;

read.csv() digunakan untuk membaca file nilai yang dipisahkan koma (csv), di mana koma “,”
digunakan sebagai pemisah bidang
output
Hasilkan Awan Kata Awan kata adalah salah satu cara paling populer untuk memvisualisasikan dan menganalisis
data kualitatif. Ini adalah gambar yang terdiri dari kata kunci yang ditemukan di dalam badan teks, di mana
ukuran setiap kata menunjukkan frekuensinya di badan teks tersebut. Gunakan bingkai data frekuensi kata (tabel)
yang dibuat sebelumnya untuk menghasilkan awan kata. Dalam skrip R Anda, tambahkan kode berikut dan
jalankan untuk menghasilkan kata cloud dan tampilkan di bagian Plot RStudio.

Di bawah ini adalah penjelasan singkat tentang argumen yang digunakan dalam kata cloud
function;
kata – kata yang akan diplot freq
- frekuensi kata-kata min.freq
– kata-kata yang frekuensinya berada pada atau di atas nilai ambang ini diplot (dalam hal ini,
saya telah menyetelnya ke 9) max.words
– jumlah maksimum kata yang akan ditampilkan pada plot (pada kode di atas, saya telah
mengaturnya menjadi 200) random.order
– Saya telah menyetelnya ke FALSE, sehingga kata-kata diplot dalam urutan penurunan

Anda mungkin juga menyukai