M.Mirzan Hidayat - Kuis Big Data M14
M.Mirzan Hidayat - Kuis Big Data M14
MIRZAN HIDAYAT
NPM : 5210811147
MATKUL : BIG DATA DAN DATA ANALYTIC
KUIS
Berdasarkan hasil analisis data yang telah dilakukan bisa dilihat bahwa
terjadi perubahan kalimat diamana kalimat pada create document yang dimasukkan
tadi, setelah dianalisis menggunakan operator Create Document => Tokenize =>
Steam (Porter). Kalimat tersebut menjadi lebih ringkas dari kalimat sebelumnya.
Untuk lebih jelasnya bias dilihat pada gambar dibawah :
Note : Kalimat berwarna yang berada di atas tersebut merupakan hasil perubahan
dari kalimat aslinya yaitu kalimat yg dibawah
➢ Result
Dari hasil di atas ditampilkan jumlah kemunculan kata dalam document dan
jumlah kata dalam berapa dokumen, Kemudian kita akan memunculkan 10
kata terbanyak dalam hasil tersebut :
− di = 21 kali
− dan = 14 kali
− yang = 10 kali
− jogja = 9 kali
− makan = 9 kali
− nasi = 9 kali
− jam = 8 kali
− hanya = 8 kali
− wd = 8 kali
− ke = 7 kali
− buka = 6
− kt = 6
− Yogyakarta = 6
− Jt = 6
− Juga = 6
Untuk menampillkan hasil visualisasi dari jumlah kemunculan document
tersebut kita menggunakan operator Generate TF-IDF,