20.11.3412 - Ghanim Ramadhan Laporan Praktikum Collaborative Filtering
20.11.3412 - Ghanim Ramadhan Laporan Praktikum Collaborative Filtering
20.11.3412 - Ghanim Ramadhan Laporan Praktikum Collaborative Filtering
B. Import Dataset
Perintah diatas digunkan untuk membaca dataset dengan format txt dan mengubah
nya ke RDD. Setelah diubah ke RDD, lalu dilakukan transformasi metode map() untuk
membagi RDD menjadi beberapa bagian atau kolom dan memberikan label untuk
setiap kolom.
Perintah diatas digunakan untuk membuat dataframe dan melakukan split data dengan
fungsi randomsplit perbandingan 0.8 : 0.2.
D. Training dan Testing Data
Perintah diatas digunakan untuk melakukan training dan testing data menggunakan
library ALS. Library ALS adalah algoritma faktorisasi matrix untuk memperkirakan
ratings matrix satu dan lainya. Kemudian dilakukan Evaluasi model menggunakan
RegressionEvaluator dengan menghitung beberapa uji statistik yang umum digunakan
untuk menentukan keakuratan beberapa kolom (Nilai Prediksi). Ini mewakili prediksi
terhadap satu kolom (Nilai Aktual) yang ditetapkan sebagai "kebenaran dasar".
E. Evaluation
Perintah diatas digunakan untuk menguji model yang sudah dibuat.