20.11.3412 - Ghanim Ramadhan Laporan Praktikum Collaborative Filtering

Anda mungkin juga menyukai

Anda di halaman 1dari 4

Laporan Praktikum Collaborative Filtering

A. Install Pyspark, SparkSession dan Library

Perintah di atas digunakan untuk melakukan instalasi Pyspark, SparkSession, dan


Library yang akan digunakan.

B. Import Dataset
Perintah diatas digunkan untuk membaca dataset dengan format txt dan mengubah
nya ke RDD. Setelah diubah ke RDD, lalu dilakukan transformasi metode map() untuk
membagi RDD menjadi beberapa bagian atau kolom dan memberikan label untuk
setiap kolom.

C. Create Dataframe dan Split Data

Perintah diatas digunakan untuk membuat dataframe dan melakukan split data dengan
fungsi randomsplit perbandingan 0.8 : 0.2.
D. Training dan Testing Data

Perintah diatas digunakan untuk melakukan training dan testing data menggunakan
library ALS. Library ALS adalah algoritma faktorisasi matrix untuk memperkirakan
ratings matrix satu dan lainya. Kemudian dilakukan Evaluasi model menggunakan
RegressionEvaluator dengan menghitung beberapa uji statistik yang umum digunakan
untuk menentukan keakuratan beberapa kolom (Nilai Prediksi). Ini mewakili prediksi
terhadap satu kolom (Nilai Aktual) yang ditetapkan sebagai "kebenaran dasar".

E. Evaluation
Perintah diatas digunakan untuk menguji model yang sudah dibuat.

Anda mungkin juga menyukai