590 1266 1 PB

JURNAL ITSMART Vol 1. No 2.
Desember 2012 ISSN : 2301–7201
Penerapan Metode Collaborative Filtering

Menggunakan Rating Implisit pada
Sistem Perekomendasi Pemilihan Film di Rental VCD
Lisniati Dzumiroh Ristu Saptono
Jurusan Informatika Jurusan Informatika
Universitas Sebelas Maret Universitas Sebelas Maret
Jl. Ir. Sutami 36A Surakarta Jl. Ir. Sutami 36A Surakarta
lisniati.dz@gmail.com r_saptono@uns.ac.id
ABSTRAK Terdapat dua pendekatan utama dalam proses rekomendasi,

Untuk membangkitkan rekomendasi film yang bersifat personal yaitu content based filtering dan collaborative filtering. Content
dan dapat sedikit di luar dugaan bagi member di suatu rental based filteringmemberikan rekomendasi item yang
VCD, diterapkan metode collaborative filtering kemungkinan disukai oleh user tertentu berdasarkan
recommendation.Collaborative filtering memungkinkan karakteristik dari item yang sebelumnya telah mendapat
munculnya item yang memiliki karakteristik sama sekali penilaian positif dari user yang bersangkutan. Akibatnya,
berbeda dari item-item yang pernah dipilih sebelumnya namun metode ini hanya dapat memberikan rekomendasi berupa item-
ternyata menarik bagi user bersangkutan, karena rekomendasi item yang karakteristiknya mirip dengan item-item yang pernah
didasarkan pada preferensi user -user lain juga. Feedback dipilih sebelumnya.Item yang memiliki karakteristik sama
ditangkap secara implisit berupa data biner dengan hanya sekali berbeda dari item-item yang pernah dipilih sebelumnya
didasarkan pada perilaku seorang member apakah dia namun mungkin sebenarnya menarik bagi user yang
menyewa (‘1’) ataukah belum menyewa (‘0’) suatu judul film bersangkutan, tidak akan pernah direkomendasikan.
tertentu.Metode collaborative filtering yang digunakan adalah Collaborative filtering memungkinkan hal ini terjadi karena
user-based collaborative filtering, item -based collaborative rekomendasi berdasarpada preferensi user-user lain juga, yaitu
filtering, dan item-based collaborative filtering yang dengan asumsi bahwa user-user dengan selera yang hampir
dikombinasikan dengan fitur konten. Hasil dari pengujian ketiga sama akan memberi penilaian terhadap item-item dengan cara
metode menunjukkan bahwa pada penggunaan user-based yang hampir sama pula [1]. Dalam pembuatan sistem
collaborative filtering terjadi kesalahan prediksi rata -rata perekomendasi pemilihan film di rental VCD in i, dipilih
sebanyak 58,8%; pada item-based collaborative filtering terjadi menggunakan metode collaborative filtering.
kesalahan prediksi rata-rata sebanyak 24,9%;sedangkan pada Feedback dari user dalam bentuk rating merupakan bagian
item-based collaborative filtering yang dikombinasikan dengan yang tidak dapat dipisahkan dari sistem perekomendasi
fitur konten terjadi kesalahan prediksi rata -rata sebanyak collaborative filtering. Explicit feedback memungkinkan untuk
24,4%. Pengkombinasian collaborative filtering dengan fitur didapatkannya deskripsi yang akurat mengenai preferensi
konten mengakibatkan hasil rekomendasi yang muncul tidak seorang user. Namun, masalah yang dihadapi oleh cara
lagi memiliki karakteristik rekomendasi hasil collaborative pengumpulan feedback secara eksplisit adalah diperlukannya
filtering. effort tambahan dari sisi user yang menjadikan pengumpulan
explicit feedback menjadi relatif sukar sebab tidak semua user
Kata Kunci dengan senang hati melakukan aksi pemberian feedback ini.
item-based collaborative filtering,kombinasi fitur konten, rating Pada kasus rental VCD, pemberian feedback secara eksplisit
implisit, user-based collaborative filtering sukar diimplementasikan karena kegiatan normal di rental VCD
hanya sewa dan kembali, tanpa user harus repot-repot
1. PENDAHULUAN memberikan penilaiannya terhadap film yang baru saja ia sewa.
Seringkali ketika seseorang memasuki suatu rental VCD, ia Hal ini berakibat pengumpulan rating dalam rentang numerik
mengalami kebimbangan disebabkan oleh begitu banyaknya seperti pada kebanyakan sistem perekomendasi tidak mungkin
pilihan film yang tersedia. Hal seperti ini terjadi khususnya bagi untuk dilakukan. Maka, rating yang ditangkap secara implisit
mereka yang sebelumnya tidak memiliki cukup informasi berupa data biner dengan hanya didasarkan pada perilaku
seperti dari membaca review-review film, atau bagi mereka seorang member apakah dia menyewa (‘1’) ataukah belum
yang memang belum memiliki tujuan pas ti akan menyewa suatu menyewa (‘0’) suatu judul film tertentu.
judul film tertentu. Member-member seperti ini tentu
memerlukan bentuk rekomendasi dari member-member lain. Pada penelitian ini, diimplementasikan metode collaborative
Tatanan rak khusus untuk film-film yang direkomendasikan filtering menggunakan rating implisit biner untuk menyediakan
(recommended) pada dasarnya memuat film-film yang memang rekomendasi personal bagi member-member di rental VCD
terkenal sehingga tanpa perlu direkomendasikan pun berupa film-film yang mungkin menarik sehingga akhirnya
sebenarnya banyak memberrental VCD tersebut yang akan dapat membantu dalam proses pemilihan film -film yang ingin
menyewanya. Terkadang seseorang menginginkan rekomendasi disewa.
yang sedikit di luar dugaan. Kemungkinan film yang sama
sekali tidak terpikirkan olehnya namun ternyata menarik untuk 2. SISTEM PEREKOMENDASI
dilihat dan sesuai dengan seleranya. Ide awal sistem perekomendasi muncul sejak berkembangnya
Internet yang menimbulkan permasalah baru yang disebut
Solusi dari permasalahan di atas adalah disediakannya suatu dengan information overload. Pengguna seringkali dihadapkan
sistem perekomendasi di dalam rental VCD tersebut yang dengan situasi dimana mereka mempunyai terlalu banyak opsi
mampu menyediakan rekomendasi yang bersifat personal.
54
JURNAL ITSMART Vol 1. No 2. Desember 2012 ISSN : 2301–7201
untuk dipilih, sehingga mereka membutuhkan bantuan dalam 2.2 Metode dalam CF Recommendation
menentukan preferensi dari begitu banyaknya pilihan yang ada Ada dua pendekatan utama dalam metode collaborative
[2]. filtering, yaitu:
Sistem perekomendasi (recommender system) merupakan suatu a. User-based collaborative filtering
agen perangkat lunak yang mempelajari minat dan preferensi
seorang pengguna individu terhadap produk -produk, kemudian Pendekatan ini bersandar pada fakta bahwa seorang user
menyediakan rekomendasi yang sesuai dengan kebutuhan mengikuti kelompok (group) lebih besar (yang perilaku
pengguna bersangkutan [3]. Sistem perekomendasi mempunyai individunya sama). Rekomendasi didasarkan pada item-item
karakteristik sebagai salah satu jenis dari customer decision yang sering dibeli/disukai oleh berbagai anggota kelompok.
support system (DSS) dikarenakan sistem perekomendasi: (a) Metode yang paling umum digunakan adalah nearest neighbors
merupakan sebuah sistem informasi, (b) digunakan dalam method.Berdasar pada item-item yang telah dipilih oleh
pengambilan keputusan, dan (c) digunakan untuk mendukung, tetangga terdekat seorang user, item-item yang kemungkinan
bukan menggantikan, manusia dalam pengambilan akan dipilih oleh user tersebut di masa yang akan datang
keputusannya. Sama seperti jenis DSS yang lain, pada sistem diprediksi [5]. Algoritma yang sering digunakan antara lain
perekomendasi, customer menyediakan masukan (berupa algoritma Pearson correlation coefficient (PCC) dan algoritma
karakteristik produk yang diinginkan atau berupa rating vector space similarity (VSS).
terhadap produk) yang kemudian digunakan oleh sistem untuk
b. Item-based collaborative filtering
membangkitkan rekomendasi bagi customer yang bersangkutan.
Meskipun begitu, sistem perekomendasi berbeda dengan DSS Pendekatan ini bersandar pada relasi antar item, dianalisa dari
dalam hal penggunanya. Pengguna DSS biasanya adalah informasi historis sehingga pembelian dari suatu item
general manager atau analyst yang memanfaatkan sistem untuk mengarahkan pembelian terhadap item lain (himpunan item).
membantu pekerjaan-pekerjaan seperti perencanaan pemasaran, Rekomendasi didasarkan pada fakta bahwa seorang user
perencanaan logistik, atau perencanaan keuangan, sementara cenderung memilih item yang mirip dengan item-item yang
pengguna sistem perekomendasi adalah customer yang telah dipilihnya di masa lampau [6].
menghadapi masalah yang disebut sebagai preferential choice
problem. 2.3 Pendekatan CF untuk Data Biner
Pendekatan collaborative filtering, baik user-based maupun
2.1 Collaborative Filtering Recommendation item-based, menggunakan keseluruhan atau sampel dari basis
Collaborative filtering(CF) merupakan proses penyaringan atau data user-item untuk membangkitkan prediksi. Langkah -
pengevaluasian item dengan menggunakan opini dari orang langkahnya secara garis besar sebagai berikut [7]:
lain. Ide utamanya adalah untuk mengeksploitasi informasi
mengenai perilaku di masa lampau maupun opini dari suatu a. Perhitungan similarity
komunitas pengguna yang kemudian digunakan untuk Pada user-based collaborative filtering , di langkah ini dihitung
memprediksi item mana yang akan disukai atau menarik ba gi nilai similarityantarsetiap pasanguser.Ada berbagai macam
seorang pengguna. CF murni menggunakan matriks yang berisi algoritma untuk perhitungan similarity, salah satunya adalah
user-item rating sebagai satu-satunya input, sedangkan output Pearson Correlation Coefficient (PCC). PCC mengukur
yang dihasilkan ada dua jenis: (1) prediksi (numerik) yang besarnya hubungan satu sama lain antara dua variabel.
mengindikasikan seberapa besar tingkat kesukaan seorang
pengguna terhadap sebuah item, dan (2) sebuah daftar berisi Algoritma perhitungan similarity PCC tidak dapat digunakan
nitem yang direkomendasikan [4].Istilah pengguna (user) dalam pada data biner karena untuk menggunakan PCC , data yang
CF mengacu kepada mereka yang memberi penilaian terhadap dicari korelasinya harus berskala interval dan berdistribusi
item-item di dalam sistem, sekaligus nantinya menerima kontinu [8].Perhitungan similarity yang dapat digunakan di
rekomendasi dari sistem. antaranya adalah cosine similarity untuk data biner.
Tabel 1.Representasi matriks user-item rating Cosine similarity antara usera dan b ditunjukkan sebagai
berikut
User Item1 Item2 Item3 Item4 Item5
Alice 1 1 1 1 0 ,
User1 1 1 1 0 1
User2 1 1 0 1 0 dengann(A)adalah banyaknya item yang telah dipiliholeh usera,
User3 0 0 1 1 1 n(B)adalah banyaknya item yang telah dipiliholeh userb, dan
adalah banyaknya item yang telah dipilihbaik oleh
usera maupun b.
Rating dapat dikumpulkan dengan cara ekspisit, implisit, atau
keduanya bersamaan. Rating eksplisit adalah ketika seorang Dari contoh matriks user-item rating yang ditunjukkan dalam
pengguna secara langsung diminta untuk memberikan opini Tabel 1, dapat dihitung cosine similarity antara Alice dengan
terhadap suatu item.Rating implisit mengandung arti bahwa User1 sebagai berikut
sistem secara otomatis mendapatkan preferensi pengguna secara
pasif dengan me-monitor aksi pengguna.Penilaian hanya , ,
didasarkan pada perilaku pengguna, misalnya ketika seorang
memberdi perpustakaan memutuskan untuk meminjam suatu
itembuku maka member tersebut dianggap tertarik atau Pada item-based collaborative filtering, yang dihitung bukan
menyukai item tersebut, dan sebaliknya dianggap tidak tertarik similarity antar user melainkan similarity antar item.Sehingga
atau tidak menyukai apabila tidak meminjamnya.Dengan cara jika berpedoman pada rumusan yang sama di atas, n(A)adalah
ini, user profile dibentuk tanpa melibatkan effort tambahan dari banyaknya user yang telah memilih itema, n(B)adalah
user. Kekurangan dari cara ini tentu saja bahwa dugaan banyaknya user yang telah memilih itemb, dan adalah
feedback bisa jadi tidak tepat [1]. banyaknya user yang telah memilihkedua itema dan b.
55
Dari contoh matriks user-item rating yang ditunjukkan dalam fitur-fitur konten dari katalogitem. Tabel 2 menggambarkan
Tabel 1, dapat dihitung cosine similarity antara Item3 dengan penerapan penambahan fitur konten dalam domain film.
Item5 sebagai berikut
Tabel 2. Fitur konten
, , Item Genre
Item1 Drama/Romance
b. Perhitungan prediksi dan rekomendasi Item2 Horror/Mystery
Pada user-based collaborative filtering ,di langkah ini sebuah Item3 Horror/Mystery
subsetuser tetangga terdekat (nearest neighbor) dari seorang Item4 Horror/Mystery
user aktif dipilih berdasar pada similarity mereka terhadap user Item5 Comedy
bersangkutan. Untuk membuat rekomendasi bagi user aktif kita Tabel 1 menampilkan fitur collaborative berupa
dapat menggunakan langkah-langkah berikut ini: userbesertarating-nya terhadap katalog film. Rating dibentuk
(1) Menemukanusertetangga terdekat dengan nilai secara implisit melalui observasi terhadap user feedback,
similarity yang paling besar. misalnyapenyewaan.Informasi produk dibatasi pada genre item.
(2) Menghitung nilai prediksi terhadap item-item yang Pada pendekatan collaborative murni, tanpa memandang fitur
pernah dipilih oleh user tetangga terdekatnamun belum produk sama sekali, Alice dan User1dengan mudah dianggap
pernah dipilih oleh user aktif, dengan rumus sebagai sebagai “tetangga dekat”. Akan tetapi, pendekatan feature
berikut combination mengidentifikasi bahwa Alice, tidak seperti User1,
, , belum pernah menyewa film ber-genre Comedy.Informasi ini
menyebabkan Alice dan User1 berada dalam “kelompok genre”
dengana adalah user aktif, p adalah item yang dihitung yang berbeda.
prediksinya, danrubernilai ‘1’, yang menunjukkan
bahwa user tetangga terdekat,u,sudah pernah memilih 3. METODOLOGI PENELITIAN
itemp. Objek penelitian dalam penulisan tugas akhir ini adalah studi
kasus pada sistem perekomendasi untuk pemilihan film di rental
Dalam contoh, prediksi bagi Alice untuk Item5 berdasar pada
VCD dengan data yang digunakan dalam penelitian diambil
user tetangga terdekat, User1, adalah sebagai berikut
dari data transaksi dan katalog VCD di Odiva Video Rental
, , , cabang Fajar Indah Solo. Langkah-langkah yang dilakukan
digambarkan pada Gambar 1.
Pada item-based collaborative filtering ,di langkah ini sebuah
subsetitem tetangga terdekat (nearest neighbor) dipilih berdasar 3.1 Data Set
pada similarity mereka terhadap item-item yang pernah dipilih Sampel data diambil dari data transaksi penyewaan di Odiva
oleh user aktif. Langkah yang hampir serupa dilakukan untuk Video Rental cabang Fajar Indah Solo selama bulan Januari,
membuat rekomendasi bagi user aktif yaitu sebagai berikut: Februari, dan Maret 2012 sebanyak 1.345 transaksi yang
(1) Menemukan itemtetangga terdekat dengan nilai melibatkan 295item dan 218user (tingkat sparsity
similarity yang paling besar. 97,9%).Useryang mendapatkan rekomendasi film dari sistem
(2) Menghitung nilai prediksi terhadap item-item tetangga hanya user yang telah menyewa paling sedikit 3 judul film,
terdekat yang belum pernah dipilih oleh user aktif dengan pertimbangan bahwa dengan setiapuser minimal telah
berdasar pada similarity-nyaterhadap item iyang sudah menyewa 3 item, formasi neighborhood yang masuk akal sudah
pernah dipilih oleh user aktif, dengan rumus debagai dapat tercapai.
berikut
, ,
3.2 Implementasi CF untuk Binary Data
Metode collaborative filtering yang diimplementasikan adalah
dengana adalah user aktif, p adalah item yang dihitung user-based collaborative filtering, item -based collaborative
prediksinya, danrabernilai ‘1’, yang menunjukkan filtering, dan item-based collaborative filtering yang
bahwa user aktif sudah pernah memilih itemi. dikombinasikan dengan fitur konten.
Dalam contoh, prediksi bagi Alice untuk Item5 berdasar pada
item tetangga terdekat, Item3, adalah sebagai berikut
, , ,
c. Top-N Recommendation
Dari perhitungan prediksi dan rekomendasi, didapatkan
kandidat-kanidat item untuk direkomendasikan, yang kemudian
diseleksi menjadi hanya Nitem dengan nilai prediksi yang
paling tinggi (top-N recommendation), yang diasumsikan
mempunyai nilai peluang paling besar untuk dipilih oleh user
aktif. N item tersebut kemudian ditampilkan sebagai daftar item
yang direkomendasikan untuk user aktif.
2.4 Feature Combination Hybrid

Feature combination hybrid merupakan bentuk rekomendasi
yang memanfaatkan dua atau lebih masuk an data dari jenis
yang berbeda. Basu[9] mengajukan sebuah feature combination
hybrid yang menggabungkan fitur-fitur collaborative dengan Gambar 1. Diagram metode penelitian
56
User profile direpresentasikan dengan matriks user-item rating 4. PEMBAHASAN

yang berisi data biner ‘0’ atau ‘1’. Nilai ‘0’ terhadap suatu item
berarti bahwa user yang bersangkutan belum pernah menyewa 4.1 Hasil Eksperimen
item tersebut, sedangkan nilai ‘1’ berarti bahwa user yang Dari data sampel yang sudah didapat, dipilih nilai rating untuk
bersangkutan sudah pernah menyewa item tersebut.Basis data dikosongkan dengan menghilangkan transaksi secara acak
member, transaksi penyewaan, dan katalog item diubah ke mulai dari 10%, 20%, 30%, 40%, dan 50%.Untuk setiap data
dalam bentuk matriks user-item sebagai training set untuk sampel yang telah dikosongkan secara acak, dihitung prediksi
membentuk initial user profile. dengan tiga metode yang berbeda, yaitu user-based
collaborative filtering, item-based collaborative filtering , dan
Pada item-based collaborative filtering yang dikombinasikan item-based collaborative filtering yang dikombinasikan dengan
dengan fitur konten, suatu informasi baru ditambahkan sebagai fitur konten.Untuk masing-masing pengosongan nilai rating
fitur konten.Pada penelitian ini, informasi tambahan dibatasi dan perhitungan nilai prediksi pada tiap metode, dilakukan
hanya pada genre item. Pengklasifikasian item terhadap genre percobaan sebanyak 40 kali.
dibatasi hanya ke dalam lima macam genre, yaitu:
Action/Adventure, Drama/Romance, Horror/Mystery, Comedy, Tabel 4 dan Gambar2 menunjukkan perbandingan nilai MAE
dan Kids/Animation. User kemudian dikelompokkan sesuai yang dihasilkan dari seluruh pengujian yang telah dilakukan.
dengan genre item yang sudah pernah disewa. Pada saat Tabel 4. Perbandingan nilai MAE
perhitungan prediksi dan rekomendasi dengan item-based
collaborative filtering, genre item yang akan diprediksi terlebih User-based Item-based Item-based
dahulu dicocokkan dengan kelompok genre milik user aktif. Pengosongan collaborative collaborative dengan fitur
Apabila tidak cocok, maka item tersebut tidak akan dihitung rating filtering filtering konten
prediksinya sehingga tidak mungkin pula masuk dalam daftar 10% 0,812 0,733 0,728
item yang direkomendasikan untuk user bersangkutan.
20% 0,809 0,728 0,726
Pengelompokan user berdasar hasil penggabungan antara fitur 30% 0,809 0,721 0,719
collaborativedari Tabel 1 dengan fitur konten dari Tabel 2
ditunjukkan pada Tabel 3. 40% 0,804 0,708 0,707
Tabel 3. Pengelompokan user berdasar genre item 50% 0,796 0,694 0,694
Rata-rata 0,806 0,717 0,715
User Genre
Alice Drama/Romance, Horror/Mystery
User1 Drama/Romance, Horror/Mystery, Comedy Pada levelpengosongan rating yang semakin besar, pada
User2 Drama/Romance, Horror/Mystery umumnyaakandihasilkan nilai rata-rata MAE yang semakin
User3 Horror/Mystery, Comedy besar pula dikarenakan tingkat sparsity semakin bertambah.
Namun, pada pengujian ini nilai rata-rata MAE cenderung tidak
3.3 Metrik Evaluasi mengalami perubahan yang berart i, atau bahkan sedikit
Kualitas sebuah sistem perekomendasi dapat diputuskan dari menurun.Hal ini disebabkan karena tingkatsparsity yang
hasil evaluasi.Tipe metrik yang digunakan bermacam -macam, dihasilkan pada setiap level pengosongan rating sebenarnya
namun salah satu yang paling sering digunakan di literatur - tidak banyak berubah, yaitu tetap dalam kisaran 98% .Pada
literatur penelitian adalah Mean Absolute Error (MAE) [9]. pengujian yang dilakukan dengan perhitungan nilai rata-rata
MAE menghitung rata-rata perbedaan mutlak antara rating probabilitas kesalahan, hasil yang serupa terjadi.Nilai rata-rata
prediksi dengan rating sebenarnya, sebagai berikut probabilitas kesalahan cenderung tidak mengalami perubahan
yang berarti, atau bahkan sedikit menurun.
∑ , , ,
0.830
dengann adalah total banyaknya rating oleh semua user, pi,j 0.810
user-based
adalah rating prediksi untuk useri terhadap item j, dan ri,j adalah 0.790
rating sebenarnya. Semakin kecil nilai MAE, semakin bagus 0.770
prediksi yang dihasilkan. 0.750
E
A
M item-based
0.730
Metrik evaluasi lain digunakan pada pengukuran kualitas 0.710
rekomendasi di penelitian ini,yaitu dengan menghitung 0.690
probabilitas kesalahan prediksi . Nilai threshold yang digunakan
0.670 item-based
adalah 0,2. Nilai tersebut dipilih mengingat tingginya tingkat
0.1 0.2 0.3 0.4 0.5 dengan fitur
sparsity dan besarnya data sampel yang digunakan.
konten
Dengan menggunakan nilai threshold 0,2; hasil prediksi kontinu pengosongan rating
dikonversikan ke dalam bilangan biner 0 atau 1.
0 0,2 Gambar 2. Perbandingan nilai MAE
1 0,2
Tabel 5 dan Gambar3 menunjukkan perbandingan nilai
Probabilitas kesalahan prediksi kemudian dihitung dengan probabilitas kesalahan prediksi yang dihasilkan dari seluruh
membandingkan antara jumlah prediksi yang salah dengan pengujian dengan nilai threshold 0,2.
jumlah prediksi keseluruhan.
57
Tabel 5. Perbandingan nilai probabilitas kesalahan yang ber-genre sama dengan film-film yang sudah pernah
disewa oleh user bersangkutan sehingga hasil rekomendasi
User-based Item-based Item-based tidak lagi “di luar dugaan”.
Pengosongan collaborative collaborative dengan fitur
filtering filtering konten Karena semakin kecil nilai kesalahan berarti semakin baik
rating
akurasi prediksi yang dihasilkan, maka dapat dikatakan bahwa
10% 0,612 0,272 0,254 metodeitem-based collaborative
20% 0,602 0,281 0,278 filteringmenghasilkanakurasiprediksiyanglebihbaik dibanding
dengan metode user-based collaborative filtering , sedangkan
30% 0,597 0,265 0,262
metode item-based collaborative filtering yang dikombinasikan
40% 0,578 0,222 0,224 dengan fitur kontenmemberikan akurasi yang hanya sedikit
50% 0,553 0,202 0,201 lebih baik dibanding dengan metode item-based collaborative
filtering.
Rata-rata 0,588 0,249 0,244
5. KESIMPULAN
Untukmenyediakan rekomendasi film personal bagi member di
0.700 rental VCD dengan berdasar pada rating implisit yang didapat,
0.600
telah diimplementasikan metode collaborative filtering untuk
user-based data biner.Metode collaborative filtering yang digunakan
0.500
adalah user-based collaborative filtering, item-based
0.400 collaborative filtering, dan item-based collaborative filtering
0.300 item-based yang dikombinasikan dengan fitur konten.
0.200
ailty
b
p
ero Kualitas rekomendasi yang dihasilkan oleh penggunaan
0.100 metodeitem-based collaborative filtering lebih baik
0.000 item-based dibandingkan dengan kualitas rekomendasi yang dihasilkan
0.1 0.2 0.3 0.4 0.5 dengan fitur oleh penggunaan metode user-based collaborative filtering.Hal
konten tersebut ditunjukkan dengan akurasi prediksi yang diukur dari
pengosongan rating rata-rata nilai MAE dan probabilitas kesalahanyang dihasilkan
oleh metode item-based collaborative filtering lebih rendah
dibandingkan dengan user-based collaborative filtering , seperti
Gambar 3. Perbandingan nilai probabilitas kesalahan
terlihat dalam Gambar 2 dan Gambar 3. Metode item-based
4.2 Analisis collaborative filtering yang dikombinasikan dengan fitur konten
Akurasi prediksi diukur dengan menggunakan metrik MAE dan hanya sedikit sekali memperbaiki aku rasi prediksi yang
rata-rata probabilitas kesalahan prediksi. Metrik probabilitas dihasilkan oleh metode item-based collaborative filtering , atau
kesalahan prediksi digunakan karena MAE cenderung tidak dapat dikatakan perbaikan kualitas rekomendasi yang
sesuai digunakan untuk pengujian kualitas hasil prediksi pada dihasilkan tidak signifikan. Selain itu, pengkombinasian
sistem perekomendasi yang menggunakan data biner untuk collaborative filtering dengan fitur konten mengakibatkan hasil
rating-nya. MAE menggunakan rating prediksi kontinu yang rekomendasi yang muncul tidak lagi memiliki karakteristik
bernilai antara 0 hingga 1 untuk mengukur kesalahan prediksi, rekomendasi hasil collaborative filtering.
padahal sistem perekomendasi yang dibangun lebih berbasis
pada kejadian (occurence) biner apakah seorang user menyewa
6. DAFTAR PUSTAKA
[1] Schafer, J. B., D. Frankowski, J. Herlocker, dan S. Sen.
atau belum menyewa suatu item tertentu, atau dengan kata lain
2007. Collaborative Filtering Re commender System. The
lebih bersifat probabilistik.
Adaptive Web (Peter Brusilovsky, Alfred Kobsa, and
Pengujian metode user-based collaborative filtering , item- Wolfgang Nejdl, eds.)Lecture Notes in Computer Science
based collaborative filtering, dan item-based collaborative Vol. 4321 pp. 291-324.Springer - Verlag Berlin
filtering yang dikombinasikan dengan fitur konten Heidelberg
padasampelsebanyak 1.345 transaksiyang
[2] Montaner, M., B. Lopez, dan J.L. De La Rosa. 2003. A
dilakukansebanyak40kalidenganpengosonganratingsecara
Taxonomy of Recommender Agents on the Internet.
acakdari10%, 20%, 30%, 40%, dan 50%sebagaimana terlihat
Artificial Intellegence Review 19 pp.285-330. Netherlands:
dalam Tabel 5 diperolehhasilbahwapenggunaan metodeitem-
Kluwer Academic Publisher
based collaborative filtering menurunkannilai rata-rata
probabilitas kesalahan prediksisebesar 0,339 (dari 0,588 [3] Xiao, B. dan Benbasat, I. 2007. E-Commerce Product
menjadi 0,249) atau sebesar 57,7% dari nilai rata- Recommendation Agents: Use, Characteristics, and
rataprobabilitas kesalahan yang dihasilkan dari penggunaan Impact. MIS Quarterly 31 No. 1 pp. 137-209
metodeuser-based collaborative filtering . Penggunaan [4] Jannach, D., M. Zanker, A. Felfernig, dan G. Friedrich.
metodeitem-based collaborative filtering yang dikombinasikan 2011. Recommender Systems: An Introduction . New York:
dengan fitur konten menurunkannilai rata-rata probabilitas Cambridge University Press
kesalahan sebesar 0,005 (dari 0,249 menjadi 0,244) atau sebesar
1,9% dari nilai rata-rataprobabilitas kesalahan yang dihasilkan [5] Babu, M.S.P., dan Kumar, B.R.S. 2011. An
dari penggunaan metodeitem-based collaborative filtering. Implementation of the User-based Collaborative Filtering
Akan Namun, pengkombinasian item-based collaborative Algorithm. International Journal of Computer Science and
filtering dengan fitur konten berdampak pada hasil rekomendasi Information Technologies, Vol. 2 (3), pp. 1283-1286
yang sudah tidak lagi memiliki karakteristik rekomendasi hasil [6] Deshpande, M. dan Karypis, G. 2004. Item-based Top-N
collaborative filtering. Film-film yang muncul dalam daftar Recommendation Algorithms . ACM Transactions on
rekomendasi oleh metode item-based collaborative filtering Information Systems 22 No. 1 pp. 143-177
yang dikombinasikan dengan fitur konten merupakan film -film
58
[7] Su, X.Y. dan Khoshgoftaar, T.M. 2009. A Survey of [9] Basu, C., H. Hirsh, dan W. Cohen. 1998. Recommendation
Collaborative Filtering Techniques . Review Article as Classification: Using Social andContent-Based
Advances in Artificial Intellegence, Vol. 2009, Article ID Information in Recommendation.Proceedings of the 15th
421 425, doi:10.1155/2009/421425 . Hindawi Publishing NationalConference on Artificial Intelligence, American
Corporation Association for Artificial Intelligence, pp. 714-720
[8] Irianto, A. 2008. Statistika Konsep Dasar dan Aplikasinya .
Jakarta: Prenada Media Group
59

590 1266 1 PB

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

590 1266 1 PB

Diunggah oleh

Hak Cipta:

Format Tersedia

JURNAL ITSMART Vol 1. No 2.

Desember 2012 ISSN : 2301–7201

Penerapan Metode Collaborative Filtering

ABSTRAK Terdapat dua pendekatan utama dalam proses rekomendasi,

2.4 Feature Combination Hybrid

User profile direpresentasikan dengan matriks user-item rating 4. PEMBAHASAN

Anda mungkin juga menyukai