Anda di halaman 1dari 11

library.uns.ac.id digilib.uns.ac.

id

BAB II

TINJAUAN PUSTAKA

2.1.DASAR TEORI
2.1.1 Collaborative Filtering
Collaborative filtering (CF) adalah teknik bagaimana membuat
prediksi otomatis atau rekomendasi tentang minat seorang user dengan
pengumpulan informasi cita rasa dari banyak user. Adapun yang mendasari
asumsi pendekatan CF adalah bahwa mereka yang menyetujui di masa lalu
cenderung setuju lagi di masa yang akan datang. Prinsip kerja dari CF adalah
memberikan prediksi atau rekomendasi item berdasarkan pada opini user-
user yang memunyai kemiripan (Sarwar, Karypis, Konstan, & Riedl, 2001).
Tujuan dari CF adalah merekomendasikan item baru atau
memprediksi evaluasi item kepada pengguna khusus berdasarkan pada
ketertarikan sebelumnya dari user tersebut dan opini user-user lain yang
mempunyai ketertarikan yang mirip. Di dalam CF terdapat m user 𝑈 = 𝑢1 ,
𝑢2 , … , 𝑢𝑚 dan daftar n item 𝐼 = {𝑖1 , 𝑖2 , … , 𝑖𝑛 }. Setiap user 𝑢m mempunyai
daftar item 𝐼𝑢n yang menggambarkan opini dari user tersebut. Opini
diberikan secara eksplisit oleh user berupa suatu rating score, biasanya
dalam skala kuantitatif tertentu, atau bisa juga secara implisit yang diperoleh
dari arsip transaksi, dengan melakukan analisis terhadap logs, navigation
history, atau dengan cara yang lain (Sarwar et al., 2001).
Ada dua hal utama yang dilakukan sistem rekomendasi dengan CF,
yaitu : 1. Prediksi, melakukan prediksi opini yang akan diberikan kepada
pengguna dalam skala bilangan yang sama, 2. Rekomendasi, memberikan
rekomendasi berupa daftar item dengan nilai prediksi tertinggi. Item-item
yang direkomendasikan belum pernah di rating sebelumya oleh user
tersebut (Saptono, 2010).

7
library.uns.ac.id digilib.uns.ac.id

2.1.2 Cosine Similarity


Dalam hal ini, dua item dianggap sebagai dua vektor di dalam user-
space dimensi m. Similarity diantara item-item dihitung dengan perhitungan
kosinus sudut antara dua vektor. Prinsip perhitungaannya, dua vektor
dikatakan sama jika membentuk sudut 0° (nol derajat), atau nilai cosinusnya
sama dengan 1 (satu). Secara formal, di dalam matriks m x n, similarity
antara item i dan j, dinotasikan dengan sim(i,j) diberikan oleh

(2.1)
Notasi ∙ adalah dot-product dari dua vektor, 𝑖 = [𝑖1 𝑖2 … 𝑖m ] dan 𝑗 = [𝑗1 𝑗2 …
𝑗𝑛 ].

2.1.3 Item-based Collaborative Filtering


Metode item-based collaborative filtering menggunakan item-item
yang telah di-rating oleh pengguna sebagai dasar perhitungan. Algoritma ini
menghitung kemiripan item-item yang telah dirating dengan item-item lain
dan selanjutnya dipilih sekelompok item yang memiliki kemiripan dengan
item yang sudah di-rating. Nilai kemiripan tersebut akan dijadikan nilai
bobot untuk memprediksi nilai rating pada item target.
Proses pada item-based collaborative filtering juga terdiri dari empat
langkah seperti pada user based collaborative filtering. Profile
representation yang digunakan berupa user-item rating matrix. Pada proses
item neighborhood, algoritma yang digunakan untuk menghitung item-item
similarity sama seperti yang digunakan pada user neighborhood yaitu
menggunakan cosine based similarity dan Pearson correlation (Leben,
2008). Untuk melakukan prediksi berdasarkan item neighborhood yang
telah dibentuk dapat menggunakan penjumlahan terbobot dan regresi
(Sarwar et al., 2001). Kelebihan dari metode item-based collaborative
filtering adalah kecepatan. Metode ini dapat menghasilkan rekomendasi
dalam waktu singkat. Sedangkan kelemahannya adalah kualitas
rekomendasi yang dihasilkan cenderung kurang baik.

8
library.uns.ac.id digilib.uns.ac.id

2.1.4 Item-based Multi Criteria Collaborative Filtering


Munculnya gagasan multicriteria collaborative filtering didasari
kenyataan bahwa banyak item yang nilai ratingnya tidak bisa diwakili hanya
dengan satu kriteria saja. Sebagai contoh, dalam suatu sistem e-commerce,
produk dinilai oleh pelanggan berdasarkan beberapa kriteria, seperti kualitas
barang, harga, pengiriman, layanan purna jual dan lain sebagainya
(Adomavicius & Kwon, 2015).
Oleh karena itu, penggunaan teknik collaborative filtering klasik
(dengan satu kriteria) dalam beberapa aplikasi sering tidak relevan dan tidak
mengakomodasi opini yang diberikan oleh pengguna. Untuk mempermudah
pemahaman terhadap konsep item based multi criteria collaborative
filtering diberikan ilustrasi seperti Tabel 2.1. Nampak dalam gambar bahwa
setiap pengguna memberikan nilai rating untuk empat kriteria yang berbeda.
Dari empat nilai rating tersebut kemudian dilakukan perhitungan nilai rating
keseluruhan (overall). Misalnya nilai rating yang diberikan u1 untuk i1
adalah 2, 2, 8, 8 dan nilai rating keseluruhan adalah 5, yang merupakan hasil
rata-rata dari nilai keempat kriteria tersebut. Fungsi rata-rata hanya sebagai
contoh sederhana saja.

Tabel 2.1 Tabel Ilustrasi Item-based Multi Criteria Collaborative


Filtering

I1 I2 I3 I4 I5
U1 5(2,2,8,8) 5(2,2,8,8) 4(6,6,2,2) 4(6,6,2,2) 4(2,2,6,6)
U2 5(3,3,7,7) 5(3,3,7,7) 6(8,8,4,4) 6(8,8,4,4) 6(4,4,8,8)
U3 5(2,2,8,8) 5(2,2,8,8) 4(6,6,2,2) 4(6,6,2,2) 4(2,2,6,6)
U4 5(3,3,7,7) 5(3,3,7,7) 6(8,8,4,4) 6(8,8,4,4) 6(4,4,8,8)
U5 4 4 7 7 ?

Kalau pada teknik collaborative filtering klasik sebelumnya item i3


dan i4 sebagai item yang paling mirip dengan i5, maka pada konsep multi
criteria hal itu tidak berlaku. Hal ini disebabkan oleh perbedaan yang sangat

9
library.uns.ac.id digilib.uns.ac.id

jauh nilai rating multi criteria antara i3 dan i4 dengan i5 meskipun nilai rating
keseluruhan sama persis. Sebagai contoh, nilai rating yang diberikan u1
untuk i5 adalah 4(2,2,6,6) dan nilai rating yang diberikan u1 untuk i4 adalah
4(6,6,2,2). Jadi meskipun nilai keseluruhannya sama, yaitu 4 namun nilai dari
keempat kriterianya saling bertolak belakang.
Berdasarkan pendekatan item based multi criteria collaborative
filtering, item i1 dan i2 justru dinilai memiliki kemiripan dengan i5.
Meskipun nilai keseluruhan tidak mirip, yaitu 4 dan 5, namun nilai dari
masing-masing kriterianya justru lebih mendekati. Sehingga nilai prediksi
u5 untuk item i5 ditetapkan 4, sama dengan nilai yang diberikan oleh item i1
dan i2. Dengan demikian, terlihat sangat jelas bahwa konsep multi criteria
collaborative filtering akan memberikan hasil rekomendasi yang lebih
relevan kepada pengguna dibanding dengan collaborative filtering klasik.
Persoalannya adalah bagaimana menemukan pendekatan yang tepat untuk
menghitung nilai rating keseluruhan(Wiranto & Winarko, 2015).

2.1.5 Kriteria Film


Untuk menilai apakah sebuah film tersebut bagus atau tidak, terdapat
sembilan aspek penilaian yaitu ide cerita, plot, penokohan, acting, audio,
visual, suasana, hiburan dan amanat (Siagian, 2006). Namun hanya empat
aspek saja yang dijadikan kriteria pada sistem rekomendasi ini yaitu :
• Ide Cerita
Aspek ini menekankan pada originalitas atau ide dasar diciptakannya
film tersebut. Semakin unik ide cerita tentu semakin menarik, walaupun
tidak menutup kemungkinan ide yang mainstream mendapat nilai bagus.

• Plot
Aspek ini menekankan pada bagaimana cerita dalam film mengalir.
Cerita dalam hal ini menyangkut pembuka, klimaks, dan berbagai twist
yang dihadirkan. Selain itu, cerita yang disampaikan harus menarik, jelas
arahnya, dan mengandung unsur permainan emosi.

10
library.uns.ac.id digilib.uns.ac.id

• Penokohan
Aspek ini menekankan pada keunikan para tokoh di dalam sebuah film.
Film yang baik adalah film dimana tokoh-tokoh di dalamnya memiliki ciri
khas (unik). Sehingga, penonton tidak merasa bahwa karakter A sama
dengan karakter B dan C. Keunikan tersebut dilihat dari gaya bicara, gerak
tubuh, pola pikir, dan sebagainya.

• Visual
Aspek ini menekankan bagaimana visual dalam film itu secara
keseluruhan. Visual ini mencakup efek yang digunakan untuk
memperindah tampilan, pemilihan lokasi, penataan kamera, pemilihan
kostum, dan sebagainya.

2.1.6 Rating Scale

Rating scale merupakan skala penilaian yang lebih fleksibel, skala


penilaian ini tidak hanya untuk mengukur sikap tetapi dapat juga digunakan
untuk mengukur persepsi responden terhadap fenomena lingkungan, seperti
skala untuk mengukur status sosial, ekonomi, pengetahuan, kemampuan,
dan lain-lain.

Pada skala penilaian rating scale menurut (Wimmer & Dominick,


2013) keputusan peneliti yang menentukan skala mana yang digunakan
untuk penilaian yang digunakan, apakah 1 sampai 3, 1 sampai 5, 1 sampai
7, 1 sampai 10 atau 1 sampai 100. Memilih jenis skala rating sebagian besar
merupakan masalah preferensi pribadi. Namun ada beberapa hal yang harus
dipertimbangkan, yaitu:

a. Skala dengan nilai yang lebih tinggi akan menggambarkan perbedaan


penilaian rating yang lebih detail pada item jika dibandingkan dengan
skala dengan penilaian rendah. Sebagai contoh ketika menilai
pentingnya suatu program dalam acara weekday radio show, jika
responden mengatakan “semakin tinggi penilai maka semakin penting

11
library.uns.ac.id digilib.uns.ac.id

program tersebut untuk mereka”. Apakah skala 1-3 atau 1-10 yang
digunakan. Tentu saja 1-10 karena skala ini menggambarkan
perbedaan paling lebar (Wimmer & Dominick, 2013).

b. Penelitian yang dilakukan (Wimmer & Dominick, 2013) menyatakan


bahwa laki-laki, perempuan, disemua tingkatan usia, semua suku dan
bangsa menyukai penilaian 1-10. Hal ini dikarenakan skala 1-10
digunakan secara universal, terutama pada acara olahraga seperti
pertandingan olimpiade. Hampir setiap orang mengerti skala 1-10
dimana 10 merupakan penilaian sempurna atau yang terbaik
sedangkan 1 merupakan penilaian yang paling buruk. Penelitian
(Wimmer & Dominick, 2013) juga menunjukkan bahwa peneliti
seharusnya tidak menggunakan skala rating 0-9 atau 1-9 karena
responden umumnya tidak mengenali kalau 9 merupakan nilai
tertinggi.

2.1.7 Euclidean Distance


Euclidean Distance dianggap sebagai distance matrix yang
mengadopsi prinsip Phytagoras. Hal ini dikarenakan pola perhitungannya
yang menggunakan aturan pangkat dan akar kuadrat. Euclidean sering
dipergunakan dalam clustering karena sederhana walaupun sangat sensitif
terhadap pencilan serta memiliki masalah jika skala nilai atribut yang satu
sangat besar dibandingkan nilai atribut lainnya. Oleh sebab itu, nilai-nilai
atribut dinormalisasi sehingga berada dalam kisaran 0 dan 1. Normalisasi
bisa dilakukan bisa dilakukan dengan min-max normalization atau Z-score
normalization.
Jika data training terdiri dari atribut campuran antara numerik dan
kategori, lebih baik menggunakan min-max normalization (Larose, 2014).
Penggunaan rumus Euclidean Distance, ditunjukkan pada rumus berikut :
2 2 2
𝑑(𝑖, 𝑗) = √|𝑥𝑖1 − 𝑥𝑗1 | + |𝑥𝑖2 − 𝑥𝑗2 | + ⋯ + |𝑥𝑖𝑝 − 𝑥𝑗𝑝 | (2.2)

12
library.uns.ac.id digilib.uns.ac.id

Keterangan :
d(i,j) = jarak Euclidean
xi = nilai titik 1
xj = nilai titik 2
p = dimensi data

2.1.8 Metrik Evaluasi Metode


Tipe metrik yang digunakan bermacam-macam, namun salah satu
pengukuran error yang paling sering digunakan di literatur- literatur
penelitian adalah Mean Absolute Error (MAE) (Goldberg, Roeder, Gupta,
& Perkins, 2001). Jika Pu,i adalah nilai prediksi rating pengguna u pada item
i, dan Ru,i adalah nilai rating yang sebenarnya pengguna u pada item i maka
persamaan MAE dirumuskan sebagai berikut :
1
𝑀𝐴𝐸 = ∑𝑛𝑖=1 |𝑃𝑢,𝑖 − 𝑅𝑢,𝑖 | (2.3)
𝑛
di mana n adalah jumlah item yang telah di-rating oleh pengguna.
Semakin kecil nilai MAE, semakin akurat sistem dalam memberikan
rekomendasi.

2.1.9 Min-Max Normalization


Metode min-max normalization ini me-rescale data dari suatu range
ke range baru lain. Data diskalakan dalam range 0 sampai 1. Selain memiliki
misclassification errors yang kecil, Min-Max Normalization juga
melindungi hubungan antara nilai data asli karena semua nilai data baru
berada dalam range yang pasti. (Jain & Bhandare, 2011). Diberikan yang
bersesuaian (dalam satu kolom) {sk}, k = 1,2,..n. Maka nilai normalisasinya
adalah
𝑠−𝑚𝑖𝑛{𝑆𝑘 }
𝑠′ = (2.5)
𝑚𝑎𝑥{𝑆𝑘 }−𝑚𝑖𝑛{𝑆𝑘 }

13
library.uns.ac.id digilib.uns.ac.id

Dimana s’ adalah data normalisasi, s adalah data asli, max{Sk} adalah


nilai maksimum dari semua data asli, min{Sk} adalah nilai minimum dari
semua data asli.
2.2. Penelitian Terkait
Beberapa penelitian telah dilakukan dalam menyelesaikan
permasalahan penjadwalan. Penggunaan beberapa metode pun dilakukan untuk
mengetahui solusi tepat dalam membangun sistem rekomendasi yang lebih
baik. Adapun beberapa penelitian diantaranya adalah sebagai berikut:
Penelitian pertama terkait dengan penggunaan metode item based
collaborative filtering pada sebuah system rekomendasi. Penelitian ini
digunakan untuk membangun system rekomendasi sepatu. Dari hasil
pengujiannya disimpulkan bahwa dengan menggunakan metode item-based
collaborative filtering, sistem rekomendasi yang dibangun dapat menghasilkan
rekomendasi produk yang belum dirating oleh user yang prediksinya dihitung
menggunakan persamaan Weighted Sum. (Arif Kuniawan, 2016)
Selanjutnya terdapat penelitian yang menggagas pengembangan konsep
metode collaborative filtering untuk pemilihan item yang memiliki banyak
kriteria agar rekomendasi yang dihasilkan memiliki kualitas lebih baik dan
relevan dengan kebutuhan pengguna.sehingga muncullah gagasan metode
collaborative filtering multi kriteria yang didasari kenyataan bahwa banyak
item yang nilai ratingnya tidak bisa diwakili hanya dengan satu kriteria saja.
Pada penelitian ini disimpulkan bahwa konsep collaborative filtering berbasis
multi kriteria memberikan kesempatan kepada pengguna recommender system
untuk menilai suatu item secara variatif. Agar nilai rating keseluruhan
mencerminkan nilai rating multi kriteria maka perlu dikembangkan pendekatan
fungsi agregasi yang tepat, sehingga rekomendasi yang dihasilkan akan
memiliki kualitas lebih baik. (Wiranto & Winarko, 2015)
Penelitian lainnya, lebih kepada penggunaan persamaan Euclidean
Distance dalam menghitung similarity yang digunakan pada sistem
rekomendasi pemilihan paket internet berdasarkan wilayah. Menurut hasil
pengujian yang telah dilakukan dapat disimpulkan bahwa metode Euclidean

14
library.uns.ac.id digilib.uns.ac.id

Distance ini memiliki tingkat akurasi yang cukup tinggi ketika digunakan
untuk membangun sistem rekomendasi. (Fitriani, 2017)
Lalu penggunaan dasar metode item-based collaborative filtering pada
penelitian ini didasari pada penelitian perbandingan metode user-item based
dan item-based collaborative filtering pada studi kasus sistem rekomendasi
tempat wisata untuk wilayah Solo dan Yogyakarta. Yang hasilnya metode item
based collaborative filtering mampu memberikan kualitas rekomendasi yang
lebih baik dengan tingkat akurasi prediksi yang cukup tinggi dibandingkan
metode user-item based dilihat dari nilai NMAE yang cukup signifikan dan
banyaknya prediksi di luar range yang dihasilkan oleh metode user item based
collaborative filtering

2.3. Rencana Penelitian

Pada penelitian ini akan dibangun sistem rekomendasi film yang


berbasis web dengan metode item based multi criteria collaborative filtering
yang menggunakan algoritma similarity Euclidean Distance dan Cosine
Similarity untuk menghitung nilai kesamaan antar item. Dalam membentuk
initial profile menggunakan training set atau gauge set yaitu interaksi pengguna
dengan sistem dengan memberikan penilaian atau rating pada sekumpulan item
contoh. Pemberian feedback secara eksplisit menggunakan rating bar dengan
penilaian 1-10. Setelah diimplementasikan dalam sistem perekomendasi, kedua
metode tersebut diuji dengan data nyata untuk mengetahui akurasi dari metode
tersebut. Pengujian metode dilakukan dengan pengukuran error menggunakan
Mean Absolute Error (MAE).

15
library.uns.ac.id digilib.uns.ac.id

Tabel 2.2 Tabel Penelitian Terkait

No Penulis Tujuan Metode Hasil


1 (Kurniawan. Membangun sistem rekomendasi Item based Dengan menggunakan metode item-based
A, 2016) produk sepatu menggunakan Collaborative collaborative filtering, sistem rekomendasi yang
metode item based collaborative Filtering, dibangun dapat menghasilkan rekomendasi produk
filtering Cosine yang belum dirating oleh user yang prediksinya
Similarity, dihitung menggunakan persamaan Weighted Sum.
Weighted
Sum
2 (Wiranto & Mengembangkan konsep metode Collaborative Konsep collaborative filtering berbasis multi
Edi Winarko, collaborative filtering untuk Filtering kriteria yang digagas memberikan kesempatan
2015) pemilihan item yang memiliki Multi Kriteria kepada pengguna recommender system untuk
banyak kriteria agar rekomendasi menilai suatu item secara variatif. Agar nilai rating
yang dihasilkan memiliki kualitas keseluruhan mencerminkan nilai rating multi
lebih baik dan relevan dengan kriteria maka perlu dikembangkan pendekatan
kebutuhan pengguna. fungsi agregasi yang tepat, sehingga rekomendasi
yang dihasilkan akan memiliki kualitas lebih baik.

15
library.uns.ac.id digilib.uns.ac.id

No Penulis Tujuan Metode Hasil


3 (Fitriani, Membangun sistem rekomendasi Collaborative Menurut hasil pengujian yang telah dilakukan
2017) pemilihan paket internet. Metode filtering, dapat disimpulkan bahwa metode Euclidean
Euclidean Distance ini dipakai Euclidean Distance ini memiliki tingkat akurasi yang cukup
untuk menghitung jarak antara Distance tinggi ketika digunakan untuk membangun sistem
nilai weight evaluation dari rekomendasi.
kriteria paket internet dan nilai
weight evaluation setiap kriteria
yang diinginkan pelanggan.
4 (Christanti, Mengetahui akurasi prediksi nilai Item based Metode item based collaborative filtering mampu
Y. E, 2013) rating yang dihasilkan oleh collaborative memberikan kualitas rekomendasi yang lebih
metode user-item based dan item filtering, baik dengan tingkat akurasi prediksi yang cukup
based collaborative User-item tinggi dibandingkan metode user-item based
filtering pada sistem rekomendasi based dilihat dari nilai NMAE yang cukup signifikan
tempat wisata untuk wilayah Solo collaborative dan banyaknya prediksi di luar range yang
dan Yogyakarta filtering dihasilkan oleh metode user item based
collaborative filtering

16

Anda mungkin juga menyukai