Paper Ratna Mutiara Dewi 13410108
Paper Ratna Mutiara Dewi 13410108
Abstrak
Internet (online advertising) dianggap sebagai media periklanan yang paling potensial saat ini.
Iklan banner menjadi bentuk utama dari media advertising baru. Namun, nilai CTR (ClickThrough Rate) yang menjadi ukuran efektivitas iklan banner turun menjadi 0,1%. Nilai CTR
digunakan oleh advertiser sebagai dasar pembayaran iklan kepada publisher. Perusahaan X
sebagai penyedia platform teknologi otomatisasi penjualan ruang iklan online bagi publisher
akan mengalami peningkatan revenue yang sebanding dengan peningkatan revenue publisher
apabila nilai CTR semakin tinggi.
Pada beberapa literatur, behavioral targeting diklaim dapat mengatasi masalah rendahnya
CTR dengan cara memperlihatkan iklan tertentu berdasar pada perilaku pengguna internet
dalam mengakses Web (online behaviour). Behavioral targeting dapat didekati dengan cara
membedakan pengguna menurut clickstream dari navigasi online dan mengiklankan hanya
kepada seseorang yang memiliki history perilaku yang menunjukkan ketertarikan pada produk
yang diiklankan.
Terdapat dua cara untuk menentukan iklan yang cocok untuk setiap audience dengan
menggunakan browsing history (Web server log file). Cara pertama adalah iklan ditayangkan
kepada audience melalui ranking iklan hasil pengolahan Web ad selector. Web ad selector
terdiri atas dua model yaitu model fuzzy inference dan model Web ad matching. Cara kedua
adalah advertiser dapat menentukan kriteria segmen yang disasar berdasarkan ketertarikan
sehingga iklan milik advertiser tersebut dapat ditayangkan berdasarkan jam penayangan
ranking klasifikasi waktu segmen tersebut. Segmen ketertarikan didapatkan dengan
menggunakan model customer clustering.
Kata kunci : online advertising, iklan banner, CTR, behavioral targeting, Web ad selector,
FRBS Mamdani, Hamming distance
1. Pendahuluan
Dalam memasarkan suatu barang atau jasa, perusahaan memerlukan suatu usaha promosi,
salah satunya adalah periklanan (advertising). Dengan meningkatnya accessibility dari
internet, internet menjadi media advertising yang paling potensial yang biasa disebut
online advertising. Pada sistem online advertising terlibat beberapa entitas antara lain :
1. Advertiser
2. Publisher
3. Ad network
Saat ini advertiser semakin tertarik untuk menjangkau konsumen dengan lebih baik,
menyampaikan pesan, dan membangun hubungan terus menerus melalui media ini.
Berdasarkan data yang dikeluarkan ZenithOptimedia tahun 2014, pangsa pembelanjaan
iklan global pada tahun 2016 untuk media desktop internet naik sebesar 2% dan mobile
internet naik sebesar 5% apabila dibandingkan dengan tahun 2013.
Iklan banner adalah bentuk utama dari media advertising baru, mewakili 55% dari
seluruh iklan online (IAB, 2002) dan 32% dari pendapatan seluruh media advertising
baru (IAB, 1999). Ukuran yang umum digunakan untuk mengevaluasi efektivitas iklan
banner adalah Click-Through Rate (CTR). CTR adalah rata-rata jumlah click oleh
audience pada sebuah iklan banner yang kemudian mengarah pada situs Web sasaran
(Novak & Hoffman, 1997). Namun, saat ini nilai CTR (Click-Through Rate) turun
menjadi 0,1%. Nilai CTR digunakan oleh advertiser sebagai dasar pembayaran iklan
kepada publisher. Perusahaan X sebagai penyedia platform teknologi otomatisasi
penjualan ruang iklan online bagi publisher akan mengalami peningkatan revenue yang
sebanding dengan peningkatan revenue publisher apabila nilai CTR semakin tinggi.
Penemuan oleh Dreze dan Hussherr (2003) menunjukkan bahwa rendahnya CTR
kebanyakan disebabkan oleh kenyataan bahwa banyak orang yang menghindari melihat
semua iklan yang ditayangkan. Hal ini terjadi karena iklan banner yang ditampilkan tidak
sesuai dengan ketertarikan audience. Oleh karena itu, targeting adalah salah satu cara
untuk mengatasi masalah rendahnya CTR. Tujuan dari targeting iklan adalah untuk
menampilkan iklan secara selektif kepada individu yang kemungkinan besar
meresponnya secara positif. Namun, tantangan yang perlu dihadapi dalam melakukan
targeting adalah pengidentifikasian individu tersebut.
Terdapat beberapa jenis targeting antara lain data-driven demographic, behavioral,
contextual, channel, geographic, dan re-targeting (Jandal, 2011). Namun, jenis targeting
yang paling cocok digunakan adalah behavioral targeting. Hal ini dikarenakan
perusahaan X hanya memiliki data browsing history yang merekam perilaku pengguna
internet dalam mengakses Web. Behavioral targeting digunakan untuk memperlihatkan
iklan tertentu berdasar pada perilaku yang secara tidak langsung menunjukkan
ketertarikan.
Agar iklan bisa disasarkan kepada seseorang yang tepat, solusi yang diperlukan harus
mampu mengidentifikasi konsumennya, memprediksi dan mengerti preferensi dan
ketertarikan mereka, mengidentifikasi iklan yang cocok, dan menyampaikannya dengan
bentuk personalisasi secara langsung kepada pengguna selama sesi online mereka. Dalam
penelitian ini, untuk mencapai efektivitas dari iklan Web diolah browsing history dengan
menggunakan Web ad selector. merupakan algoritma yang dapat mempersonalisasi pesan
iklan untuk audience berdasarkan preferensi dan ketertarikan mereka.
Browsing history bisa didapatkan dengan memanfaatkan cookies yang tersimpan pada
browser device milik audience. Web ad selector yang terbagi ke dalam dua model yaitu
model fuzzy inference dan model Web ad matching mengolah browsing history tersebut.
Model fuzzy inference menggunakan metode FRBS Mamdani untuk menghasilkan skor
ketertarikan audience per kategori iklan. Skor tersebut bersama dengan karakteristik fuzzy
per kategori iklan suatu brand kemudian diolah dalam model Web ad matching
menggunakan Hamming distance untuk menghasilkan ranking iklan yang cocok
ditampilkan kepada audience tertentu. Model customer clustering juga digunakan dalam
penelitian ini untuk mencari insight berupa segmen ketertarikan audience berdasarkan
kategori situs Web.
HARI
Senin-Kamis
Jumat
Sabtu
Minggu
00.00-03.59
00.00-03.59
00.00-03.59
00.00-03.59
04.00-07.59
04.00-07.59
04.00-07.59
04.00-07.59
08.00-11.59
08.00-10.59
08.00-10.59
08.00-10.59
JAM
12.00-12.59
11.00-12.59
11.00-12.59
11.00-12.59
13.00-16.59
13.00-16.59
13.00-16.59
13.00-16.59
17.00-20.59
17.00-20.59
17.00-20.59
17.00-20.59
21.00-23.59
21.00-23.59
21.00-23.59
21.00-23.59
Di dalam Fuzzy Inference Engine, terdapat tiga tahap yaitu penerapan minimum fuzzy
operation, implikasi antecedent menuju consequent, dan agregasi consequent semua rule
menggunakan maximum fuzzy operation. Pada tahap penerapan minimum fuzzy operation
pada antecedent, degree of membership setiap kategori situs Web diaplikasikan pada
antecedent dari fuzzy rule. Minimum fuzzy operation kemudian digunakan untuk
memperoleh bilangan tunggal yang merepresentasikan hasil dari evaluasi antecedent.
Pada tahap implikasi antecedent menuju consequent, hasil evaluasi antecedent
diaplikasikan pada membership function dari consequent dengan metode clipping. Pada
tahap agregasi consequent semua rule menggunakan maximum fuzzy operation,
membership function dari seluruh consequent rule yang telah di-clipping digabungkan
menjadi himpunan fuzzy tunggal.
Di dalam Defuzzification Interface, output fuzzy yang berupa variabel linguistik diubah
menjadi variabel crisp menggunakan metode Center of Gravity (COG). Output dari tahap
Fuzzy Inference adalah skor ketertarikan per kategori brand per Unique ID.
Intensitas Akses
1
0,8
Low
0,6
Medium
0,4
High
0,2
0
0
0,125
0,25
0,375
0,5
0,625
0,75
0,825
Fuzzy membership function proporsi frekuensi akses yang didapat ditunjukkan pada
persamaan berikut.
1 [0,0]
0,375
( )=
[0; 0,375]
0 0,375
0
0,125
[0,125; 0,5]
0,5 0,125
( )=
0,825
[0,5; 0,825]
0,5 0,825
0,625
[0,625; 1]
( ) = 1 0,625
1 [1; 1]
0
Langkah 2. Perancangan Fuzzy Rule
Perancangan fuzzy rule memerlukan input mengenai ada tidaknya hubungan antara
kategori situs Web dengan kategori. Contoh hubungan tersebut dapat dilihat pada Tabel
2. Jika terdapat hubungan antara kategori situs Web dan kategori brand, maka hubungan
tersebut langsung dikonversi menjadi tiga fuzzy rule. Masing-masing fuzzy rule memuat
nilai linguistik yang sama baik untuk kategori situs Web sebagai variabel antecedent pada
bagian IF maupun kategori brand sebagai variabel consequent pada bagian THEN. Nilai
linguistik tersebut adalah Low, Medium, High. Dengan kata lain, jika nilai linguistik
untuk variabel antecedent ditentukan Low, maka nilai linguistik untuk variabel
consequent juga akan ditentukan Low.
Tabel 2 Sampel Hubungan antara Kategori Situs Web dengan Kategori Brand
Hubungan pada Tabel dapat diubah menjadi fuzzy rule sebagai berikut.
1.
2.
3.
4.
5.
6.
7.
8.
9.
7.12.0 (R2011a). Variabel input (antecedent) yaitu semua kategori situs Web dan variabel
output (consequent) yaitu semua kategori brand diinput pada FIS Editor. Pada FIS Editor
juga diatur operasi matematika untuk AND method, OR method, Implication dan
Aggregation serta metode defuzzifikasi yang dipilih. Operator matematika yang
digunakan adalah MIN untuk relasi AND dan MAX untuk relasi OR pada fuzzy rule.
Untuk proses implikasi (implication) dari antecedent menuju consequent digunakan
operator matematika MIN. Untuk proses penggabungan (aggregation) output setiap rule
digunakan operator matematika MAX. Metode defuzzifikasi yang dipilih adalah Center
of Gravity (COG). Membership function untuk semua variabel input dan output yang
telah didapatkan pada Langkah 1 diinput pada Membership Function Editor. Fuzzy rule
yang telah didapat pada Langkah 2 diinput pada Rule Editor.
Langkah 4. Pengujian FRBS Mamdani
Input dalam langkah pengujian FRBS Mamdani adalah proporsi frekuensi akses per
kategori situs Web. Berikut ini akan dijelaskan secara rinci mengenai langkah pengujian
FRBS Mamdani.
1. Menginput nilai proporsi frekuensi akses berdasarkan kategori situs Web ke dalam FIS
untuk masing-masing Unique ID.
2. FIS akan menghitung degree of membership dari input untuk setiap kategori situs Web
yang merupakan variabel antecedent melalui proses fuzzifikasi.
3. FIS akan menentukan fitness value setiap fuzzy rule melalui operasi MIN () yang
akan dijelaskan pada persamaan berikut.
=
( )
( )
( )
adalah fitness value. Indeks k menunjukkan fuzzy rule ke-k. xi adalah proporsi
frekuensi akses kategori situs Web i. ( ) adalah membership degree dari variabel
antecedent (kategori situs Web) ke-i.
4. FIS akan mengimplikasikan fitness value yang telah ditentukan pada langkah
sebelumnya pada consequent dari rule dengan proses clipping. Berikut ilustrasi proses
clipping untuk variabel consequent Elektronik pada sembilan fuzzy rule yang telah
didapat sebelumnya.
Rule 1
Rule 2
Rule 3
Low
Low
0
Low
0
0
0,375
Rule 4
0,375
Rule 5
Rule 6
Low
Low
Low
0
0
0,375
Rule 7
0,375
Rule 8
Low
Low
0
0
0,375
Rule 9
Low
0,375
0,375
0,375
0,375
5. FIS akan mengagregasi output hasil clipping variabel consequent dari semua rule
melalui operasi MAX () yang akan dijelaskan pada persamaan berikut.
( )=
=1
( )
0,375
6. FIS akan menentukan skor ketertarikan per variabel consequent untuk setiap Unique
ID melalui metode defuzzifikasi Center of Gravity (COG). Perhitungan metode
defuzzifikasi COG dapat dilihat pada persamaan berikut.
(x) x
(x)
i adalah nilai linguistik pada himpunan fuzzy dan x adalah skor ketertarikan pada suatu
kategori brand.
Dengan menggunakan persamaan di atas dan Gambar , diperoleh skor ketertarikan
Unique ID terhadap variabel Seni & Hiburan sebesar 0.
COG(i) =
| (x ) (x )|
x X
menjadi ketertarikan yang direpresentasikan dalam nilai linguistik himpunan crisp untuk
setiap kategori situs Web. Untuk menentukan ketertarikan, himpunan crisp masingmasing kategori situs Web perlu dibangun terlebih dahulu yang ditunjukkan pada Gambar
7. Nilai linguistik himpunan crisp tersebut adalah Low (L), Medium (M), dan High (H).
Agar unique ID dapat dikelompokkan, nilai linguistik ketertarikan perlu ditransformasi ke
dalam bentuk metric. Transformasi tersebut mengubah ketertarikan Low (L) menjadi 1,
Medium (M) menjadi 2, dan High (H) menjadi 3.
1. Hierarchical Cluster
Metode Hierarchical Cluster dengan aglomerasi digunakan untuk menentukan berapa
segmen yang terbentuk. Dalam metode aglomerasi, pada stage 1, jumlah cluster akan
sama dengan jumlah audience dikurangi satu.
Hierarchical Cluster menentukan kemiripan antar cluster sebagai jarak terpendek dari
suatu objek pada satu cluster dengan objek pada cluster lainnya. Metode yang
digunakan untuk menentukan jumlah cluster adalah Wards method. Metode ini
mengukur seberapa beda karakteristik objek dalam suatu cluster. Jumlah cluster terlihat
dari selisih koefisien aglomerasi paling besar. Untuk menentukan jumlah cluster yang
tepat, pengelompokan cluster dibandingkan dengan menggunakan metode Hierarchical
dan K-Means untuk jumlah cluster yang dibentuk.
2. K-Means Clustering
Dari hasil perbandingan pengelompokan antara metode Hierarchical dan K-Means,
akan didapatkan jumlah cluster yang lebih baik untuk dibentuk. Jumlah cluster tersebut
akan digunakan sebagai dasar pengelompokan Unique ID pada metode K-Means
Cluster. Metode K-Means ini melakukan proses iterasi hingga akhirnya didapatkan
cluster akhir.
Hasil akhir Unique ID clustering adalah jumlah segmen terbentuk dan masing-masing
anggotanya. Unique ID beserta ketertarikan per kategori situs Web dalam nilai linguistik
dan frekuensi akses per klasifikasi waktunya kemudian dikelompokkan berdasarkan
segmen yang terbentuk. Dari nilai linguistik ketertarikan per kategori situs Web per
Unique ID untuk setiap segmen dapat dilihat kecenderungan ketertarikan kategori situs
Web. Frekuensi akses per klasifikasi waktu untuk setiap segmen dijumlah dan klasifikasi
waktu bisa didapat ranking-nya dari frekuensi akses terbanyak hingga terkecil.
Hasil dari face validity ditunjukkan pada Tabel 3. Ranking diberikan untuk memberikan
urutan penayangan iklan. Brand yang paling cocok ditampilkan diberikan urutan ranking
paling atas yaitu 1 dan begitu juga selanjutnya. Dari tabel tersebut, terdapat banyak
kesamaan antara hasil Web ad matching dan hasil validasi. Kesamaan yang dimaksud
adalah brand hasil Web ad matching sama dengan brand hasil validasi untuk urutan
ranking yang sama, contohnya pada Unique ID ke-6 terdapat kesamaan untuk urutan
ranking 1. Perbedaan kedua hasil tersebut mungkin terletak pada urutan ranking yang
saling tertukar saja, misal pada Unique ID ke-6 yang terbalik pada urutan ranking 3 dan 4.
Saling tertukarnya urutan ranking tidak berpengaruh karena iklan yang terpilih samasama cocok dengan ketertarikan audience. Urutan ranking yang terbalik hanya
mempengaruhi urutan penayangan iklan. Pada hasil validasi untuk beberapa Unique ID,
ada yang jumlah brand terpilihnya hanya dua atau tiga. Menurut ad expert, adanya brand
yang tidak terpilih dikarenakan brand tersebut dirasa tidak cocok bila ditampilkan kepada
audience tersebut.
Tabel 3 Hasil Face Validity
Unique ID ke - 6
Ranking
Hasil web matching
Hasil Validasi
1
LED TV samsung samsung galaxy note Nike samsung galaxy note
2
adira finance
majalah pulsa
3
innovation store
oke shop
4
oke shop
innovation store
Ranking
1
2
3
4
Unique ID ke - 14
Hasil web matching
LED TV samsung
adira finance
Nike
samsung galaxy note
innovation store
Ranking
1
2
3
4
Unique ID ke - 23
Hasil web matching
LED TV samsung
adira finance
Nike
samsung galaxy note
innovation store
Ranking
1
2
3
4
Unique ID ke - 55
Hasil web matching
Hasil Validasi
LED TV samsung
samsung galaxy note
Nike
LED TV samsung
samsung galaxy note
adira finance
Hasil Validasi
LED TV samsung
samsung galaxy note
Ranking
1
2
3
4
Unique ID ke - 60
Hasil web matching
LED TV samsung
adira finance
innovation store
Nike
samsung galaxy note
Hasil Validasi
samsung galaxy note
majalah pulsa
oke shop
innovation store
Ranking
1
2
3
4
Unique ID ke - 76
Hasil web matching
Hasil Validasi
LED TV samsung
LED TV samsung
adira finance
samsung galaxy note
Nike
samsung galaxy note
innovation store
Unique ID ke - 37
Ranking
Hasil web matching
Hasil Validasi
1
adira finance
samsung galaxy note
2
LED TV samsung samsung galaxy note Nike
majalah pulsa
oke shop
3
oke shop
4
innovation store
innovation store
Ranking
1
2
3
4
Unique ID ke - 88
Hasil web matching
Hasil Validasi
LED TV samsung
samsung galaxy note
adira finance
majalah pulsa
Nike
samsung galaxy note
innovation store
Ranking
1
2
3
4
Unique ID ke - 49
Hasil web matching
LED TV samsung
Nike
samsung galaxy note
innovation store
adira finance
oke shop
Hasil Validasi
samsung galaxy note
LED TV samsung
Hasil Validasi
oke shop
innovation store
Unique ID ke - 136
Ranking
Hasil web matching
Hasil Validasi
1
Nike
samsung galaxy note
2
LED TV samsung samsung galaxy note
LED TV samsung
3
adira finance
innovation store
4
oke shop
Pada tahap customer clustering, hasil pengolahan data Hierarchical Cluster berupa
Agglomeration Schedule. Dari hasil tersebut, dicari selisih koefisien aglomerasi dan
direpresentasikan pada Gambar 8. Dari Gambar 8 terlihat bahwa selisih koefisien
aglomerasi yang paling besar terdapat pada jumlah cluster 2 atau 3, sehingga ditetapkan
jumlah cluster yang dibentuk adalah 2 atau 3. Untuk menentukan jumlah cluster yang
tepat, peneliti kemudian membandingkan pengelompokan cluster menggunakan metode
Hierarchical dan K-Means untuk 2 cluster dan 3 cluster. Dari hasil perbandingan tersebut,
ditentukan jumlah cluster yang dibentuk berdasarkan jumlah kesamaan terbanyak antara
hasil cluster kedua metode tersebut adalah 3.
Setiap Unique ID beserta nilai linguistik ketertarikan per kategori situs Web dipisahkan
ke dalam cluster yang terbentuk dan digabungkan dengan proporsi frekuensi akses serta
klasifikasi waktu miliknya. Output dari tahap ini adalah ketertarikan per kategori situs
Web dalam nilai linguistik per Unique ID dan segmen yang terbentuk berdasarkan
ketertarikan situs Web dan ranking klasifikasi waktu yang ditunjukkan pada Tabel 4.
Tabel 4 Ranking Klasifikasi Waktu Setiap Cluster
KETERTARIKAN keluarga & pengasuhan
seni & hiburan
gaya & mode
RANK
CLUSTER 1
N = 35
CLUSTER 2
N = 77
CLUSTER 3
N = 38
1
08.00-11.59
04.00-07.59
13.00-16.59
2
04.00-07.59
00.00-03.59 senin-kamis 08.00-11.59
senin-kamis
21.00-23.59
3
00.00-03.59
13.00-16.59
senin-kamis
sabtu
11.00-12.59
4
jumat
13.00-16.59
08.00-11.59
17.00-20.59
senin-kamis
04.00-07.59
5
senin-kamis 13.00-16.59
17.00-20.59
jumat
04.00-07.59
6
minggu
08.00-10.59 jumat
13.00-16.59 sabtu
04.00-07.59
7
00.00-03.59 senin-kamis 21.00-23.59 senin-kamis 12.00-12.59
jumat
8
04.00-07.59
00.00-03.59 minggu
00.00-03.59
minggu
9
17.00-20.59
04.00-07.59 senin-kamis 00.00-03.59
21.00-23.59
minggu
senin-kamis
08.00-10.59
12.00-12.59
sabtu
21.00-23.59
10
jumat
08.00-10.59
17.00-20.59
13.00-16.59
jumat
sabtu
21.00-23.59
11.00-12.59
08.00-10.59
Gambar 9 menunjukkan diagram alir penayangan iklan kepada audience apabila rancangan
model diimplementasikan pada sistem nyata.
6. Daftar Pustaka
Dreze, X., & Hussherr, F.-X. (2003). Internet Advertising: Is Anybody Watching?
Journal of Interactive Marketing, 17(4), 8-23.
Interactive Advertising Bureau. (1999). IAB Internet advertising revenue report.
Interactive Advertising Bureau. (2002). Internet ad revenue report.
Jandal, H. (2011). Display Advertising : The Billboards of the Web. WSI White Paper.
Novak, T., & Hoffman, D. L. (1997). New metrics for new media: Toward the
development of Web measurement standards. World Wide Web Journal, 2(1), 213-246.
ZenithOptimedia. (2014). Executive summary : Advertising Expenditure Forecasts April
2014. Diakses Juni 16, 2014 jam 17.20, dari http://www.zenithoptimedia.com/wpcontent/uploads/2014/04/Adspend-forecasts-April-2014-executive-summary.pdf.