Abstrak
Saat awal proses bisnis yang berjalan pada sebuah perusahaan maupun organisasi dimodelkan setelah melalui
proses requirement elicitation pada tahap analisis dalam Software Development Life Cycle (SDLC). Proses ini
membutuhkan waktu yang lama dan biaya yang besar jika stakeholder yang berkepentingan berada pada jarak
dan ruang yang berjauhan. Keberhasilan implementasi e-commerce merupakan proses perbaikan
berkelanjutan yang cepat dan bijak terhadap proses bisnis dalam menyikapi perubahan perilaku dan
kebutuhan konsumen. Untuk menyikapi perubahan tersebut sistem e-commerce dapat merekam aktivitas
konsumen di toko “virtual”, termasuk apa yang konsumen lihat, apa yang dimasukkan ke dalam keranjang
belanja, dan sebagainya dalam bentuk data log. Penelitian ini memberi kontribusi dengan menggunakan
teknologi web mining untuk mengekstrak model proses bisnis pada aplikasi e-commerce yang berasal dari
data log hingga menghasilkan sebuah model proses bisnis bagi aplikasi e-commerce. Model proses bisnis
yang dihasilkan dapat digunakan sebagai rekomendasi bagi pengembang aplikasi e-commerce dalam
mengembangkan aplikasi tanpa melakukan tahapan analisis dan desain.
Kata Kunci: model proses bisnis, e-commerce, requirement elicitation, web mining
1. Pendahuluan
mining adalah salah satu metode dari web mining Adapun sistematika pembahasan sub bab berikutnya
yang secara spesifik ditujukan untuk mengekstraksi pada makalah ini yaitu Sub Bab II membahas
informasi dari data log yang merekam aktivitas mengenai metode yang digunakan untuk
pengguna aplikasi pada saat berinteraksi dengan menghasilkan model proses bisnis menggunakan
aplikasi web (Sharma, 2011). Data log merekam data log. Sub Bab III membahas mengenai hasil dan
identitas pengguna web bersamaan dengan perilaku pembahasan tentang model proses bisnis yang
browsing mereka pada situs web. Web usage mining dihasilkan. Sub Bab IV berisi kesimpulan dari hasil
diterapkan pada e-commerce untuk dapat penelitian serta ucapan terimakasih.
mengetahui perilaku browsing pelanggan sehingga
dapat dilakukan prediksi dari perilaku pengguna 2. Metode
dalam situs web, melakukan perbandingan terhadap
penggunaan situs web yang diharapkan dengan Bagian ini menjelaskan mengenai metode yang
penggunaan aktual dari pengguna, sehingga dari digunakan untuk menghasilkan model proses bisnis
sana dapat dijadikan sebagai dasar memperbaiki menggunakan data log. Bagian ini dibedakan
fungsionalitas dan tampilan dari web e-commerce menjadi 2 pembahasan yaitu metode pengumpulan
dalam rangka memberi layanan yang sesuai dengan data dan metode analisa data.
kepentingan pengguna(Patel, Chauhan, & Patel,
2011; Vellingiri & Pandian, 2011). 2.1 Metode Pengumpulan Data
1.2 State of The Art Untuk melakukan analysis model proses bisnis
sebuah aplikasi diperlukan data log yang merupakan
WUM adalah aplikasi teknik data mining untuk rekaman aktivitas pengguna selama berinteraksi
menemukan pola penggunaan dari data web dengan dengan aplikasi. Model proses yang akan dianalysis
tujuan memahami dan memberikan layanan yang pada penelitian ini adalah model proses bisnis dari
lebih baik pada aplikasi berbasis web (Cooley, aplikasi webstore, sedangkan data log yang
Mobasher, & Srivastava, 2013; Wang, 2000). digunakan adalah data log web yang berasal dari
Setelah data dikumpulkan selanjutnya dilakukan rujukan penelitian Ivancsy,dkk yaitu Click Stream
proses pre-processing data untuk memastikan data data dari ECML/PKDD 2005 Discovery Challenge1
yang akan diproses lebih lanjut sudah bersih dari yang merupakan kumpulan data click stream dari 7
data-data yang tidak diperlukan maupun dilengkapi buah toko web. Log yang direkam adalah aktivitas
dengan data yang sesuai dengan kebutuhan. Tahap setiap pengguna dari ketujuh aplikasi webstore sejak
selanjutnya adalah pattern discovery yaitu tahapan awal pengguna berinteraksi pada halaman web
melakukan generate rules dan pattern. Proses yang hingga akhir meninggalkannya.
dilakukan pada tahap ini termasuk juga melakukan Setiap baris pada data log berisi informasi sebagai
generate dari data statistik, seperti jumlah halaman berikut:
yang paling sering diakses, halaman awal yang Inisialisasi Toko
paling sering diakses, dan waktu rata-rata setiap Waktu
halaman diakses. Algoritma data mining yang IP address
digunakan pada tahap ini diantaranya adalah Session
assosiation rule, dan sequential pattern. Proses Halaman yang dikunjungi
mining selanjutnya adalah pattern analysis yaitu Halaman referensi
proses menampilkan hasil analisa yang diperoleh
dari proses pattern discovery kedalam tampilan
dengan visualisasi yang mudah dimengerti oleh
pengguna. Output proses ini dapat berupa aturan-
aturan, pola, dan gambaran statistic (Cooley et al.,
2013; Gomes, 2005; Han, J., Kamber, 2000).
processing untuk mengidentifikasi sebuah urutan menyelesaikan satu prosedur transaksi pembelian
yang dianggap valid untuk dapat diikutkan pada seperti terlihat pada Gambar (2.2).
mining proses pada tahap selanjutnya.
Pre-processing dilakukan untuk WUM dengan
teknik frequent pattern pada data akses log web
melalui beberapa tahap yaitu data cleaning, session
identification dan data conversion.
Data cleaning
Gambar.2-2 Contoh urutan proses transaksi pembelian
Aktivitas yang dilakukan pada data cleaning antara
lain membersihkan data log dari noise, seperti data
Data akses log akan menyimpan informasi aktivitas
yang tidak lengkap, atribut yang tidak relevan
pengguna dimulai saat klik pertama mengakses
dengan kebutuhan mining sehingga hanya atribut
halaman web step y step hingga klik terakhir
session ID, visited page dan timestamp yang tersisa
mengakhiri akses web. Klik tersebut diasumsikan
pada log file. 1 session akan diidentifikasi sebagai
adalah halaman per halaman web yang diakses oleh
sesi tunggal yang berisi sekumpulan event, visited
pengguna (visited page). Urutan visited page inilah
page adalah halaman yang diakses oleh pengguna
yang kemudian akan merujuk menjadi sebuah proses
pada satu session, dan timestamp adalah durasi akses
model transaksi untuk aplikasi e-commerce.
ketika pengguna mengakses sebuah halaman web.
Dari sini diambil kesimpulan bahwa untuk
menghasilkan sebuah model proses dengan
Session identification
menganalisis data dari akses log web diprediksi akan
Pada sebuah log file, 1 transaksi dinyatakan dalam 1
diperoleh dengan menggunakan metode WUM. Hal
buah sesi dimana untuk satu sesi akan berisi urutan
ini merupakan hipotesa yang akan dibuktikan
halaman yang diakses oleh pengguna untuk satu
dengan melakukan percobaan terhadap beberapa file
halaman web yang diakses pada interval waktu
log akses. Pengetahuan yang diharapkan akan
tertentu. Antara 1 sesi dengan sesi yang lain untuk
diperoleh dengan menggunakan metode WUM
pengguna yang diidentifikasikan dengan IP Address
terkait penelitian ini adalah pola urutan akses
yang sama akan dibedakan oleh interval waktu idle
pengguna ketika berinteraksi pada web store. Untuk
(30 menit). Hal ini dilakukan karena pada data akses
menghasilkan sebuah proses model seperti
log tidak terdapat informasi kapan sesi seorang
dijelaskan sebelumnya, diperlukan analisa terhadap
pengguna berakhir. Selain itu 1 sesi hanya berlaku
teknik mining yang akan digunakan dalam
untuk 1 pengguna ketika mengakses 1 halaman web
mengekstrak data akses log dengan WUM.
saja. Jika pengguna berpindah halaman web, maka
Model proses yang dihasilkan berdasarkan asumsi
akan diidentifikasikan sebagai 1 sesi baru.
bahwa setiap kali pengguna mengakses sebuah
aplikasi e-commerce seperti toko web, akan
Data Conversion
memiliki kecenderungan yang sama atau hampir
Kebutuhan data untuk proses mining menggunakan
sama ketika mengakses halaman-halaman web pada
frequent sequence discovery mengharuskan data
saat berbelanja. Dari asumsi tersebut dapat diambil
dikonversi menjadi bentuk dataset. Setiap record
kesimpulan bahwa semakin banyak pembeli
data diubah menjadi bentuk itemset dan sequences
melakukan pembelian dengan tahapan proses yang
yang disebut sebagai sequence database. Sequence
sama atau frequent maka proses tersebutlah yang
database merupakan satu set urutan dimana setiap
akan dijadikan sebagai acuan proses bisnis yang
urutan adalah daftar dari itemset-itemset. Sebuah
akan dimodelkan oleh organisasi yang memiliki
itemset adalah serangkaian item yang berbeda.
pusat perbelanjaan tersebut.
Sedangkan kebutuhan data jika menggunakan
frequent subtree discovery mengharuskan data Analisa Teknik Mining untuk Menghasilkan Model
dikonversi menjadi scope-list yang berisi tree yang Proses
direpresentasikan dalam bentuk urutan event. Analisa selanjutnya dilakukan terhadap metode yang
akan digunakan pada frequent pattern sehingga
menghasilkan proses model pada aplikasi e-
2.2 Metode Analisis Data
commerce. Ada 3 metode yang dapat digunakan
Metode web mining dikelompokkan berdasarkan
untuk menemukan pola akses dari pengguna web,
jenis data yang diekstrak terdiri dari web content
yaitu frequent item discovery, frequent sequence
mining (WCM), web struktur mining (WSM), dan
discovery, frequent subtree discovery.
web usage mining (WUM). Pola aktivitas pengguna
Log akses web berisi urutan kejadian atau akitivitas
pada aplikasi e-commerce akan merujuk menjadi
atau events (items), dengan informasi mencakup
sebuah proses berurutan yang dilakukan pengguna
session identifier dan informasi akses pengguna.
ketika mengeksekusi sebuah prosedur misalnya
Informasi tersebut juga dapat merupakan kombinasi
diawali dari ketika pengguna mulai melihat produk
dari beberapa informasi yang dikandung dalam
apa saja yang akan dibeli, memasukkan produk yang
format log tertentu. Sebagai contoh, format
akan dibeli kedalam kantong belanja, hingga
informasi dari sebuah akses log adalah <SessionId, frequent selanjutnya tidak akan diikutkan dalam
EventId>, sedangakan data log akses web dari basisdata sekuen.
beberapa session sesuai format adalah sebagai
berikut: Frequent Itemset Discovery
<100,a><100,b><200,e><200,a><300,b><200,e><1 Untuk mendapatkan pola akses menggunakan
00,d><200,b><400,a><400,f><100,a><400,b><300, metode frequent item discovery akan diperoleh pola
a><100,c><200,c><400,a><200,a><300,b><200,c> akses terhadap halaman yang paling sering diakses
<300,f><400,c><400,f><400,c><300,a><300,e><3 oleh pengguna seperti pada Gambar (2.3). Frequent
00,c> item discovery menemukan pola akses pengguna
Data log akses disebut sebagai basisdata transaksi, berdasarkan halaman yang paling sering diakses
selanjutnya dipre-proses menjadi sebuah web akses tanpa memperhatikan urutan aksesnya.
sekuen basisdata. Urutan log akses dalam database
transaksi pada pada masing-masing baris terdiri dari
ID Transaksi (TID) yang berasal dari session dan
urutan akses (access sequence) yang berasal dari
Gambar.2 -3 Contoh Proses Model dari Akses Web
event. Pre-proses dilakukan dengan dengan Frequent Item Discovery
mengelompokkan setiap session dengan event yang
dilakukan di dalamnya. Misalkan untuk session 100, Ada informasi yang tidak sesuai dengan proses
event yang dilakukan terdiri dari a,b,d,a,dan c. model yang dibutuhkan karena untuk mendapatkan
Sehingga basisdata sekuen yang berasal dari sebuah proses model urutan menjadi atribut itemset
basisdata transaksi dapat dilihat pada Tabel (2.1). yang diperhitungkan, sehingga metode ini tidak
dapat digunakan untuk menghasilkan sebuah proses
Tabel 2.1 Contoh Sequence Database
model untuk aplikasi e-commerce.
Tabel 2.2 Contoh Frequent Sequence Database Untuk mendapatkan pola akses menggunakan
metode frequent sequence discovery, selain
diperoleh pola akses terhadap halaman yang paling
sering diakses oleh pengguna sequence atau urutan
akses juga menjadi penentu pola yang dihasilkan.
Sehingga dari pola yang dihasilkan terdapat
kesesuaian dengan proses model yang dibutuhkan
karena untuk mendapatkan sebuah proses model
urutan menjadi atribut itemset yang diperhitungkan,
Tabel (2.1) terdiri dari set item yang berasal dari sehingga metode ini dapat digunakan untuk
event atau akses, yaitu a,b,c,d,e,f selanjutnya disebut menghasilkan sebuah proses model untuk aplikasi e-
sebagai item, dan kombinasi dari 1 atau lebih item commerce.
disebut sebagai itemset. Dari 4 data transaksi, nilai
support untuk itemset “a,b,e” adalah 3 dari 4 atau ¾ Frequent subtree discovery
atau 75%. Karena itemset “a,b,e” terdapat hanya Tree mining adalah turunan dari Frequent Structure
dalam 3 transaksi yaitu (200,300,400). Jika batas Mining (FSM) yaitu yang berhubungan dengan
minimun support (minsup) yang diinginkan untuk penggalian pola dalam database besar yang
menentukan itemset yang frequent adalah 75% atau mewakili interaksi kompleks antara entitas. FSM
lebih rendah maka itemset “a,b,e” merupakan tidak hanya mencakup teknik mining seperti asosiasi
sebuah itemset yang frequent selanjutnya disebut dan sequence tetapi juga generalisasi ke pola yang
sebagai frequent itemset. Jika batas minsup yang lebih kompleks seperti tree dan graph. Tree mining
diinginkan adalah lebih besar dr 75%, maka itemset pada WUM dapat digunakan untuk untuk
“a,b,e” bukan merupakan frequent itemset karena mengabaikan semua informasi tautan dari log, dan
itemset tersebut memiliki nilai support dibawah nilai menemukan set halaman yang sering diakses oleh
minsup yang diinginkan. pengguna. Selain itu juga dapat membentuk pola
Sedangkan nilai support untuk item a adalah 4, item urutan tautan yang diikuti oleh pengguna, serta
b adalah 4, item c adalah 4, item d adalah 1, item e menemukan pola urutan path yang paling sering
adalah 3, dan item f adalah 2. Jika minimum support dilalui pengguna dalam bentuk tree. Dari path yang
yang dingikan untuk setiap item adalah 3, maka item sering dilalui oleh pengguna tersebut dapat
a,b,c,e adalah frequent item, item yang tidak
ditemukan juga subtree yang paling sering diakses 3. Hasil dan Pembahasan
pada halaman web.
Misalkan D adalah sebuah tree (T) database (yaitu, Penelitian ini ditujukan untuk mengekstrak model
forest), dan subtree S ≤ T untuk beberapa Τ ϵ D. proses dari data log sehingga pada penelitian ini
Setiap terbentuk S dapat diidentifikasi dengan memanfaatkan tool ProM pada tahap pattern
persamaan tersebut, yang diberikan sebagai discovery dengan menggunakan algoritma tertentu
himpunan posisi yang tepat (dalam T) untuk node di untuk melakukan analysis terhadap data log yang
| T | = n, dan {s1, s2, ..., sm} menjadi node di S, berasal dari data log web karena melihat kesesuaian
dengan | S | = m. Maka S memiliki persamaan {ti1, proses dan kelengkapan fitur yang ada untuk
Ti2, ..., tim}, jika dan hanya jika: 1) l (sk) = l (tik) melakukan mining proses mulai dari pre-processing
untuk semua induk tik di T. Kondisi 1) menunjukkan data logs hingga visualisasi model proses bisnis
bahwa semua label simpul di S persamaan yang yang dihasilkan dari algoritma mining yang
tepat di T, sementara 2) menunjukkan bahwa digunakan.
topologi tree dari node yang tepat di T sama dengan
S. Model proses yang dihasilkan dari mining proses
δT (S) menunjukkan jumlah kejadian dari subtree S sebagaimana yang diuraikan sebelumnya adalah
di T. dT (S) = 1 jika δT (S) > 0 dan dt (S) = 0 jika dT seperti gambar di bawah ini:
(S) = 0. Support dari subtree S dalam database
didefinisikan sebagai σ(S) = ΣTED dT (S), yaitu,
jumlah tree di D yang terdiri dari setidaknya
terbentuk satu S. Weighted support S didefinisikan
sebagai σω(S)= ΣTED δT (S), yaitu, jumlah kejadian
dari S atas semua tree di D. Biasanya, nilai support
diberikan sebagai percentase dari jumlah tree di D.
Sebuah subtree S adalah frequent jika support lebih
dari atau sama dengan nilai minsup yang ditetapkan.
Fk adalah himpunan semua frequent subtree Gambar 3.1 Model Proses hasil Web Mining
berukuran k. Minsup ditetapkan dengan tujuan untuk Menggunakan Heuristik Miner
memberikan filter terhadap seluruh subtree yang
akan diikutkan pada proses mining selanjutnya. Keterangan :
Gambar 2.5 adalah contoh proses model yang /+ : Halaman Home
dihasilkan dengan frequent subtree dari data pada ct+ : Halaman Kategori Produk
tabel 3.2. ls+ : Halaman List Produk
dt+ : Halaman Detil Produk
findf+ : Halaman Pencarian Produk dan
Aksesories
kosik+ : Halaman Keranjang Belanja