Anda di halaman 1dari 28

GSP

neralized Sequential Patt

Nama Kelompok H
Dian Putri Ambar

(11043023)

Menurut Halawani, Shaik, & Prasad, algoritma GSP secara umum dipandang

sebagai algoritma luas traversal pertama, yang menemukan semua urutan yang
sering munculdengan cara melewati beberapa data.
Menurut J. Zaki (1997) dalam (Budhi, Handojo, & Wirawan, 2009) menyebutkan

algoritma GSP atau dengan nama lain apriori all adalah suatu algoritma yang dapat
memproses dan menemukan semua pola sekuensial dan non sekuensial yang ada.
Berdasarkan pada atribut penutupan suatu pola sekuensial, GSP mengadopsi banyak

cara pada calon generasi dan pendekatan uji pada mining sequential pattern (Han,
Pei, & Yan, 2005). Algoritma GSP digunakan pada mining sequence dan baik untuk
memecahkan masalah mining sequence yang banyak didasarkan pada sebuah
algoritma Apriori (Halawani, Shaik, & Prasad, 2010). Fungsi utama dari algoritma
GSP yaitu menemukan pola sequansial atau urutan.

GSP menemukan pola sekuensial. GSP skala linear dengan jumlah urutan
data, dan memiliki sifat skala-up yang sangat baik sehubungan dengan
ukuran rata-rata urutan data.
Tabel 1.1
SID

TIME (EID)

ITEMS

10, 15,20,25 <(CD)(ABC)(ABF)(ACDF)>

15,20

<(ABF)(E)>

10

<(ABF)>

10,20,25

<(DGH)(BF)(AGH)>

Tabel 1.1 Untuk menentukan frequent item menggunakan


GSP, dengan nilai min_sup=2.

Tabel 1.2
Items

Jumlah
Kejadian
Item

Item yang memenuhi minsup adalah A, B, D, F. Jadi A, B, D, F


adalah Frequent 1- sequence

1.
2.

Frequent 1- itemset adalah A, B, D, F


Dengan properti Apriori, frequent itemset yang diperoleh ditunjukkan pada
tabel di bawah ini. C digunakan untuk menandakan Calon set (Barang set). Ck
menunjukkan kandidat memiliki k item. Untuk misalnya C1 Menandakan
barang set (atau calon set) memiliki 1 item.
Tabel 1.3 CI

Items

Jumlah
Kejadian Item

Item yang memenuhi minsup milik L1. Lk menunjukkan kandidat


memiliki k item. Untuk misalnya L1 menunjukkan item set (atau calon
set) memiliki 1 item.

Tabel 1.4 L1

3.

Items

Jumlah
Kejadian Item

Dari Tabel 1.4 di atas kita dapat melihat bahwa a, b, d, f adalah yang
memenuhi minsup. C2 (di mana k = 2) dapat diperoleh dengan bergabung
L1 X L1 tapi kondisi ini k-2 item harus umum, jadi di sini saat bergabung
untuk mendapatkan item set untuk C2 (2-2 = 0) item harus umum.

Tabel 1.5 C2
Items

Jumlah Kejadian
Item

BF

BD

BF

DA

DB

DD

DF

DF

FA

AA

AB

AD

AF

AB

AD

AF

BA

FB

BB

FD

BD

F F

Kandidat yang memenuhi minsup milik L2.

Tabel 1.6 L2
Items

Jumlah Kejadian Item

AB

AF

BA

BF

DA

DB

DF

FA

4.

Sekarang, pada langkah ini kita harus mencapai 3-urutan item-set, yaitu
item-set memiliki 3 item. C3 (di mana k = 3) dapat diperoleh dengan
bergabung L2 X L2 tapi kondisi ini k-2 item harus umum, jadi di sini saat
bergabung untuk mendapatkan item set untuk C3 (3-2 = 1) item harus
menjadi umum.
Tabel 1.7 C3
Items

Jumlah
Kejadian
Item

FAF

DFA

ABF

DAB

ABA

FAB

AFA

BAB

BFA

BAF

DB A

DFA

DBF

Kandidat yang memenuhi minsup milik L3

Items

Tabel 1.8 L3
Jumlah Kejadian
Items

ABF

BFA

DB A

DFA

DBF

5. Pada langkah ini kita harus mencapai 4-urutan item-set, yaitu item-set

memiliki 4 item. C4 (di mana k = 4) dapat diperoleh dengan bergabung L3


X L3 tapi kondisi ini k-2 item harus umum, jadi di sini saat bergabung
untuk mendapatkan itemset untuk C4 (4-2 = 2) item harus menjadi umum.
Tabel 1.9 C4
Items
DBFA

Jumlah Kejadian
Items
2

Kandidat yang memiliki dukungan minimal memenuhi syarat untuk pindah


ke L4.

Tabel 1.10 L4
Items
DBFA

Jumlah Kejadian
Items
2

Di sini, kita telah memperoleh hanya 1, 4-urutan (urutan item set


memiliki 4 item) barang ditetapkan.

Contoh Perhitungan 1
Tabel 1. Satu set transaksi diurutkan berdasarkan ID pelanggan
dan waktu transaksi
Tabel 1. Database
ID Pelanggan

Waktu
Transaksi

Transaksi

1
1

20 Juli 2005
25 Juli 2005

30
90

2
2
2

9 Juli 2005
14 Juli 2005
20 Juli 2005

10, 20
30
40, 60, 70

25 Juli 2005

30, 50, 70

4
4
4

25 Juli 2005
29 Juli 2005
2 Agustus 2005

30
40, 70
90

12 Juli 2005

90

Contoh Perhitungan 1 (Kondisi)


Tabel 2. Urutan data yang dihasilkan dari tabel database transaksi 1
ID
Pelanggan

Urutan Data

<{30} {90}>

<{10, 20} {30} {40, 60,


70}>

<{30, 50, 70}>

<{30} {40, 70} {90}>

5 sekuensial
Tabel 3. Hasil akhir pola

<{90}>

Data yang sering


muncul
dari tabel 2
<{30}>, <{40}>, <{70}>, <{90}>,
Data yang sering
muncul
dari 1-urutan
<{30}{40}>, <{30}{70}>, <{30}
Data yang sering muncul
{90}>, <{40, 70}>
dari 2-urutan dan
<{30}{40, 70}>
merupakan hasil akhir
Pola sekuensial dengan support
25%

1urutan
2urutan
3urutan

Contoh Perhitungan 2
Berikut ini tabel 1 yang merupakan data transaksi dengan minsup = 2
Tabel 1. Database

Sequence
ID

Transaction
Time

Items

C1

0001

C1

0002

C1

0015

CD

C2

0001

AB

C2

0020

BE

C2 tabel 2 untuk0050
C urutan yang
Dibawah ini adalah
menentukan jumlah data
sesuai dengan minsup.
Tabel 2. Jumlah urutan data

Kurang dari Minsup

Berdasarkan tabel 2, maka data yang lolos (lebih dari minsup) adalah A, B dan
C. Berikut tabel 3 yang merupakan 2-urutan
Tabel 3. 1-urutan
AA

AB

AC

AB

AC

BA

BB

BC

BC

CA

CB

CC

Dari hasil tabel 3 dapat diketahui bahwa hasil akhir pola sekuensial hanya
sampai pada tahap 1-urutan yaitu tabel 2.

Contoh Perhitungan 3
Tabel 1. Data transaksi, minsup=2
SID

EID

Items

10

AB

15

CD

20

BD

10

AD

15

BC

10

AC

Tabel 2. Jumlah data 1-urutan


Item

Jumlah

Berdasarkan tabel 2, maka data yang lolos (lebih dari minsup)


adl A, B, C dan D. Berikut tabel 3 yang merupakan 2-urutan.
Tabel 3. 2-urutan
ITEM

JUMLAH

ITEM

JUMLAH

AA

BC

AB

BD

AC

CA

AD

CB

AB

CC

AC

CD

AD

CD

BA

DA

BB

DB

BC

DC

BD

DD

Berdasarkan tabel 2, maka data yang lolos (lebih dari


minsup) adl AD, BB dan B C.
Untuk membuat 3-urutan kita membutuhkan k=3, tetapi
karena AD yang merupakan untemporal join hanya terdiri
dari 2 elemen huruf (k=2) dan karena BB dan B C
yang merupakan temporal join hanya terdiri dari 2 elemen
huruf (k=2), maka kita tidak dapat membuat 3-urutan, itu
berarti kita berhenti sampai di 2-urutan.

Contoh Perhitungan 4
Tabel 1. Satu set transaksi diurutkan berdasarkan ID pelanggan dan waktu
transaksi
SID

Tabel 1. Database
TIME (EID)

ITEMS

10, 20,25, 30, 40

<(A)(ABC)(AC)(D)
(CF)>

01,02,03,04

<(AD)(C) (BC)
(AE)>

003,004,005,006

<(EF) (AB) (DF)


(CB)>

50,60,70

<(EGC)(AF)(CB)>

Tabel 1 Untuk menentukan frequent item menggunakan GSP, dengan nilai


min_sup=4.

Contoh Perhitungan 4
(Kondisi)
Tentukan jumlah data urutan sesuai dengan minsup, dibawah ini
tabel 2 yang merupakan jumlah data urutan.
Tabel 2. Jumlah data urutan
Jumlah
Items
Kejadian Item
A

Item yang memenuhi minsup adalah A, B, C. Jadi A, B, C


adalah jumlah 1-urutan

Berdasarkan tabel 2, data yang lolos adalah A, B dan C. Berikut


tabel 3 yang merupakan data 2-urutan.
Tabel 3. 2-urutan
AA

BB

AB

BC

AC

BC

AB

CA

AC

CB

BA

CC

Dari tabel 3 dapat diketahui bahwa tidak ada item yang lolos dari
minsup, jadi Dari hasil tabel 3 dapat diketahui bahwa hasil akhir
pola sekuensial hanya sampai pada tahap 1-urutan yaitu tabel 2.

Contoh Perhitungan 5
Tabel 1. Satu set transaksi diurutkan berdasarkan ID pelanggan dan waktu
transaksi, minsup=3
SID

Tabel 1. Database
EID
ITEMS

20

BC

10

AC

15

15

10

ABC

15

AD

20

30

EF

10

DB

15

ACD

25

AF

20

BC

Contoh Perhitungan 5
(Kondisi)
Tentukan jumlah data urutan sesuai dengan minsup, dibawah ini tabel 2
yang merupakan jumlah data urutan.
Tabel 2. Jumlah data urutan

Items

Jumlah
Kejadian Item

Item yang memenuhi minsup adalah A, B, C dan D. Jadi A, B, C


dan D adalah jumlah 1-urutan

Berdasarkan tabel 2, data yang lolos adalah A, B dan C. Berikut tabel 3


yang merupakan data 2-urutan.
Tabel 3. 2-urutan
AA

BC

AB

BD

AC

CA

AC

CB

AB

CC

AC

CD

AD

CD

BA

DA

BB

DB

BC

DC

BD

DD

Dari tabel 3 dapat diketahui bahwa tidak ada item yang lolos dari minsup,
jadi dari hasil tabel 3 dapat diketahui bahwa hasil akhir pola sekuensial
hanya sampai pada tahap 1-urutan yaitu tabel 2.

Dari tabel 3 dapat diketahui bahwa yang lolos dari minsup


adalah AB, AC dan BC. Berikut ini adalah tabel 4 yang
merupakan 3-urutan.
Tabel 4. 3-urutan
Items

Jumlah Kejadian Items

ABC

Pada tabel 4 kita dapat mengetahui bahwa tidak ada yang lolos
dari minsup, jadi langkah kita berhenti hanya sampai pada tabel
4 yaitu 3-urutan

DAFTAR PUSTAKA
http://www.ijedr.org/papers/IJEDR1403022.pdf

diakses tgl 20-06-2015 pukul 16.21


https://ellymunig.wordpress.com/2014/04/10/algoritmageneralized-sequential-pattern-gsp/
diakses tgl 20-06-2015 pukul 16.30

Anda mungkin juga menyukai