Anda di halaman 1dari 21

BRLKTELK ANALZ

APRIORI Algoritmas

Emre DELBA

Birliktelik Analizi

APRIORI ALGORTMASI
Apriori algoritmas birliktelik analizinin yaplarak, birliktelik kurallarnn karlmasnda en ok bilinen ve kullanlan algoritmadr. Tan, Steinbach ve Kumar (2005) a gre temel prensip, bir rn kmesi sk grlyorsa, onun tm alt kmeleri de sk grlmelidir eklinde aklanmtr.

Birliktelik Analizi

APRIORI ALGORTMASI
Yaygn rn kmelerini ortaya karan algoritmalar eldeki tm verileri birok kez tararlar. lk taramada, her bir nesnenin destek deeri hesaplanarak kullanc tarafndan balangta girilen minimum destek deeri ile karlatrlr ve her bir rnn yaygn olup olmadna baklr.

Birliktelik Analizi

APRIORI ALGORTMASI
Bundan sonraki her tarama bir nceki taramada yaygn olarak belirlenmi rnlerden balar ve yaygn rn kmeleri oluturulur. Bu yaygn rn kmelerine aday rn kmeleri (candidate itemsets) denir. Taramann sonunda ise hangi aday rn kmesinin gerekten yaygn olduuna baklr.

Birliktelik Analizi

APRIORI ALGORTMASI
Bir sonraki taramada, yine bir nceki taramada yaygn olarak seilen rn kmelerinden balanr ve veritabannn sonuna kadar bu rn kmelerinin destekleri hesaplanr. Bu ilem, baka yeni yaygn rn kmeleri bulunamayana kadar srer
(Fast Algorithms for Mining Association Rules, Agrawal & Srikant, 1994).

Birliktelik Analizi

APRIORI ALGORTMASI
Apriori algoritmas, daha nceden ortaya atlm olan AIS ve SETM algoritmalarndan her bir taramada aday rn kmelerinin saylma ve bu aday kmelerinin retilme ekliyle ayrlr. AIS ve SETMde sonuca ularken gereksiz rn kmelerinin yaygn kmelermi saylmas neticesinde zaman karmakln artrmaktadr.

Birliktelik Analizi

APRIORI ALGORTMASI
Apriori algoritmas ise aday rnleri retirken veritabanndaki ilemleri hi iin iine sokmadan, yalnzca bir nceki taramada yaygn olduu tespit edilmi rn kmelerini kullanarak oluturur. smini de bu zelliinden almtr.(A-Priori)

Birliktelik Analizi

APRIORI ALGORTMASI
k adet rnden olumu bir rn kmesi, k-1 adet rne sahip yaygn rn kmelerinin birletirilmesi ve alt kmeleri yaygn olmayanlarn silinmesiyle elde edilebilir. Bu birleme ve silme ilemi sonunda daha az sayda aday rn kmeleri oluacaktr.

Birliktelik Analizi

APRIORI ALGORTMASI
Apriori, bir hareket veya rn kmesi iindeki rnlerin alfabetik ekilde sralandn varsaymaktadr. Fk, k boyutlu sk grlen bir rn kmesi ve Ck da onlarn adaylar olsun. Apriori ilk nce veritabann tarar ve her rnn saysn artrarak ve onlar gereken minimum destek deeri salanncaya kadar toplayarak boyutu 1 olan sk grlen rn kmelerini arar.

Birliktelik Analizi

APRIORI ALGORTMASI
Daha sonra aadaki adm tekrar ederek btn sk grlen rn kmelerini bulur. (Top 10 algorithms in data mining, Wu vd., 2008).
k boyutlu sk grlen rn kmelerinden, Ck+1 adet, k+1 boyutlu aday sk grlen rn kmesi ret. Veritabann tara ve sk grlen rn kmelerinin her aday iin destek deerini hesapla. Gereken minimum destek seviyesi salanncaya kadar bu rn kmelerini Fk+1e ekle.

Birliktelik Analizi

APRIORI ALGORTMASI

Kaynak: Agrawal ve Srikant, 1994

Birliktelik Analizi

APRIORI ALGORTMASI
3. Satrdaki apriori-gen fonksiyonu aadaki iki admlk sreci uygulayarak Fkdan Ck+1 retir.
(Top 10 algorithms in data mining, Wu vd., 2008)

Birleme adm: k boyutlu iki sk grlen, ilk k-1 elemana sahip Pk ve Qk rn kmelerini birletirerek k+1 boyutlu sk grlen rn kmelerinin balang adaylar RK+1 i belirle.

RK 1 Pk Qk rn1 ,..., rnk 1 , rnk , rnk ' Qk rn1 ,..., rnk 1 , rnk , rnk ' Pk rn1 ,..., rnk 1 , rnk , rnk

Burada rnl rn2 ... rnk , rnk ' dir

Birliktelik Analizi

APRIORI ALGORTMASI
Budama adm: RK+1deki k boyutlu tm rn kmelerinin sk grlen olup olmadn kontrol et ve bu gereklilii salamayanlar RK+1den kararak CK+1i ret. nk CK+1in sk grlen olmayan k boyutlu hibir alt kmesi k+1 boyutlu sk grlen rn kmesinin alt kmesi olamaz.

Birliktelik Analizi

APRIORI ALGORTMASI
5. satrdaki alt kme fonksiyonu t hareketindeki sk grlen rn kmelerinin tm adaylarn belirler. Daha sonra Apriori veritabann tarayarak sadece bu yolla retilen adaylarn frekanslarn hesaplar. Apriorinin sk grlen rn kmelerinin maksimum boyutu kmax iken veritabann en fazla kmax+1 kere tarar.

Birliktelik Analizi

APRIORI ALGORTMASI
Apriori aday kmelerin boyutunu indirgemede iyi performans gsterir. Bununla birlikte, ok fazla sk grlen nesne kmesi, byk nesne kmeleri ya da minimum destek deerinin ok dk olduu durumlarda, ok fazla sayda aday kme retme ve ok sayda aday rn kmesini kontrol etmek iin veritabann tekrar tekrar kontrol etme gibi sorunlarla kar karya kalr.

Birliktelik Analizi

APRIORI ALGORTMASI
Veri madenciliinde kullanlan karar aalar, snflandrma kurallar ve kmeleme teknikleri gibi desen bulma algoritmalarnn pek ou makine renmesi aratrma topluluunda gelitirilmitir. Sk rastlanan desen ve birliktelik kural madencilii bu gelenein az sayda istisnalarndan biridir.

Birliktelik Analizi

APRIORI ALGORTMASI
Bu tekniin girii veri madencilii aratrmalarn canlandrm ve etkisi muazzam olmutur. Algoritma olduka basit ve uygulamas kolaydr. Veri madencilerinin ilk yapmaya altklar ey Apriori ve benzeri algoritmalar denemektir.

Birliktelik Analizi

Kullanlan Dier Algoritmalar


Bu algoritmalardan bir tanesi Apriori ve AprioriTid algoritmalarnn bir karm olan Apriori-Hybrid algoritmasdr (Agrawal ve Srikant, 1994). Geni nesne kmelerini belirlemek iin veritabanndan alnm kk rneklerin ok iyi sonular verebilecei fikrine dayanan OCD (Offline Candidate Determination - Srad Aday Belirleme) algoritmas (Mannila, Toivonen, Verkamo, 1994). Veritabann kk paralara blerek, bellekte igal edilen yeri azaltp daha hzl sonuca ulama salayan blmleme (partitioning) teknii (Toivonen, 1996).

Birliktelik Analizi

Kullanlan Dier Algoritmalar


1996'da Toivonen tarafndan ortaya atlan ve veritabanndaki tarama saysn azaltan rnekleme (Savasere, Omiecinski, Navathe, 1995) teknii. Kullancya her taramadan sonra oluan kurallar gsterip, minimum destek ve gven seviyelerini deitirme olana veren CARMA (Continuous Association Rule Mining Algorithm - Srekli Balant Kural Madencilii) (Hidber, 1999) Veri paralelliine dayanan CD (Count Distribution Saym Dalm) (Agrawal ve Shafer, 1996).

Birliktelik Analizi

Kullanlan Dier Algoritmalar


PDM (Parallel Data Mining - Paralel Veri Madencilii) (Park, 1995), DMA (Distributed Mining Algorithm Datlm Madencilik Algoritmas) (Cheung vd. 1996). CCPD (Parthasarathy, Zaki, Ogihara ve Li, 2001) (Common Candidate Partitioned Database - Ortak Aday Blnm Veritaban). IDD (Intelligent Data Distribution) (Han, Karypis ve Kumar, 1997). HPA (Hash-based Parallel Mining of Association Rules Balant Kurallarnn rp Temelli Paralel Madencilii) (Masaru ve Kitsuregawa, 1996). PAR (Parallel Association Rules - Paralel Balant Kurallar) (Zaki, 1997)

Birliktelik Analizi

Kullanlan Dier Algoritmalar


FP-Growth Algoritmas Candidate Distribution Algoritmas SH (Skew Handling) Algoritmas HD (Hybrid Distribution) Algoritmas DIC (Dynamic Itemset Counting) Algoritmas.

Anda mungkin juga menyukai