APRIORI Algoritmas
Emre DELBA
Birliktelik Analizi
APRIORI ALGORTMASI
Apriori algoritmas birliktelik analizinin yaplarak, birliktelik kurallarnn karlmasnda en ok bilinen ve kullanlan algoritmadr. Tan, Steinbach ve Kumar (2005) a gre temel prensip, bir rn kmesi sk grlyorsa, onun tm alt kmeleri de sk grlmelidir eklinde aklanmtr.
Birliktelik Analizi
APRIORI ALGORTMASI
Yaygn rn kmelerini ortaya karan algoritmalar eldeki tm verileri birok kez tararlar. lk taramada, her bir nesnenin destek deeri hesaplanarak kullanc tarafndan balangta girilen minimum destek deeri ile karlatrlr ve her bir rnn yaygn olup olmadna baklr.
Birliktelik Analizi
APRIORI ALGORTMASI
Bundan sonraki her tarama bir nceki taramada yaygn olarak belirlenmi rnlerden balar ve yaygn rn kmeleri oluturulur. Bu yaygn rn kmelerine aday rn kmeleri (candidate itemsets) denir. Taramann sonunda ise hangi aday rn kmesinin gerekten yaygn olduuna baklr.
Birliktelik Analizi
APRIORI ALGORTMASI
Bir sonraki taramada, yine bir nceki taramada yaygn olarak seilen rn kmelerinden balanr ve veritabannn sonuna kadar bu rn kmelerinin destekleri hesaplanr. Bu ilem, baka yeni yaygn rn kmeleri bulunamayana kadar srer
(Fast Algorithms for Mining Association Rules, Agrawal & Srikant, 1994).
Birliktelik Analizi
APRIORI ALGORTMASI
Apriori algoritmas, daha nceden ortaya atlm olan AIS ve SETM algoritmalarndan her bir taramada aday rn kmelerinin saylma ve bu aday kmelerinin retilme ekliyle ayrlr. AIS ve SETMde sonuca ularken gereksiz rn kmelerinin yaygn kmelermi saylmas neticesinde zaman karmakln artrmaktadr.
Birliktelik Analizi
APRIORI ALGORTMASI
Apriori algoritmas ise aday rnleri retirken veritabanndaki ilemleri hi iin iine sokmadan, yalnzca bir nceki taramada yaygn olduu tespit edilmi rn kmelerini kullanarak oluturur. smini de bu zelliinden almtr.(A-Priori)
Birliktelik Analizi
APRIORI ALGORTMASI
k adet rnden olumu bir rn kmesi, k-1 adet rne sahip yaygn rn kmelerinin birletirilmesi ve alt kmeleri yaygn olmayanlarn silinmesiyle elde edilebilir. Bu birleme ve silme ilemi sonunda daha az sayda aday rn kmeleri oluacaktr.
Birliktelik Analizi
APRIORI ALGORTMASI
Apriori, bir hareket veya rn kmesi iindeki rnlerin alfabetik ekilde sralandn varsaymaktadr. Fk, k boyutlu sk grlen bir rn kmesi ve Ck da onlarn adaylar olsun. Apriori ilk nce veritabann tarar ve her rnn saysn artrarak ve onlar gereken minimum destek deeri salanncaya kadar toplayarak boyutu 1 olan sk grlen rn kmelerini arar.
Birliktelik Analizi
APRIORI ALGORTMASI
Daha sonra aadaki adm tekrar ederek btn sk grlen rn kmelerini bulur. (Top 10 algorithms in data mining, Wu vd., 2008).
k boyutlu sk grlen rn kmelerinden, Ck+1 adet, k+1 boyutlu aday sk grlen rn kmesi ret. Veritabann tara ve sk grlen rn kmelerinin her aday iin destek deerini hesapla. Gereken minimum destek seviyesi salanncaya kadar bu rn kmelerini Fk+1e ekle.
Birliktelik Analizi
APRIORI ALGORTMASI
Birliktelik Analizi
APRIORI ALGORTMASI
3. Satrdaki apriori-gen fonksiyonu aadaki iki admlk sreci uygulayarak Fkdan Ck+1 retir.
(Top 10 algorithms in data mining, Wu vd., 2008)
Birleme adm: k boyutlu iki sk grlen, ilk k-1 elemana sahip Pk ve Qk rn kmelerini birletirerek k+1 boyutlu sk grlen rn kmelerinin balang adaylar RK+1 i belirle.
RK 1 Pk Qk rn1 ,..., rnk 1 , rnk , rnk ' Qk rn1 ,..., rnk 1 , rnk , rnk ' Pk rn1 ,..., rnk 1 , rnk , rnk
Birliktelik Analizi
APRIORI ALGORTMASI
Budama adm: RK+1deki k boyutlu tm rn kmelerinin sk grlen olup olmadn kontrol et ve bu gereklilii salamayanlar RK+1den kararak CK+1i ret. nk CK+1in sk grlen olmayan k boyutlu hibir alt kmesi k+1 boyutlu sk grlen rn kmesinin alt kmesi olamaz.
Birliktelik Analizi
APRIORI ALGORTMASI
5. satrdaki alt kme fonksiyonu t hareketindeki sk grlen rn kmelerinin tm adaylarn belirler. Daha sonra Apriori veritabann tarayarak sadece bu yolla retilen adaylarn frekanslarn hesaplar. Apriorinin sk grlen rn kmelerinin maksimum boyutu kmax iken veritabann en fazla kmax+1 kere tarar.
Birliktelik Analizi
APRIORI ALGORTMASI
Apriori aday kmelerin boyutunu indirgemede iyi performans gsterir. Bununla birlikte, ok fazla sk grlen nesne kmesi, byk nesne kmeleri ya da minimum destek deerinin ok dk olduu durumlarda, ok fazla sayda aday kme retme ve ok sayda aday rn kmesini kontrol etmek iin veritabann tekrar tekrar kontrol etme gibi sorunlarla kar karya kalr.
Birliktelik Analizi
APRIORI ALGORTMASI
Veri madenciliinde kullanlan karar aalar, snflandrma kurallar ve kmeleme teknikleri gibi desen bulma algoritmalarnn pek ou makine renmesi aratrma topluluunda gelitirilmitir. Sk rastlanan desen ve birliktelik kural madencilii bu gelenein az sayda istisnalarndan biridir.
Birliktelik Analizi
APRIORI ALGORTMASI
Bu tekniin girii veri madencilii aratrmalarn canlandrm ve etkisi muazzam olmutur. Algoritma olduka basit ve uygulamas kolaydr. Veri madencilerinin ilk yapmaya altklar ey Apriori ve benzeri algoritmalar denemektir.
Birliktelik Analizi
Birliktelik Analizi
Birliktelik Analizi
Birliktelik Analizi