Dosen Pembimbing :
Oleh :
UNIVERSITAS SRIWIJAYA
FAKULTAS ILMU KOMPUTER
TEKNIK INFORMATIKA
2018
ii
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT yang telah memberikan
Growth” sebagai tugas dari mata kuliah Data Mining and Data Warehouse dapat
berbagai hambatan namun Alhamdulillah laporan ini dapat diselesaikan tepat pada
waktunya.
Secara khusus ucapkan terima kasih penulis sampaikan kepada Ibu Rizki
Kurniati, M.T. selaku dosen mata kuliah Data Mining and Data Warehouse yang
telah membimbing dan memberikan materi kuliah demi menyelesaikan tugas ini.
Dalam kesempatan ini pula, penulis mengucapkan terima kasih kepada semua
pihak yang ikut serta atas sumbangan pemikiran dan pengalaman dalam penulisan
laporan ini.
Akhir kata penulis berharap semoga laporan ini bermanfaat bagi diri kami dan
pembaca. Penulis menyadari bahwa makalah ini belum sempurna sehingga kritik
dan saran dari teman-teman yang positif dan dapat membangun sangat kami
April 2018
Penulis
BAB I
PENDAHULUAN
tidak diketahui secara manual dari suatu basisdata dapat dilakukan dengan
penggalian pola-pola dari data. Hal ini bertujuan tujuan untuk memanipulasi data
menjadi informasi yang lebih berharga dengan cara mengekstraksi dan mengenali
pola yang penting atau menarik dari data yang terdapat dalam basisdata. Proses
yang efektif untuk mengetahui adanya serangkaian pola informasi dari sejumlah
data. Pola asosiasi menjadi salah satu hal yang paling menarik dalam penggalian
dipakai untuk menentukan himpunan data yang paling sering muncul (frequent
Heuristic: Setiap pola dengan panjang K yang tidak sering muncul (tidak
frequent) dalam kumpulan data, maka pola dengan panjang (k+1) yang
mengandung sub pola K tersebut tidak akan menjadi frequent. Dasar Apriori
1
sekumpulan pola frequent dengan panjang k, lalu mencocokkan jumlah
kemunculan pola tersebut dengan informasi yang terdapat dalam database. Hal ini
membutuhkan waktu yang relatif lebih lama karena proses scan tersebut.
item-item yang saling mempunyai nilai keterkaitan untuk mencapai suatu business
data yang ada sehingga menghasilkan sebuah pengetahuan atau informasi yang
dari tugas ini adalah Bagaimana penerapan algoritma Apriori dan FP-Growth
KAJIAN PUSTAKA
Data Mining diartikan sebagai proses mencari pola dalam suatu data (Witten,
selama ini tidak diketahui dengan manual dari suatu data, dengan menggali pola-
pola data dengan tujuan memanipulasi data menjadi informasi yang lebih berharga
yang diperoleh dengan mengekstraksi dan mengenali pola yang penting atau
kumpulan data yang sangat besar dengan memakai algoritma dan teknik penarikan
dalam bidang statistik, pembelajaran mesin, dan sistem manajemen basis data
(Shyara, 2013).
Dari beberapa definisi tersebut, dapat disimpulkan bahwa hal penting yang
dari data
5
Data Mining dapat dibagi menjadi beberapa tahap proses. Tahap-tahap Data
tidak konsisten,
Seleksi data adalah proses pemilihan data dari banyak data di database
1. Asosiasi
2. Klustering
3. Klasifikasi
4. Prediksi
Prediksi adalah proses perkiraan berdasarkan pola-pola di dalam
yang diperlukan, yang belum diketahui saat ini. Prediksi hampir sama
dengan klasifikasi dan estimasi, bedanya hasil prediksi nilai dari hasil
akan ada di masa mendatang (Kusrini dan Emha Taufiq Luthfi, 2009),
5. Estimasi
yang kita miliki(yg tidak kita ketahui). Estimasi hampir sama dengan
2.4 Asosiasi
Market Basket Analysis, adalah teknik yang tugasnya menemukan atribut yang
muncul dalam satu waktu yang dipakai dalam bisnis untuk menganalisa tabel
Asosiasi biasanya memakai pola jika (if) yang mewakili antecedent dan
pencarian iterative pada itemset, dengan mulai dari satu itemset, dua
itemsets, tiga itemsets, dan seterusnya. Cara kerja algoritma ini adalah
2. FP Growth
algoritma yang memakai tree. Tidak seperti Apriori yang scan data
mungkin ada transaksi yang memiliki item yang sama, semakin banyak
Misal I= {a1, a2, …, an} adalah kumpulan dari item. Dan basis data
PEMBAHASAN
dimana LHS dan RHS tersebut adalah himpunan item; jika setiap item-
item dalam LHS terdapat dalam transaksi maka item-item dalam RHS
Association Rules:
consequent.
item tersebut dalam database, dimana jika mempunyai item A dan item
B maka support adalah proporsi dari transaksi dalam database yang
Confidence = P( B | A )
3.2.Frequent Pattern-Growth (FP-Growth)
algoritma yang memakai tree. Tidak seperti Apriori yang scan data
transaksi yang memiliki item yang sama, semakin banyak data transaksi
yang memiliki item yang sama, maka proses pemampatan dengan struktur
sebagai:
Misal I= {a1, a2, …, an} adalah kumpulan dari item. Dan basis
muncul ( frequent pattern) apabila support dari pola tersebut tidak kurang
dengan batas ambang minimum support count ξ inilah yang dicoba untuk
1. Tidak perlu scan untuk tiap iterasi seperti Apriori (tidak scan data
sebanyak Apriori)
yakni:
sebelumnya,
pattern base dijumlahkan, kemudian tiap item yang punya support count
lebih besar atau sama dengan minimum support count ξ akan dibangkitkan
Promosi Pendidikan
1. Praproses
yaitu berisi Null-Sistem Informasi (D1) = 20 -IPA (C1) = 16- SMA Negeri
terkecil, yaitu C2 yang diikuti dengan A4, A3, C1, D1, dan di akhiri
gambar berikut.
4.1. Kesimpulan
Dan dari presentasi kelompok kami juga didapat beberapa pertanyaan dari
teman-teman serta Bu Rizki sebagai dosen pembimbing yang terbagi menjadi dua
Pertanyaan Sesi 1:
1. Bu Rizki :
Dalam penyelesaian kasus Market Basket apakah algoritma yang paling baik
2. Bu Rizki :
3. Kelompok 3 (Halim) :
Apa tujuan dari Asosiasi? Dan jelaskan tentang hasil study case kelompok anda?
4. Kelompok 1 (Faiz) :
Apakah data perlu disorting didalam Asosiasion mining? Dan apakah ada proses
5. Bu Rizki :
Kenapa nilai support yang telah ditentukan dapat berubah padahal telah
Ex: ditentukan 0,87 tetapi nilai yang dihasilkan dalam perhitungan 0,500?
4.2 Saran
Pada presentasi ini masih terdapat banyak kekurangan yang ada. Berikut
Luthfi, Emha Taufik, dan Kusriani. (2009). Algoritma Data Mining. Yogyakarta:
Andi Offset
Wu, X., dan Kumar. (2009). The Top Ten Algorihtms In Data Mining. Boca
5
DOKUMENTASI
Ananta R