Anda di halaman 1dari 4

A.

Fungsi Asosiasi
Algoritma asosiasi merupakan suatu bentuk algoritma dalam data mining yang memberikan
informasi hubungan antar item data di database. Analisis asosiasi atau association rule mining
adalah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item.
Data mining algoritma asosiasi dapat membantu dalam proses penjualan dengan memberikan
hubungan antar data penjualan yang dilakukan pelanggan sehingga akan didapat pola pembelian
pelanggan. Seperti halnya pada kelompok ini yang membahas PERHITUNGAN PENJUALAN
BARANG ELEKTRONIK DENGAN METODE ASOSIASI DENGAN ALGORITMA FP-
GROWTH.

Aturan asosiasi dilaksanakan dalam 2 langkah proses, yaitu :

1. Temukan semua frequent itemset; Berdasar definisi, masing-masing dari itemset aka
muncul sedikitnya dengan frequency sebesar di berikan dalam minimum support count.

2. Munculkan strong association rule dari frequent itemset; Berdasar definisi, aturan ini harus
memenuhi minimum support dan minimum confidence.

B. ALGORITMA FP-Growth

Algoritma FP-Growth merupakan salah satu alternatif algoritma yang cukup efektif untuk
mencari himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan
data yang besar.

Algoritma FP-Growth dibagi menjadi tiga langkah utama, yaitu :


a. Tahap Pembangkitan Conditional Pattern Base.
b. Tahap Pembangkitan Conditional FP-Tree.
c. Tahap Pencarian frequent itemset.
Perhitungan Support Item

Analisa asosiasi didefinisikan suatu proses untuk menemukan semua aturan asosiasi yang
memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk
confidence (minimum confidence).
Dalam makalah ini kami sertakan langkah-langkah perhitungan Rapidmnner dengan hasil
seperti berikut :
1. Masukan data dari excel : Import Data Read Excell
Import data Wizard Data Transaksi (Transaksi sebagai Id)
Finish.
2. Read Excell Numerical to Binominal FP-Growth
Create Association Rules.

CLUSTERING
FUNGSI CLUSTERING
Clustering adalah proses mengelompokkan atau penggolongan objek berdasarkan informasi yang
diperoleh dari data yang menjelaskan hubungan antar objek dengan prinsip untuk
memaksimalkan kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar
kelas/cluster.
Algoritma K-means
K-means merupakan salah satu metode data klustering non hirarki yang berusaha mempartisi
data yang ada ke dalam bentuk satu atau lebih cluster / kelompok.

Analisis kluster (Clustering) merupakan usaha untuk mengidentifikasi kelompok obyek yang
mirip-mirip dan membantu menemukan pola penyebaran dan pola hubungan dalam sekumpulan
data yang besar. Hal penting dalam proses pengklasteran adalah menyatakan sekumpulan
pola ke kelompok yang sesuai yang berguna untuk menemukan kesamaan dan perbedaan
sehingga dapat menghasilkan kesimpulan yang berharga.
Ada beberapa pendekatan yang digunakan dalam mengembangkan metode clustering. Dua
pendekatan utama adalah clustering dengan pendekatan partisi dan clustering dengan pendekatan
hirarki. Dalam hal ini, kita membahas 2 kasus dengan data yang berbeda. Pertama, kita akan
membahas CLUSTERING PERHITUNGAN GOLONGAN PEGAWAI DENGAN
ALGORITMA K-MEANS dengan menggunakan pendekatan partisi. Clustering dengan
pendekatan partisi atau sering disebut dengan partition-based clustering mengelompokkan data
dengan memilah-milah data yang dianalisa ke dalam cluster-cluster yang ada.
Proses clustering
Identifikasi data
dihitung jarak antara setiap data dengan setiap pusat kluster
kelompokkan data-data yang menjadi anggota pada setiap kluster
cleaning data terhadap data-data yang memiliki missing value dan redundant
proses Data Mining (clustering) dengan menggunakan algoritma K-Means.
Tahap2nya:
pembentukan cluster
melakukan penghitungan untuk menentukan jarak setiap data dengan centroid awal
yang telah dibentuk dengan menggunakan rumus euclidiance distance
Kedua, dalam perhitungan ini, kita akan membahas CLUSTERING PENDUDUK
DENGAN ALGORITMA K-MEANS. Data yang digunakan sebanyak 2.737 data
penduduk, yang terdiri dari Nomor Induk Keluarga, nama lengkap, jenis kelamin, hubungan
dengan keluarga, tanggal lahir, umur, status perkawinan, agama, golongan darah,
pendidikan, pekerjaan, nama orang tua, RT, dan RW.
Secara umum algoritma dasar K-Means Clustering adalah sebagai berikut :
1. Tentukan jumlah cluster
2. Tentukan centroid/pusat cluster
3. Hitung jarak setiap data ke pusat kluster menggunakan rumus persamaan dibawah
4. Kelompokkan data ke dalam kluster yang dengan jarak yang paling pendek.

Dimana :
dij = Jarak objek antara objek i dan j
P = Dimensi data
Xik = Koordinat dari obyek i pada dimensi k
Xjk = Koordinat dari obyek j pada dimensi k
Langkah langkah Clustering Data Penduduk di rapid miner :
Pertama kita import data penduduk dengan Operator Read Excel
Selanjutnya kita pilih Data Transformation > Data Cleansing > Replace Missing Value.
Lalu pilih dan tarik operator Replace Missing Value ke dalam lembar proses
Modelling > Clustering & Segmentation > k-Means. Pilih dan tarik k-Means ke dalam
lembar proses
Kedua proses tsebut sama2 menggunakan algoritma k-means, tetapi dalam perhitungan pertama
tidak efektif karena terlalu membutuhkan waktu yang lama. Sedangkan pada perhitungan kedua
lebih singkat dan cepat dari pada perhitungan yang pertama.

KLASSIFIKASI
a) Metode klasifikasi

Metode klasifikasi ada banyak yaitu klasifikasi dengan induksi pohon keputusan, klasifikasi
Bayesian, klasifikasi berdasarkan aturan, klasifikasi dengan backpropagation, dan masih ada
yang lain. Metode yang paling terkenal adalah klasifikasi Bayesian karena mempunyai akurasi
dan kecepatan yang tinggi ketika diterapkan pada basis data yang besar.
1) Nave Bayes

Metode Bayes merupakan pendekatan statistic untuk melakukan inferensi induksi pada persoalan
klasifikasi. Metode Bayes menggunakan propabilitas bersyarat sebagai dasarnya. Dalam ilmu
probabilitas bersyarat.
Algoritma navie bayes menghitung probilitas kejadian masa datang dari kejadian sebelumnya
dimana masing masing predictor dianggap tidak saling tergantung atau sering disebut class
conditional independence. Rumus menghitung probilitas masa datangnya :
P (x y) = P (y xi) / P (x)
Keterangan :
P (x y) : prosterior probality dari class (target) tiap predictor (attribute)
P (y xi) : probality dari predictor tiap class
P (x) : proior probality dari predictor

PREDIKSI
Secara sederhana dapat dikatakan bahwa prediksi adalah sebuah proses proyeksi waktu secara
berurutan. Disini kita membahas dua kasus yang berbeda dengan algoritma yang berbeda pula.
Pertama kita bahas dengan algoritma

Anda mungkin juga menyukai